人工智能数学常用公式

yβ0β1x1β2x2⋯βnxnϵyx1x2⋯xnβ0β1⋯βnϵxyβ0β1xϵyxβ1∑i1nxi−xˉ2∑i1nxi−xˉyi−yˉβ0yˉ−β1xˉxˉyˉxy(x1y1x2y2⋯xnyn)β。

思想永不止步

1563人浏览 · 2024-12-14 15:13:02

思想永不止步 · 2024-12-14 15:13:02 发布

人工智能常用公式

线性回归公式
- 模型公式： $\beta_0+\beta_1x_1+\beta_2x_2+\cdots+\beta_nx_n+\epsilon$ ，其中 $y$ 是因变量， $,xnx_1,x_2,\cdots,x_n$ 是自变量， $,βn\beta_0,\beta_1,\cdots,\beta_n$ 是模型的参数， $ϵ\epsilon$ 是误差项。例如，在简单的一元线性回归（只有一个自变量 $x$ ）中， $y=β0+β1x+ϵy=\beta_0+\beta_1x+\epsilon$ 。如果我们要预测房屋价格（ $y$ ）与房屋面积（ $x$ ）的关系，就可以建立这样的模型。
- 最小二乘法参数估计公式：对于一元线性回归， $β^1=∑i=1n(xi−xˉ)(yi−yˉ)∑i=1n(xi−xˉ)2\hat{\beta}_1=\frac{\sum_{i = 1}^{n}(x_i - \bar{x})(y_i - \bar{y})}{\sum_{i = 1}^{n}(x_i - \bar{x})^2}$ ， $β^0=yˉ−β^1xˉ\hat{\beta}_0=\bar{y}-\hat{\beta}_1\bar{x}$ ，其中 $xˉ\bar{x}$ 和 $yˉ\bar{y}$ 分别是 $x$ 和 $y$ 的样本均值。假设我们有一组数据 $,(xn,yn)(x_1,y_1),(x_2,y_2),\cdots,(x_n,y_n)$ ，通过这些公式可以计算出 $β0\beta_0$ 和 $β1\beta_1$ 的估计值 $β^0\hat{\beta}_0$ 和 $β^1\hat{\beta}_1$ ，从而得到回归直线。
逻辑回归公式
- 模型公式（二分类）： $\frac{1}{1 + e^{-z}}$ ，其中 $z=β0+β1x1+⋯+βnxnz=\beta_0+\beta_1x_1+\cdots+\beta_nx_n$ ， $p$ 是事件发生的概率。例如，在判断一封邮件是否为垃圾邮件（二分类问题）时， $,xnx_1,x_2,\cdots,x_n$ 可以是邮件中的一些特征（如关键词出现频率等），通过计算得到邮件是垃圾邮件的概率 $p$ 。
- 损失函数（对数损失函数）： $J(θ)=−1m∑i=1m[yilog⁡(pi)+(1−yi)log⁡(1−pi)]J(\theta)=-\frac{1}{m}\sum_{i = 1}^{m}[y_i\log(p_i)+(1 - y_i)\log(1 - p_i)]$ ，其中 $m$ 是样本数量， $y_i$ 是样本 $i$ 的真实标签（0或1）， $p_i$ 是模型预测样本 $i$ 为正类的概率。在模型训练过程中，通过最小化这个损失函数来优化模型参数 $,βn)\theta = (\beta_0,\beta_1,\cdots,\beta_n)$ 。
神经网络公式（以简单的前馈神经网络为例）
- 神经元激活公式：对于第 $l$ 层的第 $j$ 个神经元， $aj(l)=g(∑i=1nl−1wij(l)ai(l−1)+bj(l))a_j^{(l)}=g(\sum_{i = 1}^{n_l - 1}w_{ij}^{(l)}a_i^{(l - 1)}+b_j^{(l)})$ ，其中 $g(⋅)g(\cdot)$ 是激活函数（如Sigmoid函数、ReLU函数等）， $w_{ij}^{(l)}$ 是第 $l - 1$ 层的第 $i$ 个神经元到第 $l$ 层的第 $j$ 个神经元的权重， $a_i^{(l - 1)}$ 是第 $l - 1$ 层的第 $i$ 个神经元的输出， $b_j^{(l)}$ 是第 $l$ 层的第 $j$ 个神经元的偏置。例如，在一个简单的三层神经网络（输入层、隐藏层、输出层）中，对于隐藏层的神经元就可以使用这个公式来计算其输出。
- 反向传播公式（以均方误差损失函数为例）： $∂J∂wij(l)=δj(l)ai(l−1)\frac{\partial J}{\partial w_{ij}^{(l)}}=\delta_j^{(l)}a_i^{(l - 1)}$ ，其中 $δj(l)\delta_j^{(l)}$ 是第 $l$ 层的第 $j$ 个神经元的误差项，对于输出层 $δj(L)=(aj(L)−yj)g′(zj(L))\delta_j^{(L)}=(a_j^{(L)}-y_j)g^\prime(z_j^{(L)})$ ，对于隐藏层 $δj(l)=g′(zj(l))∑k=1nl+1wjk(l+1)δk(l+1)\delta_j^{(l)}=g^\prime(z_j^{(l)})\sum_{k = 1}^{n_{l + 1}}w_{jk}^{(l + 1)}\delta_k^{(l + 1)}$ 。这些公式用于在训练神经网络时更新权重，根据误差从输出层反向传播到输入层来调整权重，以减小损失函数的值。
聚类算法公式（以K - Means为例）
- 质心更新公式： $μk=1∣Ck∣∑xi∈Ckxi\mu_k=\frac{1}{|C_k|}\sum_{x_i\in C_k}x_i$ ，其中 $μk\mu_k$ 是第 $k$ 个聚类的质心， $C_k$ 是属于第 $k$ 个聚类的样本集合， $x_i$ 是样本， $C_k|$ 是集合 $C_k$ 中的样本数量。例如，在一个二维数据的聚类中，假设有两个聚类（ $k = 2$ ），通过这个公式不断更新每个聚类的质心位置。
- 样本到质心距离公式（常用欧几里得距离）： $d(xi,μk)=∑j=1n(xij−μkj)2d(x_i,\mu_k)=\sqrt{\sum_{j = 1}^{n}(x_{ij}-\mu_{kj})^2}$ ，其中 $x_{ij}$ 是样本 $x_i$ 的第 $j$ 个特征， $μkj\mu_{kj}$ 是第 $k$ 个质心的第 $j$ 个特征。在K - Means算法中，根据这个距离来确定样本属于哪个聚类。
主成分分析（PCA）公式
- 协方差矩阵公式：对于数据集 $[x_1,x_2,\cdots,x_n]$ （ $x_i$ 是样本向量），协方差矩阵 $Σ=1n−1XTX\Sigma=\frac{1}{n - 1}X^TX$ 。例如，对于一个有 $m$ 个特征的数据集， $Σ\Sigma$ 是一个 $m×mm\times m$ 的矩阵，其元素 $σij\sigma_{ij}$ 表示第 $i$ 个特征和第 $j$ 个特征之间的协方差。
- 特征值和特征向量公式：求解协方差矩阵 $Σ\Sigma$ 的特征值 $λi\lambda_i$ 和特征向量 $v_i$ ，满足 $Σvi=λivi\Sigma v_i=\lambda_iv_i$ 。在PCA中，通过选择特征值较大的特征向量来构建主成分，将高维数据投影到低维空间。例如，选择前 $k$ 个特征值对应的特征向量，将数据从 $m$ 维投影到 $k$ 维空间，投影公式为 $y_i = V_k^Tx_i$ ，其中 $,vk]V_k = [v_1,v_2,\cdots,v_k]$ 是由 $k$ 个特征向量组成的矩阵。