归一化处理

  • 方法一

    • 将指标数组[a1, a2, , an][a_1,\space a_2,\space \dots ,\space a_n] 加权归一化处理得到 p1a1i=1nai ,p2a2i=1nai  pnani=1nai\frac{p_1a_1}{\sum_{i=1}^{n}{a_i} } \space ,\frac{p_2a_2}{\sum_{i=1}^{n}{a_i} }\space \dots\space \frac{p_na_n}{\sum_{i=1}^{n}{a_i} }
  • 最小-最大归一化(Min-Max Normalization) :

    • 这种方法将数据缩放到一个特定的区间,通常是[0,1][0, 1][1,1][-1, 1]
    • 其公式为:x=xminmaxminx′=\frac{x-min}{max-min}​,
    • 其中x是原始数据,min和max分别是该特征的最小值和最大值。
  • Z-score归一化(Z-score Normalization) :

    • 也称为标准差归一化,该方法通过减去均值并除以标准差来将数据转换为均值为0、标准差为1的分布。
    • 其公式为:x=xμσx'=\frac{x-\mu}{\sigma}
    • 其中μ是均值,σ是标准差。
  • 小数定标规范化(Decimal Scaling) :

    • 这种方法通过移动数据的小数点来缩放数据,直到所有的数值都在-1到1之间。
    • 其公式为:x=x10jx'=\frac{x}{10^j}
    • 其中jj是使得xx'[1,1][-1, 1]范围内的最小整数。
  • 对数归一化(Log Normalization) :

    • 适用于具有正偏态分布的数据,通过取对数来减少数据的偏斜性。
    • 其公式为:x=log(x+1)x′=log⁡(x+1)
    • 其中加1是为了避免取对数时出现负数的情况。
  • 反余切函数归一化(Arc-cot Normalization) :

    • 这种方法适用于将数据映射到[1,1][-1, 1]区间,
    • 其公式为:x=2arccot(exms)x′=2arccot(e^{\frac{x-m}{s}})
    • 其中m是均值,s是标准差