在我们的日常生活中,无时无刻不在遭遇各种随机现象。气温的变化就是一个显著的例子,每天的天气都在变化,而这些变化虽然看似无规律,却又蕴含着一定的规律。例如,上海的7月份平均气温通常在35度左右,而冬季的平均温度则大约为5度。这些温度数字揭示了某种程度的稳定性和规律。除了前面章节中提到的分布律和概率密度函数能够刻画随机变量之外,我们还可以通过一组数字来体现随机变量的一般特性。这些数字特征帮助我们更好地识别和理解随机变量的潜在特征,这正是本文的主要讨论内容。
我们来探讨数学期望。虽然这个概念可能有些专业,但可以将其理解为“平均值”,无论是算术平均还是加权平均。数学期望反映了数据的基本趋势,例如,我们可以通过夏天和冬天的温度平均值来感知季节变化的规律。在投资中,我们经常使用数学期望来评估投资组合的表现。例如,如果一个投资组合包含两个产品,一个的收益为1000元,风险为10%,另一个的收益为1000元,风险为50%,则该组合的总期望收益可以通过数学期望的公式进行计算:z = 1000 * 0.9 1000 * 0.5。掌握数学期望的计算可以帮助我们在投资决策中更加精准,虽然评估风险的过程比较复杂,需要专业知识,但数学期望的基本概念仍然非常有用。
接下来,我们将介绍方差。方差是另一个重要的数字特征,用于测量数据偏离均值的程度。方差越大,说明数据的分散程度越高。例如,在生产过程中,如果一批尺子的长度方差大于另一批,这可能意味着生产质量控制不到位。方差的数学定义为e{(x - e(x))^2},其中e(x)表示数学期望。方差的平方根是标准差,能够直观地表示数据的波动性。方差的一些基本性质包括:常数的方差为零,随机变量乘以常数的方差等于常数平方乘以方差,多个变量的方差等于各自方差之和加上协方差(协方差将在后面介绍)。这些性质可以帮助我们在实际应用中更好地理解数据的分布特征。
切比雪夫不等式是研究随机变量的重要工具。它表明,当一个随机变量存在均值和方差时,该随机变量偏离均值的范围是有限的。换句话说,偏离均值越远,发生的概率就越小。这一不等式在不具备随机变量概率密度函数信息时非常有用,通过均值和方差,我们可以估算随机变量超出某个区间的概率上限。切比雪夫不等式在大数定律和中心极限定理的证明中都有应用,因此记住这个不等式的结论是非常重要的。
在讨论二维随机变量时,我们引入了协方差的概念。协方差是从方差公式推导而来的,用于衡量两个随机变量之间的关系。如果两个随机变量独立,那么它们的协方差为零。协方差的定义为两个随机变量的和的方差等于它们各自方差的和加上协方差。通过分析协方差,我们可以判断两个随机变量是否独立,这在处理多维变量时尤为重要。
相关系数是另一重要的概念,它通过将协方差除以相应变量的标准差来定义。相关系数的绝对值不超过1,如果相关系数为1,则说明y可以通过x的线性组合来表示。如果相关系数为0,说明y与x不具有线性关系,介于0和1之间则表示部分相关性。相关系数是判断两个随机变量相关性的关键特征。对于二维正态分布的情况,通过均值、方差和相关系数,我们可以很容易地确定其分布特征。
矩是另一个用来描述随机变量特性的工具。原点矩是随机变量x的k次方的数学期望,而中心矩则是x减去其数学期望的k次方的数学期望。混合矩是x的k次方和y的l次方的数学期望。数学期望是x的一阶原点矩,方差是x的二阶中心矩,协方差则是x和y的二阶混合中心矩。矩的概念在统计中有广泛的应用,尤其是在参数估计中。
协方差矩阵在处理多维随机变量时显得尤为重要。由于高维随机变量的分布通常复杂且难以处理,协方差矩阵提供了一种有效的表示方法。协方差矩阵是由随机变量的二阶中心矩组成的对称矩阵,它使得高维计算变得更加高效和可行。例如,对于二维正态分布的随机变量,我们可以使用均值、方差和协方差矩阵来描述其分布特性。
图1 二维正态分布概率密度函数
图2 参考教材