跳转至

[4.x] 随机变量的数字特征

约 1774 个字 预计阅读时间 9 分钟

数学期望

离散随机变量XX的概率分布率为 P{X=xi}=pi,    i=1,2,...P\{X=x_i\}=p_i,\;\;i=1,2,...,若级数 i=1+xipi<+\sum_{i=1}^{+\infty}|x_i|p_i<+\infty(绝对收敛),则称级数 i=1+xipi\sum_{i=1}^{+\infty}x_ip_iXX数学期望(Mathematical Expectation)均值(Mean),简称为期望,记 E(X)=i=1+xipiE(X)=\sum_{i=1}^{+\infty}x_ip_i
如果 i=1+=xipi=+\sum_{i=1}^{+\infty}=|x_i|p_i=+\infty 则称随机变量 XX 的数学期望不存在。

连续随机变量 XX 的密度函数为 f(x)f(x),若 +xf(x)dx<+\int^{+\infty}_{-\infty}|x|f(x)\mathrm{d} x<+\infty(绝对收敛),则称积分 +xf(x)dx\int^{+\infty}_{-\infty}xf(x)\mathrm{d} xXX数学期望均值,简称为期望,记 E(X)=+xf(x)dxE(X)=\int^{+\infty}_{-\infty}xf(x)\mathrm{d} x
如果 +xf(x)dx=+\int^{+\infty}_{-\infty}|x|f(x)\mathrm{d} x=+\infty 则称随机变量 XX 的数学期望不存在。

常见分布的数学期望

泊松分布的数学期望
设随机变量 XX 服从泊松分布 P(λ)  (λ>0)P(\lambda)\;(\lambda>0),则:
E(X)=k=0+kP{X=k}=k=0+kλkk!eλ=λk=1+λk1(k1)!eλ=λE(X)=\sum_{k=0}^{+\infty}k・ P\{X=k\}=\sum_{k=0}^{+\infty}k・\frac{\lambda^{k}}{k!}e^{-\lambda}=\lambda\sum_{k=1}^{+\infty}\frac{\lambda^{k-1}}{(k-1)!}e^{-\lambda}=\lambda
由此式可知,已知泊松分布的数学期望可以确定泊松分布。

指数分布的数学期望
设随机变量XX服从指数分布 E(λ)  (λ>0)E(\lambda)\;(\lambda>0),则:
E(X)=+xf(x)dx=0+xλeλxdx=0+xdeλx=(xeλx)0++0+eλxdx=1λE(X)=\int_{-\infty}^{+\infty}xf(x)\mathrm{d}x=\int_{0}^{+\infty}x\lambda e^{-\lambda x}\mathrm{d}x=-\int_{0}^{+\infty}x\mathrm{d}e^{-\lambda x}\\=-(xe^{-\lambda x})\big|_{0}^{+\infty}+\int_{0}^{+\infty}e^{-\lambda x}\mathrm{d}x=\frac{1}{\lambda}
由此式可知,已知指数分布的数学期望可以确定指数分布。

标准正态分布的数学期望
设随机变量XX服从标准正态分布 N(0,1)N(0,1),注意到其的密度函数:φ(x)=12πex2/2,  xR\varphi(x)=\frac{1}{\sqrt{2\pi}}e^{-x^2/2},\;x\in \R 为偶函数,那么 xφ(x)x\varphi(x) 是奇函数,所以 E(x)=0E(x)=0

随机变量函数的数学期望

YY 是随机变量 XX 的函数:Y=g(X)Y=g(X)gg 是连续函数)。

XX 是离散型随机变量,它的分布律为 P(X=xk)=pk,    k=1,2,...P(X=x_k)=p_k,\;\;k=1,2,...,若 k=1+g(xk)pk\sum_{k=1}^{+\infty}g(x_k)p_k 绝对收敛,则有:
E(Y)=E(g(X))=k=1+g(xk)pkE(Y)=E(g(X))=\sum_{k=1}^{+\infty}g(x_k)p_k

XX 是连续型随机变量,它的概率密度为 f(x)f(x),若 +g(x)f(x)dx\int_{-\infty}^{+\infty}g(x)f(x)\mathrm{d}x 绝对收敛,则有:
E(Y)=E(g(X))=+g(x)f(x)dxE(Y)=E(g(X))=\int_{-\infty}^{+\infty}g(x)f(x)\mathrm{d}x

数学期望的性质

  1. CC 是常数,则 E(C)=CE(C) = C
  2. XX 是随机变量,CC 是常数,则 E(CX)=CE(X)E(C・X)=C・E(X)
  3. X,YX,Y 是两个随机变量,则 E(X+Y)=E(X)+E(Y)E(X+Y)=E(X)+E(Y)
    • 这一性质可以推广到任意有限个随机变量线性组合的情况:
      E(c0+inciXi)=c0+inciE(Xi)E(c_0+\sum^n_i{c_iX_i})=c_0+\sum^n_i c_iE(X_i)
  4. X,YX,Y 是相互独立的随机变量,则 E(XY)=E(X)E(Y)E(X・Y)=E(X)・E(Y),但逆命题不成立
    • 这一性质可以推广到任意有限个相互独立的随机变量:
      E(inXi)=inE(Xi)E(\prod_i^nX_i)=\prod_i^nE(X_i)

方差与变异系数

XX 为随机变量,若 E{[XE(X)]2}E\{[X-E(X)]^2\} 存在,则称其为 XX方差,记作 Var(X)Var(X)D(X)D(X),即 Var(X)=D(X)=E{[XE(X)]2}Var(X)=D(X)=E\{[X-E(X)]^2\}
σ(X)=(Var(X))\sigma(X)=\sqrt{(Var(X))}XX标准差均方差

数学期望存在是方差存在的必要但不充分条件。

方差刻画了 XX 取值的分散程度:

  • XX取值集中,则 Var(X)Var(X) 较小;
  • XX取值分散,则 Var(X)Var(X) 较大;

而其计算方法可以利用随机变量函数的数学期望,记 g(X)=(XE(X))2g(X)=(X-E(X))^2,然后计算 E(g(X))E(g(X))

  • 离散型:Var(X)=E{[XE(X)]2}=i=1+[xiE(X)]2piVar(X)=E\{[X-E(X)]^2\}=\sum_{i=1}^{+\infty}[x_i-E(X)]^2p_i
  • 连续型:Var(X)=E{[XE(X)]2}=+[xE(X)]2f(x)dxVar(X)=E\{[X-E(X)]^2\}=\int_{-\infty}^{+\infty}[x-E(X)]^2f(x)\mathrm dx
  • 利用期望的性质,可以得到 Var(X)=E(X2)E2(X)Var(X)=E(X^2)-E^2(X)

常见分布的方差

泊松分布方差
E(X2)=E(X(X1)+X)=E(X(X1))+E(X)=k=0k(k1)λkeλk!+λ=λ2+λVar(X)=E(X2)+E2(X)=λ\because E(X^2)=E(X(X-1)+X)=E(X(X-1))+E(X)=\sum_{k=0}^{\infty}k(k-1)\frac{\lambda^ke^{-\lambda}}{k!}+\lambda=\lambda^2+\lambda\\ \therefore Var(X)=E(X^2)+E^2(X)=\lambda

指数分布方差
E(X2)=+x2f(x)dx=0+x2λeλxdx=x2eλx0++0+2xeλxdx=2λ2Var(X)=E(X2)E2(X)=1λ2\because E(X^2)=\int_{-\infty}^{+\infty}x^2f(x)\mathrm dx=\int_0^{+\infty}x^2\lambda e^{-\lambda x}\mathrm d x=-x^2e^{-\lambda x}\big|^{+\infty}_0+\int^{+\infty}_{0}2xe^{-\lambda x}\mathrm dx=\frac{2}{\lambda^2}\\ \therefore Var(X)=E(X^2)-E^2(X)=\frac{1}{\lambda^2}

方差的性质

  1. CC 是常数,则 Var(C)=0Var(C) = 0
  2. XX 是随机变量,CC 是常数,则 Var(CX)=C2Var(X)Var(C・X)=C^2・Var(X)
  3. X,YX,Y 是两个随机变量,则 Var(X±Y)=Var(X)+Var(Y)±2E{[XE(X)][YE(Y)]}=Var(X)+Var(Y)±2Cov(X,Y)Var(X\pm Y)=Var(X)+Var(Y)\pm2E\{[X-E(X)][Y-E(Y)]\}=Var(X)+Var(Y)\pm 2Cov(X,Y)
    • 这一性质可以推广到任意有限个随机变量之和的情况:Var(i=1nXi)=i=1nVar(Xi)+21i<jnCov(Xi,Xj)Var(\sum_{i=1}^{n}X_i)=\sum_{i=1}^{n}Var(X_i)+2\sum_{1\leq i<j\leq n}Cov(X_i,X_j)
    • 特别地,如果 X,YX,Y 相互独立,则 Var(X±Y)=Var(X)+Var(Y)Var(X\pm Y)=Var(X)+Var(Y)
    • 进一步地,如果 Xi  (i=1,2,...,n)X_i\;(i=1,2,...,n) 彼此独立,则 Var(c0+i=1nciXi)=i=1nci2Var(Xi)Var(c_0+\sum_{i=1}^{n}c_iX_i)=\sum_{i=1}^{n}c_i^2Var(X_i)
  4. Var(X)E[(Xc)2]Var(X)\leq E[(X-c)^2],并且当且仅当 E(X)=cE(X)=c 时等号成立;
  5. Var(X)=0        P(X=c)=1    and    c=E(X)Var(X)=0\;\;\Leftrightarrow\;\;P(X=c)=1\;\;and\;\;c=E(X)

变异系数

变异系数(Coefficient of Variation)又叫“标准差率”,是衡量资料中各观测值变异程度的一个数字特征。它可以消除单位或平均数不同对两个或多个资料变异程度比较的影响。

设随机变量 XX 具有数学期望 E(X)=μE(X)=\mu,方差 Var(X)=σ20Var(X)={\sigma}^2 \neq 0,则称 Cv=σμC_v = \frac{\sigma}{\mu}XX 的变异系数。

协方差与相关系数

随机变量 X,YX,Y协方差 Cov(X,Y)=E{[XE(X)][YE(Y)]}=E(XY)E(X)E(Y)Cov(X,Y)=E\{[X-E(X)][Y-E(Y)]\}=E(XY)-E(X)E(Y)

随机变量 X,YX,Y相关系数 ρXY=Cov(X,Y)Var(X)Var(Y)=Cov(X,Y)\rho _{_{XY}}=\frac{Cov(X,Y)}{\sqrt{Var(X)Var(Y)}}=Cov(X^*,Y^*)

协方差的性质

  1. Cov(X,Y)=Cov(Y,X)Cov(X,Y)=Cov(Y,X)
  2. Cov(X,Y)=E(XY)E(X)E(Y)Cov(X,Y)=E(XY)-E(X)E(Y)
  3. Cov(aX,bY)=abCov(X,Y)  ,    a,bRCov(aX,bY)=abCov(X,Y)\;,\;\;a,b\in\R
  4. Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z)Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z)
  5. Cov(X,X)=Var(X)Cov(X,X)=Var(X)
  6. Cov(c,Y)=E(cY)E(c)E(Y)=0  ,    cRCov(c,Y)=E(cY)-E(c)E(Y)=0\;,\;\;c\in\R
  7. Cov(X+Y,XY)=Cov(X,X)Cov(Y,Y)=Var(X)Var(Y)Cov(X+Y,X-Y)=Cov(X,X)-Cov(Y,Y)=Var(X)-Var(Y)
  8. Cov(X,Y)=Cov(XE(X)Var(X),YE(Y)Var(Y))=Cov(X,Y)Var(X)Var(Y)=ρXYCov(X^*,Y^*)=Cov(\frac{X-E(X)}{\sqrt{Var(X)}},\frac{Y-E(Y)}{\sqrt{Var(Y)}})=\frac{Cov(X,Y)}{\sqrt{Var(X)}\sqrt{Var(Y)}}=\rho_{_{XY}}
  9. Cov(aX+bY,cX+dY)=acVar(X)+bdVar(Y)+(ad+bc)Cov(X,Y)Cov(aX+bY,cX+dY)=acVar(X)+bdVar(Y)+(ad+bc)Cov(X,Y)

相关系数的性质

  1. ρXY1|\rho_{_{XY}}|\leq 1
  2. ρXY=1        a,bR,  s.t.  P(Y=a+bX)=1|\rho_{_{XY}}|=1 \;\; \Leftrightarrow \;\; \exists a,b\in \R,\;s.t.\;P(Y=a+bX)=1
    • ρXY=+1\rho_{_{XY}}=+1时,b>0b>0
    • ρXY=1\rho_{_{XY}}=-1时,b<0b<0
  3. 上述两条性质可以合并写成:
    Var(X)Var(Y)0Var(X)Var(Y)\neq 0 时,有 Cov2(X,Y)Var(X)Var(Y)Cov^2(X,Y)\leq Var(X)Var(Y),其中等号当且仅当 XXYY 之间有严格的线性关系,即存在常数 a,ba,b,使 P(Y=a+bX)=1P(Y=a+bX)=1

相关系数 ρXY\rho_{_{XY}} 是用来表征 X,YX,Y 之间线性关系紧密程度的量。此外,考虑以 XX 的线性函数 a+bXa+bX 来近似表示 YY,均方误差 e(a,b)=E{[Y(a+bX)]2}e(a,b)=E\{ [Y-(a+bX)]^2 \} 也可以用来衡量 X,YX,Y 之间线性关系紧密程度。

  • ρXY|\rho_{_{XY}}| 比较大时,均方误差较小,表示 X,YX,Y 线性关系的程度好;
  • ρXY=1|\rho_{_{XY}}|=1 时,均方误差为 00,表示 X,YX,Y 之间以概率 11 存在线性关系;
  • ρXY|\rho_{_{XY}}| 比较小时,均方误差较大,表明 X,YX,Y 线性关系的程度差;
  • ρXY>0\rho_{_{XY}}>0 时,X,YX,Y 正相关;
  • ρXY<0\rho_{_{XY}}<0 时,X,YX,Y 负相关;
  • ρXY=0\rho_{_{XY}}=0 时,称 X,YX,Y 不相关零相关(仅仅对于线性关系来说,与独立的含义不同);
    • ρXY=0\rho_{_{XY}}=0 有如下等价条件:
      Cov(X,Y)=0Cov(X,Y)=0
      E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)
      Var(X±Y)=Var(X)+Var(Y)Var(X\pm Y)=Var(X)+Var(Y)

注意区分独立性和相关性:

  • X,YX,Y 互相独立         \;\;\Rightarrow \;\; X,YX,Y 不相关;
  • X,YX,Y 不独立         \;\;\Leftarrow \;\; X,YX,Y 相关;

多元随机变量的数字特征

nn 元随机变量 X=(X1,X2,...,Xn)TX=(X_1,X_2,...,X_n)^T,若每一个分量的数学期望都存在,则称 E(X)=(E(X1),E(X2),...,E(Xn))TE(X)=(E(X_1),E(X_2),...,E(X_n))^Tnn 元随机变量 XX 的数学期望(向量)

nn 维随机变量 X=(X1,X2,...,Xn)T\vec{X}=(X_1,X_2,...,X_n)^TCov(Xi,Xj)    (i,j=1,2,...,n)Cov(X_i,X_j)\;\;(i,j=1,2,...,n) 都存在,则:

[Var(X1)Cov(X1,X2)...Cov(X1,Xn)Cov(X2,X1)Var(X2)...Cov(X2,Xn)............Cov(Xn,X1)Cov(Xn,X2)...Var(Xn)] \begin{bmatrix} Var(X_1) & Cov(X_1,X_2) & ... & Cov(X_1,X_n)\\ Cov(X_2,X_1) & Var(X_2) & ... & Cov(X_2,X_n)\\ ... & ... & ... & ... \\ Cov(X_n,X_1) & Cov(X_n,X_2) & ... & Var(X_n) \end{bmatrix}

称之为 X\vec{X}协方差矩阵,它是一个对称非负定矩阵

n 维正态变量重要性质

  1. nn 维正态变量 (X1,X2,...,Xn)T(X_1,X_2,...,X_n)^T 中的任意子向量 (Xi1,Xi2,...,Xik)T(X_{i_1},X_{i_2},...,X_{i_k})^T1kn1\leq k\leq n 也服从 kk 元正态分布;
    • 特别地,每一个分量 Xi,i=1,2,...,nX_i,i=1,2,...,n 都是正态变量;
    • 反之,若每个 XiX_i 都是正态变量,且相互独立,则 (X1,X2,...,Xn)(X_1,X_2,...,X_n)nn 维正态变量;
  2. nn 维随机变量 (X1,X2,...,Xn)(X_1,X_2,...,X_n) 服从 nn 维正态分布的充要条件X1,X2,...,XnX_1,X_2,...,X_n 的任意线性组合 inliXi\sum_{i}^{n} l_iX_i 服从一维正态分布,其中 l1,l2,...,lnl_1,l_2,...,l_n 不全为 00
  3. (X1,X2,...,Xn)(X_1,X_2,...,X_n) 服从 nn 维正态分布,设 Y1,Y2,...,YkY_1,Y_2,...,Y_kXiX_i 的线型函数,则 (Y1,Y2,...,Yk)(Y_1,Y_2,...,Y_k) 也服从多维正态分布,这一性质被称为正态变量的线性变换不变性;
  4. (X1,X2,...,Xn)(X_1,X_2,...,X_n) 服从 nn维正态分布,则 X1,X2,...,XnX_1,X_2,...,X_n 互相独立的充要条件XiX_i 两两不相关,也等价于协方差矩阵为对角矩阵;

最后更新: 2024年1月13日 19:00:24
创建日期: 2024年1月13日 19:00:24
激励

评论