当累积分布函数为连续函数时,概率质量函数PMF不再适用,因此需要使用积分(概率密度函数PDF)来计算概率。 在概率上,PDF是CDF的微分,CDF是PDF的积分,以标准正态分布为例,看下面动画说明PDF与CDF的关系:
与PMF不同的是, 概率密度函数(Probability Density Function,PDF)f(x)与dx的乘积近似等于概率,即f(x)dx≈P(x<X<=xdx),观察浅红色 下图中阴影部分,如果在这个范围内对PDF进行积分,就会得到这个范围的概率。
连续随机变量X具有如下概率密度函数,则称X在[a,b]上服从均匀分布,记为X ~ U(a,b)
的PDF和 均匀分布的CDF如下:
正态分布是统计学和许多统计检验中使用最广泛的分布类型。 许多自然现象服从正态分布。 若随机变量X服从位置参数为μ,尺度参数为σ的正态分布,记为:X ~ N(μ, σ²)
正态分布的数学期望或期望值μ等于 location 参数,它决定分布的位置; 其方差 σ² 的平方根或标准差 σ 等于尺度参数,它决定了分布的大小。 观察下面的动画:
当μ=0时,绘制不同σ值的概率密度函数,同时显示CDF等高线:
Exponential Distribution
Exponential distribution可以用来 表示独立随机事件的时间间隔,如旅客进入机场的时间间隔、呼叫客服中心的时间间隔等。若随机变量X服从参数为λ的指数分布,记为X ~Exp(λ) 。 其中λ>0是分布的一个参数,即单位时间内事件发生的次数。 指数分布的区间为[0,∞)。 观察下面指数分布的PDF和CDF动画:
绘制不同λ值(0.1~5)的概率密度函数,同时显示CDF等值线,观察下面动画:
Gamma Distribution
Gamma分布有两种:参数α称为形状参数,β称为尺度参数,α>0,β>0。
CDF等高线下,当α=2时,不同β值的概率密度函数,看下面动画: