几何分布 在概率论和统计学中,几何分布(英语:Geometric distribution)指的是以下两种离散型概率分布中的一种: 在伯努利试验中,得到一次成功所需要的试验次数 X {\displaystyle X} 。 X {\displaystyle X} 的值域是{ 1, 2, 3, ... }几何分布 概率质量函数 累积分布函数 参数 0 < p ≤ 1 {\displaystyle 0<p\leq 1} 成功概率(实) 0 < p ≤ 1 {\displaystyle 0<p\leq 1} 成功概率(实) 支撑集 k ∈ { 1 , 2 , 3 , … } {\displaystyle k\in \{1,2,3,\dots \}\!} k ∈ { 0 , 1 , 2 , 3 , … } {\displaystyle k\in \{0,1,2,3,\dots \}\!} 概率质量函数 (pmf) ( 1 − p ) k − 1 p {\displaystyle (1-p)^{k-1}\,p\!} ( 1 − p ) k p {\displaystyle (1-p)^{k}\,p\!} 累积分布函数 (cdf) 1 − ( 1 − p ) k {\displaystyle 1-(1-p)^{k}\!} 1 − ( 1 − p ) k + 1 {\displaystyle 1-(1-p)^{k+1}\!} 期望值 1 p {\displaystyle {\frac {1}{p}}\!} 1 − p p {\displaystyle {\frac {1-p}{p}}\!} 中位数 ⌈ − 1 log 2 ( 1 − p ) ⌉ {\displaystyle \left\lceil {\frac {-1}{\log _{2}(1-p)}}\right\rceil \!} (如果 − 1 / log 2 ( 1 − p ) {\displaystyle -1/\log _{2}(1-p)} 是整数,则中位数不唯一) ⌈ − 1 log 2 ( 1 − p ) ⌉ − 1 {\displaystyle \left\lceil {\frac {-1}{\log _{2}(1-p)}}\right\rceil \!-1} (如果 − 1 / log 2 ( 1 − p ) {\displaystyle -1/\log _{2}(1-p)} 是整数,则中位数不唯一) 众数 1 {\displaystyle 1} 0 {\displaystyle 0} 方差 1 − p p 2 {\displaystyle {\frac {1-p}{p^{2}}}\!} 1 − p p 2 {\displaystyle {\frac {1-p}{p^{2}}}\!} 偏度 2 − p 1 − p {\displaystyle {\frac {2-p}{\sqrt {1-p}}}\!} 2 − p 1 − p {\displaystyle {\frac {2-p}{\sqrt {1-p}}}\!} 超值峰度 6 + p 2 1 − p {\displaystyle 6+{\frac {p^{2}}{1-p}}\!} 6 + p 2 1 − p {\displaystyle 6+{\frac {p^{2}}{1-p}}\!} 熵 − ( 1 − p ) log 2 ( 1 − p ) − p log 2 p p {\displaystyle {\tfrac {-(1-p)\log _{2}(1-p)-p\log _{2}p}{p}}\!} − ( 1 − p ) log 2 ( 1 − p ) − p log 2 p p {\displaystyle {\tfrac {-(1-p)\log _{2}(1-p)-p\log _{2}p}{p}}\!} 矩生成函数 (mgf) p e t 1 − ( 1 − p ) e t {\displaystyle {\frac {pe^{t}}{1-(1-p)e^{t}}}\!} , for t < − ln ( 1 − p ) {\displaystyle t<-\ln(1-p)\!} p 1 − ( 1 − p ) e t {\displaystyle {\frac {p}{1-(1-p)e^{t}}}\!} 特征函数 p e i t 1 − ( 1 − p ) e i t {\displaystyle {\frac {pe^{it}}{1-(1-p)\,e^{it}}}\!} p 1 − ( 1 − p ) e i t {\displaystyle {\frac {p}{1-(1-p)\,e^{it}}}\!} 在得到第一次成功之前所经历的失败次数 Y = X − 1 {\displaystyle Y=X-1} 。Y的值域是{ 0, 1, 2, 3, ... }实际使用中指的是哪一个取决于惯例和使用方便。 这两种分布不应该混淆。前一种形式( X {\displaystyle X} 的分布)经常被称作shifted geometric distribution;但是,为了避免歧义,最好明确地说明取值范围。 如果每次试验的成功概率是 p {\displaystyle p} ,那么 k {\displaystyle k} 次试验中,第 k {\displaystyle k} 次才得到成功的概率是, Pr ( X = k ) = ( 1 − p ) k − 1 p {\displaystyle \Pr(X=k)=(1-p)^{k-1}\,p\,} 其中 k = 1 , 2 , 3 , … {\displaystyle k=1,2,3,\ldots } . 上式描述的是取得一次成功所需要的试验次数。而另一种形式,也就是第一次成功之前所失败的次数,可以写为, Pr ( Y = k ) = ( 1 − p ) k p {\displaystyle \Pr(Y=k)=(1-p)^{k}\,p\,} 其中 k = 0 , 1 , 2 , 3 , … {\displaystyle k=0,1,2,3,\ldots } 两种情况产生的序列都是几何数列。这是几何分布的名字来源。 比如,假设不停地掷骰子,直到得到1。投掷次数是随机分布的,取值范围是无穷集合{ 1, 2, 3, ... },并且是一个 p = 1 6 {\displaystyle p={\frac {1}{6}}} 的几何分布。 目录 1 性质 2 记号 3 用途 4 参见 性质 呈几何分布的随机变量X的期望值是1/p,方差是 (1-p)/p2: E ( X ) = 1 p , v a r ( X ) = 1 − p p 2 . {\displaystyle \mathrm {E} (X)={\frac {1}{p}},\qquad \mathrm {var} (X)={\frac {1-p}{p^{2}}}.} 几何分布具有非记忆性的性质(Memoryless Property,又称遗失记忆性) 这表示如果一个随机变量呈几何分布,它的条件概率遵循: P ( T > s + t | T > t ) = P ( T > s ) for all {\displaystyle P(T>s+t\;|\;T>t)=P(T>s)\;\;{\hbox{for all}}\ } s, t ∈ℕ.记号 若随机变量 X {\displaystyle {\mathit {X}}} 服从参数为 p {\displaystyle {\mathit {p}}} 的几何分布,则记为 X ∼ G ( p ) {\displaystyle X\sim G(p)} . 用途 在重复多次的伯努利试验中,试验进行到某种结果出现第一次为止,此时的试验总次数服从几何分布,如:射击,首次击中目标时的次数。 参见 概率分布 超几何分布 负二项分布 指数分布