游戲前端轉(zhuǎn)網(wǎng)站開發(fā)站長(zhǎng)工具seo綜合查詢收費(fèi)嗎
此示例是 什么是極大似然估計(jì) 中的一個(gè)例子,本文的目的是給出更加詳細(xì)的方程求解步驟,便于數(shù)學(xué)基礎(chǔ)不好的同學(xué)理解。
目標(biāo)
假設(shè)我們有一組樣本數(shù)據(jù) x 1 , x 2 , … , x n x_1, x_2, \dots, x_n x1?,x2?,…,xn?,它們來自一個(gè)正態(tài)分布 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2),我們的目標(biāo)是通過極大似然估計(jì)(MLE)來找到正態(tài)分布的兩個(gè)參數(shù) μ \mu μ 和 σ 2 \sigma^2 σ2。
對(duì)數(shù)似然函數(shù)
正態(tài)分布的概率密度函數(shù)為:
f ( x i ∣ μ , σ 2 ) = 1 2 π σ 2 exp ? ( ? ( x i ? μ ) 2 2 σ 2 ) f(x_i | \mu, \sigma^2) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp \left( -\frac{(x_i - \mu)^2}{2\sigma^2} \right) f(xi?∣μ,σ2)=2πσ2?1?exp(?2σ2(xi??μ)2?)
給定樣本 x 1 , x 2 , … , x n x_1, x_2, \dots, x_n x1?,x2?,…,xn?,樣本的似然函數(shù)為:
L ( μ , σ 2 ) = ∏ i = 1 n 1 2 π σ 2 exp ? ( ? ( x i ? μ ) 2 2 σ 2 ) L(\mu, \sigma^2) = \prod_{i=1}^n \frac{1}{\sqrt{2\pi\sigma^2}} \exp \left( -\frac{(x_i - \mu)^2}{2\sigma^2} \right) L(μ,σ2)=i=1∏n?2πσ2?1?exp(?2σ2(xi??μ)2?)
對(duì)似然函數(shù)取對(duì)數(shù),得到對(duì)數(shù)似然函數(shù):
? ( μ , σ 2 ) = log ? L ( μ , σ 2 ) = ∑ i = 1 n log ? ( 1 2 π σ 2 exp ? ( ? ( x i ? μ ) 2 2 σ 2 ) ) \ell(\mu, \sigma^2) = \log L(\mu, \sigma^2) = \sum_{i=1}^n \log \left( \frac{1}{\sqrt{2\pi\sigma^2}} \exp \left( -\frac{(x_i - \mu)^2}{2\sigma^2} \right) \right) ?(μ,σ2)=logL(μ,σ2)=i=1∑n?log(2πσ2?1?exp(?2σ2(xi??μ)2?))
我們可以將對(duì)數(shù)似然函數(shù)分解為三部分:
? ( μ , σ 2 ) = ? n 2 log ? ( 2 π ) ? n 2 log ? ( σ 2 ) ? 1 2 σ 2 ∑ i = 1 n ( x i ? μ ) 2 \ell(\mu, \sigma^2) = -\frac{n}{2} \log(2\pi) - \frac{n}{2} \log(\sigma^2) - \frac{1}{2\sigma^2} \sum_{i=1}^n (x_i - \mu)^2 ?(μ,σ2)=?2n?log(2π)?2n?log(σ2)?2σ21?i=1∑n?(xi??μ)2
現(xiàn)在我們分別對(duì) μ \mu μ 和 σ 2 \sigma^2 σ2 求導(dǎo)。
一、對(duì) μ \mu μ 求導(dǎo)
首先,對(duì) μ \mu μ 求導(dǎo),方程中的 μ \mu μ 僅出現(xiàn)在最后一項(xiàng) ∑ i = 1 n ( x i ? μ ) 2 \sum_{i=1}^n (x_i - \mu)^2 ∑i=1n?(xi??μ)2 中,因此我們只對(duì)這一項(xiàng)求導(dǎo):
? ( μ , σ 2 ) = ? 1 2 σ 2 ∑ i = 1 n ( x i ? μ ) 2 \ell(\mu, \sigma^2) = -\frac{1}{2\sigma^2} \sum_{i=1}^n (x_i - \mu)^2 ?(μ,σ2)=?2σ21?i=1∑n?(xi??μ)2
對(duì) μ \mu μ 求導(dǎo):
? ? ? μ = ? 1 2 σ 2 ? 2 ∑ i = 1 n ( x i ? μ ) ( ? 1 ) \frac{\partial \ell}{\partial \mu} = -\frac{1}{2\sigma^2} \cdot 2 \sum_{i=1}^n (x_i - \mu) (-1) ?μ???=?2σ21??2i=1∑n?(xi??μ)(?1)
簡(jiǎn)化后為:
? ? ? μ = 1 σ 2 ∑ i = 1 n ( x i ? μ ) \frac{\partial \ell}{\partial \mu} = \frac{1}{\sigma^2} \sum_{i=1}^n (x_i - \mu) ?μ???=σ21?i=1∑n?(xi??μ)
將這個(gè)導(dǎo)數(shù)設(shè)為 0,來找到 μ \mu μ 的極大似然估計(jì):
1 σ 2 ∑ i = 1 n ( x i ? μ ) = 0 \frac{1}{\sigma^2} \sum_{i=1}^n (x_i - \mu) = 0 σ21?i=1∑n?(xi??μ)=0
因?yàn)? σ 2 ≠ 0 \sigma^2 \neq 0 σ2=0,我們可以省略 1 σ 2 \frac{1}{\sigma^2} σ21?,得到:
∑ i = 1 n ( x i ? μ ) = 0 \sum_{i=1}^n (x_i - \mu) = 0 i=1∑n?(xi??μ)=0
簡(jiǎn)化為:
n μ = ∑ i = 1 n x i n\mu = \sum_{i=1}^n x_i nμ=i=1∑n?xi?
因此, μ \mu μ 的極大似然估計(jì)為:
μ ^ = 1 n ∑ i = 1 n x i \hat{\mu} = \frac{1}{n} \sum_{i=1}^n x_i μ^?=n1?i=1∑n?xi?
這意味著,樣本的均值是 μ \mu μ 的極大似然估計(jì)。
二、對(duì) σ 2 \sigma^2 σ2 求導(dǎo)
接下來我們對(duì) σ 2 \sigma^2 σ2 求導(dǎo)。對(duì)數(shù)似然函數(shù)中關(guān)于 σ 2 \sigma^2 σ2 的部分是:
? ( μ , σ 2 ) = ? n 2 log ? ( 2 π ) ? n 2 log ? ( σ 2 ) ? 1 2 σ 2 ∑ i = 1 n ( x i ? μ ) 2 \ell(\mu, \sigma^2) = -\frac{n}{2} \log(2\pi) - \frac{n}{2} \log(\sigma^2) - \frac{1}{2\sigma^2} \sum_{i=1}^n (x_i - \mu)^2 ?(μ,σ2)=?2n?log(2π)?2n?log(σ2)?2σ21?i=1∑n?(xi??μ)2
我們對(duì) σ 2 \sigma^2 σ2 求導(dǎo),逐項(xiàng)進(jìn)行求導(dǎo):
-
第一項(xiàng) ? n 2 log ? ( 2 π ) -\frac{n}{2} \log(2\pi) ?2n?log(2π) 是常數(shù),對(duì) σ 2 \sigma^2 σ2 求導(dǎo)為 0。
-
第二項(xiàng) ? n 2 log ? ( σ 2 ) -\frac{n}{2} \log(\sigma^2) ?2n?log(σ2):
使用對(duì)數(shù)函數(shù)的求導(dǎo)公式 d d σ 2 ( log ? σ 2 ) = 1 σ 2 \fracvxwlu0yf4{d\sigma^2} (\log \sigma^2) = \frac{1}{\sigma^2} dσ2d?(logσ2)=σ21?,我們有:
? ? σ 2 ( ? n 2 log ? ( σ 2 ) ) = ? n 2 σ 2 \frac{\partial}{\partial \sigma^2} \left( -\frac{n}{2} \log(\sigma^2) \right) = -\frac{n}{2\sigma^2} ?σ2??(?2n?log(σ2))=?2σ2n? -
第三項(xiàng) ? 1 2 σ 2 ∑ i = 1 n ( x i ? μ ) 2 -\frac{1}{2\sigma^2} \sum_{i=1}^n (x_i - \mu)^2 ?2σ21?∑i=1n?(xi??μ)2:
使用 d d σ 2 ( 1 σ 2 ) = ? 1 σ 4 \fracvxwlu0yf4{d\sigma^2} \left( \frac{1}{\sigma^2} \right) = -\frac{1}{\sigma^4} dσ2d?(σ21?)=?σ41?,我們得到:
? ? σ 2 ( ? 1 2 σ 2 ∑ i = 1 n ( x i ? μ ) 2 ) = 1 2 σ 4 ∑ i = 1 n ( x i ? μ ) 2 \frac{\partial}{\partial \sigma^2} \left( - \frac{1}{2\sigma^2} \sum_{i=1}^n (x_i - \mu)^2 \right) = \frac{1}{2\sigma^4} \sum_{i=1}^n (x_i - \mu)^2 ?σ2??(?2σ21?i=1∑n?(xi??μ)2)=2σ41?i=1∑n?(xi??μ)2
將各項(xiàng)導(dǎo)數(shù)結(jié)果組合
我們將對(duì)數(shù)似然函數(shù)中所有關(guān)于 σ 2 \sigma^2 σ2 的項(xiàng)求導(dǎo)結(jié)果組合起來:
? ? ? σ 2 = ? n 2 σ 2 + 1 2 σ 4 ∑ i = 1 n ( x i ? μ ) 2 \frac{\partial \ell}{\partial \sigma^2} = -\frac{n}{2\sigma^2} + \frac{1}{2\sigma^4} \sum_{i=1}^n (x_i - \mu)^2 ?σ2???=?2σ2n?+2σ41?i=1∑n?(xi??μ)2
設(shè)置導(dǎo)數(shù)為 0,解出 σ 2 \sigma^2 σ2
為了找到 σ 2 \sigma^2 σ2 的極大似然估計(jì),我們將導(dǎo)數(shù)設(shè)為 0:
? n 2 σ 2 + 1 2 σ 4 ∑ i = 1 n ( x i ? μ ) 2 = 0 -\frac{n}{2\sigma^2} + \frac{1}{2\sigma^4} \sum_{i=1}^n (x_i - \mu)^2 = 0 ?2σ2n?+2σ41?i=1∑n?(xi??μ)2=0
1. 消去常數(shù) 1 2 \frac{1}{2} 21?
為了簡(jiǎn)化方程,兩邊同時(shí)乘以 2 消去常數(shù):
? n σ 2 + 1 σ 4 ∑ i = 1 n ( x i ? μ ) 2 = 0 -\frac{n}{\sigma^2} + \frac{1}{\sigma^4} \sum_{i=1}^n (x_i - \mu)^2 = 0 ?σ2n?+σ41?i=1∑n?(xi??μ)2=0
2. 將 n σ 2 \frac{n}{\sigma^2} σ2n? 移到右邊
將方程重排:
1 σ 4 ∑ i = 1 n ( x i ? μ ) 2 = n σ 2 \frac{1}{\sigma^4} \sum_{i=1}^n (x_i - \mu)^2 = \frac{n}{\sigma^2} σ41?i=1∑n?(xi??μ)2=σ2n?
3. 乘以 σ 4 \sigma^4 σ4
為了消去 σ 4 \sigma^4 σ4,我們將方程兩邊乘以 σ 4 \sigma^4 σ4:
∑ i = 1 n ( x i ? μ ) 2 = n σ 2 \sum_{i=1}^n (x_i - \mu)^2 = n \sigma^2 i=1∑n?(xi??μ)2=nσ2
4. 解出 σ 2 \sigma^2 σ2
將 σ 2 \sigma^2 σ2 留在一邊,解出:
σ 2 = 1 n ∑ i = 1 n ( x i ? μ ) 2 \sigma^2 = \frac{1}{n} \sum_{i=1}^n (x_i - \mu)^2 σ2=n1?i=1∑n?(xi??μ)2
這個(gè)結(jié)果就是 σ 2 \sigma^2 σ2 的極大似然估計(jì),即樣本方差公式。
總結(jié)
我們通過對(duì)正態(tài)分布的對(duì)數(shù)似然函數(shù)分別對(duì) μ \mu μ 和 σ 2 \sigma^2 σ2 求導(dǎo),得到以下結(jié)論:
-
均值 μ \mu μ 的極大似然估計(jì):
μ ^ = 1 n ∑ i = 1 n x i \hat{\mu} = \frac{1}{n} \sum_{i=1}^n x_i μ^?=n1?i=1∑n?xi?
即樣本的均值是 μ \mu μ 的極大似然估計(jì)。 -
方差 σ 2 \sigma^2 σ2 的極大似然估計(jì):
σ ^ 2 = 1 n ∑ i = 1 n ( x i ? μ ^ ) 2 \hat{\sigma}^2 = \frac{1}{n} \sum_{i=1}^n (x_i - \hat{\mu})^2 σ^2=n1?i=1∑n?(xi??μ^?)2
即樣本方差是 σ 2 \sigma^2 σ2 的極大似然估計(jì)。