极大似然估计(Maximum Likelihood Estimate,MLE)
由于样本数据,是实实在在发生的数据,有理由相信该样本出现的概率本来就比较大,极大似然估计假设该样本出现的概率是最大的,然后通过该样本寻找一组参数,该参数使得该样本出现的概率最大
比如:班里有 50 个男生,50 个女生,我们拥有所有男生的身高数据,也拥有所有女生的身高数据,假定男生的身高服从正态分布,女生的身高服从另一个正态分布,这时可以用极大似然法,通过 50 个男生和 50 个女生的样本来估计这两个正态分布的参数,该参数使得样本数据出现的概率最大
设有样本
预测算法的参数为 ,不同参数下 X 出现的概率不同,表示为
极大似然估计就是求解使得 为最大值的
实际中为了方便计算,经常改成对数形式
以上面例子中的正态分布为例,一维正态分布函数为
则有
取对数
求导得到
另导数为 0 求解得到
这两个参数使得样本出现的概率最大
于是就用这两个参数代入正态分布函数,用以预测新的数据
网友评论