【思考快与慢 丹尼尔卡尼曼】高斯提出了一种方法,用于评估单个误差对总体误差的影响。他在测量总体误差时,使用的是“均方误差”(MeanSquaredError,

原创 [db:作者]  2021-09-15 15:44  评论 0 条

本文选自 丹尼尔·卡尼曼新作《噪声》,扫上面码免费领电子书

高斯提出了一种方法,用于评估单个误差对总体误差的影响。他
在测量总体误差时,使用的是“均方误差” (Mean Squared Error,
MSE) ,即个体误差平方的平均值。

详细探讨高斯对总体误差的测量超出了本书的讨论范畴,而且他
的解决方案并非直观易懂。为什么用均方呢? 这是一个听起来有些奇
怪的概念,但它建立在我们几乎所有的直觉上。

为了乔明白 其中的原因,让我们来看一个看上去似乎完全不同但
其实本质相同的问题。想象一下,你用一把尺子来测量一条线段的长
度,要求精确到毫米,并且你可以测量5次。测量结果分别用图5-3中
指向下方的三角箭头表示。

970 971 972 973 9 978 979 980 (训米)

图5-3 ”对同一线段长度的5次测量结果

正如你看到的,5次测量结果都在971一980毫米这一范围内。那
么,哪一个是对这条线段的最精确测量昵? 一个可能是中位数,即两
个最短的测量结果和两个最长的测量结果之间的那个测量结果,在本
例中为973毫米。另一种可能是算术平均值,通常被称为平均值,在本
例中为975毫米〈图5-3中指向上方的三角箭头) 。你可能倾向于认为
平均值更为精确,你的直觉是对的。平均值包含更多信息,它受测量
次数的影响,而中位数只受顺序的影响。

我们对实现最佳评估这一问题有很清晰的直觉,它与我们关注的
对总体误差的测量关系紧密。它们实际上是同一个问题的两面,因为
最佳评估能够使当前测量的总体误差最小化。因此,如果你赁直觉认
为平均值是最佳测量结果,并且你的直觉没有错的话,那么用于测量总体误差的公式应该能够产生算术平均值,因为算术平均值的误差是
最小的。

均方误差就具有这样的特征,它是唯一能够对总体误差进行测量
的概念。在图5-4中,我们假定线段的真实长度有10个可能的整数值,
进而计算5次测量的均方误差。例如,如果真实值是971毫米,那么5次
测量的误差就分别是0(、1、2、8和9。这些误差的平方之和为150,均
方为30。这是一个很大的数值,表明一些测量值离真实值很远。你会
看到,当测量值接近975 (平均值) 时, 0 下降。随着测量值
远离平均值,均方误差又会逐渐增加。 ,平均值是最佳评估结
果,因为在这种情况下总体误差最小。

上 | 是
8371 872 可 71 去 上 8977 978 5色8 980 【(闻米)

图5-4 10个可能的真实值对应的均方误差

你还会发现,当你的评估值远离平均值时,总体误差会迅速增
加。例如,当你的评估值仅仅增加3毫米,如从976变化到979,均方误
差就会翻倍。这是均方误差的关键特征: 相比于小的误差,平方给大
的误差赋予了更大的权重。

现在你应该明白 了为什么高斯用于测量总体误差的公式被称为均
方误差计算公式,以及这种评估方法为什么被称为最小平方法。对误

关于思考快与慢主要内容介绍相关推荐:

噪声书籍,卡尼曼著作,卡尼曼噪声

历史上的今天:

文章标签:

特别说明:本站不提供下载,文章采集自网络,如有侵权,联系删除文章

版权声明:【思考快与慢 丹尼尔卡尼曼】高斯提出了一种方法,用于评估单个误差对总体误差的影响。他在测量总体误差时,使用的是“均方误差”(MeanSquaredError,》,版权归 [db:作者] 所有,侵删!

发表评论


表情