【噪声 丹尼尔卡尼曼pdf】图10-14类规则和算法的相对复杂性简捷稳定之美

原创 [db:作者]  2021-09-15 15:40  【噪声 丹尼尔卡尼曼pdf】图10-14类规则和算法的相对复杂性简捷稳定之美已关闭评论

本文选自 丹尼尔·卡尼曼新作《噪声》,扫上面码免费领电子书

图10-1 4类规则和算法的相对复杂性

简捷: 稳定之美

罗宾。道斯 (Robyn Dawes) 是20世纪六七十年代美国俄勒冈州万
金市研究人类判断行为的团队中的另一位明星成员。1974年,道斯在
简化预测任务方面取得了突破。他的研究思路令人人惊讶: 他建议不要
使用多元回归模型来确定每个预测因素的精确权重,而应给所有预测
因素分配均等的权重。

道斯将均等权重的公式定义为“非最适线性模型〈improper

linear model) 。 人 ee
eight_ models) 的准确| 旧
判断。

连“并非最合适的模型”的支持者也承认,这种说法是不可信
的,并且与统计直觉相悖。的确,道斯及其助手伯纳德。科里根
(Bernard Corrigan) 最初曾努力将论文发表在学术期刊上,但是编
辑们根本不认同。如果回顾一下上一章中的莫妮卡和娜塔莉的例子,
你就会相信某些预测因素比其他预测因素更重要。例如,相比于职业
技能,大多数人会给予领导力更高的权重。因此,简单的未加权平均
值怎么可能比精细加权的平均值或专家判断更好地预测一个人的表现
呢?

在道斯取得研究突破多年后的今天,人们已经很熟悉这种令其同

时代人惊讶的统计现象。正如前文所解释的那样,多元回归模型计算
出了最佳权重,从而使均方误差最小化,而多元回归使原始数据中的误差最小化,因此,公式会自行调整以便预测数据中的每个偶然因
素。例如,如果样本中包含一些具有较高职业技能但是由于不相关原
因而表现异常出色的经理,该模型就将增加职业技能的权重。

这其中的挑战是:当将公式应用于样本之外时,也就是用它预测
不同数据集的结果时,这些权重将不再是最优的。原始样本中的偶然
因素不再存在,因为它们是“偶然因素”。在新样本中,具有较高职
业技能的经理并不会都表现出色,而且新样本中具有原公式无法预测
的新因素。要衡量模型预测的准确性,正确的做法是观察它在新样本
中的表现,也就是观察它的“交叉验证相关性” (cross-validated
correlation) 。事实上,回归模型在原始样本上过于出色,因此交叉
验证相关性的表现几乎总是比它在原始样本中的表现差。道斯和科里
根在几种情况下对均等权重模型和多元回归模型〈交叉验证后) 进行
了比较。他们采用的一个案例就是预测伊利诺伊大学90名心理学研究
生第一年的GPA,使用的是与学业成就相关的10个变量,如能力测试分
数、大学成绩、各种同龄人评分(peer ratings,如外向性) 以及各
种自评 〈如责任心) 等。标准多元回归模型的预测相关系数为0. 69,
经过交叉验证后降至0.57 (PC=69%) ;, 均等权重模型与第一年GPA预测
的相关系数与此大致相同,为0. 6 (PC=71%) 。话多其他研究也得到了
相似的结果。

当原始样本较小时,经过交叉验证后,准确性会降低更多,因为
小样本的偶然性多,变异性较大。道斯指出,社会科学研究中通常使
用小样本,以致所谓的最佳权重的优势消失殖尽。正如统计学家霍华
德。怀纳 (Howard Wainer) 在一篇研究最适当权重估值的学术论文中
所使用的副标题: 它并丕重要。用道斯的话说,“我们丕直要比我们
的测量更精 划型”。均等权重模型之所以表现出色,是因为它不
容易受样本中偶然因素的影响。

关于卡尼曼名言相关推荐:

思考快与慢第十八章解读,丹尼尔卡尼曼名言,卡尼曼新书噪声

历史上的今天:

文章标签:

特别说明:本站不提供下载,文章采集自网络,如有侵权,联系删除文章

版权声明:【噪声 丹尼尔卡尼曼pdf】图10-14类规则和算法的相对复杂性简捷稳定之美》,版权归 [db:作者] 所有,侵删!

评论已关闭!