为什么:关于因果关系的新科学(书)
我在机器学习方面的研究经历告诉我,因果关系的学习者必须熟练掌握至少三种不同层级的认知能力:观察能力、行动能力和想象能力。
干预比关联更高级,因为它不仅涉及被动观察,还涉及主动改变现状。例如,观察到烟雾和主动制造烟雾,二者所表明的“某处着火”这件事的可能性是完全不同的。无论数据集有多大或者神经网络有多深,只要使用的是被动收集的数据,我们就无法回答有关干预的问题。从统计学中学到的任何方法都不足以让我们明确表述类似“如果价格翻倍将会发生什么”这样简单的问题,更别说回答它们了。认识到这一点让许多科学家挫败不已。我之所以对此心知肚明,是因为我曾多次帮助这些科学家踏上因果关系之梯的更高层级。
首先,赖特想说的是,路径分析的应用应该以研究者对因果过程的个人理解为基础,这种理解就反映在其所绘制的因果图或路径图中。它不能被简化为一个机械性的程序,就像统计手册里列出的那些操作方法一样。对于赖特来说,绘制路径图不是一种统计学实践,而是一种遗传学、经济学、心理学实践或其他诸领域的研究者在自己的专业领域所进行的一种实践。
其次,赖特将“无模型方法”的诱人之处归因于其客观性。自1834年3月15日伦敦统计学会成立伊始,客观性就是统计学家的圣杯。学会的创始章程规定,在所有的情况下,数据都优先于观点和解释。数据是客观的,而观点是主观的。这个规则的提出远远早于皮尔逊时代。为客观性而奋斗,完全根据数据和实验进行推理的思想,自伽利略以来一直是科学定义自身存在方式的一部分。与相关性分析和大多数主流统计学不同,因果分析要求研究者做出主观判断。研究者必须绘制出一个因果图,其反映的是他对于某个研究课题所涉及的因果过程拓扑结构的定性判断,或者更理想的是,他所属的专业领域的研究者对于该研究课题的共识。为了确保客观性,他反而必须放弃传统的客观性教条。在因果关系方面,睿智的主观性比任何客观性都更能阐明我们所处的这个真实世界。
我们在实际生活中似乎就是遵循着共因原则行事的,无论何时,只要观察到某种模式,我们就会去寻找一个因果解释。事实上,我们本能地渴望根据数据之外的某个稳定机制对观察结果做出解释。其中最令人满意的解释是直接因果关系:X导致Y。当实际情况不能满足直接因果关系时,如果能找出X和Y的共因,那么我们也会感到满意。相比之下,对撞结构太难以捉摸,无法满足我们的因果解释欲。
对撞的扭曲棱镜在日常生活中同样普遍存在。正如乔丹·埃伦伯格在《魔鬼数学》(How Not to Be Wrong)中提出的问题:你有没有注意到,在你约会的人当中,那些有魅力的人往往是混蛋?与其为解释这一现象而费力构建复杂的社会心理理论,不如考虑一种更简单的解释。你对约会对象的选择取决于两个因素:魅力和个性。你会冒险约会一个刻薄而有魅力的人,或者一个和蔼但缺乏魅力的人,你当然也会与既和蔼又有魅力的人约会,但你肯定不会与既刻薄又没有魅力的人约会。换句话说,你删掉了所有“负—负”的结果,这与你在抛掷两枚硬币的例子中所做的筛选是相同的,而正是这种筛选造成了魅力和个性之间的伪负相关。可悲的事实是,没有魅力的人可能会和有魅力的人一样刻薄,但你永远意识不到这一点了,因为你永远不会约会既刻薄又没有魅力的人。