1.4 数据驱动的因果推断模型
为了能够利用观测数据进行因果关系推断,研究者们开发了数据驱动的因果推断模型,其中最为著名的是潜在结果模型(Potential Outcome Framework)[2]与结构因果模型(Structural Causal Model)[1]。这两个模型在不同的领域都有不同侧重的应用,例如社会科学、计量经济学、流行病学等领域主要采用潜在结果模型,而人工智能与计算机领域更多地采用结构因果模型。
潜在结果模型(在第2章详细介绍)由哈佛大学著名统计学家Donald Rubin教授提出,是因果关系推断最重要的理论模型之一[2]。潜在结果模型研究的核心问题是混杂变量的控制。潜在结果模型主要在“可交换性/可忽略性”(Exchangeability/Ignorability)假设下保证处理组和对照组的可比性或同质性,以实现对混杂因子的控制和对混杂偏差的修正。“可交换性”假设要求对照组在干预或不干预情况下的结果和处理组在同样的干预或不干预情况下的结果保持一致,保证处理组和对照组在所有方面尽可能相同或相似。那么在“可交换性”假设下,研究人员如何选择一组合适的变量(即混杂因子)用于构造两个所有方面都相同或相似的处理组和对照组呢?在潜在结果模型框架下,研究人员已经发展了许多经典的方法,我们将在第3章详细介绍。
结构因果模型(在第4章详细介绍)由图灵奖获得者Judea Pearl教授提出,是贝叶斯网络模型的延伸和扩展[1]。结构因果模型通过因果图(有向无环图)与赋值方程表示因果关系。因果图是因果关系的图形化定性表示,而赋值方程是因果关系的定量表示。结构因果模型可以表示多维复杂变量之间的因果关系。Pearl结合结构因果模型与do演算发展了一套完整的理论与方法来识别混杂因子和修正混杂偏差,这也是本书的重点内容。结构因果模型的核心是因果图,有向无环图(Directed Acyclic Graph,DAG)是因果图的主要表示模型。基于有向无环图,Pearl给出了混杂因子的图形化定义,利用有向无环图(因果结构)学习算法,Pearl解决了在数据驱动的因果效应计算中的混杂因子的识别问题。因此,如何从数据中学习准确的因果结构(有向无环图)是结构因果模型实现因果效应评估的关键。