根本原因分析与解释#

DoWhy 的图因果模型框架通过利用因果图中节点分解为单一因果机制的特性,为观测到的效应的根本原因分析和解释提供了强大的工具。

异常归因:给定异常观测值(即离群点),我们可以将其归因于导致它们发生的节点。其核心思想是提出反事实问题:“如果节点 x 的行为方式不同,我们还会观测到异常吗?”。我们目标节点的变化量化了一个节点对观测到的异常的贡献程度。为了确保公平的归因,这需要系统地对节点变化的各种组合进行估计。

分布变化归因:给定两个分布已发生变化的数据集,我们将这些变化归因于图中导致变化的节点。在此,我们首先识别已发生变化的节点的数据生成机制,然后将分布变化(例如,方差或 KL 散度的变化)归因于这些机制。

特征重要性:在此,我们探讨特征对于模型有多重要的问题。流行的软件包如 SHAP 解决了这个问题,通过定义一个集合函数并估计每个输入特征的 Shapley 值。在我们的情况下,我们做类似的事情,但也包含了因果机制的概率性特征。也就是说,我们也包含了影响变量的噪声。通过这种方式,我们可以计算输入的重要性,但也可以包含由噪声表示的不可解释部分。此外,DoWhy 中的 Shapley 值估计器提供了一种灵活的方式来定义自定义集合函数。