我们马上记住本站网址,www.kcbook.pro,若被浏/览/器/转/码,可退出转/码继续阅读,感谢支持.
2.4 结构因果模型(Scm)
2.4.1 基本定义[5][11]
这是一种基于因果图(casual graph),构建各类因子间因果关系的方法。该方法可以将因果图转为结构化等式(structural equations),并通过do算子干预因果图,打破混淆因子干扰,完成因果发现。
那什么是因果图呢,这是一个有向无环图(dAG),节点表示因子,有向边表示因果关系和大小。如下图(a)是Scm的一个示例。其中t为treatment(即要分析的“因”),y是目标,x是混淆因子。显然,x的存在干扰了分析t对y的影响,作者提出通过do算子去除混淆因子x对treatment的影响,这也是Scm做因果分析的关键。
那具体是怎么实现的呢?我们需要先了解因果图里的经典结构
2.4.2 网络结构与前后门准则[11][12]
三种经典的图结构
当我们分析x和Y的因果关系时,如果存在其他变量Z,则它们的关系不外乎以下三种图结构。
链式(a):x -> Z -> Y。有 且
叉式(b):x <- Z -> Y。同链式有 且
V式(c):x -> Z <- Y。有 且
那么针对这三种图结构,如何输出x变化对Y的影响呢?我们的重点是如何“过滤”变量Z对分析的干扰(这也是因果识别的目标)
2. 后门准则:该准则对应叉式的图结构
后门标准(后门准则):如果变量集Z满足:1 不包含x的子孙节点;2 阻断了x到Y的所有后门路径。则称Z满足(x, Y)的后门准则
后门调整:基于后门路径,通过干预do算子消除混淆因子的影响,仅使用已知的数据分布,估计变量之间的因果效应
3. 前门准则:该准则对应链式结构