PyWhy 因果关系实践是一个新的讲座系列,重点关注因果关系和机器学习,特别是从实践角度出发。我们将提供关于 PyWhy 库的教程和演示,同时也有外部讲者介绍因果推断相关的工作。
Johannes Textor 在荷兰奈梅亨的拉德堡德大学和拉德堡德大学医学中心工作。他热衷于利用因果推断方法造福生物医学研究,尤其是在免疫学和肿瘤免疫学领域。
在本次讲座中,Johannes 分享了他对生物医学科学家使用 DAGitty 的思考,以及因果图在科学研究中的有用程度。用他的话说:“我于 2010 年开始开发‘dagitty’工具,起初是一个网站,后来是一个 R 包。我不确定具体有多少人使用这个工具,但我相信数量相当可观:该网站每天约有 1000 次访问,迄今为止已保存约 17000 个因果图,并且两篇关于 dagitty 的论文已被引用约 2800 次。多年来,用户基础的反馈让我对用户的问题和优先事项有了独特的见解。最近,我也一直在积极尝试了解 dagitty(以及更广泛意义上的因果图)是如何被使用的,以及它是否真的对科学有益(我目前对此表示怀疑)。在讲座中,我将分享一些与这些互动有关的故事,以及它们如何在这些年里塑造了 dagitty 和我自己。”
CMU 博士生 Yujia Zheng 介绍了 causal-learn 包及其如何用于从观测数据中学习因果图(及更多内容)。
因果发现旨在从观测数据中揭示因果关系,这是科学和工程领域的一项基础任务。本次讲座介绍了 causal-learn,一个用于因果发现的开源 Python 库。该库致力于为从业者和研究人员提供全面的因果发现方法集合。它为非专业人士提供了易于使用的 API,为开发者提供了模块化的构建块,为学习者提供了详细的文档,并为所有人提供了全面的方法。与之前基于 R 或 Java 的软件包不同,causal-learn 完全由 Python 开发,这与相关社区中编程语言的最新偏好变化更加一致。讲座还将探讨相关的用法示例,旨在通过提供选择适当算法的路线图来进一步降低入门门槛。
张昆教授目前从卡内基梅隆大学 (CMU) 休假,他是穆罕默德·本·扎耶德人工智能大学 (MBZUAI) 机器学习系的教授兼代理系主任,同时也是综合人工智能中心的主任。在本次讲座中,他概述了因果表征学习及其随时间演变的过程。
因果关系是科学、工程甚至机器学习中的一个基本概念。因果表征学习旨在揭示潜在的高层隐藏因果变量及其关系。它可以看作是因果发现的一个特例,其目标是从观测数据中恢复潜在的因果结构或因果模型。因果系统的模块化特性意味着因果表征具有最小变化和独立变化的属性,在本次讲座中,我们展示了这些属性如何使得从观测数据中恢复具有可辨识性保证的潜在因果表征成为可能:在适当的假设下,学习到的表征与潜在的因果过程一致。考虑了各种问题设置,包括独立同分布 (i.i.d.) 数据、时间序列数据或带有分布偏移的数据作为输入。我们通过各种示例和应用演示了何时可辨识的因果表征学习可以受益于灵活的深度学习,以及何时必须对因果过程施加适当的参数化假设。
EconML 是一个 Python 包,它在灵活的机器学习方法之上实现了多种前沿的因果推断估计器。在本次讲座中,微软新英格兰研究院的软件工程师兼 EconML 主要开发者 Keith Battocchi 首先简要介绍了 EconML,然后详细讲解了 EconML 0.15 版本中的几个重要新功能。
微软高级首席研究员 Emre Kiciman 介绍了 pywhy-llm,这是一个新的实验性库,专注于利用大型语言模型进行因果关系研究。