聚合国内IT技术精华文章,分享IT技术精华,帮助IT从业人士成长

DataFunSummit2022:因果推断在线峰会

2022-11-24 23:49 浏览: 1009243 次 我要评论(0 条) 字号:


2022年11月26日,DataFunSummit2022:因果推断在线峰会将如约而至。本次峰会由2位主席与4位出品人精心策划而成,共包含了:主题论坛、实验科学与因果推断、用户增长与因果推断、搜广推中的因果推断、金融场景中的因果推断等论坛,邀请20余位来自国内外一线的因果推断专家学者,进行深度分享交流。本次峰会将全程直播,欢迎大家届时收看。

扫码入群收看

▌峰会日程


上午场 主论坛


下午场 分论坛

▌详细介绍


峰会主席

李奘 腾讯 PCG 技术副总经理

个人介绍:李奘,腾讯PCG技术副总经理。宾西法利亚州立大学博士,长期致力于机器学习、大数据、数据科学和增长技术体系与方法论的研究和应用。曾在硅谷Cisco,Linkedin等公司任职,回国后在滴滴任杰出算法工程师负责增长、数据挖掘、NLP、知识图谱和智能客服等方向。当前在腾讯负责PCG的推荐中台、画像中台和数据治理平台等多个项目,并负责OVBU大数据体系建设以及PCG的AI委员会的规划发展。


龙波 京东集团 副总裁

个人介绍:Dr. Bo Long is  Head of Search and Recommendation Business Unit, VP of JD Group.  Previously he was Head of LinkedIn’s AI Foundations. He also worked at Particle Media, Yahoo! Labs, IBM Watson and Google Lab. He has 15 years of experience in data mining and machine learning with applications to web search, recommendation, and social network analysis. He holds dozens of innovations and has published 100+ peer-reviewed papers in top conferences and journals including ICML, KDD, NeurlIPS,ICDM, AAAI, SDM, CIKM, TKDE,KAIS etc. He has served as reviewers, workshops co-organizers, conference organizer committee members, and area chairs for multiple conferences, including KDD, NeurlIPS, SIGIR, ICML, SDM, CIKM, JSM etc.



① 主论坛

主讲嘉宾:张坤

Carnegie Mellon University

& MBZUAI 副教授

个人介绍:张坤现为卡内基大学以及MBZ人工智能大学的副教授。他的研究领域是因果关系、机器学习以及通用人工智能。他在自动因果发现领域提出了一系列模型和算法,与合作者一起开创了从因果思维的角度来理解和解决复杂的机器学习问题的研究方向,并用因果的思维方式看待机器学习以求可靠性、可解释性以及对社会好的影响。他长期担任一系列机器学习和人工智能会议的领域主席、资深领域主席或程序委员会主席,包括UAI、NeurIPS、ICML、CLeaR、IJCAI和AISTATS等会议,同时是 ACM Computing Surveys和Pattern Recognition等杂志的副主编。

演讲题目:因果表述学习技术进展

演讲提纲:本次交流主要讨论如下问题。我们为何在意因果关系?因果关系和因果思维有何用处?因果关系可指导我们对系统做合适的变化以达到的目的,除此之外,为什么因果表述可以帮助我们避免对抗攻击,以实现可信任、可解释的人工资能?如何从观测数据中学习因果关系以及因果表述?如何自动从数据中发现有因果意义的隐变量以及它们之间的因果关系?如何自动的实现迁移学习?迁移学习一定需要因果表述么?

听众收益:

1. 因果关系如何定义,我们为何如此在意因果关系?

2. 数据的什么性质可以帮组我们学习因果关系?

3. 我们如何从数据中学习系统里面的隐变量以及它们之间的关系?


主讲/圆桌嘉宾:崔鹏

清华大学 副教授

个人介绍:崔鹏,清华大学计算机系长聘副教授,博士生导师。研究兴趣聚焦于大数据驱动的因果推理和稳定预测、大规模网络表征学习等。在数据挖掘及人工智能领域顶级国际会议发表论文 100 余篇,先后 5 次获得国际会议或期刊论文奖,并先后两次入选数据挖掘领域顶级国际会议 KDD 最佳论文专刊。担任 IEEE TKDE、ACM TOMM、ACM TIST、IEEE TBD 等国际期刊编委。曾获得国家自然科学二等奖、教育部自然科学一等奖、CCF-IEEE CS 青年科学家奖、ACM 杰出科学家。

演讲题目:关于可信智能决策的一些思考和尝试

演讲提纲:真实场景下的决策评估、优化和回溯是众多领域面临的共性难题,其核心挑战是如何回答 “what-if” 等反事实问题。本报告将重点面向复杂决策变量空间、混淆变量未被观测、以及有效样本不足等复杂场景,介绍在反事实决策评估、优化以及可回溯解释等方面的最新研究进展。


圆桌嘉宾:赵振宇 腾讯 数据科学总监

个人介绍:腾讯海外游戏数据科学总监,CausalML 开源项目创始人。博士毕业于美国西北大学,本科毕业于中国科学技术大学。曾在 Yahoo、Uber 等公司工作,负责实验、因果推断、机器学习等方法的应用、研究和工具建设,发表多篇相关论文和专利。




② 实验科学与因果推断论坛

出品人:杨帆 腾讯 数据科学总监

个人介绍:先后负责腾讯视频增长、运营、内容制作、商业化等多业务方向数据科学及算法工作。从事数据方面科研及互联网行业应用工作十余年,在加入腾讯前,曾在 Uber,SAS 等公司担任数据科学及管理岗位。


李烜 资深数据科学家

个人介绍:新浪、腾讯等多家互联网公司从业经验,先后在增长、推荐、内容生态、作者画像、媒体资源等领域有多年数据科学实践经验。

演讲题目:浅谈因果推断与在内容平台的实践

演讲提纲:

1. 因果推断初探

2. 内容平台场景的业务实践

听众收益:

1. 为什么使用因果推断?

2. 常见的方法有哪些?

3. 业务场景的实践案例


李世嘉 腾讯 中短视频数据科学组副组长

个人介绍:复旦大学本科,康奈尔大学硕士,13年至20年在美国纽约工作,20年加入腾讯,目前负责腾讯视频的中短视频的数据科学工作。

演讲题目:因果推断在腾讯视频中短视频的应用

演讲提纲:

1. 因果推断常用方法概览

2. 因果推断在腾讯视频中短视频的应用案例分享

2.1 中视频反转实验CATE分析

2.2 运营策略对于创作者影响的PSM分析

2.3 底部Tab气泡的Uplift策略

2.4 爆款召回队列对于推爆影响的合成控制法分析

听众收益:

1. 了解 HTE 分析、PSM、Uplift、Synthetic Control 等常用因果推荐方法

2. 了解常用因果推断方法在中短视频业务场景的落地实践,包括业务场景、方法应用、策略落地等



王文广 达观数据 副总裁

个人介绍:王文广,达观数据副总裁,高级工程师,浙江大学硕士,人工智能标准编制专家,知识图谱顶尖专家,《知识图谱:认知智能理论与实战》作者,专注于知识图谱与认知智能、自然语言处理、图像与语音分析、大数据和图分析等人工智能方向。现在是上海市人工智能技术标准化委员会委员,上海科委评审专家,中文信息学会(CIPS)语言与知识计算专委会委员,中国计算机学会(CCF)高级会员,中国人工智能学会(CAAI)深度学习专委会委员。曾获得多个国际国家级、省部级、地市级奖项,拥有数十项人工智能领域的国家发明专利和会议、期刊学术论文。在达观数据致力于将自然语言处理、知识图谱、计算机视觉和大数据技术产品化,以OCR、文档智能处理、知识图谱、RPA等产品服务于金融、智能制造、贸易、半导体、汽车工业、航空航天、新能源、双碳等领域。

演讲题目:制造业失效归因分析的探索与实践

演讲提纲:

1. 知识图谱与知识推理

2. 制造业失效分析

3. 基于知识推理的失效归因分析实践

4. 案例

听众收益:

1. 了解制造业失效分析场景

2. 了解达观数据基于知识推理的失效归因分析的方法

3. 实践案例


刘春辰 阿里巴巴 高级算法专家

个人介绍:刘春辰,计算机博士。目前就职于阿里巴巴数据技术部,担任高级算法专家。主要从事知识表示、自然语言处理、贝叶斯推断、可解释AI、因果推断、鲁棒优化等领域的前沿技术创新研究及商业化落地。在学术成果方面,在ICML、AAAI、IJCAI等顶级AI会议、期刊发表多项研究成果,先后发表20余篇SCI、EI研究成果,在海内外申请专利40余项。

演讲题目:基于因果推断的商家经营智能诊断实践

演讲提纲:

1. 处方式分析及因果推断简介

2. 商家经营端到端诊断框架

3. 关键技术介绍

听众收益:

1. 了解因果效应估计、因果网络发现的一些前沿探索

2. 了解如果综合异常检测、归因、因果推断、决策优化等技术构建智能的商家问题/机会自动诊断

3. 了解处方式分析在商家场景下的落地实践


常铮 腾讯视频 用户增长

数据科学负责人

个人介绍:腾讯视频用户增长数据科学负责人,在用户数据分析领域深耕多年,对投放/push/活动等增长武器的应用有丰富经验,对数据量化和评估有一定方法论。

演讲题目:因果推断在腾讯视频增长业务的应用

演讲提纲:腾讯视频增长业务在因果推断领域做了一些探索,分享内容框架如下:

一、业务场景落地:

1. Uplift 增益模型,加强用户理解。识别用户对策略的 HTE,优化策略收益

● uplift模型方法对比和模型效果评估

● 四个实际落地案例·

2. PSM 用户匹配,开展增量评估。作为AB实验的补充工具,评价策略效果

● 对于PSM准入逻辑和评估步骤,总结了一套方法论

● 四个实际落地案例

二、技术创新探索:

1. 为解决海量样本的因果推断,我们封装了SparkCausalML,一个用来做因果推断的 PySpark 包

2. HTE 增益模型的深度架构升级

听众收益:

1. 一组业务实操的案例,打开落地场景的想象空间

2. 一套严谨完备的方法论,助力应用实践和减少踩坑

3. 一个高效使用的代码包,解决海量样本处理的实用工具




③ 用户增长与因果推断论坛

出品人/圆桌嘉宾:杨晓庆

快手用户增长触达算法负责人

个人介绍:杨晓庆,快手用户增长触达算法负责人。博士毕业于香港中文大学计算机系,在加入快手之前,曾在滴滴担任首席算法工程师。她成功将因果推断在用户增长、定价补贴等领域落地实践并助力业务。


秦旋/余珊珊 快手 算法工程师

个人介绍:

秦旋,毕业于美国波士顿大学,清华大学计算机系研究员。曾在滴滴出行任职高级算法工程师,研究方向为因果推断。曾自主开发了一套适用于工业界的RCT&观测数据融合算法。参与开发基于SPARK的分布式因果森林,并进行改造与升级。该工作在网约车智能定价业务上多次取得ROI收益。加入快手后,负责裂变场景下RCT数据流的规范化开发与树模型&深度模型的联合建模。

余珊珊,浙大硕士。2020年加入快手,现主要工作内容为基于表征学习的因果推断方法在裂变场景的业务落地和技术创新。

演讲主题:基于表征学习的因果推断技术实践

演讲提纲:

1. 工业界 RCT 实验规范

2. 树模型&深度模型联合建模

3. RCT 数据&观测数据融合建模

4. 在观测数据中进行特征分解

听众收益:

1. 在工业界,如何规范,有效的收集 RCT 数据

2. 树模型和深度模型在因果建模上的优势该如何结合

3. 如何使用有限的 RCT 数据与大量的观测数据融合建模

4. 在观测数据中,我们如何分理出混淆变量,工具变量与调整变量


刘刚刚 腾讯 PCG 算法工程师

个人介绍:曾就职于中科院计算所,在17年加入滴滴智能出行部,负责司乘画像、智能增长策略的挖掘;20年加入腾讯平台与内容事业群(PCG),在微视负责数据挖掘、用户增长相关的业务,后转入PCG中台,目前负责用户兴趣画像,商业化方向的中台能力建设。

演讲主题:因果推断在腾讯 PCG 中台的落地实践

演讲提纲:

1. 因果推断方法概述

2. 中台视角的因果推断能力建设

3. 中台赋能业务的实践

听众收益:了解因果推断在业务落地的通用方法论,从实验设计、算法选择、策略生成到最终的业务上线;同时了解如何更体系化的,建立一套高效的数据挖掘与因果推断建模流程。


宛舒 亚利桑那州立大学 博士研究生

个人介绍:宛舒,在读博士(一年级),目前就读于美国亚利桑那州立大学数据科学分析与工程专业,主要的研究方向为因果推断和基于物理知识的机器学习。宛舒曾就职于滴滴出行供需策略技术部,主要从事价格弹性建模,价格实验平台等工作。在滴滴工作期间,深度参与了广义因果森林的技术开发和策略迭代,并推动该模型成功上线。

演讲题目:广义因果森林的构造以及在在线交易市场的应用

演讲提纲:

1. 处理效应估计在交易市场策略中的重要性

2. 什么是广义因果森林,如何构造

3. 广义因果森林的效果和其他模型的比较

听众收益:

1. 如何估计连续非线性的处理效应?

2. 如何构造广义因果森林?

3. 广义因果森林的应用


罗文娟 快手 增长算法工程师

个人介绍:罗文娟,博士毕业于中国科学院计算技术研究所,研究方向为文本挖掘。毕业后曾在美团从事用户增长相关算法优化,在滴滴担任资源分配业务负责人。加入快手后,主要工作内容为基于因果推断算法优化 push 效率提升push效果。读博和工作期间曾在 ICDM,KDD,NIPS,Information Processing & Management , Knowledge Based System 等顶级会议和期刊上发表多篇论文并发表国际专利一项。

演讲题目:因果推断在有限资源决策中的应用

演讲提纲:简要介绍因果推断是什么,有限资源决策问题是什么,因果推断在有限资源决策中的关键作用,针对工业界的几个经典场景介绍因果推断的落地实战。

听众收益:

1. 什么是有限资源决策?有哪些具体的应用场合?

2. 有限资源决策需要用到哪些技术?因果推断在其中的关键作用?

3. 本次分享针对工业界比较典型的应用场景分享一些因果推断的落地实战,希望能帮助大家打开思路解决实际问题。



④ 搜广推中的因果推断论坛

出品人/圆桌主持人:胡泊

腾讯 PCG 大数据平台部总监

个人介绍:现任腾讯 PCG 大数据平台部资产服务中心总监,负责 PCG 画像中台、风控中台、数据治理中台等数据产品,曾就职于 LinkedIn、探探、滴滴,有多年数据产品、数据挖掘和因果推断建模经验。


乔阳 腾讯 FIT 高级应用研究员

个人介绍:乔阳,硕士毕业于浙江大学计算机学院,2018年加入腾讯FIT,负责金融场景下推荐和精准营销相关工作,致力于通过AI技术助力金融业务发展。研究兴趣包括大规模深度学习、用户行为序列建模、因果推断与纠偏推荐等。

演讲主题:debias 在金融推荐场景下的探索应用

演讲提纲:现有推荐系统的研究大多旨在设计更好的模型来拟合用户的行为数据,但由于实际系统中普遍存在着各种偏置,直接对观测数据建模不仅可能反映不了模型的真实性能,也会损害用户体验。金融场景下由于用户转化链路长、产品形态复杂、样本稀疏,模型更容易受到各种 bias 的影响。近年来纠偏推荐得到了学术界和工业界的广泛关注,但相关方法在工业界的应用仍然处于探索和发展阶段。本演讲首先对纠偏推荐的研究进展进行概述,随后介绍我们提出的样本层面上IPS采样联合训练纠偏框架和表征层面上偏置代理纠偏框架两种 debias 新思路,最后介绍上述方法在金融推荐场景的线上效果和落地经验。

听众收益:

1. 了解当前代表性的纠偏推荐研究思路

2. 了解 IPS 采样联合训练纠偏框架和偏置代理纠偏框架两种新的纠偏思路

3. 了解纠偏技术在金融推荐场景的落地经验


郑嘉 腾讯 PCG 11级研究员

个人介绍:腾讯OVBU 11级研究员,微视期间负责补贴激励,供需调优相关算法工作,不断推进因果推断方法落地,大幅提升产品核心指标,并结合业务场景探索新的因果推断方法。目前负责应用宝搜索与增长相关工作。

演讲主题:因果推断方法在微视激励和供需场景的应用与前沿方法探索

演讲提纲:

1. 因果推断方法在微视红包激励场景的应用

2. 因果推断方法在微视供需调优场景的尝试

3. 带有约束的、连续 treatment 因果推断方法的论文分享

听众收益:

1. 了解因果推断方法在短视频激励场景的落地与选取经验

2. 了解因果推断方法在短视频供需场景的尝试与trick

3. 了解针对带有约束的、连续 treatment 因果推断方法的前沿探索


张洁 腾讯 IEG Global

资深数据科学家

个人介绍:2012年毕业后,先后在百度、腾讯从事内容安全、金融安全、游戏增长领域的数据科学工作。对因果推断在广告投放、产品优化、用户增长、安全风控等方向的应用有广泛的研究和探索。

演讲题目:因果推断在海外游戏增长中的应用

演讲提纲:介绍因果推断在科学高效的UA投放、生命周期运营、玩法优化中的应用。

听众收益:

1. 如何科学衡量广告投放的效果

2. 如何开展运营活动提升用户生命周期

3. 如何优化游戏玩法,提升用户游戏体验


李旭琦 阿里飞猪 算法工程师

个人介绍:本科毕业于澳门大学,19年爱丁堡大学硕士毕业后校招加入阿里任算法工程师,负责领域包括飞猪保险模块相关营销推荐算法,猪搜NLP算法和多模态推荐等。

演讲题目:因果推荐技术在飞猪保险营销和可解释性上的应用

演讲提纲:

1. Uplift 增益敏感度预测

2. 基于增益敏感度预测在飞猪保险各场景上的应用和效果

3. 贝叶斯因果网介绍

4. 基于贝叶斯因果网构建保险用户决策图及可解释性应用

听众收益:

1. 如何应用 uplift 技术做价格/红包/文案营销推荐?

2. 如何构建可解释的贝叶斯因果网?

3. 如何通过贝叶斯因果网挖掘因果关联和规则?




⑤ 金融场景中的因果推断论坛


出品人/圆桌嘉宾:李东晨

度小满 资深算法专家

个人介绍:李东晨,度小满资深算法专家,经营模型团队负责人,本科毕业于北京邮电大学,硕士毕业于伦敦大学学院(UCL)计算机系,当前专注于将因果推断技术与金融业务结合落地。


高寒 腾讯金融科技 高级算法工程师

个人介绍:毕业于普渡大学,现负责腾讯金融科技信用卡及证券业务的营销及推荐算法。研究深度 UPLIFT 算法助力业务精益增长,并搭建因果推断工具箱提升数据分析底层能力。

演讲主题:深度 UPLIFT 模型在金融科技用户增长的探索应用

演讲提纲:UPLIFT 模型是助力业务精益增长的关键算法。本次课程重点介绍了在多值干预(multiple treatments)、多任务学习(multitask learning)、观测数据纠偏(debias)、连续值预估(continuous outcome)课题下的深度 UPLIFT 模型研究,并介绍了使用UPLIFT模型突破业务增长瓶颈的应用实践。主要内容包括:

1. UPLIFT 模型概述

2. 业务场景介绍

3. 技术演进探索

听众收益:

1. 了解深度 UPLIFT 模型发展脉络

2. 如何构建并优化深度 UPLIFT 模型

3. 如何应用模型与业务场景适配


万世想 度小满 资深算法工程师

个人介绍:万世想,度小满资深算法工程师,硕士毕业于天津大学计算机系,在滴滴和腾讯有三年因果推断工业实战经验。加入度小满后,专注于因果推断对金融核心业务的前沿研究与落地。

演讲主题:基于反事实因果推断的金融额度模型

演讲提纲:基于关联的机器学习已经在金融科技领域有着广泛而成熟的应用。在用户申请额度之前,平台会通过其历史征信记录,来初步识别用户的潜在需求和违约风险(逾期率)。平台授予用户的额度会进一步影响用户的逾期率。通常认为,授信额度与逾期率呈现正相关关系。但历史数据往往呈现出辛普森悖论,即高额度优质用户的逾期率显著低于一般用户。传统机器学习无法解决额度与风险的悖论关系,我们必须借助因果推断做反事实估计。本报告将主要向大家介绍,我们从0到1地在大规模观测样本上,利用因果表示学习搭建额度模型框架,并且取得了突破性的业务收益。

听众收益:

1. 传统机器学习与因果推断

2. 什么是因果表示学习?

3. 基于数据驱动的额度模型

4. 如何评估额度模型的效果


贾延夺 360数科 算法专家

个人介绍:中国科学技术大学硕士研究生,毕业后加入IBM,主要负责大型toB公司定制化数据挖掘解决方案。17年加入学而思网校,用户策略负责人,负责全网校线索分发、师生匹配、电销业务和辅导业务智能化工作。目前在360数科,主要负责老客经营业务,因果模型在个性化营销方向的落地。

演讲题目:因果推断在金融客户营销领域的应用

演讲提纲:

1. 因果模型0-1建设思路

2. 从历史数据中挖掘因果模型样本

3. 复杂干预特征的表达

4. 业务实践中的效果评估

听众收益:

1. uplift 模型应用过程中会遇到哪些挑战?解决方案是什么?

2. PSM 模型在实践中是否真的有用?又该如何构建?

3. 复杂业务场景如何充分表达干预特征?


崔卿 蚂蚁集团 高级算法专家

个人介绍:崔卿于2015年从清华大学数学系博士毕业,2015年加入阿里巴巴,2015年至2018年在阿里云从事大规模机器学习平台和强化学习平台的研发,2018年加入蚂蚁集团后,主要负责可解释平台和因果推断平台的业务应用和技术研发工作。

演讲题目:在因果推断中如何更好地利用数据?

演讲提纲:本报告从两个方面来介绍我们如何利用更多的数据来做好因果推断,一个是利用历史对照数据来显式缓解混淆偏差,另一个是多源数据融合下的因果推断。主要内容包括:

1. 因果推断的背景知识

2. 纠偏因果树

3. 因果数据融

4. 在业务中的应用

听众收益:

1. 如何利用历史对照数据来更好地纠偏?

2. 如何在多源数据融合下做好因果推断?

3. 因果推断如何解决实际业务问题?


傅剑文 翼支付 算法总监

个人介绍:中国电信翼支付算法总监,毕业于伊利诺伊大学芝加哥分校计算机科学系,目前在翼支付人工智能研究院负责AI算法研发工作,曾在携程、PayPal、SGI从事模型算法及高性能计算相关工作,曾在创业团队担任CTO。

演讲题目:因果推断在翼支付智能决策中的探索实践

演讲提纲:

1. 什么是因果推断?

2. 因果推断如何应用于智能决策。

3. 关于因果推断的深入思考。

听众收益:

1. 了解因果推断的主要原理。

2. 了解如何将因果推断应用于业务场景。


▌如何参与?

扫码入群收看

▌关于我们

DataFun:专注于大数据、人工智能技术应用的分享与交流。发起于2017年,在北京、上海、深圳、杭州等城市举办超过100+线下和100+线上沙龙、论坛及峰会,已邀请超过2000位专家和学者参与分享。其公众号 DataFunTalk 累计生产原创文章800+,百万+阅读,15万+精准粉丝。



网友评论已有0条评论, 我也要评论

发表评论

*

* (保密)

Ctrl+Enter 快捷回复