News Center

Causal decision-making starts with YLearn, and data intelligence foundation software welcomes the "window"

2022.08.15Source: 云数智观察

学习知识不能流于表面,不仅要“知其然,更要知其所以然”,探究事物的本质及其产生的原因。

因为疫情而减少飞行的原因,有些人的航空公司金卡会员身份被降至了银卡甚至普遍卡,乘机体验大打折扣。优先登机、免费使用航空公司的VIP休息室、免费升舱等优惠服务,对于频繁出差的旅客来说还是颇具吸引力的。实践证明,会员制是培养客户忠诚度的有效营销手段之一,并且在商业企业的营销中占据了越来越重要的地位。无论是去商场消费,还是去美容美发,甚至在网上买个零食,会员的身份都可以让你享受到更多优惠或其他服务。

商家希望将会员制作为一条有效的纽带,不断增强客户的黏性,所以会想出各种高招吸引回头客,比如采取会员升级服务等。但是将银卡客户升级为金卡,还是将金卡客户升级至钻石卡,哪个更有益于留住客户,并最大程度地刺激消费呢?以前,商家做出相关决定时,可能就是凭经验或拍脑袋,结果也只能是“差不多”“大概其”。

现在,因为因果决策技术的应用,商家可以从以前对相关性的预测“跃升”至决策,能够对结果做出比较精确的评估和判断。九章云极DataCanvas推出了一个名为YLearn的因果学习开源项目,它提供了一站式处理因果学习完整流程的开源算法工具包,解决了因果学习中的因果发现、因果量识别、因果效应估计、反事实推断和策略学习等五大关键问题,可以有效帮助客户进一步提升自动化决策的能力。

究竟是金卡客户的消费能力更强,还是钻石卡客户对商家的收入贡献最大这个问题,对于YLearn来说是个小Case。事实上,九章云极DataCanvas也确实通过YLearn帮助某个商家做过智能分析,结果显示,从商家的投入产出来衡量,将银卡客户升级为金卡客户是最划算的。YLearn可以助力商家的卡中心将运营的精细化程度提升至更高层次,而这在以前是很难做到的。

从预测到决策,从YLearn学到了什么?

YLearn是何物?你把它颠倒过来想,也就是Learn Why,即“学习为什么”。

v2_feee2037d8d0472286f795fabf44e7db_img_jpg.jpeg

人们经常说,学习知识不能流于表面,不仅要“知其然,更要知其所以然”,探究事物的本质及其产生的原因。从人工智能应用发展的角度,“知其然”中的“然”,是指数据之间的关联关系,通过机器学习、深度学习便可以做到“知其然”;而“所以然”是指数据之间的因果关系,必须在机器学习、深度学习的基础之上,引入因果统计,才能实现从预测到决策的跃升。“从预测到决策,看似一小步,但正是这一步,就像当初阿波罗登月人类迈出的那一小步一样,具有决定性的意义。”九章云极DataCanvas董事长方磊博士如是说。

最近几年,在全球范围内形成了一股因果学习的热潮,微软、谷歌、卡内基梅隆大学等都投入了重点研究并发表了多篇论文,其势头之迅猛相比深度学习兴起时有过之而无不及。

“大量机器学习、深度学习所作的工作只是预测,人们已经习以为常,而决策依然要靠脑补。比如,降低月费能挽留多少客户这件事,只应用机器学习和深度学习,得不出一个肯定的说法。今天,越来越多的客户需要对策略进行评估,这就要依靠因果学习。”方磊解释说,“我们推出YLearn,并非单纯追求技术上的创新突破,而是客户需求使然。YLearn覆盖从因果发现、评估到决策一系列模块的端到端开源框架,能够有效降低决策者的使用门槛。”

如果说机器学习是1.0、深度学习是2.0,那么因果学习就是3.0。以前不能做决策评估或者说做得比较粗糙,而现在有了因果学习的助力,评估的精度显著提升。一方面,金融、运营商以及大型企业客户有了迫切的需求,另一方面,因果学习技术快速发展,九章云极DataCanvas在这样一个合适的时间点推出像YLearn这样的开源框架,可谓生逢其时,推动了整个行业的发展。

YLearn由CausalDiscovery、CausalModel、EstimatorModel、Policy和Interpreter等部件组成,各部件既可独立使用,也可以进行统一封装。借助这些组件,YLearn能够实现用因果图表示数据集中的因果关系、识别因果效应、概率表达式和各类估计模型等功能。在九章云极DataCanvas的另一核心技术AutoML自动机器学习的加持下,YLearn还能实现自动调参、自动优化、一键自动生成对应结果“Y”的多种决策方案等高级功能,进一步降低了应用门槛。

v2_78befcc9b45b47ec800b61ca21d5fa49_img_jpg.jpeg

YLearn 因果学习开源项目组成

在人工智能1.0时代,人们打造了AI的基本框架;进入2.0时代,进一步降低了AI的应用门槛;到了3.0时代,数据的极大丰富以及因果学习算法上的巨大突破,使得从预测到决策成为可能。“在AI 3.0时代,我们要将AI的技术能力赋能给业务端,实现更准确的决策,给用户带来更大的实用价值,而不是只围绕着预测打转转。”方磊表示。

为什么是九章云极DataCanvas拔了头筹?

上文已经提及,全球研究因果学习关系的企业、高校有很多,但为什么是九章云极DataCanvas推出了因果学习完整流程开源工具包?

方磊回忆说:“大约两年多前,在与客户的交流中我们了解到,客户在业务上遇到的最大瓶颈是AI预测与企业的业务运营之间是脱钩的。弥补这中间的鸿沟当然需要很多技术,而因果关系是其中非常关键的一环。我们认定了这一突破点,启动了相关研究,最终开发出这一工具包。现在看来,我们当初的选择是正确的。”

因果关系决策之于AI,其重要性就相当于Tensorflow之于深度学习。YLearn是九章云极DataCanvas站在前人的肩膀上,为开发者提供的一个统一的、标准化的、低门槛的工具,让因果关系决策可以轻松落地,而不需要开发者把大量精力放在自己研究和部署相关的基础组件上,也无需开发者自己写更多代码,只要调用YLearn提供的API,就可以使用九章云极DataCanvas开发的简洁而强大的因果学习底层框架,更快速地应用于实际业务中。

虽然国外有很多厂商、研究机构和高校在研究因果关系决策,但大多只是出于研究的目的,而且停留在对单个点的研究上,并不是将因果学习框架的商业化作为目标。九章云极DataCanvas是一家企业,以服务客户为目标,非常注重实用性,所以从深入研究因果关系决策的第一天开始,就致力于将其变成一个客户能够用的产品框架。有客户需求、有九章云极DataCanvas自身的技术和能力积累,又找到了一个适合的切入点,YLearn的推出也就顺理成章了。

通过给定的数据集,发现因果关系,并将其变成因果图谱,在其上进行策略检验,然后再根据这个图谱进行评估和推断,形成最终的结果。这样一个标准的流程、端到端的每一步,如今都可以在YLearn中便捷、完整地实现。“达到同样的效果,如果不使用YLearn,一个博士先要研读大量相关论文,然后做大量重复性的工作,而采用YLearn则可以事半功倍。”方磊表示,YLearn将决策这件事从博士生才能胜任的工作“降低”到程序员就能搞定,未来随着图形化交付的实现,可能普通的业务人员也能轻松上手。

YLearn如同一面旗帜,标志着从预测到决策的飞跃,更大的业务价值将进一步释放出来。相信接下来整个行业也会跟风而起。

找准突破口,做大做强数据智能基础软件

九章云极DataCanvas长期专注于数据智能基础设施的建设,而YLearn对于其数据智能基础软件平台来说起到了承前启后的作用。

虽然从产品形态上说,YLearn目前只是一个开源的核心算法包而已,但从产品架构上看,它从承载模型的上线推理到承载决策的上线推理,这是一个极大的改变。“从预测到决策不会一蹴而就,但从YLearn开始,数据科学家这一人群终于拥有了决策判断的能力。从这个角度说,YLearn起到了承前启后的作用。”方磊表示,“我们的数据智能基础软件平台以前承载的是模型,从YLearn发布开始将承载决策,这是本质的变化。迈出这一步,我们也就从模型的视角转向了决策的视角,从而更加贴近业务。客户能否对AI进行持续、大量的投资,主要取决于客户能否看得更清楚,能否做出更精准的评估。而这一切的前提就是决策能力的提升。”

九章云极DataCanvas之所以对YLearn充满信心,因为YLearn体现的是业务价值。当前,YLearn还处于蹒跚起步的阶段,但它带来的改变是具有革命性的,让用户第一次可以做出精确的评估。以前我们常说的机器自动决策,适用的范围相对较窄,而现在所说的决策则是拓展到更大的范围、更高的层次。有了数据、有了因果关系,用户就可以从更丰富的视角去预测、评估,从而得到更精确的结论。

进入AI 3.0时代,数据智能基础软件平台要做的是更好地赋能给数据科学家、程序员乃至业务人员。因果学习会产生出更多决策的组合,使其与业务相结合就更加复杂。使因果学习决策更加标准化、简单化就成了一项现实的挑战。九章云极DataCanvas认为,这会是数据智能基础软件发展的一个突破口,虽然可能会经历一条较漫长的商业路径,但一旦被市场和客户所接受,将成为数据智能基础软件一次关键性的升级。

方磊表示:“我们会坚持做好那些‘苦活’‘累活’,沿着明确的发展路径,加大产品的研发和投入。我们不是单纯地销售软件和服务,而是云中的一份子,携手云生态的合作伙伴,通过‘云中云’的模式,推动数据智能基础软件的广泛应用。在因果学习这方面,我们也是采取相同的策略和作法。”

如今,九章云极DataCanvas的业务已经从以金融、运营商为主,逐步扩展到能源、交通、国央企等十几个行业,2022年第一季度收入相比去年同期实现了100%的增长。YLearn作为一款开源工具包,除了供社区用户下载使用以外,也会作为九章云极DataCanvas数据智能基础软件平台的一个重要功能 ,与其他企业级产品和功能打通,为用户决策提供更好的助力。

从辅助决策到增强决策再到自动决策,这是一个持续演进的过程。目前,大部分用户还处在辅助决策阶段,增强决策的应用也才刚刚开始。因果决策则是始于增强决策,实现向自动决策跨越的关键一步。YLearn无疑踩准了节奏。