News Center

DataCanvas亮相双创周期重点论坛,CTO尚明栋分享金融科技实践经验

2018.10.15

  • 10月12日-13日,2018中关村创新创业季重点活动——2018金融科技发展论坛暨第三届中国金融科技创新大会在北京顺利召开。DataCanvas CTO尚明栋受邀出席论坛,与政、产、学、研、金各方代表齐聚,共话金融科技创新发展。DataCanvas数据科学平台获评“2018金融科技优秀解决方案”。


  • 本次论坛以“新科技·新金融·新动能——推动金融科技发展,助力实体经济腾飞”为主题,中国银行、农业银行、工商银行、建设银行、交通银行等20余家银行代表,DataCanvas、腾讯、兴业数金、亚信安全、甜橙金融、中金智汇等科技企业代表,和微软、埃森哲、毕马威等国际著名科技企业和咨询公司纷纷从不同行业角度分享科技赋能金融的实践经验和前瞻见解。DataCanvas CTO 尚明栋在论坛上发表主题演讲(下附精彩演讲内容)。


  • 从BI到AI,历史赋予的时代机遇

    金融领域正处于从BI到AI转换的阶段,这是历史赋予我们的时代机遇。从技术角度看BI发展到AI的原因和历程,BI数据基础是数据仓库,实现的更多的是数据统计性的分析,然后借助于人工解读统计结果,从而实现商业价值。BI最主要解答的是呈现发生了什么事、发生的原因是什么。

    现在在大数据时代,由于海量数据的收集以及数据产生的速度,数据模式发生了根本性变化。我们对于数据的需求,从统计性的决策转变为预测性的决策。人们除了希望了解已经发生了什么,还想了解未来有可能会发生什么,为了应对有可能发生的事件应该去创造什么样的条件,这就是我们说的AI模型决策来产生的预测性分析的价值。

    从描述性的分析、诊断性的分析到今天决策性分析和预测性分析,不仅对技术难度提出了的挑战,同时对于使用者的要求也发生了根本性的变化。在BI时代,企业需要使用者的自主分析,对可视化的报表做出解读;而在AI时代,人们需要的是结合更多的机器学习算法,需要的是数据科学家的能力,来实现预测分析和业务价值的结合。

  • 数据科学平台 + 平民数据科学家 = 数据科学家

    为什么数据科学家这类人才如此之难得?

    数据科学是一个综合性的科学,除了信息论、统计学,对计算机科学、人工智能等领域也需要有所涉猎,因此,数据科学家需要拥有复合型技能。在我国,开设本科数据专业的院校从2015年的3所发展到2017年的248所,一方面体现出人才培养的重要性,但同时也体现出一个严峻的现实:数据科学家人才的供给真正在市场里能发挥出价值,至少是2021年以后的事情。所以Gartner在2017年总结发展企业AI所面临的六个问题中,第一个其实就是数据人才的短缺。

    在这种情况下,我们提出了让“平民数据科学家”——那些不像数据科学家那么专业的使用者——通过降低了使用者学习门槛和使用门槛的数据科学平台来实现预测分析。

    2017年2月,数据科学平台第一次出现在Gartner魔力象限里。数据科学平台是实现AI的基础,实现数据分析整个流程的自动化和智能化,就是数据科学平台的主要功能。

    那么,DataCanvas数据科学平台是如何让只有数据科学家才能够实现的功能,通过平民数据科学家就可以实现?DataCanvas输出的模型数据资产又是如何快速地应用到生产系统里,实现模型的生产化呢?

  • 两大功臣:AutoML和模型生产化

    数据科学家从处理数据到最终输出预测性模型,要经历数据的理解、数据探查、特征工程、模型训练、模型评估,直到最后输出到生产系统里面去,整个流程是非常高的壁垒。当DataCanvas数据科学平台介入进来,通过特征工程的选取、算法的选择、模型的训练以及模型的评估,整个流程变成自动化、智能化过程。

    同时,在智能建模过程中,借助于AutoML,DataCanvas数据科学平台可以将数据探查和特征工程的工作量节省70%,最终我们将同样效果或者说接近同样效果的模型训练和模型评估的学习门槛降低为接近于“0”。因此,借助于数据科学平台,平民数据科学家完全能够完成智能化的数据建模,能够快速实现AI应用。

    2018年,神经网络结构搜索进入我们的视野。DataCanvas开始借助机器学习来构建深度的神经网络,也就是说,用机器学习的方式,构建机器学习的模型,并取得了深入进展。我们畅想,随着技术的进步,进入全自动的数据化的模型、并能够实现自我解释的“上帝模式”也会成为现实。

  • AI能力的最终目的是实现应用落地

    DataCanvas作为大数据和AI能力输出商,通过DataCanvas数据科学平台产品和数据科学家服务,结合用户的业务需求,可以生成一个个适用于不同场景的金融行业的解决方案。将技术在场景中落地,是DataCanvas在技术研发的同时关注的重点问题。

    在这种理念下,DataCanvas数据科学平台套件内的产品,可以灵活适用于不同的业务场景。比如DataCanvas RT实时智能引擎和DataCanvas APS机器学习平台,落到业务场景上,实现的是业务监控;落到运维数据场景上,则可以实现AIOps。目前,DataCanvas已在金融、交通、政府、IoT等行业领域,落地近百个业务场景,为企业用户直接提升商业利益和综合竞争力。

    未来,DataCanvas仍会将技术紧密贴合场景,通过实时和数据分析两大核心能力和数据科学家服务的不断输出,为金融行业更多业务场景提供端到端的解决方案,为AI全面赋能金融行业贡献力量。