2021.07.21Source: 赛迪网
当 AI 进入后深度学习时代,其应用成果已深入至人类生活的方方面面。相关企业凭借着更丰富的数据、人才和市场资源,取得了关键技术的突破,开创了新一轮的创新应用前景。
近日,以“众智成城”为主题的世界人工智能大会(WAIC)在上海举办。图灵奖得主、阿里巴巴高管、百度高管、上海交通大学计算机系教授、斯坦福大学计算机科学教授、及九章云极 DataCanvas等国内一众 AI 产业界代表齐聚论坛现场。
与会期间,WAIC九章云极DataCanvas董事长方磊接受了赛迪网记者的采访。
在深度学习崛起的这些年,人工智能技术突飞猛进,对各行各业带来了巨大的影响。如何从底层思考、上层基础设施,多个维度探索 AI 的发展成为相关企业思考的重点。
在相关行业人士看来,“人工智能”是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。其分支包括专家系统、机器学习、进化计算、模糊逻辑、计算机视觉、自然语言处理、推荐系统等。而深度学习是用于建立、模拟人脑进行分析学习的神经网络,并模仿人脑的机制来解释数据的一种机器学习技术。从技术发展角度来说,其实深度学习是AI的一个阶段。在一定意义上,深度学习是围绕着AI这个大的主题发展。
如今企业开始广泛而深入的进入AI阶段,人才匮乏、数据短缺、内部能力缺失成为企业发展的难题。据悉,九章云极DataCanvas坚持“硬科技”,专注“纯软件”产品研发并匹配“纯软件”产品的市场战略。方磊提到,面对不同行业、不同场景,九章云极结合“四库”技术,解决知识融合问题,同时运用自动化的AI产品,接入数据,降低企业建模门槛,支撑企业业务,结合产品平台化的功能在企业大规模应用后,实现成本很低、性能更高,提升企业客户数智化升级能效。
人工智能已经成为当今社会经济发展的重要技术底座,开源开放是驱动AI技术创新和产业发展的重要模式。近年来,也是开源的黄金时代。开源在今天毫无疑问已经成为了软件最主流的一种渗透方式。相关公司以开源为技术底蕴,积极参与开源生态的建设,推动了AI技术和产业创新发展。
在深度学习开源框架市场中,九章云极DataCanvas开源的框架处于国际领先地位,应用于众多的行业客户,在应用性和先进性上都是自动机器学习的的最先进之一。其中DeepTables在世界竞赛Kaggle中获得第一名,以Hypernets为核心的一系列开源工具包——面向结构化数据的HyperGBM、面向深度学习的HyperKeras,解决各个应用领域自动化的问题,降低门槛构建模型。
作为一个自动机器学习的底层通用框架,Hypernets帮助企业实现自动化,只要5行代码就能训练出高质量模型,解决自动建模领域的三个关键技术:丰富的搜索空间表示、提供多种高效的搜索算法、高性能的评估策略。
在搜索空间里,本质是由三部分组成,一部分叫做Connection Hypernets,一个点和下一个点连接的方式。另外一个被称为Promoter Space,就是所谓参数空间。还有Module Space,不同计算模块本身有模块空间。在一定意义上,不同的算子代表模块空间,连接方式代表连接空间,参数代表参数空间把它放到一起就是整个搜索空间。方磊谈到,在搜索空间内运用Monte-Carlo Tree Search和遗传算法来进行计算,从而达到局部最优。
基于超架构的搜索空间完成神经网络超参数和微架构的自动搜索和模型训练,再一次提升自动机器学习工具的开发和应用效能。方磊认为,使用Hypernets很容易结合出框架本身的自动机器学习能力,如果是开发应用模型,还能组合不同学习训练框架的同时,在上面使用Hypernets,端到端的整个pipeline进行自动机器学习的参数搜索,搜索时间减短,算力仅需普通训练的20-30倍,从而得到较好的模型。并且对于企业而言,不仅降低人力成本,并且能够提升业务创造业务价值。
根据相关报道可知,九章云极DataCanvas凭借国内外领先的自动化机器学习平台建设能力,其开源项目在银行、保险、证券、基金、运营商、政府、交通以及一些像工业制造之类行业已经深深广布。
在面对企业AI业务的新需求、新问题时,九章云极DataCanavs重点突出其自动化能力,坚持自主创新,持续增强AI技术的应用规模,全力服务企业数智化升级。
在方磊看来,AutoML领域虽然在不断发展,但也面临不均衡数据、概念漂移、模型泛化能力、大规模数据自动建模等诸多挑战。这是由其技术现状和新算法环境所影响的。但这些问题都不足为惧,自动机器学习平台的建设目标是面向IT,帮助业务模型解决问题,其中做好在行业大规模落地,实现自动化的推广、渗透才是最重要的。
目前,九章云极DataCanvas自动机器学习平台已成为集数据准备、特征工程、算法实现、模型开发、模型发布、模型生产化管理于一体的机器学习平台,能够帮助企业快速构建数据分析应用。在国内,数据密集型的行业,金融、运营商等已大规模使用。方磊透露,九章云极的开源项目做的不是传统的销售项目,而是社区分享,通过用户口口相传的好评变成一个自然而然的商机形成的过程。
九章云极DataCanvas作为专注自动化数据科学平台的持续开发与建设,着重为数据科学家,AI从业者提供一整套开发平台,为政府和企业智能化升级和转型提供全面配套服务的企业,在未来,将继续坚持坚持自主创新、科技创新,深耕大数据领域专业技术及应用实践为多行业客户提供实时敏捷的AI能力建设!(文/徐培炎)