News Center

DingoDB多模向量数据库,大模型时代的数据觉醒

2023.08.28

1182-1.jpg

大模型技术迸发的烟花点燃了整个AI产业链。继各类生成式模型、行业大模型、AI基础软件后,“大模型的海马体”——向量数据库,成为当前最为灼热的AI技术焦点。

在九章云极DataCanvas“变革”产品发布会上重磅亮相的DingoDB多模向量数据库,将多模态能力加持到向量数据库之上,其产品能力和技术优势让业界眼前一亮。作为开源社区的一员, DingoDB正在加速实现与开源社区的联动,目前已完成与LangChain框架的对接。

1182-2.jpg

DingoDB与LangChain框架完成对接

01 DingoDB——全新的多模态数据混合分析解决方案

当前,市场上的向量数据库主要有三种形态。

第一种“基于关系型数据库的向量索引”,适用于小规模向量数据的存储和查询;

第二种“专用向量数据库”,通过使用特定的向量索引、压缩算法和查询优化技术来提供高效的向量存储和检索,一般用于企业级应用设计和优化的数据库解决方案;

第三种“分布式向量数据库”,利用分布式计算和存储技术实现了高性能和可扩展性,适用于大规模向量数据集和高并发访问的场景。三种向量数据库往往不能兼得,用户需要根据自身的数据规模、场景需求和技术成本来选用其一。

DingoDB的出现突破了当前向量数据库的有限选择。作为一种全新的向量数据库形态——分布式多模态向量数据库,DingoDB具备上述三种数据库全部能力的同时,还支持多模态数据的统一存储和联合分析,进一步扩展了向量数据库的能力边界。

DingoDB在向量化数据存储处理方面提供以下功能特性:

  • 统一存储:

提供统一的数据存储能力,支持单表存储表标量/向量数据,适用于不同数据间的联合查询和分析计算,提供全面的数据处理能力。

  • 多模态检索:

支持基于不同模态数据的联合查询和检索,非结构化数据向量化存储,有利于处理、分析和应用非结构化数据。

  • 联合分析:

支持非结构化数据向量化处理,同时提供标量数据与向量数据的联合分析能力,确保用户获取全面、准确的结果数据。

  • 一体化SQL计算引擎:

使用SQL提供强大的结构化、非结构化的分析能力,实现多模态数据类型的综合分析。

  • 异构计算:

利用多种不同类型的计算资源执行数据处理和计算任务,提高数据库系统的计算性能、增强扩展性和灵活性,实现高效分析和科学计算。

02 联合分析——多模态数据分析的必备能力

结构化数据的分析和计算一直是企业智能决策的重要组成部分。

随着信息多样化的爆发,文本、图片、视频、音频等非结构化数据变得越来越重要,结构化和非结构化数据联合分析的需求应运而生。

DingoDB以其独特的设计和开放的心态,提供了同时处理结构化和非结构化数据的能力,其多模态特性使其在处理不同类型的数据时更加灵活和高效。

DingoDB将数据湖和向量数据库的特性相结合,可以同时存储和处理多模态数据,并提供结构化与非结构化数据的联合查询和融合分析计算的能力;借助结构化和非结构化的融合分析计算技术,能够高效地管理和检索多模态数据,进一步提升数据的利用价值。

通过DingoDB,用户可以构建专属的数据向量海“vector ocean”,并实现针对不同行业场景的多模态数据存储、分析和管理的个性化需求。

03 拥抱开源——大模型时代数据觉醒的加速器

作为一款开源产品,DingoDB贯彻九章云极DataCanvas“开源开放”的产品理念,同时重视开源社区的合作和互动,以不断提升其功能和性能。目前,DingoDB与众多优秀的开源项目合作,LangChain框架就是其中一员。

LangChain是一种基于语义的知识图谱技术,它可以实现语义级别的数据关联和查询优化,从而提高数据库查询的效率和准确性。基于LangChain构建的数据库对接可以为数据查询效率带来一些潜在的提升。通过与LangChain的合作,DingoDB能够实现与其他开源工具和技术更好的集成,从而向用户提供更强大的数据能力。

专业的向量数据库开发需要长期的技术积累和投入,具有更高的技术壁垒。在大模型时代助推下,向量数据库行业将获得前所未有的资源倾斜,DingoDB的多模态向量数据库能力将持续引领行业发展,也将在时代红利下加速前进步伐。

前往DingoDB:

DingoDB官网地址:https://www.dingodb.com

DingoDB Github地址:https://github.com/dingodb