Alaya-7B

Alaya-7B Foundation Model是DataCanvas Alaya九章元识大模型矩阵的其中一款开源通识大模型,是在自我采集、精心筛选处理的万亿token数据集上从0开始预训练而成。自有采集数据包含网络上的中英文文章、新闻、百科等数据源。


https://github.com/DataCanvasIO/alaya 


Alaya-7B Foundation Model

Alaya-7B Foundation Model

Alaya-7B Chat Model是Alaya-7B的对话版本,同样是Alaya大模型矩阵的成员之一。通过在精心选择的微调数据集上进行微调,并对基于涉毒、涉黄以及不良偏见数据进行去毒,从而生成和人类价值观对齐的对话式大模型。


https://github.com/DataCanvasIO/alaya 

Alaya-7B Chat Model

Alaya-7B Chat Model

大模型性能优势
  • 友好的开源License

    “白盒”模型,Apache 2.0 license,支持Fine-tune

  • 多模态

    支持文本、图像,支持时序数据,支持结构化数据

  • 新的模型训练机制

    改进的attention机制,更长的context window, Composable fine-tune,全新的masking机制

  • 系列模型矩阵

    模型参数从小到大,通识到垂直行业

LLMOps大模型工具链

LLMOps大模型工具链为训练和使用大模型而生,覆盖了大模型的训练、精调、压缩、部署、推理和监控全生命周期过程,它为数据科学家、应用程序开发人员提供了一整套工具,可以轻松地处理数据并使用这些数据来开发、训练和部署任何规模的模型。

  • LMS模型运行工具

    LMS(Large Model Serving)模型运行工具主要面向工程技术人员,旨在帮助工程师实现大模型的交付、运维和运营,提高大模型的交付速度和质量,降低大模型的运维和运营成本,以及完成大模型生产化及服务运营等方面的需求。


    https://github.com/DataCanvasIO/LMS

  • LMPM提示词管理器

    LMPM (Large Model Prompt Manager) 提示词管理器是大模型提示词的设计和构建工具,通过帮助用户设计更好的提示词,引导大模型生成更加准确、可靠、符合预期的输出内容。该工具既可面向技术人员提供development toolkit的开发模式,也可以面向非技术人员提供人机交互的操作模式,满足不同人群使用大模型的需求。


    https://github.com/DataCanvasIO/LMPM 


大模型行业应用

Jarvex 知识智能体是融合九章云极DataCanvas Alaya九章元识大模型、DingoDB多模向量数据库、AIFS人工智能基础软件产品的前沿大模型技术应用解决方案。只需通过数据收集数据处理,写入向量数据库,集成、微调大语言模型,知识助手应用,以及反馈与迭代优化六步过程,企业用户即可构建高度自动化与智能化的企业知识管理和探查分析的能力。


Jarvex 知识智能体技术亮点
  • 多模态支持

    支持多种数据模式
    提供对齐语义

  • 高精度检索

    多种数据的解析
    保留原文真实内容

  • 高可用与扩展性

    存储提供多副本机制
    存储提供多节点扩展机制

  • 安全合规

    数据私域存储
    大模型企业内部署

  • 智能数据融合

    结构与非结构联合分析
    多业务系统的数据

  • 场景丰富

    知识问答
    多模态数据检索
    自然语言分析、决策

咨询