ModelEngine

ModelEngine

ModelEngine提供从数据处理、知识生成,到模型微调和部署,以及RAG(Retrieval Augmented Generation)应用开发的AI训推全流程工具链。

公告

README

产品介绍

ModelEngine提供从数据处理、知识生成,到模型微调和部署,以及RAG(Retrieval Augmented Generation)应用开发的AI训推全流程工具链,用于缩短从数据到模型、 数据到AI应用的落地周期。ModelEngine提供低代码编排、灵活的执行调度、高性能 数据总线等技术,结合内置的数据处理算子、RAG框架以及广泛的生态能力,为数据 开发工程师、模型开发工程师、应用开发工程师提供高效易用、开放灵活、开箱即 用、轻量的全流程AI开发体验。

ModelEngine产品包括数据使能、模型使能、应用使能模块,各模块功能定位如下:

数据使能:是用于文本、图像、文档等各类型数据处理的工具链,提供如数据清洗、数据评估、QA对生成、知识生成关键能力,为大模型训练和RAG应用提供语料和知识,应用场景如下:

● 面向大模型训练场景:提供数据处理工具链,解决用户高质量数据处理困难的问 题、缓解数据量不足的痛点,辅助模型训练提效。

● 面向大模型推理场景:提供知识库管理能力,解决行业用户领域知识生成与更新 的需求,知识生成能力,帮助用户更加有效落地大模型应用。

数据使能关键能力包括:

● 内置数据清洗算子,覆盖文本(PDF/DOC/DOCX/Markdown/MD/TXT/Html/XML/ JSON格式类型)、图像(PNG/JPG/BMP/JPEG格式类型)多模态数据清洗。

● 内置数据质量评估能力,对文本质量进行人工/自动化评估,对数据清洗效果产生 反馈,辅助优化数据清洗流程。

● 内置QA对生成能力,基于清洗后的文本数据与外置大模型服务,自动生成大模型 微调QA对,留用率60%;具备QA对自动评估/留用审核能力,大幅提升QA对审核 效率。

● 内置知识向量化功能,基于清洗后的文本数据,通过Embedding模型与向量数据 库服务,将纯文本数据转化为向量化知识,对接推理应用。

模型使能:是面向模型微调和模型推理的工具链,降低模型训练和推理门槛,主要应用场景如下:

● 模型训练:提供模型训练工具链,基于界面内配置方式,降低模型训练和微调难 度。

● 模型部署:提供模型评测、模型仓库、模型服务等功能,实现大模型部署、上线 和版本管理。

● 模型管理:提供模型权重管理、模型量化,训练后的checkpoints归档功能。

● 模型评测:提供利用第三方或者自定义评测数据对模型进行精度和性能评测的能 力。

模型使能关键能力包括:

● 提供训练引擎和推理引擎,支持开发者模型选型/评测、模型训练、模型管理和模 型推理;提供无代码操作、一键精调能力。

● 提供OpenAI标准推理接口,一键部署模型。

● 开放硬件生态,支持昇腾NPU;开放模型生态,支持safetensors格式模型权重。

应用使能:是为AI应用提供一站式开发、调试和部署的工具,帮助快速构建高准确率的AI应用,主要应用场景如下:

● 应用开发:提供完整的应用编排框架以及丰富的内置插件,支持用户快速创建AI 应用。

● 应用调试:提供黑盒与白盒两种调试方式,支持用户快速定位问题。

● 应用部署:对调试成功的应用提供快速部署的能力,支持公共URL及北向API两种 访问方式。

应用使能关键能力包括:

● 面向开发者的一站式AI应用开发、调试和部署框架,支持私域安全部署。

● 面向普通用户的零代码、可视化RAG应用编排框架。

如何参与贡献

https://gitcode.com/ModelEngine/ModelEngineCommunity/blob/main/如何参与贡献.md

公众号

B站视频号

项目邮箱:modelengine@163.com

精选项目
818

FIT: 企业级AI开发框架,提供多语言函数引擎(FIT)、流式编排引擎(WaterFlow)及Java生态的LangChain替代方案(FEL)。原生/Spring双模运行,支持插件热插拔与智能聚散部署,无缝统一大模型与业务系统。

928

DataMate是面向模型微调与RAG检索的企业级数据处理平台,支持数据归集、数据管理、算子市场、数据清洗、数据合成、数据标注、数据评估、知识生成等核心功能。

1.13 K

Nexent 是一个开源智能体SDK和平台,能够将描述流程的自然语言转化为完整的多模态服务 —— 无需编排,无需复杂拖拉拽。基于 MCP 工具生态系统构建,Nexent 提供灵活的模型集成、可扩展的数据处理和强大的知识库管理。我们的目标很简单:将数据、模型和工具整合到一个智能中心中,让任何人都能轻松地将 Nexent 集成到项目中,使日常工作流程更智能、更互联。

187

Unified Cache Manager(推理记忆数据管理器),是一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理并持久化推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

187

Flex:ai是一个面向AI容器场景的开源项目,其核心能力包含两大部分,分别是XPU虚拟化和多级智能调度。其中XPU虚拟化分为本地XPU虚拟化和跨节点拉远虚拟化,本地XPU虚拟化支持将1台服务器上的XPU算力卡虚拟化分割出多个虚拟算力单元,实现单张算力卡在多个容器的共享。跨节点拉远虚拟化支持通过RDMA或TCP网络访问远端节点上的算力卡。多级智能调度支持对切分出的虚拟卡进行Binpack等资源级调度,以及对AI训推任务进行分时调度等能力。

1

这是一个围绕“AI + 医疗”逐步构建的开源知识社区,系统汇聚人工智能与医疗健康交叉领域的各类资源,内容涵盖学习课程体系、技术与论文前沿、开源资源和工具、AI医疗治理等内容,共同服务于研究人员、医疗从业者、AI开发者与医疗教育工作者。

  • DataMate是面向模型微调与RAG检索的企业级数据处理平台,支持数据归集、数据管理、算子市场、数据清洗、数据合成、数据标注、数据评估、知识生成等核心功能。

    Python
    928
    42
    MIT
    更新于 23 小时前
    Star
  • 这是一个围绕“AI + 医疗”逐步构建的开源知识社区,系统汇聚人工智能与医疗健康交叉领域的各类资源,内容涵盖学习课程体系、技术与论文前沿、开源资源和工具、AI医疗治理等内容,共同服务于研究人员、医疗从业者、AI开发者与医疗教育工作者。

    1
    1
    MIT
    更新于 6 小时前
    Star
  • Flex:ai是一个面向AI容器场景的开源项目,其核心能力包含两大部分,分别是XPU虚拟化和多级智能调度。其中XPU虚拟化分为本地XPU虚拟化和跨节点拉远虚拟化,本地XPU虚拟化支持将1台服务器上的XPU算力卡虚拟化分割出多个虚拟算力单元,实现单张算力卡在多个容器的共享。跨节点拉远虚拟化支持通过RDMA或TCP网络访问远端节点上的算力卡。多级智能调度支持对切分出的虚拟卡进行Binpack等资源级调度,以及对AI训推任务进行分时调度等能力。

    Go
    187
    8
    Apache-2.0
    更新于 1月19日
    Star
  • 暂无简介

    16
    0
    更新于 3月27日
    Like
  • ModelEngine开源项目公共文档库

    214
    7
    更新于 2025年6月30日
    Star
  • Nexent 是一个开源智能体SDK和平台,能够将描述流程的自然语言转化为完整的多模态服务 —— 无需编排,无需复杂拖拉拽。基于 MCP 工具生态系统构建,Nexent 提供灵活的模型集成、可扩展的数据处理和强大的知识库管理。我们的目标很简单:将数据、模型和工具整合到一个智能中心中,让任何人都能轻松地将 Nexent 集成到项目中,使日常工作流程更智能、更互联。

    Python
    1.13 K
    64
    MIT
    更新于 21 小时前
    Star
  • Unified Cache Manager(推理记忆数据管理器),是一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理并持久化推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

    Python
    187
    9
    MIT
    更新于 22 小时前
    Star
  • FIT: 企业级AI开发框架,提供多语言函数引擎(FIT)、流式编排引擎(WaterFlow)及Java生态的LangChain替代方案(FEL)。原生/Spring双模运行,支持插件热插拔与智能聚散部署,无缝统一大模型与业务系统。

    Java
    818
    51
    MIT
    更新于 3月3日
    Star
  • AppPlatform 是一个前沿的大模型应用工程,旨在通过集成的声明式编程和低代码配置工具,简化和优化大模型的训练与推理应用的开发过程。本工程为软件工程师和产品经理提供一个强大的、可扩展的环境,以支持从概念到部署的全流程 AI 应用开发。

    Java
    601
    24
    MIT
    更新于 3月13日
    Star
  • 暂无简介

    5
    0
    更新于 4月14日
    Like
查看全部项目 >
公告
成就
4.6 K
Star
238
Fork
57.58 K
Download
常用语言
Python
Java
JavaScript
Go
C++
社区动态