The Modular Platform (includes MAX & Mojo)
[关于 Modular] | [MAX 文档] | [Mojo 文档] | [贡献指南]
🤝 加入我们的 月度社区会议!
Modular 平台
面向 AI 开发与部署的统一平台,包含 MAX🧑🚀 和 Mojo🔥。
Modular 平台是一套开放且完全集成的 AI 库与工具套件,可加速模型服务并扩展生成式 AI 部署。它抽象了硬件复杂性,让您无需修改任何代码,就能以业界领先的 GPU 和 CPU 性能运行最受欢迎的开源模型。

快速开始
您无需克隆此仓库。
您可以使用 pip 或 conda 等包管理器(如 uv 或 pixi)安装 Modular,然后使用您选择的模型启动兼容 OpenAI 的端点。
要开始使用 Modular 平台并通过 MAX 框架部署模型,请参阅 快速入门指南。
Note
** nightly 版本与稳定版本**
如果您克隆了仓库并希望使用稳定版本,请运行 git checkout max/vX.X 以匹配相应版本。
main分支跟踪 nightly 构建版本。更多信息,请参阅 分支说明。
模型端点启动并运行后,您可以使用 我们兼容 OpenAI 的 REST API 开始发送模型推理请求。
在我们的 模型库 中探索所有可通过 Modular 部署的模型。
部署容器
MAX 容器是我们兼容 Kubernetes 的 Docker 容器,便于部署,它使用 MAX 框架内置的推理服务器。我们为 NVIDIA 和 AMD GPU 环境提供了单独的容器,以及一个适用于两者的统一容器。
例如,您可以使用以下命令为 NVIDIA GPU 启动容器:
docker run --gpus=1 \
-v ~/.cache/huggingface:/root/.cache/huggingface \
-p 8000:8000 \
modular/max-nvidia-full:latest \
--model google/gemma-3-27b-it
如需了解更多信息,请参阅我们的 MAX 容器文档 或 Modular Docker Hub 仓库。
开始使用 Mojo
开始使用 Mojo 无需克隆此仓库。
要安装 Mojo 并开始学习这门语言,请参阅 Mojo 快速入门。Mojo 网站 还提供了全面的语言指南,包括教程、语言参考和 API 参考。
关于本仓库
我们正不断将 Modular Platform 的更多部分开源,您可以在此仓库中找到所有相关内容。截至 2025 年 5 月,本仓库包含超过 450,000 行代码,来自 6000 多位贡献者,为开发人员提供了生产级别的参考实现和工具,以便通过新算法、操作和硬件目标扩展 Modular Platform。
它很可能是全球最大的开源 CPU 和 GPU 内核仓库!
主要内容包括:
- Mojo 标准库:/mojo/stdlib
- MAX GPU 和 CPU 内核:/max/kernels(Mojo 内核)
- MAX 推理服务器:/max/python/max/serve(兼容 OpenAI 的端点)
- MAX 模型流水线:/max/python/max/pipelines(基于 Python 的图)
- 代码示例:/max/examples + /mojo/examples
分支
-
MAX 发布分支命名为
max/vX.X。 -
Mojo 发布分支命名为
mojo/vX.X.X(Mojo 采用 PEP 440 版本方案)。 -
对于 MAX 26.3 / Mojo 1.0.0b1 之前的稳定版本,MAX/Mojo 合并发布分支命名为
modular/vX.X。
贡献
我们接受对 Mojo 标准库、MAX AI 内核、MAX 模型架构、代码示例、Mojo 文档等方面的贡献。
首先,请阅读 贡献指南,然后参考以下关于如何在仓库中进行开发的文档:
/max/docs:供在 MAX 框架代码库中工作的开发人员使用的文档。/mojo/stdlib/docs:供在 Mojo 标准库中工作的开发人员使用的文档。
我们也欢迎您提交错误报告。如果您遇到 bug,请在此提交 issue。
新闻与公告
[2026/3] Modular Platform 26.2 带来了最先进的图像生成技术,在 FLUX.2 模型上实现了超过 4 倍的速度提升,扩展了对 NVIDIA B300、Jetson Thor、DGX Spark 以及 AMD RDNA 消费级 GPU 的硬件支持,并且 Mojo 语言进行了升级,借助 AI 编码助手,编写 GPU 内核变得更加轻松。
[2026/2] 我们宣布 BentoML 正式加入 Modular。我们致力于开源建设,并将通过 Bento 自身的开源项目 扩展对开源 AI 的支持。阅读 2026 年 2 月的 AMA 问答,了解更多关于我们计划的信息。
[2026/1] Modular Platform 26.1 标志着 MAX Python API 正式脱离实验阶段,它具备类 PyTorch 的即时执行模式以及面向生产环境的 model.compile() 功能,同时稳定了 MAX LLM Book,并扩展了对 Apple 硅基 GPU 的支持。Mojo 新增了编译时反射、线性类型、类型化错误以及改进的错误消息,朝着 1.0 版本稳步迈进。
[2025/12] Mojo 1.0 路线图 正式公布,计划于 2026 年上半年发布,并包含了大量关于预期功能的详细信息。
[2025/12] 我们举办了 MAX 框架深度解析Meetup,重新介绍了 MAX 框架,并向社区展示了即将到来的变化。
[2025/11] Modular Platform 25.7 提供了完全开放的 MAX Python API,扩展了对 NVIDIA Grace 超级芯片的硬件支持,改善了 Mojo GPU 编程体验,以及更多其他功能。
[2025/11] 我们在 PyTorch 2025 + LLVM 开发者大会 上与社区会面,征集社区关于 Modular 平台如何减少碎片化并提供统一 AI 堆栈的意见和建议。
[2025/09] Modular 完成 2.5 亿美元融资,用于扩展 AI 的统一计算层。至此,Modular 的总融资额达到 3.8 亿美元,估值达 16 亿美元。
[2025/09] Modular Platform 25.6 提供了从笔记本电脑到数据中心 GPU 的统一计算层,在 NVIDIA Blackwell (B200) 和 AMD MI355X 上实现了行业领先的吞吐量。
[2025/08] Modular Platform 25.5 通过与 SF Compute 的合作引入了大规模批处理推理,并开源发布了 MAX Graph API 等更多功能。
[2025/08] 我们在 洛斯阿尔托斯Meetup 上进行了演讲,内容包括 Chris Lattner 关于 AI 计算民主化的探讨以及 Inworld AI 关于生产环境语音 AI 的分享。
[2025/06] 宣布与 AMD 达成合作——Modular Platform 现已在 AMD 的 MI300 和 MI325 GPU 产品组合中全面可用。
[2025/06] Modular 黑客周末活动 汇聚了众多开发者,共同使用 Mojo 和 MAX 构建自定义内核、模型架构以及 PyTorch 自定义算子。
[2025/05] 超过 100 名工程师齐聚 AGI House,参加我们首届 GPU 内核黑客松活动,其中包括 Modular 和 Anthropic 工程师的精彩演讲。
社区与活动
我们定期在全球范围内举办线上线下聚会。在这些聚会中,我们会分享Modular团队的最新动态,展示社区贡献,邀请嘉宾分享专业知识,并解答社区问题。
加入我们!
| 渠道 | 链接 |
|---|---|
| 💬 Discord | discord.gg/modular |
| 💬 论坛 | forum.modular.com |
| 📅 聚会小组 | meetup.com/modular-meetup-group |
| 🎥 社区会议 | 即将举行的社区会议 |
即将举行的活动将在我们的Meetup页面和Discord上发布。社区会议记录将发布在我们的YouTube频道。
联系我们
如果您想与团队和其他社区成员交流,请发送消息至我们的Discord频道和论坛版块。
许可协议
本仓库及其贡献基于Apache License v2.0(含LLVM例外条款)授权(详见LLVM 许可协议)。Modular、MAX和Mojo的使用及分发受Modular社区许可协议约束。
第三方许可协议
您需自行负责检查和验证所下载的相关软件及库(如Huggingface)的第三方许可协议。
感谢贡献者
下载使用量
项目总下载次数(含Clone、Pull、 zip 包及 release 下载),每日凌晨更新