OmniRoute:基于 TypeScript 的 AI 模型智能路由网关项目

Never stop coding. Free AI gateway: one endpoint, 231+ providers (50+ free), connect Claude Code, Codex, Cursor, Cline & Copilot to FREE Claude/GPT/Gemini. RTK+Caveman stacked compression saves 15-95% tokens, smart auto-fallback, MCP/A2A, multimodal APIs, Desktop/PWA.

分支102Tags306
文件最后提交记录最后更新时间
1 天前
11 天前
17 天前
15 天前
11 天前
1 天前
1 天前
1 天前
26 天前
1 天前
1 天前
21 天前
1 天前
1 天前
1 天前
1 天前
1 天前
1 天前
1 天前
5 天前
1 天前
5 天前
15 天前
15 天前
2 个月前
20 天前
1 天前
2 个月前
2 天前
17 天前
2 天前
15 天前
14 天前
1 天前
1 天前
1 天前
1 个月前
1 天前
11 天前
1 天前
1 个月前
4 个月前
9 小时前
2 天前
12 天前
1 个月前
9 天前
17 天前
24 天前
17 天前
1 个月前
1 个月前
2 个月前
17 天前
1 天前
2 个月前
3 天前
1 天前
1 天前
23 天前
4 个月前
4 个月前
14 天前
17 天前
1 个月前
17 天前
1 个月前
12 天前
11 天前
5 天前
29 天前
1 个月前
19 天前
1 天前
OmniRoute Dashboard

🚀 OmniRoute — 免费 AI 网关

永不停歇地编码。通过一个端点连接所有 AI 工具至 236 个提供商50 多个免费

将 Claude Code、Codex、Cursor、Cline、Copilot 和 Antigravity 接入免费的 Claude / GPT / Gemini。自动故障转移。

RTK + Caveman 压缩节省 15–95% 的 tokens。永不限流。


约 16 亿记录的免费 tokens/月 — 首次注册可获得额外 credits,首月最高可达 约 21 亿 — 汇总了各免费层级的额度,加上大量永久免费、无上限的提供商,再配合上述压缩技术,让每一个 token 都发挥更大价值。(我们如何计算 →)


231 AI Providers 50+ Free 1.6B Free Tokens/mo Token Savings 17 Strategies $0 to start


💬 加入社区

Discord Telegram WhatsApp Global WhatsApp Brasil

问题、提供商提示、路线图和支持 → Discord · Telegram · WhatsApp 🌍 全球 / 🇧🇷 巴西


diegosouzapw%2FOmniRoute | Trendshift

npm License: MIT Node Stars

npm version NPM Monthly Docker Hub Docker Pulls Electron Downloads Website


🚀 快速开始🎯 组合功能🌐 提供商🔌 CLI 与 MCP🗜️ 压缩🌍 网站

💥 承诺🤔 为何选择🏆 优势所在🤖 兼容 CLI🖥️ 运行环境🔒 隐私保护🎬 实际应用📚 探索更多📧 支持


💰 每月约 16 亿免费 Token

手动叠加免费额度是件痛苦的事——几十个 SDK、几十个速率限制,而且根本不知道自己到底有多少额度。OmniRoute 将 40 多个提供商池 / 500 多个模型公开记录免费额度聚合为一个真实数字,并在仪表盘(/dashboard/free-tiers)上实时显示。

  • 每月约 16 亿免费 Token(稳定)——加上注册 credits,首月最高可达约 21 亿
  • 池去重,真实可信——我们每个共享免费池只计算一次,因此标题数字不会像某些声称数十亿的竞争对手那样被速率限制上限所夸大。(如果全天候计算每个速率限制,会显示约 100 亿;我们不会发布这个数字。)
  • 外加不可计数部分——永久免费、无 Token 上限的提供商(SiliconFlow、Z.AI GLM-Flash、Kilo、OpenCode Zen 等)以及10 美元 OpenRouter 充值,可额外解锁每月 2400 万 Token,这些都单独列出,绝不会夸大标题数字。
  • 按模型细分、当月已使用/剩余实时数据,以及每个提供商透明的条款标记

免费额度预算卡片(预览模拟图)

预览模拟图——一旦 /dashboard/free-tiers 页面通过验证,将替换为实际截图。完整计算方法(池去重、信用额度、提供商条款):docs/reference/FREE_TIERS.md


💥 核心承诺

一个端点。236 个提供商。永不停歇地构建——让 OmniRoute 为您选择既有效又最经济的方案。

🚫 永不触达限制
毫秒级在 236 个提供商之间自动切换。配额用尽?下一个提供商立即接管——零停机时间。
💸 节省高达 95% 的 Token
RTK + Caveman 叠加压缩技术可削减 15–95% 的合格 Token(在工具密集型会话中平均约 89%)。
🆓 零成本启动
50 多个提供商提供免费额度,11 个永久免费(Kiro、Qoder、Pollinations、LongCat 等)。无需信用卡。
🔌 所有工具均适用
16 多种编码代理——Claude Code、Codex、Cursor、Cline、Copilot、Antigravity——通过一个配置即可使用。
🧩 单一端点
OpenAI ↔ Claude ↔ Gemini ↔ Responses API 翻译。将任何工具指向 /v1 即可直接使用。
🛡️ 生产级标准
断路器、TLS 隐身、MCP(87 种工具)、A2A、内存、安全护栏、评估。14,965 项测试。


🤔 为什么选择 OmniRoute?

告别同时管理 10 个仪表盘、失效的 API 密钥和突如其来的账单。

❌ 日常痛点 ✅ OmniRoute 如何解决
📉 订阅配额每月到期未使用 充分利用订阅 — 跟踪配额使用情况,在重置前用尽每一个令牌
🛑 编码途中遭遇速率限制 4 层自动回退 — 订阅 → API → 低成本 → 免费,毫秒级切换
🔥 工具输出(git diffgrep、日志)消耗大量令牌 RTK + Caveman 压缩 — 每个请求节省 15–95% 的合格令牌
💸 API 费用高昂(每个提供商每月 20–50 美元) 成本优化路由 — 自动路由至成本最低的可用模型
🧰 每个 AI 工具都需要单独设置 一个端点,所有工具,一个仪表盘
🌍 所在国家/地区无法使用 AI 3 级代理 + TLS 指纹隐身技术 — 随时随地使用 AI
┌──────────────────────────────────────────────────────────┐
│        Your IDE / CLI  (Claude Code, Cursor, Cline…)       │
└─────────────────────────┬──────────────────────────────────┘
                          │ http://localhost:20128/v1
                          ▼
┌──────────────────────────────────────────────────────────┐
│                  OmniRoute — Smart Router                  │
│  RTK + Caveman compression · 17 routing strategies         │
│  Circuit breakers · TLS stealth · MCP · A2A · Guardrails   │
└─────────────────────────┬──────────────────────────────────┘
        ┌─────────────┬────┴────────┬─────────────┐
        ▼ Tier 1      ▼ Tier 2      ▼ Tier 3       ▼ Tier 4
   SUBSCRIPTION     API KEY        CHEAP          FREE
   Claude Code,     DeepSeek,      GLM $0.5,      Kiro, Qoder,
   Codex, Copilot   Groq, xAI      MiniMax $0.2   Pollinations
   quota out? ───▶  budget hit? ─▶ budget hit? ─▶ always on

🎯 组合 — 旗舰功能

组合是 OmniRoute 自动跨接的模型链。当配额用尽、服务提供商故障或成本飙升时,组合会无缝切换至下一个模型。这正是 OmniRoute 坚不可摧的原因。 🛡️

⚡ 零配置 — 只需使用 auto

无需创建组合。将模型设置为 auto(或其变体),OmniRoute 会根据您已连接的服务提供商动态构建虚拟组合,并实时评分:

模型 ID 优化目标
auto 🎯 平衡默认值(LKGP — 保持使用您上次成功的服务提供商)
auto/coding 🧑‍💻 代码生成优先考虑质量的权重设置
auto/fast ⚡ 优先选择最低延迟
auto/cheap 💰 优先选择每 token 成本最低
auto/offline 🔋 优先选择配额/速率限制余量最大
auto/smart 🔭 质量优先 + 10% 探索比例以发现更优模型

🔀 或创建您自己的组合 — 17 种路由策略

目标 策略 / 组合
🥇 用尽订阅额度后再付费 priority / fill-first
⚖️ 在多个账户间分散负载 round-robin · weighted · p2c · least-used
💸 始终使用最便宜的可用模型 cost-optimized · auto/cheap
🧠 在模型间传递长上下文 context-relay · context-optimized
🎲 随机化/隐私路由 random · strict-random
🧬 分发至专家团并整合判断结果 fusion
📊 根据剩余配额余量进行路由 reset-window · headroom
🤖 智能路由 auto(9 因素评分)· lkgp · reset-aware

自动组合引擎基于9 个因素(健康度、配额、成本、延迟、成功率、新鲜度……)对每个候选模型进行评分 — 详见 docs/routing/AUTO-COMBO.md

🧱 内置韧性机制(3 个独立层级)

层级 作用范围 功能描述
🔌 断路器 整个服务提供商 停止持续请求上游已出现故障的服务提供商;自动探测以恢复服务
💤 连接冷却 单个账户 / 密钥 当某个密钥触发速率限制时跳过该密钥,其他密钥继续提供服务
🎯 模型锁定 服务提供商 + 模型 仅隔离配额受限的单个模型,而非整个连接
Combo: "always-on"                         Strategy: priority
  1. cc/claude-opus-4-7   ← subscription (use it fully)
  2. cx/gpt-5.5           ← second subscription
  3. glm/glm-5.1          ← cheap backup ($0.5/1M)
  4. kr/claude-sonnet-4.5 ← FREE, unlimited (never fails)
Result: 4 layers of fallback = zero downtime

📖 自动组合引擎 · 弹性指南


🏆 OmniRoute 的独特优势

功能 OmniRoute 其他路由工具
🌐 服务提供商 231 家 20–100 家
🆓 免费服务提供商 50+ 家(11 家永久免费) 1–5 家
🔀 路由策略 17 种(优先级、加权、成本优化、上下文中继、融合等) 1–3 种
🗜️ 令牌压缩 RTK + Caveman 叠加压缩(15–95%) 无 / 20–40%
🧰 内置 MCP 服务器 87 种工具、3 种传输方式、30 种作用域 罕见
🤝 A2A 代理协议 6 种技能、JSON-RPC 2.0
🧠 记忆功能(FTS5 + 向量) 支持 罕见
🛡️ 安全护栏(PII、注入攻击、视觉内容) 支持 罕见
☁️ 云代理 Codex、Devin、Jules
🥷 TLS 指纹隐匿 通过 wreq-js 实现 JA3/JA4
🖥️ 多平台支持 网页版 · 桌面版 · Termux · 渐进式网页应用(PWA) 仅网页版
🌍 国际化 42 种语言 0–4 种

📊 与 LiteLLM、OpenRouter 和 Portkey 的详细对比 → docs/comparison/OMNIROUTE_VS_ALTERNATIVES.md


✨ 新增功能

v3.8.20 至 v3.8.41 的近期亮点。完整历史记录请参见 CHANGELOG.md

  • ⚖️ 配额共享路由 — 一种专用组合策略,根据 可用配额 在多个账户间分配负载: deficit-轮询调度、带冷却等待队列的每连接 max_concurrent、多窗口使用桶(5小时/7天/每模型)、每(密钥,模型)上限、确保提示缓存完整性的会话粘性,以及基于上游令牌使用头的主动饱和度控制。→ 弹性指南
  • 🤖 一键式 CLI/代理设置 — 专用 setup-* 命令可将各编码工具配置为通过 OmniRoute 路由(Claude Code、Codex、Cline、Continue、Cursor、Roo Code、Kilo Code、Crush、Goose、Qwen Code、Aider、OpenCode);omniroute launch / omniroute launch-codex 是零配置启动器。→ CLI 集成
  • 🛰️ 远程模式 — 使用范围访问令牌从任何机器驱动远程 OmniRoute(omniroute connect / omniroute contexts / omniroute tokens),并提供 omniroute login antigravity 辅助工具,该工具在您自己的机器上运行 Google“原生/桌面”OAuth,并将凭据 blob 粘贴到远程/VPS 安装中(此时环回重定向不可达)。→ 远程模式
  • 🧭 更智能的自动路由 — OpenRouter 风格的 auto/<category>:<tier> 组合(例如 auto/coding:fastauto/reasoning:pro)、融合策略(并行向一组模型发送请求,然后通过判断模型进行综合)、任务感知路由(根据任务类型选择最佳连接)、每请求 X-Route-Model 覆盖、实时 Arena-ELO + models.dev 模型智能、每步骤账户允许列表、提供商通配符组合步骤、嵌套组合引用执行、粘性加权选择以及 web_search 感知路由。→ 自动组合
  • 🗜️ 可插拔压缩 — 一个包含 9 个可组合引擎 的异步管道,配备压缩工作室、LLMLingua-2 ONNX 引擎和启发式/SLM 双层 Ultra、RTK、委托式 Anthropic 上下文编辑、输出样式(输出轴控制:简洁散文/少代码/简洁中日韩文本)、自适应上下文预算调节(仅在需要时扩展以适应上下文窗口)、每请求 x-omniroute-compression 控制、可选的离线评估工具、从仪表板一键式 Headroom 代理生命周期管理(支持 Docker 边车)、合成 压缩 playground(Play 通道 + A/B 对比,附带 USD 上限保真度判断)、可选的 每步骤保真度门控(在有损引擎降低提示质量前拒绝它)、最佳 N 候选编码器(GCF 与 TOON — 保留较短者,并在工作室中提供 A/B 字节/令牌表)、CCR 范围/grep/统计检索(提取存储块的精确字节/行切片或摘要,而非重新展开),以及一个带有命名配置文件和活动配置文件选择器的统一面板。→ 压缩
  • 🕵️ 透明 MITM 解密(TPROXY) — 捕获并转换忽略代理环境变量的 CLI 流量,配备每 SNI 证书颁发机构和信任存储安装程序。→ MITM/TPROXY
  • 💸 全面成本遥测 — 每个端点(包括媒体)的 X-OmniRoute-* 成本/使用头、非令牌成本引擎、缓存命中 X-OmniRoute-Cost-Saved 头,以及每密钥 USD 支出配额。→ API 参考
  • 🧠 可控内存 — 可选的 int8 向量量化(Qdrant + sqlite-vec)、默认关闭内存,以及每请求 x-omniroute-no-memory 头。→ 内存
  • 🛡️ 安全性 — 所有 LLM 路由的提示注入防护(由红队套件支持),以及免费的 DuckDuckGo 最后手段网络搜索。→ 护栏
  • 🤝 更多提供商和代理 — Cursor Cloud Agent(第四个云代理)、CodeBuddy CN(copilot.tencent.com)、Google Flow 视频生成提供商、新网关 DGridPioneer AI(Fastino Labs)、入站 xAI Grok 转换器以及带有 OAuth 导入令牌流程的 Grok Build (xAI)、GitHub Copilot 提供商上的 GPT-4 / GPT-4o-mini、多模型 Factory DroidZenMux Free(无会话 cookie 免费层)、Alibaba DashScope 文本转视频(wan2.7-t2v)、更新的 236 个提供商目录(OrcaRouter、Wafer AI、OpenAdapter、dit.ai、TokenRouter 等)、Vertex AI 媒体生成(语音/转录/音乐/视频),以及从 CLIProxyAPI(~/.cli-proxy-api/)一键导入账户。→ 提供商
  • ⚡ 本地性能和基础设施 — 一键式本地 Redis 启动器(omniroute redis up,以及仪表板 Redis 面板)、一键式 Cloudflare WorkersDeno Deploy 中继部署器(接入代理池),以及可选的 Bifrost Go 边车(卸载最热的中继路径,BIFROST_BASE_URL,超时后自动回退到 TypeScript 路径)—— 现在支持中继后端选择器(OMNIROUTE_RELAY_BACKEND=ts|bifrost|auto),因此 /v1/relay 端点保持稳定,同时在内部选择最快的后端。→ 环境

🤖 兼容的命令行工具与编码代理

只需一个配置 — http://localhost:20128/v1 — 所有 AI 集成开发环境或命令行工具都能运行在免费及低成本模型上。

Claude Code
Claude Code
Codex CLI
Codex CLI
Cursor
Cursor
Copilot
Copilot
Continue
Continue
OpenCode
OpenCode
Kilo Code
Kilo Code
Droid
Droid
OpenClaw
OpenClaw
Kiro
Kiro
Command Code
Command
+ 同时兼容 · Cline · Antigravity · Windsurf · AMP · Hermes · Qwen CLI · Roo · Continue · 任何 OpenAI 兼容工具

📖 所有 16+ 工具的分步设置指南 → docs/reference/CLI-TOOLS.md · 🧩 OpenCode 插件 → @omniroute/opencode-provider


🌐 231 个 AI 服务提供商 — 50+ 免费

所有开源路由中最完整的目录:236 个提供商50+ 提供免费套餐11 个永久免费

🆓 永久免费 — 0 美元,无需信用卡

AgentRouter
GPT-5、Claude、Gemini
100 美元免费额度
Qoder AI
Kimi-K2、DeepSeek-R1
无限免费
Pollinations
GPT-5、Claude、Llama 4
无需密钥
LongCat
LongCat-2.0
一次性 1000 万 tokens(需身份验证)🔑
Cloudflare AI
50+ 模型
每日 10K neurons
NVIDIA NIM
129 个模型
免费约 40 RPM
Cerebras
Qwen3 235B
每日 100 万 tokens

📖 完整的机器可读目录 → docs/reference/PROVIDER_REFERENCE.md


🖥️ OmniRoute 的运行环境 — 无处不在

同一个应用,在您的设备上,由您掌控。从全局 npm 安装到通过 Termux 在您的手机上运行。

平台 安装方式 亮点说明
📦 npm(全局) npm install -g omniroute 一条命令,适用于任何操作系统
🐳 Docker docker run … diegosouzapw/omniroute 多架构支持 AMD64 + ARM64
🖥️ 桌面版(Electron) npm run electron:build 原生窗口 + 系统托盘 — Windows / macOS / Linux
💪 ARM 架构 原生 arm64 树莓派、ARM 服务器、Apple Silicon
📱 Android(Termux) pkg install nodejs && npx -y omniroute 您的手机上运行,24/7 不间断,无需 root
📲 PWA "添加到主屏幕" 全屏显示、支持离线、可从浏览器安装
🧩 OpenCode 插件 @omniroute/opencode-provider 原生 OpenCode 集成
🛠️ 从源代码构建 npm install && npm run dev 进行自定义开发,贡献代码

📖 Docker 指南 · 桌面版 · Termux · PWA · OpenCode


🔒 隐私优先 & 本地优先

您的密钥,您的设备,您的数据。OmniRoute 是一款本地代理 — 绝不会进行后台数据传输。

  • 🏠 100% 在您的硬件上运行 — 支持 npm、Docker、桌面端乃至手机。请求路径中不存在任何 OmniRoute 云端服务。
  • 🔐 凭证静态加密 — API 密钥和 OAuth 令牌采用AES-256-GCM 加密保护。
  • 🚫 默认零遥测 — 您的提示词仅发送至选择的服务提供商,不会流向其他任何地方。
  • 🛡️ 强化网关 — 具备 API 密钥范围限定、IP 过滤、速率限制、提示词注入防护以及仅本地回环进程路由。
  • 📜 MIT 许可 & 完全开源 — 可审计每一行代码,永久自托管。

📖 授权 · 安全护栏 · 合规性


🔌 完整 CLI + A2A 与 MCP

OmniRoute 不仅仅是一个服务器 — 它是一个拥有60 多个命令完整命令行控制台,外加开放的智能体协议,让 AI 智能体能够自主驱动 OmniRoute。

⌨️ 真正的 CLI(不只是 start

omniroute               # serve gateway + dashboard (port 20128)
omniroute chat          # interactive TUI chat client (slash: /model /combo /skill /memory)
omniroute setup         # guided first-run wizard
omniroute doctor        # diagnose providers, ports, native deps

🛰️ 远程模式 — 在此运行 CLI,OmniRoute 部署于 VPS

想在服务器上运行 OmniRoute?只需使用相同的 CLI 即可从笔记本电脑进行控制。通过范围访问令牌登录一次后,所有后续命令都将直接作用于远程服务器。

omniroute connect 192.168.0.15            # password → scoped token, saved as a context
omniroute models list                     # ← runs against the REMOTE server
omniroute configure codex                 # ← picks a remote model, writes a local Codex profile
omniroute tokens create --name ci --scope read   # mint narrower tokens for other machines
omniroute contexts use default            # ← switch back to the local server

令牌的作用域分为 read / write / admin;生成进程的路由仅保留本地回环访问。 📖 远程模式

providers · oauth · keys · combo · nodes · models · cache · compression · cost · usage · quota · health · resilience · telemetry · logs · audit · mcp · a2a · cloud · memory · skills · eval · tunnel · backup · sync · webhooks · policy · pricing · translator · simulate

🤝 接入智能体 — 即可让其控制 OmniRoute 本身

通过 MCPA2A 对外暴露 OmniRoute 后,任何具备相应能力的智能体都能获得整个网关的控制权 — 包括路由、服务提供商、组合配置、缓存、压缩、内存等 — 实现自主操作。

协议 端点 用途说明
🧰 MCP (标准输入输出) omniroute --mcp 接入 Claude 桌面版、Cursor 及任何 MCP 客户端
🌊 MCP (HTTP) http://localhost:20128/api/mcp/stream 远程 MCP — 87 种工具,30 种作用域,完整审计跟踪
📡 MCP (SSE) http://localhost:20128/api/mcp/sse 流式 MCP 传输协议
🤝 A2A http://localhost:20128/.well-known/agent.json 智能体到智能体,JSON-RPC 2.0 + SSE,6 种技能
# Give Claude Code the full OmniRoute toolset over MCP:
claude mcp add-server omniroute --type http --url http://localhost:20128/api/mcp/stream

📖 MCP 服务器 · A2A 服务器 · 代理协议


🗜️ 自动节省 15–95% tokens

既然少量 tokens 就能解决问题,何必使用大量 tokens? 每个请求都会透明地经过 OmniRoute 的压缩管道 — 无需修改客户端。如今,它已成为一个由9 个可组合引擎组成的堆栈,这些引擎按顺序运行,并可根据路由组合进行混合搭配 — 其构建理念源自 RTKCaveman(⭐ 51K+)、LLMLingua-2Troglodita(葡萄牙语)。

🧱 9 引擎堆栈

引擎按管道顺序运行;每个引擎均可独立切换,并可针对不同组合进行配置:

# 引擎名称 功能描述
1 会话去重 移除多轮对话中重复的内容(基于内容寻址,跨轮次)
2 CCR 将大块内容归档到检索标记后,按需获取
3 RTK 智能工具结果过滤、去重和截断(命令感知)
4 Headroom 同类 JSON 数组的无损表格压缩(约节省 30%+)
5 Caveman 基于规则的 prose 压缩(输出内容节省约 65–75%)
6 LLMLingua-2 通过 MobileBERT ONNX 进行 ML 语义剪枝 — 代码安全,异步执行
7 Lite 空白字符 + 图片 URL 修剪(低延迟基础压缩)
8 Aggressive 总结 + 旧轮次内容的渐进式老化处理
9 Ultra 启发式 token 剪枝,可选配小型模型(SLM)层

代码块、URL 和结构化数据始终保持字节级完美。一键预设组合多种引擎:

模式 节省比例 最佳适用场景
🪶 轻量(Lite) ~15% 始终启用的安全默认设置
🪨 标准(Caveman) ~30% 日常编码
激进(Aggressive) ~50% 长时长工具密集型会话
🔥 极致(Ultra) ~75% 最大程度节省
🧰 RTK 60–90% Shell/测试/构建/git 输出
🔗 堆栈式(RTK → Caveman) 78–95% 混合提示词 + 工具日志

实际示例 — 标准模式:

压缩前(69 tokens): "您的 React 组件重新渲染的原因很可能是因为您在每个渲染周期都创建了一个新的对象引用。当您将内联对象作为属性传递时,React 的浅层比较会将其视为每次都是不同的对象,从而触发重新渲染。我建议使用 useMemo 来记忆化该对象。"

压缩后(19 tokens): "每次渲染生成新对象引用。内联对象属性 = 新引用 = 重新渲染。使用 useMemo 包装。"

答案相同。tokens 减少 72%。零准确率损失。

葡萄牙语示例 — Troglodita 模式:

Antes (42 tokens): "O problema é que o componente está re-renderizando porque uma nova referência de objeto está sendo criada em cada ciclo de renderização. Eu recomendaria usar useMemo."

Depois (12 tokens): "Re-render: ref nova cada ciclo (objeto inline recriado). Usar useMemo."

Mesma resposta. ~70% menos tokens. Precisão técnica intacta.


📖 工作原理 — 流程、架构与节省计算

Client (10,000 tok) ──▶ OmniRoute Compression (9 engines) ──▶ Provider (~1,080 tok, up to 95% saved)

默认的堆叠组合运行 RTK → Caveman。当两者作用于相同的工具/上下文负载时,节省效果会叠加:

combined = 1 − (1 − RTK) × (1 − Caveman_input)
average  = 1 − (1 − 0.80) × (1 − 0.46) = 89.2%
range    = 78.4 – 94.6%

代码块、URL、JSON 及结构化数据均受保护引擎全程保护

🎚️ 超越引擎 — 输出风格、自适应调节与按请求控制

上述 9 种引擎可缩减输入内容。另有三层机制决定如何何时输出以及输出什么

  • 🪄 输出风格 (输出轴导向) — 注入确定性、缓存安全的响应塑形指令;可组合使用,每种风格强度分为 lite / full / ultra。添加风格仅需一行注册表项:
    • 简洁文本 — 去除冗余填充词、冠词及模糊表述;确保技术实质准确无误。
    • 精简代码 — “资深懒开发”的 YAGNI 原则:以最小化有效变更实现需求,不添加未请求的框架代码。
    • 简洁中文(文言) — 古典中文超精炼风格(仅对 zh 语言环境开放)。
  • 🎯 自适应上下文预算 (调节旋钮) — 不再依赖单一开关式令牌阈值,仅在必要时逐步启用成本最低、损失最小的引擎,以确保内容适配模型上下文窗口。策略:reserve-output(默认,模型感知)· percentage · absolute。模式:floor(保证适配)· replace-autotrigger(显式选择优先)· off(传统阈值模式)。
  • 🎛️ 压缩决策优先级 (由高至低) — 按请求的 x-omniroute-compression 头 › 路由组合覆盖 › 激活的命名配置文件 › 自适应/自动触发 › 面板默认值 › 关闭。应用的压缩方案将通过响应头 X-OmniRoute-Compression: <mode>; source=<source> 返回。

可通过令牌阈值自动触发、启用自适应调节、固定命名配置文件、设置单次请求参数或为每个路由组合分配专属流程 — 选择最适合当前工作负载的方式即可。系统提供可选的离线评估工具npm run eval:compression),可在推广变更前基于固定语料库评估压缩保真度与令牌节省效果。

📖 COMPRESSION_GUIDE.md · RTK_COMPRESSION.md · COMPRESSION_ENGINES.md


⚡ 快速开始

1) 安装并运行

npm install -g omniroute
omniroute

仪表板位于 http://localhost:20128 · API 位于 http://localhost:20128/v1

2) 连接免费提供商(无需注册)

仪表板 → Providers → 连接 Kiro AI(免费 Claude,每个账户每月约 50 个 credits)或 OpenCode Free(无需授权)→ 完成。

3) 指向您的编码工具

Base URL: http://localhost:20128/v1
API Key:  [copy from Dashboard → Endpoints]
Model:    auto            (zero-config smart routing — or any provider/model)

4) 验证其是否正常工作

curl http://localhost:20128/v1/models -H "Authorization: Bearer YOUR_KEY"

您应该能看到已连接的模型列表。🎉 就是这样 — 开始编码吧,OmniRoute 会自动为您路由并进行故障转移。

如果您的客户端无法发送自定义标头,OmniRoute 还会公开令牌化兼容别名:

OpenAI catalog:   http://localhost:20128/vscode/YOUR_KEY/
OpenAI models:    http://localhost:20128/vscode/YOUR_KEY/models
OpenAI chat:      http://localhost:20128/vscode/YOUR_KEY/chat/completions
OpenAI responses: http://localhost:20128/vscode/YOUR_KEY/responses
Ollama chat:      http://localhost:20128/vscode/YOUR_KEY/api/chat
Ollama tags:      http://localhost:20128/vscode/YOUR_KEY/api/tags

仅对无法附加 Authorization: Bearer ... 的客户端使用这些方法。Header 认证仍是首选方式。


📦 更多安装方法 — Docker、源代码、pnpm、Arch

🐳 Docker

docker run -d --name omniroute --restart unless-stopped --stop-timeout 40 \
  -p 20128:20128 -v omniroute-data:/app/data diegosouzapw/omniroute:latest

🛠️ 来自源代码

cp .env.example .env && npm install
PORT=20128 npm run dev

📦 pnpm

pnpm install -g omniroute && pnpm approve-builds -g && omniroute

🐧 Arch Linux (AUR)

yay -S omniroute-bin && systemctl --user enable --now omniroute.service

🔧 Nix (Flake)

# Using Nix flakes
nix develop
npm run dev

# Or using devbox
devbox run npm run dev

📖 Docker 指南 — Compose 配置文件、Caddy HTTPS、Cloudflare 隧道。

🦭 Podman

# 1. Build the image
podman build --target runner-base -t omniroute:base .

# 2. Fix data directory permissions for rootless Podman
mkdir -p data && podman unshare chown 1000:1000 ./data

# 3. Set runtime in .env, then run (see contrib/podman/ for Quadlet)
echo "CONTAINER_HOST=podman" >> .env
podman compose --profile base up -d

📖 Podman 指南 — Quadlet 设置、podman-compose、Quadlet。


🎬 OmniRoute 实际应用

Guia em Português
🇧🇷 葡萄牙语
完整指南
English Guide
🇺🇸 英语
完整操作流程
Руководство
🇷🇺 俄语
完整使用说明

🎬 制作了关于 OmniRoute 的视频? 请通过issue讨论提交链接 — 我们会在此处展示。


📚 了解更多

💰 价格概览与 0 美元免费组合(11 个提供商)
层级 示例 费用
💳 订阅制 Claude Code Pro / Codex / Copilot 10–200 美元/月
🔑 API 密钥(免费层级) NVIDIA NIM、Cerebras、Groq 免费
💰 经济实惠型 GLM-5 0.5 美元/百万 tokens · MiniMax M2.5 0.3 美元/百万 tokens 几美分
🆓 永久免费 Kiro、Qoder、Qwen、Pollinations、LongCat 0 美元

0 美元免费组合 — 打造一个坚不可摧的组合:

提供商 前缀 免费模型 配额
Kiro kr/ Claude Sonnet 4.5、Haiku 4.5、Opus 4.6 50 积分/月
Qoder if/ kimi-k2-thinking、qwen3-coder-plus、deepseek-r1 ♾️ 无限量
Qwen qw/ qwen3-coder-plus/flash/next ♾️ 无限量
Pollinations pol/ GPT-5、Claude、Gemini、DeepSeek、Llama 4 无需密钥
LongCat lc/ LongCat-2.0 1000 万一次性(需 KYC)
Cloudflare AI cf/ 50+ 模型 10000 神经元/天
NVIDIA NIM nvidia/ 129 模型 ~40 次/分钟
Cerebras cerebras/ Qwen3 235B、GPT-OSS 120B 100 万 tokens/天

💡 控制台中的“费用”是节省追踪器,而非账单 — OmniRoute 从不向您收费。使用免费模型显示“总费用 290 美元”意味着节省了 290 美元

📖 完整免费目录 → docs/reference/FREE_TIERS.md — 25+ 提供商、配额、基础 URL。

🎯 使用场景 — 现成的组合使用指南

永久 0 美元:

1. kr/claude-sonnet-4.5   (Kiro — ~50 credits/mo per acct)
2. if/kimi-k2-thinking    (Qoder — unlimited)
3. pol/gpt-5              (Pollinations — no key)
4. lc/LongCat-2.0         (10M one-time backup, KYC)
Compression: aggressive (~50%) → double your free quota · Cost: $0/mo

全天候无间断运行:串联 2 个订阅 → 降低成本 → 5 层备用方案实现免费使用。 区域访问限制:免费服务提供商 + 全局/按服务提供商代理 → 从任何国家/地区访问 AI。 最大化节省:订阅服务 + 经济实惠的备用方案 + ultra 压缩(约 75%)→ 重度用户每月可节省约 150–300 美元。

🌍 绕过地域限制 — 3 级代理 + 隐身模式

🇷🇺 🇨🇳 🇮🇷 🇨🇺 🇹🇷 处于受限制地区?OmniRoute 的 3 级代理(全局 / 按服务提供商 / 按连接)可代理 API 请求、OAuth 流程、连接测试、令牌刷新和模型同步。

  • 协议:HTTP/HTTPS、SOCKS5、带身份验证的代理
  • 🆓 1proxy 市场 — 数百个免费验证代理,带质量评分和自动轮换功能
  • 反检测 — TLS 指纹伪造(wreq-js)、CLI 指纹匹配、代理 IP 保持

📖 docs/ops/PROXY_GUIDE.md

✨ 完整功能列表 — 30 多种功能(记忆、评估、可观测性)

路由:15 种策略 · 任务感知智能路由 · 思考预算控制 · 通配符路由 · 系统提示注入。 兼容性:OpenAI ↔ Claude ↔ Gemini ↔ Responses API · 自动 OAuth 刷新(PKCE,8 个服务提供商)· 多账户轮询 · Batch + Files API · 实时 OpenAPI 3.0。 协议:MCP(87 个工具,3 种传输方式,30 个作用域)· A2A(JSON-RPC 2.0,SSE,6 种技能)· ACP · 云代理(Codex、Devin、Jules)。 插件:自定义插件市场(系统配置的注册表 URL,带 SSRF 防护的获取功能)· 安装/启用/禁用 · Notion + Obsidian 知识库集成(WebDAV 文件服务器、知识库搜索、笔记 CRUD)。 嵌入式服务:一键安装和生命周期管理本地辅助服务(CLIProxy、NineRouter)。 质量与运维:内置 评估(黄金标准:精确匹配/包含/正则表达式/自定义)· 安全护栏(PII、注入防护、视觉内容)· 健康仪表板 · p50/p95/p99 遥测 · Webhook · 合规审计。 AI 代理技能:嵌入式 Markdown 清单 — 将任何代理指向 skills/*/SKILL.md 清单。现有 43 种技能可用。

📖 MCP Server · A2A Server · Resilience Guide · Features Gallery

📖 设置、环境变量与常见问题
环境变量 默认值 用途
PORT 20128 API 和仪表板端口
REQUIRE_API_KEY false 所有请求是否需要 API 密钥
DATA_DIR ~/.omniroute 数据库和配置文件存储目录

OmniRoute 会向我收费吗? 不会 — 它是在您设备上运行的免费开源软件。您只需直接向付费服务提供商付费。OmniRoute 没有计费系统。 免费服务提供商真的无限制吗? 大多数是的 — Qoder、Pollinations、LongCat 和 Cloudflare 都是免费的,没有每个账户的信用额度上限。Kiro 也是免费的,但每个账户每月上限约为 50 个信用点。将多个免费服务提供商组合使用,自动备用功能可让您实现 0 成本使用。 压缩会影响质量吗? 不会 — 它只压缩输入内容;代码、URL、JSON 始终受到保护。 在 AI 被封锁的地方能使用吗? 能 — 3 级代理 + 1proxy 市场可连接所有 236 个服务提供商。

📖 User Guide · API Reference · Environment Config

🐛 故障排除
问题描述 快速解决方法
"Language model did not provide messages" 服务提供商配额用尽 → 使用组合备用方案
速率限制 (429) 添加备用方案:cc/claude → glm/glm-4.7 → if/kimi-k2-thinking
OAuth 令牌过期 自动刷新;若刷新失败,在“服务提供商”中删除并重新授权
unsupported_country_region_territory 在“设置”→“代理”中配置代理
Docker SQLite 锁定 使用 --stop-timeout 40 进行干净的 WAL 检查点
Node 运行时错误 使用 Node >=22.0.0 <23>=24.0.0 <27 版本

🐛 报告错误? 运行 npm run system-info 并附上 system-info.txt。📖 docs/guides/TROUBLESHOOTING.md

📸 仪表板截图
页面 截图 页面 截图
Providers Providers Combos Combos
Analytics Analytics Health Health
Translator Translator Settings Settings
CLI Tools CLI Tools Usage Logs Usage

📧 支持与社区

💬 与社区交流 — Discord、Telegram 和 WhatsApp(🌍 / 🇧🇷)链接位于 本 README 顶部



🛠️ 技术栈

  • 运行时:Node.js 22.x 或 24.x LTS(推荐 24 LTS)— >=22.0.0 <23 || >=24.0.0 <27
  • 语言:TypeScript 6.0 — src/open-sse/ 目录下100% TypeScript(自 v2.0 起核心模块零 any 类型)
  • 框架:Next.js 16 + React 19 + Tailwind CSS 4
  • 数据库:better-sqlite3(SQLite)+ LowDB(JSON 遗留)— 领域状态、代理日志、MCP 审计、路由决策、内存、技能
  • 模式验证:Zod(MCP 工具输入输出验证、API 契约)
  • 协议:MCP(标准输入输出/HTTP)+ A2A v0.3(JSON-RPC 2.0 + SSE)
  • 流式传输:服务器发送事件(SSE)+ WebSocket 桥接(/v1/ws
  • 身份验证:OAuth 2.0(PKCE)+ JWT + API 密钥 + MCP 范围授权
  • 测试:Node.js 测试运行器 + Vitest(14,965 个测试用例,覆盖 517 个文件 — 单元测试、集成测试、端到端测试、安全测试、生态系统测试)
  • 平台:桌面端(Electron)、安卓端(Termux)、渐进式 Web 应用(PWA,支持任何浏览器)
  • CI/CD:GitHub Actions(发布时自动执行 npm 发布和 Docker Hub 推送)
  • 网站omniroute.online
  • npmjs.com/package/omniroute
  • Dockerhub.docker.com/r/diegosouzapw/omniroute
  • 弹性能力:熔断机制、指数退避、防惊群效应、TLS 伪装、自动组合自愈

📖 文档

📘 入门指南

文档 描述
用户指南 提供商、组合、CLI 集成、部署
设置指南 完整安装方法、CLI 工具配置、协议设置、超时调整
CLI 工具指南 Claude Code、Codex、Cursor、Cline、OpenClaw、Kilo、Copilot 的逐工具设置
远程模式 通过范围访问令牌从笔记本电脑 CLI 驱动远程 OmniRoute(VPS)
Claude Code 配置 使用 launch 命令和每模型配置文件将 Claude Code 指向 OmniRoute(本地/远程)
快速开始 3 步安装 → 连接 → 配置

🔧 运维与部署

文档 描述
Docker 指南 Docker 运行、Compose 配置文件、Caddy HTTPS、隧道、镜像标签
Podman 指南 Quadlet systemd 集成、podman-compose、SELinux
虚拟机部署 完整指南:虚拟机 + nginx + Cloudflare 设置
Fly.io 部署 部署到 Fly.io 并配置持久化存储
Termux 指南 通过 Termux 在 Android 上运行 OmniRoute
PWA 指南 渐进式 Web 应用安装、缓存、架构
卸载指南 所有安装方法的彻底移除步骤
环境配置 完整的 .env 变量及其参考说明

🧠 功能与架构

文档 描述
Architecture 系统架构、数据流及内部机制
Compression Guide 7 种选项的处理流程:关闭 / 轻量 / 标准 / 激进 / 极致 / RTK / 叠加
RTK Compression 命令输出压缩、过滤器、信任机制、验证及原始输出恢复
Compression Engines Caveman、RTK、叠加处理流程、控制台/API/MCP 交互界面
Compression Rules Format 用于 Caveman 和 RTK 过滤器的 JSON 规则包架构
Compression Language Packs 语言检测与 Caveman 规则包编写
Resilience Guide 断路器、冷却机制、队列、防流量突增、TLS 伪装
Auto-Combo Engine 9 因素评分、模式包、自愈功能
Proxy Guide 3 级代理系统、1proxy 市场、注册中心增删改查
Free Tiers 25+ 免费 API 提供商综合目录
Features Gallery 带截图的可视化控制台导览
Codebase Documentation 面向初学者的代码库漫游指南

🤖 协议与接口

文档 说明
API 参考 所有端点及示例
OpenAPI 规范 OpenAPI 3.0 规范
MCP 服务器 87 款 MCP 工具、IDE 配置、Python/TS/Go 客户端
MCP 服务器指南 MCP 安装、传输方式及工具参考
A2A 服务器 JSON-RPC 2.0 协议、技能、流式传输、任务管理
A2A 服务器指南 A2A 代理卡、任务、技能及流式传输

📋 项目与质量

文档 说明
贡献指南 开发环境搭建与规范
更新日志 完整的版本发布历史
安全策略 漏洞报告与安全实践
国际化指南 40+ 语言支持、翻译流程、RTL
发布检查清单 发布前验证步骤
测试覆盖计划 测试覆盖策略与 14,965 项测试套件

⭐ 主要贡献者

OmniRoute 由充满热情的开源社区共同打造。这些贡献者的杰出工作直接提升了项目的质量、稳定性和影响力。感谢你们。

oyi77
oyi77

🥇 190 次提交 • +72K 代码行
分析引擎、SQL 聚合、
代理市场、测试覆盖
Chris Staley
Chris Staley

🥈 72 次提交 • +5.7K 代码行
SSE 流优化、响应 API、
Gemini 分页、测试回归修复
zenobit
zenobit

🥉 62 次提交 • +24K 代码行
CI/CD 流水线、33 种语言国际化、
Void Linux 包、平台修复
R.D. & Randi
R.D. & Randi

🏅 107 次提交 • +28K 代码行
端点页面、隧道集成、
Docker 工作流、A2A 状态、压缩界面
benzntech
benzntech

🏅 20 次提交 • +7.5K 代码行
Electron 桌面应用、自动更新器、
发布构建流程、跨平台 CI

🙏 这些贡献者开发的功能、修复的漏洞和优化的基础设施,是 OmniRoute 实现可靠运行和丰富功能的核心要素。每一个拉取请求、每一个测试用例、每一份国际化翻译文件都至关重要。开源事业正因他们这样的人而生生不息。



👥 贡献者

贡献者

贡献指南

  1. Fork 本仓库
  2. 创建你的功能分支 (git checkout -b feature/amazing-feature)
  3. 提交你的更改 (git commit -m 'Add amazing feature')
  4. 推送到分支 (git push origin feature/amazing-feature)
  5. 打开一个 Pull Request

详细指南请参见 CONTRIBUTING.md

发布新版本

# Create a release — npm publish happens automatically
gh release create v3.8.2 --title "v3.8.2" --generate-notes

📊 星标统计

Star History Chart

🌍 星标地图

StarMapper

🙏 致谢

OmniRoute 站在巨人的肩膀上。它最初是 9router 的分支,同时也是 Go 项目 CLIProxyAPI 的 TypeScript 移植版本——从那时起,以下每个子系统都受到了先行开源项目的启发。每个项目都塑造了 OmniRoute 的具体组成部分。这是我们对所有这些项目的感谢。🙏

⭐ 星标数量统计截至 2026 年 6 月——请给这些项目点个星标。

🧬 项目渊源与网关

项目 对 OmniRoute 的启发
9router · decolua 17.9k 本分支所基于的原始项目——在此基础上扩展了多模态 API 并进行了完整的 TypeScript 重写。
CLIProxyAPI · router-for-me 37.8k 启发本 JavaScript/TypeScript 移植版本的 Go 实现。
LiteLLM · BerriAI 50.8k 其公开定价数据集为我们的成本跟踪同步提供支持,其提供商标准化模型为我们的路由功能提供了思路。

🗜️ 上下文与令牌压缩 — 引擎

项目 其对 OmniRoute 的启发
Caveman · JuliusBrussee 74.5k 这个火爆的“为何要用多令牌,少令牌就能解决问题”项目 — 其“穴居人式”表达理念为我们的标准压缩模式及 30 多种冗余信息/精简规则提供了核心动力。
RTK – Rust Token Killer · rtk-ai 63.6k 高性能命令输出压缩 — 启发了我们的 RTK 引擎、JSON 过滤 DSL、原始输出恢复以及 RTK → Caveman 堆叠式处理流程。
headroom · chopratejas 33.6k 可逆上下文压缩(SmartCrusher)— 启发了我们的 headroom 引擎以及 ccr 检索标记模式。
LLMLingua · Microsoft 6.3k 提示词压缩研究(LLMLingua / LLMLingua-2)— 启发了我们的异步、代码安全、故障开放型 llmlingua 引擎。
llmlingua-2-js · atjsh 27 JS/ONNX 移植版(MobileBERT / XLM-RoBERTa),用作我们 LLMLingua 引擎的工作线程后端。
Troglodita · Lenine Júnior 15 葡萄牙语(巴西)令牌压缩 — 为我们的葡萄牙语(巴西)语言包提供支持:针对巴西葡萄牙语语法优化的冗余成分缩减和填充词移除功能。
ponytail · DietrichGebert 51.4k 这个火爆的“懒惰资深开发者”YAGNI(You Aren't Gonna Need It,你不会需要它)编码技巧 — 启发了我们的 less-code 输出风格:以最小可行变更为导向,削减生成的代码(这是与 Caveman 简洁 prose 相对应的输出端优化)。

🧩 紧凑格式、令牌研究与代码感知工具

项目 其对OmniRoute的启发
TOON · toon-format 24.6k 面向令牌的对象表示法(Token-Oriented Object Notation)—— 其柱状、标题+行模型塑造了我们的表格压缩阶段。
GCF – 图形紧凑格式 · Blackwell Systems 11 模式感知的“LLM专用JSON”表示法 —— 共同启发了我们使用[N rows]标记的无损同构数组压缩。
token-optimizer-mcp · ooples 409 Brotli/SQLite缓存 + 每会话上下文增量 —— 启发了我们的session-dedup(会话去重)引擎。
token-savior · Mibayy 993 Bash输出压缩 + MCP配置文件 —— 启发了我们的压缩退出策略和MCP工具清单精简。
token-saver · ppgranger 103 内容感知的、按文件类型的输出压缩,具备故障感知退出机制 —— 验证了我们的按类型调度和最小增益跳过策略。
token-optimizer · alexgreensh 1.4k “寻找幽灵令牌” —— 其卸载+可恢复句柄模式为我们的CCR卸载思路提供了参考。
TokenMizer · Shweta-Mishra-ai 1 会话图 + 跨轮次行去重蓝图,为我们的session-dedup设计提供了参考。
OmniCompress · jessefreitas 2 Rust柱状JSON + 内容寻址检索 + 跨消息去重 —— 验证了我们的headroom/ccr/session-dedup引擎设计以及“压缩形式与位置无关”的缓存稳定性不变量。
mcp-compressor · Atlassian Labs 80 MCP工具模式/描述压缩 —— 为我们MCP工具清单的基数精简提供了参考。
RepoMapper · pdavis68 182 Aider风格的仓库映射排序 —— 为我们的仓库映射/检索排序探索提供了参考。
quiet-shell-mcp · mrsimpson 4 基于MCP的声明式shell输出精简 —— 验证了我们的声明式bash输出压缩。
ts-morph · David Sherret 6.1k TypeScript编译器API工具包 —— 启发了我们基于解析器的注释移除方法,该方法能保留字符串、模板和正则表达式字面量。

🧠 记忆与RAG

项目 对OmniRoute的启发
Mem0 · mem0ai 58.9k 通用记忆层 — 其代理作为写入/读取边界的模型塑造了我们的记忆架构。
Letta (MemGPT) · letta-ai 23.4k 具有分层记忆的有状态智能体 — 启发了我们的上下文控制与恢复(CCR)分层模型。
WFGY · onestardao 1.8k 包含16种常见RAG/LLM故障模式的ProblemMap分类法 — 成为我们故障排除指南中的共享词汇。

🛰️ 流量监控、中间人攻击与透明代理

项目 对OmniRoute的启发
llm-interceptor · chouzz 46 编码助手与LLM之间流量的中间人拦截/分析 — 我们的流量监控器借鉴了其SSE合并、对话标准化、主机透传以及密钥屏蔽(MIT)功能。
ProxyBridge · InterceptSuite 5.1k 透明的进程级代理路由 — 启发了我们的崩溃安全中间人拆除、套接字空闲超时、/proc进程归因以及TPROXY捕获功能。

📚 模型数据、可观测性与用户界面

项目 对 OmniRoute 的启发
models.dev · SST / OpenCode 5.1k AI 模型规格、定价和功能的开放数据库 — 原生同步到我们的模型目录中。
React Flow / xyflow · xyflow 37.1k 基于节点的图形库,为我们的实时压缩工作室和组合/路由工作室提供支持。
LangGraph · LangChain 35.1k LangGraph Studio 的实时工作流图形可视化启发了我们工作室的实时级联视图。
Langfuse · Langfuse 29.3k 其跟踪 → 跨度 → 生成的可观测性模型塑造了我们压缩工作室的瀑布流展示。
Kiali · Kiali 3.6k Istio 服务网格可观测性 — 启发了我们在路由/组合工作室中的断路器标记和错误边缘视觉效果。
lobe-icons · LobeHub 2.1k AI/LLM 品牌图标,用于在我们的仪表板上呈现提供商图标。

🛡️ 安全性

项目 对 OmniRoute 的启发
awesome-secure-defaults · tldrsec 708 精选的安全默认库列表,指导我们的安全选择(Helmet.js、DOMPurify、ssrf-req-filter、safe-regex、Google Tink)。

❤️ 支持我们

OmniRoute 是免费开源的,所有开发和维护工作均公开进行。如果它为您节省了时间或成本,欢迎考虑支持我们的开发:

  • 为仓库点亮星标 — 这真的能帮助提升项目的曝光度
  • 💖 GitHub 赞助 — 资助持续的维护工作和新服务提供商的接入
  • 🐛 报告漏洞并分享反馈,请前往 讨论区

📄 许可证

MIT 许可证 - 详情参见 LICENSE


⬆ 返回顶部 · 用 ❤️ 为开源 AI 社区打造。

OmniRoute v3.8.24 · Node ≥22.0.0 · MIT 许可证 · omniroute.online

项目介绍

OmniRoute 是多供应商大语言模型的 AI 网关:这是一个兼容 OpenAI 的端点,具备智能路由、负载均衡、重试和故障转移功能。添加策略、速率限制、缓存和可观测性,以实现可靠且具成本意识的推理。【此简介由AI生成】

定制我的领域
319.05 K1.43 K访问 GitHub