结构化 LLM Provider 行业图谱 · 共 178 个提供商
| 名称 | 简介 | 类别 | 商业模式 | 卖点 |
|---|---|---|---|---|
| OpenAI | GPT 系列模型的原生 API 提供商 | 模型提供商 | API 计费 | GPT 系列 生态最成熟 多模态 |
| Anthropic | Claude 系列模型 API,长上下文与安全对齐 | 模型提供商 | API 计费 | Claude 系列 超长上下文 安全对齐 |
| Google (Gemini) | Gemini 系列模型 API,多模态长上下文 | 模型提供商 | API 计费 | Gemini 系列 多模态 超长上下文 |
| DeepSeek | 高性价比推理模型,开源权重 | 模型提供商 | API 计费 | DeepSeek-V3/R1 开源权重 低价 |
| Mistral AI | 欧洲开源大模型公司,提供 API 与本地部署 | 模型提供商 | 混合 | Mistral 系列 开源权重 欧洲本土 |
| xAI | Grok 系列模型 API | 模型提供商 | API 计费 | Grok 系列 X 平台集成 实时数据 |
| AI21 Labs | Jamba 系列模型 API,专注 RAG 与企业搜索 | 模型提供商 | API 计费 | Jamba 架构 RAG 优化 企业搜索 |
| Cohere | Command 系列模型 API,企业级 RAG、嵌入与重排序 | 模型提供商 | 混合 | Command 系列 RAG 检索增强 Embed + Rerank |
| 百度 (文心) | 文心系列大模型 API,百度千帆平台 | 模型提供商 | API 计费 | 文心系列 千帆平台 百度生态 |
| 阿里 (通义千问) | 通义千问系列大模型 API,阿里云百炼平台 | 模型提供商 | API 计费 | 通义千问系列 阿里云百炼 开源权重 |
| 智谱 AI | GLM 系列大模型 API,国产通用 AI 平台 | 模型提供商 | API 计费 | GLM 系列 国产自主 多模态 |
| Moonshot AI | Kimi 系列大模型 API,超长上下文与 Agent | 模型提供商 | API 计费 | Kimi 系列 256K 长上下文 Agent 能力 |
| 字节跳动 (豆包) | 豆包系列大模型 API,火山引擎平台 | 模型提供商 | API 计费 | 豆包系列 火山引擎 字节跳动生态 |
| MiniMax | 多模态大模型 API,音视频生成能力突出 | 模型提供商 | API 计费 | MiniMax 系列 多模态 音视频生成 |
| 腾讯 (混元) | 混元系列大模型 API,腾讯云平台 | 模型提供商 | API 计费 | 混元系列 腾讯云 多模态 |
| 讯飞 (星火) | 星火认知大模型 API,讯飞 AI 平台 | 模型提供商 | API 计费 | 星火系列 讯飞出品 语音能力 |
| 百川智能 | Baichuan 系列大模型 API,国产自研 | 模型提供商 | API 计费 | Baichuan 系列 国产自研 领域微调 |
| 阶跃星辰 | Step 系列大模型 API,多模态能力突出 | 模型提供商 | API 计费 | Step 系列 多模态 国产自研 |
| Stability AI | Stable Diffusion 等开源生成模型 API | 模型提供商 | API 计费 | Stable Diffusion 图像生成 开源模型 |
| 360 智脑 | 360 智脑大模型 API,安全合规方向 | 模型提供商 | API 计费 | 360 智脑 安全合规 国内生态 |
| 商汤科技 | 日日新大模型 API,多模态与视觉能力突出 | 模型提供商 | API 计费 | 日日新系列 计算机视觉 多模态 |
| 零一万物 | Yi 系列大模型 API,零一万物开放平台 | 模型提供商 | API 计费 | Yi 系列 开源权重 中美双团队 |
| 书生·浦语 | InternLM 开源大模型,上海人工智能实验室 | 模型提供商 | 开源 | InternLM 系列 上海 AI Lab 开源商用 |
| 昆仑万维 (天工) | 天工大模型 API,昆仑万维 AI 平台 | 模型提供商 | API 计费 | 天工系列 昆仑万维 搜索增强 |
| 网易有道 | 有道大模型 API,教育与翻译场景 | 模型提供商 | API 计费 | 有道大模型 教育场景 翻译能力 |
| 知乎 (知海) | 知海大模型 API,知乎知识社区场景 | 模型提供商 | API 计费 | 知海大模型 知乎出品 知识问答 |
| vivo (蓝心) | 蓝心大模型,vivo 端侧 AI 平台 | 模型提供商 | API 计费 | 蓝心大模型 vivo 出品 端侧推理 |
| 联想 (绿洲) | 绿洲大模型,联想 PC 端 AI 助手 | 模型提供商 | API 计费 | 绿洲大模型 联想出品 PC 端集成 |
| OPPO (万鲤) | 万鲤大模型,OPPO 手机端侧 AI | 模型提供商 | API 计费 | 万鲤大模型 OPPO 出品 手机端侧 |
| 小米 (小爱) | 小爱大模型,小米 IoT 与手机生态 | 模型提供商 | API 计费 | 小爱大模型 小米出品 IoT 生态 |
| 华为 (盘古) | 盘古系列大模型 API,华为云 ModelArts 平台 | 模型提供商 | API 计费 | 盘古系列 华为云 行业大模型 |
| 澜舟科技 | 孟子系列大模型 API,轻量化 NLP 平台 | 模型提供商 | API 计费 | 孟子系列 澜舟科技 NLP 技术 |
| Inflection AI | Inflection 系列模型 API,对话式 AI | 模型提供商 | API 计费 | Inflection 系列 Pi 助手 对话 AI |
| Preferred Networks (PLaMo) | 日本国产 LLM PLaMo,政府与自治体广泛采用 | 模型提供商 | API 计费 | PLaMo 系列 日本国产 政府采用 |
| ELYZA | 日本语特化 LLM 开发商,企业向け AI SaaS | 模型提供商 | API 计费 | ELYZA 系列 日本语特化 企业向け |
| Stockmark | 日本国产 LLM Stockmark-2,商务日语领域高性能 | 模型提供商 | API 计费 | Stockmark-2 日本语特化 NVIDIA NIM |
| rinna | 日本语特化 LLM rinna 系列,开源模型提供 | 模型提供商 | API 计费 | 日本语 GPT rinna 系列 开源模型 |
| CyberAgent (OpenCALM) | 日本语特化 LLM OpenCALM 系列,商用可开源 | 模型提供商 | API 计费 | OpenCALM 日本语特化 CC BY-SA 开源 |
| Fugaku-LLM | 富岳超算训练的日本国产 LLM,产学合作开发 | 模型提供商 | 开源 | Fugaku 超算 日本国产 产学合作 |
| Kotoba Technologies | 日本语音 AI 模型 Koto,东亚语言实时语音 | 模型提供商 | API 计费 | Koto 语音模型 东亚语言 实时语音 |
| NTT (tsuzumi) | NTT 日本国产 LLM tsuzumi,轻量高效日语模型 | 模型提供商 | API 计费 | NTT LLM 日本国产 电信生态 |
| NEC | NEC 日本国产企业向け LLM,セキュリティ特化 | 模型提供商 | API 计费 | NEC LLM 企业向け セキュリティ |
| SB Intuitions | 軟銀系国産 LLM Sarashina,国内最大級パラメータ | 模型提供商 | API 计费 | Sarashina 系列 4,600 億パラメータ MoE 国内最大級 |
| Sakana AI | 進化的モデルマージで構築する日本発 LLM | 模型提供商 | API 计费 | 進化的モデルマージ 東京拠点 Transformer 共著者創業 |
| Rakuten (Rakuten AI) | 楽天国産 LLM Rakuten AI,最大級开源权重 | 模型提供商 | API 计费 | Rakuten AI 7,000 億 MoE Apache 2.0 開源 |
| LINE (japanese-large-lm) | LINE 国産日本語 LLM,大規模コーパス学習 | 模型提供商 | API 计费 | japanese-large-lm Apache 2.0 650GB 学習データ |
| Lightblue (Karasu) | Lightblue 日本語特化 LLM Karasu/Qarasu | 模型提供商 | 开源 | Karasu/Qarasu 日本語特化 Lightblue 出品 |
| Fujitsu (Takane) | 富士通国産 LLM Takane,JGLUE 最高性能 | 模型提供商 | API 计费 | Takane JGLUE 最高スコア 1bit 量子化 |
| KDDI (ELYZA連携) | KDDI 通信キャリアの AI プラットフォーム | 模型提供商 | API 计费 | KDDI + ELYZA 源内採択 通信キャリア連携 |
| Shisa.AI | 日英双语 LLM Shisa V2,开源 + API 服务 | 模型提供商 | API 计费 | Shisa V2 系列 日英双语 1.2B–405B 全规格 |
| Stability AI Japan | Japanese StableLM 系列,Stability AI 日本語特化モデル | 模型提供商 | API 计费 | Japanese StableLM 日語特化 Stability AI 日本版 |
| Inception Labs | 扩散式 LLM Mercury dLLM,速度比传统 AR 快 5-10 倍 | 模型提供商 | API 计费 | Mercury dLLM 扩散式生成 1000+ tok/s |
| Liquid AI | Liquid Foundation Models,设备感知架构高效推理 | 模型提供商 | API 计费 | LFM2 系列 设备感知架构 边缘到云端 |
| Reka AI | 多模态模型 Reka Flash/Edge/Core,文本图像视频音频 | 模型提供商 | API 计费 | Reka Flash/Edge 多模态 文本+图像+视频+音频 |
| Arcee AI | 企业合规优先 LLM,支持边缘部署 | 模型提供商 | API 计费 | AFM 企业模型 合规优先 边缘部署 |
| Writer | 企业级 LLM Palmyra 系列,内容生成与安全 | 模型提供商 | API 计费 | Palmyra 系列 企业级 内容安全 |
| Aleph Alpha | 欧洲企业级 LLM Luminous,可解释 AI 与合规 | 模型提供商 | API 计费 | Luminous 系列 欧洲合规 可解释 AI |
| Dragon LLM | 法国非 Transformer 架构 LLM,欧洲主权 AI | 模型提供商 | API 计费 | Dragon Architecture 非 Transformer 欧洲主权 AI |
| Prime Intellect | 分布式 RL 训练开源推理模型 INTELLECT-2 | 模型提供商 | 开源 | INTELLECT-2 分布式 RL 训练 开源推理 |
| 名称 | 简介 | 类别 | 商业模式 | 卖点 |
|---|---|---|---|---|
| Crof AI | 低价 OSS 模型推理 API | 推理 API | API 计费 | 价格低 OpenAI 兼容 轻量 |
| Groq | LPU 硬件加速推理,超低延迟 | 推理 API | API 计费 | LPU 硬件 超低延迟 高速推理 |
| Together AI | 大规模开源模型推理与微调平台 | 推理 API | API 计费 | 200+ 开源模型 微调支持 高性价比 |
| Fireworks AI | 高速多模态推理引擎,自研 FireAttention | 推理 API | API 计费 | FireAttention 多模态 低延迟 |
| Cerebras | CS-3 晶圆级引擎推理,极致速度 | 推理 API | API 计费 | 晶圆级芯片 极速推理 硬件自研 |
| SambaNova | RDU 架构企业级 AI 推理平台 | 推理 API | 混合 | RDU 架构 企业级 高性能推理 |
| DeepInfra | 稳定的大规模推理服务,支持专用端点 | 推理 API | API 计费 | 专用端点 大规模稳定 按量计费 |
| Hyperbolic | 低价 GPU 推理与模型 API | 推理 API | API 计费 | 低价 GPU 租赁 快速上线新模型 |
| Replicate | 社区模型一键部署,适合快速原型 | 推理 API | API 计费 | 社区模型丰富 一键部署 原型开发 |
| Hugging Face | 最大开源模型社区,提供托管推理 API | 推理 API | 混合 | 10 万+ 模型 开源生态 企业方案 |
| Perplexity | AI 搜索引擎,pplx-api 提供推理 API | 推理 API | SaaS | 搜索增强 pplx-api 快速接入新模型 |
| Novita AI | 低价 GPU 云平台,200+ 模型 API | 推理 API | API 计费 | 低价 无服务器 GPU 快速冷启动 |
| SiliconFlow | 高性能 AI 推理平台,支持文本/图像/视频/音频模型 | 推理 API | API 计费 | 多模态推理 高性价比 国内生态 |
| Cloudflare Workers AI | 全球边缘网络 AI 推理,无需 GPU 运维 | 推理 API | 混合 | 边缘推理 300+ 数据中心 无需管理 GPU |
| Voyage AI | 高质量嵌入与重排序模型 API | 推理 API | API 计费 | 嵌入模型 重排序 检索优化 |
| Chutes.ai | 去中心化 LLM 推理平台,基于 Bittensor 网络 | 推理 API | API 计费 | 去中心化 Bittensor 网络 低价开源模型 |
| FriendliAI | 自研推理引擎高吞吐 LLM 服务 | 推理 API | API 计费 | Friendli Engine 高吞吐 低延迟 |
| Lepton AI | AI 模型一键部署与推理平台 | 推理 API | API 计费 | Lepton SDK 一键部署 模型市场 |
| BentoML | AI 模型打包与生产部署框架 | 推理 API | API 计费 | BentoML 框架 模型打包 生产部署 |
| Jina AI | Embedding 与搜索 API,Jina Reader 网页提取 | 推理 API | API 计费 | Jina Embeddings 多模态搜索 Reader API |
| Nomic | 开源嵌入模型与数据可视化平台 | 推理 API | API 计费 | Nomic Embed Atlas 可视化 开源嵌入 |
| OctoAI | 高效 LLM 推理与模型定制平台 | 推理 API | API 计费 | OctoAI 推理 模型定制 高效部署 |
| NLP Cloud | 多模型 NLP 推理 API 平台 | 推理 API | API 计费 | 多模型 API 简单接入 社区驱动 |
| Akash AI | 去中心化 GPU 云推理,Akash 网络 | 推理 API | API 计费 | 去中心化推理 Akash 网络 社区节点 |
| Pieces | 端侧 LLM 推理,开发者工作流集成 | 推理 API | API 计费 | 模型蒸馏 边缘推理 低成本 |
| Glhf.chat | 去中心化 LLM 推理,社区 GPU 节点 | 推理 API | API 计费 | 去中心化 社区节点 低价开源 |
| 名称 | 简介 | 类别 | 商业模式 | 卖点 |
|---|---|---|---|---|
| OpenRouter | 统一 API 聚合 300+ 模型的路由市场 | 聚合路由 | API 计费 | 300+ 模型 统一 API 按需选模型 |
| Poe | Quora 出品多模型聚合平台,提供 API 访问 | 聚合路由 | SaaS | 多模型聚合 Quora 出品 对话界面 |
| LiteLLM | 开源 LLM 代理,归一化 100+ 提供商 API | 聚合路由 | 开源 | 开源代理 100+ API 归一化 负载均衡 |
| Portkey | LLM 控制面,网关 + 可观测性 + Prompt 管理 | 聚合路由 | SaaS | 可观测性 Prompt 管理 成本控制 |
| Artificial Analysis | LLM Provider 性能基准对比平台 | 聚合路由 | API 计费 | AI 比较 基准测试 Provider 排名 |
| qzira | 日本語 LLM API 网关,日元结算多模型中继 | 聚合路由 | API 计费 | 日本語 UI 日元结算 BYOK 网关 |
| CC-Relay | 开源 LLM API 代理,Claude Code 专用中继 | 聚合路由 | 开源 | Go 编写 Claude Code 集成 SSE 流式 |
| APIMart | LLM API 聚合网关,企业级多模型中继 | 聚合路由 | API 计费 | OpenAI 兼容 企业 SLA 多模型聚合 |
| GateRouter | LLM API 智能路由中继,支持加密货币支付 | 聚合路由 | API 计费 | 20+ 模型 加密货币支付 智能路由 |
| DMXAPI | LLM API 中继服务,300+ 模型折扣价格 | 聚合路由 | API 计费 | 300+ 模型 折扣充值 OpenAI 协议 |
| GPTACG | LLM API 高并发中继服务,企业级稳定性 | 聚合路由 | API 计费 | 高稳定性 10 万 rpm 并发 企业级 |
| 名称 | 简介 | 类别 | 商业模式 | 卖点 |
|---|---|---|---|---|
| Lamini | 企业级 LLM 微调平台,Memory Tuning 降低幻觉 | 训练平台 | 混合 | Memory Tuning 低幻觉 企业微调 |
| Modal | Serverless GPU 云平台,Python 原生 AI 工作负载 | 训练平台 | API 计费 | Serverless GPU 按需计费 Python 原生 |
| RunPod | GPU 云市场,按需租用 GPU 运行 AI 工作负载 | 训练平台 | API 计费 | GPU 市场 社区模板 一键部署 |
| Lambda Labs | GPU 云与推理 API 服务 | 训练平台 | API 计费 | GPU 云 推理 API 自研硬件 |
| Databricks | 数据与 AI 统一平台,Mosaic AI LLM 训练 | 训练平台 | API 计费 | Mosaic AI 训练 数据湖集成 企业 ML |
| Scale AI | AI 数据标注与 RLHF 训练数据平台 | 训练平台 | SaaS | RLHF 数据标注 企业数据质量 多模态标注 |
| Labelbox | AI 数据标注与训练数据管理平台 | 训练平台 | SaaS | 数据标注 主动学习 多模态 |
| 名称 | 简介 | 类别 | 商业模式 | 卖点 |
|---|---|---|---|---|
| Azure OpenAI | 微软 Azure 托管的 OpenAI 模型服务 | 企业 AI 平台 | API 计费 | Azure 集成 企业合规 区域部署 |
| AWS Bedrock | AWS 托管的多模型 AI 服务 | 企业 AI 平台 | API 计费 | AWS 集成 多模型统一 企业安全 |
| Anyscale | 基于 Ray 的端到端 AI 计算平台 | 企业 AI 平台 | 混合 | Ray 原生 端到端 企业治理 |
| Google Vertex AI | Google Cloud 全托管 ML/AI 平台 | 企业 AI 平台 | API 计费 | Google Cloud AutoML 全托管 ML |
| Abacus.AI | 企业级 AI Agent 构建与部署平台 | 企业 AI 平台 | SaaS | AI Agent 构建 无代码 企业集成 |
| IBM watsonx | IBM 企业 AI 平台,Granite 模型与 Agent 编排 | 企业 AI 平台 | API 计费 | watsonx Granite 模型 企业 AI 治理 |
| Oracle OCI AI | Oracle 云 AI 服务,OCI 生成式 AI | 企业 AI 平台 | API 计费 | OCI 集成 Generative AI Oracle 生态 |
| Snowflake Cortex | Snowflake 数据云原生 AI 服务 | 企业 AI 平台 | API 计费 | Snowflake 集成 Cortex AI 数据云原生 |
| Clarifai | 全栈 AI 平台,视觉与多模态模型部署 | 企业 AI 平台 | API 计费 | 全栈 AI 多模态 企业部署 |
| Salesforce Einstein | Salesforce 企业 AI 平台,CRM 原生 AI | 企业 AI 平台 | SaaS | Salesforce 集成 CRM AI Einstein GPT |
| ServiceNow AI | ServiceNow 企业 AI 平台,IT 服务智能化 | 企业 AI 平台 | SaaS | ServiceNow 集成 IT 服务 AI 工作流自动化 |
| 名称 | 简介 | 类别 | 商业模式 | 卖点 |
|---|---|---|---|---|
| LangChain | LLM 应用编排框架,链式调用与工具集成 | 代理框架 | 开源 | 链式编排 生态最丰富 LangGraph |
| LlamaIndex | LLM 数据框架,专注 RAG 与数据索引 | 代理框架 | 开源 | RAG 优化 数据索引 查询引擎 |
| CrewAI | 多角色 AI Agent 协作框架 | 代理框架 | 开源 | 多角色协作 角色定义 任务编排 |
| AutoGen | 微软多 Agent 对话框架 | 代理框架 | 开源 | 多 Agent 对话 微软出品 研究导向 |
| Semantic Kernel | 微软 LLM 编排 SDK,企业级插件集成 | 代理框架 | 开源 | Semantic Kernel 微软出品 企业集成 |
| Haystack | deepset 出品 LLM 编排框架,专注搜索增强 | 代理框架 | 开源 | Pipeline 架构 搜索增强 可扩展 |
| DSPy | Stanford 出品 LLM 管线编程与自动优化框架 | 代理框架 | 开源 | Stanford 出品 自动优化 Prompt 声明式编程 |
| Phidata | LLM Agent 构建框架,内置工具与记忆 | 代理框架 | 开源 | Agent 框架 工具集成 多模型支持 |
| OpenAI Agents SDK | OpenAI 官方 Agent 开发 SDK | 代理框架 | 开源 | OpenAI 官方 轻量级 Agent SDK |
| Smolagents | HuggingFace 出品轻量级 Agent 框架 | 代理框架 | 开源 | HuggingFace 出品 轻量级 简单 Agent |
| 名称 | 简介 | 类别 | 商业模式 | 卖点 |
|---|---|---|---|---|
| Helicone | LLM 可观测性平台,日志与成本追踪 | 其他 | SaaS | LLM 可观测性 日志分析 成本追踪 |
| Ollama | 本地 LLM 运行工具,一键运行开源模型 | 其他 | 开源 | 本地运行 多模型支持 CLI 工具 |
| Pinecone | 全托管向量数据库,Serverless 向量搜索 | 其他 | SaaS | 全托管向量库 Serverless 低运维 |
| Weaviate | 开源向量数据库,融合知识图谱与向量搜索 | 其他 | 混合 | 知识图谱 + 向量 混合搜索 开源 |
| Qdrant | Rust 高性能开源向量数据库 | 其他 | 开源 | Rust 高性能 丰富过滤 云原生 |
| Chroma | 嵌入式向量数据库,开发者友好的 RAG 工具 | 其他 | 开源 | 嵌入式 开发者友好 快速原型 |
| Milvus | 大规模分布式开源向量数据库 | 其他 | 开源 | 大规模分布式 云原生 GPU 加速 |
| vLLM | 高吞吐 LLM 推理引擎,PagedAttention 优化 | 其他 | 开源 | PagedAttention 高吞吐 连续批处理 |
| SGLang | 快速 LLM 推理框架,结构化生成与低延迟 | 其他 | 开源 | 结构化生成 低延迟 RadixAttention |
| TensorRT-LLM | NVIDIA 出品 LLM 推理优化库 | 其他 | 开源 | NVIDIA 出品 TensorRT 优化 生产级推理 |
| LangSmith | LLM 可观测性与评估平台,LangChain 生态 | 其他 | SaaS | LLM 可观测性 评估框架 LangChain 生态 |
| Braintrust | LLM 评估平台,自动化测试与迭代 | 其他 | SaaS | LLM 评估 自动化测试 数据驱动 |
| Langfuse | 开源 LLM 可观测性平台,追踪与评估 | 其他 | 开源 | 开源可观测性 自部署 多框架支持 |
| llama.cpp | 轻量 C/C++ LLM 推理引擎,CPU/GPU 通用 | 其他 | 开源 | C/C++ 推理 CPU/GPU 通用 量化支持 |
| Guardrails AI | LLM 输出校验与安全防护框架 | 其他 | 开源 | 输出校验 结构化生成 安全防护 |
| CalypsoAI | LLM 安全与内容审查企业平台 | 其他 | SaaS | AI 安全 内容审查 企业合规 |
| ElevenLabs | AI 语音合成与克隆平台,TTS/STT API | 其他 | API 计费 | 语音克隆 TTS/STT 多语言 |
| AssemblyAI | 语音识别 API,实时转录与理解 | 其他 | API 计费 | 语音转文字 实时转录 说话人识别 |
| LM Studio | 本地 LLM 桌面应用,一键运行开源模型 | 其他 | 开源 | 桌面应用 本地推理 模型管理 |
| GPT4All | CPU 端本地 LLM 推理,离线运行 | 其他 | 开源 | CPU 推理 离线运行 轻量级 |
| PromptLayer | LLM Prompt 版本管理与请求日志平台 | 其他 | SaaS | Prompt 版本管理 请求日志 性能分析 |
| Gretel | AI 合成数据生成平台,隐私保护 | 其他 | SaaS | 合成数据 隐私保护 表格数据 |
| TruLens | LLM 应用可观测性与 RAG 质量评估框架 | 其他 | SaaS | LLM 可观测性 RAG 评估 质量监控 |
| Weights & Biases | ML 实验追踪与模型管理平台 | 其他 | SaaS | ML 实验追踪 模型注册 团队协作 |
| Apple MLX | Apple 芯片端侧 LLM 推理框架 | 其他 | 开源 | Apple 芯片优化 Metal 加速 端侧推理 |
| Promptfoo | 开源 LLM Prompt 测试与红队评估工具 | 其他 | 开源 | Prompt 测试 红队测试 自动评估 |
| Flowise | 开源拖拽式 LLM 工作流构建平台 | 其他 | 开源 | Agent 工作流 可视化编排 LangChain 生态 |
| Dify | 开源 LLM 应用开发平台,低代码构建 AI Agent | 其他 | 开源 | 低代码 Agent 可视化构建 插件市场 |
| TGI | HuggingFace 出品生产级 LLM 推理服务器 | 其他 | 开源 | HuggingFace 出品 生产级推理 多框架支持 |
| ONNX Runtime | 微软开源跨平台 ML 推理引擎 | 其他 | 开源 | 跨平台推理 ONNX 格式 多语言 SDK |
| MNN | 阿里巴巴开源轻量级推理引擎 | 其他 | 开源 | GPU 加速 跨平台推理 模型转换 |
| UiPath AI | 企业 RPA + AI Agent 自动化平台 | 其他 | SaaS | 自动化 AI 多模态 Agent RPA 集成 |
| Open LLM Leaderboard | HuggingFace 开源 LLM 排行榜与评估 | 其他 | SaaS | LLM 评估 模型排行榜 开源基准 |
| HELM | Stanford 出品 LLM 全面评估框架 | 其他 | 开源 | LLM 基准测试 多任务评估 HELM 框架 |
| RouteLLM | 开源 LLM 路由框架,按查询复杂度选模型 | 其他 | 开源 | LLM 路由 预测选择 降低成本 |
| Ragas | RAG 管线评估框架,自动化质量测试 | 其他 | 开源 | RAG 评估 自动化测试 生成质量 |
| LlamaParse | LlamaIndex 出品文档解析 API,PDF 等格式提取 | 其他 | 开源 | 文档解析 LlamaIndex 生态 多格式支持 |
| DeepEval | 开源 LLM 评估框架,单元测试式评估 | 其他 | 开源 | LLM 评估 指标框架 单元测试 |
| OpenPipe | LLM 实验管理与评估平台 | 其他 | SaaS | LLM 评估 A/B 测试 人类反馈 |
| Triton Inference Server | NVIDIA 出品多框架模型推理服务器 | 其他 | 开源 | 推理引擎 Serving 框架 NVIDIA Triton |
| Guru | 企业知识库 AI 平台,RAG 即服务 | 其他 | SaaS | 知识库平台 RAG 即服务 多租户 |
| Glean | 企业级 AI 搜索平台,内部知识检索 | 其他 | SaaS | AI 搜索 企业内部搜索 多源连接 |
| You.com | AI 搜索引擎,提供搜索 API | 其他 | SaaS | AI 搜索引擎 实时信息 API 访问 |
| RapidAPI | API 市场平台,聚合多个 LLM API | 其他 | SaaS | API 市场 LLM 路由 多模型 |
| Mostly AI | AI 合成数据生成,隐私安全表格数据 | 其他 | SaaS | 合成数据 LLM 训练数据 场景模拟 |
| Langflow | 开源可视化 LLM 工作流构建平台 | 其他 | 开源 | 低代码 AI 可视化构建 多模型支持 |
| Continue.dev | 开源 AI 编程助手,IDE 内代码补全与对话 | 其他 | 开源 | AI 编程助手 代码补全 IDE 集成 |
| Aider | 开源终端 AI 编程助手,Git 集成 | 其他 | 开源 | AI 编程助手 终端界面 多模型支持 |
| Cursor | AI 代码编辑器,智能代码生成与审查 | 其他 | SaaS | AI 编程 代码审查 GitHub 集成 |
| GitHub Copilot | GitHub AI 编程助手,代码补全与生成 | 其他 | SaaS | AI 编程助手 IDE 插件 企业级 |
| APIDog | API 开发协作平台,LLM API 测试与管理 | 其他 | SaaS | API 市场 OpenAPI 规范 快速集成 |
| AI inside | 日本企业 AI 平台,OCR + LLM 通用 AI サービス | 其他 | SaaS | AI inside OCR + LLM 企业 AI |
| PKSHA Technology | 日本 AI 企业,NLP 与对话 AI 解决方案 | 其他 | SaaS | PKSHA AI 日本企业 NLP/对话 |
| Cinnamon AI | 日本 AI 企业,文档 AI + RAG 解决方案 | 其他 | SaaS | 文档 AI Super RAG IDP 智能文档处理 |