Ollama
1 min readv0.6By openDesk Edu
人工智能基础设施测试版
Stableollamallmaimachine-learningscientific-computing
Ollama 是一个本地 LLM 后端,为开源语言模型提供推理服务。它为 Open WebUI 提供模型运行时支持,并支持不断增长的模型库,包括 llama3.2、Mistral、Gemma 以及用于嵌入的 nomic-embed-text。
核心功能
- 本地模型服务:本地运行开源 LLM,无需依赖外部 API。
- 模型库:从精选模型库中下载和服务模型(llama3.2、Mistral、Gemma、Phi 等)。
- REST API:完整的 API 支持聊天补全、嵌入和模型管理。
- GPU 加速:通过 CUDA 支持 NVIDIA GPU 加速,提升推理速度。
- 轻量级:仅 CPU 部署所需资源极少。
与 openDesk Edu 的集成
Ollama 属于协作服务套件,通过其上游 Helm Chart(ollama.github.io)部署。它在 Helmfile 依赖链中率先部署(阶段 010-infra),作为 Open WebUI 所依赖的 LLM 后端。它作为内部服务运行,不直接暴露给用户。
