1.8K+ Star！RAGapp：一个基于Agentic RAG模型的企业级应用，是企业使用Agentic RAG的最简单方式

小半 • 2025年2月15日下午10:20 • 技术前沿 • 阅读 64

项目简介

RAGapp^[1] 是一个基于 Agentic RAG（Retrieval-Augmented Generation）模型的企业级应用，旨在简化企业使用 Agentic RAG 模型的过程。

项目提供了一个简单的 Docker 部署方式，允许用户在自己的云基础设施中部署和配置 RAGapp，项目由 LlamaIndex^[2] 构建。

1.8K+ Star！RAGapp：一个基于Agentic RAG模型的企业级应用，是企业使用Agentic RAG的最简单方式

使用场景

企业内部需要使用先进的 AI 模型来增强业务流程或提供智能服务。
需要在本地云基础设施中部署 AI 模型，以保证数据安全和合规性。
需要一个易于配置和管理的界面来操作 AI 模型。

使用方法

快速开始

要运行RAGapp，可以使用以下命令启动一个Docker容器：

docker run -p 8000:8000 ragapp/ragapp

启动后，可以通过访问http://localhost:8000/admin来配置你的RAGapp的Admin UI。

支持的AI模型

可以使用OpenAI或Gemini提供的托管AI模型，也可以使用Ollama^[3]提供的本地模型。

暴露的端点

Docker容器公开了以下端点：

Admin UI: http://localhost:8000/admin
Chat UI: http://localhost:8000
API: http://localhost:8000/docs

请注意，Chat UI和API只有在RAGapp配置完成后才能正常工作。

安全性

RAGapp默认不包含任何认证层。为了确保你的RAGapp安全，请在你的环境中保护/admin路径。

部署方式

使用Docker Compose

RAGapp提供了一个docker-compose.yml文件，以便在自己的基础设施中轻松部署RAGapp与Ollama和Qdrant^[4]。

使用MODEL环境变量，可以指定要使用的模型，例如llama3：

MODEL=llama3 docker-compose up

如果没有指定MODEL变量，默认使用的模型是phi3，它比llama3功能较弱，但下载速度更快。

注意：docker-compose.yml文件中的setup容器将把选定的模型下载到ollama文件夹中，这可能需要几分钟时间。

使用OLLAMA_BASE_URL环境变量，可以指定要使用的Ollama主机。如果没有指定OLLAMA_BASE_URL变量，默认指向由Docker Compose启动的Ollama实例（http://ollama:11434）。

如果正在运行本地Ollama实例，可以通过设置OLLAMA_BASE_URL变量将其连接到RAGapp：

MODEL=llama3 OLLAMA_BASE_URL=http://host.docker.internal:11434 docker-compose up

如果在macOS上运行RAGapp，这将非常有用，因为Docker for Mac不支持GPU加速。

Kubernetes

在自己的云基础设施中部署RAGapp也很容易。定制的Kubernetes部署即将推出。

注：本文内容仅供参考，具体项目特性请参照官方 GitHub 页面的最新说明。

欢迎关注&点赞&在看，感谢阅读~

资源列表

[1]

项目地址: https://github.com/ragapp/ragapp

[2]

LlamaIndex: https://github.com/run-llama/llama_index

[3]

Ollama: https://ollama.com/

[4]

Qdrant: https://qdrant.tech/

原文始发于微信公众号（AIGC创想者）：1.8K+ Star！RAGapp：一个基于Agentic RAG模型的企业级应用，是企业使用Agentic RAG的最简单方式

文章由极客之音整理，本文链接：https://www.bmabk.com/index.php/post/315442.html