项目简介
RAGapp[1] 是一个基于 Agentic RAG(Retrieval-Augmented Generation)模型的企业级应用,旨在简化企业使用 Agentic RAG 模型的过程。
项目提供了一个简单的 Docker 部署方式,允许用户在自己的云基础设施中部署和配置 RAGapp,项目由 LlamaIndex[2] 构建。

使用场景
-
企业内部需要使用先进的 AI 模型来增强业务流程或提供智能服务。 -
需要在本地云基础设施中部署 AI 模型,以保证数据安全和合规性。 -
需要一个易于配置和管理的界面来操作 AI 模型。
使用方法
快速开始
要运行RAGapp,可以使用以下命令启动一个Docker容器:
docker run -p 8000:8000 ragapp/ragapp
启动后,可以通过访问http://localhost:8000/admin
来配置你的RAGapp的Admin UI。
支持的AI模型
可以使用OpenAI或Gemini提供的托管AI模型,也可以使用Ollama[3]提供的本地模型。
暴露的端点
Docker容器公开了以下端点:
-
Admin UI: http://localhost:8000/admin
-
Chat UI: http://localhost:8000
-
API: http://localhost:8000/docs
请注意,Chat UI和API只有在RAGapp配置完成后才能正常工作。
安全性
RAGapp默认不包含任何认证层。为了确保你的RAGapp安全,请在你的环境中保护/admin
路径。
部署方式
使用Docker Compose
RAGapp提供了一个docker-compose.yml
文件,以便在自己的基础设施中轻松部署RAGapp与Ollama和Qdrant[4]。
使用MODEL
环境变量,可以指定要使用的模型,例如llama3
:
MODEL=llama3 docker-compose up
如果没有指定MODEL
变量,默认使用的模型是phi3
,它比llama3
功能较弱,但下载速度更快。
注意:
docker-compose.yml
文件中的setup
容器将把选定的模型下载到ollama文件夹中,这可能需要几分钟时间。
使用OLLAMA_BASE_URL
环境变量,可以指定要使用的Ollama主机。如果没有指定OLLAMA_BASE_URL
变量,默认指向由Docker Compose启动的Ollama实例(http://ollama:11434
)。
如果正在运行本地Ollama实例,可以通过设置OLLAMA_BASE_URL
变量将其连接到RAGapp:
MODEL=llama3 OLLAMA_BASE_URL=http://host.docker.internal:11434 docker-compose up
如果在macOS上运行RAGapp,这将非常有用,因为Docker for Mac不支持GPU加速。
Kubernetes
在自己的云基础设施中部署RAGapp也很容易。定制的Kubernetes部署即将推出。
注:本文内容仅供参考,具体项目特性请参照官方 GitHub 页面的最新说明。
欢迎关注&点赞&在看,感谢阅读~
项目地址: https://github.com/ragapp/ragapp
[2]
LlamaIndex: https://github.com/run-llama/llama_index
[3]
Ollama: https://ollama.com/
[4]
Qdrant: https://qdrant.tech/
原文始发于微信公众号(AIGC创想者):1.8K+ Star!RAGapp:一个基于Agentic RAG模型的企业级应用,是企业使用Agentic RAG的最简单方式
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/315442.html