🧐 Knowledge QA LLM
 
SemVer2.0 GitHub

简介

基于本地知识库+LLM的问答系统。该项目的思路是由langchain-ChatGLM启发而来。

  • 缘由:
  • 优势:
    • 整个项目为模块化配置,不依赖lanchain库,各部分可轻易替换,代码简单易懂。
    • 除需要单独部署大模型接口外,其他部分用CPU即可。
    • 支持常见格式文档,包括txt、md、pdf, docx, pptx, excel等等。当然,也可自定义支持其他类型文档。

整体流程

解析文档并存储在数据库

flowchart LR

A([Documents]) --ExtractText--> B([sentences])
B --Embeddings--> C([Embeddings])
C --Store--> D[(DataBase)]

检索并回答问题

flowchart LR
E([Query]) --Embedding--> F([Embeddings]) --> H[(Database)] --Search--> G([Context])
E --> I([Prompt])
G --> I --> J([LLM]) --> K([Answer])

使用的工具

Last updated 15 Oct 2023, 02:57 -0500 . history