wut0n9 / ChatLLM

轻松玩转LLM 提供生产级API 前后端分离

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

image image image

🔥ChatLLM 基于知识库🔥

Install

pip install -U chatllm

Usages

from chatllm.applications import ChatBase

qa = ChatBase()
qa.load_llm4chat(model_name_or_path="THUDM/chatglm-6b")

_ = list(qa(query='周杰伦是谁', knowledge_base='周杰伦是傻子', role=' '))
# 根据已知信息无法回答该问题,因为周杰伦是**内地流行歌手、演员、音乐制作人、导演,
# 是具有一定的知名度和专业能力的人物,没有提供足够的信息无法判断他是傻子。
  • 支持角色扮演 img.png

ChatPDF

Click to ChatPDF
  • 一键启动UI
pip install "chatllm[pdf]" && chatllm-run webui --name chatpdf
  • python交互
from chatllm.applications.chatpdf import ChatPDF

qa = ChatPDF(encode_model='nghuyong/ernie-3.0-nano-zh')
qa.load_llm4chat(model_name_or_path="THUDM/chatglm-6b")
qa.create_index('财报.pdf')  # 构建知识库

list(qa(query='东北证券主营业务'))
# 根据已知信息,东北证券的主营业务为证券业务。公司作为证券公司,主要从事证券经纪、证券投资咨询、与证券交易、
# 证券投资活动有关的财务顾问、证券承销与保荐、证券自营、融资融券、证券投资基金代销和代销金融产品待业务。
  • 支持召回结果查看 向量召回结果

Deploy

Click to Deploy

TODO

Click to TODO
  • ChatLLM 应用

    • 接入非结构化文档(已支持 md、pdf、docx、txt 文件格式)
    • 搜索引擎与本地网页接入
    • 结构化数据接入(如 csv、Excel、SQL 等)
    • 知识图谱/图数据库接入
    • 增加 ANN 后端,ES/RedisSearch【确保生产高可用】
    • 增加多级缓存缓存
  • 多路召回

      • 标量匹配
      • 多种向量化,向量匹配
      • 增加相似问,换几个问法
      • 高置信度直接返回答案【匹配标准问】
      • 高置信度篇章
      • 增加上下文信息
      • 增加跨篇章信息
      • 增加召回信息的相似信息
      • 提前生成标准问,匹配问
      • 拒绝推断
  • 增加更多 LLM 模型支持

  • 增加更多 Embedding 模型支持

  • 增加一键启动 webui

    • 利用 streamlit 实现 ChatPDF,一键启动 chatllm-run webui --name chatpdf
    • 利用 gradio 实现 Web UI DEMO
    • 添加输出内容及错误提示
    • 引用标注
    • 增加知识库管理
      • 选择知识库开始问答
      • 上传文件/文件夹至知识库
      • 删除知识库中文件
  • 增加 API 支持

    • 利用 Fastapi/Flask/Grpc 实现流式接口 chatllm-run flask-api --model_name_or_path <MODEL_PATH> --host 127.0.0.1 --port 8000
    • 前后端分离,实现调用 API 的 Web UI Demo

交流群

群

若二维码失效加微信拉群 313303303

About

轻松玩转LLM 提供生产级API 前后端分离

License:MIT License


Languages

Language:Python 49.4%Language:Jupyter Notebook 48.0%Language:Makefile 2.1%Language:Shell 0.6%