xuqy1981's repositories

alpaca-chinese-dataset

alpaca中文指令微调数据集

Stargazers:0Issues:0Issues:0

alpaca-lora

Instruct-tune LLaMA on consumer hardware

Language:Jupyter NotebookLicense:Apache-2.0Stargazers:0Issues:0Issues:0

alpaca_chinese_dataset

人工精调的中文对话数据集和一段chatglm的微调代码

Language:Jupyter NotebookLicense:MITStargazers:0Issues:0Issues:0

BELLE

BELLE: Be Everyone's Large Language model Engine(开源中文对话大模型)

License:Apache-2.0Stargazers:0Issues:0Issues:0

Best-Incremental-Learning

An Incremental Learning, Continual Learning, and Life-Long Learning Repository

Stargazers:0Issues:0Issues:0

botbots

A dataset featuring diverse dialogues between two ChatGPT (gpt-3.5-turbo) instances with system messages written by GPT-4. Covering various contexts and tasks (task-oriented dialogue systems, abstract reasoning, brainstorming).

License:MITStargazers:0Issues:0Issues:0

chatglm_finetuning

chatglm 6b finetuning and alpaca finetuning

Stargazers:0Issues:0Issues:0

ChatGLM_mutli_gpu_tuning

deepspeed+trainer简单高效实现多卡微调大模型

License:MITStargazers:0Issues:0Issues:0

Chinese-LLaMA-Alpaca

中文LLaMA&Alpaca大语言模型+本地部署 (Chinese LLaMA & Alpaca LLMs)

License:Apache-2.0Stargazers:0Issues:0Issues:0

Chinese-Vicuna

Chinese-Vicuna: A Chinese Instruction-following LLaMA-based Model —— 一个中文低资源的llama+lora方案,结构参考alpaca

License:Apache-2.0Stargazers:0Issues:0Issues:0

CodeGPT

数据集--CodeGPT: A Code-Related Dialogue Dataset Generated by GPT and for GPT

License:Apache-2.0Stargazers:0Issues:0Issues:0

Everything-LLMs-And-Robotics

The world's largest GitHub Repository for LLMs + Robotics

License:BSD-3-ClauseStargazers:0Issues:0Issues:0

FastChat

The release repo for "Vicuna: An Open Chatbot Impressing GPT-4"

License:Apache-2.0Stargazers:0Issues:0Issues:0

free-chatgpt-client-pub

ShellGPT是一个免费多功能ChatGPT客户端,支持联网搜索,无需密钥,无需登录即可使用。 它具有多节点自动测速切换功能,能够进行长文翻译,还能进行AI作图。该客户端内置了GPT4和Claude+等多种模型,支持聊天、翻译和AI作图等多种模式,并且适用于Mac、Windows、Android和Linux等操作系统。

Stargazers:0Issues:0Issues:0

funNLP

中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、历史名人词库、诗词词库、医学词库、饮食词库、法律词库、汽车词库、动物词库、中文聊天语料、中文谣言数据、百度中文问答数据集、句子相似度匹配算法集合、bert资源、文本生成&摘要相关工具、cocoNLP信息抽取工具、国内电话号码正则匹配、清华大学XLORE:中英文跨语言百科知识图谱、清华大学人工智能技术系列报

Stargazers:0Issues:0Issues:0
License:Apache-2.0Stargazers:0Issues:0Issues:0

gpt4all

gpt4all: a chatbot trained on a massive collection of clean assistant data including code, stories and dialogue

Stargazers:0Issues:0Issues:0

ImageBind

MetaAI 重磅开源 ImageBind,可让模型跨 6 种不同的模态(图像、文本、音频、深度、热能和 IMU 数据)进行联动! 基于该项目,开发者可以「开箱即用」实现包括跨模态检索、使用算术合成模态、跨模态检测和生成等各类新兴应用。借助 ImageBind,则可以做到直接通过声音来直接生成图像。这使得 AI 能够更加深入了解人类情感,理解他们的喜怒哀乐,进而为人类提供更好的服务。 当你举起手机,录制一个海边日落的视频时,AI 便能自动根据视频内容来生成文案和字幕,并匹配上合适的背景音乐。 甚至 AI 还有可能通过一首歌,直接为歌手生成一段视频 MV。 此举将为 AIGC 技术带来更为广泛的应用场景,一大波更为有趣、实用的 AI 项目也即将来袭。

License:NOASSERTIONStargazers:0Issues:0Issues:0

LLMDataHub

LLMDataHub: 致力于收集大型语言模型(LLM)高质量训练语料库的项目。提供了一系列专门用于聊天机器人训练的数据集,包括各种对话领域和风格。数据集包含链接、大小、语言、使用情况以及每个数据集的简要描述。其中包括了SHP、ELI5、evol_instruct_70k、MOSS SFT data、ShareGPT52K、GPT-4all Dataset、COIG、RedPajama-Data-1T、OpenAssistant Conversations Dataset (OASST1)等多个数据集。此外,该项目还收集了一些针对特定领域的数据集,如财务领域的finance-alpaca数据集

License:MITStargazers:0Issues:0Issues:0

ML-NLP

此项目是机器学习(Machine Learning)、深度学习(Deep Learning)、NLP面试中常考到的知识点和代码实现,也是作为一个算法工程师必会的理论基础知识。

Stargazers:0Issues:0Issues:0

MOSS

An open-source tool-augmented conversational language model from Fudan University

Language:PythonLicense:Apache-2.0Stargazers:0Issues:0Issues:0

PaLM

PaLM的开源复现。已训练了三种不同大小的PaLM模型(150m,410m,1b),并且还在训练一个2b模型。这些模型使用了Flash Attention、Xpos旋转嵌入以及多查询单键值注意力等技术,以提高解码效率

License:MITStargazers:0Issues:0Issues:0

privateGPT

基于私有LLM(大语言模型)做个人的文档问答,不必担心隐私泄露 技术栈是 LangChain 和 GPT4All - LLM默认用的 ggml-model-q4_0.bin. - Embedding默认用的是 ggml-model-q4_0.bin 当然你可以自己替换,不过对中文支持应该不会太好。

License:Apache-2.0Stargazers:0Issues:0Issues:0

PyCIL

PyCIL: A Python Toolbox for Class-Incremental Learning

License:MITStargazers:0Issues:0Issues:0

RefGPT

包含5万条中文多轮对话

License:Apache-2.0Stargazers:0Issues:0Issues:0

RLHF

Implementation of Chinese ChatGPT

Stargazers:0Issues:0Issues:0
Language:PythonStargazers:0Issues:1Issues:0

semantic_slam

This package is for running the semantic SLAM algorithm using extracted planar surfaces from the received detection

Stargazers:0Issues:0Issues:0

TigerBot

TigerBot: A multi-language multi-task LLM

License:Apache-2.0Stargazers:0Issues:0Issues:0

whisper.cpp

Port of OpenAI's Whisper model in C/C++

License:MITStargazers:0Issues:0Issues:0