embedding

There are 20 repositories under embedding topic.

chatchat-space / Langchain-Chatchat
Langchain-Chatchat（原Langchain-ChatGLM）基于 Langchain 与 ChatGLM, Qwen 与 Llama 等语言模型的 RAG 与 Agent 应用 | Langchain-Chatchat (formerly langchain-ChatGLM), local knowledge based LLM (like ChatGLM, Qwen and Llama) RAG and Agent app with langchain
chatbot chatchat chatglm chatgpt embedding faiss fastchat gpt knowledge-base langchain langchain-chatglm llama llm milvus ollama qwen rag retrieval-augmented-generation streamlit xinference
Language:TypeScript 30821
PaddleNLP
PaddlePaddle / PaddleNLP
👑 Easy-to-use and powerful NLP and LLM library with 🤗 Awesome model zoo, supporting wide-range of NLP tasks from research to industrial applications, including 🗂Text Classification, 🔍 Neural Search, ❓ Question Answering, ℹ️ Information Extraction, 📄 Document Intelligence, 💌 Sentiment Analysis etc.
nlp embedding bert ernie paddlenlp pretrained-models transformers information-extraction question-answering search-engine semantic-analysis sentiment-analysis neural-search uie document-intelligence compression llm distributed-training llama
Language:Python 11896
Embedding / Chinese-Word-Vectors
100+ Chinese Word Vectors 上百种预训练中文词向量
chinese chinese-word-segmentation embedding embeddings vectors-trained word-embeddings
Language:Python 11742
madawei2699 / myGPTReader
A community-driven way to read and chat with AI bots - powered by chatGPT.
chatgpt slack-bot prompt crawler embedding gpt-35-turbo scraper ai reader hot-news daily-news openai
Language:Python 4420
adambielski / siamese-triplet
Siamese and triplet networks with online pair/triplet mining in PyTorch
contrastive-loss deep-learning embedding learning-embeddings machine-learning pytorch siamese-network triplet-loss triplet-network
Language:Python 3088
infiniflow / infinity
The AI-native database built for LLM applications, providing incredibly fast hybrid search of dense vector, sparse vector, tensor (multi-vector), and full-text
ai-native approximate-nearest-neighbor-search bm25 cpp20 cpp20-modules embedding full-text-search hnsw hybrid-search information-retrival nearest-neighbor-search rag search-engine tensor-database vector vector-database vector-search vectordatabase
Language:C++ 2358
awesome-community-detection
benedekrozemberczki / awesome-community-detection
A curated list of community detection research papers with implementations.
graph-clustering network-clustering clustering dimensionality-reduction factorization embedding deep-learning matrix-factorization igraph networkx bigclam network-science social-network network-analysis node2vec deepwalk unsupervised-learning data-science machine-learning community-detection
Language:Python 2301
run-llama / LlamaIndexTS
LlamaIndex in TypeScript
agent anthr chatbot claude claude-ai embedding firewo groq-ai javascript llama llama-index llama2 llama3 llm mistr nodejs openai react typescript create-llama
Language:TypeScript 1704
pavlin-policar / openTSNE
Extensible, parallel implementations of t-SNE
tsne visualization machine-learning dimensionality-reduction embedding
Language:Python 1437
devflowinc / trieve
All-in-one infrastructure for search, recommendations, RAG, and analytics offered via API
actix actix-web ai artificial-intelligence diesel embedding llm postgresql qdrant qdrant-vector-database rag retrieval-augmented-generation rust search search-engine solidjs tailwindcss vector-search
Language:Rust 1252
vercel / modelfusion
The TypeScript library for building AI applications.
chatbot gpt-3 javascript js llm openai ts typescript whisper ai embedding huggingface dall-e stable-diffusion llamacpp artificial-intelligence claude multi-modal ollama mistral
Language:TypeScript 1088
SkywalkerDarren / chatWeb
ChatWeb can crawl web pages, read PDF, DOCX, TXT, and extract the main content, then answer your questions based on the content, or summarize the key points.
chatgpt embedding gpt-35-turbo news-extractor newspaper openai pgvector postgresql vector-database faiss ai gpt crawler docx pdf
Language:Python 867
zhezhaoa / ngram2vec
Four word embedding models implemented in Python. Supporting arbitrary context features
ngram word2vec ngram2vec embedding analogy chinese glove ppmi svd n-gram word word-embedding
Language:Python 839
myscale / MyScaleDB
An open-source, high-performance SQL vector database built on ClickHouse.
embedding search-engine sql vector-search vectordb myscaledb sql-vector big-data llm rag ann similarity-search image-search unstructured-analytics
Language:C++ 803
xing61 / zzz-api
优质稳定的OpenAI的API接口-For企业和开发者。OpenAI的api proxy，支持ChatGPT的API调用，支持openai的API接口，支持：gpt-4，gpt-3.5。不需要openai Key, 不需要买openai的账号，不需要美元的银行卡，通通不用的，直接调用就行，稳定好用！！智增增
chatgpt gpt4 openai openai-api gpt-35-turbo prompt finetune finetuning gpt china embedding openai-proxy proxy
Language:PHP 574
shawroad / NLP_pytorch_project
Embedding, NMT, Text_Classification, Text_Generation, NER etc.
chatbot embedding mrc ner nlp-pytorch nmt seq2seq text-classification text-generation
Language:Python 555
cvxgrp / pymde
Minimum-distortion embedding with PyTorch
embedding visualization feature-vectors machine-learning dimensionality-reduction graph-embedding pytorch cuda gpu
Language:Python 533
OysterQAQ / ACG2vec
ACG2vec (Anime Comics Games to vector) are committed to creating a playground that combines ACG and Deep learning.（文本语义检索、以图搜图、语义搜图、图片超分辨率、推荐系统）
acg deep-learning embedding feature-extraction keras tensorflow anime image-search image-super-resolution
525
ContextualAI / gritlm
Generative Representational Instruction Tuning
embeddings grit information-retrieval instruction-tuning llm llms mteb retrieval sbert sgpt text-embedding embedding embedding-models
Language:Jupyter Notebook 510
cvqluu / Angular-Penalty-Softmax-Losses-Pytorch
Angular penalty loss functions in Pytorch (ArcFace, SphereFace, Additive Margin, CosFace)
metric-learning pytorch loss-functions loss-function embedding face-verification fashion-mnist fmnist-dataset face-recognition speaker-recognition sphereface arcface normface am-softmax
Language:Python 479
marl / openl3
OpenL3: Open-source deep audio and image embeddings
audio deep-learning embedding embedding-models image image-embeddings machine-listening
Language:Jupyter Notebook 447
aquila
Aquila-Network / aquila
An easy to use Neural Search Engine. Index latent vectors along with JSON metadata and do efficient k-NN search.
feature-vectors similarity-search knn-search information-retrieval neural-information-retrieval vector-database approximate-nearest-neighbor-search search-engine nearest-neighbor-search embedding similarity-searches video-search image-search aquila retrieval faiss neural-search information-retrieval-engine
Language:HTML 376
guangzhengli / vectorhub
Quickly and easily build AI website or application by using embeddings!
chatgpt chatpdf embedding embeddings gpt gpt-3 nextjs supabase vector vector-database
Language:TypeScript 357
luyug / GradCache
Run Effective Large Batch Contrastive Learning Beyond GPU/TPU Memory Constraint
jax flax contrastive-learning pytorch deep-learning embedding large-language-models vector-database
Language:Python 339
PaddlePaddle / ERNIE-SDK
ERNIE Bot Agent is a Large Language Model (LLM) Agent Framework, powered by the advanced capabilities of ERNIE Bot and the platform resources of Baidu AI Studio.
agent chatcompletion embedding ernie-bot function-calling llm sdk
Language:Jupyter Notebook 338
yongzhuo / Macadam
Macadam是一个以Tensorflow(Keras)和bert4keras为基础，专注于文本分类、序列标注和关系抽取的自然语言处理工具包。支持RANDOM、WORD2VEC、FASTTEXT、BERT、ALBERT、ROBERTA、NEZHA、XLNET、ELECTRA、GPT-2等EMBEDDING嵌入; 支持FineTune、FastText、TextCNN、CharCNN、BiRNN、RCNN、DCNN、CRNN、DeepMoji、SelfAttention、HAN、Capsule等文本分类算法; 支持CRF、Bi-LSTM-CRF、CNN-LSTM、DGCNN、Bi-LSTM-LAN、Lattice-LSTM-Batch、MRC等序列标注算法。
bert embedding keras ner python3 relation-extraction sequence-labeling tensorflow text-classification
Language:Python 323
askaitools / askaitools-community-edition
A cutting-edge search engine project tailored specifically for the AI product
ai embedding enterprise-search full-text-search hybrid-search search search-engine semantic-search tools
Language:TypeScript 311
marcominerva / ChatGptNet
A ChatGPT integration library for .NET, supporting both OpenAI and Azure OpenAI Service
azure-openai azure-openai-api chatgpt csharp dotnet embedding embeddings embeddings-similarity hacktoberfest net openai openai-api
Language:C# 290
geeks-of-data / knowledge-gpt
Extract knowledge from all information sources using gpt and other language models. Index and make Q&A session with information sources.
gpt openai context embedding embedding-vectors gpt3-turbo gpt4 huggingface huggingface-transformers information-extraction language-model llm python question-answering scraper sentence-embeddings sentence-similarity vector-search llama natural-language-processing
Language:Python 278
snap-stanford / KGReasoning
Multi-Hop Logical Reasoning in Knowledge Graphs
knowledge-graph knowledge-base embedding reasoning
Language:Python 272
GEMSEC
benedekrozemberczki / GEMSEC
The TensorFlow reference implementation of 'GEMSEC: Graph Embedding with Self Clustering' (ASONAM 2019).
clustering m-nmf deepwalk node2vec word2vec tensorflow gemsec facebook deezer community-detection matrix-factorization implicit-factorization embedding neural-network semisupervised-learning unsupervised-learning gensim machine-learning network-embedding graph-embedding
Language:Python 252
memfreeme / memfree
MemFree - Hybrid AI Search Engine
ai-search embedding vector-database vector-search serverless-vector redis redis-queue chrome-extension nextjs react shadcn-ui tailwind hybrid-ai-search
Language:TypeScript 240
llm-tools / embedJs
A NodeJS RAG framework to easily work with LLMs and embeddings
embedding embeddings gpt gpt-4 llm openai vector-database ai chatgpt cohere huggingface large-language-models rag mistral pinecone claude ollama vertex-ai gpt-4o
Language:TypeScript 231
shahsohil / DCC
This repository contains the source code and data for reproducing results of Deep Continuous Clustering paper
dcc pytorch clustering embedding robust-optimization robust-continuous-clustering rcc autoencoder-clustering
Language:Python 209
amansrivastava17 / embedding-as-service
One-Stop Solution to encode sentence to fixed length vectors from various embedding techniques
nlp bert xlnet word2vec glove fasttext ulmfit embedding transformer bert-as-service embedding-as-service sentence-encoding tensorflow word-embedding deep-learning ai encoder embeddings albert roberta
Language:Python 204
DANMF
benedekrozemberczki / DANMF
A sparsity aware implementation of "Deep Autoencoder-like Nonnegative Matrix Factorization for Community Detection" (CIKM 2018).
deep-learning autoencoder machine-learning data-science clustering community-detection nmf deepwalk node2vec mnmf gemsec coordinate-descent danmf node-embedding word2vec embedding sklearn cikm unsupervised-learning dimensionality-reduction
Language:Python 202