similarity-measures

There are 2 repositories under similarity-measures topic.

tdebatty / java-string-similarity
Implementation of various string similarity and distance algorithms: Levenshtein, Jaro-winkler, n-Gram, Q-Gram, Jaccard index, Longest Common Subsequence edit distance, cosine similarity ...
java levenshtein-distance cosine-similarity string-distance damerau-levenshtein distance distance-measure jaro-winkler similarity-measures shingles algorithm
Language:Java 2677
SimSIMD
ashvardanian / SimSIMD
Up to 200x Faster Inner Products and Vector Similarity — for Python, JavaScript, Rust, C, and Swift, supporting f64, f32, f16 real & complex, i8, and binary vectors using SIMD for both x86 AVX2 & AVX-512 and Arm NEON & SVE 📐
arm-neon arm-sve assembly avx2 distance-calculation distance-measures metrics neon simd simd-instructions information-retrieval numpy scipy similarity-measures similarity-search vector-search avx512 blas blas-libraries float16
Language:C 819
hbollon / go-edlib
📚 String comparison and edit distance algorithms library, featuring : Levenshtein, LCS, Hamming, Damerau levenshtein (OSA and Adjacent transpositions algorithms), Jaro-Winkler, Cosine, etc...
go golang edit-distance algorithms levenshtein levenshtein-distance lcs lcs-distance damerau-levenshtein string-matching string-comparison string-distance similarity-measures unicode golang-string-comparison jaro-winkler edit-distance-algorithms hamming cosine
Language:Go 465
feature23 / StringSimilarity.NET
A .NET port of java-string-similarity
algorithms dotnet strings string-distance levenshtein-distance damerau-levenshtein cosine-similarity jaro-winkler distance string shingles similarity-measures lcs-distance winkler string-metrics
Language:C# 440
patrickzib / SFA
Scalable Time Series Data Analytics
classification indexing similarity-measures time-series
Language:Java 309
WenRichard / Customer-Chatbot
中文智能客服机器人demo，包含闲聊和专业问答2个部分，支持自定义组件（Chinese intelligent customer chatbot Demo, including the gossip and the professional Q&A(FAQ) , support for custom components！）
nlp chatbot customer-chatbot faq similarity-measures similarity qa
Language:Python 306
cjekel / similarity_measures
Quantify the difference between two arbitrary curves in space
similarity-measures curve distance fr-chet-distance warping measure dtw dynamic-time-warping frechet-distance python
Language:Jupyter Notebook 242
firmai / datagene
DataGene - Identify How Similar TS Datasets Are to One Another (by @firmai)
dataset-generation synthetic-data synthesizers synthetic-dataset-generation distance-measures decomposition encoding finance data-structures predictive-maintenance model-checking testing-framework similarity-measures similarity-score dataset-similarity transformation-recipes data-transformations distance-calculations
Language:Jupyter Notebook 194
matchms / matchms
Python library for processing (tandem) mass spectrometry data and for computing spectral similarities.
python3 similarity-measures mass-spectrometry fuzzy-matching fuzzy-search metabolomics analysis
Language:Python 172
jm199504 / Financial-Time-Series
金融时间序列（预测分析 / 相似度 / 数据处理）
financial-prediction financial-time-series similarity-measures python
Language:Jupyter Notebook 168
ansegura7 / Algorithms
Free hands-on course with the implementation (in Python) and description of several computational, mathematical and statistical algorithms.
python computer-science statistics algorithms divide-and-conquer graphs probabilistic-algorithms similarity-measures chaotic-systems cellular-automata dijkstra-algorithm lasvegas-algorithm hanoi-towers graph-coloring fractal networkx dynamic-programming mathematics
Language:HTML 130
drostlab / philentropy
Information Theory and Distance Quantification with R
jensen-shannon-divergence information-theory similarity-measures distance-quantification distance-measures parametric-distributions statistics r
Language:R 128
xgfs / verse
Reference implementation of the paper VERSE: Versatile Graph Embeddings from Similarity Measures
graph similarity-measures embeddings machine-learning machine-learning-algorithms graph-algorithms
Language:C++ 128
firmai / mtss-gan
MTSS-GAN: Multivariate Time Series Simulation with Generative Adversarial Networks (by @firmai)
time-series synthetic-dataset-generation synthetic-data generative-adversarial-network multivariate-data multivariate-timeseries simulation finance adverserial stress-test model-validation similarity-measures
92
Nakilon / dhash-vips
vips-powered ruby gem to measure images similarity, implementing dHash and IDHash algorithms
dhash image-comparison similarity-measures fingerprint similarity-search fingerprints perceptual-hashing gem
Language:Ruby 88
chandan-u / graph-based-recommendation-system
building a recommendation system using graph search methodologies. We will be comparing these different approaches and closely observe the limitations of each.
python recommendation-system collaborative-filtering content-filtering graph-algorithms similarity-measures pandas data-science algorithms
Language:Python 63
frjnn / bhtsne
Parallel Barnes-Hut t-SNE implementation written in Rust.
data-science data-visualization machine-learning rust dimensionality-reduction similarity-measures bhtsne barnes-hut
Language:Rust 63
jim-spyropoulos / Trajectory-Analysis-and-Classification-in-Python-Pandas-and-Scikit-Learn
Formed trajectories of sets of points.Experimented on finding similarities between trajectories based on DTW (Dynamic Time Warping) and LCSS (Longest Common SubSequence) algorithms.Modeled trajectories as strings based on a Grid representation.Benchmarked KNN, Random Forest, Logistic Regression classification algorithms to classify efficiently trajectories.
python machine-learning classification trajectory scikitlearn-machine-learning dtw trajectory-analysis classifiers similarity-measures scikit-learn random-forest knn logistic-regression
Language:Python 63
renjunxiang / chatbot_by_similarity
根据文本相似度实现问答的聊天机器人（简单版）
nlp chatbot similarity-measures
Language:Python 52
dumitrescustefan / RoWordNet
Romanian WordNet (Data + API for Python)
wordnet romanian python rowordnet similarity-measures
Language:Python 46
cjekel / DTW_cpp
Dynamic Time Warping single header library for C++
dynamic-time-warping single-header cpp11 similarity-measures dtw
Language:C++ 44
babylonhealth / fuzzymax
Code for the paper: Don't Settle for Average, Go for the Max: Fuzzy Sets and Max-Pooled Word Vectors, ICLR 2019.
research-paper machine-learning natural-language-processing word-vectors word-embeddings similarity-measures
Language:Python 43
DavideNardone / MTSS-Multivariate-Time-Series-Software
A GP-GPU/CPU Dynamic Time Warping (DTW) implementation for the analysis of Multivariate Time Series (MTS).
dtw mts classification gpu similarity-measures timeseries subseq-search distance-measures distance-metric gpgpu warping
Language:Cuda 41
bigpon / SpeechSubjectiveTest
Speech (audio) subjective evaluation system
subjective-evaluations speech mean-opinion-score preference similarity-measures excel-export
Language:Python 37
babylonhealth / corrsim
Code for the papers: Correlation Coefficients and Semantic Textual Similarity, NAACL-HLT 2019 & Correlations between Word Vector Sets, EMNLP-IJCNLP 2019.
research-paper machine-learning natural-language-processing word-embeddings similarity-measures correlation-coefficients
Language:Python 35
lewinfox / levitate
Fuzzy string matching in R. Inspired by Python's thefuzz (but without the Python).
fuzzy-matching string-similarity r data-matching similarity-measures thefuzz
Language:R 34
koheiw / proxyC
R package for large-scale similarity/distance computation
r data-science distance-measures similarity-measures
Language:R 29
nlpub / rdt
RDT: Russian Distributional Thesaurus (Русский Дистрибутивный Тезаурус)
distributional thesaurus word2vec semantic similarity similarity-measures semantic-relations relatedness distributional-semantics distributional-analysis marisa-trie trie russian nlp natural-language-processing
Language:Python 27
nrohani / NDD
Drug-Drug Interaction Predicting by Neural Network Using Integrated Similarity
drug-similarities neural-network deep-neural-networks ndd drug-discovery drug-drug-interaction drug-target-interactions predictive-modeling neural-networks similarity similarity-measures snf
Language:Python 27
lqzhao / SAFNet
[IROS 2021] Implementation of "Similarity-Aware Fusion Network for 3D Semantic Segmentation"
semantic-segmentation deep-learning pytorch similarity-measures
Language:Python 21
oist-ncbc / spykesim
Extended edit similarity measurement for high dimensional discrete-time series signal (e.g., multi-unit spike-train).
neuroscience spike-trains editdistance neuroinformatics theoretical-neuroscience similarity-measures python
Language:Python 21
jessicabonnie / dandd
Tool to estimate deltas for sequence sets and answer questions about relative contribution
genomics genomics-analysis sequence-analysis similarity-measures
Language:Python 20
ngmarchant / comparator
Similarity and distance measures for clustering and record linkage applications in R
r-package distance-measures similarity-measures string-similarity record-linkage distance-metrics entity-resolution clustering
Language:R 16
raj1603chdry / CSE3018-Content-Based-Image-and-Video-Retrieval-Lab
Repository containing all the codes created for the lab sessions of CSE3018 Content Based Image and Video Retrieval at VIT University Chennai Campus
matlab cbir content-based-image-retrieval statistical-feature-extraction color-histogram auto-correlogram color-correlogram color-cohorence-vector ccv glcm gray-level-coocurence-matrix shape-analysis distance-measure similarity-measures local-binary-patterns precision recall f-score
Language:MATLAB 16
tcrouch / edits.cr
Edit distance algorithms inc. Jaro, Damerau-Levenshtein, and Optimal Alignment
crystal edit-distance similarity-measures levenshtein damerau-levenshtein jaro-winkler jaro text
Language:Crystal 16
oertl / treeminhash
TreeMinHash: Fast Sketching for Weighted Jaccard Similarity Estimation
minhash weighted-sets sketching sketching-algorithm jaccard-similarity jaccard-distance jaccard jaccard-index lsh-algorithm locality-sensitive minwise-hashing minwise-hashing-algorithm locality-sensitive-hashing hash-algorithm similarity-measures similarity-search similarity-metric jaccard-similarity-estimation jaccard-coefficient
Language:C++ 15