low-resource-machine-translation

There are 1 repository under low-resource-machine-translation topic.

csebuetnlp / banglanmt
This repository contains the code and data of the paper titled "Not Low-Resource Anymore: Aligner Ensembling, Batch Filtering, and New Datasets for Bengali-English Machine Translation" published in Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP 2020), November 16 - November 20, 2020.
bangla-nlp machine-translation parallel-corpus parallel-corpora neural-machine-translation bangla-dataset-machine-translation bangla-machine-translation low-resource-languages emnlp-2020 low-resource-nlp low-resource-machine-translation
Language:Python 147
cambridgeltl / ContrastiveBLI
Improving Word Translation via Two-Stage Contrastive Learning (ACL 2022). Keywords: Bilingual Lexicon Induction, Word Translation, Cross-Lingual Word Embeddings.
bilingual-lexicon-induction word-translation contrastive-learning self-learning cross-lingual-word-embeddings mbert pytorch word-alignment cross-lingual-embeddings bilingual-lexicon-extraction bilingual-word-embedding word-embeddings fasttext-embeddings bilingual-dictionary-induction cross-lingual-word-embedding low-resource-machine-translation information-retrieval machine-translation
Language:Python 35
Kartikaggarwal98 / Indian_ParallelCorpus
Curated list of publicly available parallel corpus for Indian Languages
corpus indian-languages low-resource-languages low-resource-machine-translation machinetranslation multilingual-translation neural-machine-translation nlp parallel-corpora parallel-corpus
32
yaoyiran / BLI-Reading-List
A 2024 Reading List for Bilingual Lexicon Induction (BLI) / Word Translation. Frequently Updated.
bilingual-dictionary-induction bilingual-lexicon-extraction bilingual-lexicon-induction bilingual-word-embedding cross-lingual-embeddings cross-lingual-word-embedding cross-lingual-word-embeddings information-retrieval large-language-models llms low-resource-machine-translation word-alignment word-retrieval word-translation
Language:Python 25
L1-Refinement
Pzoom522 / L1-Refinement
Code for "Cross-Lingual Word Embedding Refinement by ℓ1 Norm Optimisation" (NAACL 2021)
cross-lingual-word-embedding low-resource-machine-translation naacl2021 transfer-learning word-translation
Language:Python 17
cambridgeltl / BLICEr
Improving Bilingual Lexicon Induction with Cross-Encoder Reranking (Findings of EMNLP 2022). Keywords: Bilingual Lexicon Induction, Word Translation, Cross-Lingual Word Embeddings.
bilingual-dictionary-induction bilingual-lexicon-extraction bilingual-lexicon-induction bilingual-word-embedding cross-encoder cross-lingual-embeddings cross-lingual-word-embeddings fasttext-embeddings pytorch reranking self-learning word-alignment word-embeddings word-translation xlm-r xlm-roberta low-resource-machine-translation cross-lingual-word-embedding information-retrieval machine-translation
Language:Python 13
cambridgeltl / prompt4bli
On Bilingual Lexicon Induction with Large Language Models (EMNLP 2023). Keywords: Bilingual Lexicon Induction, Word Translation, Large Language Models, LLMs.
bilingual-dictionary-induction bilingual-lexicon-extraction bilingual-lexicon-induction large-language-models llms machine-translation multilingual-models multilingual-nlp word-translation low-resource-machine-translation pytorch prompt prompt-engineering prompting prompts llama mt5 few-shot-learning in-context-learning zero-shot-learning
Language:Python 10
clefourrier / CopperMT
[ACL 2021, Findings] Cognate Prediction Per Machine Translation
acl2021 cognate-prediction cognates fairseq low-resource-languages low-resource-machine-translation machine-translation nmt smt
Language:JavaScript 10
machelreid / afromt
Code for the EMNLP 2021 Paper "AfroMT: Pretraining Strategies and Reproducible Benchmarks for Translation of 8 African Languages" by Machel Reid, Junjie Hu, Graham Neubig, Yutaka Matsuo
low-resource-machine-translation machine-learning nlp
Language:Python 9
HenningBuhl / low-resource-machine-translation
This repository is an open-source colleciton of various low-resource machine translation experiments.
deep-learning low-resource low-resource-languages low-resource-machine-translation low-resource-nlp machine-learning machine-translation machine-translation-models neural-machine-translation neural-network neural-networks python transformer experiments nlp nlp-machine-learning cascading pivoting direct-pivoting step-wise-pivoting
Language:Python 7
andrea-cavallo-98 / Low-resource-Machine-Translation
Multilingual finetuning of Machine Translation model on low-resource languages. Project for Deep Natural Language Processing course.
natural-language-processing machine-translation low-resource-languages low-resource-machine-translation
Language:Jupyter Notebook 5
Rui0828 / Learning-From-Mistakes-Prompting
LoResMT@ACL 2024: Learning-From-Mistakes Prompting for Indigenous Language Translation – A feedback-driven approach to enhance low-resource translation.
low-resource low-resource-nlp machine-translation chain-of-thought few-shot-learning in-context-learning low-resouce-language low-resource-machine-translation natural-language-processing
Language:Python 5
cambridgeltl / sail-bli
Self-Augmented In-Context Learning for Unsupervised Word Translation (ACL 2024). Keywords: Bilingual Lexicon Induction, Word Translation, Large Language Models, LLMs.
bilingual-dictionary-induction bilingual-lexicon-extraction bilingual-lexicon-induction few-shot-learning in-context-learning large-language-models llama llama2 llms low-resource-machine-translation machine-translation multilingual-models multilingual-nlp prompt prompt-engineering prompting pytorch self-learning word-translation zero-shot-learning
Language:Python 3
harshitadd / indicOCR
Low-Resource OCR
crawlers low-resource-machine-translation ocr
Language:Jupyter Notebook 1
jchenghu / lowres_uski
Learning from Wrong Predictions in Low-Resource Neural Machine Translation. Basic implementation of the USKI (Unaligned Sentences Keytokens pre-training) method for Neural Machine Translation
low-resource-machine-translation machine-translation transformer
Language:Python 1
steventan0110 / ParaCrawl
On-develop Bitext Mining Tool for low resource languages
bitext-mining low-resource-machine-translation
Language:Shell