Hyunjoong Kim's repositories
textmining-tutorial
(한국어) 텍스트 마이닝을 위한 공부거리들
soyspacing
띄어쓰기 오류 교정 라이브러리입니다. CRF 와 같은 머신러닝 알고리즘이 아닌, 직관적인 접근법으로 띄어쓰기를 교정합니다.
fastcampus_textml_blogs
패스트캠퍼스, 자연어처리를 위한 머신러닝, 수업관련 포스트 입니다.
korean_lemmatizer
한국어 용언 분석기 (원형 복원, 용언 형태소 분석)
python_ml4nlp
패스트캠퍼스 자연어처리를 위한 머신러닝 실습 자료실
textmining_dataset
텍스트마이닝 실습을 위한 데이터셋 핸들러
sejong_corpus_cleaner
세종 말뭉치 데이터를 정제하기 위한 utils
python_ml4tm
패스트캠퍼스 텍스트마이닝을 위한 머신러닝 실습 자료실
petitions_dataset
청와대 국민청원 게시판으로부터 수집된 데이터
petitions_scraper
청와대 국민청원 게시판의 데이터를 수집하는 스크래퍼
text_embedding
Inferring vector of unseen words
archive_carblog_analysis
Carblog dataset (github.com/lovit/carblog_dataset) 의 분석 코드입니다
joint_visualization_of_words_and_docs
(Demo) Joint visualization for representation of words and docs trained from Doc2Vec
topic_embedding
Embedding words to topic space
easy_wikitext
Wikitext dataset handler
dissertation
Dessertation repository
introduction_to_ml_with_python
도서 "[개정판] 파이썬 라이브러리를 활용한 머신 러닝"의 주피터 노트북과 코드입니다.
kaggle_ner_dataset_handler
Easy-Handler for Kaggle Annotated Corpus for Named Entity Recognition
kmeans4doc_experiments
Experiments repository. topic = kmeans4doc
lattice_based_tagger
Lattice based Korean Morphological analyzer & Part of Speech Tagger
morph-net
Fast & Simple Resource-Constrained Learning of Deep Network Structure
NLPMetrics
Python code for various NLP metrics
PRML
PRML algorithms implemented in Python
pytorch-optimizer
torch-optimizer -- collection of optimizers for Pytorch