lovit

Hyunjoong Kim's repositories

textmining-tutorial

(한국어) 텍스트 마이닝을 위한 공부거리들

Language:Jupyter Notebook204 18 3

soyspacing

띄어쓰기 오류 교정 라이브러리입니다. CRF 와 같은 머신러닝 알고리즘이 아닌, 직관적인 접근법으로 띄어쓰기를 교정합니다.

Language:Python141 11 7

fastcampus_textml_blogs

패스트캠퍼스, 자연어처리를 위한 머신러닝, 수업관련 포스트 입니다.

70 80

korean_lemmatizer

한국어 용언 분석기 (원형 복원, 용언 형태소 분석)

Language:Python4100

python_ml4nlp

패스트캠퍼스 자연어처리를 위한 머신러닝 실습 자료실

Language:Jupyter Notebook40 50

textmining_dataset

텍스트마이닝 실습을 위한 데이터셋 핸들러

Language:Python38 5 1

sejong_corpus_cleaner

세종 말뭉치 데이터를 정제하기 위한 utils

Language:Python36 3 17

python_ml4tm

패스트캠퍼스 텍스트마이닝을 위한 머신러닝 실습 자료실

Language:Jupyter Notebook2000

petitions_dataset

청와대 국민청원 게시판으로부터 수집된 데이터

Language:Python17 2 3

petitions_scraper

청와대 국민청원 게시판의 데이터를 수집하는 스크래퍼

Language:Python16 3 1

text_embedding

Inferring vector of unseen words

Language:Python7 3 16

archive_carblog_analysis

Carblog dataset (github.com/lovit/carblog_dataset) 의 분석 코드입니다

Language:Python6 10

joint_visualization_of_words_and_docs

(Demo) Joint visualization for representation of words and docs trained from Doc2Vec

Language:Python600

ekmeans

Epsilon constrained k-means for document clustering with noise removal

Language:Python5 2 1

pagerank

PageRank

Language:Jupyter Notebook5 2 1

topic_embedding

Embedding words to topic space

Language:Python500

lovit.github.io

Language:HTML4 2 8

archive_acl2019review

Language:Python100

easy_wikitext

Wikitext dataset handler

Language:Python1 20

imdb_scraper

Language:Python1 2 3

carblog_dataset

Language:Python000

dissertation

Dessertation repository

Language:TeX000

introduction_to_ml_with_python

도서 "[개정판] 파이썬 라이브러리를 활용한 머신 러닝"의 주피터 노트북과 코드입니다.

Language:Jupyter Notebook000

kaggle_ner_dataset_handler

Easy-Handler for Kaggle Annotated Corpus for Named Entity Recognition

Language:Python020

kmeans4doc_experiments

Experiments repository. topic = kmeans4doc

Language:Python020

lattice_based_tagger

Lattice based Korean Morphological analyzer & Part of Speech Tagger

Language:Python000

morph-net

Fast & Simple Resource-Constrained Learning of Deep Network Structure

Language:PythonApache-2.0000

NLPMetrics

Python code for various NLP metrics

MIT000

PRML

PRML algorithms implemented in Python

MIT000

pytorch-optimizer

torch-optimizer -- collection of optimizers for Pytorch

Language:PythonApache-2.0020