clover3 / KoreanNLP

Python Code and Data for Korean NLP / 한국어 자연어 처리, 문장 자르기, 스팸 검사 파이썬 코드

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

KoreanNLP

It contains useful code and data for korean NLP

소개

이 Repository 의 목적은 한국어 자연어 처리를 위한 쓸만한 코드를 공유하기 위함입니다.

각 코드는 100% 정확도를 보증하지는 않으며, 최대한 간결하고 실용적인 목적으로 작성되었습니다.

API 목록

현재 사용가능한 함수는 다음과 같습니다.

  • split_sentence : 문자열을 입력받아 문장 단위로 나누어서 문장의 리스트를 반환합니다.
  • 마침표, 문장부호(!,?), 이모티콘을 검색하여 규칙에 기반하여 문장을 잘라냅니다. 문법 파싱 등은 하지 않기 때문에 의미상으로 문장을 자르지는 못합니다.
  • is_spam : 해당 텍스트가 스팸인지 검사합니다. 댓글, 트위터 등의 단문 스팸에 최적화 되어 있습니다.
  • 키워드 기반의 심플한 스팸 필터입니다. 코드에 스팸 키워드를 상황에 맞게 추가하여 스팸을 쉽게 걸러낼 수 있습니다.

About

Python Code and Data for Korean NLP / 한국어 자연어 처리, 문장 자르기, 스팸 검사 파이썬 코드


Languages

Language:Python 100.0%