welpia / BIGKINDS-LAB

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

목차

  • 1_1 Mecab 사용자 사전 : 메켑 형태소 분석기에 언론재단이 보유한 명사 사전을 추가하는 프로그램(우선 순위 조정)
  • 1_2 명사 추출 : 언론 기사들의 본문에서 사용자 사전을 활용하여 명사만을 추출하는 프로그램
  • 1_3 Mecab vs soynlp 비교 : 명사사전 없이 비지도 학습 방법으로 복합명사를 추출하는 프로그램
  • 2_1 LDA - 8개 대분류 기준 하위 중분류 분석 : 자동 분류를 위한 LDA 모형을 생성하는 프로그램
  • 3_1 국립국어원 개체명 인식 : 국립국어원의 말뭉치 데이터를 활용, 신경망 학습 후, 모형을 생성 저장하는 프로그램
  • 4_1 krwordrank : 비지도 학습 방식으로 언론 기사에서 핵심단어/문장을 추출하는 프로그램
  • 5_1 SentenceTransformer2 : 센텐스 트랜스포머 모형을 활용하녀, 기사 데이터를 임베딩시키고, 기사 유사도를 측정하는 프로그램

About

License:MIT License


Languages

Language:Python 100.0%