scvgoe / CorpusProject

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Corpus Project

This project contains FormatTransfomer, Combinator, Separator.

KISTI 외주로 진행한 프로젝트, Corpus라는 태그 정보를 포함한 xml 문서를 분석하는 프로젝트로서,

포맷을 KISTI에서 요구한 사항에 맞게 변환시켜주는 FormatTransformer와

두개의 단문을 결합하여 복문 혹은 중문을 생성하는 Combinator

복문을 두개의 문장으로 분리해주는 Separator를 포함한다.

Parser로는 Stanford Parser를 사용하였다.

About


Languages

Language:Java 100.0%