BlueCatFlord / cx-extractor-1.1

《基于行块分布函数的通用网页正文抽取》算法的Java实现;算法代码来源于该算法附带的开源实现,不过接下可能会对之修改。

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

This repository is not active

About

《基于行块分布函数的通用网页正文抽取》算法的Java实现;算法代码来源于该算法附带的开源实现,不过接下可能会对之修改。


Languages

Language:Java 100.0%