Hellohistory's repositories

EbookDatabase

本地网页书籍信息检索

Language:PythonLicense:NOASSERTIONStargazers:190Issues:6Issues:9

EbookDataGeter

EbookDataGeter 是一个基于 NLCISBNPlugin 的改进项目,提供了简单好用的**国家图书馆ISBN检索

Language:PythonLicense:Apache-2.0Stargazers:35Issues:0Issues:0

OpenPrepTools

本项目旨在于提供一些预处理与实用工具

Language:PythonLicense:Apache-2.0Stargazers:9Issues:0Issues:0

EbookDataRename.py

EbookDataTools系列作品

Language:PythonLicense:GPL-3.0Stargazers:8Issues:0Issues:0

Machine_Translation_ebook

一个致力于将EPUB、PDF、MOBI等格式的可编辑电子书翻译后保留原始格式的项目

Language:PythonLicense:GPL-3.0Stargazers:7Issues:0Issues:0

ClassicalModernCorpus

该项目旨在于收集制作古代汉语和现代汉语对照语料数据集

License:CC-BY-4.0Stargazers:5Issues:0Issues:0

Python-Study_CH

这是一个学习Python的存储库

Language:PythonLicense:MITStargazers:4Issues:0Issues:0
Language:PythonLicense:GPL-3.0Stargazers:4Issues:0Issues:0

ErrorFile

用于损坏文件检测的Python库

Language:PythonLicense:Apache-2.0Stargazers:1Issues:0Issues:0

Shadowscript

古籍影文: 中文古籍开放数据集仓库

License:CC-BY-4.0Stargazers:1Issues:0Issues:0

EbookDataRename.cpp

EbookDataTools系列作品

Language:C++License:GPL-3.0Stargazers:0Issues:0Issues:0
Language:PythonStargazers:0Issues:0Issues:0

HanLP

中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理

License:Apache-2.0Stargazers:0Issues:0Issues:0