chapzq77 / Baike_Unstruction_Info_Extract

抽取百度百科,互动百科和搜狗百科网页中的info box 的属性信息

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

#功能:抽取人名百科网页的属性信息

  • 安装的库 lxml ----使用pip install lxml命令安装
  • 从百度百科、互动百科和搜狗百科中提取半结构化的 info box 中提取 结构化的属性信息
  • 输入是一个:任意的一个url,
  • 返回:解析后的结构化的属性信息

About

抽取百度百科,互动百科和搜狗百科网页中的info box 的属性信息


Languages

Language:Python 100.0%