hankcs / HanLP

中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理

Home Page:https://hanlp.hankcs.com/

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

执行open_small.py时报'utf-8' codec can't decode byte 0xb4 in position 0: invalid start byte

hiking-coder opened this issue · comments

作者大大,本人小白在尝试使用hanlp2.1执行train的demo时,一直卡在导入from hanlp.datasets.ner.msra import 导入数据这关,然后也搜索了您论坛上的解决方案,如下设置
image
但还是一直执行后报如下错误
image

请问是什么原因呢,先感谢大佬了

  • I've completed this form and searched the web for solutions.

Hi, please refer to the doc:

Many preprocessing scripts written by professionals make heavy use of Linux/Unix tool chains like shell, perl, gcc,