luopeixiang / named_entity_recognition

中文命名实体识别(包括多种模型:HMM,CRF,BiLSTM,BiLSTM+CRF的具体实现)

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

打开train、dev、text时报错

beagood opened this issue · comments

运行时出现打开文件问题
UnicodeDecodeError: 'gbk' codec can't decode byte 0x98 in position 2: illegal multibyte sequence
但因为对build_corpus函数不熟悉,不知道参数是什么,无法改成utf-8格式。
想咨询博主应该怎么办,谢谢回答!
如果方便的话,想请博主给我一个联系方式,或者通过邮箱联系。我的个人邮箱是384569486@qq.com
再次感谢!

运行时出现打开文件问题
UnicodeDecodeError: 'gbk' codec can't decode byte 0x98 in position 2: illegal multibyte sequence
但因为对build_corpus函数不熟悉,不知道参数是什么,无法改成utf-8格式。
想咨询博主应该怎么办,谢谢回答!
如果方便的话,想请博主给我一个联系方式,或者通过邮箱联系。我的个人邮箱是384569486@qq.com
再次感谢!

你好,我在linux下面用python3运行的时候没有此问题,请问你使用的python版本是2还是3呢?

您好,我是在windows下面用的python3.7版本,编译器用的是pycharm。

UnicodeDecodeError这个问题已经通过更新data.py中的open函数解决

已解决,谢谢!

已解决,谢谢!如何解决的,可以细说一下嘛!谢谢