关于TF-IDF导出乱码问题
ShawWang1991 opened this issue · comments
用的是Python3,但在导出CSV时,关键词是'b'\xe7\x94\等,想问一下如何转换成汉字?
找了半天解决方法,亲测有效~getKeywords_tfidf函数中改为:keys.append(word_split)
keys.append(word_split)
NB 在控制台显示是正常了 但是现在又写不进去csv里了 我再研究看看
为啥在控制台是正常的简体字 一写进csv就乱码了呢
是不是写入csv文件时没声明编码格式呢?
我是这样保存的:
result.to_csv("keys_TFIDF.csv", header=1, index=0, encoding='utf_8_sig')
是不是写入csv文件时没声明编码格式呢?
我是这样保存的:
result.to_csv("keys_TFIDF.csv", header=1, index=0, encoding='utf_8_sig')
我的是python2 好像不支持 我直接去csv里改编码了
谢谢回复
name.append(word.encode('utf8'))把这种encode去掉就行了
收到 谢谢🙏🏼
在2020年05月30日 11:06,liyang0 写道:
name.append(word.encode('utf8'))把这种encode去掉就行了
—
You are receiving this because you commented.
Reply to this email directly, view it on GitHub, or unsubscribe.