关于乱码问题

Question

mikiihuang opened this issue 6 years ago · comments

大佬您吼~~我按照您word2vec+聚类的代码跑了一遍，但是输出的csv文件的关键词一直存在着编码的问题，key那一列对应的是b"b'\xe8\x8d\xaf\xe7\x89\xa9' b'\xe5\x..这种格式，不知道您有没有好的建议可以修改？

yumihuang · Answer 1 · Thu Apr 12 2018 13:44:43 GMT+0800 (China Standard Time)

哈哈哈哈哈我改好啦~~~谢谢大佬的代码啦~~(#^.^#)

Shaw Wang · Answer 2 · Mon Jul 16 2018 18:46:55 GMT+0800 (China Standard Time)

可以分享一下解决方法吗？

Liu Jia · Answer 3 · Mon Nov 26 2018 14:38:15 GMT+0800 (China Standard Time)

哈哈哈哈哈我改好啦~~~谢谢大佬的代码啦~~(#^.^#)

我也一样遇到这个问题了,请问怎么解决的?

yumihuang · Answer 4 · Mon Nov 26 2018 21:23:33 GMT+0800 (China Standard Time)

哈哈哈哈哈我改好啦~~~谢谢大佬的代码啦~~(#^.^#)

我也一样遇到这个问题了,请问怎么解决的?

具体改的哪里我记不清了，还是中文编码的问题，看一下那个读取的csv文件是什么编码方式，然后找代码里哪里读入的，你可以在读入的时候打印一下是不是这个时候就变成乱码了，然后一点一点的改。

xiamaojin · Answer 5 · Wed Dec 05 2018 13:53:27 GMT+0800 (China Standard Time)

把里面的encode都给去了就好了，楼主的是2.7的版本

liyang0 · Answer 6 · Sat May 30 2020 11:05:16 GMT+0800 (China Standard Time)

name.append(word.encode('utf8'))把这种encode去掉就行了

KMDing · Answer 7 · Wed Dec 23 2020 15:28:33 GMT+0800 (China Standard Time)

name.append(word.encode('utf8'))把这种encode（‘utf8’）去掉就okok