Python中出现文本乱码如何解决-编程语言-互联网-天达云

Python中出现文本乱码如何解决
更新：HHH 时间：2023-1-7

今天就跟大家聊聊有关Python中出现文本乱码如何解决，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。

在处理utf8文本格式的时候，由于这些文本是含BOM(byte order mark)的utf8文本，编译时产生一个Error，”UnicodeEncodeError: ‘gbk’ codec can’t encode character u’\ufeff’ in position 0: illegal multibyte sequence”

原来，某些软件，如notepad，在保存一个以UTF-8编码的文件时，会在文件开始的地方插入三个不可见的字符（0xEF 0xBB 0xBF，即BOM）。因此我们在读取时需要自己去掉这些字符，Python中的codecs module定义了这个常量：

查看源代码打印帮助

import codecs   data = open("Test.txt").read()   if data[:3] == codecs.BOM_UTF8:   datadata = data[3:]   print data.decode("utf-8")

看完上述内容，你们对Python中出现文本乱码如何解决有进一步的了解吗？如果还想了解更多知识或者相关内容，请关注天达云行业资讯频道，感谢大家的支持。


返回编程语言教程...

新手上路

产品管理

支付方式

关于我们