pandas如何读取含有中文的excel-IT俱乐部

pandas读取含有中文的excel

在读取含有中文的 Excel 文件时，需要使用 encoding 参数设置编码方式。

常用的编码方式有 ‘gbk’ 和 ‘utf-8’。

示例代码：

import pandasas pd
  
# 读取含有中文的 Excel 文件
df = pd.read_excel('filename.xlsx', encoding='gbk')

如果读取过程中出现乱码，可以尝试更换编码方式。

pandas读取excel时遇到的编码问题 unknown_codepage_21010

最近在使用pandas读取不规则excel表时遇到了一种编码问题，自己找了好久资料也是终于综合了一下解决了这种编码异常的问题。

首先呢，报错会提示 下面这种错误：

unknown encoding: unknown_codepage_21010

自己在找资料的时候看到一篇很早在git上发布的一篇文章，意思就是让直接明确将编码设置好，具体可以看一下git链接

https://github.com/okfn/messytables/issues/47

最后呢，自己改了一个源文件里的东西，其实也不知道是不是正确的，但是这个问题却解决了，所以分享出来，也算是为自己记录一下，以防以后再次遇到这个问题，又得找半天。

找到xlrd的__init__.py文件，在 open_workbook 模块中将encoding_override的值明确为”cp1252″，其实具体这样做的原因就是将编码明确，使得可以识别这种异常编码。

def open_workbook(filename=None,
                  logfile=sys.stdout,
                  verbosity=0,
                  use_mmap=USE_MMAP,
                  file_contents=None,
                  encoding_override="cp1252",
                  formatting_info=False,
                  on_demand=False,
                  ragged_rows=False):

这样问题就成功解决了~

总结

以上为个人经验，希望能给大家一个参考，也希望大家多多支持IT俱乐部。

IT俱乐部

pandas如何读取含有中文的excel

目录

pandas读取含有中文的excel

pandas读取excel时遇到的编码问题 unknown_codepage_21010

总结

联系我们

微信扫一扫关注我们

微信扫一扫：分享

目录

pandas读取含有中文的excel

pandas读取excel时遇到的编码问题 unknown_codepage_21010

总结

微信扫一扫：分享

相关推荐

联系我们

微信扫一扫关注我们