python 写入csv 文件显示乱码,python的read_csv中文乱码

  python 写入csv 文件显示乱码,python的read_csv中文乱码

  Python编码格式导致csv读取错误(csv.reader,pandas.csv_read),有很好的参考价值。希望对你有帮助。如有错误或不足之处,请不吝赐教。

  

目录
python编码格式导致csv读取错误。熊猫阅读csv的常见错误及其解决方法1)第一个错误2)第二个错误

  

python编码格式导致csv读取错误

  本文记录了python小白今天遇到的这两个问题(csv.reader和pandas.csv_read):

  Pandas模块“cparserror:标记数据时出错。c error:第4行需要1个字段,请参见2”错误

  csv模块中的错误“行包含空字节”

  今天疏忽了对数据的处理,偷懒把数据复制到xlsx保存。之后我直接把文件后缀修改成了。csv用于阅读。之后运行算法读取数据时,问题真的来了。

  进口熊猫作为pd

  path=water30.csv

  df=pd.read_csv(路径)

  注意:最后两行可以写成df=pd.read_csv(water30.csv )。

  但是由于read_csv本身有很多参数(虽然这里没有用到),所以还是写成path比较好。

  这将报告一个错误CPARSERERERROR 3360错误标记数据。c错误3360在第4行,SAW2中需要1个字段

  我在网上查了很多解决方案。因为read_csv的参数很多,各有各的词。我在这里遇到的应该只是其中之一,但是找了很久都没有找到。直到我在这里看到,看了module _csv.c的代码后,发现文件中不可能有“\0”,所以csv文件不可能是unicode编码,而是ANSI。

  直接更改后缀名称的结果是,当我单击该名称时,系统会提示我。csv打开它:

  也就是说,在这里更改后缀并没有得到正确的文件格式。所以我选择了“另存为”并将文件格式改为

  之后,读数不会报错。

  注意:有一个未解决的问题,即。我通过“直接改后缀”得到的csv。我用记事本打开检查了一下。代码是ANSI。然后不知道为什么报错了.但问题暂时解决了。

  现在读取的格式是

  这是一种结构。

  另外,对于:csv模块“行包含空字节”错误。上述问题的原因和解决方法是相同的,如

  导入csv

  csvfile=file(water30.csv , rb )

  reader=csv.reader(csvfile)

  对于reader:中的行

  打印行

  csvfile.close()

  错误:错误:行包含空字节

  校正后,读取的数据格式如下表所示

  [1, 2, 2, 1, 2]

  [1, 1, 1, 2, 2]

  [1, 2, 1, 1, 1]

  [1, 1, 1, 1, 2]

  [1, 1, 1, 2, 2]

  [1, 1, 1, 2, 2]

  [0.697, 0.744, 0.634, 0.403, 0.481]

  [0.46, 0.376, 0.264, 0.237, 0.149]

  [1, 1, 1, 1, 1]

  

pandas读取csv常见错误及解决

  

1)第一种错误

  错误提示:

  pandas.errors.ParserError:标记数据时出错。c错误:在第121行需要1个字段,但看到2个

  解决方法:

  进口熊猫作为pd

  data=pd.read_csv(inputfile,encoding=utf-8 ,header=None,sep=\t )

  

2)第二种错误

  错误提示:

  pandas.errors.ParserError:标记数据时出错。C error:从第15945行开始的字符串中的EOF

  解决方法:

  进口熊猫作为pd

  导入csv

  df=pd.read_csv(csvfile,quoting=csv。QUOTE_NONE,encoding=utf-8 )

  以上个人经验,希望给你一个参考,也希望你能支持盛行的IT软件开发工作室。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: