xml报文中文乱码,python解决中文乱码

  xml报文中文乱码,python解决中文乱码

  用大蟒解析可扩展标记语言文件,出现异常信息如下:

  XML。解析器。外籍人士。expat错误:格式不正确(无效令牌):第13行,第31列相关推荐: 《Python入门教程》

  解决方式:

  将文件重新编码成utf-8格式就可以了。

  在Linux操作系统操作系统下一种取巧的解决方式:

  对于中文,这里选了一种取巧的方法。即先通过编码转换命令将可扩展标记语言文件变成utf-8格式,然后将可扩展标记语言中指定编码格式的内容去掉即可。

  可参考如下代码:

  cmd= iconv 文件名-t utf-8 utf。 tmp

  操作系统(cmd)

  utf_filename=utf.tmp

  f=打开(utf _文件名)

  data=f.read()

  f.close()

  操作系统( rm-futf.tmp )

  #-deletetheencodetypeinxmlfile-

  #result=re.sub(regex,newstring,subject)

  数据=数据。替换( encoding= GB 2312 ,)

  数据=数据。替换( encoding= GB 2312 ,)

  #self.dom.unlink

  自我。DOM=XML。多姆。迷你王国。解析字符串(数据)

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: