如何筛选出excel表中重复数据,python筛选出重复数据

  如何筛选出excel表中重复数据,python筛选出重复数据

  要求

  前段时间有个朋友问能不能写个脚本,快速从execl表单中分离出重复数据和非重复数据。想想看,好像python实现起来更快。我花了一段时间写了下面的脚本。

  准备环境

  Python版本:3.6.2

  用python3.6写的,用python2.7的话应该是兼容的。

  如果您使用python2.7,记得在文件前面加上前缀

  # -*-编码:utf-8 -*-

  否则文件中的中文会报错,所以推荐Python3。

  开发环境:Archlinux

  在Linux下开发测试,但在windows下运行应该没问题。

  包装:xlrd xlwt

  Xlrd用于读取execl表中的数据;Xlwt用来写execl文件。直接用pip install安装即可。

  pip安装xlrd

  Pip xlwt代码

  必需的模块

  获取重复的行号。

  将它写入文件。

  主功能运行处理

  地址:3359gitee.com/jalright/scripttodo/blob/master/unique _副本. py

  (标题里的代码格式会比较乱,放这里吧)

  施用方式

  例如:1.xlsx

  将代码保存为unique_duplicate.py,输入终端或dos。

  python唯一_重复. py 1.xls

  生成结果:

  如果需要比较指定的列,请在文件名后指定(如果只指定第一列,则比较第一列到最后一列的数据)。

  比较第二列之后的数据

  python唯一_重复. py 1.xls 2

  比较第二列和第五列的数据:

  python unique _ duplicate . py1 . xls 2 5摘要

  起初,脚本只是直接比较一整行数据。后来朋友要求越来越多,然后代码越来越长。想找时间修改一些,写一些备注之类的,然后就没时间了。如果我有时间复习,反正我可以用。

  一点点积累会让你走得更快!

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: