python数据清洗步骤,利用python数据清洗常用函数

  python数据清洗步骤,利用python数据清洗常用函数

  python操作excel的同时,上一篇文章讲了数据读取、插入和简单分析,还有一个很重要的点就是数据清洗。什么是数据清洗?说白了就是去除数据文本中的垃圾值,比如对已有空值、冗余空格、数据格式等的处理。

  相关免费学习推荐:python视频教程

  00-1010 #导入熊猫库导入熊猫为pd# read_excel()读取excel数据# DataFrame()将读取的数据转换为data frame data df=PD . data frame(PD . read _ excel( data . xlsx ))

1,导入 python 库、读取 excel 数据
# dropna()函数删除df数据表中所有为空值的行。df.dropna(how=any)# mean()函数计算年龄字段所在列的平均值。age_pre=df[age]。mean()#用fillna()函数填充空值,将age_pre的值填入df [age]内部的值。fillna (age _ pre)
2,数据清洗(去除空值)
#清除字段df [name]=df [name]中的空格。map (str.strip)
3,数据清洗(清除字段中的空格)
# rename()重命名函数列df。rename(columns={ name 3360 name _ new })
4,数据清洗(对某个列进行重命名)
#从前到后查找一列中的重复值,如果存在,清除重复值df[name]。drop_duplicates()#从后向前查找一列中的重复值,如果存在,清除前面的重复值df [city]。drop _ duplicates (keep= last) #。这两种重复值完全替换了df [name]列中的特定值。替换( Lao ,LWSBC )相关免费学习推荐:,python教程以上是python操作excel系列中数据清洗的详细内容。更多信息请关注盛行IT软件开发工作室的其他相关文章!

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: