python合并csv文件,并利用结果进行计算,python csv文件处理

  python合并csv文件,并利用结果进行计算,python csv文件处理

  由于项目检索的需要,需要将两个不同的csv文件合并为一个文件,所以下面文章主要介绍用python合并csv文件的相关信息。通过示例代码介绍的非常详细,有需要的朋友可以参考一下。

  00-1010 1.用concat方法合并csv2。Glob模块批量合并csv补充:Python处理(加载、合并)多个CSV文件摘要

  

目录

  通过熊猫的read_csv和to_csv合并两个完全相同的csv文件的数据,即采用concat方法:

  #加载第三方库

  进口熊猫作为pd

  将numpy作为np导入

  #读取文件

  Df1=pd.read_csv (file -1.csv )

  Df2=pd.read_csv (file -2.csv )

  #合并

  df=pd.concat([df1,df2])

  Df.drop_duplicates() #重复数据删除

  #保存合并的文件

  Df.to_csv (file.csv ,编码= UTF-8 )

  您还可以添加一列标签来区分两个合并的数据:

  #加载第三方库

  进口熊猫作为pd

  将numpy作为np导入

  #读取文件

  Df1=pd.read_csv (file -1.csv )

  1 [来自文件]=文件-1

  Df2=pd.read_csv (file -2.csv )

  2 [来自文件]=文件-2

  #合并

  df=pd.concat([df1,df2])

  Df.drop_duplicates() #重复数据删除

  #保存合并的文件

  Df.to_csv (file.csv ,编码= UTF-8 )

  

1.用concat方法合并csv

  用合并几个文件时,可以使用上面的concat方法。而当需要合并大量相同的文件时,此时应该进行批量合并,这样可以减少工作量,提高操作效率。

  使用Python批量合并csv,这里介绍的方法是引入glob模块。

  Glob模块是最简单的模块之一,内容不多。它可以找到符合特定规则的文件路径名。

  用glob方法遍历所有文件,读取数据并另外保存在文件中。

  将numpy作为np导入

  进口熊猫作为pd

  导入全球

  进口re

  csv_list=glob.glob(*。CSV’)

  打印(找到%s个CSV文件“% len(csv_list))

  打印(正在处理..)

  对于csv_list:中的I

  fr=open(i, r ,编码=utf-8 )。阅读()

  With (file collection.csv , a ,encoding= utf-8 )为f:

  f.write(法国)

  打印(“合并完成!”)

  上面的方法是合并csv文件,excel文件也是一样。

  

2.glob模块批量合并csv

  数据集介绍:这个数据集是一个化学系统的数据,总共有很多个月。我这里取一个月的数据集,August _ data(8月数据集),共31个csv文件。

  方法一遍历OS。listdir(目录路径)[用于tqdm]操作系统中的文件。path.join(路径,文件)

  进口熊猫作为pd

  将numpy作为np导入

  从tqdm导入tqdm

  导入操作系统

  def get_data(路径):

  df_list=[]

  对于tqdm中的文件(os.listdir (path)) : # #进度条

  file_path=os.path.join(路径,文件)

  df=pd.read_csv(文件路径)

  df_list.append

  df=pd.concat(df_list)

  返回df

  cPath=。\八月_数据

  # cpath= f :/BaiduneDiskDownload/宁东电厂数据及分析要求/宁东脱销系统优化-上海交通大学/SCR数据-2020年1月/8月数据 # f :/BaiduneDiskDownload/宁东电厂数据及分析要求/宁东脱销系统优化-上海交通大学/SCR数据-2000

  # uPath=str(cPath)# uPath=unicode(cPath, utf-8 )

  # dirs=os.listdir(TEST_PATH)

  #打印(目录)

  test_df=get_data(cPath)

  print(test_df.head())

  # test _ df . to _ CSV(path _ or _ buf= test . CSV ,index=false) #另存为CSV文件

  方法二滴法

  #!/usr/bin/env python

  #编码=utf-8

  导入全球

  导入时间

  导入csv

  进口熊猫作为pd

  从tqdm导入tqdm

  #一个新文件

  #打开所有CSV文件

  #遍历文件夹下的所有csv文件

  TEST_PATH=。\八月_数据

  CSV _ list=glob . glob(f“{ TEST _ PATH } \ *。CSV’)

  打印(有%s个CSV文件 % len(csv_list))

  #打印(csv_list)

  def获取数据():

  df_list=[]

  对于csv_list:中的csv_file

  df=pd.read_csv(csv_file)

  df_list.append

  df=pd.concat(df_list)

  打印(“加载Oer”)

  返回df

  get_data()

  

补充:Python处理(加载、合并)多个csv文件

  这就是这篇关于用python合并csv文件的文章。关于用python合并csv文件的更多信息,请搜索热门IT软件开发工作室之前的文章或者继续浏览下面的相关文章。希望大家以后多多支持热门IT软件开发工作室!

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: