爬虫爬取基金数据,python获取基金数据

  爬虫爬取基金数据,python获取基金数据

  本文主要介绍python爬虫获取的资金列表。python爬虫是收集数据最直接、最常用的方法,可以利用Python爬虫获取大量数据。下面介绍更多相关内容,有需要的可以参考一下。

  00-1010 1前言2从哪里获取数据3如何抓取数据?

  

目录

  Python爬虫是收集数据最直接、最常用的方法。python爬虫可以用来获取大量数据,非常简单快捷。大部分网站都是使用模板开发,使用的模板可以快速生成大量布局相同内容不同的页面。这时候只需要为一个页面开发一个爬虫就可以了,因为爬虫也可以抓取同一个模板生成的不同内容。

  

1 前言

  给大家准备好了,打开这个连接,就能找看到对应的基金信息:.

  http://fund.eastmoney.com/jzzzl.html

  有了资金连接,我们要做的就是怎么把它弄下来。从123开始,我偶然发现了后台访问的接口。是不是很神奇?是时候上图了,,大家可以看到如下图:?

  #这是原始连接

  http://fund.eastmoney.com/Data/Fund_JJJZ_Data.aspx?lx=1sort=zdf,descpage=2,200onlySale=0

  #在我用postman删除了一些参数后,发现简化的连接如下,忍不住吐槽一下。此时仍有参数以中文首字母传递。

  # lx显然是type的缩写。排序就是对一些可以忽略的字段进行排序。如果有页面,2200是第二页,每页200页。onlySale是可以出售的条件。

  http://fund.eastmoney.com/Data/Fund_JJJZ_Data.aspx?lx=1sort=zdf,descpage=2,100onlySale=0

  

2 哪里去获取数据呢

  我们这里用的是python,需要安装的类库是Requests/DemJSON/Pretty Table/JSON。是不是特别简单?

  #安装命令如下

  #发起请求

  pip安装请求

  #将不太严格的json格式转换为json

  pip安装demjson

  #格式化打印数据

  pip安装表

  #将json格式的文本转换为json

  pip安装json

  我可以在这里上传代码。简单的逻辑就是先抓取api接口返回的信息,然后解析消息,将返回的结果转换成json格式,只选择需要获取的内容,最后输出获取的结果。

  导入请求

  导入json

  导入demjson

  从漂亮的桌子进口漂亮的桌子

  #数据表的列表头字段

  title_list=[code , name , value]

  #查询基金列表信息

  定义查询_资金_列表(page=1):

  req _ URL= http://Fund . eastmoney.com/Data/Fund _ JJJZ _ Data . aspx?lx=1sort=zdf,descpage={},20onlySale=0 。格式(页面)

  response=requests.get(请求url)

  #输出响应标题

  #打印(response.headers)

  #获取请求的结果并替换它,否则结果不能格式化为json

  resp _ body=response . text . replace( var db=,)

  #本来首选这个json,因为json不支持像{a :1}这样的转换,所以用了demojson。

  # JSON _ data=JSON . loads(resp _ body)

  #将对象转换为json对象,将不规则的json格式化为json对象。

  resp _ body=demjson . decode(resp _ body)

  #获取结果数组

  fund_list=resp_body[datas]

  body_list=[]

  对于fund_list:中的节点

  tmp=[]

  tmp.append(节点[0])

  tmp.append(节点[1])

  tmp.append(节点[3])

  body_list.append(tmp)

  #创建一个对象PrettyTable来打印输出结果。

  bt=PrettyTable()

  #将标题信息放入bt

  bt.field_names=title_list

  #将表格内容放入bt中

  bt.add_rows(body_list)

  #打印结果

  打印(bt)

  if __name__==__main__:

  #此处只打印第一页,不写循环打印结果。每个人都会。

  查询_资金_列表(1)

  最终输出的结果如图所示 :

  我们最终达到的结果就是这样一个结果。有了这些结果,我们就可以把它们以结构化的方式存储起来,放入数据库供查询和使用。

  代码基金名称最新净值005585银河文体混合1.6363001907 SDIC瑞银灵活配置混合A3.3055001908 SDIC瑞银灵活配置混合C3.1667164818工银中证传媒指数(LOF)A0.9231............后续会抓取基金的基本信息和变动信息,建立模型展示。

  这就是这篇关于Python爬虫收购基金名单的文章。有关Python收购列表的更多信息,请搜索热门IT软件开发工作室之前的文章或继续浏览下面的相关文章。希望你以后能支持风行IT软件开发工作室!

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: