python下载视频,python腾讯视频

  python下载视频,python腾讯视频

  我学习Python爬虫已经很久了。为了加强学习过程,为以后的学习留下一些痕迹,我在此记录下整个爬虫过程。以电影天堂为例,提取当前界面的最新电影。

  # -*-编码:utf-8 -*-

  导入urllib2

  导入操作系统

  进口re

  URL= 3358 www.dy2018.com/html/gndy/dyzz/index.html #这是电影天堂最新电影的网站。

  conent=urllib2.urlopen(url)

  conent=conent.read()

  Ent=cone.decode (gb2312 , ignore )。编码( utf-8 , ignore) #以避免中文乱码

  f=打开( conent.txt , w )

  f.write(内容)

  f.close()

  产生的context.txt文件是

  电影《天堂》,浏览器打开后的F12界面,看起来如下图。(本文档有1126行)

  初步过滤,过滤出586行:

  pattern=re.compile(。*?(.*?)items=re.findall (pattern,conent) #先选择包含最新电影的网页代码,再进行下一次放映。

  str=“”。加入(项目)

  f=打开( str.txt , w )

  f.write

  f.close()

  进一步过滤和提取:

  pattern=re.compile((。*?)’,re。s)

  news=re.findall(pattern,str)

  f=打开( movie.txt , w )

  对于新闻中的j:

  f.write(j[1] \n )

  f.close()

  好了,你完成了!

  所有代码如下:

  # -*-编码:utf-8 -*-

  导入urllib2

  导入操作系统

  进口re

  URL= 3358 www.dy2018.com/html/gndy/dyzz/index.html #这是电影天堂最新电影的网站。

  conent=urllib2.urlopen(url)

  conent=conent.read()

  conent=conent.decode(gb2312 , ignore )。编码(“utf-8”、“忽略”)

  #这个‘忽略’差点忘了。主要是编码,忽略了一些可以忽略的参数。下午从来没想到过,它总是出错。

  f=打开( conent.txt , w )

  f.write(内容)

  f.close()

  pattern=re.compile(。*?(.*?)items=re.findall (pattern,conent) #先选择包含最新电影的网页代码,再进行下一次放映。

  str=“”。加入(项目)

  f=打开( str.txt , w )

  f.write

  f.close()

  pattern=re.compile((。*?)’,re。s)

  news=re.findall(pattern,str)

  f=打开( movie.txt , w )

  对于新闻中的j:

  f.write(j[1] \n )

  f.close()

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

相关文章阅读

  • 腾讯视频扫描二维码在哪,腾讯视频扫一扫二维码在哪里找
  • python腾讯视频,python在线视频播放
  • 腾讯视频转换成常见的MP4视频格式,腾讯视频怎么转换成mp4格式
  • python访问腾讯文档,python抓取腾讯视频
  • 腾讯视频无法打开是什么原因,腾讯视频打不开怎么回事-
  • 腾讯视频vip和腾讯体育vip通用吗,腾讯视频vip包括腾讯体育么
  • 腾讯视频怎么调,腾讯视频怎么改模式
  • ipad 腾讯视频 儿童模式,ipad的腾讯视频怎么设置青少年模式
  • 腾讯笔试必须参加吗,腾讯视频专员笔试
  • 腾讯视频怎么登陆别人的会员账号,腾讯视频怎么登录别人的会员手机号
  • 云视听极光属于腾讯视频吗,云视听极光和极光tv是一样的吗
  • 腾讯视频登录别人的会员账号方法一样吗,腾讯视频登录别人的会员账号方法怎么改
  • 腾讯视频学生身份认证,腾讯视频怎么进行学生认证
  • 腾讯视频设置本机为主设备,腾讯视频怎么修改设置主设备
  • 微信看一看怎么打开看不到视频,微信看一看怎么打开腾讯视频
  • 留言与评论(共有 条评论)
       
    验证码: