python提取html内容,python网页文本分析和提取

  python提取html内容,python网页文本分析和提取

  选择目录的内容。

  在浏览器中点击工具-开发者工具或者直接按F12找到元素,在控制台Console中输入代码提取表格内容,选择表格元素表(下图为选中状态),在控制台Console中输入代码。

  var tbody=$ 0;//获取刚才点击鼠标选中的窗体var trArr=tbody.children//表的所有子节点for(var I=0;i tbody.childElementCountI){ var tr=trArr[I];//var tdArr=tr . I 1行的tr.children//获取这行var a=tdArr[0]的单元格列表。innerText//第一列(扩展)var b=tdArr[1]。innerText//第二列var c=tdArr[2]。innerText//第三列console.log(行数:% d% s% s ,i 1,a,b,c);} var结果=“”;var tbody=$ 0;//获取刚才点击鼠标选中的窗体var trArr=tbody.children//表的所有子节点for(var I=0;i tbody.childElementCountI){ var tr=trArr[I];//var tdArr=tr . I 1行的tr.children//获取这行var a=tdArr[0]的单元格列表。innerText//第一列(扩展)var b=tdArr[1]。innerText//第二列var c=tdArr[2]。innerText//第三列result=` $ { a } $ { b } $ { c } \ n}console.log(结果);//一次性打印提取的数据

  参考资料

  使用JavaScript从网页中提取表格的行和列数据。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: