[已解决] 求助各位了,关于用Power Query抓取网页数据的问题

  [复制链接]
查看225174 | 回复171 | 2021-2-18 19:32:20 | 显示全部楼层 |阅读模式
数据抓取的情景是这样的,以网址 https://wayougou.com/stock/000001/市盈率/市盈率 为例,这个网页有近十年、近七年、近五年、近三年的子页面,同时下方又有 指标统计、数据详情两个不同的表格数据
现在想用Power Query抓取 同时满足 近七年+数据详情 的那个表格的数据,发现网址不变,请教各位大神,这种情况下怎么处理呢?

目前用的语句是 Web.Page(Web.Contents("https://wayougou.com/stock/"&[代码]&"/市盈率/市盈率"))
10850111524501.png

另外还有两个小问题:
1、能在抓取时,间隔几秒钟再抓取下一条数据吗?

2、用power query抓取该网站的其他网址时时,发现有些网页,比如https://wayougou.com/index/000001/市盈率/市盈率,这时候导航器中没有显示出Table。尝试用Excel自带的 数据-自网站 功能导入这个网址的数据,也是无法导出,而是弹出“当前页面的脚本发生错误”的提示,这种情况该怎么解决呢?
10850111524502.png
10850111524503.png

多谢!
回复

使用道具 举报

想退定的人 | 2021-2-18 19:38:20 | 显示全部楼层
链接都没找对,给你两个链接参考下。里面也有说怎么控制抓取时间的。
https://pqfans.com/2230.html
https://pqfans.com/207.html
回复

使用道具 举报

37度3 | 2021-2-18 19:45:21 | 显示全部楼层
链接都没找对,给你两个链接参考下。里面也有说怎么控制抓取时间的。
https://pqfans.com/2230.html
http ...


根据里面的方法,找到的链接是https://wayougou.com/api/ratios/stock?code=601939&name=股息&chart=股息率&span=7,但是之后的操作,使用Json.Document解析,以及使用Table.FromReocrds还原成表,这两步还是不会,能讲解下接下来怎么操作吗
回复

使用道具 举报

力仔 | 2021-2-18 19:48:21 | 显示全部楼层
自顶,求高手解答
回复

使用道具 举报

麦兜 | 2021-2-18 19:52:21 | 显示全部楼层
选中Document表,点左边那个web视图,看是显示什么?
回复

使用道具 举报

┋黑洞└ | 2021-2-18 19:59:21 | 显示全部楼层
右边那个web视图,说错了
回复

使用道具 举报

kenzo | 2021-2-18 20:04:22 | 显示全部楼层
https://pqfans.com/catalog 学习pQ的好网址
回复

使用道具 举报

cool | 2021-5-27 17:35:49 | 显示全部楼层
无论是不是沙发都得回复下
回复

使用道具 举报

二少 | 2021-6-18 10:03:00 | 显示全部楼层
元芳你怎么看?
回复

使用道具 举报

车迷 | 2021-7-18 18:56:03 | 显示全部楼层
沙发???
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则