[已解决] PQ网抓,页码变动网址不变

  [复制链接]
查看144866 | 回复138 | 2020-9-25 01:49:29 | 显示全部楼层 |阅读模式
目标网址:http://data.eastmoney.com/hsgtcg ... 9%u9650%u516C%u53F8
共有25页,但无论翻到哪一页,都是这个网址,如何用PQ来获取这25页的数据呢?  另外,假定以后是26页或24页,还能正常获取吗?
请帮我写写代码,不胜感激!
回复

使用道具 举报

蓝精灵 | 2020-9-25 01:58:29 | 显示全部楼层
let
  源 = Web.Page(Web.Contents("http://data.eastmoney.com/hsgtcg/InstitutionHdDetail.aspx?jgCode=B01590&date=2020-03-06&jgName=%u76C8%u900F%u8BC1%u5238%u9999%u6E2F%u6709%u9650%u516C%u53F8")),
  Data0 = 源{0}[Data]
in
  Data0


同样疑问,只找到了第一页链接,其他页的页数变量不知藏哪了,难道是%后面这些16进制的数字里慢慢找?
回复

使用道具 举报

宇文寒涛 | 2020-9-25 02:03:30 | 显示全部楼层
let
  源 = Web.Page(Web.Contents("http://data.eastmoney.com/hsgtcg/InstitutionHdDetail.aspx?jgCod ...


不是,我只知道大概思路,按F12,在里面找,好象在WORD里面找参数。还请大佬大神们帮帮俺。
回复

使用道具 举报

阿汤哥 | 2020-9-25 02:07:30 | 显示全部楼层
这个要学习网页抓包的,点击第二页 会有个转跳 抓包网址为:http://dcfm.eastmoney.com//em_mu ... 9eca5&st=HDDATE,SHAREHOLDPRICE&sr=3&p=2&ps=50&js=var LldsZJcr={pages:(tp),data:(x)}&filter=(PARTICIPANTCODE='B01590')(MARKET in ('001','003'))(HDDATE=^2020-03-06^)&type=HSGTNHDDET&rt=52800859
其中 &p=2&  就是你要转跳的页码,
再看返回数据:var LldsZJcr={pages:25,data:[{"HDDATE":"2020-03-06T00:00:00","HKCODE":"1000320592","SCODE":"603658","SNAME":"安图生物","PARTICIPANTCODE":"B01590","PARTICIPANTNAME":"盈透证券香港有限公司", 。。。。。后面的省略

其中{pages:25 就是页码总数,
给你提供思路了,具体 PQ 中怎样写,我还真不知道了
回复

使用道具 举报

半支烟 | 2020-9-25 02:11:30 | 显示全部楼层
怎么不能显示?违规了?
用抓包工具查看,有个转跳网址如下
http://dcfm.eastmoney.com//em_mu ... 9eca5&st=HDDATE,SHAREHOLDPRICE&sr=3&p=2&ps=50&js=var LldsZJcr={pages:(tp),data:(x)}&filter=(PARTICIPANTCODE='B01590')(MARKET in ('001','003'))(HDDATE=^2020-03-06^)&type=HSGTNHDDET&rt=52800859
其中&p=2&就是转跳到第2页,返回源码中的 var LldsZJcr={pages:25,  就是最大页码数
回复

使用道具 举报

zyzjy | 2021-5-17 10:08:38 | 显示全部楼层
努力学习中
回复

使用道具 举报

小彭 | 2021-6-19 19:26:03 | 显示全部楼层
高手云集 果断围观
回复

使用道具 举报

wds | 2021-6-30 18:52:39 | 显示全部楼层
我也来支持一下,这里的老师和其他机构不一样,其他就是让付费。
回复

使用道具 举报

86298688 | 2021-7-4 20:06:33 | 显示全部楼层
支持,楼下的跟上哈~
回复

使用道具 举报

zihan | 2021-8-21 15:33:05 | 显示全部楼层
努力学习中
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则