百度网盘关了外链采集接口,如何采集百度网盘外链? 采集各大网盘搜索引擎


1.使用谷歌自动义搜索。但谷歌咱访问不了。

2.但有些人能访问,VPN或在国外等,这些网盘搜索引擎有钱搞,那我就采集他们网站的。通过爬虫爬各大网盘搜索引擎。

3.通过爬虫爬其它大量分享的。

演示:文件搜wjsou.com 数据采集于各大网盘搜索引擎,并删去失效的。

下面就来试试

1.获得搜索关键词:通过百度风云排行榜获得,还可以通过各大网盘搜索引擎的首页获得。

2.各大网盘搜索引擎为了SEO,一般加几个子网面。但都有固定的结构,这样就好办了。

3.通过最终网盘链接页提取数据。文件名,链接,文件大小,文件类型,分享时间,是否有效等



倒着来说

1.通过最终网盘链接页提取数据。

要采集的示例:https://pan.baidu.com/share/link?uk=2433762860&shareid=2999758878

源码:右键查看源码

文件名name 正则表达式:<title>(?<name>.*)_免费高速下载\|百度网盘-分享无限制</title> 

说明链接是有效的。


发现源码里没有文件大小,那应该是动态获得的。

相关文章
相关标签/搜索