本文介绍怎么使用python编写爬虫爬取bgp.he.net的数据
1 | #!/usr/bin/env python |
输出结果:
1 |
|
发现无法直接访问
对其中的js代码混淆进行解密http://www.dejs.vip/index.html
得到
1 | function printerror() { |
用burpsuite查看网络连接
可以看见一次发起如下请求:
1 | GET /search?search[search]=ChinaNet&commit=Search 设置path的cookie |
分析p和i参数的生成:
1 | function printerror() { |
经测试jstest使用的是md5算法
1 | p: md5(cookie["path"]) |
编写代码
1 | from urllib import parse |