本文介绍怎么使用python编写爬虫爬取bgp.he.net的数据
1  | #!/usr/bin/env python  | 
输出结果:
1  | 
  | 
发现无法直接访问
对其中的js代码混淆进行解密http://www.dejs.vip/index.html
得到
1  | function printerror() {  | 
用burpsuite查看网络连接









可以看见一次发起如下请求:
1  | GET /search?search[search]=ChinaNet&commit=Search 设置path的cookie  | 
分析p和i参数的生成:
1  | function printerror() {  | 
经测试jstest使用的是md5算法
1  | p: md5(cookie["path"])  | 
编写代码
1  | from urllib import parse  |