巧用百度 APP 代理规避网站反爬-Blogᒼ

爬虫是一种程序，它可以自动地访问网站并抓取数据。但是，如果爬虫发送的请求过于频繁，服务器可能会将其 IP 地址屏蔽，这就需要使用代理 IP 来访问，然而高质量的代理 IP 价格通常较贵。因此，我们可以使用百度 APP 的代理进行数据抓取。

代理 IP 信息：

HOST: cloudnproxy.baidu.com
PORT: 443

需要注意的是，百度代理会校验 User-Agent。因此，我们需要在正常的 User-Agent 后面追加 baiduboxapp/13.10.0.10。有些实现会要求在 Headers 中添加 X-T5-Auth，但经过测试，这个 key 其实是不必要的。

代码实现

import requests


def send_request_via_proxy(*args, **kwargs):
    baidu_proxy = 'cloudnproxy.baidu.com:443'
    kwargs['proxies'] = {'http': baidu_proxy, 'https': baidu_proxy}
    if 'headers' not in kwargs:
        kwargs['headers'] = {}
    if 'User-Agent' not in kwargs['headers']:
        kwargs['headers']['User-Agent'] = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 ' \
                                          '(KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36'

    kwargs['headers']['User-Agent'] += ' baiduboxapp/13.10.0.10'
    # kwargs['headers']['X-T5-Auth'] = '196289709'
    resp = requests.request(*args, **kwargs)
    return resp


if __name__ == '__main__':
    api = 'https://pubstatic.b0.upaiyun.com/?_upnode'
    ip_info = send_request_via_proxy('GET', api).json()
    print(ip_info['remote_addr'])
    print(ip_info['remote_addr_location'])

运行代码，可以看到我们的 IP 地址已经变成了百度的代理 IP 地址

$ python3 proxy-test.py
180.101.81.32
{'country': '中国', 'isp': '电信', 'province': '江苏', 'continent': '亚洲', 'city': '苏州'}

每次请求的出口 IP 随机，这样就可以避免被服务器屏蔽了。

代理 IP 池

使用 ping 命令，可以获取多个地点的入口 IP，但是出口 IP 仍然是随机的，这点需要注意。

220.181.7.1  中国北京电信
220.181.33.174  中国北京电信
220.181.111.189  中国北京电信
180.97.93.202  中国江苏苏州 电信
180.97.104.168  中国江苏南京 电信
14.215.179.244  中国广东广州 电信
157.0.148.53  中国江苏苏州 联通
153.3.236.22  中国江苏南京 联通
110.242.70.69  中国河北保定 联通
110.242.70.68  中国河北保定 联通
157.255.78.51  中国广东广州 联通
36.152.45.98  中国江苏南京 移动
36.152.45.97  中国江苏南京 移动

缺点

因为这个代理本身就很多用户在使用，所以一些反爬比较严格的网站可能会拦截这个代理的请求。

其实这个代理有一些其他的用法（~~比如流量卡~~），但是可能涉及到一些法律问题，这里就不多介绍。

escrow	交易金额（商品+运费）	标准	礼宾服务（使用了人工参与的中介服务）	支付处理费
	$0 - $5,000.00	2.6%（最低 50.00 美元）	5.2%（最低 100.00 美元）	标准或礼宾服务费 + 3.05%
	5,000.01 美元 - 50,000.00 美元	2.4%（最低 130.00 美元）	4.80%	不可用
	50,000.01美元-200,000.00美元	1.9%（最低 1,200.00 美元）	3.80%	不可用
	200,000.01美元-500,000.00美元	1.5%（最低 3,800.00 美元）	3.00%	不可用
	500,000.01 美元 - 1,000,000.00 美元	1.2%（最低 7,500.00 美元）	2.40%	不可用
	1,000,000.01美元-3,000,000.00美元	1.0%（最低 12,000.00 美元）	2.00%	不可用
	3,000,000.01美元-5,000,000.00美元	0.95%（最低 30,000.00 美元）	1.90%	不可用
	5,000,000.01 美元 - 10,000,000.00 美元	0.9%（最低 47,500.00 美元）	1.80%	不可用
	10,000,000.01 美元及以上	0.7% (询价)	1.40%	不可用
sedo	通过Sedo市场购买已停放的域名	10%
	通过Sedo市场的其他域名销售	15%
	通过 SedoMLS高级推广出售域名	20%
	外部转移和中介服务（自己导入交易）	3%（看具体后缀）
Atom	自己导入交易	4.50%
	标准市场搜索	7.50%
	Plus列表 – 增加曝光和被发现的机会	15%
	Premium列表 – 最大化的曝光和拍卖靠前被搜索的机会	$4998及以下: 30%（若没有币则为35%）
		$4999至$49,999: 25%
		$50,000至$74,999: 20%
		$75,000以上: 15%

条件	交易时使用的NS	基础佣金率	Boost 加成（如启用）	实际佣金率	示例说明
Afternic 支持的 NS	ns1.afternic.com, ns2.afternic.com 以及 Afternic Aftermarket 支持的其他域名（afternic.com、smartname.com、uniregistrymarket.link 等）	15% （最低 $15）	+0% 或+5%	不启用 Boost： 15% 启用 Boost： 20%	例：域名以 $1,000 售出，使用 Afternic NS 不启用Boost：卖家获得 $850 启用 Boost：卖家获得 $800
非Afternic 支持的NS	其他NS，如 ns1.nameserver.com, ns2.nameserver.com	25% （最低 $15）	+0% 或+5%	不启用 Boost： 25% 启用 Boost： 30%	例：域名以 $1,000 售出，使用非 Afternic NS 不启用 Boost：卖家获得 $750 启用 Boost：卖家获得 $700

租期（月）	折扣
0 - 12	0%
13 - 24	5%
25 - 36	10%
37 - 60	15%

案例	NS 类型	基础佣金率	Boost 状态	租期	折扣	总佣金率计算	销售价格	卖家实际收入
例1	Afternic NS	15%	未启用	16 个月	5%	15% - 5% = 10%	$1,000	$1,000 × (100%-10%) = $900 （分 16 期支付）
例2	非 Afternic NS	25%	未启用	35 个月	10%	25% - 10% = 15%	$1,000	$1,000 × (100%-15%) = $850 （分 35 期支付）
例3	Afternic NS	15%	启用 Boost (+5%)	12 个月	0%	(15%+5%) = 20%	$1,995	$1,995 × (100%-20%) = $1,596
例4	非 Afternic NS	25%	启用 Boost (+5%)	12 个月	0%	(25%+5%) = 30%	$3,288	$3,288 × (100%-30%) = $2,301.60

销售类型	佣金率	说明
Offer/Buy-It-Now 销售	5%（最低 $15）	例：$1,000 售出后，佣金 5%，卖家获得 $950。
LTO 销售	10%	例：$1,000 售出后，佣金 10%，卖家获得 $900。

巧用百度 APP 代理规避网站反爬

代理 IP 信息：

代码实现

代理 IP 池

缺点

相关推荐

评论抢沙发

时间轴

关于“低价激活码steam游戏假入库”的提醒

买了，没激活

买了，激活了

没买，看完原理心有不忿

实现原理

最后

各类域名中介平台的服务费收取比例

1：Make Offer / Buy-It-Now 佣金结构

2：Lease-To-Own (LTO) 佣金结构

3：Custom Checkout Link 佣金结构

哈喽米表 - 一款简易的米表

哈喽米表

主要特点

快速安装

系统要求

安装步骤

配置说明

基本设置

图片设置

hCaptcha配置（选配）

安全建议

自取：

一场迟到二十年的赴约：与青春邂逅之周杰伦演唱会

密码保护：抢演唱会门票的方法及脚本

密码保护：2025年自建房🪜搭建方法

随机推荐

热门标签

网上邻居

代理 IP 信息：

代码实现

代理 IP 池

缺点

相关推荐

评论 抢沙发

时间轴

关于“低价激活码steam游戏假入库”的提醒

买了，没激活

买了，激活了

没买，看完原理心有不忿

实现原理

最后

各类域名中介平台的服务费收取比例

1：Make Offer / Buy-It-Now 佣金结构

2：Lease-To-Own (LTO) 佣金结构

3：Custom Checkout Link 佣金结构

哈喽米表 - 一款简易的米表

哈喽米表

主要特点

快速安装

系统要求

安装步骤

配置说明

基本设置

图片设置

hCaptcha配置（选配）

安全建议

自取：

一场迟到二十年的赴约：与青春邂逅之周杰伦演唱会

密码保护：抢演唱会门票的方法及脚本

密码保护：2025年自建房🪜搭建方法

随机推荐

热门标签

网上邻居

评论抢沙发