当前位置: 电话机 >> 电话机优势 >> 2022年崔庆才Python3爬虫教
我们在前面尝试维护过一个代理池,代理池可以挑选出许多可用代理,但是常常其稳定性不高、响应速度慢,而且这些代理通常是公共代理,可能不止一人同时使用,其IP被封的概率很大。另外,这些代理可能有效时间比较短,虽然代理池一直在筛选,但如果没有及时更新状态,也有可能获取到不可用的代理。
上一节我们也了解了付费代理的使用,付费代理的质量相对免费代理就会好不少,这的确已经是一个相对不错的方案了,但本节要介绍的方案可以使我们既能不断更换代理,又可以保证代理的稳定性。
在一些付费代理套餐中,大家可能会注意到有这样的一个套餐-独享代理或私密代理,这种其实就是用了专用服务器搭建了代理服务,相对一般的付费代理来说,其稳定性更好,速度也更快,同时IP可以动态变化。这种独享代理或私密代理的IP切换大多数都是基于ADSL拨号机制来实现的,一台云主机每拨号一次就可以换一个IP,同时云主机上搭建了代理服务,我们就可以直接使用该云主机的HTTP代理来进行数据爬取了。
本节我们就来实际操作一下搭建ADSL拨号代理服务的方法。
1.什么是ADSL
ADSL,英文全称是AsymmetricDigitalSubscriberLine,即非对称数字用户环路。它的上行和下行带宽不对称,它采用频分复用技术把普通的电话线分成了电话、上行和下行3个相对独立的信道,从而避免了相互之间的干扰。
ADSL通过拨号的方式上网,拨号时需要输入ADSL账号和密码,每次拨号就更换一个IP。IP分布在多个A段,如果IP都能使用,则意味着IP量级可达千万。如果我们将ADSL主机作为代理,每隔一段时间云主机拨号就换一个IP,这样可以有效防止IP被封禁。另外,由于我们是直接使用专有的云主机搭建的代理服务,所以其代理的稳定性相对更好,代理响应速度也相对更快。
2.准备工作
在本节开始之前,我们需要先购买几台ADSL代理云主机,建议2台或以上。因为云主机在拨号的一瞬间服务器正在切换IP,所以拨号之后代理是不可用的状态,所以需要2台及以上云主机来做负载均衡。
ADSL代理云主机的服务商还是比较多的,个人推荐的有阿斯云、云立方等,其
转载请注明:http://www.aideyishus.com/lkgx/5281.html