百度蜘蛛ip段(详细IP分析)

百度蜘蛛是一个自动程序,它的英文名称叫做BaiduSpider。
由于百度蜘蛛是我们人类设计和制造出来一个产物,因此它每天都会按照我们人类的思维方式,在互联网上爬行和抓取网页、图片和视频等内容,然后分门别类建立索引数据库,使用户能在百度搜索引擎中搜索到自己想要的东西。
百度蜘蛛(Baiduspider)爬取
是搜索引擎获得页面内容的一个重要的途径,通过蜘蛛的抓取可以得到一个页面的最主要的内容从而收录百度数据库系统,每次抓取之后都会再与数据库原有的信息进行比对,来确定页面的总体质量。
那么,每当蜘蛛来抓取的时候都会被网站日志文件记录下来,具体包括抓取时间,抓取的页面以及蜘蛛来路IP地址,上次说到百度蜘蛛(Baiduspider)ip来路基本能够反映出不同蜘蛛对站点不同页面的喜好程度,从侧面也反映出整个网站不同页面的权重值,通过自己一系列的分析,可以较为准确的评估整站的权重分布,对于seo、文章内容价值、用户体验都起到很好的参考价值。
经常听到站长们问,百度蜘蛛是什么?最近百度蜘蛛来的太频繁服务器抓爆了,最近百度蜘蛛都不来了怎么办,还有很多站点想得到百度蜘蛛的IP段,想把IP加入白名单,但IP不固定,我们无法对外公布。
那怎么才能识别正确的百度蜘蛛呢?来来来,只需两步,教你正确识别百度蜘蛛
那么,不同的百度蜘蛛,它的功能和作用是什么呢?以下是搜集于互联网的,大家可以作为一个参考。
百度蜘蛛 | 功能说明 |
60.172.229.61 | 蜘蛛来访,准备抓取网页内容 |
61.129.45.72 | 蜘蛛来访,准备抓取网页内容 |
61.135.162.* | 蜘蛛来访,准备抓取网页内容 |
61.135.165.134 | 百度竞价蜘蛛 |
117.34.74.66 | 百度竞价蜘蛛 |
118.122.188.194 | 百度竞价蜘蛛 |
119.63.196.9 | 百度竞价蜘蛛 |
125.39.78.185 | 百度竞价蜘蛛 |
61.135.186.* | 百度联盟蜘蛛、百度统计蜘蛛 |
61.147.98.146 | 站长工具模拟百度蜘蛛 |
61.188.39.16 | 站长工具模拟百度蜘蛛 |
113.98.254.245 | 站长工具模拟百度蜘蛛 |
117.21.220.245 | 站长工具模拟百度蜘蛛 |
117.28.255.42 | 站长工具模拟百度蜘蛛 |
124.248.34.52 | 站长工具模拟百度蜘蛛 |
125.90.88.* | 站长工具模拟百度蜘蛛 |
119.147.114.213 | 站长工具模拟百度蜘蛛 |
121.10.141.* | 站长工具模拟百度蜘蛛 |
123.15.**.** | 百度图片蜘蛛 |
123.125.71.* | 抓取网站内页收录,质量不高,暂时不会放出来 |
159.226.50.* | 考察蜘蛛(很大可能是降权蜘蛛) |
180.76.5.* | 考察蜘蛛(很大可能是降权蜘蛛) |
180.76.5.87 | 考察蜘蛛(很大可能是降权蜘蛛) |
220.181.158.107 | 考察蜘蛛(很大可能是降权蜘蛛) |
183.91.40.144 | 新站不正常情况下的蜘蛛 |
203.208.60.* | 新站不正常情况下的蜘蛛 |
210.72.225.* | 打酱油的百度蜘蛛 |
123.125.68.* | 如果发现下面这几个ip段每天只增不减的话,那就很危险了, 很有可能会进入沙盒或者有被K站的现象。 |
218.30.118.102 | 如果发现下面这几个ip段每天只增不减的话,那就很危险了, 很有可能会进入沙盒或者有被K站的现象。 |
220.181.68.* | 如果发现下面这几个ip段每天只增不减的话,那就很危险了, 很有可能会进入沙盒或者有被K站的现象。 |
123.125.66.* | 代表百度蜘蛛IP来过了,准备抓取你网站上的东西! |
220.181.7.* | |
121.14.89.* | 百度蜘蛛作为度过新站考察期的一个ip段 |
220.181.108.95 | 此ip段爬过的文章或首页正常情况下基本在24小时都会放出来 |
220.181.108.92 | 此ip段爬过的文章或首页正常情况下基本在25小时都会放出来 |
220.181.108.91 | 此ip段爬过的文章或首页正常情况下基本在26小时都会放出来 |
220.181.108.75 | 此ip段爬过的文章或首页正常情况下基本在27小时都会放出来 |
116.179.32* | 此ip段爬过的文章或首页正常情况下基本在27小时都会放出来,百度快收的蜘蛛也是这个 |
123.125.71.95 | 抓取内页收录的,权重相对比较低,爬过此段的内页文章不会很快被放出来, 因它怀疑不是原创文章或者怀疑是采集来的文章。 |
123.125.71.97 | 抓取内页收录的,权重相对比较低,爬过此段的内页文章不会很快被放出来, 因它怀疑不是原创文章或者怀疑是采集来的文章。 |
123.181.108.77 | 抓取内页收录的,权重相对比较低,爬过此段的内页文章不会很快被放出来, 因它怀疑不是原创文章或者怀疑是采集来的文章。 |
123.125.71.106 | 抓取内页收录的,权重相对比较低,爬过此段的内页文章不会很快被放出来, 因它怀疑不是原创文章或者怀疑是采集来的文章。 |
220.181.108.89 | 专用抓取网站首页的,也属于权重段, 一般返回代码304 0 0就代表网站未更新 |
220.181.108.94 | 专用抓取网站首页的,也属于权重段, 一般返回代码304 0 1就代表网站未更新 |
220.181.108.97 | 专用抓取网站首页的,也属于权重段, 一般返回代码304 0 2就代表网站未更新 |
220.181.108.80 | 专用抓取网站首页的,也属于权重段, 一般返回代码304 0 3就代表网站未更新 |
220.181.108.77 | 专用抓取网站首页的,也属于权重段, 一般返回代码304 0 4就代表网站未更新 |
220.181.108.83 | 专用抓取网站首页的,也属于权重段, 一般返回代码304 0 5就代表网站未更新 |
220.181.108.86 | 专用抓取网站首页的,也属于权重段, 一般返回代码304 0 6就代表网站未更新 |
一、123开头IP段蜘蛛
123.125.66.* 代表百度蜘蛛预备抓取。
123.125.68.* 每天这个IP段蜘蛛来的最多,其余IP段较少的话示意网站被降权或者进入沙盒。
123.125.71.* 低权重蜘蛛,抓取内页收录的,但是权重较低,文章内页不会很快被放出来。
123.181.108.77 低权重蜘蛛,抓取内页收录的,但是权重较低,文章内页不会很快被放出来。
121.14.89.* 此蜘蛛为考察蜘蛛,此IP段蜘蛛来光顾基本上是网站无排名!(以上笔者从未见到过)
二、网站异常Ip段:
203.208.60.*:此ip段为异常蜘蛛,通常由于网站服务器问题或其他违规行为会引起它来爬取
210.72.225.*,此ip段为日常巡逻蜘蛛,只要网站没有问题,没有违规操作就行。(以上笔者从未见到过)
三、220和116开头IP段蜘蛛
220.181.68.*:每天这个IP段只增不减很有大概进沙盒或K站。
220.181.7.*:代表百度蜘蛛IP拜访,预备抓取你工具。
220.181.108.*,此ip段为权重蜘蛛,如果此蜘蛛频繁光顾,那么网站收录会有提高。如果频繁光顾网站却不收录,那么要注意是否网站质量不高,内容是否很差。
220.181.108.95:这个是百度抓取首页的公用IP,如是220.181.108段的话,网站会每天隔夜快照。
220.181.108.92:同上98%抓取首页,大概还会抓取其他(不是指内页)220.181段属于权重IP段此段爬过的文章或首页根本24小时放出来。
220.181.108.91:属于综合的,重要抓取首页和内页或其他,属于权重IP段,爬过的文章或首页根本24小时放出来。
220.181.108.75:重点抓取更新文章的内页到达90%,8%抓取首页,2%其他。权重IP段,爬过的文章或首页根本24小时放出来。

116.179开头的百度蜘蛛、与220开头的蜘蛛功能类似、目测属于权重蜘蛛。
四、其余百度蜘蛛
159.226.50.*
180.76.5.*
220.181.158.107
百度图片蜘蛛
123.15.**.**
百度渲染蜘蛛
111. *(如下图)

百度竞价蜘蛛
61.135.165.134
117.34.74.66
118.122.188.194
119.63.196.9
125.39.78.185