
在过去的一段时间里,大家一度对收录和索引的概念非常模糊,百度工程师也曾“粗暴”地说过“收录和索引是一回事”。但实际工作中,院长发现,其实收录和索引都有其各自的重要意义,并不能含糊地混为一谈,于是制作了这样一张图,让大家快速了解收录与索引的区别。
1,收录和索引分别指什么
收录:页面被Baiduspider发现、分析过
索引:Baiduspider经初步分析后认为有意义,做建库处理
2, 收录和索引的关系
包含关系,先收录才可以建索引,收录量大于索引量。百度站长平台链接提交工具是通往收录的大门。
3, 收录和索引的意义
【收录意义1】收录是索引的前提,站点需要保持服务器稳定(参考抓取诊断工具、抓取异常工具)、robots正确(《robots写法和需求用法对应表》),为Baiduspider抓取铺平道路
【收录意义2】Baiduspider只能处理已分析过的页面,面对新旧页301和移动适配,可为已收录页面完成权值评分以及流量切换
【索引意义1】只有被建入索引库的网页才有获得流量的机会(网页虽然被建入索引库,但获得流量的机会并不同,无效索引很难获得流量)
【索引意义2】新闻源站点(新闻源目录)内的链接,必须先被网页库建索引,才有机会出现在新闻检索中
4, 如何查询收录量和索引量
目前百度未提供查询收录的工具,任何第三方提供的所谓收录查询都是不靠谱儿的。站长可以通过LOG日志分析估算收录,注意真假Baiduspider(《如何识别百度蜘蛛》)
真实索引量只能通过百度站长平台索引量工具查询
索引zd量数据与site查询结果数差异较大原因
从以上数据对比,我们再来回味一下百度索引量查询功能里的小贴士,可以发现:
(1)一般情况,百度索引量比site指令查询的收录数大,这主要是因为:百度的索引量是百度抓取网站的页面数;site指令查询到的页面只是放出去的页面,也就是用户可以搜索到的页面。
(2)一般情况,百度索引量与site查询的收录数,都会同步增长,这说明网站专的权重在逐渐增加。
(3)如果索引量数据与site查询结果数差异较大,一般是新站。如果是站的时间比较长,那就是网站被降权了。
(4)针对新站,如果site数量比较少,索引量的数据比较大,并且在逐渐增多,别着急!说明你的新站索引正常,过一段时间这些索引页面会被陆续的放出来。
不是的,索引量中比收录量高的部分索引量是百度带走的,但带走他不一定就给你放出来,质量不高的就不会放出来的。site的也不是很准确,毕竟索引量在那放着,其中有的属部分会陆续放出的