先简单介绍下百度收录的基本流程是,蜘蛛通过外部链接找到你的网站——爬行——存储在数据库中——展现。在了解了搜索引擎的基本原理后,下面小编说说网站文章不被收录的问题。
一、蜘蛛没有爬行网站
也就是说,蜘蛛没有发现你的网站,所以就不会被收录。你可以通过查看网站日志来判断蜘蛛是否已经爬过你的网站,如果没有,你可以手动提交搜索引擎,然后去高权重的网站发布外链。
二、页面的质量
从三个方面考虑,首先是页面内容的质量,如果文章的内容都是复制的,可以就会被百度的去重算法过滤掉,自然就无法收录。另外,如果页面中存在大量的死链接或者整个页面使用Flash等不友好的设计,也会影响到百度对站点的收录。
三、网站中有违禁词
包括网站标题和页面中出现的大量禁止用语,这些页面也会被百度过滤。
四、度娘的特殊时期
在一些大会时期,度杜娘怕惹麻烦,会减少对新站的收录。虽然它不承认,但经过总结确实有这种现象。
五、网站设置不当
很多程序员担心在调试程序时会被百度抓取。采用robots.txt来屏蔽蜘蛛爬行,有时很容易忘记,所以检查一下。
六、域名处于处罚期
这是一件很悲哀的事情,很多新手注册了一个域名,结果网站就是不被收录,反而百度的处罚时间越来越长。如果这个域名上有一个使用者的网站被惩罚,域名到期被你注册,且你使用时还处于惩罚期,名域名名义上你使用所以网站就不会被收录。
网站不被收录,无非就是以上几点原因,如果你的网站未收录,你可以参考以上几点方法来排除。当你知道问题所在,就可以对症下药了。