蜘蛛爬多少页不是最重要的事。重要的是有多少页面被索引,就像我们经常调用的库一样。
对于网站管理员或SEO优化器来说,搜索引擎索引库是分级的,高质量的页面被分配给重要的索引库,普通页面留在公共库中,更糟糕的页面被分配给低级别的库作为补充材料。目前,60%的检索要求只能通过调用重要索引库来满足。
哪些页面可以包含在百度搜索中事实上一般原则是:用户的价值。
1 及时性和价值页面:这里的及时性和价值是并列且不可或缺的。一些网站做了大量的收集工作来产生及时性内容页面,导致出现一些百度不想看到的一堆毫无价值的页面,。
2 高质量的主题页面:页面的内容不一定是原创的,也就是说,可添加一些新鲜的内容如视图和评论,让它可以与各方的内容很好地集成,以丰富用户的综合内容。
3 高价值原创内容页面:百度原创定义提取后积累了一定经验成本的文章。不要再问我们原创是否是原创。
4 重要的个人页面:这里只是一个例子。一位名人在新浪微博上开了一个账户即使他不定期更新它,它仍然是百度的一个非常重要的页面。
事实上,大部分的互联网网站都没有被百度收录。这不是因为百度没有找到它们,而是因为筛选链接之前的数据库被过滤掉了。什么样的网页在初始链接中被过滤掉了?
1 使用一些无法被百度蜘蛛解析的技术,如JS、AJAX蜘蛛陷阱,虽然用户可以看到丰富的内容,但仍然会被搜索引擎抛弃。
2 具有慢加载速度的页面也可以被视为空页或短页。注意,广告加载时间是在整个页面加载时间中计算的。