一、内容重复的概念
不同的网站、不同的域名之间存在的大量雷同或者相似的内容就称之为内容重复。有的内容重复现象并非故意为之,其动机并没有恶意,但是有的网站为了能够拥有一个好的排名,故意将从其它网站中复制过来的内容粘贴到自己的网站,从而增加网站的流量,这属于恶意的作弊行为。
二、什么行为不算内容重复
如果是利用一些翻译工具将一些网站中的内容翻译成另一种语言,比如英文翻译成中文,那么即使内容意思并没有变,但是这种行为不算是内容重复。
三、搜索引擎关心重复内容的原因
搜索引擎一直立志于为用户提供有价值的原创内容,如果用户得到搜索结果后,点击不同的搜索答案,进入网站后,却发现内容都是一样的,那么用户就会反感该网站,甚至还会反感提供该搜索结果的搜索引擎。所以,搜索引擎才十分重视内容重复现象,打击内容重复行为。
四、搜索引擎采取的措施
为了保证提供给用户的不同的搜索结果,不出现内容重复现象,搜索引擎会从有多个版本的网站中选取一个版本作为索引显示给用户。比如,你的网站中的某篇文章设置有正常版与打印版,而且你没有将noindex标记设置在robots.txt中,那么搜索引擎只会从这两个版本中选择一个版本呈现给用户,这样就避免了重复显示。另外,为了打击一些不良网站欺骗用户,搜索引擎将索引与排名都进行了适当调整,使得不良网站有机可乘的机会大大减少,并且一旦发现有的网站存在这种不良行为,会给予十分严厉的惩罚。