判断文章关键词堆砌的思路

 发表于 2013-09-23

关键词堆砌是一种黑帽SEO方法,是指在网页中大量重复关键词以提高关键词的密度。此类文章更像是一连串关键词的堆砌,而没有可读性,更别提什么阅读价值了。

虽然关键词的密度会影响网页排名,但是关键词的堆砌却是一个错误的极端做法,这种做法一定会被搜索引擎惩罚。

目前可以用来判断关键词堆砌的方法是用文章的长度L,和文章中的词汇数量N进行比值。经过大量的数据统计发现, L/N比值范围大致是介于4到8之间,平均值是5-6。如果L/N比值过小,则说明文章中的词汇太多,很可能是一堆词汇的拼凑,比如一个产品类目页面。如果L/N比值太大则可能页面是由无任何词汇意义的文字组成的,比如一段乱码。

基于以上理论知识,我们可以使用分词工具将一段文字进行分词,然后与文字的长度进行运算,看看两者的比值是否在合理范围内。

这样做有什么意义呢?举个例子,如果你的网站是一个由用户生成内容( UGC )的网站,为了防止用户在论坛、留言板、评论中填写不利于网站排名,或者可能造成网站被惩罚的内容,你就可以即时监控到这种异常行为。

评论 判断文章关键词堆砌的思路

版权所有,未经许可,请勿转载,违者追究法律责任