用相关搜索挖掘长尾关键词

2013-07-26
  • 1564
  • 0

在SEO项目中行业词库的建设无疑是一个非常重要的工作内容,一个合格的词库应当覆盖用户的搜索需求。后续的网站内容建设也是根据词库展开的。现在我来阐述一下词库的拓展思路。

以一个百货类电商为例,商品有3级类目 如( 母婴/婴幼儿食品/奶粉 ),奶粉类目有对应的品牌 (雅培、多美滋、贝因美、美赞臣)。那么我们就可以根据 类目、品牌、类目+品牌,这三种规则来组成词根。如:雅培、多美滋、多美滋奶粉、雅培奶粉。而这些词根都是隶属于奶粉的商品类目的,所以词根就天然具备了分组和分类。

有了词根之后就可以根据词根来拓展出长尾词了。百度的相关搜索是非常有价值的参考信息。您可能会问,为什么不参考百度搜索框的下拉推荐,为什么不参考百度指数或者搜索量。这是因为,百度搜索框的下拉推荐是根据输入文字(或拼音)相似度 + 搜索量向你推荐关键词。而百度指数中也主要是根据文字相似度和搜索量。可是搜索量大的词往往竞争激烈很难占领比较好的排名,而且也无法满足用户更细分更明确的搜索需求。另外指数、下拉推荐中的内容都是可以作弊刷上去的。

而百度相关搜索的关键词,是基于所有用户的搜索行为产生的数据,用户先搜索了关键词A,然后又搜索了关键词B,或者根据相关搜索点击了关键词B。那么百度记录了这一过程,基于海量的用户搜索行为就产生了相关搜索。 这个数据更准确,也更能反映用户的搜索需求。当你的鼠标停留在相关搜索的链接上时,便可看见其中的传递的参数。

我们可以从词根作为起点,去收集相关搜索的关键词,去除重复的关键词,去除与词根相似度太低的关键词,去除需要递归层次太深的关键词。因为用户可能最多只会通过三次的相关搜索来查询结果。画出了一个递归模型图如下。

图中,字母A是词根,其他字母是根据这个词根逐级拓展出来的长尾词,而数字则表示了与词根A相似度太低的搜索,斜线灰色的字母是已经拥有的关键词。而灰色分割线下方表示的是递归的深度过深,而被忽略掉的所有相关搜索。因此从词根A经过4级的递归所能挖掘出的长尾词分别是,B C D E F G H I J K L M N O P Q R S T,其他词都被忽略掉。

根据这个递归的方法我们也是可以计算出,从一个词到另一个词之间的距离的,比如图中词根A到长尾关键词M的距离是4。也可以汇总出关键词B的出现次数是4次。这种与词根距离短,而且出现次数多的长尾关键词就是很有价值的关键词。