网站地图提升收录效率

2014-02-09
  • 782
  • 0
         大多数商业搜索引擎都支持网站地图,它是一种标示网站主要内容和层级结构的文件形式。搜索引擎大多遵守同样的sitemap协议,例如谷歌、Bing和百度等、他们都是siemaps.org的成员,可以识别标准的网站地图文件。
         我们可以手动创建一个网站地图,此外,也可以利用第三方工具生成站点地图。在这里特别说明一下,Google搜索引擎支持以下三种形式的地图:
        (1) RSS、mRSS和Atom1.0;
        (2) XML格式的网站地图
        (3) 文本文件。在文本文件中只需要每行录入一个网址即可。例如下面的形式:
          http://www.example.com/file1.html
          http://www.example.com/file2.html
        为了使TXT格式的网站地图得到更好的抓取效果,需要注意以下几个事项:
        (1) 搜索引擎会按照提交的网址尝试进行抓取,因此,需要指定正确的,完整的网址
        (2) 文档格式必须是UTF-8编码格式
        (3) 文件只包含网站URL列表,不需要包含其他信息
        (4) 文件可以任意命名,但需要以.txt结尾。例如sitemap.txt
        站点地图的创建需要遵守以下准则:
        1. 一个站点地图文件包含的网址不得超过5万个,且压缩后的文件不得超过50MB。
        2. 如果拥有多个站点文件,需要将其列在站点地图索引文件中,然后将该文件提交给搜索引擎。通常不需要单独提交每个文件。
        3. 不要在网址中添加会话ID。
        4. 如果使用XML格式的网站地图,必须制定命名空间:xmlns=http://www.sitemaps.org/schemas/sitemap/0.9
        5. 站点地图文件与内容的语言无关。需要确保系统能够抓取各种语言版本并编入索引,请确保每个独立的页面都拥有独一无二的网址与其对应。