如何识别Baiduspider

 发表于 2014-05-26

        最近一直有客户说百度蜘蛛抓取数量突然变大,会不会产生什么问题?然而我一看到日志,研究了一下就和客户说,那些突然增加的蜘蛛都是伪装的.客户很诧异的说你怎么知道?我说:其实百度蜘蛛是可以识别的. 
        那么,该如何通过ip来判断此spider是不是来自百度搜索引擎的呢?
         可以通过dns反查方式来解决这个问题。以下是linux/windows/os三种平台下的验证方法: 
        在windows平台,通过命令提示符可以使用nslookup ip命令反解ip来 判断 
        在linux平台下,可以使用host ip命令反解ip来判断 
        在mac os平台下,可以使用dig 命令反解ip来判断
        baiduspider的hostname以*.baidu.com 或*.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。

评论 如何识别Baiduspider

版权所有,未经许可,请勿转载,违者追究法律责任