baidu手机蜘蛛真假要如何识别

最尽我们医疗网站新上线了,手机WAP站。发现日志里有好有多IP显示是baidu的,但名称很奇怪的东东。见下图:





问题一:这到底是不是真的baidu蜘蛛呢?要如何才能确定百度蜘蛛的真假呢?
问题二:如果是真的baidu蜘蛛,见图中用红色圈起来的具体又代表什么呢?是baidu蜘蛛服务器的配置信息?
追加问题
    3 人参与回答
捡书运营
捡书运营 · 一起记录、学习、总结运营经验,洞察增长逻辑.
岑科成 等 1 人赞同该回答

可以先用nslookup 查询一下显示:

Server: Address:
Name: Address:
基本可以确定是百度的IP,但冒失不是蜘蛛,而是用户访问,但为什么是百度的IP就不晓得了,我怀疑IP是伪装的。

王侠
王侠 · 任何事情,只要坚持一个星期,重复一个月,就可以成为一种习惯!

首先,我们对apache访问日志进行一个解读,

- - [22/Aug/2013:23:59:59 +0800] "GET /min/f=/media/JS/ HTTP/" 200 70550 "" "Mozilla/ (X11; U; linux x86_64; en-US; rv:) Gecko Minefield/"

第一项信息是远程主机的地址,即它表明访问网站的究竟是谁。

第二项是空白,用一个“-”占位符替代。实际上绝大多数时候这一项都是如此。这个位置用于记录浏览者的标识,这不只是浏览者的登录名字,而是浏览者的email地址或者其他唯一标识符,通常只是"-";

第三项也是空白用一个占位符"-"来替代。这个位置用于记录浏览者进行身份验证时提供的名字。当然,如果网站的某些内容要求用户进行身份验证,那么这项信息是不会空白的。但是,对于大多数网站来说,日志文件的大多数记录中这一项仍旧是空白的。

第四项,表示访问者的访问时间记录,无需多解释,时间信息最后的“+800”表示服务器所处时区位于UTC之后的8小时。

第五项,是整个日志记录中最有用的信息,它告诉我们服务器收到的是一个什么样的请求

第六项,200状态代码

第七项,70500,是服务器发送给客户端的总字节数

第八项,客户在提出请求时所在的目录或URL。

第九项,客户端的详细信息

吴仕奇
吴仕奇 · 武汉国信映盛互动技术 SEO专员 SEO经验2012年起

也不太懂,这个显示的是linux的型号而已,不用太担心,你这ip段的蜘蛛应该是隔天抓取的首页快照,现在情况很良好啊 。