Mar
12
很多企业因为前面生产环境没有架构好。导致后面URL重新布局。对于现有搜索引擎来说必然是个弊端。
还好,Google等多数搜索引擎公司支持301永久重定向这个标准。
不过在国内占70%搜索份额的百度确对301支持不好,带有浓烈的“中国特色”。
以Old_url 301 到 New_url 为例。
用php脚本写了一个301,各大搜索引擎以及订阅客户端都能正常识别。在web serer的日志上能看到状态 Old_url 301,New_url 200。即跳转成功。而百度的蜘蛛只能到Old_url 301,后面没有200的完成状态。过些时候就发现Old_url 的状态变为 301 64,即传说中的不可用标记。
那么这样分析出对于web server后端的程序写的301跳转,百度的spider是无法辨认的。这样我在web server上直接加了301规则,在不读取程序之前就直接301跳转。这回看日志终于显示了spider读取New_url 200的成功状态。同时Old_url标记为 301 64。
最后得出的结论是百度的spider是可以正确读取web server上的301规则。
为万无一失,大家在最开始的时候就得规划好url。若后期不得不做301时,还是在web server的前端(如isapi_rewrite)或直接使用server自带的正则来实现,用后端程序来实现的话,BD spider有可能无法正确识别。
还好,Google等多数搜索引擎公司支持301永久重定向这个标准。
不过在国内占70%搜索份额的百度确对301支持不好,带有浓烈的“中国特色”。
以Old_url 301 到 New_url 为例。
用php脚本写了一个301,各大搜索引擎以及订阅客户端都能正常识别。在web serer的日志上能看到状态 Old_url 301,New_url 200。即跳转成功。而百度的蜘蛛只能到Old_url 301,后面没有200的完成状态。过些时候就发现Old_url 的状态变为 301 64,即传说中的不可用标记。
那么这样分析出对于web server后端的程序写的301跳转,百度的spider是无法辨认的。这样我在web server上直接加了301规则,在不读取程序之前就直接301跳转。这回看日志终于显示了spider读取New_url 200的成功状态。同时Old_url标记为 301 64。
最后得出的结论是百度的spider是可以正确读取web server上的301规则。
为万无一失,大家在最开始的时候就得规划好url。若后期不得不做301时,还是在web server的前端(如isapi_rewrite)或直接使用server自带的正则来实现,用后端程序来实现的话,BD spider有可能无法正确识别。
hootoo
2009/11/18 17:23
谢谢,请问单个页面怎么301呢?
分页: 1/1
1
1
dos 命令for循环举
php ceil 


