(转)最新屏蔽百度快照的方法

转自月光的一篇日志,很实用!标题是《屏蔽百度快照的方法》但是我感觉这方法更像是在重定向百度快照。先复习一下什么是快照:

网页快照(英语:Web cache)是搜索引擎的一项特色功能。搜索引擎在收录网页时,对网页进行备份,存在自己的服务器缓存里,由于网页快照是存储在搜索引擎服务器中,所以查看网页快照的速度往往比直接访问网页要快。网页快照中,搜索的关键词用亮色显示,用户可以点击呈现亮色的关键词直接找到关键词出现位置,便于快速找到所需信息,提高搜索效率。当搜索的网页被删除或连接失效时,可以使用网页快照来查看这个网页,起到“救急作用”。搜索引擎一般都设有网页快照功能。

既然是快照就意味着搜索引擎保存的网页可能是过期的,可能在我们还未完成网站的时候,搜索引擎就来光顾我们的网站并拍下快照,一般这个时候我们的测试页面或者一些不想公开的页面都被搜索引擎备份了快照,而且会在搜索引擎里展现出来,如果我们可以重定向快照的连接,就可以有效的避免了隐私页面的曝光。

下面内容转自月光博客的《最新屏蔽百度快照的方法

有时候,因为内容的更改或者隐私问题,我们往往不希望别人通过“百度快照”的方法查看自己网站的某一些网页,对于网站管理员来说,百度快照也分流了大量本属于网站的流量,为了增加网站的流量或者增强内容隐私,我以前曾经提供过一段将百度快照重定向到自己网站的方法。不过后来百度改变的快照算法,不从远端服务器获取JavaScript文件,因此先前介绍的那个屏蔽方法目前已经失效。

现在我介绍一个新方法,原理也是大致相同,我们知道目前百度网页快照虽然不从远端服务器抓取JavaScript文件,还是依旧会从远端服务器抓起 CSS文件,而通过一个技巧可以在CSS文件中实现网页重定向,从而控制百度快照中的网页,完全由我们控制该快照重定向到我们制定的任何网页地址。

例如,如果百度快照中缓存的文件为style.css,那么我们在服务器上编辑这个文件,在CSS文件中加入以下语句,即可控制百度缓存快照重定向,从而实现屏蔽百度网页快照内容的功能。

body {onload:expression(location.href='http://www.williamlong.info/');}

以上语句在IE浏览器下测试通过。理论上,根据这个方法,我们可以控制百度网页快照的内容重定向到任何一个我们指定的网址,甚至是第三方网站。为了实现网页的正常显示,百度快照屏蔽CSS的可能性会非常小。

这个方法也可用于屏蔽Google等其他搜索引擎的网页快照。

《(转)最新屏蔽百度快照的方法》有6个想法

  1. 网页快照有时候还是有正面的积极地用处的。
    比如,站点的数据丢失了,而有没有备份,以立即通过快照尽快恢复文章。我就经历过。

发表评论

电子邮件地址不会被公开。 必填项已用*标注