前一段时间网站断流了,原因是我的网站两天的流量达到了50G,不要误会,网站的访问量每天只有100左右,怪就怪我曾经写过一片日志,《 北京欢迎你-群星打造奥运倒计时100天主题曲》,我把这首歌曲放在网站上提供下载了,然后这首mp3就被百度之类的mp3蜘蛛抓到了,然后就出现了网站流量超标的情况。
现在我对百度mp3之类的搜索引擎深恶痛绝,百度公司说白了就是光明正大的盗链啊!借用别人网站的资源给自己的网站赚取流量,实在不算君子所为。很久以前百度是在搜索页面直接提供下载链接的,结果被人告了,要是我我也要告,现在点击链接后弹出一个小对话框,可是仍然有直接下载地址,换汤不换药,这就是为什么我的流量都超过50G了而访问量却只有100的原因。
说过mp3,我想顺带说说图片的搜索,先来看看Google的图片搜索结果是什么样子(Google至今没有直接的mp3搜索页面,实在是明智之举),点开Google的图片搜索结果,看到的是上面是图片缩略图,下面是来源网站的网页,这样的话并不会伤害到原来图片网站的访问量,如果这个页面有广告的话,也同样可以为原来的网站带来收益的,这样两面都有访问量,是双赢的。
接着我们再来看看百度是怎么做的,百度的图片搜索很巧妙,上面的图片链接打开的是百度的网页,而下面很小的文字链接打开的是来源网页:
相对于这么大的图片,点击文字链接的概率是很小的,也就是说绝大部分的时候用户点开的网页还是百度的页面:
尽管上下都有链接指向来源网页,可是图片已经被打开了,谁还会再去点开原来的网站来消磨自己的时间呢?所以我的结论是:百度图片和百度音乐一样,在拿着别人的资源给自己赚取访问量。他的图片并不是保存在自己的服务器上的,而是直接拿着别人的服务器上的文件做自己的网页,这是实实在在的盗链!而且这种盗链比其他的来的都可怕,因为百度的访问量是惊人的。
也就是在中国,网络版权的法律都不健全,才让很多网站(不仅仅是百度)有了可乘之机,我以前似乎没有盗链过别人的东西,如果我真的喜欢,我会下载回来放在自己的服务器上,或者直接做一个到原来网页的链接。
我理想中的搜索引擎应该是不管搜索的什么资源,都应该连接到原来的网站页面,你mp3也好,图片也好,都应该让用户打开原来的网页进行下载,同时用户也可以判断文件是否是自己需要的,是否是正确的。可是现在的状况不是这样,那只好自己努力了:第一,不要放mp3之类的容易被抓取的文件,第二,有能力的话做好防盗链工作。
呵呵,soso同学过奖了
这真是专业写博客的,这精神。。。
可不是,最近弄这个很头痛,吸取教训吧,不犯错误怎么能学东西呢。
我以后要少去百度mp3下东西了,不公平
怪不得前几天浏览不了您的网站……原来百度的mp3下载是这么来的呀~