百度Bing360等搜索引擎网页快照时间显示错误
自建站以来,我经常关注各大搜索引擎对站点的快照情况。一开始,并没有感觉出有任何的问题,渐渐的时间长了,对网页快照的时间产生了怀疑,感觉有些不对劲。为了证明我的疑惑,后来我在站点的底部加入了时间显示,每次请求都会带上本次请求的准确时间信息,在页面底部用脚本将时间隐藏。由于百度和360对网页快照是直接过滤JS的,所以在快照的页面就会直接显示出快照页的准确时间,Bing(必应)的网页快照没有过滤JS,通过...
如何防止ISP网络运营商篡改网页
如何防止运营商修改网页,如何防止网页页面被植入广告,如何检测网页源码到达用户后被篡改?这个问题是个比较头疼的问题,也是让无数站长寻医问药很多年仍然不能很好的解决的一个问题。我这里先给出一个答案,如果一定要根治的话,那就是全站 HTTPS。全站 HTTPS 是很难做到的,包括百度在内,百度仍有部分时候不是 HTTPS。据说使用了 HTTPS,某些运营商依然会更改,不过这样网页就会发生错误。很多时候我...
一颗巨星的陨落 CodeWeBlog
android,业界,configurationfile,通信与电信,mainstring,ltxml,电子商务,jsp,javautil,lib,eclipse,数码与手机,ajax,apache,网页设计,array,attribute,stringargs,interface,MySQL,交互设计,textjavascript,map,站长经验,target,sourcecode,scriptt...
JavaScript实现图片懒加载非可视区域延迟加载
网页上图片很多时,如果不对图片使用懒加载(延迟加载)技术,网站显示速度就会很慢,给用户的感觉很不好,图片资源服务器的负载也会很大,一般不太好的服务商会直接返回 503 Service Unavailable 暂停服务错误。很多网站在处理这个问题时,直接使用 JQuery 的懒加载扩展,这样一来,网站必须要加载 JQuery,速度自然下降。JQuery 是一个很臃肿的 JavaScript 框架,虽然...
谈谈关于Jquery中html()方法设计不合理的地方
关于 JavaScript 的动态技术,最熟悉的莫过于 DOM 的 innerHTML 操作。这个是让网页动态的最重要最基础的功能。当我们做后台的时候,所以完全不用做 SEO,这样后台的代码尽量动态化和异步加载,异步加载一般不一定全部都是 JSON 格式,很多时候直接加载 HTML 网页也是非常常见的。这种动态加载过来的网页要嵌入到原网页中,如果不用 Jquery 提供的 html() 方法,只能使...
基于HTTP协议之WEB消息实时推送技术原理及实现
很早就想写一些关于网页消息实时推送技术方面的文章,但是由于最近实在忙,没有时间去写文章。本文主要讲解基于 HTTP1.1 协议的 WEB 推送的技术原理及实现。本人曾经在工作的时候也有做过一些用到网页消息实时推送的项目,但是当时实现的都不是很完美,甚至有时候是通过 Ajax 轮训的方式实现。在网上也找过不少的资料,真正说到点子上的几乎没有,很多文章大都是长篇大论,说了一些新有名字,什么“HTTP 长连...
No-Transform协议禁止搜索引擎转码兼移动站建设问答
在手机端访问时,发现自己的站点经常被百度,360等搜索引擎转码展示。转码后发现网页质量不太好,很多功能都出问题了。本人也是非常讨厌这种无声无息的动作,之前在站长沙龙上看到过一些问答,有关于如何禁止搜索引擎转码网页的问题,需要加上一段代码。我就是后知后觉的那种,当时并没有加上这段代码,现在实在是看不下去了,不得不加上了。加上后网站的转码并不会立刻生效,还需要耐心观察。no-transform 代码如下...
从SEO效果看谷歌百度360搜狗有道bing技术现状
你有一个大公司,有足够强的技术团队。那么我让你来做一个搜索引擎。你会怎么做?首先一定是爬虫设计,它的频率,它的对象,匹配入库,然后建立索引,分析链接,搜出结果,大概也就是这样的流程。你会去频繁的去抓取网页,当一篇文章被多个网站转载后,你会去对比时间吗,你能判断出正确的时间吗?你会通过谁是原创而排在前面吗?答案是否定的。 互联网虽然发达了,但是计算机技术一直没有进步,搞来搞去,归根结底,就是匹配建索引。...
百度统计onunload事件拖慢网页加载速度
刚刚开始使用百度统计的时候,有时候查看浏览器对网页的渲染情况,发现在 FireFox 上页面变慢了很多,第一个请求文档加载完毕后,紧接着下一个请求就是百度统计,这一点曾经让我迷惑了很久,一直不清楚是怎么回事,后来清除了百度统计代码后的第二次加载页面就没有了统计请求(清除后的第一次还是有的)。 后来我在百度知道里面提问,问题的内容大概是百度统计是如何做到在文档 onload 之后就立刻发出请求的。过了...
写网页爬虫遇到标签匹配难题
前段时间写优化网页节点的程序时,遇到了标签匹配的难题。在匹配图片标签时,由于标签里面的 JavaScript 代码中含有大于号“>”导致无法匹配完整的标签内容。将这样的问题分享出来,不知道像百度啊他们的爬虫是如何处理这样的问题的。请看下面的代码: <!-- HTML DOCUMENT --> <IMG onmousewheel="return imgzoom(this);" onmouseover=...