LMLPHP后院

百度的爬虫 Baiduspider 也不过尔尔

这么多年,的确积累了一些经验,然后用这些不怎么样的经验强加给哪些影响力不大的网站,结果互联网的阶级就这样固化了。分析了下搜索引擎爬虫的行为。baidu spider 一般用的北京的联通 IP 地址进行网络抓取,baidu spider 对于新链接的态度异常缓慢,一般十天半个月才会去请求一次,请求了之后呢,然后进行两次渲染,分别是以两个尺寸 375x667 和 1600x1600 的屏幕渲染。傻不傻,为...

Fatal Error:imagecreatefrompng(): gd-png: fatal libpng error: Read Error: truncated data

gd 怎么不出一个检测图片文件是否是 truncated data 的函数呢?难就难在 PHP 的错误处理和异常处理太分散,太混乱。这样导致 PHP 很难去完成长时间稳定运行的不确定性的任务,特别是网络的操作;so,一个经验丰富的程序员,没个五年 PHP 使用经验,是不敢用它去做这些事情的;线程什么的其实不重要,全世界没几个公司需要开几十个线程加速处理不然就完不成的任务吧。...

Google百度360搜狗Bing(必应)对网站收录区别

新站,无论关键词(关键字)和网页有多么的匹配,一律不展示,显示的都是一些完全不搭界的东西,甚至是一些网站的地址上的无用字符,对国内搜索引擎表示非常的无语,不知道是技术不行还是对新站的歧视,在这样的一个网络环境下,不知道埋没了多少优秀的站点。而国外的搜索引擎,如Google,Bing,他们对新站的收录一直都不错,我在之前的一篇文章《从百度、360、搜狗对新站态度看国内搜索引擎技术现状》就提到过,这点对他...
2026-04-27 10:07:43 1777255663 0.003907