从SEO效果看谷歌百度360搜狗有道bing技术现状
司,有足够强的技术团队。那么我让你来做一个搜索引擎。你会怎么做?首先一定是爬虫设计,它的频率,它的对象,匹配入库,然后建立索引,分析链接,搜出结果,大概也就是这样的流程。你会去频繁的去抓取网页,当一篇文章被多个网站转载后,你会去对比时间吗,你能判断出正确的时间吗?你会通过谁是原创而排在前面吗?答案是否定的。 互联网虽然发达了,但是计算机技术一直没有进步,搞来搞去,归根结底,就是匹配建索引。我在 OSC...
LMLPHP官方博客上线
经过一番努力,LMLPHP官方博客正式上线。这里将作为LMLPHP官方打造的互联网资讯平台,包含官方的新闻动态,创业感悟,行业认知,技术文档等。这里的文章除非特别注明外,全部为原创文章,转载时必须将文章链接标注在显眼位置并注明来源,否则将追究法律责任。最近一段时间忙工作,忙网站,更新框架,写文档等,时间安排滴满满的,早上一起床洗漱完毕就直奔公交车。有时候睡的很晚,早上起床仍然睁不开眼,非常的辛苦。每当...
使用GIT BASH管理多个远程代码库
我的另一篇文章《GITHUB之GIT BASH使用教程》,最近一段时间,百度等搜索引擎也带来了一些流量,看到有很多网友浏览,也有网友来过多次。这篇文章再做一些补充,关于如何使用 GIT 推送代码到多个远程代码库。使用场景:比如我们的项目同时放到了 GITHUB 和 GITOSC 中,这个时候本地只有一份项目代码,当本地开发时做了更新,要保持远程两个远程版本库的一致性,就必须将代码同时推送到两个远程服...
GITHUB之GIT BASH使用教程
写在前面这篇文章写完后,感觉不是很满意,漏掉了一些常用的命令忘记写,如“git tag”,“git diff”,“git show”,“git log”,“git remote”等。但是作为教程,应该是越简单越好,文章太长,反而惹人讨厌,这样一想,也就没有继续补充了。GITHUB 是全球最出名的基于 GIT 的代码托管平台之一,可以免费的托管开源代码。作为一名软件工程师,对代码的管理养成一个良好的习惯...
VPS snapshot 之后重启防火墙丢失
记录下前阵子由于某些原因被强制停机,系统被快照之后出现的一些问题。首先当然是数据库崩溃啦,无法启动。参考我的另一篇文章 is marked as crashed and last (automatic?) repair failed。然后出现的问题有 SSH 无法登录;screen 会话丢失,估计 screen 是存储在内存中导致。SSH 登录报错:ssh: connect to host lmlph...
使用Form Iframe Request取代Ajax技术和Jquery的Ajax方法
有个好的想法,如果所有的网站都不使用 Ajax 技术,或者不再为了使用比较成熟的 Ajax 方法而去加载 JQuery。写这篇文章不是说用 Ajax 不好,而是从另外一方面去想,如果我们把东西做的足够简单,或者在特殊情况下可以不使用 Ajax 技术来达到和 Ajax 一样的用户体验。其实,是可以实现的,那就是使用 Iframe。 之前看过一篇文章,有人说过 Google 的天才们发明了 HtmlFi...
在GITHUB上进行团队项目开发教程
该是个有道德的公司,对保护用户数据应该还是做的不错的。我相信,以后会有很多公司都会将项目放到 GITHUB 的私有库上。用过很多的在线产品,印象中做的不错的网站有 126 邮箱,GITHUB 等。这篇文章将完整的讲述如何在 GITHUB 上进行团队项目开发的过程。 Fork项目到自己的 GITHUB 账号下 在 GITHUB 上进行团队多人项目开发,一般会被公司拉入一个组织,这样你才有权限 Fork ...
其实每个人都有同理心
终就是对人处事没有主见,优柔寡断;而对于没有受过教育的人而言,做人处事反而显得很聪明,就像红楼梦里面作者觉得自己不如其中所经历过的所有女子一样,觉其行止见识皆处于我之上。现在微信每天都会自动推荐公众号文章,朋友偶尔也会看看推荐的文章。最终决定你是否关注这个公众号的一个重要因素就是同理心,共鸣啊,人家的经历跟你类似,能不触动你的内心吗?大家也许都见过那张老照片吧,当年太祖衣锦还乡之时,在家乡附近看到一位...
为什么内容平台终将消失?
段时间,坚持不下去了,因为 CMS 程序不是自己写的,没有感谢,也没有维护下去的动力,后来服务器到期,没有续费,内容也就随之一命呜呼了!这个是很早的事情了,大概在 2010 年!当时的技术博客上的技术文章化为乌有!!!后来上班后,还是习惯的写写文章,后来在百度空间开了博客,开始写技术类的经验分享,后来百度空间关闭了,虽然有导出一份数据,但根本没有心去看看导出的内容,最后也就化作乌有!后面很长一段时间,...
谈谈网站开发中的跳转方式
互联网是一个大杂烩,一个系统在公网上运行,随时面临着傻逼程序的进攻,在互联网的大家庭里,鱼龙混杂,技术水平参差不齐,特别是各种傻逼爬虫。这也是我写这篇文章的原因。本文主要讲解如何更好的在网站开发中使用跳转。当我在我的统计日志中发现大量的重定向之后,我觉得这些爬虫怎么可以这么傻逼,请看下面的日志,我截取的是比较短的一个记录,事实上最长的记录已经达到了 GET 请求的最大限制:"GET //mall.db...