LMLPHP后院

浅谈三大搜索引擎爬虫性感 B-G-B技术

maybe yes 发表于 2019-07-12 08:59

SEO 的朋友们有福音了,本篇给大家带来帮助。会 SEO 不一定懂技术,不懂技术怎么能精通 SEO?来看看吧?让你提升一个档次。

就干货吧,不饶弯子了,直接上福利。

先说说度娘吧?度娘你们懂的,顾名思义,就是很娘的意思,所以它的爬虫也比较娘,以前我就说过 2000 秒一次抓取,虽然不是每次都是 2000 秒,但基本就是非常不积极,非常不积极。一天抓个几百次就不得了了,每次间隔时间都很长,给人感觉很温柔,生怕被操痛了。就是这样吧。

说说哥哥吧。哥哥是个生猛的男人,确实如果,在抓取这件事情上体现的淋漓尽致。非常迅猛,像是迅猛龙一样,30 秒就要操上百次,一分钟好几百次,10 分钟就是五六百次以上,这速度基本上很多对象都受不了,基本上做的好点的都会限制下频率,生怕被操高潮了。于是经常达到了最高限制数量,然后哥哥就像是一只宠物狗🐶一样被贵妇们卸货了。就说这些吧。

朋友圈已死微信五年内必死死了没人知道声音

maybe yes 发表于 2019-07-03 08:12

好恶心的东西啊,像是一个小丑一样。

搞互联网的人都以为,封闭的东西必死无疑,微信就是如此。像一些小商户啊,什么的脑残人士觉得网站不方便啊,还是小程序好的这种人,也是要吊打的。

朋友圈复杂的权限,隐藏的暗海,谁知道里面怎么回事?除了几个大 V,微信对于普通老百姓,没有意义。现在出现的情况是,随便你发什么,根本没人看,完全漠视,这样的东西必须死。

就是死了,人家还不知道它死了。

微信是政府的工具,有钱有影响力,通过它的特权,让几乎所有的政府办事机构和媒体全部入驻微信公众号。所有的屁民都被震撼了,很多中小企业都掏钱认证啊,开发小程序啊,殊不知,微信没有给这些企业带来什么好,完全就是坑爹坑逼。通过流氓手段不给你渲染,逼着你交钱认证绑定域名,ICP 备,公安备,整个的就是一个狮子大开口。弄来弄去还不是垃圾信息满天飞,强盗横行。

Regexp Compilation failed: lookbehind assertion is not fixed length at offset技术

maybe yes 发表于 2019-07-02 10:12

关于正则的使用,必须实践了之后才会发现问题。希望本篇给大家带来帮助。

你对正则表达式了解吗?

什么是非获取匹配?什么是获取匹配?什么是正向预查?什么是逆向预查?什么是零宽断言?什么是肯定匹配?什么是否定匹配?

先把上面的问题搞懂,才能继续往下看。上面的概念哪怕一丁点不清晰,那么请离开。

给大家讲一下,向后断言需要注意的事项?看代码:

/谢谢(?=.{0,10})/i

能匹配“王同学谢谢王老师”中的谢谢吗?

Yes,能匹配。

继续看代码:

/(?<=.{0,10})谢谢/i

以上,这个能匹配吗?

No,because not fixed length occurs。Notice:[2]preg_match(): Compilation failed: lookbehind assertion is not fixed length at offset 11 in

PHP trim 函数引发崩溃且数据库保存失败技术

maybe yes 发表于 2019-06-30 07:21

请慎用 PHP 的 trim 函数来去除额外的头尾字符,否则可能带来意外的不合法字符。

请看下面的例子🌰

var_dump(trim('血'));
var_dump(trim('血', ' '));
var_dump(preg_replace('/^ | $/', '', ' 血 '));

return;

输出

string(3) "血"
string(2) "?"
string(3) "血"

上面的例子是用来去除文字两边的中文全角空格,结果在个别字结尾的时候就出现来问号,这个特殊的编码的字符导致数据库保存失败,直接 crash。

LmlException: HY000
1366
Incorrect string value: '\xE8\xA1</p>...' for column 'content' at row 1 in .php:109
Stack trace:

影响程序员开发效率的几大神器技术

maybe yes 发表于 2019-06-24 08:24

程序员的效率其实跟很多因素有关,很多观点也只对一部分人有效。

这几大神器,程序员必须得会,光会还不行,还得精通,要精通那必须得用个三到五年。这五年之痒有谁挺得过来?

第一大神器

GIT

GIT 是影响开发效率的东西,尤其是 git console。这里的影响其实是阻碍开发效率,linus 的思维就是和普通人不一样,以致于很多程序员大牛刚接触 GIT,一直玩不来,理解不了。所以懂了又如何,每天几个命令敲一敲,没干啥这一上午就过去了。这也是朋友的个人观点,非喜勿喷,想一下,你以前不用 GIT 的时候开发是不是快一些,用了之后是不是慢了很多?因为除了种种原因,你得 diff 一下,show 一下,add 一下,commit 一下,push 一下,这些已经是最简洁的流程了,很多人在某个环节要重复多次。复杂一些的,你可能要 stash 一下,可能要各种 checkout,要 rebase 一下,然后重复上面的简洁过程,然后 merge 一下,然后 push。现在公司的绩效管理制度,让这些程序员越来越犹豫,代码看了又看,时间就在这些环节浪费掉了。并且 console 下,输入各种命令总得要点时间吧。还是 UI 省事一些。

2019-07-16 10:10:57 1563243057 0.023496