放牧代码和思想
专注自然语言处理、机器学习算法
    Why join the Navy if you can be a pirate?

Web开发

mysql恢复drop掉的表

mysql恢复drop掉的表

hankcs阅读(400)评论(0)

手贱drop了几个表,以为能从昨天的备份中恢复,结果发现最近两个月的备份都是空文件,因为备份脚本在两个月前改错了!难道就这样丢失两个月的数据?镇定镇定—— 先看看mysql的配置文件 cat /etc/my.cnf 发现如下字样说...

多说评论丢失的找回办法

多说评论丢失的找回办法

hankcs阅读(522)评论(0)

这两天发现“关于”页面的多说评论数突然从两百多锐减到27条,一下丢失几乎全部的相关评论。起初以为是多说服务器抽风,可过了好几天也没见评论自动找回来,于是想出了一个找回多说评论的解决方案。要知道,文章版权属于博主,评论版权属于读者,两者对于一...

WordPress 分页加html后缀伪静态

WordPress 分页加html后缀伪静态

hankcs阅读(5273)评论(8)

问题 当文章有分页的时候,WordPress生成的永久链接是page.html/2的形式,前面一段是文章的$link,后面的数字代表分页$number。那么问题来了,挖掘……不对,从逻辑上讲这到底是个html文件还是一个目录呢? 难看 在....

WordPress中文分词与智能搜索

WordPress中文分词与智能搜索

hankcs阅读(3062)评论(2)

问题 WordPress的搜索功能非常简陋,如果用户搜索“日语综合教程+第六册”,WordPress会机械地构造一个wp_posts.post_title LIKE '%日语综合教程+第六册%'的SQL查询送到数据库里,结果...

WordPress安装Memcached缓存加速

WordPress安装Memcached缓存加速

hankcs阅读(1007)评论(2)

内存缓存Memcached可以突破MySQL性能瓶颈,加速博客的访问。 安装Memcached拓展 Memcached是php的一个拓展,类似的拓展还有Memcache。少了一个d的是旧版,多了一个d是新版。新版有更好的性能,推荐安装。 我...

WordPress集成Lucene全文搜索

WordPress集成Lucene全文搜索

hankcs阅读(3320)评论(6)

终于将Lucene集成到中文WordPress中了,实现了中文博客的全文搜索。作为一个搞NLP的博主,如果还在用SQL的LIKE做搜索,那也太不上档次了。这次集成主要难点在于 ①PHP平台上并没有一款成熟的分词套件。 ②Lucene的PHP...

百度云储存批量下载脚本

百度云储存批量下载脚本

hankcs阅读(3559)评论(4)

前些时间在BAE上搭了一个应用,数据写入了百度云储存BCS里。现在想将BCS里的数据搬走,但是官方并没有提供一个一键下载的功能。只好自己写了一个,运行良好。 此脚本在本地PHP环境下运行,需要开启CURL拓展。代码里的krumo是一个调试输...

多说自动摘要与防剽窃代码

多说自动摘要与防剽窃代码

hankcs阅读(3064)评论(3)

多说还算是WordPress上一款不错的社交网络评论框插件,不过它有“剽窃”博主文章的嫌疑。在wp-content/plugins/duoshuo/WordPress.php中有如下“剽窃”代码: 红色方框内的代码直接将整个post的con...

BAE3.0 Wordpress 搬家指南

BAE3.0 WordPress 搬家指南

hankcs阅读(3999)评论(27)

在阿里云暂住一个月后,码农场顺利搬家到BAE3.0。在这里做个记录,以后可能还有搬进搬出的可能。 搬家的好处 降低托管成本 阿里云单月55元,包年500元,平均每天1.37元。BAE3.0同等配置每天0.7元。 BAE3.0的计费采用执行单...

我的开源项目

HanLP自然语言处理包基于DoubleArrayTrie的Aho Corasick自动机