放牧代码和思想
专注自然语言处理、机器学习算法
    博主不用扣扣,公事请博客留言,私事请微博私信。开源项目一律GitHub见,发错地方恕不回复,谢谢。

WordPress

多说评论丢失的找回办法

多说评论丢失的找回办法

hankcs阅读(559)评论(0)

这两天发现“关于”页面的多说评论数突然从两百多锐减到27条,一下丢失几乎全部的相关评论。起初以为是多说服务器抽风,可过了好几天也没见评论自动找回来,于是想出了一个找回多说评论的解决方案。要知道,文章版权属于博主,评论版权属于读者,两者对于一...

WordPress 分页加html后缀伪静态

WordPress 分页加html后缀伪静态

hankcs阅读(5540)评论(8)

问题 当文章有分页的时候,WordPress生成的永久链接是page.html/2的形式,前面一段是文章的$link,后面的数字代表分页$number。那么问题来了,挖掘……不对,从逻辑上讲这到底是个html文件还是一个目录呢? 难看 在....

WordPress中文分词与智能搜索

WordPress中文分词与智能搜索

hankcs阅读(3160)评论(2)

问题 WordPress的搜索功能非常简陋,如果用户搜索“日语综合教程+第六册”,WordPress会机械地构造一个wp_posts.post_title LIKE '%日语综合教程+第六册%'的SQL查询送到数据库里,结果...

WordPress安装Memcached缓存加速

WordPress安装Memcached缓存加速

hankcs阅读(1093)评论(2)

内存缓存Memcached可以突破MySQL性能瓶颈,加速博客的访问。 安装Memcached拓展 Memcached是php的一个拓展,类似的拓展还有Memcache。少了一个d的是旧版,多了一个d是新版。新版有更好的性能,推荐安装。 我...

WordPress集成Lucene全文搜索

WordPress集成Lucene全文搜索

hankcs阅读(3449)评论(6)

终于将Lucene集成到中文WordPress中了,实现了中文博客的全文搜索。作为一个搞NLP的博主,如果还在用SQL的LIKE做搜索,那也太不上档次了。这次集成主要难点在于 ①PHP平台上并没有一款成熟的分词套件。 ②Lucene的PHP...

多说自动摘要与防剽窃代码

多说自动摘要与防剽窃代码

hankcs阅读(3178)评论(3)

多说还算是WordPress上一款不错的社交网络评论框插件,不过它有“剽窃”博主文章的嫌疑。在wp-content/plugins/duoshuo/WordPress.php中有如下“剽窃”代码: 红色方框内的代码直接将整个post的con...

阿里云备案和使用心得及 wordpress BAE、SAE搬家指南

阿里云备案和使用心得及 wordpress BAE、SAE搬家指南

hankcs阅读(5121)评论(0)

上个周末终于有点空了,将码农场搬到阿里云,并且备案成功。这里简单做个记录,给有需要的博友参考。 说起备案,其实不像我原来想象的那么难,反而可以说出乎意料地简单。我1月9号买了台阿里云服务器并且进入代备案流程,当天代备案初审通过并且邮寄了协议...

多说WordPress插件安装

多说WordPress插件安装

hankcs阅读(3264)评论(2)

多说是一款特别好用的评论框插件,今天码农场换用了多说评论框,感觉非常好,来展示一下多说的强大。多说评论框是一款WordPress社会化评论插件,可以用新浪微博、腾讯QQ、人人、豆瓣多帐号登录,帮助网站进行社会化媒体优化。 先去http://...

我的开源项目

HanLP自然语言处理包基于DoubleArrayTrie的Aho Corasick自动机