放牧代码和思想
专注自然语言处理、机器学习算法
    恕不接待索要源码语料者、索求技术方案者、以及不Google的懒人。

PHP

WordPress 分页加html后缀伪静态

WordPress 分页加html后缀伪静态

hankcs阅读(5273)评论(8)

问题 当文章有分页的时候,WordPress生成的永久链接是page.html/2的形式,前面一段是文章的$link,后面的数字代表分页$number。那么问题来了,挖掘……不对,从逻辑上讲这到底是个html文件还是一个目录呢? 难看 在....

WordPress中文分词与智能搜索

WordPress中文分词与智能搜索

hankcs阅读(3061)评论(2)

问题 WordPress的搜索功能非常简陋,如果用户搜索“日语综合教程+第六册”,WordPress会机械地构造一个wp_posts.post_title LIKE '%日语综合教程+第六册%'的SQL查询送到数据库里,结果...

WordPress集成Lucene全文搜索

WordPress集成Lucene全文搜索

hankcs阅读(3319)评论(6)

终于将Lucene集成到中文WordPress中了,实现了中文博客的全文搜索。作为一个搞NLP的博主,如果还在用SQL的LIKE做搜索,那也太不上档次了。这次集成主要难点在于 ①PHP平台上并没有一款成熟的分词套件。 ②Lucene的PHP...

百度云储存批量下载脚本

百度云储存批量下载脚本

hankcs阅读(3559)评论(4)

前些时间在BAE上搭了一个应用,数据写入了百度云储存BCS里。现在想将BCS里的数据搬走,但是官方并没有提供一个一键下载的功能。只好自己写了一个,运行良好。 此脚本在本地PHP环境下运行,需要开启CURL拓展。代码里的krumo是一个调试输...

多说自动摘要与防剽窃代码

多说自动摘要与防剽窃代码

hankcs阅读(3064)评论(3)

多说还算是WordPress上一款不错的社交网络评论框插件,不过它有“剽窃”博主文章的嫌疑。在wp-content/plugins/duoshuo/WordPress.php中有如下“剽窃”代码: 红色方框内的代码直接将整个post的con...

再谈BAE上传文件的临时路径Bug

再谈BAE上传文件的临时路径Bug

hankcs阅读(3054)

上次写了一篇关于sys_get_temp_dir()实现错误,觉得写得不够,这次来举例说明使用自有域名访问BaeApp时导致的文件上传失败现象以及解决方案。 首先搭建一个测试demo: <html> <body> &...

BAE的Bug——sys_get_temp_dir()实现错误

BAE的Bug——sys_get_temp_dir()实现错误

hankcs阅读(2572)评论(4)

BAE2.0不支持本地读写,但是提供了一个PHP的库函数sys_get_temp_dir()来获取一个临时文件夹,这个文件夹可供临时读写。但是我发现在绑定域名之后,这个函数并没有达到“返回一个可读可写的路径”之目的。此时上传文件会触发UPL...

论ECMall的粗糙

论ECMall的粗糙

hankcs阅读(2309)评论(0)

只举一个例子,说明ECMall表面的光鲜之后,隐藏着多么粗糙的内核。 ECMall中除了一个BaseApp类之外所有的App类都是ECBaseApp的子类,ECBaseApp是ECMall中举足轻重的一个类,它的父类是BaseApp,Bas...

Yii ajax显示错误提示,messagebox

Yii ajax显示错误提示,messagebox

hankcs阅读(4305)评论(0)

在Yii中,可以利用ajax执行一个action,但是这个action有时候会有弹出错误讯息的需求,这时候的处理方式如下 基本思想 利用exception,比如 throw new CHttpException(403,...

PHP IDE推荐与评测 ZendStudio VS.PHP PhpStorm

PHP IDE推荐与评测 ZendStudio VS.PHP PhpStorm

hankcs阅读(24078)评论(11)

开发网站的时候,文件众多,类库复杂,没有一款趁手的IDE就无法满足大型项目需求。我接触过一些PHP的IDE,在这里做个评测,一家之言,不用太认真。 前言 这里列出能称得上IDE的三大IDE——ZendStudio,VS.PHP和PhpSto...

我的开源项目

HanLP自然语言处理包基于DoubleArrayTrie的Aho Corasick自动机