Categories
- Android (5)
- Cloud Computing (10)
- Development (14)
- Linux (35)
- Uncategorized (36)
- WordPress (5)
Tags
Archives
-
Random Posts
Delicious Bookmarks
- Labor Efficiency: The Next Great Internet Disruption 24 hours ago
- Apache HBase 0.92.0 has been released 2012/02/04
- Ceph 2012/02/04
- Maximize virtio-net performance with vhost-net 2012/02/03
- Android-x86 - Porting Android to x86 2012/02/01
- 中国电信将成立云计算公司 践行“天翼云计算”战略 2012/02/01
Google Reader Shares
- Hudson vs. Jenkins: Is it too soon to declare a winner?
- Galaxy Nexus 的 Super AMOLED 屏幕多了 HD,但少了 Plus
- Faenza Icon theme for Gnome 3.2 makes Ubuntu a little more eye candy
- Google 在台湾、香港及新加坡兴建自己的数据中心,一到两年后启用
- 既定的秩序是教育的结果
- Amazon S3 - 566 Billion Objects, 370,000 Requests/Second, and Hiring!
Links
Meta
Tag Archives: bbcode
Use KefirBB to Extract Text from BBCode String
之前写了一篇帖子介绍如何从字符串中去除 BBCode 标签、提取纯文本信息,使用的是 JBoss Portal format 包,虽然可以解决问题,但非常不完美,比如,无法支持大写标签、无法识别自定义标签等。春节前发现了一个专门用于处理 BBCode 的 Java 库 KefirBB,当时的版本是 0.5,只支持 Java 6,我修改了些源码以支持 Java 5,并发了 patch 给其作者 Kefir。很快 Kefir 发布了新版本 0.6,同时支持 Java 5 & 6. 使用 KefirBB 提取纯文本信息非常简单。首先新建配置文件 kefirbb.xml 并放置到 CLASSPATH 中,其内容如下: <?xml version="1.0" encoding="UTF-8"?> <configuration xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" … Continue reading
Extract Text from BBCode String
正如其名字所暗示的,BBCode 广泛用在论坛程序开发中,比如 phpbb、vbb 等。存储在数据库中的字符串往往是混杂 BBCode 的,如何从这些字符串中剔除 BBCode,以提取纯文本信息?如果使用 PHP 语言,有很多现成可用的 PHP BBCode parser。但如果使用 Java 呢?似乎很难找到现成的 Java BBCode parser。当然,可以使用正则表达式来做匹配分析,不过失之繁琐。无意中,在 JBoss Portal v2.6.7 中发现了一个组件可以分析 BBCode,位于 org.jboss.portal.format.* 包中,其 jar 文件是 portal-format-lib.jar 使用方法: ToTextRenderer render = new ToTextRenderer(); StringWriter writer = new StringWriter(); render.setWriter(writer); render.render(bbString.toCharArray(), … Continue reading