Tag Archives: bbcode

Use KefirBB to Extract Text from BBCode String

之前写了一篇帖子介绍如何从字符串中去除 BBCode 标签、提取纯文本信息,使用的是 JBoss Portal format 包,虽然可以解决问题,但非常不完美,比如,无法支持大写标签、无法识别自定义标签等。春节前发现了一个专门用于处理 BBCode 的 Java 库 KefirBB,当时的版本是 0.5,只支持 Java 6,我修改了些源码以支持 Java 5,并发了 patch 给其作者 Kefir。很快 Kefir 发布了新版本 0.6,同时支持 Java 5 & 6. 使用 KefirBB 提取纯文本信息非常简单。首先新建配置文件 kefirbb.xml 并放置到 CLASSPATH 中,其内容如下: <?xml version="1.0" encoding="UTF-8"?>   <configuration xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" … Continue reading

Posted in Development | Tagged | 2 Comments

Extract Text from BBCode String

正如其名字所暗示的,BBCode 广泛用在论坛程序开发中,比如 phpbb、vbb 等。存储在数据库中的字符串往往是混杂 BBCode 的,如何从这些字符串中剔除 BBCode,以提取纯文本信息?如果使用 PHP 语言,有很多现成可用的 PHP BBCode parser。但如果使用 Java 呢?似乎很难找到现成的 Java BBCode parser。当然,可以使用正则表达式来做匹配分析,不过失之繁琐。无意中,在 JBoss Portal v2.6.7 中发现了一个组件可以分析 BBCode,位于 org.jboss.portal.format.* 包中,其 jar 文件是 portal-format-lib.jar 使用方法: ToTextRenderer render = new ToTextRenderer(); StringWriter writer = new StringWriter(); render.setWriter(writer); render.render(bbString.toCharArray(), … Continue reading

Posted in Development | Tagged | 1 Comment