博主最近需要从一个 JSON 中取出部分数据存到数据库表中,但是却遇到了 背包小鹏 这样的字符串。博主了解到,这是 HTML 字符实体编号,使用 Java 的第三方类 org.apache.commons.lang.StringEscapeUtils 就可以对其进行解码。

如果是在 Maven 项目中,可以导入 jar 包:

<dependency>
   <groupId>commons-lang</groupId>
   <artifactId>commons-lang</artifactId>
   <version>2.6</version>
</dependency>

具体使用如下:

@Test
public void test() {
   String string =  StringEscapeUtils.unescapeHtml("&#x5f20;&#x9646;&#x20;&#x7b56;&#x5212;100");
   System.out.println(string);
}

输出:

张陆 策划100

当然, StringEscapeUtils 工具类中还有很多其他的编码与解码的方法,官方对其描述是:

Escapes and unescapes <code>String</code>s for Java, Java Script, HTML, XML, and SQL.