博主最近需要从一个 JSON 中取出部分数据存到数据库表中,但是却遇到了 背包小鹏
这样的字符串。博主了解到,这是 HTML 字符实体编号,使用 Java 的第三方类 org.apache.commons.lang.StringEscapeUtils
就可以对其进行解码。
如果是在 Maven 项目中,可以导入 jar 包:
<dependency>
<groupId>commons-lang</groupId> <artifactId>commons-lang</artifactId> <version>2.6</version></dependency>
具体使用如下:
@Test | |
public void test() { | |
String string = StringEscapeUtils.unescapeHtml("张陆 策划100"); | |
System.out.println(string); | |
} |
输出:
张陆 策划100
当然, StringEscapeUtils
工具类中还有很多其他的编码与解码的方法,官方对其描述是:
Escapes and unescapes <code>String</code>s for Java, Java Script, HTML, XML, and SQL.