当前位置: 首页 > 图灵资讯 > 技术篇> 高效处理字符串中的标点符号

高效处理字符串中的标点符号

来源:图灵教育
时间:2023-06-14 09:44:17

\pP 其中的小写 p 是 property 意思,表示 Unicode 属性,用于 Unicode 正面表达式前缀。

大写 P 表示 Unicode 七个字符属性之一:标点符。

其他六个是

L:字母;

M:标记符号(一般不会单独出现);

Z:分隔符(如空格、换行等);

S:符号(如数学符号、货币符号等);

N:数字(如阿拉伯数字、罗马数字等);

C:其他字符

string.replaceAll("[\pP""""" "");

使用示例

String s1=“我的宿舍:位于河南省,新乡市牧野区,东区46号,河南师范大学,东校区,东16号学生公寓”;

System.out.println(new JiebaSegmenter().sentenceProcess(s1.replaceAll("[\pP""""" "")));

清洗结果

高效处理字符串中的标点符号_System