Java 1.1.6 码点与码点单元(回)

Java 字符串由 char 值序列组成。char 数据类型是一 个采用 UTF-16 编码表示 Unicode 码点的代码单元。

  1. length方法将返回采用 UTF-16 编码表示的给定字符串所需要的代码单元数量。
String greeting = "Hello"; 
int n = greeting.length(); 
// n=5. 
  1. 要想得到实际的长度,即码点数量,可以调用:
int cpCount = greeting.codePointCount(0, greeting.length());
  1. 调用s.charAt(n) 将返回位置 n 的代码单元,n 介于 0 ~ s.length()-1之间。例如:
char first = greeting.charAtO); // first is 'H' 
char last = greeting.charAt(4); // last is ’o’ 
  1. 要想得到第 i 个码点,应该使用下列语句
 int index = greeting.offsetByCodePoints(0,i);
 int cp = greeting.codePointAt(index); 

猜你喜欢

转载自blog.csdn.net/weixin_45884316/article/details/107653451