鴻蒙OS Character

2022-04-29 17:47 更新

Character

java.lang.Object

|---java.lang.Character

public final class Character
extends Object
implements Serializable, Comparable<Character>

Character 類將原始類型 char 的值包裝在一個(gè)對(duì)象中。 Character 類的對(duì)象包含一個(gè)類型為 char 的字段。

此外,該類提供了大量靜態(tài)方法,用于確定字符的類別(小寫字母、數(shù)字等)以及將字符從大寫字母轉(zhuǎn)換為小寫字母,反之亦然。

Unicode 一致性

Character 類的字段和方法是根據(jù) Unicode 標(biāo)準(zhǔn)中的字符信息定義的,特別是作為 Unicode 字符數(shù)據(jù)庫一部分的 UnicodeData 文件。此文件為每個(gè)分配的 Unicode 代碼點(diǎn)或字符范圍指定屬性,包括名稱和類別。該文件可從 Unicode 聯(lián)盟 http://www.unicode.org 獲得。

Java SE 8 平臺(tái)使用來自 Unicode 標(biāo)準(zhǔn) 6.2 版的字符信息,帶有兩個(gè)擴(kuò)展。首先,Java SE 8 平臺(tái)允許類 Character 的實(shí)現(xiàn)使用日本時(shí)代的代碼點(diǎn) U+32FF,從 6.2 之后分配代碼點(diǎn)的 Unicode 標(biāo)準(zhǔn)的第一個(gè)版本開始。其次,鑒于新貨幣頻繁出現(xiàn)這一事實(shí),Java SE 8 平臺(tái)允許類 Character 的實(shí)現(xiàn)使用 Unicode 標(biāo)準(zhǔn) 10.0 版中的貨幣符號(hào)塊。因此,在處理上述代碼點(diǎn)(版本 6.2 之外)時(shí),Character 類的字段和方法的行為可能會(huì)因 Java SE 8 平臺(tái)的實(shí)現(xiàn)而異,但以下定義 Java 標(biāo)識(shí)符的方法除外:isJavaIdentifierStart(int)、isJavaIdentifierStart (char)、isJavaIdentifierPart(int) 和 isJavaIdentifierPart(char)。 Java 標(biāo)識(shí)符中的代碼點(diǎn)必須取自 Unicode 標(biāo)準(zhǔn) 6.2 版。

Unicode 字符表示

char 數(shù)據(jù)類型(以及因此 Character 對(duì)象封裝的值)基于原始 Unicode 規(guī)范,該規(guī)范將字符定義為固定寬度的 16 位實(shí)體。此后,Unicode 標(biāo)準(zhǔn)已更改為允許表示需要超過 16 位的字符。合法代碼點(diǎn)的范圍現(xiàn)在是 U+0000 到 U+10FFFF,稱為 Unicode 標(biāo)量值。 (請(qǐng)參閱 Unicode 標(biāo)準(zhǔn)中 U+n 符號(hào)的定義。)

從 U+0000 到 U+FFFF 的字符集有時(shí)稱為基本多語言平面 (BMP)。碼位大于 U+FFFF 的字符稱為補(bǔ)充字符。 Java 平臺(tái)在 char 數(shù)組以及 String 和 StringBuffer 類中使用 UTF-16 表示。在此表示中,補(bǔ)充字符表示為一對(duì) char 值,第一個(gè)來自高代理范圍 (\uD800-\uDBFF),第二個(gè)來自低代理范圍 (\uDC00-\uDFFF)。

因此,char 值表示基本多語言平面 (BMP) 代碼點(diǎn),包括代理代碼點(diǎn)或 UTF-16 編碼的代碼單元。一個(gè) int 值表示所有 Unicode 代碼點(diǎn),包括補(bǔ)充代碼點(diǎn)。 int 的低(最低)21 位用于表示 Unicode 代碼點(diǎn),高(最高)11 位必須為零。除非另有說明,關(guān)于補(bǔ)充字符和代理字符值的行為如下:

  • 只接受 char 值的方法不支持補(bǔ)充字符。 它們將代理范圍中的 char 值視為未定義字符。 例如,Character.isLetter('\uD840') 返回 false,即使此特定值后跟字符串中的任何低代理值將表示一個(gè)字母。
  • 接受 int 值的方法支持所有 Unicode 字符,包括補(bǔ)充字符。 例如,Character.isLetter(0x2F81A) 返回 true,因?yàn)榇a點(diǎn)值表示一個(gè)字母(CJK 表意文字)。

在 Java SE API 文檔中,Unicode 代碼點(diǎn)用于 U+0000 到 U+10FFFF 范圍內(nèi)的字符值,Unicode 代碼單元用于 16 位字符值,即 UTF-16 編碼的代碼單元。

嵌套類摘要

修飾符和類型 描述
static class Character.Subset 此類的實(shí)例表示 Unicode 字符集的特定子集。
static class Character.UnicodeBlock 表示 Unicode 規(guī)范中字符塊的字符子集系列。
static class Character.UnicodeScript 表示 Unicode 標(biāo)準(zhǔn)附件 #24:腳本名稱中定義的字符腳本的字符子集系列。

字段摘要

修飾符和類型 字段 描述
static int BYTES 用于以無符號(hào)二進(jìn)制形式表示 char 值的字節(jié)數(shù)。
static byte COMBINING_SPACING_MARK Unicode 規(guī)范中的通用類別“Mc”。
static byte CONNECTOR_PUNCTUATION Unicode 規(guī)范中的通用類別“Pc”。
static byte CONTROL Unicode 規(guī)范中的通用類別“Cc”。
static byte CURRENCY_SYMBOL Unicode 規(guī)范中的通用類別“Sc”。
static byte DASH_PUNCTUATION Unicode 規(guī)范中的通用類別“Pd”。
static byte DECIMAL_DIGIT_NUMBER Unicode 規(guī)范中的通用類別“Nd”。
static byte DIRECTIONALITY_ARABIC_NUMBER Unicode 規(guī)范中的弱雙向字符類型“AN”。
static byte DIRECTIONALITY_BOUNDARY_NEUTRAL Unicode 規(guī)范中的弱雙向字符類型“BN”。
static byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR Unicode 規(guī)范中的弱雙向字符類型“CS”。
static byte DIRECTIONALITY_EUROPEAN_NUMBER Unicode 規(guī)范中的弱雙向字符類型“EN”。
static byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR Unicode 規(guī)范中的弱雙向字符類型“ES”。
static byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR Unicode 規(guī)范中的弱雙向字符類型“ET”。
static byte DIRECTIONALITY_LEFT_TO_RIGHT Unicode 規(guī)范中的強(qiáng)雙向字符類型“L”。
static byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING Unicode 規(guī)范中的強(qiáng)雙向字符類型“LRE”。
static byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE Unicode 規(guī)范中的強(qiáng)雙向字符類型“LRO”。
static byte DIRECTIONALITY_NONSPACING_MARK Unicode 規(guī)范中的弱雙向字符類型“NSM”。
static byte DIRECTIONALITY_OTHER_NEUTRALS Unicode 規(guī)范中的中性雙向字符類型“ON”。
static byte DIRECTIONALITY_PARAGRAPH_SEPARATOR Unicode 規(guī)范中的中性雙向字符類型“B”。
static byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT Unicode 規(guī)范中的弱雙向字符類型“PDF”。
static byte DIRECTIONALITY_RIGHT_TO_LEFT Unicode 規(guī)范中的強(qiáng)雙向字符類型“R”。
static byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC Unicode 規(guī)范中的強(qiáng)雙向字符類型“AL”。
static byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING Unicode 規(guī)范中的強(qiáng)雙向字符類型“RLE”。
static byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE Unicode 規(guī)范中的強(qiáng)雙向字符類型“RLO”。
static byte DIRECTIONALITY_SEGMENT_SEPARATOR Unicode 規(guī)范中的中性雙向字符類型“S”。
static byte DIRECTIONALITY_UNDEFINED 未定義的雙向字符類型。
static byte DIRECTIONALITY_WHITESPACE Unicode 規(guī)范中的中性雙向字符類型“WS”。
static byte ENCLOSING_MARK Unicode 規(guī)范中的通用類別“Me”。
static byte END_PUNCTUATION Unicode 規(guī)范中的通用類別“Pe”。
static byte FINAL_QUOTE_PUNCTUATION Unicode 規(guī)范中的通用類別“Pf”。
static byte FORMAT Unicode 規(guī)范中的通用類別“Cf”。
static byte INITIAL_QUOTE_PUNCTUATION Unicode 規(guī)范中的通用類別“Pi”。
static byte LETTER_NUMBER Unicode 規(guī)范中的通用類別“Nl”。
static byte LINE_SEPARATOR Unicode 規(guī)范中的通用類別“Zl”。
static byte LOWERCASE_LETTER Unicode 規(guī)范中的通用類別“Ll”。
static byte MATH_SYMBOL Unicode 規(guī)范中的通用類別“Sm”。
static int MAX_CODE_POINT Unicode 碼位的最大值,常量 U+10FFFF。
static char MAX_HIGH_SURROGATE UTF-16 編碼中 Unicode 高代理代碼單元的最大值,常量 '\uDBFF'。
static char MAX_LOW_SURROGATE UTF-16 編碼中 Unicode 低代理代碼單元的最大值,常量 '\uDFFF'。
static int MAX_RADIX 可用于與字符串相互轉(zhuǎn)換的最大基數(shù)。
static char MAX_SURROGATE UTF-16 編碼中 Unicode 代理代碼單元的最大值,常量 '\uDFFF'。
static char MAX_VALUE 該字段的常量值是 char 類型的最大值,'\uFFFF'。
static int MIN_CODE_POINT Unicode 代碼點(diǎn)的最小值,常量 U+0000。
static char MIN_HIGH_SURROGATE UTF-16 編碼中 Unicode 高代理代碼單元的最小值,常量 '\uD800'。
static char MIN_LOW_SURROGATE UTF-16 編碼中 Unicode 低代理代碼單元的最小值,常量 '\uDC00'。
static int MIN_RADIX 可用于與字符串相互轉(zhuǎn)換的最小基數(shù)。
static int MIN_SUPPLEMENTARY_CODE_POINT Unicode 補(bǔ)充碼點(diǎn)的最小值,常數(shù) U+10000。
static char MIN_SURROGATE UTF-16 編碼中 Unicode 代理代碼單元的最小值,常量 '\uD800'。
static char MIN_VALUE 該字段的常數(shù)值是 char 類型的最小值,'\u0000'。
static byte MODIFIER_LETTER Unicode 規(guī)范中的通用類別“Lm”。
static byte MODIFIER_SYMBOL Unicode 規(guī)范中的通用類別“Sk”。
static byte NON_SPACING_MARK Unicode 規(guī)范中的通用類別“Mn”。
static byte OTHER_LETTER Unicode 規(guī)范中的通用類別“Lo”。
static byte OTHER_NUMBER Unicode 規(guī)范中的通用類別“No”。
static byte OTHER_PUNCTUATION Unicode 規(guī)范中的通用類別“Po”。
static byte OTHER_SYMBOL Unicode 規(guī)范中的一般類別“So”。
static byte PARAGRAPH_SEPARATOR Unicode 規(guī)范中的通用類別“Zp”。
static byte PRIVATE_USE Unicode 規(guī)范中的通用類別“Co”。
static int SIZE 用于以無符號(hào)二進(jìn)制形式表示 char 值的位數(shù),常量 16。
static byte SPACE_SEPARATOR Unicode 規(guī)范中的通用類別“Zs”。
static byte START_PUNCTUATION Unicode 規(guī)范中的通用類別“Ps”。
static byte SURROGATE Unicode 規(guī)范中的通用類別“Cs”。
static byte TITLECASE_LETTER Unicode 規(guī)范中的通用類別“Lt”。
static ClassCharacter TYPE 表示基本類型 char 的 Class 實(shí)例。
static byte UNASSIGNED Unicode 規(guī)范中的通用類別“Cn”。
static byte UPPERCASE_LETTER Unicode 規(guī)范中的通用類別“Lu”。

構(gòu)造函數(shù)摘要

構(gòu)造函數(shù) 描述
Character(char value) 構(gòu)造一個(gè)新分配的 Character 對(duì)象,該對(duì)象表示指定的 char 值。

方法總結(jié)

修飾符和類型 方法 描述
static int charCount(int codePoint) 確定表示指定字符(Unicode 代碼點(diǎn))所需的 char 值的數(shù)量。
char charValue() 返回此 Character 對(duì)象的值。
static int codePointAt(char[] a, int index) 返回 char 數(shù)組給定索引處的代碼點(diǎn)。
static int codePointAt(char[] a, int index, int limit) 返回 char 數(shù)組給定索引處的代碼點(diǎn),其中只能使用索引小于限制的數(shù)組元素。
static int codePointAt(CharSequence seq, int index) 返回 CharSequence 的給定索引處的代碼點(diǎn)。
static int codePointBefore(char[] a, int index) 返回 char 數(shù)組的給定索引之前的代碼點(diǎn)。
static int codePointBefore(char[] a, int index, int start) 返回 char 數(shù)組的給定索引之前的代碼點(diǎn),其中只能使用索引大于或等于 start 的數(shù)組元素。
static int codePointBefore(CharSequence seq, int index) 返回 CharSequence 的給定索引之前的代碼點(diǎn)。
static int codePointCount(char[] a, int offset, int count) 返回 char 數(shù)組參數(shù)的子數(shù)組中的 Unicode 代碼點(diǎn)數(shù)。
static int codePointCount(CharSequence seq, int beginIndex, int endIndex) 返回指定字符序列的文本范圍內(nèi)的 Unicode 代碼點(diǎn)數(shù)。
static int compare(char x, char y) 以數(shù)字方式比較兩個(gè) char 值。
int compareTo(Character anotherCharacter) 以數(shù)字方式比較兩個(gè) Character 對(duì)象。
static int digit(char ch, int radix) 返回指定基數(shù)中字符 ch 的數(shù)值。
static int digit(int codePoint, int radix) 返回指定基數(shù)中指定字符(Unicode 代碼點(diǎn))的數(shù)值。
boolean equals(Object obj) 將此對(duì)象與指定對(duì)象進(jìn)行比較。
static char forDigit(int digit, int radix) 確定指定基數(shù)中特定數(shù)字的字符表示。
static byte getDirectionality(char ch) 返回給定字符的 Unicode 方向性屬性。
static byte getDirectionality(int codePoint) 返回給定字符(Unicode 代碼點(diǎn))的 Unicode 方向性屬性。
static String getName(int codePoint) 返回指定字符代碼點(diǎn)的 Unicode 名稱,如果代碼點(diǎn)未分配,則返回 null。
static int getNumericValue(char ch) 返回指定 Unicode 字符表示的 int 值。
static int getNumericValue(int codePoint) 返回指定字符(Unicode 代碼點(diǎn))表示的 int 值。
static int getType(char ch) 返回一個(gè)值,指示字符的一般類別。
static int getType(int codePoint) 返回一個(gè)值,指示字符的一般類別。
int hashCode() 返回此字符的哈希碼; 等于調(diào)用 charValue() 的結(jié)果。
static int hashCode(char value) 返回 char 值的哈希碼; 與 Character.hashCode() 兼容。
static char highSurrogate(int codePoint) 返回以 UTF-16 編碼表示指定補(bǔ)充字符(Unicode 代碼點(diǎn))的代理項(xiàng)對(duì)的前導(dǎo)代理項(xiàng)(高代理項(xiàng)代碼單元)。
static boolean isAlphabetic(int codePoint) 確定指定字符(Unicode 代碼點(diǎn))是否為字母表。
static boolean isBmpCodePoint(int codePoint) 確定指定字符(Unicode 代碼點(diǎn))是否在基本多語言平面 (BMP) 中。
static boolean isDefined(char ch) 確定字符是否以 Unicode 定義。
static boolean isDefined(int codePoint) 確定字符(Unicode 代碼點(diǎn))是否以 Unicode 定義。
static boolean isDigit(char ch) 確定指定的字符是否為數(shù)字。
static boolean isDigit(int codePoint) 確定指定的字符(Unicode 代碼點(diǎn))是否為數(shù)字。
static boolean isHighSurrogate(char ch) 確定給定的 char 值是否是 Unicode 高代理代碼單元(也稱為前導(dǎo)代理代碼單元)。
static boolean isIdentifierIgnorable(char ch) 確定是否應(yīng)將指定字符視為 Java 標(biāo)識(shí)符或 Unicode 標(biāo)識(shí)符中的可忽略字符。
static boolean isIdentifierIgnorable(int codePoint) 確定是否應(yīng)將指定字符(Unicode 代碼點(diǎn))視為 Java 標(biāo)識(shí)符或 Unicode 標(biāo)識(shí)符中的可忽略字符。
static boolean isIdeographic(int codePoint) 確定指定字符(Unicode 代碼點(diǎn))是否為 Unicode 標(biāo)準(zhǔn)定義的 CJKV(中文、日文、韓文和越南文)表意文字。
static boolean isISOControl(char ch) 確定指定字符是否為 ISO 控制字符。
static boolean isISOControl(int codePoint) 確定引用的字符(Unicode 代碼點(diǎn))是否為 ISO 控制字符。
static boolean isJavaIdentifierPart(char ch) 確定指定字符是否可以是 Java 標(biāo)識(shí)符的一部分,而不是第一個(gè)字符。
static boolean isJavaIdentifierPart(int codePoint) 確定字符(Unicode 代碼點(diǎn))是否可以是 Java 標(biāo)識(shí)符的一部分,而不是第一個(gè)字符。
static boolean isJavaIdentifierStart(char ch) 確定指定的字符是否允許作為 Java 標(biāo)識(shí)符中的第一個(gè)字符。
static boolean isJavaIdentifierStart(int codePoint) 確定字符(Unicode 代碼點(diǎn))是否允許作為 Java 標(biāo)識(shí)符中的第一個(gè)字符。
static boolean isJavaLetter(char ch) 已棄用。 替換為 isJavaIdentifierStart(char)。
static boolean isJavaLetterOrDigit(char ch) 已棄用。 替換為 isJavaIdentifierPart(char)。
static boolean isLetter(char ch) 確定指定的字符是否為字母。
static boolean isLetter(int codePoint) 確定指定字符(Unicode 代碼點(diǎn))是否為字母。
static boolean isLetterOrDigit(char ch) 確定指定的字符是字母還是數(shù)字。
static boolean isLetterOrDigit(int codePoint) 確定指定的字符(Unicode 代碼點(diǎn))是字母還是數(shù)字。
static boolean isLowerCase(char ch) 確定指定字符是否為小寫字符。
static boolean isLowerCase(int codePoint) 確定指定字符(Unicode 代碼點(diǎn))是否為小寫字符。
static boolean isLowSurrogate(char ch) 確定給定的 char 值是否是 Unicode 低代理代碼單元(也稱為尾隨代理代碼單元)。
static boolean isMirrored(char ch) 確定字符是否根據(jù) Unicode 規(guī)范進(jìn)行鏡像。
static boolean isMirrored(int codePoint) 確定是否根據(jù) Unicode 規(guī)范鏡像指定的字符(Unicode 代碼點(diǎn))。
static boolean isSpace(char ch) 已棄用。 替換為 isWhitespace(char)。
static boolean isSpaceChar(char ch) 確定指定字符是否為 Unicode 空格字符。
static boolean isSpaceChar(int codePoint) 確定指定字符(Unicode 代碼點(diǎn))是否為 Unicode 空格字符。
static boolean isSupplementaryCodePoint(int codePoint) 確定指定字符(Unicode 代碼點(diǎn))是否在補(bǔ)充字符范圍內(nèi)。
static boolean isSurrogate(char ch) 確定給定的 char 值是否是 Unicode 代理代碼單元。
static boolean isSurrogatePair(char high, char low) 確定指定的 char 值對(duì)是否為有效的 Unicode 代理項(xiàng)對(duì)。
static boolean isTitleCase(char ch) 確定指定的字符是否為標(biāo)題字符。
static boolean isTitleCase(int codePoint) 確定指定字符(Unicode 代碼點(diǎn))是否為標(biāo)題字符。
static boolean isUnicodeIdentifierPart(char ch) 確定指定字符是否可以是 Unicode 標(biāo)識(shí)符的一部分,而不是第一個(gè)字符。
static boolean isUnicodeIdentifierPart(int codePoint) 確定指定字符(Unicode 代碼點(diǎn))是否可以是 Unicode 標(biāo)識(shí)符的一部分,而不是第一個(gè)字符。
static boolean isUnicodeIdentifierStart(char ch) 確定指定字符是否允許作為 Unicode 標(biāo)識(shí)符中的第一個(gè)字符。
static boolean isUnicodeIdentifierStart(int codePoint) 確定指定的字符(Unicode 代碼點(diǎn))是否允許作為 Unicode 標(biāo)識(shí)符中的第一個(gè)字符。
static boolean isUpperCase(char ch) 確定指定字符是否為大寫字符。
static boolean isUpperCase(int codePoint) 確定指定字符(Unicode 代碼點(diǎn))是否為大寫字符。
static boolean isValidCodePoint(int codePoint) 確定指定的代碼點(diǎn)是否是有效的 Unicode 代碼點(diǎn)值。
static boolean isWhitespace(char ch) 根據(jù) Java 確定指定字符是否為空格。
static boolean isWhitespace(int codePoint) 根據(jù) Java 確定指定字符(Unicode 代碼點(diǎn))是否為空格。
static char lowSurrogate(int codePoint) 返回以 UTF-16 編碼表示指定補(bǔ)充字符(Unicode 代碼點(diǎn))的代理項(xiàng)對(duì)的尾隨代理項(xiàng)(低代理項(xiàng)代碼單元)。
static int offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset) 返回給定 char 子數(shù)組中從給定索引偏移 codePointOffset 代碼點(diǎn)的索引。
static int offsetByCodePoints(CharSequence seq, int index, int codePointOffset) 返回給定 char 序列中的索引,該索引與給定索引偏移 codePointOffset 代碼點(diǎn)。
static char reverseBytes(char ch) 返回通過反轉(zhuǎn)指定 char 值中的字節(jié)順序獲得的值。
static char[] toChars(int codePoint) 將指定字符(Unicode 代碼點(diǎn))轉(zhuǎn)換為存儲(chǔ)在 char 數(shù)組中的 UTF-16 表示形式。
static int toChars(int codePoint, char[] dst, int dstIndex) 將指定的字符(Unicode 代碼點(diǎn))轉(zhuǎn)換為其 UTF-16 表示。
static int toCodePoint(char high, char low) 將指定的代理對(duì)轉(zhuǎn)換為其補(bǔ)充代碼點(diǎn)值。
static char toLowerCase(char ch) 使用 UnicodeData 文件中的大小寫映射信息將字符參數(shù)轉(zhuǎn)換為小寫。
static int toLowerCase(int codePoint) 使用 UnicodeData 文件中的大小寫映射信息將字符(Unicode 代碼點(diǎn))參數(shù)轉(zhuǎn)換為小寫。
String toString() 返回一個(gè)表示此 Character 值的 String 對(duì)象。
static String toString(char c) 返回表示指定字符的 String 對(duì)象。
static char toTitleCase(char ch) 使用 UnicodeData 文件中的大小寫映射信息將字符參數(shù)轉(zhuǎn)換為標(biāo)題大小寫。
static int toTitleCase(int codePoint) 使用 UnicodeData 文件中的大小寫映射信息將字符(Unicode 代碼點(diǎn))參數(shù)轉(zhuǎn)換為標(biāo)題大小寫。
static char toUpperCase(char ch) 使用 UnicodeData 文件中的大小寫映射信息將字符參數(shù)轉(zhuǎn)換為大寫。
static int toUpperCase(int codePoint) 使用 UnicodeData 文件中的大小寫映射信息將字符(Unicode 代碼點(diǎn))參數(shù)轉(zhuǎn)換為大寫。
static Character valueOf(char c) 返回表示指定 char 值的 Character 實(shí)例。
從類 java.lang.Object 繼承的方法
clone, finalize, getClass, notify, notifyAll, wait, wait, wait

字段詳細(xì)信息

BYTES

public static final int BYTES

用于以無符號(hào)二進(jìn)制形式表示 char 值的字節(jié)數(shù)。

COMBINING_SPACING_MARK

public static final byte COMBINING_SPACING_MARK

Unicode 規(guī)范中的通用類別“Mc”。

CONNECTOR_PUNCTUATION

public static final byte CONNECTOR_PUNCTUATION

Unicode 規(guī)范中的通用類別“Pc”。

CONTROL

public static final byte CONTROL

Unicode 規(guī)范中的通用類別“Cc”。

CURRENCY_SYMBOL

public static final byte CURRENCY_SYMBOL

Unicode 規(guī)范中的通用類別“Sc”。

DASH_PUNCTUATION

public static final byte DASH_PUNCTUATION

Unicode 規(guī)范中的通用類別“Pd”。

DECIMAL_DIGIT_NUMBER

public static final byte DECIMAL_DIGIT_NUMBER

Unicode 規(guī)范中的通用類別“Nd”。

DIRECTIONALITY_ARABIC_NUMBER

public static final byte DIRECTIONALITY_ARABIC_NUMBER

Unicode 規(guī)范中的弱雙向字符類型“AN”。

DIRECTIONALITY_BOUNDARY_NEUTRAL

public static final byte DIRECTIONALITY_BOUNDARY_NEUTRAL

Unicode 規(guī)范中的弱雙向字符類型“BN”。

DIRECTIONALITY_COMMON_NUMBER_SEPARATOR

public static final byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR

Unicode 規(guī)范中的弱雙向字符類型“CS”。

DIRECTIONALITY_EUROPEAN_NUMBER

public static final byte DIRECTIONALITY_EUROPEAN_NUMBER

Unicode 規(guī)范中的弱雙向字符類型“EN”。

DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR

public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR

Unicode 規(guī)范中的弱雙向字符類型“ES”。

DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR

public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR

Unicode 規(guī)范中的弱雙向字符類型“ET”。

DIRECTIONALITY_LEFT_TO_RIGHT

public static final byte DIRECTIONALITY_LEFT_TO_RIGHT

Unicode 規(guī)范中的強(qiáng)雙向字符類型“L”。

DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING

public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING

Unicode 規(guī)范中的強(qiáng)雙向字符類型“LRE”。

DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE

public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE

Unicode 規(guī)范中的強(qiáng)雙向字符類型“LRO”。

DIRECTIONALITY_NONSPACING_MARK

public static final byte DIRECTIONALITY_NONSPACING_MARK

Unicode 規(guī)范中的弱雙向字符類型“NSM”。

DIRECTIONALITY_OTHER_NEUTRALS

public static final byte DIRECTIONALITY_OTHER_NEUTRALS

Unicode 規(guī)范中的中性雙向字符類型“ON”。

DIRECTIONALITY_PARAGRAPH_SEPARATOR

public static final byte DIRECTIONALITY_PARAGRAPH_SEPARATOR

Unicode 規(guī)范中的中性雙向字符類型“B”。

DIRECTIONALITY_POP_DIRECTIONAL_FORMAT

public static final byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT

Unicode 規(guī)范中的弱雙向字符類型“PDF”。

DIRECTIONALITY_RIGHT_TO_LEFT

public static final byte DIRECTIONALITY_RIGHT_TO_LEFT

Unicode 規(guī)范中的強(qiáng)雙向字符類型“R”。

DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC

public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC

Unicode 規(guī)范中的強(qiáng)雙向字符類型“AL”。

DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING

public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING

Unicode 規(guī)范中的強(qiáng)雙向字符類型“RLE”。

DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE

public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE

Unicode 規(guī)范中的強(qiáng)雙向字符類型“RLO”。

DIRECTIONALITY_SEGMENT_SEPARATOR

public static final byte DIRECTIONALITY_SEGMENT_SEPARATOR

Unicode 規(guī)范中的中性雙向字符類型“S”。

DIRECTIONALITY_UNDEFINED

public static final byte DIRECTIONALITY_UNDEFINED

未定義的雙向字符類型。 未定義的 char 值在 Unicode 規(guī)范中具有未定義的方向性。

DIRECTIONALITY_WHITESPACE

public static final byte DIRECTIONALITY_WHITESPACE

Unicode 規(guī)范中的中性雙向字符類型“WS”。

ENCLOSING_MARK

public static final byte ENCLOSING_MARK

Unicode 規(guī)范中的通用類別“Me”。

END_PUNCTUATION

public static final byte END_PUNCTUATION

Unicode 規(guī)范中的通用類別“Pe”。

FINAL_QUOTE_PUNCTUATION

public static final byte FINAL_QUOTE_PUNCTUATION

Unicode 規(guī)范中的通用類別“Pf”。

FORMAT

public static final byte FORMAT

Unicode 規(guī)范中的通用類別“Cf”。

INITIAL_QUOTE_PUNCTUATION

public static final byte INITIAL_QUOTE_PUNCTUATION

Unicode 規(guī)范中的通用類別“Pi”。

LETTER_NUMBER

public static final byte LETTER_NUMBER

Unicode 規(guī)范中的通用類別“Nl”。

LINE_SEPARATOR

public static final byte LINE_SEPARATOR

Unicode 規(guī)范中的通用類別“Zl”。

LOWERCASE_LETTER

public static final byte LOWERCASE_LETTER

Unicode 規(guī)范中的通用類別“Ll”。

MATH_SYMBOL

public static final byte MATH_SYMBOL

Unicode 規(guī)范中的通用類別“Sm”。

MAX_CODE_POINT

public static final int MAX_CODE_POINT

Unicode 碼位的最大值,常量 U+10FFFF。

MAX_HIGH_SURROGATE

public static final char MAX_HIGH_SURROGATE

UTF-16 編碼中 Unicode 高代理代碼單元的最大值,常量 '\uDBFF'。 高代理也稱為領(lǐng)先代理。

MAX_LOW_SURROGATE

public static final char MAX_LOW_SURROGATE

UTF-16 編碼中 Unicode 低代理代碼單元的最大值,常量 '\uDFFF'。 低代理也稱為尾隨代理。

MAX_RADIX

public static final int MAX_RADIX

可用于與字符串相互轉(zhuǎn)換的最大基數(shù)。 該字段的常數(shù)值是基數(shù)轉(zhuǎn)換方法(例如 digit 方法、forDigit 方法和 Integer 類的 toString 方法)中基數(shù)參數(shù)允許的最大值。

MAX_SURROGATE

public static final char MAX_SURROGATE

UTF-16 編碼中 Unicode 代理代碼單元的最大值,常量 '\uDFFF'。

MAX_VALUE

public static final char MAX_VALUE

該字段的常量值是 char 類型的最大值,'\uFFFF'。

MIN_CODE_POINT

public static final int MIN_CODE_POINT

Unicode 代碼點(diǎn)的最小值,常量 U+0000。

MIN_HIGH_SURROGATE

public static final char MIN_HIGH_SURROGATE

UTF-16 編碼中 Unicode 高代理代碼單元的最小值,常量 '\uD800'。 高代理也稱為領(lǐng)先代理。

MIN_LOW_SURROGATE

public static final char MIN_LOW_SURROGATE

UTF-16 編碼中 Unicode 低代理代碼單元的最小值,常量 '\uDC00'。 低代理也稱為尾隨代理。

MIN_RADIX

public static final int MIN_RADIX

可用于與字符串相互轉(zhuǎn)換的最小基數(shù)。 該字段的常量值是基數(shù)轉(zhuǎn)換方法(如 digit 方法、forDigit 方法和 Integer 類的 toString 方法)中允許的 radix 參數(shù)的最小值。

MIN_SUPPLEMENTARY_CODE_POINT

public static final int MIN_SUPPLEMENTARY_CODE_POINT

Unicode 補(bǔ)充碼點(diǎn)的最小值,常數(shù) U+10000。

MIN_SURROGATE

public static final char MIN_SURROGATE

UTF-16 編碼中 Unicode 代理代碼單元的最小值,常量 '\uD800'。

MIN_VALUE

public static final char MIN_VALUE

該字段的常數(shù)值是 char 類型的最小值,'\u0000'。

MODIFIER_LETTER

public static final byte MODIFIER_LETTER

Unicode 規(guī)范中的通用類別“Lm”。

MODIFIER_SYMBOL

public static final byte MODIFIER_SYMBOL

Unicode 規(guī)范中的通用類別“Sk”。

NON_SPACING_MARK

public static final byte NON_SPACING_MARK

Unicode 規(guī)范中的通用類別“Mn”。

OTHER_LETTER

public static final byte OTHER_LETTER

Unicode 規(guī)范中的通用類別“Lo”。

OTHER_NUMBER

public static final byte OTHER_NUMBER

Unicode 規(guī)范中的通用類別“No”。

OTHER_PUNCTUATION

public static final byte OTHER_PUNCTUATION

Unicode 規(guī)范中的通用類別“Po”。

OTHER_SYMBOL

public static final byte OTHER_SYMBOL

Unicode 規(guī)范中的一般類別“So”。

PARAGRAPH_SEPARATOR

public static final byte PARAGRAPH_SEPARATOR

Unicode 規(guī)范中的通用類別“Zp”。

PRIVATE_USE

public static final byte PRIVATE_USE

Unicode 規(guī)范中的通用類別“Co”。

SIZE

public static final int SIZE

用于以無符號(hào)二進(jìn)制形式表示 char 值的位數(shù),常量 16。

SPACE_SEPARATOR

public static final byte SPACE_SEPARATOR

Unicode 規(guī)范中的通用類別“Zs”。

START_PUNCTUATION

public static final byte START_PUNCTUATION

Unicode 規(guī)范中的通用類別“Ps”。

SURROGATE

public static final byte SURROGATE

Unicode 規(guī)范中的通用類別“Cs”。

TITLECASE_LETTER

public static final byte TITLECASE_LETTER

Unicode 規(guī)范中的通用類別“Lt”。

TYPE

public static final ClassCharacter TYPE

表示基本類型 char 的 Class 實(shí)例。

UNASSIGNED

public static final byte UNASSIGNED

Unicode 規(guī)范中的通用類別“Cn”。

UPPERCASE_LETTER

public static final byte UPPERCASE_LETTER

Unicode 規(guī)范中的通用類別“Lu”。

構(gòu)造函數(shù)詳細(xì)信息

Character

public Character(char value)

構(gòu)造一個(gè)新分配的 Character 對(duì)象,該對(duì)象表示指定的 char 值。

參數(shù):

參數(shù)名稱 參數(shù)描述
value 要由 Character 對(duì)象表示的值。

方法詳情

valueOf

public static Character valueOf(char c)

返回表示指定 char 值的 Character 實(shí)例。 如果不需要新的 Character 實(shí)例,則通常應(yīng)優(yōu)先使用此方法而不是構(gòu)造函數(shù) Character(char),因?yàn)榇朔椒赡軙?huì)通過緩存頻繁請(qǐng)求的值來顯著提高空間和時(shí)間性能。 此方法將始終緩存 '\u0000' 到 '\u007F' 范圍內(nèi)的值,包括在內(nèi),并且可能緩存此范圍之外的其他值。

參數(shù):

參數(shù)名稱 參數(shù)描述
c 一個(gè)字符值。

返回:

一個(gè)代表 c 的 Character 實(shí)例。

charValue

public char charValue()

返回此 Character 對(duì)象的值。

返回:

此對(duì)象表示的原始 char 值。

hashCode

public int hashCode()

返回此字符的哈希碼; 等于調(diào)用 charValue() 的結(jié)果。

覆蓋:

類 Object 中的 hashCode

返回:

此字符的哈希碼值

hashCode

public static int hashCode(char value)

返回 char 值的哈希碼; 與 Character.hashCode() 兼容。

參數(shù):

參數(shù)名稱 參數(shù)描述
value 要為其返回哈希碼的字符。

返回:

char 值的哈希碼值。

equals

public boolean equals(Object obj)

將此對(duì)象與指定對(duì)象進(jìn)行比較。 當(dāng)且僅當(dāng)參數(shù)不為 null 并且是表示與此對(duì)象相同的 char 值的 Character 對(duì)象時(shí),結(jié)果才為真。

覆蓋:

類 Object 中的等于

參數(shù):

參數(shù)名稱 參數(shù)描述
obj 比較的對(duì)象。

返回:

如果對(duì)象相同,則為 true; 否則為假。

toString

public String toString()

返回一個(gè)表示此 Character 值的 String 對(duì)象。 結(jié)果是長(zhǎng)度為 1 的字符串,其唯一組成部分是此 Character 對(duì)象表示的原始 char 值。

覆蓋:

類 Object 中的 toString

返回:

此對(duì)象的字符串表示形式。

toString

public static String toString(char c)

返回表示指定字符的 String 對(duì)象。 結(jié)果是長(zhǎng)度為 1 的字符串,僅由指定的字符組成。

參數(shù):

參數(shù)名稱 參數(shù)描述
c 要轉(zhuǎn)換的字符

返回:

指定字符的字符串表示

isValidCodePoint

public static boolean isValidCodePoint(int codePoint)

確定指定的代碼點(diǎn)是否是有效的 Unicode 代碼點(diǎn)值。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的 Unicode 代碼點(diǎn)

返回:

如果指定的代碼點(diǎn)值介于 MIN_CODE_POINT 和 MAX_CODE_POINT 之間,則為 true; 否則為假。

isBmpCodePoint

public static boolean isBmpCodePoint(int codePoint)

確定指定字符(Unicode 代碼點(diǎn))是否在基本多語言平面 (BMP) 中。 這樣的代碼點(diǎn)可以使用單個(gè)字符來表示。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))

返回:

如果指定的代碼點(diǎn)介于 MIN_VALUE 和 MAX_VALUE 之間,則為 true; 否則為假。

isSupplementaryCodePoint

public static boolean isSupplementaryCodePoint(int codePoint)

確定指定字符(Unicode 代碼點(diǎn))是否在補(bǔ)充字符范圍內(nèi)。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))

返回:

如果指定的代碼點(diǎn)介于 MIN_SUPPLEMENTARY_CODE_POINT 和 MAX_CODE_POINT 之間,則為 true; 否則為假。

isHighSurrogate

public static boolean isHighSurrogate(char ch)

確定給定的 char 值是否是 Unicode 高代理代碼單元(也稱為前導(dǎo)代理代碼單元)。

這些值本身并不表示字符,而是用于表示 UTF-16 編碼中的補(bǔ)充字符。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要測(cè)試的 char 值。

返回:

如果 char 值介于 MIN_HIGH_SURROGATE 和 MAX_HIGH_SURROGATE 之間,則為 true; 否則為假。

isLowSurrogate

public static boolean isLowSurrogate(char ch)

確定給定的 char 值是否是 Unicode 低代理代碼單元(也稱為尾隨代理代碼單元)。

這些值本身并不表示字符,而是用于表示 UTF-16 編碼中的補(bǔ)充字符。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要測(cè)試的 char 值。

返回:

如果 char 值介于 MIN_LOW_SURROGATE 和 MAX_LOW_SURROGATE 之間,則為 true; 否則為假。

isSurrogate

public static boolean isSurrogate(char ch)

確定給定的 char 值是否是 Unicode 代理代碼單元。

這些值本身并不表示字符,而是用于表示 UTF-16 編碼中的補(bǔ)充字符。

char 值是代理代碼單元當(dāng)且僅當(dāng)它是低代理代碼單元或高代理代碼單元。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要測(cè)試的 char 值。

返回:

如果 char 值介于 MIN_SURROGATE 和 MAX_SURROGATE 之間,則為 true; 否則為假。

isSurrogatePair

public static boolean isSurrogatePair(char high, char low)

確定指定的 char 值對(duì)是否為有效的 Unicode 代理項(xiàng)對(duì)。

該方法等價(jià)于表達(dá)式:

 isHighSurrogate(high) && isLowSurrogate(low) 

參數(shù):

參數(shù)名稱 參數(shù)描述
high 要測(cè)試的高代理代碼值
low 要測(cè)試的低代理代碼值

返回:

如果指定的高和低代理代碼值表示有效的代理對(duì),則為 true; 否則為假。

charCount

public static int charCount(int codePoint)

確定表示指定字符(Unicode 代碼點(diǎn))所需的 char 值的數(shù)量。 如果指定字符等于或大于 0x10000,則該方法返回 2。否則,該方法返回 1。

此方法不會(huì)驗(yàn)證指定字符是否為有效的 Unicode 代碼點(diǎn)。 如有必要,調(diào)用者必須使用 isValidCodePoint 驗(yàn)證字符值。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))。

返回:

2 如果字符是有效的補(bǔ)充字符; 1 否則。

toCodePoint

public static int toCodePoint(char high, char low)

將指定的代理對(duì)轉(zhuǎn)換為其補(bǔ)充代碼點(diǎn)值。 此方法不驗(yàn)證指定的代理對(duì)。 如有必要,調(diào)用者必須使用 isSurrogatePair 對(duì)其進(jìn)行驗(yàn)證。

參數(shù):

參數(shù)名稱 參數(shù)描述
high 高代理代碼單元
low 低代理代碼單元

返回:

由指定代理對(duì)組成的補(bǔ)充代碼點(diǎn)。

codePointAt

public static int codePointAt(CharSequence seq, int index)

返回 CharSequence 的給定索引處的代碼點(diǎn)。 如果 CharSequence 中給定索引處的 char 值在高代理范圍內(nèi),后續(xù)索引小于 CharSequence 的長(zhǎng)度,并且后續(xù)索引處的 char 值在低代理范圍內(nèi),則補(bǔ)充 返回與此代理對(duì)對(duì)應(yīng)的代碼點(diǎn)。 否則,返回給定索引處的 char 值。

參數(shù):

參數(shù)名稱 參數(shù)描述
seq 一系列 char 值(Unicode 代碼單元)
index 要轉(zhuǎn)換的 seq 中 char 值(Unicode 代碼單元)的索引

返回:

給定索引處的 Unicode 代碼點(diǎn)

Throws:

Throw名稱 Throw描述
NullPointerException 如果 seq 為空。
IndexOutOfBoundsException 如果值索引為負(fù)數(shù)或不小于 CharSequence#length()。

codePointAt

public static int codePointAt(char[] a, int index)

返回 char 數(shù)組給定索引處的代碼點(diǎn)。 如果 char 數(shù)組中給定索引處的 char 值在高代理范圍內(nèi),后面的索引小于 char 數(shù)組的長(zhǎng)度,并且后面的索引處的 char 值在低代理范圍內(nèi),則 返回與該代理對(duì)對(duì)應(yīng)的補(bǔ)充代碼點(diǎn)。 否則,返回給定索引處的 char 值。

參數(shù):

參數(shù)名稱 參數(shù)描述
a 字符數(shù)組
index 要轉(zhuǎn)換的 char 數(shù)組中的 char 值(Unicode 代碼單元)的索引

返回:

給定索引處的 Unicode 代碼點(diǎn)

Throws:

Throw名稱 Throw描述
NullPointerException 如果 a 為空。
IndexOutOfBoundsException 如果值索引為負(fù)數(shù)或不小于 char 數(shù)組的長(zhǎng)度。

codePointAt

public static int codePointAt(char[] a, int index, int limit)

返回 char 數(shù)組給定索引處的代碼點(diǎn),其中只能使用索引小于限制的數(shù)組元素。 如果 char 數(shù)組中給定索引處的 char 值在高代理范圍內(nèi),后面的索引小于限制,并且后面的索引處的 char 值在低代理范圍內(nèi),則補(bǔ)充代碼點(diǎn) 返回對(duì)應(yīng)于這個(gè)代理對(duì)。 否則,返回給定索引處的 char 值。

參數(shù):

參數(shù)名稱 參數(shù)描述
a 字符數(shù)組
index 要轉(zhuǎn)換的 char 數(shù)組中的 char 值(Unicode 代碼單元)的索引
limit 可以在 char 數(shù)組中使用的最后一個(gè)數(shù)組元素之后的索引

返回:

給定索引處的 Unicode 代碼點(diǎn)

Throws:

Throw名稱 Throw描述
NullPointerException 如果 a 為空。
IndexOutOfBoundsException 如果 index 參數(shù)為負(fù)數(shù)或不小于 limit 參數(shù),或者 limit 參數(shù)為負(fù)數(shù)或大于 char 數(shù)組的長(zhǎng)度。

codePointBefore

public static int codePointBefore(CharSequence seq, int index)

返回 CharSequence 的給定索引之前的代碼點(diǎn)。 如果 CharSequence 中 (index - 1) 處的 char 值在低代理范圍內(nèi),則 (index - 2) 不為負(fù),并且 CharSequence 中 (index - 2) 處的 char 值在高代理范圍內(nèi) ,則返回該代理對(duì)對(duì)應(yīng)的補(bǔ)充碼點(diǎn)。 否則,返回 (index - 1) 處的 char 值。

參數(shù):

參數(shù)名稱 參數(shù)描述
seq CharSequence 實(shí)例
index 應(yīng)返回的代碼點(diǎn)之后的索引

返回:

給定索引之前的 Unicode 代碼點(diǎn)值。

Throws:

Throw名稱 Throw描述
NullPointerException 如果 seq 為空。
IndexOutOfBoundsException 如果索引參數(shù)小于 1 或大于 CharSequence#length()。

codePointBefore

public static int codePointBefore(char[] a, int index)

返回 char 數(shù)組的給定索引之前的代碼點(diǎn)。 如果 char 數(shù)組中 (index - 1) 處的 char 值在低代理范圍內(nèi),則 (index - 2) 不為負(fù),并且 char 數(shù)組中 (index - 2) 處的 char 值在高 - 代理范圍,則返回該代理對(duì)對(duì)應(yīng)的補(bǔ)充碼位。 否則,返回 (index - 1) 處的 char 值。

參數(shù):

參數(shù)名稱 參數(shù)描述
a 字符數(shù)組
index 應(yīng)返回的代碼點(diǎn)之后的索引

返回:

給定索引之前的 Unicode 代碼點(diǎn)值。

Throws:

Throw名稱 Throw描述
NullPointerException 如果 a 為空。
IndexOutOfBoundsException 如果 index 參數(shù)小于 1 或大于 char 數(shù)組的長(zhǎng)度

codePointBefore

public static int codePointBefore(char[] a, int index, int start)

返回 char 數(shù)組的給定索引之前的代碼點(diǎn),其中只能使用索引大于或等于 start 的數(shù)組元素。 如果 char 數(shù)組中 (index - 1) 處的 char 值在低代理范圍內(nèi),則 (index - 2) 不小于 start,并且 char 數(shù)組中 (index - 2) 處的 char 值在 high-surrogate range,則返回該代理對(duì)對(duì)應(yīng)的補(bǔ)充碼點(diǎn)。 否則,返回 (index - 1) 處的 char 值。

參數(shù):

參數(shù)名稱 參數(shù)描述
a 字符數(shù)組
index 應(yīng)返回的代碼點(diǎn)之后的索引
start char 數(shù)組中第一個(gè)數(shù)組元素的索引

返回:

給定索引之前的 Unicode 代碼點(diǎn)值。

Throws:

Throw名稱 Throw描述
NullPointerException 如果 a 為空。
IndexOutOfBoundsException 如果 index 參數(shù)不大于 start 參數(shù)或大于 char 數(shù)組的長(zhǎng)度,或者 start 參數(shù)為負(fù)數(shù)或不小于 char 數(shù)組的長(zhǎng)度。

highSurrogate

public static char highSurrogate(int codePoint)

返回以 UTF-16 編碼表示指定補(bǔ)充字符(Unicode 代碼點(diǎn))的代理項(xiàng)對(duì)的前導(dǎo)代理項(xiàng)(高代理項(xiàng)代碼單元)。 如果指定的字符不是補(bǔ)充字符,則返回未指定的字符。

如果 isSupplementaryCodePoint(x) 為真,則 isHighSurrogate(highSurrogate(x)) 和 toCodePoint(highSurrogate(x), lowSurrogate(x)) == x 也始終為真。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 補(bǔ)充字符(Unicode 代碼點(diǎn))

返回:

用于以 UTF-16 編碼表示字符的前導(dǎo)代理代碼單元

lowSurrogate

public static char lowSurrogate(int codePoint)

返回以 UTF-16 編碼表示指定補(bǔ)充字符(Unicode 代碼點(diǎn))的代理項(xiàng)對(duì)的尾隨代理項(xiàng)(低代理項(xiàng)代碼單元)。 如果指定的字符不是補(bǔ)充字符,則返回未指定的字符。

如果 isSupplementaryCodePoint(x) 為真,則 isLowSurrogate(lowSurrogate(x)) 和 toCodePoint(highSurrogate(x), lowSurrogate(x)) == x 也始終為真。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 補(bǔ)充字符(Unicode 代碼點(diǎn))

返回:

用于以 UTF-16 編碼表示字符的尾隨代理代碼單元

toChars

public static int toChars(int codePoint, char[] dst, int dstIndex)

將指定的字符(Unicode 代碼點(diǎn))轉(zhuǎn)換為其 UTF-16 表示。 如果指定的code point是BMP(Basic Multilingual Plane or Plane 0)值,則將相同的值存儲(chǔ)在dst[dstIndex]中,并返回1。 如果指定的碼位是增補(bǔ)字符,則將其代理值存儲(chǔ)在 dst[dstIndex](高代理)和 dst[dstIndex+1](低代理)中,并返回 2。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要轉(zhuǎn)換的字符(Unicode 代碼點(diǎn))。
dst 一個(gè) char 數(shù)組,其中存儲(chǔ)了 codePoint 的 UTF-16 值。
dstIndex 存儲(chǔ)轉(zhuǎn)換值的 dst 數(shù)組的起始索引。

返回:

如果代碼點(diǎn)是 BMP 代碼點(diǎn),則為 1,如果代碼點(diǎn)是補(bǔ)充代碼點(diǎn),則為 2。

Throws:

Throw名稱 Throw描述
IllegalArgumentException 如果指定的 codePoint 不是有效的 Unicode 代碼點(diǎn)。
NullPointerException 如果指定的 dst 為空。
IndexOutOfBoundsException 如果 dstIndex 為負(fù)數(shù)或不小于 dst.length,或者如果 dstIndex 處的 dst 沒有足夠的數(shù)組元素來存儲(chǔ)結(jié)果 char 值。 (如果 dstIndex 等于 dst.length-1 并且指定的 codePoint 是補(bǔ)充字符,則高代理值不存儲(chǔ)在 dst[dstIndex] 中。)

toChars

public static char[] toChars(int codePoint)

將指定字符(Unicode 代碼點(diǎn))轉(zhuǎn)換為存儲(chǔ)在 char 數(shù)組中的 UTF-16 表示形式。 如果指定的代碼點(diǎn)是 BMP(基本多語言平面或平面 0)值,則生成的 char 數(shù)組具有與 codePoint 相同的值。 如果指定的代碼點(diǎn)是補(bǔ)充代碼點(diǎn),則生成的 char 數(shù)組具有相應(yīng)的代理對(duì)。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 一個(gè) Unicode 代碼點(diǎn)

返回:

具有 codePoint 的 UTF-16 表示形式的 char 數(shù)組。

Throws:

Throw名稱 Throw描述
IllegalArgumentException 如果指定的 codePoint 不是有效的 Unicode 代碼點(diǎn)。

codePointCount

public static int codePointCount(CharSequence seq, int beginIndex, int endIndex)

返回指定字符序列的文本范圍內(nèi)的 Unicode 代碼點(diǎn)數(shù)。 文本范圍從指定的 beginIndex 開始并延伸到索引 endIndex - 1 處的字符。因此,文本范圍的長(zhǎng)度(以字符為單位)為 endIndex-beginIndex。 文本范圍內(nèi)的未配對(duì)代理項(xiàng)分別計(jì)為一個(gè)代碼點(diǎn)。

參數(shù):

參數(shù)名稱 參數(shù)描述
seq 字符序列
beginIndex 文本范圍的第一個(gè)字符的索引。
endIndex 文本范圍的最后一個(gè)字符之后的索引。

返回:

指定文本范圍內(nèi)的 Unicode 代碼點(diǎn)數(shù)

Throws:

Throw名稱 Throw描述
NullPointerException 如果 seq 為空。
IndexOutOfBoundsException 如果 beginIndex 為負(fù)數(shù),或者 endIndex 大于給定序列的長(zhǎng)度,或者 beginIndex 大于 endIndex。

codePointCount

public static int codePointCount(char[] a, int offset, int count)

返回 char 數(shù)組參數(shù)的子數(shù)組中的 Unicode 代碼點(diǎn)數(shù)。 offset 參數(shù)是子數(shù)組的第一個(gè) char 的索引,count 參數(shù)指定子數(shù)組的長(zhǎng)度(以 chars 為單位)。 子數(shù)組中未配對(duì)的代理項(xiàng)各自計(jì)為一個(gè)代碼點(diǎn)。

參數(shù):

參數(shù)名稱 參數(shù)描述
a 字符數(shù)組
offset 給定 char 數(shù)組中第一個(gè) char 的索引
count 以字符為單位的子數(shù)組的長(zhǎng)度

返回:

指定子數(shù)組中的 Unicode 代碼點(diǎn)數(shù)

Throws:

Throw名稱 Throw描述
NullPointerException 如果 a 為空。
IndexOutOfBoundsException 如果 offset 或 count 為負(fù),或者 offset + count 大于給定數(shù)組的長(zhǎng)度。

offsetByCodePoints

public static int offsetByCodePoints(CharSequence seq, int index, int codePointOffset)

返回給定 char 序列中的索引,該索引與給定索引偏移 codePointOffset 代碼點(diǎn)。 由 index 和 codePointOffset 給出的文本范圍內(nèi)的未配對(duì)代理分別計(jì)為一個(gè)代碼點(diǎn)。

參數(shù):

參數(shù)名稱 參數(shù)描述
seq 字符序列
index 要偏移的索引
codePointOffset 代碼點(diǎn)的偏移量

返回:

char 序列中的索引

Throws:

Throw名稱 Throw描述
NullPointerException 如果 seq 為空。
IndexOutOfBoundsException 如果 index 為負(fù)或大于 char 序列的長(zhǎng)度,或者如果 codePointOffset 為正并且以 index 開頭的子序列的代碼點(diǎn)少于 codePointOffset,或者如果 codePointOffset 為負(fù)并且 index 之前的子序列的絕對(duì)值小于 codePointOffset 碼點(diǎn)。

offsetByCodePoints

public static int offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)

返回給定 char 子數(shù)組中從給定索引偏移 codePointOffset 代碼點(diǎn)的索引。 start 和 count 參數(shù)指定 char 數(shù)組的子數(shù)組。 由 index 和 codePointOffset 給出的文本范圍內(nèi)的未配對(duì)代理分別計(jì)為一個(gè)代碼點(diǎn)。

參數(shù):

參數(shù)名稱 參數(shù)描述
a 字符數(shù)組
start 子數(shù)組的第一個(gè)字符的索引
count 以字符為單位的子數(shù)組的長(zhǎng)度
index 要偏移的索引
codePointOffset 代碼點(diǎn)的偏移量

返回:

子數(shù)組中的索引

Throws:

Throw名稱 Throw描述
NullPointerException 如果 a 為空。
IndexOutOfBoundsException 如果 start 或 count 為負(fù)數(shù),或者如果 start + count 大于給定數(shù)組的長(zhǎng)度,或者如果 index 小于 start 或大于 start + count,或者如果 codePointOffset 為正且文本范圍以 index 開頭和結(jié)尾 帶有 start + count - 1 的代碼點(diǎn)少于 codePointOffset ,或者如果 codePointOffset 為負(fù)數(shù)并且以 start 開始并以 index - 1 結(jié)尾的文本范圍少于 codePointOffset 代碼點(diǎn)的絕對(duì)值。

isLowerCase

public static boolean isLowerCase(char ch)

確定指定字符是否為小寫字符。

如果 Character.getType(ch) 提供的一般類別類型為 LOWERCASE_LETTER,或者它具有 Unicode 標(biāo)準(zhǔn)定義的貢獻(xiàn)屬性 Other_Lowercase,則字符為小寫。

以下是小寫字符的示例:

 a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF' 

許多其他 Unicode 字符也是小寫的。

注意:此方法不能處理補(bǔ)充字符。 要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 isLowerCase(int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要測(cè)試的字符。

返回:

如果字符是小寫,則為真; 否則為假。

isLowerCase

public static boolean isLowerCase(int codePoint)

確定指定字符(Unicode 代碼點(diǎn))是否為小寫字符。

如果 Character#getType 提供的一般類別類型為 LOWERCASE_LETTER,或者它具有 Unicode 標(biāo)準(zhǔn)定義的貢獻(xiàn)屬性 Other_Lowercase,則字符為小寫。

以下是小寫字符的示例:

 a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF' 

許多其他 Unicode 字符也是小寫的。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))。

返回:

如果字符是小寫,則為真; 否則為假。

isUpperCase

public static boolean isUpperCase(char ch)

確定指定字符是否為大寫字符。

如果 Character.getType(ch) 提供的一般類別類型為 UPPERCASE_LETTER,則該字符為大寫。 或者它具有 Unicode 標(biāo)準(zhǔn)定義的貢獻(xiàn)屬性 Other_Uppercase。

以下是大寫字符的示例:

 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE' 

許多其他 Unicode 字符也是大寫的。

注意:此方法不能處理補(bǔ)充字符。 要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 isUpperCase(int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要測(cè)試的字符。

返回:

如果字符是大寫的,則為真; 否則為假。

isUpperCase

public static boolean isUpperCase(int codePoint)

確定指定字符(Unicode 代碼點(diǎn))是否為大寫字符。

如果 Character#getType(int) 提供的一般類別類型為 UPPERCASE_LETTER,或者它具有 Unicode 標(biāo)準(zhǔn)定義的貢獻(xiàn)屬性 Other_Uppercase,則字符為大寫。

以下是大寫字符的示例:

 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE' 

許多其他 Unicode 字符也是大寫的。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))。

返回:

如果字符是大寫的,則為真; 否則為假。

isTitleCase

public static boolean isTitleCase(char ch)

確定指定的字符是否為標(biāo)題字符。

如果 Character.getType(ch) 提供的一般類別類型為 TITLECASE_LETTER,則該字符是標(biāo)題大寫字符。

有些字符看起來像成對(duì)的拉丁字母。例如,有一個(gè)看起來像“LJ”的大寫字母和一個(gè)看起來像“l(fā)j”的對(duì)應(yīng)小寫字母。第三種形式,看起來像“Lj”,是在以首字母大寫的小寫字母呈現(xiàn)單詞時(shí)使用的適當(dāng)形式,如書名。

以下是此方法返回 true 的一些 Unicode 字符:

  • 帶有小寫字母 Z 和 CARON 的拉丁文大寫字母 D
  • 帶有小寫字母 J 的拉丁文大寫字母 L
  • 帶有小寫字母 J 的拉丁文大寫字母 N
  • 帶有小寫字母 Z 的拉丁文大寫字母 D

許多其他 Unicode 字符也是標(biāo)題大小寫。

注意:此方法不能處理補(bǔ)充字符。要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 isTitleCase(int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要測(cè)試的字符。

返回:

如果字符是首字母大寫,則為真; 否則為假。

isTitleCase

public static boolean isTitleCase(int codePoint)

確定指定字符(Unicode 代碼點(diǎn))是否為標(biāo)題字符。

如果由 Character#getType(int) 提供的一般類別類型為 TITLECASE_LETTER,則該字符是標(biāo)題大寫字符。

有些字符看起來像成對(duì)的拉丁字母。 例如,有一個(gè)看起來像“LJ”的大寫字母和一個(gè)看起來像“l(fā)j”的對(duì)應(yīng)小寫字母。 第三種形式,看起來像“Lj”,是在以首字母大寫的小寫字母呈現(xiàn)單詞時(shí)使用的適當(dāng)形式,如書名。

以下是此方法返回 true 的一些 Unicode 字符:

  • 帶有小寫字母 Z 和 CARON 的拉丁文大寫字母 D
  • 帶有小寫字母 J 的拉丁文大寫字母 L
  • 帶有小寫字母 J 的拉丁文大寫字母 N
  • 帶有小寫字母 Z 的拉丁文大寫字母 D

許多其他 Unicode 字符也是標(biāo)題大小寫。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))。

返回:

如果字符是首字母大寫,則為真; 否則為假。

isDigit

public static boolean isDigit(char ch)

確定指定的字符是否為數(shù)字。

如果 Character.getType(ch) 提供的一般類別類型為 DECIMAL_DIGIT_NUMBER,則該字符是數(shù)字。

一些包含數(shù)字的 Unicode 字符范圍:

  • '\u0030' 到 '\u0039',ISO-LATIN-1 數(shù)字('0' 到 '9')
  • '\u0660' 到 '\u0669',阿拉伯-印度數(shù)字
  • '\u06F0' 到 '\u06F9',擴(kuò)展的阿拉伯-印度數(shù)字
  • '\u0966' 到 '\u096F',梵文數(shù)字
  • '\uFF10' 到 '\uFF19',全角數(shù)字

許多其他字符范圍也包含數(shù)字。

注意:此方法不能處理補(bǔ)充字符。 要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 isDigit(int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要測(cè)試的字符。

返回:

如果字符是數(shù)字則為真; 否則為假。

isDigit

public static boolean isDigit(int codePoint)

確定指定的字符(Unicode 代碼點(diǎn))是否為數(shù)字。

如果 Character#getType(int) 提供的一般類別類型為 DECIMAL_DIGIT_NUMBER,則該字符是數(shù)字。

一些包含數(shù)字的 Unicode 字符范圍:

  • '\u0030' 到 '\u0039',ISO-LATIN-1 數(shù)字('0' 到 '9')
  • '\u0660' 到 '\u0669',阿拉伯-印度數(shù)字
  • '\u06F0' 到 '\u06F9',擴(kuò)展的阿拉伯-印度數(shù)字
  • '\u0966' 到 '\u096F',梵文數(shù)字
  • '\uFF10' 到 '\uFF19',全角數(shù)字

許多其他字符范圍也包含數(shù)字。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))。

返回:

如果字符是數(shù)字則為真; 否則為假。

isDefined

public static boolean isDefined(char ch)

確定字符是否以 Unicode 定義。

如果以下至少一項(xiàng)為真,則定義一個(gè)字符:

  • 它在 UnicodeData 文件中有一個(gè)條目。
  • 它的值在 UnicodeData 文件定義的范圍內(nèi)。

注意:此方法不能處理補(bǔ)充字符。 要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 isDefined(int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要測(cè)試的字符

返回:

如果字符在 Unicode 中具有定義的含義,則為 true; 否則為假。

isDefined

public static boolean isDefined(int codePoint)

確定字符(Unicode 代碼點(diǎn))是否以 Unicode 定義。

如果以下至少一項(xiàng)為真,則定義一個(gè)字符:

  • 它在 UnicodeData 文件中有一個(gè)條目。
  • 它的值在 UnicodeData 文件定義的范圍內(nèi)。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))。

返回:

如果字符在 Unicode 中具有定義的含義,則為 true; 否則為假。

isLetter

public static boolean isLetter(char ch)

確定指定的字符是否為字母。

如果 Character.getType(ch) 提供的一般類別類型為以下任何一種,則該字符被視為字母:

  • 大寫字母
  • 小寫字母
  • 標(biāo)題字母
  • MODIFIER_LETTER
  • OTHER_LETTER

并非所有字母都有大小寫。 許多字符是字母,但既不是大寫,也不是小寫,也不是標(biāo)題。

注意:此方法不能處理補(bǔ)充字符。 要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 isLetter(int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要測(cè)試的字符。

返回:

如果字符是字母,則為真; 否則為假。

isLetter

public static boolean isLetter(int codePoint)

確定指定字符(Unicode 代碼點(diǎn))是否為字母。

如果 Character#getType(int) 提供的一般類別類型為以下任何一種,則該字符被視為字母:

  • 大寫字母
  • 小寫字母
  • 標(biāo)題字母
  • MODIFIER_LETTER
  • OTHER_LETTER

并非所有字母都有大小寫。 許多字符是字母,但既不是大寫,也不是小寫,也不是標(biāo)題。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))。

返回:

如果字符是字母,則為真; 否則為假。

isLetterOrDigit

public static boolean isLetterOrDigit(char ch)

確定指定的字符是字母還是數(shù)字。

如果 Character.isLetter(char ch) 或 Character.isDigit(char ch) 為字符返回 true,則認(rèn)為該字符是字母或數(shù)字。

注意:此方法不能處理補(bǔ)充字符。 要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 isLetterOrDigit(int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要測(cè)試的字符。

返回:

如果字符是字母或數(shù)字,則為真; 否則為假。

isLetterOrDigit

public static boolean isLetterOrDigit(int codePoint)

確定指定的字符(Unicode 代碼點(diǎn))是字母還是數(shù)字。

如果 isLetter(codePoint) 或 isDigit(codePoint) 對(duì)字符返回 true,則認(rèn)為該字符是字母或數(shù)字。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))。

返回:

如果字符是字母或數(shù)字,則為真; 否則為假。

isJavaLetter

@Deprecated public static boolean isJavaLetter(char ch)

已棄用。 替換為 isJavaIdentifierStart(char)。

確定指定的字符是否允許作為 Java 標(biāo)識(shí)符中的第一個(gè)字符。

當(dāng)且僅當(dāng)以下條件之一為真時(shí),字符才可以開始 Java 標(biāo)識(shí)符:

  • isLetter(ch) 返回真
  • getType(ch) 返回 LETTER_NUMBER
  • ch 是貨幣符號(hào)(例如'$')
  • ch 是一個(gè)連接標(biāo)點(diǎn)符號(hào)(例如'_')。

這些條件是針對(duì) Unicode 標(biāo)準(zhǔn) 6.2 版中的字符信息進(jìn)行測(cè)試的。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要測(cè)試的字符。

返回:

如果字符可以開始 Java 標(biāo)識(shí)符,則為 true; 否則為假。

isJavaLetterOrDigit

@Deprecated public static boolean isJavaLetterOrDigit(char ch)

已棄用。 替換為 isJavaIdentifierPart(char)。

確定指定字符是否可以是 Java 標(biāo)識(shí)符的一部分,而不是第一個(gè)字符。

當(dāng)且僅當(dāng)以下任何條件為真時(shí),字符才可能是 Java 標(biāo)識(shí)符的一部分:

  • 這是一封信
  • 它是一個(gè)貨幣符號(hào)(例如'$')
  • 它是一個(gè)連接標(biāo)點(diǎn)符號(hào)(例如'_')
  • 這是一個(gè)數(shù)字
  • 它是一個(gè)數(shù)字字母(如羅馬數(shù)字字符)
  • 它是一個(gè)組合標(biāo)記
  • 它是一個(gè)非間距標(biāo)記
  • isIdentifierIgnorable 為字符返回 true。

這些條件是針對(duì) Unicode 標(biāo)準(zhǔn) 6.2 版中的字符信息進(jìn)行測(cè)試的。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要測(cè)試的字符。

返回:

如果字符可能是 Java 標(biāo)識(shí)符的一部分,則為 true; 否則為假。

isAlphabetic

public static boolean isAlphabetic(int codePoint)

確定指定字符(Unicode 代碼點(diǎn))是否為字母表。

如果 Character#getType(int) 提供的一般類別類型是以下任何一種,則認(rèn)為該字符是字母字符:

  • 大寫字母
  • 小寫字母
  • 標(biāo)題字母
  • MODIFIER_LETTER
  • OTHER_LETTER
  • LETTER_NUMBER

或者它具有 Unicode 標(biāo)準(zhǔn)定義的貢獻(xiàn)屬性 Other_Alphabetic。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))。

返回:

如果字符是 Unicode 字母字符,則為 true,否則為 false。

isIdeographic

public static boolean isIdeographic(int codePoint)

確定指定字符(Unicode 代碼點(diǎn))是否為 Unicode 標(biāo)準(zhǔn)定義的 CJKV(中文、日文、韓文和越南文)表意文字。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))。

返回:

如果字符是 Unicode 表意字符,則為 true,否則為 false。

isJavaIdentifierStart

public static boolean isJavaIdentifierStart(char ch)

確定指定的字符是否允許作為 Java 標(biāo)識(shí)符中的第一個(gè)字符。

當(dāng)且僅當(dāng)以下條件之一為真時(shí),字符才可以開始 Java 標(biāo)識(shí)符:

  • isLetter(ch) 返回真
  • getType(ch) 返回 LETTER_NUMBER
  • ch 是貨幣符號(hào)(例如'$')
  • ch 是一個(gè)連接標(biāo)點(diǎn)符號(hào)(例如'_')。

這些條件是針對(duì) Unicode 標(biāo)準(zhǔn) 6.2 版中的字符信息進(jìn)行測(cè)試的。

注意:此方法不能處理補(bǔ)充字符。 要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 isJavaIdentifierStart(int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要測(cè)試的字符。

返回:

如果字符可以開始 Java 標(biāo)識(shí)符,則為 true; 否則為假。

isJavaIdentifierStart

public static boolean isJavaIdentifierStart(int codePoint)

確定字符(Unicode 代碼點(diǎn))是否允許作為 Java 標(biāo)識(shí)符中的第一個(gè)字符。

當(dāng)且僅當(dāng)以下條件之一為真時(shí),字符才可以開始 Java 標(biāo)識(shí)符:

  • isLetter(codePoint) 返回真
  • getType(codePoint) 返回 LETTER_NUMBER
  • 引用的字符是貨幣符號(hào)(例如'$')
  • 引用的字符是一個(gè)連接標(biāo)點(diǎn)字符(例如'_')。

這些條件是針對(duì) Unicode 標(biāo)準(zhǔn) 6.2 版中的字符信息進(jìn)行測(cè)試的。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))。

返回:

如果字符可以開始 Java 標(biāo)識(shí)符,則為 true; 否則為假。

isJavaIdentifierPart

public static boolean isJavaIdentifierPart(char ch)

確定指定字符是否可以是 Java 標(biāo)識(shí)符的一部分,而不是第一個(gè)字符。

如果滿足以下任一條件,則字符可能是 Java 標(biāo)識(shí)符的一部分:

  • 這是一封信
  • 它是一個(gè)貨幣符號(hào)(例如'$')
  • 它是一個(gè)連接標(biāo)點(diǎn)符號(hào)(例如'_')
  • 這是一個(gè)數(shù)字
  • 它是一個(gè)數(shù)字字母(如羅馬數(shù)字字符)
  • 它是一個(gè)組合標(biāo)記
  • 它是一個(gè)非間距標(biāo)記
  • isIdentifierIgnorable 為字符返回 true

這些條件是針對(duì) Unicode 標(biāo)準(zhǔn) 6.2 版中的字符信息進(jìn)行測(cè)試的。

注意:此方法不能處理補(bǔ)充字符。 要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 isJavaIdentifierPart(int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要測(cè)試的字符。

返回:

如果字符可能是 Java 標(biāo)識(shí)符的一部分,則為 true; 否則為假。

isJavaIdentifierPart

public static boolean isJavaIdentifierPart(int codePoint)

確定字符(Unicode 代碼點(diǎn))是否可以是 Java 標(biāo)識(shí)符的一部分,而不是第一個(gè)字符。

如果滿足以下任一條件,則字符可能是 Java 標(biāo)識(shí)符的一部分:

  • 這是一封信
  • 它是一個(gè)貨幣符號(hào)(例如'$')
  • 它是一個(gè)連接標(biāo)點(diǎn)符號(hào)(例如'_')
  • 這是一個(gè)數(shù)字
  • 它是一個(gè)數(shù)字字母(如羅馬數(shù)字字符)
  • 它是一個(gè)組合標(biāo)記
  • 它是一個(gè)非間距標(biāo)記
  • isIdentifierIgnorable(codePoint) 為代碼點(diǎn)返回 true

這些條件是針對(duì) Unicode 標(biāo)準(zhǔn) 6.2 版中的字符信息進(jìn)行測(cè)試的。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))。

返回:

如果字符可能是 Java 標(biāo)識(shí)符的一部分,則為 true; 否則為假。

isUnicodeIdentifierStart

public static boolean isUnicodeIdentifierStart(char ch)

確定指定字符是否允許作為 Unicode 標(biāo)識(shí)符中的第一個(gè)字符。

當(dāng)且僅當(dāng)以下條件之一為真時(shí),字符才可以開始 Unicode 標(biāo)識(shí)符:

  • isLetter(ch) 返回真
  • getType(ch) 返回 LETTER_NUMBER。

注意:此方法不能處理補(bǔ)充字符。 要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 isUnicodeIdentifierStart(int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要測(cè)試的字符。

返回:

如果字符可以開始一個(gè) Unicode 標(biāo)識(shí)符,則為 true; 否則為假。

isUnicodeIdentifierStart

public static boolean isUnicodeIdentifierStart(int codePoint)

確定指定的字符(Unicode 代碼點(diǎn))是否允許作為 Unicode 標(biāo)識(shí)符中的第一個(gè)字符。

當(dāng)且僅當(dāng)以下條件之一為真時(shí),字符才可以開始 Unicode 標(biāo)識(shí)符:

  • isLetter(codePoint) 返回真
  • getType(codePoint) 返回 LETTER_NUMBER。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))。

返回:

如果字符可以開始一個(gè) Unicode 標(biāo)識(shí)符,則為 true; 否則為假。

isUnicodeIdentifierPart

public static boolean isUnicodeIdentifierPart(char ch)

確定指定字符是否可以是 Unicode 標(biāo)識(shí)符的一部分,而不是第一個(gè)字符。

當(dāng)且僅當(dāng)以下語句之一為真時(shí),字符才可能是 Unicode 標(biāo)識(shí)符的一部分:

  • 這是一封信
  • 它是一個(gè)連接標(biāo)點(diǎn)符號(hào)(例如'_')
  • 這是一個(gè)數(shù)字
  • 它是一個(gè)數(shù)字字母(如羅馬數(shù)字字符)
  • 它是一個(gè)組合標(biāo)記
  • 它是一個(gè)非間距標(biāo)記
  • isIdentifierIgnorable 為該字符返回 true。

注意:此方法不能處理補(bǔ)充字符。 要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 isUnicodeIdentifierPart(int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要測(cè)試的字符。

返回:

如果字符可能是 Unicode 標(biāo)識(shí)符的一部分,則為 true; 否則為假。

isUnicodeIdentifierPart

public static boolean isUnicodeIdentifierPart(int codePoint)

確定指定字符(Unicode 代碼點(diǎn))是否可以是 Unicode 標(biāo)識(shí)符的一部分,而不是第一個(gè)字符。

當(dāng)且僅當(dāng)以下語句之一為真時(shí),字符才可能是 Unicode 標(biāo)識(shí)符的一部分:

  • 這是一封信
  • 它是一個(gè)連接標(biāo)點(diǎn)符號(hào)(例如'_')
  • 這是一個(gè)數(shù)字
  • 它是一個(gè)數(shù)字字母(如羅馬數(shù)字字符)
  • 它是一個(gè)組合標(biāo)記
  • 它是一個(gè)非間距標(biāo)記
  • isIdentifierIgnorable 為該字符返回 true。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))。

返回:

如果字符可能是 Unicode 標(biāo)識(shí)符的一部分,則為 true; 否則為假。

isIdentifierIgnorable

public static boolean isIdentifierIgnorable(char ch)

確定是否應(yīng)將指定字符視為 Java 標(biāo)識(shí)符或 Unicode 標(biāo)識(shí)符中的可忽略字符。

在 Java 標(biāo)識(shí)符或 Unicode 標(biāo)識(shí)符中可以忽略以下 Unicode 字符:

  • 非空白的 ISO 控制字符
    • '\u0000' 到 '\u0008'
    • '\u000E' 到 '\u001B'
    • '\u007F' 到 '\u009F'
  • 所有具有 FORMAT 通用類別值的字符

注意:此方法不能處理補(bǔ)充字符。 要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 isIdentifierIgnorable(int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要測(cè)試的字符。

返回:

如果該字符是一個(gè)可忽略的控制字符,它可能是 Java 或 Unicode 標(biāo)識(shí)符的一部分,則為 true; 否則為假。

isIdentifierIgnorable

public static boolean isIdentifierIgnorable(int codePoint)

確定是否應(yīng)將指定字符(Unicode 代碼點(diǎn))視為 Java 標(biāo)識(shí)符或 Unicode 標(biāo)識(shí)符中的可忽略字符。

在 Java 標(biāo)識(shí)符或 Unicode 標(biāo)識(shí)符中可以忽略以下 Unicode 字符:

  • 非空白的 ISO 控制字符
    • '\u0000' 到 '\u0008'
    • '\u000E' 到 '\u001B'
    • '\u007F' 到 '\u009F'
  • 所有具有 FORMAT 通用類別值的字符

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))。

返回:

如果該字符是一個(gè)可忽略的控制字符,它可能是 Java 或 Unicode 標(biāo)識(shí)符的一部分,則為 true; 否則為假。

toLowerCase

public static char toLowerCase(char ch)

使用 UnicodeData 文件中的大小寫映射信息將字符參數(shù)轉(zhuǎn)換為小寫。

請(qǐng)注意,對(duì)于某些字符范圍,尤其是符號(hào)或表意文字,Character.isLowerCase(Character.toLowerCase(ch)) 并不總是返回 true。

通常,應(yīng)使用 String#toLowerCase() 將字符映射為小寫。 字符串大小寫映射方法比字符大小寫映射方法有幾個(gè)好處。 字符串大小寫映射方法可以執(zhí)行區(qū)域敏感映射、上下文敏感映射和 1:M 字符映射,而字符大小寫映射方法不能。

注意:此方法不能處理補(bǔ)充字符。 要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 toLowerCase(int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要轉(zhuǎn)換的字符。

返回:

字符的小寫等效項(xiàng),如果有的話; 否則,角色本身。

toLowerCase

public static int toLowerCase(int codePoint)

使用 UnicodeData 文件中的大小寫映射信息將字符(Unicode 代碼點(diǎn))參數(shù)轉(zhuǎn)換為小寫。

請(qǐng)注意 Character.isLowerCase(Character.toLowerCase(codePoint)) 對(duì)于某些字符范圍并不總是返回 true,尤其是那些符號(hào)或表意文字。

通常,應(yīng)使用 String#toLowerCase() 將字符映射為小寫。 字符串大小寫映射方法比字符大小寫映射方法有幾個(gè)好處。 字符串大小寫映射方法可以執(zhí)行區(qū)域敏感映射、上下文敏感映射和 1:M 字符映射,而字符大小寫映射方法不能。

參數(shù):

Parameter Name Parameter Description
codePoint the character (Unicode code point) to be converted.

返回:

字符的小寫等效字符(Unicode 代碼點(diǎn)),如果有的話; 否則,角色本身。

toUpperCase

public static char toUpperCase(char ch)

使用 UnicodeData 文件中的大小寫映射信息將字符參數(shù)轉(zhuǎn)換為大寫。

請(qǐng)注意,Character.isUpperCase(Character.toUpperCase(ch)) 對(duì)于某些字符范圍并不總是返回 true,尤其是那些符號(hào)或表意文字。

通常,應(yīng)使用 String#toUpperCase() 將字符映射為大寫。 字符串大小寫映射方法比字符大小寫映射方法有幾個(gè)好處。 字符串大小寫映射方法可以執(zhí)行區(qū)域敏感映射、上下文敏感映射和 1:M 字符映射,而字符大小寫映射方法不能。

注意:此方法不能處理補(bǔ)充字符。 要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 toUpperCase(int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要轉(zhuǎn)換的字符。

返回:

字符的大寫等效項(xiàng)(如果有); 否則,角色本身。

toUpperCase

public static int toUpperCase(int codePoint)

使用 UnicodeData 文件中的大小寫映射信息將字符(Unicode 代碼點(diǎn))參數(shù)轉(zhuǎn)換為大寫。

請(qǐng)注意 Character.isUpperCase(Character.toUpperCase(codePoint)) 對(duì)于某些字符范圍并不總是返回 true,尤其是符號(hào)或表意文字。

通常,應(yīng)使用 String#toUpperCase() 將字符映射為大寫。 字符串大小寫映射方法比字符大小寫映射方法有幾個(gè)好處。 字符串大小寫映射方法可以執(zhí)行區(qū)域敏感映射、上下文敏感映射和 1:M 字符映射,而字符大小寫映射方法不能。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要轉(zhuǎn)換的字符(Unicode 代碼點(diǎn))。

返回:

字符的大寫等效項(xiàng)(如果有); 否則,角色本身。

toTitleCase

public static char toTitleCase(char ch)

使用 UnicodeData 文件中的大小寫映射信息將字符參數(shù)轉(zhuǎn)換為標(biāo)題大小寫。 如果一個(gè)字符沒有明確的首字母大寫映射并且根據(jù) UnicodeData 本身不是首字母大寫字符,則大寫映射作為等效的首字母大寫映射返回。 如果 char 參數(shù)已經(jīng)是 titlecase char,則將返回相同的 char 值。

請(qǐng)注意,對(duì)于某些字符范圍,Character.isTitleCase(Character.toTitleCase(ch)) 并不總是返回 true。

注意:此方法不能處理補(bǔ)充字符。 要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 toTitleCase(int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要轉(zhuǎn)換的字符。

返回:

如果有的話,相當(dāng)于該字符的標(biāo)題大小寫; 否則,角色本身。

toTitleCase

public static int toTitleCase(int codePoint)

使用 UnicodeData 文件中的大小寫映射信息將字符(Unicode 代碼點(diǎn))參數(shù)轉(zhuǎn)換為標(biāo)題大小寫。 如果一個(gè)字符沒有明確的首字母大寫映射并且根據(jù) UnicodeData 本身不是首字母大寫字符,則大寫映射作為等效的首字母大寫映射返回。 如果字符參數(shù)已經(jīng)是標(biāo)題字符,將返回相同的字符值。

請(qǐng)注意,對(duì)于某些字符范圍,Character.isTitleCase(Character.toTitleCase(codePoint)) 并不總是返回 true。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要轉(zhuǎn)換的字符(Unicode 代碼點(diǎn))。

返回:

如果有的話,相當(dāng)于該字符的標(biāo)題大小寫; 否則,角色本身。

digit

public static int digit(char ch, int radix)

返回指定基數(shù)中字符 ch 的數(shù)值。

如果基數(shù)不在 MIN_RADIX ≤ radix ≤ MAX_RADIX 范圍內(nèi),或者如果 ch 的值不是指定基數(shù)中的有效數(shù)字,則返回 -1。如果以下至少一項(xiàng)為真,則字符是有效數(shù)字:

  • isDigit 方法對(duì)字符為真且字符的 Unicode 十進(jìn)制數(shù)字值(或其單字符分解)小于指定的基數(shù)。在這種情況下,返回十進(jìn)制數(shù)字值。
  • 字符是大寫拉丁字母 'A' 到 'Z' 之一,其代碼小于 radix + 'A' - 10。在這種情況下,返回 ch - 'A' + 10。
  • 字符是小寫拉丁字母 'a' 到 'z' 之一,其代碼小于 radix + 'a' - 10。在這種情況下,返回 ch - 'a' + 10。
  • 字符是全角大寫拉丁字母 A ('\uFF21') 到 Z ('\uFF3A') 之一,其代碼小于基數(shù) + '\uFF21' - 10。在這種情況下,ch - '\uFF21 ' + 10 返回。
  • 字符是全角小寫拉丁字母 a ('\uFF41') 到 z ('\uFF5A') 之一,其代碼小于基數(shù) + '\uFF41' - 10。在這種情況下,ch - '\uFF41 ' + 10 返回。

注意:此方法不能處理補(bǔ)充字符。要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 digit(int,int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要轉(zhuǎn)換的字符。
radix 基數(shù)。

返回:

由指定基數(shù)中的字符表示的數(shù)值。

digit

public static int digit(int codePoint, int radix)

返回指定基數(shù)中指定字符(Unicode 代碼點(diǎn))的數(shù)值。

如果基數(shù)不在 MIN_RADIX ≤ radix ≤ MAX_RADIX 范圍內(nèi),或者如果字符不是指定基數(shù)中的有效數(shù)字,則返回 -1。如果以下至少一項(xiàng)為真,則字符是有效數(shù)字:

  • isDigit(codePoint) 方法對(duì)字符為真且字符的 Unicode 十進(jìn)制數(shù)字值(或其單字符分解)小于指定的基數(shù)。在這種情況下,返回十進(jìn)制數(shù)字值。
  • 字符是大寫拉丁字母 'A' 到 'Z' 之一,其代碼小于 radix + 'A' - 10。在這種情況下,返回 codePoint - 'A' + 10。
  • 字符是小寫拉丁字母 'a' 到 'z' 之一,其代碼小于 radix + 'a' - 10。在這種情況下,返回 codePoint - 'a' + 10。
  • 字符是全角大寫拉丁字母 A ('\uFF21') 到 Z ('\uFF3A') 之一,其代碼小于基數(shù) + '\uFF21' - 10。在這種情況下,codePoint - '\uFF21 ' + 10 返回。
  • 字符是全角小寫拉丁字母 a ('\uFF41') 到 z ('\uFF5A') 之一,其代碼小于基數(shù) + '\uFF41'- 10。在這種情況下,codePoint - '\uFF41 ' + 10 返回。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要轉(zhuǎn)換的字符(Unicode 代碼點(diǎn))。
radix 基數(shù)。

返回:

由指定基數(shù)中的字符表示的數(shù)值。

getNumericValue

public static int getNumericValue(char ch)

返回指定 Unicode 字符表示的 int 值。 例如,字符 '\u216C'(羅馬數(shù)字 50)將返回一個(gè)值為 50 的 int。

大寫字母 A-Z('\u0041' 到 '\u005A')、小寫字母('\u0061' 到 '\u007A')和全角變體('\uFF21' 到 '\uFF3A' 和 '\uFF41' 通過 '\uFF5A') 形式具有從 10 到 35 的數(shù)值。這與 Unicode 規(guī)范無關(guān),Unicode 規(guī)范不為這些 char 值分配數(shù)值。

如果字符沒有數(shù)值,則返回 -1。 如果字符具有不能表示為非負(fù)整數(shù)的數(shù)值(例如,小數(shù)值),則返回 -2。

注意:此方法不能處理補(bǔ)充字符。 要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 getNumericValue(int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要轉(zhuǎn)換的字符。

返回:

字符的數(shù)值,作為非負(fù) int 值; -2 如果字符的數(shù)值不是非負(fù)整數(shù); -1 如果字符沒有數(shù)值。

getNumericValue

public static int getNumericValue(int codePoint)

返回指定字符(Unicode 代碼點(diǎn))表示的 int 值。 例如,字符 '\u216C'(羅馬數(shù)字 50)將返回一個(gè)值為 50 的 int。

大寫字母 A-Z('\u0041' 到 '\u005A')、小寫字母('\u0061' 到 '\u007A')和全角變體('\uFF21' 到 '\uFF3A' 和 '\uFF41' 通過 '\uFF5A') 形式具有從 10 到 35 的數(shù)值。這與 Unicode 規(guī)范無關(guān),Unicode 規(guī)范不為這些 char 值分配數(shù)值。

如果字符沒有數(shù)值,則返回 -1。 如果字符具有不能表示為非負(fù)整數(shù)的數(shù)值(例如,小數(shù)值),則返回 -2。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要轉(zhuǎn)換的字符(Unicode 代碼點(diǎn))。

返回:

字符的數(shù)值,作為非負(fù) int 值; -2 如果字符的數(shù)值不是非負(fù)整數(shù); -1 如果字符沒有數(shù)值。

isSpace

@Deprecated public static boolean isSpace(char ch)

已棄用。 替換為 isWhitespace(char)。

確定指定字符是否為 ISO-LATIN-1 空格。 此方法僅對(duì)以下五個(gè)字符返回 true:

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要測(cè)試的字符。

返回:

如果字符是 ISO-LATIN-1 空格,則為 true; 否則為假。

isSpaceChar

public static boolean isSpaceChar(char ch)

確定指定字符是否為 Unicode 空格字符。 當(dāng)且僅當(dāng) Unicode 標(biāo)準(zhǔn)將字符指定為空格字符時(shí),該字符才被視為空格字符。 如果角色的一般類別類型是以下任何一種,則此方法返回 true:

  • SPACE_SEPARATOR
  • LINE_SEPARATOR
  • PARAGRAPH_SEPARATOR

注意:此方法不能處理補(bǔ)充字符。 要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 isSpaceChar(int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要測(cè)試的字符。

返回:

如果字符是空格字符,則為真; 否則為假。

isSpaceChar

public static boolean isSpaceChar(int codePoint)

確定指定字符(Unicode 代碼點(diǎn))是否為 Unicode 空格字符。 當(dāng)且僅當(dāng) Unicode 標(biāo)準(zhǔn)將字符指定為空格字符時(shí),該字符才被視為空格字符。 如果角色的一般類別類型是以下任何一種,則此方法返回 true:

  • SPACE_SEPARATOR
  • LINE_SEPARATOR
  • PARAGRAPH_SEPARATOR

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))。

返回:

如果字符是空格字符,則為真; 否則為假。

isWhitespace

public static boolean isWhitespace(char ch)

根據(jù) Java 確定指定字符是否為空格。 一個(gè)字符是一個(gè) Java 空白字符當(dāng)且僅當(dāng)它滿足以下條件之一:

  • 它是 Unicode 空格字符(SPACE_SEPARATOR、LINE_SEPARATOR 或 PARAGRAPH_SEPARATOR),但也不是不間斷空格('\u00A0'、'\u2007'、'\u202F')。
  • 它是'\t',U+0009 水平制表。
  • 它是'\n',U+000A LINE FEED。
  • 它是'\u000B',U+000B 垂直制表。
  • 它是'\f',U+000C 換頁。
  • 它是'\r',U+000D 回車。
  • 它是'\u001C',U+001C 文件分隔符。
  • 它是 '\u001D',U+001D 組分隔符。
  • 它是 '\u001E',U+001E 記錄分隔符。
  • 它是 '\u001F',U+001F 單位分隔符。

注意:此方法不能處理補(bǔ)充字符。 要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 isWhitespace(int) 方法。

參數(shù):

Parameter Name Parameter Description
ch the character to be tested.

返回:

如果字符是 Java 空白字符,則為 true; 否則為假。

isWhitespace

public static boolean isWhitespace(int codePoint)

根據(jù) Java 確定指定字符(Unicode 代碼點(diǎn))是否為空格。 一個(gè)字符是一個(gè) Java 空白字符當(dāng)且僅當(dāng)它滿足以下條件之一:

  • 它是 Unicode 空格字符(SPACE_SEPARATOR、LINE_SEPARATOR 或 PARAGRAPH_SEPARATOR),但也不是不間斷空格('\u00A0'、'\u2007'、'\u202F')。
  • 它是'\t',U+0009 水平制表。
  • 它是'\n',U+000A LINE FEED。
  • 它是'\u000B',U+000B 垂直制表。
  • 它是'\f',U+000C 換頁。
  • 它是'\r',U+000D 回車。
  • 它是'\u001C',U+001C 文件分隔符。
  • 它是 '\u001D',U+001D 組分隔符。
  • 它是 '\u001E',U+001E 記錄分隔符。
  • 它是 '\u001F',U+001F 單位分隔符。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))。

返回:

如果字符是 Java 空白字符,則為 true; 否則為假。

isISOControl

public static boolean isISOControl(char ch)

確定指定字符是否為 ISO 控制字符。 如果字符的代碼在 '\u0000' 到 '\u001F' 范圍內(nèi)或在 '\u007F' 到 '\u009F' 范圍內(nèi),則該字符被視為 ISO 控制字符。

注意:此方法不能處理補(bǔ)充字符。 要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 isISOControl(int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要測(cè)試的字符。

返回:

如果字符是 ISO 控制字符,則為 true; 否則為假。

isISOControl

public static boolean isISOControl(int codePoint)

確定引用的字符(Unicode 代碼點(diǎn))是否為 ISO 控制字符。 如果字符的代碼在 '\u0000' 到 '\u001F' 范圍內(nèi)或在 '\u007F' 到 '\u009F' 范圍內(nèi),則該字符被視為 ISO 控制字符。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))。

返回:

如果字符是 ISO 控制字符,則為 true; 否則為假。

getType

public static int getType(char ch)

返回一個(gè)值,指示字符的一般類別。

注意:此方法不能處理補(bǔ)充字符。 要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 getType(int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要測(cè)試的字符。

返回:

一個(gè) int 類型的值,表示字符的一般類別。

getType

public static int getType(int codePoint)

返回一個(gè)值,指示字符的一般類別。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))。

返回:

一個(gè) int 類型的值,表示字符的一般類別。

forDigit

public static char forDigit(int digit, int radix)

確定指定基數(shù)中特定數(shù)字的字符表示。 如果 radix 的值不是有效的基數(shù),或者 digit 的值不是指定基數(shù)中的有效數(shù)字,則返回空字符 ('\u0000')。

radix 參數(shù)在大于或等于 MIN_RADIX 且小于或等于 MAX_RADIX 時(shí)有效。 如果 0 <= digit < radix,則 digit 參數(shù)有效。

如果數(shù)字小于 10,則返回 '0' + 數(shù)字。 否則,返回值 'a' + digit - 10。

參數(shù):

參數(shù)名稱 參數(shù)描述
digit 要轉(zhuǎn)換為字符的數(shù)字。
radix 基數(shù)。

返回:

指定基數(shù)中指定數(shù)字的 char 表示形式。

getDirectionality

public static byte getDirectionality(char ch)

返回給定字符的 Unicode 方向性屬性。 字符方向性用于計(jì)算文本的視覺順序。 未定義字符值的方向性值為 DIRECTIONALITY_UNDEFINED。

注意:此方法不能處理補(bǔ)充字符。 要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 getDirectionality(int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 為其請(qǐng)求方向性屬性的字符。

返回:

char 值的方向性屬性。

getDirectionality

public static byte getDirectionality(int codePoint)

返回給定字符(Unicode 代碼點(diǎn))的 Unicode 方向性屬性。 字符方向性用于計(jì)算文本的視覺順序。 未定義字符的方向性值為 DIRECTIONALITY_UNDEFINED。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 為其請(qǐng)求方向性屬性的字符(Unicode 代碼點(diǎn))。

返回:

角色的方向?qū)傩浴?/p>

isMirrored

public static boolean isMirrored(char ch)

確定字符是否根據(jù) Unicode 規(guī)范進(jìn)行鏡像。 在從右到左的文本中顯示時(shí),鏡像字符應(yīng)使其字形水平鏡像。 例如,'\u0028' 左括號(hào)在語義上被定義為左括號(hào)。 這將在從左到右的文本中顯示為“(”,但在從右到左的文本中顯示為“)”。

注意:此方法不能處理補(bǔ)充字符。 要支持所有 Unicode 字符,包括補(bǔ)充字符,請(qǐng)使用 isMirrored(int) 方法。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 為其請(qǐng)求鏡像屬性的 char

返回:

如果 char 被鏡像,則為 true;如果 char 未鏡像或未定義,則為 false。

isMirrored

public static boolean isMirrored(int codePoint)

確定是否根據(jù) Unicode 規(guī)范鏡像指定的字符(Unicode 代碼點(diǎn))。 在從右到左的文本中顯示時(shí),鏡像字符應(yīng)使其字形水平鏡像。 例如,'\u0028' 左括號(hào)在語義上被定義為左括號(hào)。 這將在從左到右的文本中顯示為“(”,但在從右到左的文本中顯示為“)”。

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 要測(cè)試的字符(Unicode 代碼點(diǎn))。

返回:

如果角色被鏡像,則為 true;如果角色未鏡像或未定義,則為 false。

compareTo

public int compareTo(Character anotherCharacter)

以數(shù)字方式比較兩個(gè) Character 對(duì)象。

指定者:

接口 ComparableCharacter 中的 compareTo

參數(shù):

參數(shù)名稱 參數(shù)描述
anotherCharacter 要比較的字符。

回報(bào):

如果參數(shù) Character 等于此 Character,則值為 0; 如果此 Character 在數(shù)值上小于 Character 參數(shù),則值小于 0; 如果此 Character 在數(shù)值上大于 Character 參數(shù)(無符號(hào)比較),則值大于 0。 請(qǐng)注意,這是嚴(yán)格的數(shù)字比較; 它不依賴于語言環(huán)境。

compare

public static int compare(char x, char y)

以數(shù)字方式比較兩個(gè) char 值。 返回的值與通過以下方式返回的值相同:

    Character.valueOf(x).compareTo(Character.valueOf(y)) 

參數(shù):

參數(shù)名稱 參數(shù)描述
x 要比較的第一個(gè)字符
y 要比較的第二個(gè)字符

返回:

如果 x == y,則值為 0; 如果 x < y,則值小于 0; 如果 x > y,則值大于 0

reverseBytes

public static char reverseBytes(char ch)

返回通過反轉(zhuǎn)指定 char 值中的字節(jié)順序獲得的值。

參數(shù):

參數(shù)名稱 參數(shù)描述
ch 要反轉(zhuǎn)字節(jié)順序的字符。

返回:

通過反轉(zhuǎn)(或等效地,交換)指定 char 值中的字節(jié)獲得的值。

getName

public static String getName(int codePoint)

返回指定字符代碼點(diǎn)的 Unicode 名稱,如果代碼點(diǎn)未分配,則返回 null。

注意:如果指定的字符沒有被 UnicodeData 文件(Unicode Consortium 維護(hù)的 Unicode Character Database 的一部分)指定名稱,則返回的名稱與表達(dá)式的結(jié)果相同。

Character.UnicodeBlock.of(codePoint).toString().replace('_', '') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ENGLISH);

參數(shù):

參數(shù)名稱 參數(shù)描述
codePoint 字符(Unicode 代碼點(diǎn))

返回:

指定字符的 Unicode 名稱,如果未分配代碼點(diǎn),則為 null。

Throws:

Throw名稱 Throw描述
IllegalArgumentException 如果指定的 codePoint 不是有效的 Unicode 代碼點(diǎn)。
以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)