私人使用区

更新时间:2022-11-26 14:26

在Unicode中, 私人使用区指其解释未在Unicode标准中指定,而是由合作用户之间的私人协议决定其用途的一系列码位。Unicode定义了三个私人使用区:一个在基本多文种平面(U+E000-U+F8FF)中,另外两个几乎包含了整个第15和第16平面(分别为U+F0000-U+FFFFD,U+100000-U+10FFFD)。

使用实例

中国国家标准GB/T 20542-2006(“藏文编码字符集扩展A”)和GB / T 22238-2008(“藏文编码字符集扩展B”)使用私人使用区存放藏文连字。

GB18030GBK使用私人使用区临时编码Unicode标准之外的字符

爱沙尼亚语言研究院使用私人使用区编码Unicode标准未收录的拉丁字母西里尔字母

机读编目格式标准MARC 21使用私人使用区编码未被Unicode收录的东亚字符。

美国国际语言暑期学院使用私人使用区编码Unicode标准未收录的语言中的字符。

处理规则

私人使用区的订定只是权宜之计,让尚无统一码标准之前的字符可以临时使用。若日后被官方正式收录,那该从补充字应被剔除,移入正式字区。空下的码位被回收利用,再定义为其他新的补充字。因此每次新统一码标准发布后,都应该立即检查一次补充字,将已正式编码的字进行迁码处理。

例:【】曾经使用U+E863编码,在Unicode 3.0正式收录为U+4DAE后,则U+E863则不应继续使用。

编码分配

BMP PUA

该区段分为两个子区段:公司用途子区段,从U+F8FF位置开始往小的编码;终端用户子区段,从U+E000位置开始符号位置往大的编码。这只是一般约定,两个子区段只有私有约定的分割点。

Supplementary PUA-A

Supplementary PUA-B

免责声明
隐私政策
用户协议
目录 22
0{{catalogNumber[index]}}. {{item.title}}
{{item.title}}