
微博曾出现过两个看起来一模一样的「微博话题」,而实际上是其中一个话题里的汉字错用了康熙部首。这样的文本内容,如果遇到不支持康熙部首的字体,系统会回退到用默认字体显示,突出了字形的不一致,让用户察觉。其实,这些康熙部首都是「兼容字符」,能不用就不用,更不应该用其去代替正常的汉字。

「部首」是指为汉字分类的基本构件。最早是东汉的许慎在《说文解字》中将汉字分为 540 部。清朝康熙年间编撰的《康熙字典》确立了 214 个部首。这一分类方式沿用至今,尤其是港台和日本的汉字字典大多仍沿用 214 部首的分法。

然而,随着汉字的简化推广,传统部首难以适应现代需求。2009 年中国和国家语委联合发布了《汉字部首表》,对部首进行了重新定义,将原有的一些传统部首作为附形部首处理。如上,三画的「辶」、「艹」被列为主部首,而传统的「辵」、「艸」则被归为附形部首。

Unicode 自 2000 年发布的 3.0 版起,在 U+2F00 至 U+2FDF 的位置安放了 214 个康熙部首。因为之前台湾标准《中文标准交换码》CNS11643―1992 已在汉字之外另开码位收录了康熙部首,所以 Unicode 按照「源字集分离原则」也必须另开码位全部收入,才与其台湾标准兼容。