今日「字谈字串」,谈谈如何判断两个 Unicode 字串是否等价,以及其中必不可少的流程——规范化(normalization)。
规范化与其他诸多 Unicode 技术类似,积存着历史问题,渗透于日常应用,虽然不易察觉,却又不可或缺。
参考链接
- Type is Beautiful 十周年专页
- TypeSchool 中文设计课,8 月 4 至 9 日将在北京开办;8 月 1 日前可报名
- 京都汉字博物馆内展出的一台日文打字机
- IBM Selectric 打字机,以 typeball(字球)结构实现字体的存放和打印
- Courier 字体,用于 IBM Selectric 打字机
- 7 月 17 日是「世界 Emoji 日」,Apple 在今年当日分享了即将发布的新 emoji 设计
- AssignPhoneticName.py,江疆编写的 Python 脚本,可为 Mac 通讯录的中文姓名自动加注汉语拼音
- Unicode 标准 2.12 节,叙述了等价序列(equivalent sequences)及规范化(normalization)的相关概念;另有 FAQ 可供参考
- UAX #15: Unicode Normalization Forms
- Unicode Normalization Charts
- APFS (Apple File System),Apple 推出的新文件系统;另有 FAQ 可供参考
- HFS+,Apple 开发的文件系统
- Idempotence(冪等性)
- Hash map(哈希映射)
- macOS High Sierra,下一代 Mac 操作系统,将搭载 APFS
- IDN(Internationalized Domain Dame,国际化域名)
- Punycode
- W3C 关于 normalization 的规范可参考工作草案 Character Model for the World Wide Web: String Matching and Searching;另有一则 Q&A 可供参考
- 《字谈字畅》第十二轮抽奖结果
主播
- Rio:IPN 联合创始人,Apple4us 程序员,《IT 公论》《疯投圈》及《内核恐慌》主播
- 吴涛:Type is Beautiful 程序员,《内核恐慌》主播
- Eric:字体排印研究者,译者,Type is Beautiful 编辑
- 蒸鱼:设计师,Type is Beautiful 编辑
《内核恐慌》(Kernel Panic)是由 IPN 出品、吴涛和 Rio 做的播客,首播于 2014 年 10 月。号称硬核,可也没什么干货。想听的人听,不想听的人就别听。
欢迎与我们交流或反馈,来信请致 [email protected]。如果你喜爱本期节目,也欢迎用 PayPal 或支付宝向我们捐赠,账户与联络信箱一致:[email protected]。