今日「字談字串」,談談如何判斷兩個 Unicode 字串是否等價,以及其中必不可少的流程——規範化(normalization)。
規範化與其他諸多 Unicode 技術類似,積存着歷史問題,滲透於日常應用,雖然不易察覺,卻又不可或缺。
參考鏈接
- Type is Beautiful 十周年專頁
- TypeSchool 中文設計課,8 月 4 至 9 日將在北京開辦;8 月 1 日前可報名
- 京都漢字博物館內展出的一台日文打字機
- IBM Selectric 打字機,以 typeball(字球)結構實現字體的存放和打印
- Courier 字體,用於 IBM Selectric 打字機
- 7 月 17 日是「世界 Emoji 日」,Apple 在今年當日分享了即將發布的新 emoji 設計
- AssignPhoneticName.py,江疆編寫的 Python 腳本,可為 Mac 通訊錄的中文姓名自動加註漢語拼音
- Unicode 標準 2.12 節,敘述了等價序列(equivalent sequences)及規範化(normalization)的相關概念;另有 FAQ 可供參考
- UAX #15: Unicode Normalization Forms
- Unicode Normalization Charts
- APFS (Apple File System),Apple 推出的新文件系統;另有 FAQ 可供參考
- HFS+,Apple 開發的文件系統
- Idempotence(冪等性)
- Hash map(哈希映射)
- macOS High Sierra,下一代 Mac 操作系統,將搭載 APFS
- IDN(Internationalized Domain Dame,國際化域名)
- Punycode
- W3C 關於 normalization 的規範可參考工作草案 Character Model for the World Wide Web: String Matching and Searching;另有一則 Q&A 可供參考
- 《字談字暢》第十二輪抽獎結果
主播
- Rio:IPN 聯合創始人,Apple4us 程序員,《IT 公論》《瘋投圈》及《內核恐慌》主播
- 吳濤:Type is Beautiful 程序員,《內核恐慌》主播
- Eric:字體排印研究者,譯者,Type is Beautiful 編輯
- 蒸魚:設計師,Type is Beautiful 編輯
《內核恐慌》(Kernel Panic)是由 IPN 出品、吳濤和 Rio 做的播客,首播於 2014 年 10 月。號稱硬核,可也沒什麼乾貨。想聽的人聽,不想聽的人就別聽。
歡迎與我們交流或反饋,來信請致 [email protected]。如果你喜愛本期節目,也歡迎用 PayPal 或支付寶向我們捐贈,賬戶與聯絡信箱一致:[email protected]。