文字設計和視覺文化

字談字暢 052:Kerning Panic·字談字串(五)規範化有四樣形式,你知道么?

今日「字談字串」,談談如何判斷兩個 Unicode 字串是否等價,以及其中必不可少的流程——規範化(normalization)。

規範化與其他諸多 Unicode 技術類似,積存着歷史問題,滲透於日常應用,雖然不易察覺,卻又不可或缺。

參考鏈接

主播

《內核恐慌》(Kernel Panic)是由 IPN 出品、吳濤和 Rio 做的播客,首播於 2014 年 10 月。號稱硬核,可也沒什麼乾貨。想聽的人聽,不想聽的人就別聽。

歡迎與我們交流或反饋,來信請致 [email protected]。如果你喜愛本期節目,也歡迎用 PayPal 或支付寶向我們捐贈,賬戶與聯絡信箱一致:[email protected]

Zhifubao QR code of The Type

訂閱地址Apple Podcasts荔枝 FM網易雲音樂下載音頻

尊重原創:關於轉載

我們希望在中文環境中建立一種健康的 TrackBack 和鏈接機制,保證原創,並不影響傳播。因此對於譯文和原創文章,我們歡迎您在網站上推薦我們的文章,包括文字和圖片片段,但不贊成任何形式的全文轉載。
參與討論或通過 TrackBack 推薦:Trackback URL.

一個 Trackback

  1. By Type is Beautiful » Wǒ ài pīnyīn! on 2017/08/18 at 1:34 pm

    […] 從 Unicode 的角度來說,帶調字母由於存在「組合用字符」機制,因此涉及到規範化和等價判斷問題,這部分內容也顯然超出了本文的範圍,對技術細節感興趣的讀者可以參考筆者主持的播客節目「字談字暢」第 52 期的內容。雖然目前 Unicode 已經定義了大量帶調字符,但 Ê̄ê̄、Ê̌ê̌、M̀m̀ 這幾個帶調字母沒有獨立碼位,需要另外用組合序列來表達。另外,儘管 GB 18030 與先前的 GBK 編碼是向後兼容的,但是這兩份文件里有 95 個字符的 Unicode 參照碼位發生了變化(具體可以參照 GB 18030-2015 的「附錄 E」),其中就影響到了 ḿ 和 ǹ,因此會有一些輸入法和字體文件根據不同文件的碼位定義而無法互相匹配,造成無法正確輸入、輸出這兩個音節。 […]

參與討論

你的Email地址將不會被發布或透漏。 標記*的項目為必填項目。

*
*

作者 / 譯者