Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

中文與其他語言缺字的處理建議 #3

Closed
bobbytung opened this issue Jun 21, 2018 · 4 comments
Closed

中文與其他語言缺字的處理建議 #3

bobbytung opened this issue Jun 21, 2018 · 4 comments
Labels
提昇 新功能、新需求、新內容 發佈前需要結論 需要幫忙 此 issue 需要有人幫忙協助

Comments

@bobbytung
Copy link
Collaborator

草稿內對於缺字的處理如下:

缺字圖片

備註:

  • Unicode Ext-B之後不在HKSCS內的漢字,一律以圖片顯示

  • 要以哪款字型製作圖片,依照出版社指示

  • 背景為透明,請以8bit PNG格式保存

日本電子書RS多半會搭配明體與黑體兩套字體,而字體會包含JIS 4161-1993所含字符。

繁體中文目前沒有像JIS 4161-1993那樣的字碼標準,若使用BIG 5碼標準則會有多種缺字狀況發生(如王建「煊」、游錫「堃」)。一般印刷用內文字體則是通常包含Unicode 3.0中的中日韓統一表意文字20,902字,以及HKSCS香港增補字符集5,033字。

Ext-B後的生罕用字雖然有部分會回退(Fallback)到系統字體,但系統字體不一定包含所有文字,所以建議比照日文處理JIS 4161-1993外字符(外字處理),製作成圖片插入內文,加上CSS來顯示。

但以上處理僅限於處理漢字缺字,當遇到泰文、越南文等文字時,需要討論該如何處理,

一般來說在macOS與iOS上會回退到其他語文的系統字體,但在Windows及Android上則常顯示為缺字。

推薦方式有二:

一、同樣將文字處理成圖片插入內文

這種處理方式遇到較長的單詞或語句時會造成斷行問題。

二、以文字插入,加上lang標籤,再嵌入該語種的開放字體來處理。

日本電書協指南中不建議嵌入字體,但目前各瀏覽器與RS對於嵌入字體的支援相對完善。加上Google提供開放授權各語種的Noto字體可以使用,各語種字體的檔案尺寸也相對中文要小,大約數百KB到數MB而已。

若使用這種處理方式,需要各位測試自己RS的支援狀況。

@WillyYeh
Copy link
Collaborator

WillyYeh commented Jul 1, 2018

剛剛好友送來的資訊:網頁字型最佳化
如果要擷取字型檔內的特定子集:

pyftsubset cwTeXYen-zhonly.woff2 --text-file=content.txt --output-file=cwTexYen-sub.woff2

@bobbytung
Copy link
Collaborator Author

加了一個嵌入Noto Thai Serif字體的EPUB檔案供測試。

修改如下:

  • 新增font.css
  • 在OPF檔案中增加OTF字型檔與font.css的manifest

外文缺字主要會出現在Android系統上頭,煩請測試。

此外,Google Noto字體首頁上可以下載各語種的字體供使用。

@ccyanni ccyanni added 提昇 新功能、新需求、新內容 需要幫忙 此 issue 需要有人幫忙協助 labels Jul 31, 2018
@ccyanni
Copy link
Collaborator

ccyanni commented Jul 31, 2018

工作會議上大家覺得若能使用字型而非圖檔的方式來表現,對於內容的呈現上可以有更好的體驗。 因此決議由 @bobbytung 協助提供範例,並由各成員協助測試是否能在各自的平台上運行無誤,待測試完後再討論是否納行第一版指引中。

  • 範例提供
  • 平台測試
  • woff 字型子集處理工具 license 使用範圍

@Huichun-Hu
Copy link
Collaborator

在編輯epub時如遇到難字,都會先上"中國哲學書電子書計劃字典"找字,用法如查字典。比較不建議造字。
https://ctext.org/dictionary.pl?if=gb

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
提昇 新功能、新需求、新內容 發佈前需要結論 需要幫忙 此 issue 需要有人幫忙協助
Projects
None yet
Development

No branches or pull requests

4 participants