日語漢字 海 (中豎)應該如何輸入,為何貼上在 UTF 8 文件中依然顯示為 海 ?

時間 2021-06-01 07:34:53

1樓:DONGNANXIBEI

這鍋還得讓 Unicode 背,因為它對字形差異的處理方式存在雙重標準

對於不同地區的字形差異,有的選擇了分於不同編碼,比如:

(U+5A31)

(U+5A1B)

(U+5A2F)

以上三個字不用切換字型就能直接觀察出差異。

但是,有的選擇了合併為乙個,如:

(U+8AA4)

只給這個字乙個編碼,所以需要切換字型才能使字形發生改變,如下圖:

===2023年10月28日補充↓===

日本漢字存在新舊字型之分,比如「拡」與「擴」。但是前面提到了「海」只在基本區分配了乙個名額,如果要體現新舊字型差異,Unicode 倒是給它留了一條生路——相容區漢字。正常情況下使用的「海」字是 U+6D77,但如果要在舊字型的場合下使用,那麼相容區的 U+FA45 就是一種選擇。

下圖所示的是以 Hiragino Kaku Pro 字型顯示的兩種「海」字,黑色的是基本區,藍色的是相容區(只能用日語字型,否則顯示出來的「海」的形狀完全一樣):

關於相容區,詳細問題見:

為什麼 Unicode 中會存在「凉」和「涼」這樣兩個極其相像的字元? - 字型

擴充套件閱讀:「真姬」又怎麼寫?——中日字形暨 Unicode 字形之議 - 東南西北的文章 - 知乎專欄

2樓:

統一碼遵循的是:

相容所有已有編碼和對漢字編碼(不是字形)。

所以像這樣字義上完全沒有區別且在已有編碼內並不存在分開編碼的字就只有靠字型了。

3樓:王贇 Maigo

Unicode 的本意,是給這些含義相同但字形在各個國家或地區有微小不同的字,分配同乙個編碼。但是,為了與已有的字符集相容,有些在已有字符集中已經分開編碼的字(如「戶、戸、戶」),就只能也分開編碼了。

「海」的兩種字形並未在某種已有字符集中分開編碼,所以它們的 Unicode 是一樣的,只能通過設定字型來改變字形。

更新: @farter yang 在相容區中找到了兩點的「海」字(U+FA45),果然來自日本,這說明日本有一種字符集同時收錄了一豎的「海」字和兩點的「海」字。同樣的情況也發生在「侮」「悔」「梅」「敏」等以「每」為偏旁的字上。

不過,一般情況下並不建議使用相容區的字,一是因為很多字型不支援,二是查詢、搜尋起來都是坑。

4樓:msoeg

這兩個字形在Unicode裡編碼是一樣的,除了改變字型別無他法。控制面板的「字型」目錄下會顯示哪些字型「設計用於」日文,選擇那些即可。當然,在無法自定義字型的場合就沒有任何辦法了。

Notepad的「格式->字型」一欄中可以自定義字型,比如,如果改成MS Mincho或者MS Gothic等等,那麼「海」的兩點自然會顯示成一豎。

另外,UTF-8只不過是Unicode編碼的一種具體實現方式,它自然要求所有字元均有其Unicode碼位。從嚴格意義上來講,Unicode只是把每個字元對映為乙個整數(習慣上用十六進製制表示),但並未規定這個十六進製制數具體如何儲存。

為什麼日語中要保留漢字?

日語發音音素太少,不太好和北韓語,越南語一樣完全拼音去漢字化,而且他們也沒南韓越南那樣使用漢字的歷史心理負擔。不過在西方文化的影響下,越來越多的外來語被使用,其實韓語也在減少漢字詞的使用,這是未來的趨勢吧。不過外來語混雜太長寫法不規範,問題也不少。漢字在不少場合還有很多優點。可預見的未來是不會廢除漢...

日語要漢字有什麼用?

燕園學校 舉個例子來說 可以是上 挙 揚 都是同樣的讀音,卻寫作不同的漢字,是因為想要表達的意思不同。單詞的讀音相同卻表達的意思不同,如果不用漢字加以區分,就很容易不明白想要表達的意思。使用漢字也會更加便於閱讀,提高閱讀效率。日本古代只有語言並沒有文字,到中國隋唐時期,日本派來大量的遣隋使和遣唐使,...

日語可以完全用漢字書寫嗎?

81san 那不就是漢文 文言文 嗎。有一定文化程度的日本人甚至不需要返點。讀出來完全是日語。哦對了,還可以用萬葉仮名曲線救國。只不過中中國人看不懂。類似於夜露死苦 十六 首先寫一句日語 人 所詮環境 產物 人 意志 本當 人自身 意志 言 環境 生 環境 意志 把能換成漢字的假名換成漢字,不能換的...