2025年10月15日 星期三

HTML5 FUN 筆順部件及 CNS 部件校正

2025年10月15日 星期三

最近想製作國字的筆畫序資料庫,基於 2024年五月已經把 HTML5 FUN 的部件改使用 CNS 的部件定義,所以先幫 CNS 517個部件一個個建立了完整的筆順序。原本的計畫是接下來就可以輕鬆用 517 個部件的基礎,推算出任何字的筆順序;果然是想得太簡單了,國字有很多「例外」啊!參考教育部的《常用國字標準字體筆順手冊》:

裡面有筆順基本法則,以「國」這個字來說,它的部件是「囗戈口一」,第一個部件「囗」最後一筆的橫畫,要留在其它筆畫寫完才能加上;「國」算單純的,像「鄙」,到底什麼時候要加上橫畫,得好好的計算與判斷了。在「挖掘」的過程中,發現 HTML5 FUN 筆順練習的部件設定有諸多錯誤,而 CNS 的部件設定也有很多沒有按照《常用國字標準字體筆順手冊》中的原則來設定,修正的記錄附在本文的後段。此外,新發現教育部筆順網有兩個字寫正確了反而會過不了關的:

  • 「寓」12畫,卻有13筆資料,第6畫要重寫一次才能過關。
  • 「製」14畫,卻有15筆資料,最後面多了一筆第13畫的。

筆順網其它可能會過不了關的字,請參考「雄:教育部筆順學習網這些字的過關秘訣」這一則舊文中的說明。

▋ 整合 HTML5 FUN 部件設定與 CNS 部件筆順序

HTML5 FUN 部件設定及對應的CNS部件設定有誤的地方修正好了,乾脆偷懶,將對應的主客互換,先產生 CNS 部件的筆順序,再以部件對應到 HTML5 FUN 的筆畫序,這樣子就可以知道部件中每一個筆畫的名稱,重新按筆畫序列出,完全不用複雜的判斷就是我要的結果了。但是由產生出的結果交互比對,找出了更多的錯誤 XDDD

經過將近一週的努力,至少教育部筆順網的六千多個字,都能有完整的筆順序了。花了大半天,把國小國語課本三個版本中最近兩學期使用到的生字(二千九百多個字),以一個小工具,人工檢查的方式再次確認,並以程式調整了以下的字:

  • 寫法與部件有異:竊(vs禸)、虜(vs毌)、亟極殛(筆畫要多1)、歿沒別捌(vs方)。
  • 筆順與部件有異:升昇陞呏、臧藏臟贓。
  • 一字不二捺,捺改頓點或長頓點:潑返閣額雒擱篷縫蓬逢逄皴逡蹩釐犛邀遨瓤還遠退腿褪螁隧毅豬櫫瀦燹豢遯逐遂燧遽邃劇裹歉。

筆順校對與測試小工具截圖

目前校對部件、筆順清單已大致完成,也測試了念出筆順的功能,測試的過程還解決了一個在 iOS / Android 播放指定區段聲音一直存在的臭蟲,一個星期的研究沒有白費。接下來應該可以先弄一個「國字基本筆畫練習」的小工具測試一下資料庫與語音的功能。

▋  CNS 部件調整記錄

依據教育部《常用國字標準字體筆順手冊》筆順基本法則,調整 CNS 部件順序

✅ 「凡字的上半或下方,左右包中,且兩邊相稱或相同的結構,通常先寫中間,再寫左右。」

54,54,395,72,162

36,4,395,1,49,62,45

41,1,21,395,72,185,185,105,250

54,54,185,185,105,291

54,54,185,185,105,218

54,54,185,185,106

442,250,250,84

276,394,305

36,4,395,1,49

36,4,395,1,48,97

121,36,4,395,1,49

41,1,119,395,1,49

54,54,395,72,432

220,54,54,395,72,432

36,4,395,1,48,442

41,1,21,395,72,425,48,81

輿 419,395,1,49

185,36,4,395,1,48,97

384,185,185,72,399,80,25,128

353,185,185,257

250,331,169,169,186

331,65,73,55

67,15,119,155,382,137

277,67,15,119,155,382,137

67,15,119,406,382,137

67,15,119,434,382,137 (除順序,原「238『月』」修正為 382)

✅ 「凡以筆順基本原則-廴部筆形、筆順基本原則-辶部筆形為偏旁結體之字,通常筆順基本原則-廴部筆形、筆順基本原則-辶部筆形最後寫。」

辶(253)廴(157)後寫:

96,253

154,253

13,20,253

42,8,253

170,253

65,75,253

22,84,253

232,253

5,99,157

✅ 「卂」相關的字

20,13,253 (第一筆在十20的豎畫, 調整為 20,13)

277,20,13

250,250,72,20,13

✅ 「鄉」相關的字部件由左而右

167,6,413,166,339,209

167,6,413,166,483

204,167,6,413,166

✅ 沱跎陀 「它」的下方應該是 27

277,139,27

119,208,139,27

166,139,27

208,24,19 「此」右為 24, 「些」應相同

✅ 統一「可」的組合全部改用「32,119」,以下修正:

119,32,119

100,32,119

✅ 其它

70,425,106,166

3,205,95

252,45,382

338,252,45,382

119,208,252,45,382

252,47,382,438,251

277,121,230,230,1,119,141,99,88,305 (修正第二碼為山121)

220,47,47,99

70,3

81,6,257

45,1,119,119,47,47

391,45,1,119,119,47,47

46,45,1,119,119,47,47

47,1,119,119,47,47,82

220,45,1,119,119,47,47

47,1,119,119,47,47,221

185,45,1,119,119,47,47

195,45,1,119,119,47,47

382,45,1,119,119,47,47

166,45,1,119,119,47,47

489,45,1,119,119,47,47

38,120,399,45,1,119,119,47,47

277,47,1,119,119,47,47,221

470,47,47,99

17,278,80

277,17,278,80

204,17,278,80

417,369,131

46,3,221,63,301,251

248,1,114,208

314,49,123,49

220,423,70 (這個字的柬和其它的順序不同, 修正為423,70)

277,295,1,250 (火改用 250 末筆才是長頓點)

28,42,106,58,85,425 又應該要用長頓點第二畫的 85,而不是 84。

22,209,382,193,483 一字不二捺, 犬改用 193 的。

✅ 部件與寫法有異者

372, 273,83  原第2部件為 213 應該是錯的, 應為273「毌」ㄍㄨㄢˋ (4畫),但寫法不同「豎,橫折,豎,橫,橫」(5畫)。參「異體字字典-虜」。

竊的右下其實為「禸」,只是寫法有異,最後一個部件像 厶88 (2畫),但寫法應為3畫「豎,挑,點」。參「異體字字典-竊」。

「臧藏臟贓」應修正以戈優先,然後 266 爿 的筆順需調整為豎撇,豎橫折,橫,豎撇。

▋ 相關連結


沒有留言:

張貼留言

 
雄::gsyan © 2009. Design by Pocket