Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

異體字選擇 #10

Open
5 tasks done
ywxt opened this issue Feb 22, 2024 · 3 comments
Open
5 tasks done

異體字選擇 #10

ywxt opened this issue Feb 22, 2024 · 3 comments

Comments

@ywxt
Copy link
Owner

ywxt commented Feb 22, 2024

以下標註✅的異體字優先安排簡碼,除以下所列項之外,亦當包含 #5 中所涉及之漢字。

  • 群✅ 羣 ❌
  • 峰✅ 峯 ❌
  • 裏✅ 裡 ❌
  • 爲✅ 為 ❌ (包括作部件所構成的異體字)
  • 衮✅ 袞 ❌ (包括作部件所構成的異體字)
@belovedrebellion
Copy link

belovedrebellion commented Nov 30, 2024

個人建議將如「群」「羣」,「峰」「峯」,「裏」「裡」這類由相同部件組成而僅僅結構關係不同的異體字放到同一編碼的次選上,這樣能形成更爲直觀的兩字對比,且如 bt; 打出 手感也比敲擊 btdg 好得多。唯一可能影響到的就是那幾個簡詞,但我感覺真正需要那幾個簡詞的用戶應該極少。或者作者可以指教一下我如何將前述那幾組異體字放到同一簡碼的候選位上。

@ywxt
Copy link
Owner Author

ywxt commented Nov 30, 2024

huma.short.dict.yaml 搜索相關的字,按照格式追加即可,注意 漢字與編碼之間是 <Tab> 而不是空格。

我在攷慮是否可以做一個異體字開關,開啓後在每個字後追加相應的異體?

存在的問題:

  • 理論上像「群羣」與「花蘤」都屬於異體,但實際使用中二者詞頻差異很大,都出現是否符合用戶預期?如果只選擇部分,那標準又該是什麼?
  • 能否讓用戶選擇首選使用的變體?直觀上存在異體的詞組可能比較難實現。

@ywxt ywxt mentioned this issue Nov 30, 2024
9 tasks
@belovedrebellion
Copy link

belovedrebellion commented Nov 30, 2024

感覺不太現實,異體字的數量太龐大了,裏面必然有很多一般人完全用不上的異體字形。各種俗字與本字等更是不知用戶會偏好於哪一類,個人認爲還是宜用戶自己去做個性化設置。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants