-
Notifications
You must be signed in to change notification settings - Fork 2
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
重要性の低い語を削る。 #5
Comments
まずはこれを除外することを考える。 |
学校名については 86f37c6 で対応した。 |
30MB → 28MB に減少。非常に効果が大きかった。 |
|
14文字ぐらいなら、意味のあるエントリはありそう。
|
とりあえず、20文字以上のものは本当に意味のあるエントリがないことは目検したので、、20文字以上のものはカット。 |
11文字の「なにこれちんひゃっけい」は変換出来て欲しいかな〜 |
現在、約30MB。615,060行。
SKK-JISYO.L が 4.3MB 175,836 行なのと比べても非常に大きい。約6倍。
新語を大量に収録しているので、大きいのは当然だけれど、もう少し絞ってもいい気がする。
The text was updated successfully, but these errors were encountered: