Indonesian spell-cheking dictionary on LibreOffice

普段ちょっとした文書はGentoo Linux上のLibreOfficeで作成しているのだが、気付いたらインドネシア語のスペルチェックが効かなくなっていた。必要な辞書とソフト(hunspell)は入っており、Tool > Option > Language Settings > Writing Aids の Available language modules で、Indonesian の左肩に「ABC」というスペルチェックできまっせマークはあるのに、肝心の hunspell のところで辞書が認識されていない。他の辞書は認識されているし、マレーシア語なんて入れてみても認識されている。おまけに、ターミナル上でhunspellを走らせてみたらインドネシア語は機能している。

良く分からんのだが、他のインドネシア語の辞書で試してみようかと思い付いたものの、そんなものはない。ただ aspell にはインドネシア語辞書があるので、aspell用インドネシア語辞書→hunspell用インドネシア語辞書に変換できればよいと思ったりした。menggoogle して、ここあたりを参照した。

まず、aspell用辞書のディレクトリからaspell5-id-1.2-0.tar.bz2をもって来て、解凍。

> tar xvfj aspell5-id-1.2-0.tar.bz2

その中のid.cwlの内容をdumpする。

> precat aspell5-id-1.2-0/id.cwl > id.txt

id.txtの最後に空行を加えておく。ここから hunspell用の辞書にする。と言っても、一行目に行数、二行目以降の各行にソートした単語があれば良いらしい。

> wc -l id.txt >id_ID.dic

> sort id.txt| uniq >> id_ID.dic

本当はAffix Fileもきちんと作成した方が良いのだろうけれども、よく分からんし、テスト用なので、空のファイルで誤魔化す。

> touch id_ID.aff

でこれを、/usr/share/myspell に放り込んでみる。

ターミナル上のhunspellでもオッケー。LibreOffice上でもオケ。ということは、app-dicts/myspell-id-1.0 が何かおかしいのだな。

で、原理が分かったので、スペルチェック辞書を拡充することができる(が、やる時間があるかどうかは分からない)。Affix Fileは面倒そうだけれども。

KBBI 3 のデータは手元にあるので、それを網羅した辞書があると便利なのか? ただ、di-型、ゼロ型が自動抽出できないしなぁ。言語学の人が作ってくれないかなぁ。