Mecab の辞書登録
はじめに
Mecab ではシステム辞書とユーザー辞書に登録できる。
フォーマットはこんな感じらしい。
表層形,左文脈ID,右文脈ID,コスト,品詞,品詞細分類1,品詞細分類2,品詞細分類3,活用形,活用型,原形,読み,発音
1. 作業用&辞書保存用のディレクトリ作成
$ mkdir ~/mecab
$ cd ~/mecab
2. 辞書ファイル作成
vim 等のテキストエディタで下記のように辞書ファイルの元を作ります
みやみや,,,10,名詞,固有名詞,人名,*,,,みやみや,ミヤミヤ,ミヤミヤ
今回は userdic.csv として保存しました。 その後次のコマンドで辞書ファイル user.dic を作成します。
/usr/local/libexec/mecab/mecab-dict-index -d/usr/local/lib/mecab/dic/ipadic -u user.dic -f utf8 -t utf8 userdic.csv
面倒なんで alias を作成しておいた。
alias dic='/usr/local/libexec/mecab/mecab-dict-index -d/usr/local/lib/mecab/dic/ipadic -u /home/アカウント名/mecab/user.dic -f utf8 -t utf8 /home/アカウント名/mecab/userdic.csv'
3. 辞書ファイルを登録
vim 等のテキストエディタで下記のように辞書ファイルを登録します。
修正ファイル: /usr/local/etc/mecabrc
userdic = /home/アカウント名/mecab/user.dic
ディスカッション
コメント一覧
まだ、コメントがありません