Mecab の辞書登録

2020/04/18

はじめに

Mecab ではシステム辞書とユーザー辞書に登録できる。

□単語の追加方法

フォーマットはこんな感じらしい。

表層形,左文脈ID,右文脈ID,コスト,品詞,品詞細分類1,品詞細分類2,品詞細分類3,活用形,活用型,原形,読み,発音

1. 作業用&辞書保存用のディレクトリ作成

$ mkdir ~/mecab
$ cd ~/mecab

2. 辞書ファイル作成

vim 等のテキストエディタで下記のように辞書ファイルの元を作ります

みやみや,,,10,名詞,固有名詞,人名,*,,,みやみや,ミヤミヤ,ミヤミヤ

今回は userdic.csv として保存しました。 その後次のコマンドで辞書ファイル user.dic を作成します。

/usr/local/libexec/mecab/mecab-dict-index -d/usr/local/lib/mecab/dic/ipadic -u user.dic -f utf8 -t utf8 userdic.csv

面倒なんで alias を作成しておいた。

alias dic='/usr/local/libexec/mecab/mecab-dict-index -d/usr/local/lib/mecab/dic/ipadic -u /home/アカウント名/mecab/user.dic -f utf8 -t utf8 /home/アカウント名/mecab/userdic.csv'

3. 辞書ファイルを登録

vim 等のテキストエディタで下記のように辞書ファイルを登録します。

修正ファイル: /usr/local/etc/mecabrc

userdic = /home/アカウント名/mecab/user.dic