mecabのインストール

結構詰まりやすいので書きます

mecab導入(ubuntu想定)

前提知識:必要なアセットが異なる

コマンドライン上で使う: mecab

スクリプト上で使う: mecab-python3

mecabの導入

1. MeCabのインストール

$ apt install mecab libmecab-dev mecab-ipadic-utf8

2. mecab-python3のインストール

$ pip install mecab-python3

3. NEologdのインストール

$ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
$ cd mecab-ipadic-neologd
$ ./bin/install-mecab-ipadic-neologd -n

4. この時点では、わざわざ新語辞書のパス指定をしなければならない状態…

5. neologd(新語辞書)が入っているパスを表示

$ echo `mecab-config --dicdir`"/mecab-ipadic-neologd"

6. Mecabが参照する辞書のパスを新語辞書に変更

/etc/mecabrc 中のdicdirを変更して、新語辞書をデフォルトにする
    1. $ vim /etc/mecabrc
    2. dicdir = (5.で表示されたパス)に変更
    3. 保存

7. コマンドライン上でmecabと打ち、西野カナがちゃんと西野カナで認識されるか確認

8. スクリプト上でMeCabをimportし、MeCab.Tagger()で使用確認

使用できない場合、/usr/local/etc/mecabrcがないと言われるので、それを作り、中身は/etc/mecabrcと同じにする → するとおそらくできる

注)おそらくpermissionダメって言われるので、chmod 666とかでpermission変更したのち作成