CentOSにMeCabを入れる方法
Vagrantで作成した仮想環境内(CentOS)に形態素解析ライブラリの「MeCab」を導入する方法。
yumを用いたインストール手順
- リポジトリの追加
$sudo rpm -ivh http://packages.groonga.org/centos/groonga-release-1.1.0-1.noarch.rpm -
パッケージの更新
$sudo yum makecache -
MeCabと専用辞書のインストール
$sudo yum install mecab mecab-ipadic -
Pythonでも利用できるようにライブラリのインストール
$yum install -y mecab-devel
$pip3 install mecab-python3 - 強化版辞書(mecab-ipadic-dicNEologed)のインストール
$ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git $ cd mecab-ipadic-neologd $ ./bin/install-mecab-ipadic-neologd -n
mecab-ipadic-NEologedとは
MeCabシステム辞書の一つであるIPA辞書を拡張するための新語辞書のノードと新語辞書を組み込んだIPA辞書をインストールするセットのこと。
簡単に言うと、最近生まれた言葉がMeCabで固有名詞として表示される辞書。
週2回辞書の更新があるため、Cronを利用することで更新のあとに辞書のアップデートを行う設定をすることで自動でアップデートを行うことが可能になる。
[利用方法]
$ mecab -d /usr/lib64/mecab/dic/mecab-ipadic-neologd [形態素解析したい文章]