UETANIKUNの備忘録

PHPやPythonのことについての備忘録

CentOSにMeCabを入れる方法

Vagrantで作成した仮想環境内(CentOS)に形態素解析ライブラリの「MeCab」を導入する方法。

 

yumを用いたインストール手順

  1. リポジトリの追加
    $sudo rpm -ivh http://packages.groonga.org/centos/groonga-release-1.1.0-1.noarch.rpm
  2. パッケージの更新
    $
    sudo yum makecache

  3. MeCabと専用辞書のインストール
    $sudo yum install mecab mecab-ipadic
  4. Pythonでも利用できるようにライブラリのインストール
    $yum install -y mecab-devel
    $pip3 install mecab-python3
  5. 強化版辞書(mecab-ipadic-dicNEologed)のインストール
    $ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
    $ cd mecab-ipadic-neologd
    $ ./bin/install-mecab-ipadic-neologd -n

 

mecab-ipadic-NEologedとは

MeCabシステム辞書の一つであるIPA辞書を拡張するための新語辞書のノードと新語辞書を組み込んだIPA辞書をインストールするセットのこと。

簡単に言うと、最近生まれた言葉がMeCabで固有名詞として表示される辞書。

週2回辞書の更新があるため、Cronを利用することで更新のあとに辞書のアップデートを行う設定をすることで自動でアップデートを行うことが可能になる。

[利用方法]

$ mecab -d /usr/lib64/mecab/dic/mecab-ipadic-neologd [形態素解析したい文章]