pythonのインストール
% sudo aptitude install python2.7 % sudo aptitude install python3 % sudo update-alternatives --install /usr/bin/python python /usr/bin/python2 2 % sudo update-alternatives --install /usr/bin/python python /usr/bin/python3 1
Python3を選ぶ
% sudo update-alternatives --config python
Python3用のpipのインストール
% sudo aptitude install python3-pip
NLTKのインストール
installing NLTKに従いインストールする。
% sudo pip install --upgrade pip % sudo pip install -U nltk % sudo pip install -U numpy % sudo pip install -U bs4
MeCabのインストール
パッケージでインストールする。
% sudo apt-get install mecab libmecab-dev mecab-ipadic % sudo apt-get install mecab-ipadic-utf8 % sudo pip install mecab-python3
確かめる
% python Python 3.5.2 (default, Nov 17 2016, 17:05:23) [GCC 5.4.0 20160609] on linux Type "help", "copyright", "credits" or "license" for more information. >>> import MeCab >>> mecab = MeCab.Tagger("-Ochasen") >>> print(mecab.parse("今日の天気は晴れです。")) 今日 キョウ 今日 名詞-副詞可能 の ノ の 助詞-連体化 天気 テンキ 天気 名詞-一般 は ハ は 助詞-係助詞 晴れ ハレ 晴れ 名詞-一般 です デス です 助動詞 特殊・デス 基本形 。 。 。 記号-句点 EOS >>>
cabochaのインストール
CRF++: Yet Another CRF toolkitからダウンロードしてコンパイルする。
% tar xvfz CRF++-0.58.tar.gz % cd CRF++-0.58 % ./configure |& tee configure.log % make |& tee make.log % sudo make install % sudo ldconfig
CaoboCha: Yet Another Japanese Dependency Structure Analyzerからダウンロードしてコンパイルする。
% tar xvfj cabocha-0.69.tar.bz2 % cd cabocha-0.69 % ./configure --with-charset=UTF8 | & tee configure.log % make |& tee make.log % sudo make install % cd python % sudo python setup.py build_ext % sudo python setup.py install % sudo ldconfig
動作を確かめる。
% python Python 3.5.2 (default, Nov 17 2016, 17:05:23) [GCC 5.4.0 20160609] on linux Type "help", "copyright", "credits" or "license" for more information. >>> import CaboCha >>> c = CaboCha.Parser() >>> print(c.parseToString(sent)) 国境の---D 長い-D トンネルを-D 抜けると-D 雪国であった。-----D 夜の-D | 底が-D 白くなった。-----D 信号所に---D 汽車が-D 止まった。 EOS