Ubuntu 16.04上でPython3とNLTK

pythonのインストール

% sudo aptitude install python2.7
% sudo aptitude install python3
% sudo update-alternatives --install /usr/bin/python python /usr/bin/python2 2
% sudo update-alternatives --install /usr/bin/python python /usr/bin/python3 1

Python3を選ぶ

% sudo update-alternatives --config python

Python3用のpipのインストール

% sudo aptitude install python3-pip

NLTKのインストール

installing NLTKに従いインストールする。

% sudo pip install --upgrade pip
% sudo pip install -U nltk
% sudo pip install -U numpy
% sudo pip install -U bs4

MeCabのインストール

パッケージでインストールする。

% sudo apt-get install mecab libmecab-dev mecab-ipadic
% sudo apt-get install mecab-ipadic-utf8
% sudo pip install mecab-python3

確かめる

% python
Python 3.5.2 (default, Nov 17 2016, 17:05:23) 
[GCC 5.4.0 20160609] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import MeCab
>>> mecab = MeCab.Tagger("-Ochasen")
>>> print(mecab.parse("今日の天気は晴れです。"))
今日	キョウ	今日	名詞-副詞可能		
の	ノ	の	助詞-連体化		
天気	テンキ	天気	名詞-一般		
は	ハ	は	助詞-係助詞		
晴れ	ハレ	晴れ	名詞-一般		
です	デス	です	助動詞	特殊・デス	基本形
。	。	。	記号-句点		
EOS

>>> 

cabochaのインストール

CRF++: Yet Another CRF toolkitからダウンロードしてコンパイルする。

% tar xvfz CRF++-0.58.tar.gz
% cd CRF++-0.58
% ./configure |& tee configure.log
% make |& tee make.log
% sudo make install
% sudo ldconfig

CaoboCha: Yet Another Japanese Dependency Structure Analyzerからダウンロードしてコンパイルする。

% tar xvfj cabocha-0.69.tar.bz2
% cd cabocha-0.69
% ./configure --with-charset=UTF8 | & tee configure.log
% make |& tee make.log
% sudo make install
% cd python
% sudo python setup.py build_ext
% sudo python setup.py install
% sudo ldconfig

動作を確かめる。

% python
Python 3.5.2 (default, Nov 17 2016, 17:05:23) 
[GCC 5.4.0 20160609] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import CaboCha
>>> c = CaboCha.Parser()
>>> print(c.parseToString(sent))
        国境の---D                
            長い-D                
        トンネルを-D              
            抜けると-D            
        雪国であった。-----D      
                    夜の-D |      
                      底が-D      
                白くなった。-----D
                      信号所に---D
                          汽車が-D
                        止まった。
EOS

リンク:OpenStreetMapでIndoorマッピング

最近、いろんなところで「屋内をロボットで巡回させたい」と聞くのでそのときの地図情報ってどういうのだろうと探していたら見つけた。大学内の障碍者用トイレのマッピングとかやるの面白そうだけど、どうやるんだからさっぱりわからん。

Citation Hunt 日本語版~Wikipediaの信頼性向上に参考文献提示で貢献できる

「Wikipediaに書いてあることは信頼できない情報ばかりだ!」とお嘆きの方に朗報。信頼できないものを信頼できるように貢献できます。

tools.wmflabs.org

CitationHuntは、Wikipediaの記事につけられた「要出典」タグを探し出し、その部分を画面に表示します。もし、その記述に関係する出典に心当たりがあれば「知っている!」ボタンをクリックして、当該のWikipedia記事の編集ページに飛び、出典を付け加えます。残念ながら、出典に心当たりがなければ「次!」ボタンをクリックし、別の「要出典」を表示してもらいます。

「記事全体を書き直すのはちょっとしんどい」でも「出典追加ぐらいならできるかな?」と思っている方には便利なツールです。まあ、出典わかってもWikipediaの記事に参考文献付け加える方法が分からないと貢献できないのですが。

このツールは2016年に始まったすべての図書館員がウィキペディアにひとつずつ参照文献を加える#1Lib1Refキャンペーンにおいて、より簡単にこの取り組みに参加できるようにGuilherme P. Gonçalvesさんが開発したツールとのことです(出典)。
tools.wmflabs.org

その英語版をtakashi otaさん(ら?)が日本語対応にしてくれたのがCitationHunt日本語版です。

自分で作れという話ですが、誰がどの記事に出典を追加したのかを簡単にリスト化できる機能があると大学の授業で使いやすいなぁと感じております(たとえば、コンピュータリテラシーや情報リテラシーの授業で学生に出典追加10件以上という課題を出す。教育の狙いとしては、後から他人が書いた文章の出典を探すというのは大変であることを体感してもらう)。

関連エントリー

追記:2018年5月31日


上々颱風ベスト10

今日の通勤中にふと上々颱風のLet it beのメロディが浮かんできた。採点疲れの酔いに任せて個人的上々颱風のベスト10を挙げたいと思う。

What is 上々颱風

ちゃんちきmusicのバンド。現在、休止中

私と同じ年代かちょっと上の方にはJALのCMで流れた「愛よりも青い海」を歌っていたバンド。
youtu.be

ジブリが好きな方には平成狸合戦ぽんぽこの主題歌を歌っていたバンド.
youtu.be

上々颱風との出会い

中学生のとき同じ部活の友達がおすすめといってカセットテープに入れてくれたのが上々颱風2。これが最高に良くて、すぐにレンタルCD屋(当時はそういうサービスがあった)に走り、上々颱風上々颱風3を借りてカセットテープにダビングした。それ以来、大学生まではレンタルCD屋で、大学生以降はAmazon.co.jpでCDが出るたび買っていた。一度だけ、ライブも聞きに行ったことがある。そのライブが今のところ生涯1度の自分からチケット買って行ったライブ。

ベスト10

なお、順位は飾り。

  1. 美は乱調にあり in 上々颱風3(1992):これが「ちゃんちきロック」なんだなぁという名曲。みんなに聞いてほしい。
  2. Let it be in 上々颱風2:ビートルズの原曲よりも先にこちらに出会ったので、こっちにチューニングされてしまった。みんなに聞いてほしい。
  3. ものみな歌に始まる in SHANG SHANG TYPHOON 8(2000):この一曲を聞くと映画を一本見た気になる。旅に出たくなる曲。
  4. GHETTO BLASTER in SHANG SHANG TYPHOON 8(2000):超かっこいい。こぶしきかせてジャズピアノに乗せて歌うのがとても良い。
  5. 仏の顔もIt’s All Right in 上々颱風:名曲。
  6. 上々颱風のテーマ in 上々颱風:歌詞に(私が中学生だったときでも)時代を感じるけどノリが素晴らしい。
  7. エンド・テーマ in 上々颱風:こういう曲を楽しく歌える人たちは素晴らしい。これ聞いた後にすぐに「上々颱風のテーマ」に戻る時期が一時期あった。
  8. 平和が戦車でやって来る in SHANG SHANG TYPHOON 8(2000):たぶん、反戦歌。でも、それと関係なく聞いていて気持ち良いので好き。
  9. 愛より青い海 in 上々颱風2:名曲。行ったことのない沖縄の海をいつも想像していた
  10. 気分はセントウ! in 上々颱風2:すごい好き。今でも温泉とか入るときに口ずさんでしまう。
  11. 菜の花畑でつかまえて in 上々颱風2:さびの「愛はメロディ、リズムは命、愛に命を吹き込んで…」がとても気持ち良い
  12. 八十日間亜州一周 in 八十日間亜州一周(1994):アルバムのタイトルソングだけあって壮大な曲
  13. レボルシオン音頭 in 上々颱風3(1992):こんなに気楽に革命説かれると。これもとっても良い「ちゃんちきロック」
  14. ヨコスカ バーニング ナイト in 上々颱風2, Gnahs Gnahs グナース グナース(1997):スカジャンと聞くとこの曲が頭に流れる
  15. 秋刀魚の唄 in 上々颱風3(1992):こんなにかっこよく秋刀魚と失恋を歌い上げなくてもという名曲。これ聞いて以来秋刀魚のワタを食べるようになった。
  16. アビシニアを遠く離れて in 愛があるから大丈夫(1993):さびの「アビシニアの風のバザール あなたに会いたい」という歌詞がイメージすごい広げてくれて好き。
  17. 恋のバカヂカラ in 上々颱風11-あったりまえだ
  18. 張り扇の薔薇 in Shang Shang A Go Go! (2005):ミュージカル仕立てな曲。ライブで聞いて衝撃を受けた
  19. ハレルヤ in た め ご ま
  20. メトロに乗って浅草へ in 愛があるから大丈夫(1993):うさんくさい感じが素晴らしい
  21. アジアのこの街で in 八十日間亜州一周(1994):どこかの保険のCMソングに使われていた。
  22. 新しい日~A New Day~ in Gnahs Gnahs グナース グナース(1997):出だしが最高に好き。
  23. ヤッタネ節 in 上々颱風3(1992):さびが気持ち良い

全然、ベスト10じゃないけど。1~12までのアルバムの中だと、最初に出会った1~3の曲が一番好き(長く聞いているし)。その次は8が好き。12はあまり聞きこんでいなかったみたい。

以下、YouTube.

youtu.be
youtu.be
youtu.be

youtu.be

タイトルには具体的な年を入れたほうが良いね。

togetter.com

大元:2011年の中教審の議論に関する報道

2011年2月の報道

中央教育審議会は31日、大学院博士課程で、院生が1人の教員に師事して研究を手伝いながら指導を受ける“徒弟制度”や、特定のテーマに絞り込んだ修士論文の廃止などを盛り込む大学院教育改革策を高木義明文部科学相に答申した。

博士課程修了者が民間企業で敬遠される傾向があり、国際社会で活躍できる人材育成も不十分という批判が出ていることから、幅広い分野の研究をさせることで、企業などが求める人材育成を目指す。答申を受け、文科省は具体的な制度改革の検討に入る方針。

答申では、博士課程の院生が、1つの研究室にだけ属して1人の教員から指導を受ける現行制度からの転換を提言。複数の研究室で指導を受けながら学位を取得するように求めている。

また、5年制の博士課程の2年修了時点で、特定の研究テーマについてまとめる修士論文を原則的に廃止。代わりに幅広い分野についてテストやリポート審査を行う「クォリファイング・イグザム」の導入を求めている。

ただ、博士課程とは別にある修士課程は今後も存続するため、同課程での修士論文などは存続を認める。

新しい制度は、トップレベルの大学院教育を推進するために、各大学院の中から指定される「リーディング大学院」などで先行して導入される見通し。

(産経新聞:“徒弟制度”や修士論文の廃止求める 大学院博士課程で中教審答申より)

上の後の話が以下の報道。2011年10月の報道

www.nikkei.com


実施されたときの文科省の通知。