NIIと不満買取センターが研究用データセットを公開

人工知能学会メーリングリスト(登録無料、人工知能学会会員でなくても登録可能)に国立情報学研究所(NII)からのお知らせがあってなんじゃこりゃと思ったのでメモ。メーリングリストに流れていたメールより抜粋(リンク先はnext49が編集)。

国立情報学研究所 情報学研究データリポジトリ(IDR)では,株式会社不満買取センターの協力の下,新たに「不満調査データセット」の提供を開始致しました。

株式会社不満買取センターが運営するWebサービス「不満買取センター」( http://fumankaitori.com/ )に一般ユーザが投稿した様々な不満に関するデータです。

2015年9月までに投稿されたデータのうち,オペレータがタグ付けをした約25万件のデータで,個人情報が含まれた投稿はデータセットから排除されています。

またこの不満を投稿した約2万人分のユーザプロフィール情報(性別や居住県)も付随していますが,データセットに含まれるのは「不満買取センター」で会員が閲覧できる情報であり,特定の個人につながる情報は含まれません。

広く研究にご活用いただければ幸いです。

研究室単位で申し込めるとのこと。で、その不満の内容はどういうのがあるのだろうと思ったら、サンプルデータはない。仕方ないので会員登録してみることに。

他人の書いた不満を閲覧できるのでながめてみると結構ちゃんとした不満がかかれている(ポイント獲得目的のふわっとしたものではなく、日常生活で直面した不満が多い印象)。1日に投稿できる回数や不満の書き方をFAQで提示している上、人手でスクリーニングしているみたい。

おもしろそう。

安住紳一郎 vs 荻上チキ インタビュー対決

いつもラジオ&ポッドキャストを拝聴しているTBSラジオ安住紳一郎の日曜天国Session 22で同じゲストを呼んでインタビューをするという回があった。両方とも今週はポッドキャストで聞くことができる。ゲストはノンフィクション作家の高野秀行さん。新刊の紹介でテーマはどちらも「日本は”納豆後進国”だった?高野秀行のアジア納豆探検記」

日曜天国はベスト3方式、Session 22はフリートーク形式なので掘り下げる方向が違って、同じ人でも別の話をしているのがおもしろい。高野さんの話自体もおもしろいのでぜひ両方とも聴き比べしてみてはと思う。今回のラジオを聞いて、勝手にミャンマーに親しみを持った次第「あいつらも納豆食うんだなぁ」って。

5/29 日本科学史学会大会「ラウンドテーブル:ウィキペディアと科学史――知識とコミュニケーションを考える」

面白そう。全然、継続できていないWAQWAQプロジェクトもどうにかしたいな。

先日のSession-22で松永さんがおっしゃっていた研究者のアウトリーチが評価に反映されていないというのの突破口としてWikipediaはいけそうなんだけどなぁ(Wikipediaの外に研究者が記名付きで記述できるWikipedia的ものを用意して、そこからのWikipediaへの転機を許可する)。
www.tbsradio.jp

関連

社会人SEが数学を学びなおすならば情報処理学会誌の記事はいかがでしょう?

社会人になってから何かを学ぼうとするのは尊い。素晴らしい。
tkykhk.hatenablog.com

一方で、高校数学を教養と考えるならば別として、情報処理技術者としての背骨として数学を学びなおそうとするのであれば、今後のことを想像しながら勉強するほうがモチベーションが上がると思う。で、思い出したのが(というか、研究室掃除していたら見つけたのが)2015年5月号の情報処理学会誌「情報処理」の特集「いまさら聞けない!コンピュータの数学」。情報系の大学に入った大学1年生の方々にもおすすめ。「なんで、こんなに数学ばっかりなの?」に答える(今やっている授業がどこにつながるのかがわかる)特集。お近くの情報処理学会員にお願いした以下の記事だけダウンロードして読ませてもらうのが良いかと。不幸にして情報処理学会員が近くにいなければ、お近くの大学図書館で閲覧するか、Amazonで買うか(2015年5月号「情報処理」)。

  1. 0. 編集にあたって
  2. 1. プログラミング言語の数学
  3. 2. 数値計算における数学 連立一次方程式の求解法を題材として
  4. 3. 機械学習のための数学
  5. 4. 情報セキュリティの数学
  6. 5. 情報系の大学数学カリキュラム

ここ数年の「情報処理」は自分で調べるには大変だけどちょっとキーワードだけでも知っておきたいなぁという事柄について特集組んでくれるので、情報処理学会に入るのもお勧めであります。年会費1万円弱です。

まったくもって数学をやってこなかったプログラマのための最初の一冊としては数学ガールでおなじみの結城さんの以下の本をおすすめ。

私も大学生のときに統計と確率、そして、微分方程式をちゃんとやっておけばよかったなぁと後悔中。最近の機械学習の基礎はこれだものねぇ。