メモ: 2017年人工知能学会全国大会でのpixiv作品を用いた研究発表

いろいろ学ぶことある。

立命館大学の研究者による「pixiv論文」の論点とは──“晒し上げ”批判はどれほど妥当なのか(松谷創一郎) - 個人 - Yahoo!ニュースで紹介されている日本社会学会が以下の規程を作った経緯を明らかにしてもらえると他の学会の参考になるのでありがいたなぁありがたいなぁと思う次第。この規程は少なくとも19001990年代後半以降じゃないと必要でなかったはずなので、規程の更新の際に検討すべき事例がなにかあったのだと思う。

(1) 作成者の意思の尊重

インターネット上に存在する電子情報は万人の閲覧に開かれてはいるが,調査が回答者の協力を必要とするのと同様に,作成者が拒否する場合に論文で使用することはできない.「無断引用不可」「無断転載不可」の意思表示があるウェブサイトや,加入手続きが必要となるインターネット上のコミュニティでのやりとりを論文で使用する場合は,使用許可を得た旨を明記するなどの注意が必要となることに留意する.

日本社会学会より)

追記(2017/5/28):コメント欄で日本社会学会でのガイドラインの経緯をご説明いただいています。

追記:くだんの論文を読んで

本来行いたい「隠語を用いた性的表現の検出」を行うための予備実験という位置づけの内容。ただ、表現の自由の観点からせめぎあいがある「未成年に対して有害な情報」や「猥褻」という言葉をかなり雑に扱っているので、そのあたりの議論に関心のある人や懸念を持つ人からすると批判されて当然の文書構成だと思う。そして、この背景の下でpixivのR-18ジャンルの小説持ってくるのは理屈がわからない。このデータを使った理由は推測できる。 1) 性的表現を暗喩を使って表現している文書が多い。 2) すでにR-18というタグ付けがされており、性的表現や暴力表現などの「未成年に見せることは好ましくない」表現が含んでいることが明らかである(著者自身がそういう作品だと認めている)。3) 簡単に電子的なテキストデータを入手できる(たぶん、一番大きいのがこれ)。ただし、この論文の背景では売春(援助交際)などの犯罪行為も例にあげて「有害情報」と述べているので、著者自身がゾーニングに配慮して公開している無害なテキストを対象にするのは不適切に感じる。

表1のURLと作者名を墨消しし、第3節のテキスト例も墨消しした上(二次創作作品なので一次作品のキャラ名が出ているのは、この論文の文脈だと風評被害に思えるので。キャラ名を太朗、次郎やAlice, Bobで置き換えてもよし)でPDFを再公開し、存分にいろいろと批判してもらったらよいのではないかと思う。

追記2:研究倫理の話

以下を読んだ感想。
d.hatena.ne.jp

問題とされたのは、二次創作の小説について、その著者に説明や許諾がなく、研究にサンプルとして小説が使われた「らしい」ことに関する、研究倫理的な点だと思われます。
続・「文章フィルタリング研究」案件に関する私的メモ~情報学の研究に文化人類学的な調査手続きは必要か Part2~ - 仲見満月の研究室より)

これが「ヘイトスピーチとなっているSNSの書き込みや、講演、配布された文書について、その著者に説明や許諾がなく、研究にサンプルとしてそれらの文書が使われた」「国会議員のSNSの書き込みや、講演、配布された文書について、その著者に説明や許諾がなく、研究にサンプルとしてそれらの文書が使われた」という場合でも、上記の例と同様に整合性がとれる研究倫理を用意しないといけないと感じる次第。