2012年1月18日水曜日

情報カスケードの実験

1月18日(水)に情報カスケードの古典的な実験の追試を行いました。もともとの実験はウェルチのアイデアをもとにアンダーソンが3個の玉が入った二種類の壺R,Bを用意し、そのうちの一つをランダムに選ぶ。二種類の壺の違いは、壺Rには赤玉が二個、青玉が一個、逆に壺Bには青玉が1個、赤玉が一個入っていること。被験者はランダムに選ばれた壺から玉を一個取り出してその色を確認して壺に戻す。その玉の色の情報と、自分より前に選択した被験者の情報をもとに、その壺がRかBかをあてるというもの。他の被験者の情報がない場合、この問題は簡単で赤玉なら壺R,青玉なた壺Bと答えるのが賢明。確率3分の2で正しい結論に到達します。では、他の被験者の回答の情報が分かる場合にはどう選択するのがよいのか?

実験のポイントは、被験者は自分より前に回答した他の被験者の選択結果の情報を得ることができても、実際に玉の色については知りえないこと。もし玉の色が分かるなら、これも話は簡単で、自分の玉も含めて、赤玉、青玉の数の多いほうを選択すればよい。十分大勢の人が自分より前に回答していてくれれば、確率100%で正しい結論に達することができます。しかし、実験では他の回答者の回答は分かっても、その回答者のひいた玉の色は分からない。このとき、回答と玉の色は必ずしも一致しなくなるので、問題が複雑になります。

例えば自分より前二人がたまたま青の玉を取り出して壺Bと回答したとき、自分では赤玉を取り出して壺Rっぽいと思っても、前二人の選択によって自分の玉の情報(赤)を捨て、壺Bを選択することがあるからです。ということは、本当は壺はRなのに、たまたま青玉が2回出ただけで、3番目以降の人が赤玉を取りだし続けても、ずっと壺Bを選択し続けることが起きうる。このように、各自の情報を捨て去り、ある選択肢がずっと続くことをカスケードといい、特に誤った選択肢が続く場合は逆カスケード(Reverse Cascade)と呼んだりもします。

アンダーソンの実験は6人の被験者を並べて、実際の壺でやったそうです。その後、多くの追試(最大40人規模)が行われているのですが、その追試をWEBベースのシステムを開発してやってみました。被験者の数は33人。WEBベースの実験サーバーを用意し、被験者はブラウザから壺を選択する。33人に対応し33個の壺をRかBか最初に設定する。そして、1番から33番まで順番に回答する。ただし、最初は1番目の回答者、2回目は2番目の回答者という感じで、順番はひとつづつずらす。また、玉の比率は2:1、5:4、8:7の3パターンで行う。回答者に与える情報は、自分が引いた玉の色の情報と、自分より前に回答した人のうち、何人が壷R、何人が壷Bかといった情報。これを2時間で2回やる予定だったのですが、サーバーのレスポンスが極端に遅くなり、個々のパターンの実験を行うのに30分近くかかったため、1回やるのが精いっぱいでした。4,5人でリハーサルしたときはスムースに進行し、1パターン10分と見積もったのですが、甘かったようです。また、別の場合を調べたかったのですが、その途中でサーバーエラーとなり、実験中止。結局、壺の比率3パターンに対し、33サンプル得るのがやっと。将来的には50名程度でこの実験を行いたいので、システム設計を再考する必要があるみたいです。(単に、前の人が回答を終えていないと次のひとが回答できず、その回答リクエストがサーバーに集中するのが原因だとは分かるのですが、回答の早い遅いで回答の順番に偏りが出ないようにするのはどうすればいいのかが問題。)

実験結果については、情報カスケードも含め、おいおい紹介したいと思います。

最後になりましたが、実験を手伝ってくれた入江君、岸君、杉本さん、ありがとうございました。また、被験者として参加してくれた物理学科の学生のみなさま、ありがとうございました。

2012年1月8日日曜日

社会物理学の展望

1月7日(土)、統計数理研究所において「社会物理学の展望」という研究会がひらかれ、参加してきました。小田垣先生が主催の研究会で、朝10時から30分の講演が7件と最後に「社会物理学のこれから」についての雑談のようなもの。

石崎龍二(福岡県立大) 「外国為替レートの変動とパターン・エントロピー」 
佐藤彰洋(京大情報) 「ホテル予約サイトデータの統計分析:EMアルゴリズムによる予約傾向分類」
守真太郎(北里大)  「ヒトはいかに情報をコピーするのか?」 
藤江遼(東大)    「コンセンサス問題における多種共存の安定性」
田中美栄子(鳥取大) 「損をする籤を選んでしまう理由:プロスペクト理論の解釈について」 
松下貢(中央大)   「現代社会の豊かさとは-社会物理学の視点より
前野義晴(日本電気(株))「ネットワークゆらぎとパンデミック・リスク」

松下先生は、社会物理の対象のバルク部分が対数正規にしたがうことがベースだという話。楽しめたのは、富の分布が昔と比較して10万ドルを境に対数正規分布から不連続にジャンプし、また一番所得の低い部分の比率が顕著に増加したこと。普通は、高所得の部分で対数正規からべき分布に変化するのですが、最近はべきではなく不連続というの興味深い。(アメリカの経営者や金融関連の人がもらいすぎなのでしょう。)これが最近の格差社会の証拠だとのこと。前野氏のは、パンデミックの時系列データからネットワーク構造を推定する話で、これも楽しめました。パンデミックの場合はSIRモデルでダイナミックスを仮定すれば、感染者の数のデータに合うようにモデルを作れるみたいです。

藤江氏は、言語の競争のアブラ厶・ストロガッツのネイチャーに出た論文のモデルを2言語から3言語に拡張し、相図を求める話。 佐藤さんは、ホテルの前日の予約可能状況から、ホテルの部屋の需要・供給の様子をモデル化する話。ポアッソンでモデル化。石崎先生は、睡眠の深さを脳波のゆらぎのパターンから計算するアルゴリズムを為替市場に応用し、パターンエントロピーの変化と市場の動向に相関があるという内容。田中先生のはプロスペクト理論で、人の選択での非合理性を説明する話のレビューだったのですが、途中で混乱。カーネマンが効用関数、主観確率を仮定して説明したものらしいです。高橋先生に教えてもらったことを思いだしました。

ちなにに、私は論文に書いたことのうち、情報のコピーの部分だけを話しました。回答を知らない場合確率50%で回答するというのは、選択肢にはバイアスがある場合があるから必ずしも正しくはないのでは、という批判。あと、コピーがTanhになる理由に関して、Tanhを仮定しなくても相転移するのか、実験の状況、クイズの内容、アンケートで答えを知っているかどうか確認できないのか、などの質問が出ました。

討論では、社会物理の方向性について議論されました。私の要望は、ミクロな実験事実をもっと積み上げてサイエンスにすること。同じ意見が若い方から出ていたのは心強い。社会現象には再現性がないから説明できればいいとか、悲しい意見もありましたが、そういうことは物理の対象ではない。佐藤さんのいう、データのアーカイブは統数研あたりで作ってほしいものです。

この研究会を最後に、来年度の夏まではなにもなし。しばらくは研究に専念できそうです。

2012年1月2日月曜日

あけましておめでとうございます


ここのところブログの更新がまったくありませんでした。11月に3件書いたあとは皆無で、その前は7月の3件。この原因が情報カスケードの投票実験の論文。昨年の元旦のブログでも書きましたが、2010年の10月に行った実験のデータ解析と、その追試で2011年は終わってしまった。で、出来上がった論文が「Phase transition to two-peaks phase in an information cascade voting experiment」。

アーカイブへの投稿は12月13日ですが、最初の原稿は11月中旬に完成し、その時点でのタイトルは」「Two types of Phase Transtion in an information cascade voting experiment 」。ヒトの協同現象での相転移を実験でカッチリ示せたものだという自信もあり、サイエンスのレポートに投稿したのが11月16日。しかし、11月28日にエディターから「より専門的な雑誌に投稿したほうがいいでしょう」というメールが来てアウト。そこで、今度は物理の雑誌でNo.1のPRL(Physical Review Letter)に投稿したのが12月14日。サイエンスと違って、物理の人ならこの仕事の価値が分かるかと思っていたら、翌12月15日にリジェクト。まさに「瞬殺(By H氏)」でした。しょうがないので、Physical Review Eのレターセクション(Rapid Communication)に同じ原稿をまわしてもらい、エディターに、「内容には自信があるから、PRLで蹴られたけれど見てくれ」と書いて投稿(12月16日)。12月23日にエディターから「レフェリーにまわした」という返信をもらって、ようやく専門家の意見が聞ける状況になりました。

競馬論文1と同じく前途多難な論文になりそうですが、内容には自信を持っているので、レフェリーのコメントが楽しみです。今年は、この論文で分かったことをベースに、ヒトの情報のコピーのミクロとマクロについて理解を深めたいと思っています。

昨年は大変お世話になりました。今年もよろしくお願いします。