Res Gestae: ニューラルネットとソーシャルネット２

「ニューラルネットとソーシャルネット」の続き。

今回の研究で一番驚いたというか、直感に反した結果というのは、参照する人数を増やすと正答率が下がるというものでした。考えている状況は、一人一人順番に投票し、そのうち比率1ーｐの人は確率qで正しい投票を行い、比率pの人は無知で二択のうちのどちらが正しいか分からないというものです。このままだと全体の正答率は(1-p)q+0.5pとなります。無知な人々は、自分より前に投票した人の投票結果を参考に、その多数決の教えるほうに投票するとします。問題は、何人の意見を参考に投票するのが自分の正答率をもっとも上げることができるかというものです。直感的には、過去のすべての投票結果を見て、それを参考に投票するのがもっともよさそうです。モデルでは、多数決に従うとしているので、自分の順番が100番なら過去99人の投票結果のうち、66人が選択肢Aで残り33人が選択肢Bなら、選択肢Aを選ぶ。自分の順番が1000番なら、過去999人の多数決に従う。こうすれば、過去の情報をすべて取り入れることが可能になり、無知な人々の影響も弱まって、正答率も最大になるだろう。

図は、無知な人が80%存在する場合に、10000人の人が投票したときの全体の正答率をプロットしたものです。y軸はその正答率π。x軸は参照した人数rです。参照人数が１人の場合、無知な人は自分の直前に投票した人の結果を参照し投票する、というかんじです。図を見ると、正答率はある参照人数のところで最大になっていることが分かります。qが100%の場合は一人参照、それ以外の場合は5人から10人ぐらいを参照するのが正答率が最大で、参照人数をそれ以上に増やすと正答率は減少します。

何人を参照して投票するのがベストなのかは、全体の投票人数（何番目に投票するのか）や無知な人の比率p、正しい人の正答率qを変えると変化するので、一概には言えないのですが、pが80%以上の場合は5人から10人を参照するのがよく、pが低い場合は何人参照しても正答率はほとんど変化しないのですが、参照人数が多いほうが正答率は高い。次の図は、pをx軸に、正答率をy軸にとり、参照人数を変えたときのpと正答率の関係（1万人投票でq=0.6の場合）をプロットしたものです。pが大きい場合は参照人数が少ないほうがよく、小さい場合は多数の人の意見に従ったほうがいいことが分かります。また、参照人数が無限大の場合、無知な人々の比率が50％をこえているならば、どの参照人数の場合よりも正答率が低いこともわかります。

例えば、食べログやアスクUなどのレストランでレビュー件数が1000件の場合、1000件での多数決よりは直近10件での多数決のほうがいいということなのでしょう。情報の鮮度を考えると、数年前のレビューより、この２、３カ月のレビューを信じたほうがいいという、何かあたり前の結論になります。参照人数を多くすると正答率が下がるというのは別に直感に反するわけではなく、常識なのかもしれません。

もちろん、これはあくまで例え話なので、問題の本質とは関係ありません。情報カスケードで悪い状態に捕まったとき、参照人数がすくないならば、正しい人が状況をひっくり返せるけれど、参照人数が多い場合はそれができない、ということなのでしょう。

Res Gestae

2011年1月20日木曜日

ニューラルネットとソーシャルネット２

0 件のコメント: