2009年9月21日月曜日

馬券会計学



競馬の勉強に読んでみました。

内容は、「儲け=払い戻し額ー(馬券)購入額」なので、購入額を下げるために、新馬戦、未勝利戦に限定し、さらに馬を研究して絞り込む。払い戻し額を上げるために、万馬券を狙う」というシンプルなもの。これがこの本の売りの「3つのルール」。この新馬戦、未勝利戦に限定するというアイデアは浅田次郎氏も「おはこ」にしていたらしい、という点は興味深い。けれど、全体としてデータが貧弱(ほぼ皆無)で、説得力に欠け、結局自分で運営している競馬情報サイトのPR本でしかない。

例えばオッズが2倍以下の馬の勝率が5割であった。だから人気馬を捨て、万馬券を取りに行くのが正しい、という論理。2倍以上の馬の回収率は2倍以下の馬の回収率にも負けるか、せいぜい同じはず。また、新馬戦、未勝利戦に限定して、どう馬を選ぶのかについては、厩舎によって調教が異なるので、以下の厩舎の場合は要注意とか、パドックでの馬の見方を磨け、とか、本当かどうかもよくわからないか、または普通の人には無理な内容(なので、自分のサイトに来い?、なのか)。

浅田次郎氏の「おはこ」の作戦が分かっただけ、よしとしましょう。

田崎 統計力学I



田崎先生の「統計力学」の教科書の第1巻。昨年まで統計力学を講義していたのですが、自分で書いて配布していたテキストの内容が恥ずかしくなるぐらいの完成度の高さ、説明の的確さ、そして挿話的に語られる統計力学の発展史の面白さに圧倒され、彼の草稿(彼のWEBページから落とせる)を講義で配るようにしました(それ以前の講義も彼の「数理科学」の記事や佐々先生の「熱力学」に影響されて準備したので、根本的に変というわけではないハズです)。もちろん、この教科書のレベルの講義をやって、学生がついてこれるのか、というと無理だと思う部分もあります。実際、前書きにも教科書と講義は違うもの、とあるし。しかし、講義する側や本当に統計力学を理解したい学生は、この教科書で勉強するのがベストだと思います。というか、この本ぐらいしか説得力のある本はない。

この本で私が感心するのは、所々で語られる彼の「統計力学」に対する思いです。第6章の「結晶振動と結晶の比熱」では、「統計力学の真の目標は、普遍的な『物理』を最小限の物理的な性質だけに基づいて理解することである」。こう書くのは簡単です。しかし、この意味で『物理』を研究していくのは非常に難しい。ともすると、現象のデータに振り回されたり、数学にのめりこんだりして『物理』を見失ってしまう。こうした大事な点を、少々毒を含ませた(と感じるのは私だけ?)筆致で本文や脚注で書かれると、「正しい物理学者でありたい」と思ってします。そう思わせてくれる「熱い本」です。

とにかくお薦めの教科書です。

2009年9月16日水曜日

オークションの人間行動学



オークションでのホモ・エコノミカスの振る舞いに関する理論的な研究と、それに基づくホモ・サピエンスの振る舞いの理解を与える本です。というと、意味不明ですが、経済学的に合理的に振る舞うのがホモ・エコノミカス、いじわるだったり、感情に流されたり、理解していなかったりするのがホモ・サピエンスで、経済学はもともと前者を対象にしてきたのですが、最近は後者の本物の振る舞いを扱うのが流行っている。

この本は、オークションのいろいろな形式の紹介から始まり、ビッカレーやeBayなどの2位価格オークション(落札者が払うのは2番目に高い入札価格)や一位価格オークション(落札者は自分の入札価格を払う)で、買う側は入札価格をいどう選べばいいのか、とか、売る側はどういう開始価格や最低落札価格を選べばいいのか、といった問題を扱いつつ、理論的にはどのようなオークションシステムでも、売り手の得る収入は等しくなるといった「収入同値定理」の解説(付録ではその証明も)を行っています。

オークションでの人の行動を記述するアイデアを学ぶのはいろいろと楽しいです。1章を読んでから付録のAを読んだほうがいいでしょう。

業務連絡:F君、この本を渡すので月曜の報告会でネタがないときにでも発表すること。付録Aをみなに分かるように。

2009年9月15日火曜日

競馬でオープンレクチャー


11月7日(土)に競馬を題材に高校生向けの講義をおこないます。そのためのPR用のビラを作成してみました。この講義で話したい内容は、「予測市場でなぜ未来が予測できるのか」について、現在まで分かっていることをベースに、競馬の投票データから競馬ファンの投票行動、予測行動について何が分かるのか、といったことです。予測と結果の間のスケール不変性や投票モデルの数理などをまじえて(時間がなければ、これらの部分はパス)1時間講義します。そのあと、パソコンを使ったデータマイニングの実習を行って、データから予測モデルをどうやって抽出するのか、について解説しようと思います。データマイニングはまだまだ勉強が足りないのですが、楽しめるものにしたいと思っています。

しかし、高校生に「競馬」を講義してよいのか疑問なのですが、入試広報からオープンレクチャーを依頼されたときに、「競馬が駄目ならクレームが来てポシャる」と思いきや、そういうこともなく。

それよりも問題なのは、「予測市場」とか「競馬」で果たして高校生が来るのかという点です。高校生といわず誰でも参加OKなので、興味のある方は是非お申し込みください。申し込み数ゼロというのは悲しいので。

追記:卒研生のみなさまはご招待します。来なかったからといって、卒業延期にはしません。たぶんね。

2009年9月2日水曜日

実践データマイニング



今週末に慶応で行われるデータマイニングの勉強会の予備知識として、また、2009年度の卒論のテーマのひとつが競馬予想ということもあり読んでみました。

内容は、決定木、ニューラルネットワークを用いて競馬予想(一番人気が取れる条件を明らかにする)、日経平均予想(現状の値が天井、底からどの程度の位置にあるのか)を行うというものです。また、こうした実践のあと、最後の章では、データマイニングで得られたニューラルネットや多重線形回帰の式から、人間の理解できるルールに翻訳する方法の紹介をしています。

私の競馬の興味は、オッズの数字の生成起源なので、オッズを用いたデータマイニングには興味はないのと、また結果も「もうからない、回収率80%前後で馬連の75%とほぼ同じ」なので、競馬に関してはイマイチ。日経平均予想の部分は、やたらとグラフが多い点は、もうすこし簡潔に書けるのではと思いましたが、結構成績がよいので、その点では感心しました。ただ、筆者は実践したら損したとあるので、まだまだなのでしょうが。

大変参考にはなる本だと思います。特に、ルールの抽出部分は、いろいろ勉強してみたいと思いました。矛盾しててもしいから多数のルールを生成し、そのルールの多数決でシステム全体を記述できるのか、とか。競馬のオッズの生成も最後は多数の多様なルールに基づく投票モデルでないと、理解できないという印象を持っているので。

業務連絡:I君、がんばって読んでくること。この本の次はニューラルネットの本を渡す予定です。

2009年9月1日火曜日

Vine Linux 5.0


デスクトップPCとType PのLinuxを最新版のVine Linux5.0 (2009.8.24公開)に入れ替えてみました。Vine Linuxは最初からTeXが使えるのが一番気に入っているところで、今度のももちろん使えるのですが、エディタのEmacsが入っていないのには驚きました。あとは、グラフィックライブラリのEGGXをいれて、研究環境完成。gccとrubyそれにLatexと、Emacsだけで研究をしているので。

最近、日本語入力が不安定だったことがVine Linux 4.2の不満点だったので Ubuntu Linuxも考えたのですが。最新のVine 5.0ではどうなっているのか、使い込んでみようと思います。

追記:TYPE Pの解像度が「1024*600」、いわゆるネットブック解像度となってしまうのですが、私にはそのぐらいが丁度いいです。(たぶん、ちゃんと設定すれば高解像度にできるのでしょうが。)

追記2:しばらく使ってみましたが、どうも使いにくい。Vine 4.2に戻すことにしました。ちょっとガッカリです。Ubuntu に慣れたほうがいいのかも知れません。