2009年9月2日水曜日

実践データマイニング



今週末に慶応で行われるデータマイニングの勉強会の予備知識として、また、2009年度の卒論のテーマのひとつが競馬予想ということもあり読んでみました。

内容は、決定木、ニューラルネットワークを用いて競馬予想(一番人気が取れる条件を明らかにする)、日経平均予想(現状の値が天井、底からどの程度の位置にあるのか)を行うというものです。また、こうした実践のあと、最後の章では、データマイニングで得られたニューラルネットや多重線形回帰の式から、人間の理解できるルールに翻訳する方法の紹介をしています。

私の競馬の興味は、オッズの数字の生成起源なので、オッズを用いたデータマイニングには興味はないのと、また結果も「もうからない、回収率80%前後で馬連の75%とほぼ同じ」なので、競馬に関してはイマイチ。日経平均予想の部分は、やたらとグラフが多い点は、もうすこし簡潔に書けるのではと思いましたが、結構成績がよいので、その点では感心しました。ただ、筆者は実践したら損したとあるので、まだまだなのでしょうが。

大変参考にはなる本だと思います。特に、ルールの抽出部分は、いろいろ勉強してみたいと思いました。矛盾しててもしいから多数のルールを生成し、そのルールの多数決でシステム全体を記述できるのか、とか。競馬のオッズの生成も最後は多数の多様なルールに基づく投票モデルでないと、理解できないという印象を持っているので。

業務連絡:I君、がんばって読んでくること。この本の次はニューラルネットの本を渡す予定です。

0 件のコメント: