研究紹介

情報解析学研究室

研究テーマ

統計と多変量解析学

image16

雑誌や書籍に、健康情報があふれています。「○○すれば△△になる」や、「○○すれば△△にならない」で、○○には食べ物やある種の運動(ニンジンとか、深呼吸とか)などが、△△には、病名や症状(風邪とか、腰痛とか)が入ります。中には怪しげなものもありますが、こうした情報が正しいかどうかを確かめるためにはどうしたらいいのでしょう。極端な例として、「風が吹けば桶屋が儲かる」という諺を考えてみます。まず、風が吹いた翌日の桶屋の売り上げを調べる必要があります。(諺では、少し時間が経ってから儲かるのですが、それを確かめるのは時系列解析と呼ばれる手法で、さらに難しくなります。)一日だけではなく、風が吹くたびに調べなければいけません(調べ忘れは欠測値といいます)。春夏秋冬を通して、何年間も続けることになります。一件や二件の桶屋だけでなく、できれば日本中の桶屋を調べたいのですが(全数調査)、それは無理なので、いくつかの桶屋を選んで(標本調査)売り上げを調べます。重要なことは、近所の桶屋や売り上げをネットで公開している桶屋だけを調べてはいけない、ということです。都道府県、都市部、郊外、農村、店舗の形態や規模などの条件が偏らないように選びます(無作為抽出とか、層別抽出という方法を使います)。もちろん、風が吹いていないときの売り上げも調べる必要があります。これだけ苦労して調べても、「風が吹かないときに比べると、儲けが多くなりそう」(帰無仮説が棄却される)という結論がだせればよいほうで、「風が吹いても吹かなくても、儲けには差がなさそう」ということも稀ではありません。健康情報が正しいかどうかを確かめるときも、方法は同じです。20世紀には、集めることができるデータは少なく、データ解析の主な道具は電卓と数表でした(今でも、統計学の講義ではこの方法の紹介が主です)。現在は、ビッグデータなどと言われるように膨大な量のデータが手に入ります。数値だけではなく、自然言語や画像なども解析の対象になります。道具も、表計算ソフトや統計ソフトを利用するのが当たり前になりました。手法も次々と開発されていますが、データ解析の基本となる考え方は、いつの時代でも変わるものではありません。

教員紹介

今井 英幸
今井 英幸 イマイ ヒデユキ
役職
教授
専門分野
データ解析、統計学
趣味
読売新聞の日曜版に連載されている「猫ピッチャー」を読むこと。毎週、楽しみにしています。

知識は「知っている」だけではなく道具として「使いこなせる」ことが必要です。そのためには何度も使って「使い勝手」がわかっていなければなりません。使える道具(知識)をたくさん揃えておきましょう。

廣瀬 善大
廣瀬 善大 ヒロセ ヨシヒロ
役職
准教授
専門分野
趣味

勉強に限らず何かに一生懸命取り組んでみてください.頑張っていると,時に苦しいことがあるかもしれません.けれど,それすらも積極的に楽しんで大きく飛躍してくれることを願っています.