matsuok’s diary

あくまでも個人的意見であり感想です

データマイニング

ごまかされるな。数字に


「数字で話せ」といわれことありませんか?
主観ではなく、客観的な事実である数字で語れというのは、上司や管理者から言われることが多い。
これは、実績を数字で表現し評価するということだが、結果を示す数字の背景をどうとうるかというのは、非常にむずかしい。

膨大な売り上げデータなどから、法則性をみちびきだすデータマイニングを平易に説明しているのが、下記書籍である。

数式を使わないデータマイニング入門 隠れた法則を発見する (光文社新書)

数式を使わないデータマイニング入門 隠れた法則を発見する (光文社新書)

得てしてでる結果は、わかりきったことが多いというのは、同感。
データウェアハウスを導入し、最初に確認できたのは、既知のことだったというのはよくあった。
基本的には、営業企画部門などが感じている仮説を検証するのが主で、仮説をたてるのはシステムではなく、人間そのものである。

仮説をだせるかというのは、属人性が強く、ほとんどの場合は、仮説もたてず数字の大小のみを論ずる場合がほとんどである。これで、「数字」で語っているのだろうか。

こうなると、「数字だけで話すな」となりそうだ。
どこかの本に、

「数字がわからない馬鹿と、数字しかわからない馬鹿」