【データの読み方】データ利用についてDigDown
コラム:データの読み方

データ駆動、データを基にした意思決定。。。
古くはAlibabaやSpotifyが得意としてきました。最近はラーメンの山岡家も活用しているデータ。
現場にいるとこのデータの読み方がいまいち苦手な方が多くいらっしゃいます。
私自身まだ「AI」という言葉がここまで浸透する前に自然言語ベースのレコメンドエンジンを武器として、おすすめ記事のCTRを50%上昇させた経験があります。
データとは何か一緒に考えていきましょう
そのデータ、利用できますか?
データを目の前にすると、よくやりがちなのは「このデータから何ができるか考える」ということです。
「過去2年分の取引データがある。アイテムマスタ、顧客マスタもたまっている。商談の履歴は書き残させている。ビッグデータだ。何かできるだろう。」 --- (A)
聞いたこともあるし、もしかしたら実際に言ったこともあるのではないでしょうか。
まず、このセリフを言うような企業のこの程度のデータ、ビッグデータではありません。たいていの場合数GBも存在しません。しかも実際に使っているデータ数は数十MBでしょう。
ビッグデータはテラバイト級で大企業でしかほぼ存在しませんし、自動ではなく手動で書き残させている時点でほとんどたまっていないのが現実です。大勢の人が使用し、その使用の中で自動的に生成されるからこそ、データがたまり、ビッグデータとなるので、一般的にビッグデータとは言えません。
このようなデータから機械学習の探索ようなを行うことは不可能です。データ量が足りません。
そもそもデータとは「ゴミの山」だと思ってください。ゴミの山の中にはレアメタルを含むものがあります。燃やさないごみで出すオーディオや小型家電のようなものに金などが含まれています。このレアメタルが結果になるのですが、この取り出したレアメタルをどう使うかはこのレアメタル自体も量がないと価値が生まれないのです。
ましてや、上記で書いた例の場合、データ量はせいぜい家庭ゴミの量です。
つまり、大概の場合、(A)の問いの答えである「何かの予測」には使えない。という答えになります
目的を決めることで、データの価値を出しやすくする
データは「目的」があって初めて価値を持ちます。目的がないままデータを眺めても、意味のある情報は浮かび上がってきません。たとえば「売上を伸ばしたい」という目的があれば、「どの商品がどの顧客層に売れているか」「季節や曜日による変動はあるか」といった問いが生まれます。そしてその問いに答えるために、必要なデータの切り口や集計方法が見えてくるのです。
目的が定まると、データの中にある「レアメタル」を見つけやすくなります。逆に目的が曖昧なままでは、ゴミの山を前にして「何か使えるものはないか」と探すことになり、時間も労力も無駄になりがちです。目的は、データに光を当てるスポットライトのようなもの。照らす方向が決まっていれば、必要な情報が浮かび上がってくるのです。
目的を決めることで次に必要なデータを収集する意思決定をする
目的があることで、今あるデータの「足りなさ」に気づくことができます。たとえば「リピーターを増やしたい」という目的があるとします。すると「初回購入日」「再購入日」「購入間隔」などのデータが必要になります。もしそれらが記録されていなければ、「今後はこの項目を記録しよう」という意思決定が生まれます。
つまり、目的は「データ収集の羅針盤」です。闇雲にデータを集めても、使えない項目ばかりが増えてしまいます。目的があることで、何を記録すべきか、どの粒度で残すべきか、どのタイミングで取得すべきかが明確になります。これは、データ活用のサイクルを回すうえで非常に重要なステップです。
利用には目的が不可欠
データ活用の出発点は「目的」です。目的がなければ、データはただの記録にすぎません。目的があることで、問いが生まれ、問いがあることで分析が始まり、分析があることで意思決定が可能になります。つまり、目的はデータ活用の「起点」であり「軸」です。
目的がないまま分析を始めると、結果は「なんとなく面白い」止まりになります。意思決定につながらない分析は、ビジネスにおいては意味がありません。目的があることで、分析結果が「使える情報」になり、行動につながるのです。
データは「目的」というフィルターを通して初めて意味を持ちます。目的がなければ、データはただの数字の羅列。目的があることで、数字が語り出し、未来へのヒントとなるのです。