【データの読み方】まずはデータとは何かを考えよう
コラム:データの読み方

データ駆動、データを基にした意思決定。。。
古くはAlibabaやSpotifyが得意としてきました。最近はラーメンの山岡家も活用しているデータ。
現場にいるとこのデータの読み方がいまいち苦手な方が多くいらっしゃいます。
私自身まだ「AI」という言葉がここまで浸透する前に自然言語ベースのレコメンドエンジンを武器として、おすすめ記事のCTRを50%上昇させた経験があります。
データとは何か一緒に考えていきましょう
データとは何か
一言にデータとは言ってもそれが何かを説明できないといけません。
データとは「情報のまとまり」です。データ解析の発展は英語圏が圧倒的に進んでいますので、英語で考えてみると、dataは不可算名です。情報の一連の連なりがデータなんです。
自分は「具体的なイメージ」を大切にします。データと聞いた時の具体的なイメージはなんでしょう?
自分は「いっぱいにセルが埋められシートが何枚もあるエクセル」です。
何の「情報」かを意識する
データと聞いて思い浮かぶ具体的な情報の中身はありません。御幣を恐れずに言うならば、この世にあるものが全部情報なんです。
だから修飾語が必要になります。
例えば、「株価のデータ」。しかし、これも一意には絞れません。ざっと思い浮かぶものでも下記があります
- どの銘柄か
- 時期は
- どのように計算されているのか
- 誰が公開しているか
- 上下(変化率)かそのものの価格か
一般的には日経平均株価の直近の終値か寄り付きの価格を思い浮かべるでしょうが、これだけ多面的な側面があります
「データ」の多面性 5W1H
データと一言にいってもこれだけの多面性があります。
しかし上記上げたもの何かに似ていませんか? 国語の授業で習う5W1Hです。この観点で見切れるわけではありませんけど、ふわふわした抽象的したものが具体的になる修飾語になります。
ほかにも見方はあります。時系列、内外。。。。
コンサルティングファームがいう「フレームワーク」とよく似たものです。
データの見方はいわば「箱の中身は何だろうな」です。芸人がよくやるゲームですね。触り方を変えることで物体を言い当てるゲームですが、触り方がこの「フレームワーク」に該当するものになります。
芸人さんは誇張してやりますけど、箱の中身、本当に怖そうですよね。昔見たものではトムブラウンのみちおさんを充てるゲームもアイドルがやっていましたが、なかなか戦慄ものでした。
実際データに取り掛かるとき、よくわからないものを触るのは怖いものです。いろいろな触り方をして中身を推測していきます。
さいごに:
このコラムではまずはこういったデータの読み方、意識の仕方を連載していく予定です。
次回は「データのライフサイクル」を考えていきましょう