「ビッグデータを使ってデータ分析」「データ分析で未来予測」なんていう言葉を、よく耳にするようになりました。
なんとなく「すごいんだな」っていう感じはするのですが、いまいち実感がわかないと思いませんか?
「で、結局データ分析で何がわかるの?」「何をどうすればいいの?」て感じなんですよね。
データ分析という言葉自体が、具体的にイメージできるものではなく概念的なものということも分かりにくくなっていると思います。
そこで、データ分析っていったい何なのか、そしてその必要性について少し考えてみたいと思います。
データ分析って何?
データ分析とは情報に思考的かつ能動的作用を加え、判断、決心(決断)及び行動をするうえで役立つレベルにまで (出典:武器になる情報分析力 上田 篤盛 著) 高めることといえます。
よくわかりませんので、もう少しわかりやすく翻訳してみましょう。
データのもとになるものは情報なのですが、情報をそのまま与えられても分析することはなかなか難しいものがあります。
例えば、交通情報には大量の情報が詰まっていて、イメージ的にはビッグデータそのものですよね。
この大量の情報から目的に沿ってデータを抽出、加工し、意思決定者が決断を下すための資料、つまりインテリジェンスを作成することが、データ分析といえるでしょう。
ここでキーワードとして出てくるのが、データと情報とインテリジェンスですね。
簡単にですが、これら三つの言葉がどんな意味を持つのかを説明しておきます。
情報とは何か?
情報とは、数多くのデータで構成された何らかの媒体を通じて受信者に伝達される、一定の意味を持つ実質的な内容のことといえます。(出典:IT用語辞典バイナリ)
交通情報の例で考えると「高速道路が渋滞している」という内容で発信者が受信者に伝えることで、受信者は「高速道路が渋滞しているんだ」と思いますよね。
一般人ならそれでもいいのですが、高速道路の渋滞を避けて目的地に着きたい利用者や、渋滞を解消するための方策を考える立場の人達から見れば、情報として全く不十分です。
そのために、漠然とした情報の中から利用者が、必要とするデータを抽出加工する必要があるわけです。
データとは何か
データとは、
既知の事項や判断材料.研究活動においては,調査や実験により得られ,考察の材料となる客観的な結果である.一方,情報処理システムの処理対象でもある.出典:図書館情報学用語辞典 第4版
つまり先ほどの交通情報でいうと、交通情報を構成する要素の一つ一つ、例えば一日の東名高速道路交通量や首都高の一日の渋滞件数など、情報の中から実験や観察などによって得られた事実や科学的数値をデータというのです。出典:大日本百科事典
インテリジェンスとは何か
インテリジェンスとは、情報というデータの塊から目的をもって抽出されたデータを加工し、意思決定の判断材料まで高めたものをいいます。
例えば、交通情報から東名高速は一日のうちで「いつ」「どこが」渋滞しやすいかがわかれば、その時間や、その場所を避ける選択ができますよね。
つまり、情報から抽出されたデータが加工され、意思決定の資料になったものがインテリジェンスというわけです。
なぜデータを分析するのか?
データ分析を行う理由は、情報から意思決定のためのインテリジェンスを構築するためですが、インテリジェンスを構築することで得られるメリットは、主に以下の三つになります。
- 現状分析と将来予測
- 問題点や可能性の発見
- スピーディーな意思決定
現状分析と将来予測
データを分析することで得られるメリットの一つが、現状の確認と未来の予測ですね。
また交通情報の例ですが、データを分析することで渋滞が起きる場所と時間、規模がわかりますよね。
つまり現状の把握ができることになり、どのような選択をすればどんな結果を得ることができるのかが、わかるようになる。
つまり未来の予測ができるようになるのです。
問題点や可能性の発見
データを分析することで、いままで見えなかった問題点や改善、そして新しい機会発見の可能性を見つけることができます。
例えば同じ時間帯に同じ場所で渋滞が起きる原因や、道路の拡張や交通流入の規制による渋滞改善などを考察する材料にもなりますね。
この今まで見えなかった問題点が見える、改善や新しい機会、選択の可能性を発見できることこそがデータ分析の可能性といえますね。
スピーディーな意思決定
確かな根拠に基づいて分析されたデータをもとに作られたインテリジェンスがあることで、意思決定を迅速に、的確な方向性をもって行うことができます。
例えば、事故が多発する理由が分析によって判明したのであれば、迅速に改善するという決断を行うことが可能になります。
つまり判断にたる材料があることで、極端な話、右に行くか左に行くかの決断が簡単にできるようになるのです。
データ分析時の注意点
データ分析は主に、意思決定のために必要なインテリジェンスを作成するために行われますが、以下の点に注意しなければまったく意味のないものになってしまいます。
三つの注意点とは、以下の点です。
- 目的の明確化
- 分析は手段
- データ分析のためのデータ分析
目的の明確化
「なぜデータを分析するのか」という目的がしっかりと確立されていなければ、闇雲にデータをいじってそれで分析したような気分になってしまうことがあります。
それではどう考えても、いい結果が出せるとは思えません。
データ分析の目的を明確化するために必要なのが「前提」と「仮説」です。
前提とは「不完全であるものの、おおよそ正しいとされる情報。(出典:武器になる情報分析力 上田 篤盛 著)」のことを言います。
極端な例でいうと「東名高速が通常通り開いている。」など、になりますね。
何らかの事件や事故によって、東名高速が開いていない場合を前提から外しておかなければ、正確な高速道路情報の分析はできなくなります。
そして、その前提をもとに立てる必要があるのが仮説です。
例えば、東名高速が通常に開いていることを前提として、渋滞が起きやすい時間帯は出勤時の7時から8時と、帰宅時の6時から7時という仮説を立ててそれを検証する。
仮説を立てることで分析自体に目的が与えられるので、意味のない分析をしてしまうことを避けることができます。
データ分析は手段
仮説を立てて、データ分析をしてみたはいいけど、相手に伝わらない分析結果では意味がありません。
データを分析するだけで必要なインテリジェンスを提供できなければ、それはただのデータ分析のためのデータ分析になってしまうのです。
データ分析の目的は、仮説を検証し現実に当てはめて意思決定の参考にできるインテリジェンスを作り上げるところまで。
意思決定に使えるインテリジェンスを作れないのであれば、データ分析が目的化してしまっているということなのです。
データ分析のためのデータ分析
データ分析をしていると、意図ぜず分析自体が目的化してしまうことがあります。
データ分析ができるようになると、いろんな分析方法を試したくなってしまい、時に仮説を検証するために必要な分析以外の分析を行ってしまうこともあります。
そんな無駄な時間をかけて得られた、必要のない分析結果を提示されても実際に使うことができないのでは話になりません。
インテリジェンスとして使うことができない、分析のための分析をすることで大きなコストや時間の無駄になってしまうのです。
まとめ
データ分析は意思決定者が判断を下しやすいように、たくさんの情報の中から目的に応じた情報を拾い上げ、それを目的に合った方法で分析し、インテリジェンスを作り上げるための過程になります。
データを分析することの目的は、現状を知り同じ行動を繰り返すことで未来がどうなるかを予測することが一つ。
さらに、現状を知る過程で発見された、問題点を改善すると同時に、未来への予測をもって意思決定者がスピーディーな判断をするために行われるのです。
そしてデータ分析行う場合の注意点は、目的の明確化があります。
目的なく行うデータ分析は、もはやただの遊びといってもいいかもしれません。
巨額の予算をかけて遊んでましたではすみませんよね。
データ分析は、本来は目的のための手段なのですが、データ分析自体が目的化してしまうことも多々あります。
そして、データ分析のためのデータ分析を行ってしまうなど、本来必要のないことが行われてしまうのです。
データ分析の考え方は昔からありましたが、一般的にな広まっていませんでした。
しかし無料でデータが手に入り、しかも無料で分析ツールが使える世の中です。
データ分析的な考え方は少しづつ初めて見る必要があるでしょう。
コメント