今話題のデータサイエンスとは!?明日から雑談で話せるレベルでわかりやすく説明!

2022年8月25日
今話題のデータサイエンスとは!?明日から雑談で話せるレベルでわかりやすく説明!

朝。慌ただしい通勤時間。

混みあう電車の中でいつも通りスマートフォンで動画配信サービスを利用していると、ふと目に入った動画広告。


「そういえば、家にもう切らしていたっけ…」

と、通販サイトにワンタップでページを切り替え、お目当ての商品を購入。すると、表示される関連商品。

「あぁ、忘れてた。これも買っておいてと言われていたな…」

ちょうどいいところに!といった形でおススメされた関連商品も購入し満足していつもの動画視聴に戻っていく…。

皆さんも当たり前のように経験があるのではないでしょうか?

「こうした一連の共通する経験の裏側には、どうやら一人一人の検索結果や、購入履歴が関係しているらしい…いわゆるビッグデータというやつだ。」

最初はなじみのなかったビッグデータという言葉も、ニュースなどで一般的になり、上記のように、おススメ表示の裏側の仕組みをざっくりと理解している方も増えてきました。

では

「ビッグデータを読み解いていく為にどんな知識が必要なのか…?」

「その知識を持った人はどんな人なのか…」

「ビッグデータに関わる知識や技術が発展すると私たちの生活はどう変わっていくのか…?」

そう聞かれると、意外とわかってなかったな。という方も多いのではないでしょうか。

上記の疑問に関わってくる学問として、データサイエンスという学問がありますが

あらゆる領域で使われるようになり、世の中で求められている一方でまだまだ一般的ではありません。

本記事では

何となくわかるけれど、なんとなくよくわからない。

そんなデータサイエンスという学問を、すこしでも身近に感じられるようにわかりやすく解説していきたいと思います。

◆データサイエンスとは何か

データサイエンスとは、一言でいうとデータから価値を引き出す学問と言えます。

具体的には、統計的手法、科学的手法、人工知能(AI)など複数の分野を組み合わせてデータを分析し、有益な知見を見出すことを指します。

データから価値を引き出すという感覚が少々ピンとこない方もいるかもしれません。

つまり、データそのものに価値はないということです。

例えば「東京で、商品Aを買った人が数日以内に、商品Bを買った」というデータがあったとします。しかし、このデータだけでは、そういう事実があったという意味しかありません。

ところが関係するデータを膨大に集めていくと「東京で商品Aを買った、40歳~44歳の、6歳の男の子を子供に持つ女性が、10日以内に商品Aに関するより詳細な説明をしている記事を見て、商品Bを購入する確率が60%を超える」ということが分かってきたとします。

そうすると、40代の女性を対象にサービスを提供している会社からすると非常に価値のある情報になるのは何となくイメージが湧くかと思います。

こうして普段利用している通販サイトのおススメ欄に関連商品が表示されたり、視聴している動画サイトにおススメ動画が表示されることに繋がっていくのですが

このように、一つ一つではあまり意味を成さないデータを膨大に集め、集まった膨大なデータの中に意味を見出し、価値をつくることがデータサイエンスというわけです。

◆注目される背景

ただのデータの集まりが、価値のある情報に変わっていくのは確かにロマンがありますが、昨今、これほどまでにデータサイエンスが注目されるのにはどのような理由があるのでしょうか。

データサイエンスという言葉自体が注目されたのは2010年代以降とのことですが、その発端は50年以上前にさかのぼります。当時から統計解析を業務として活かす分野は一定数存在し、リサーチャーと呼ばれておりました。

その後、2010年以降に、インターネット上のデータ転送量が大幅に増加したことでビッグデータという用語が提唱されるようになりました。

このような流れから、元々存在していたデータを活用するという手法が、近年の情報通信技術の発展に伴い、大規模なデータを扱うように変化していったことで徐々に注目を集めていきました。

具体的にどれくらいのデータを扱うようになったかというと、世界に存在するデータのおよそ90%が過去2年間で作成されたとの推測があるほどです。

しかし、これらのデータは多くの場合、単にデータベースに保管されてあるだけで手つかずのままとなっており、膨大に増え続けるデータに対して、データを扱うことのできる人物や、データを活用する専門知識が不足したことも相まってデータサイエンスという領域に需要が生まれ、同時に注目を集めていきました。

ビジネスの領域でも同様に、テクノロジーの発展に伴いペーパーレス化が進み、安価で利便性の高いITツールが導入されたことで企業活動のほぼすべてがデータベースに格納される状態へと変化していきました。

その膨大なデータの中には、組織や事業に革新的なメリットをもたらす可能性を持っていますが、その可能性を具体化できる人材が大幅に不足しているのが今の現状です。

さながら、宝石の原石はあるけれど、宝石へと加工する技術がないといった状態ですね。

データを活用することで何ができるのか

私たちが普段生活する日常の中に、そして負担働く会社の中に、世の中に革新的な変化をもたらす可能性が眠っていると考えると非常にワクワクする話ですが、ところでデータサイエンスによって、具体的にどのようなメリットを生むことが出来るのでしょうか。

今回は簡単に2つ紹介いたします。

①データによる意思決定

今年は雨顔かったな…と思って年間の天気予報を見てみると、意外にも例年と同じくらいの雨の日数だった。といった経験をお持ちの方もいるのではないでしょうか。

それくらい人間の感覚や勘は曖昧なものです。昨今の企業経営や、事業構想においては勘や経験といった領域はある程度は重視されるものの、客観的なデータや根拠に基づいて意思決定を行う重要性は増してきています。

データや根拠に基づいて意思決定がされるということは、確かに存在するものに対して焦点が当たりやすくなるということです。

例えば「夏は冷たいものが好まれる」といった一般論がありますが

その中であなたは「夏だからこそ熱いものを食べたい」と思っていたとします。

加えて、あなたと同じように考える人が日本全国である一定数存在したとしましょう。

データによる意思決定が成されない場合「夏は冷たいものが好まれる」という一般論に対してそうではない!ということを示すことが難しい場合が多くなってしまいますが、確かなデータによって夏だから熱いものが食べたいという声に焦点が当たることで、あなたにピッタリな商品やサービスが世の中に生まれる可能性が高まります。

それ以外にも、明確な根拠がない中で「おそらく大体の人がそう思っているだろう」という曖昧な一般論が世の中には沢山ありますが、その陰で確かに存在する意見や要望に陽が当たらない方もいるかと思われます。

そのような声がデータとして集まることで、今までになかった価値を世の中に生んでいくことになります。

②予測

歴史は繰り返すという言葉がありますが、人間は集団で行動しそして環境から大きな影響を受ける為、時代によって多少の変化はあるものの、ある程度似通ったパターンを持つ生き物です。

どのように考え、どのように選択し、どのように行動することで、どのような結果になったのか。

膨大なデータを読み解くと、人間の行動や世の中の動きに規則性を見つけることが出来ます。そうして、一つ一つの思考や行動に対して得られるメリットや起こり得るリスクを予測することが出来るようになります。

例えば、保険の世界では、その人の日々の行動データや健康診断の結果から、将来的にどのような病気になりやすいのかを予測し、その結果を保険料に反映するサービスがすでに存在しています。

今後、あらゆる活動のデータが集約され、分析されることで、叶えたい未来の可能性を最大化することや、どうしても避けたい未来のリスクを最小化することができるようになると考えると非常に大きなメリットがあるのではないでしょうか。

◆データサイエンスに関わる人たち

膨大なデータがあつまり、その集まったデータを活用した先にワクワクする未来が待っている。そんなイメージを持つことが出来たと思います。

それでは、そんなデータサイエンスに関わる人たちはどのような人なのでしょうか。

データサイエンスの領域で、データから有益な価値を見出す人をデータサイエンティストと呼びますが、データサイエンティストとは

データサイエンス力、データエンジニアリング力をベースにデータから価値を創出し、ビジネス課題に答えをだすプロフェッショナル

と定義される人になります。要は、宝石の原石を、宝石にする技術を持つ人のことですね。

データサイエンティストと聞くと、複雑な計算や統計手法を用いてPCを動かしながらデータを分析する人というイメージを持つ方も多く、計算の速度や精度は今後人工知能(AI)に代替されていってしまうのではないか。という声もありますが、根本となるデータを使って社会をどのように良くしていくのか、どこに価値を見出していくのかという点は人間にしかできない仕事となります。

つまり、ただのデータの解析を行う人ではなく、データの先の現場や社会を見据え、世の中を率先して動かしていく為の支援をする人とも言い換えることが出来るでしょう。

◆データサイエンティストの仕事内容

今後のデータ社会で、非常に重要かつ需要のあるデータサイエンティストですが、具体的にはどのようなことをしているのでしょうか。

実際のデータサイエンティストの業務は多岐に渡りますが、まとめると一般的に下記の4つのフェーズに分かれています。

①分析企画

どのようなデータを分析し、どのような結果を導きたいのか全体の設計を行います。

やみくもにデータを分析しても望む結果が得られません。また複数人でチームで分析にあたることも多く、プロジェクトとしての設計を行うのもこのフェーズとなります。

②アプローチ設計とデータ収集

実際に分析の企画が立ち上がったら、どのように分析を進めていくのかを具体的に設計していきます。分析をするにあたっても分析結果が望ましい形になっていなかったり、十分なデータが存在していなかったりする場合もありますので、事前の準備が重要になります。

③データ解析

実際にデータを分析するフェーズです。分析したデータを基にどのような結果が導き出されるのか評価をするところまでが重要な仕事内容となります。

④業務への組み込み

データを分析することで得られた結果を、業務やサービスに組み込むフェーズです。結果がわかっても実際の業務やサービスに反映できなければ価値を生むことはできない為、非常に重要なフェーズとなります。

簡単に説明すると上記のようになりますが、データサイエンティストに関してはこちらでさらに詳しく解説しておりますので気になる方は確認してみてください。

◆まとめ

いかがでしたでしょうか?

データサイエンスという領域が、非常にロマンが詰まった領域であることが何となくでも理解いただけたのではないでしょうか。

本記事の内容をまとめると

  • 膨大なデータを分析、評価して意味や価値を見出すことをデータサイエンスという。
  • 情報通信技術の発展に伴い、膨大なデータを収集、保管することが出来るようになったことで、データから価値を見出し、社会の更なる発展に貢献するデータサイエンスという領域に注目が集まっていった
  • データサイエンスによって、事実に基づいた確実性の高い意思決定を行うことが出来るようになる。また過去の傾向から、望ましい未来の可能性を引上げ、避けたい未来のリスクを引き下げることが出来る
  • そういったデータサイエンスという領域に関わる人をデータサイエンティストと呼ぶ


となります。データサイエンスとはまだまだ可能性が広がり続けている領域であり、その領域に関わる仕事もどんどん増えてきております。本記事を読み、興味関心が湧いた方は、よりデータサイエンスの世界を調べてみるとよいでしょう。

それではここまでお読みいただきありがとうございました。

次回の記事でまたお会いしましょう!