ビッグデータとは?分析手法や企業ごとの活用事例をピックアップして解説

2021.11.06

2022.01.21

DXのあるべき姿を考える


企業にとって、今やなくてはならない存在となっている「ビッグデータ」。耳にする機会も多い「ビッグデータ」という言葉ですが、そもそもビッグデータとはどういうものなのでしょうか。

そこで今回は、「ビッグデータとは?」という基本的なところから分析手法、活用事例など、ビッグデータにまつわる疑問について解説。企業の経営を左右するとも言えるビッグデータの存在について、一つずつご紹介していきます。

ビッグデータとはそもそもどういうものなのか

ビッグデータとはそもそもどういうものなのか

「ビッグデータとは何か?」ということを知るために、まずはその定義や意味について考えていきましょう。

ビッグデータの定義とは?

ビッグデータという言葉を聞いて、みなさんはどのようなものをイメージされるでしょうか?その単語の組み合わせから、「大きなデータ」や「膨大なデータ」などのイメージを思い浮かべる人も多いことでしょう。

ビッグデータとは、簡単に言えば「たくさんのデータの集合体」です。日々あらゆる場面でさまざまな種類・形式のデータが生成、蓄積されていきますが、そのデータのかたまりに対して“ビッグデータ”という言葉が使われています。

総務省の「平成29年版情報通信白書」で、「デジタル化の更なる進展やネットワークの高度化、またスマートフォンやセンサー等IoT関連機器の小型化・低コスト化によるIoTの進展により、スマートフォン等を通じた位置情報や行動履歴、インターネットやテレビでの視聴・消費行動等に関する情報、また小型化したセンサー等から得られる膨大なデータ、すなわちビッグデータを効率的に収集・共有できる環境が実現されつつある。」(引用:平成29年平成29年版情報通信白書 https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h29/pdf/n2100000.pdf
と記されているように、データの種類や形式だけでなくデータが生成・蓄積される範囲が広まったことも、ビッグデータという言葉が定着した背景となっています。

ビッグデータという単語が使われ始めたのは、2010年代。ビッグデータ元年から10年以上たった今、ビッグデータの存在は今や企業にとってだけでなく人々の暮らしにとってもなくてはならない存在へと成長を遂げました。

従来のデータとの違いとビッグデータを構成するデータの種類

従来のデータとの違いとビッグデータを構成するデータの種類

ビッグデータには、従来のデータとは違う特徴があります。また、ビッグデータの種類にも目を向けてみましょう。

ビッグデータに必要な「三つのV」

たくさんのデータの集合体であるビッグデータには、「三つのV」と呼ばれる特性があります。三つのVとは、『Volume(量)』・『Velocity(処理速度)』・『Variety(多様性)』のこと。この「三つのV」の意味を理解することで、今までのデータとビッグデータとの違いがわかるようになります。
 
三つのVの意味合いは、それぞれ以下の通り。
【Volume(量)】…既存のデータベースで処理できた従来のデータとは異なり、ビッグデータは数十テラバイト~数ペタバイト以上に達するような膨大な量のデータとなる。そのため、既存のデータベースでの処理は不可能。
 
【Velocity(処理速度)】…ビッグデータは、素早い取得・分析が得意。リアルタイムで更新できるなど、データの生成や取得にかかる時間が短いことが特徴。
 
【Variety(多様性)】…構造化データだけではなく、ビッグデータのデータタイプはさまざまなデータである非構造化データも含まれる。音声やテキスト、画像、動画など、多様なデータがデータベースに存在する。
 
ビッグデータは、ただ大きなデータの塊というだけでなく、三つのVのような特徴を持ち合わせており、従来のデータとは異なるものであることを認識しておかなければなりません。

ビッグデータを構成するデータの種類

ビッグデータは、さまざまなデータによって構成されています。この“扱うデータの種類の違い”も、従来のデータとの大きな違いです。
ビッグデータはどのようなデータによって構成されているのか、その種類をいくつかピックアップしてご紹介しましょう。
 
【マルチメディアデータ】
Web上の配信サイトなどにある、音声や動画などのデータ。
 
【ソーシャルメディアデータ】
ソーシャルメディア内にて、参加者が書き込むコメントやプロフィールなどのデータ。
 
【ログデータ】
Webサーバー上にて自動的に生成されるアクセスログやエラーログなどのデータ。
 
【オフィスデータ】
オフィス内のPCにて生成される、文書やメールなどのデータ。
 
【オペレーションデータ】
取引明細データやPOSデータなど、販売管理システムなどで生成されるデータ。
 
【センサーデータ】
GPSやRFID、ICカードなどによって生成される、位置や温度、乗車履歴などのデータ。
 
上記にピックアップしたデータは、構成データも非行性データも混在しています。これこそが、ビッグデータの特徴。データの形式にとらわれないのが、従来のデータとの違いです。

ビッグデータの分析手法

ビッグデータの分析手法

シンプルな分析から複雑な分析まで、ビッグデータの分析に用いる分析手法にはさまざまなものがあります。今回は、数ある分析手法の中から五種類をピックアップしてご紹介しましょう。

クロス集計

さまざまな分析手法がある中でも、最も基本的な分析手法だと言われているのがこの「クロス集計」です。クロス集計は、さまざまなデータの集まりであるビッグデータを属性ごとに仕分けすることを得意とする分析手法。年齢や性別、住所、国籍、職業、学歴など、膨大な量のデータを属性ごとに分けることができるため、ビッグデータをそのまま分析してしまうよりも取り扱いしやすくなるというメリットがあります。

マーケティングやアンケート調査、世論調査など、さまざまな場面で活用されている分析手法です。

決定木分析

「決定木分析」は、クロス集計をベースとした分析手法です。クロス集計との違いは、「もし〇〇だったら△△になるのではないか」という仮説を立てながら、クロス集計を繰り返し行っていくというところ。

要因や属性を分析できるだけでなく、細分化する上での分岐ごとの確率計算も行なうことができるため、マーケティングのみならずリスクマネジメントにも有効です。

ロジスティック回帰分析

「ロジスティック回帰分析」は、物事が発生する確率を計算するための分析手法です。ある一つの質問に対して「YES」か「NO」の二択で答えを集計していき、将来の発生確率を予測。

商品の販売予測や病気の発症予測など場面で利用されることが多い、分析手法です。

クラスター分析

「クラスター分析」はクロス集計と似ている分析手法だと捉えられているケースが多いですが、ビッグデータを仕分ける基準が異なります。クラスター分析では、異なる性質のデータ同士を類似性によってグループ分けし、クラスター(集団)を作成。作成したクラスターを基に、ビッグデータの分析を行う分析手法です。

クラスター分析を用いることで、客観的な判断基準を基にした分析が可能に。潜在顧客のニーズを引き出すためや、ポジションの確認のために活用される分析手法です。

アソシエーション分析

「アソシエーション分析は」、一目見ただけではわからないような事実を見つけるときに活用できる分析手法です。ビッグデータのように多種多様なデータが存在している場面においては、それぞれの相関関係が見つからないケースが少なくありません。

隠れた相関関係を見つけることができる分析手法であるため、ネット通販やスーパーなどの小売り事業において活用されるケースが主。新たなアプローチを行いたい場合には、アソシエーション分析を用いるといいでしょう。

ビッグデータの身近な活用例

ビッグデータは、ビジネスの世界でだけでなく人々の生活の中でもさまざまな場面で活用されています。どういった場面で活用されているのか、身近な例をいくつか挙げてご紹介しましょう。

ICチップ付き交通カード

SuicaやPASMOなど、駅の改札にかざすだけで電車の乗り降りができる、タッチ&ゴー式のICチップ付き交通カードは、ビッグデータを活用した事例の一つです。カードに埋め込まれたICチップには、電車賃の支払いだけでなく乗車・降車履歴などさまざまなデータを蓄積する能力があります。

電車の乗り降りが便利になるというだけでなく、エリアマーケティングに活用できるようなビッグデータが蓄積できるというメリットも兼ね備えているのです。また、ICチップ付き交通カードを利用して買い物を行った際のデータも、鉄道会社がビッグデータとして活用。

利用客にも鉄道会社にもメリットの大きいシステムです。

Nシステム

警察のNシステム(自動車ナンバー自動読み取り装置)は、ビッグデータを活用して運用されているシステムです。走行中の車のナンバープレートを読み取り、そのデータを蓄積することで、手配車両との照合を行って犯罪捜査のために役立てたり、渋滞予測に活用されたりと、あらゆる場面でその力を発揮。

また、近ごろは駐車場の清算システムにも活用されており、駐車券なしで退場できるような仕組みが作られるなど、車社会に関わる場面でもビッグデータが役立っています。

選挙結果の予測

選挙結果の予測にもビッグデータが活用され、今では過去とは比べ物にならないくらい精度の高い予測が可能となっています。検索サイトにてどの候補者とどの政党がどれくらい検索されているのかや、無作為の出口調査にて得られたデータを基に、選挙結果を予測。

ビッグデータのレポートチームなども組まれており、ネットニュースの配信などに役立てられています。

 
■業界別の身近なビックデータ活用事例はこちら
■金融業界


■医療業界

■製造業

■小売業

■行政・自治体

まとめ

ビッグデータという言葉を耳にする機会が多くなりましたが、実際のその言葉の本当の意味まで理解できている人は意外と少ないのかもしれません。しかし、今や人々の生活にもなくてはならない存在となっているビッグデータ。

企業の経営の左右存在にもなるので、賢く活用しながらビジネスに役立てていきたいものです。

この記事の監修者:杉森由政

この記事の監修者:杉森由政

F2018年2月Fabeee株式会社CTOに就任。就任後は、AIの分野でシェアNo.1を目指すというビジョンを掲げ、現在、広島大学との連携研究において、生体データを解析する人工知能および解析アルゴリズムの研究開発、ブロックチェーンを利用した新規サービスの開発を積極的に展開している。
>>プロフィール情報