いまさら聞けないビッグデータの基礎知識・活用方法を徹底解説!

いまさら聞けないビッグデータの基礎知識・活用方法を徹底解説!

記事更新日: 2021/04/02

執筆: 編集部

「ビッグデータの活用」なんていう言葉を耳にする機会が増えましたが、そもそも「ビッグデータ」とは何でしょうか?

なんとなく理解しているという方もおられますが、この記事ではあらためビックデータという言葉の意味、ビックデータの活用で可能になる事柄などを具体的に紹介します。

あらためてビッグデータとは?

ビックデータとは、ネットの普及やコンピューターの処理速度の向上、センサーやスマホ、ウェラブル端末の一般化により生成されるようになった大量のデータのことを指します。

ネットの普及と処理能力の向上、ネットにつながった機器の普及により位置情報、行動履歴、閲覧履歴などたくさんの情報を収集できるようになりました。

ビッグデータの持つ3つの特徴

ビッグデータには「3つのV」つまり3つの特徴があると説明されています。

1. Volume(量)

2. Velocty(速度)

3. Variety(多様性)

 

1. Volume(量)

データの総量が大きいという特徴です。公共団体や企業は、ネットの普及と処理能力進歩によりWebページ・SNS・センサー・M2M通信など様々な媒体から大量のデータを収集できるようになりました。

注;M2M通信とは「Machine to Machine通信」の略で、人の仲介を必要とせずネットワークにより機器同士が情報交換できるものを指します。

2. Velocty(速度)

速度はデータが生成されるスピードです。データを収集できる機会や媒体が増えていく中で、データが生成されるスピードも以前では考えられなかったものになっています。

3. Variety(多様性)

データを生成し蓄積できる機会や媒体が増えているので、扱われるデータの種類も増えています。

これまでは販売実績、在庫管理などに代表される数値化された(構造化された)データが一般的でした。

それらに加えてTwitterのつぶやきに代表されるテキストデータ、センサーや防犯カメラから得られる位置情報や行動データ、Webサイト内でのクリックストリーム、音声、動画などの非構造データが増えてきています。

調査によるとビッグデータの8割がこの非構造データに該当するといわれています。

生成されるスピードが早く大量でかつ種類が多いという特徴を持つのがビックデータです。

ビックデータの構成するデータの種類

ビックデータの意味、特徴を説明しましたが、そうしたビークデータはどこからデータを収集しているのでしょうか?

次にビックデータを構成するデータの代表的な例を8種類紹介します。

1. ウェブサイトサイト

ECサイトやブログなどから収集できる購入履歴、お気に入り商品、ブログエントリーなどの情報。

2. マルチメディアデータ

ウェブ配信される音楽・動画などのデータ。

サイト会員のクリックストリーム、視聴履歴などもビックデータの一部として蓄積されていきます。

3. ソーシャルメディアデータ

Twitterやinstagramなどのソーシャルメディアの利用者が書き込んだプロフィールやコメントです。

4. センサーデータ

GPS、ICカード、RFID(商品タグを電波により非接触により複数一気にスキャンできるシステム)などにより検知された位置情報、乗降履歴、加速情報や温度などのデータ。

5. オペレーションデータ

販売管理システムなどにより生成されるデータ。

例としてはPOSデータや取引明細データが含まれます。

 

6. カスタマーデータ

CRMシステム(顧客管理システム)で管理されている会員・顧客のデータ。

購入履歴、DMの開封率、クリック率などがそれに含まれます。

 

7. オフィスデータ

オフィスのパソコンなどで作成されるメール、文書、社内コミュニケーションツールなどのデータです。

8. ログデータ

サーバーに自動的に生成されるアクセスログ、エラーログなどのデータが含まれます。

ビッグデータとして蓄積されるデータの種類

ビッグデータは様々な種類の媒体を通じて収集されます。そうして集められたデータは大きく分けると次の4つの種類に分けることができます。

1. 国や地方公共団体が提供するオープンデータ

政府や地方公共団体が保有する公共情報のことです。

2. ノウハウをデジタル化・構造化したデータ

こうしたデータは「知のデジタル化」と呼ばれています。

様々な分野、産業、身の回りに存在するこれまでデータ化されず、一定の個人間や企業間のみで継承されてきたノウハウ、つまり知をデータ化したものです。

例えば、農業での作物の育て方、インフラの管理方法などがそれに該当します。

3. M2Mデータ

Iot機器(ネットワークに接続された機器)から収集されるデータのことです。

このデータは、先ほど紹介した「知のデジタル化」と合わせて、企業が情報の収集・利用に活用することが多いので産業データとして位置づけられています。

4. パーソナルデータ

個人の属性情報のことです。

会員登録、行動履歴、乗降履歴、購買履歴、ウェラブル機器(スマートウォッチがその例)から収集された健康情報などが含まれます。

本人を特定できる「個人情報」に加えて、個人との関係性を見出せる広範囲の情報がパーソナルデータです。

ビッグデータの活用方法

様々な種類の媒体を通じて、早い速度で多種多様なデータが大量に集められたのものがビッグデータですが、その膨大なデータは分析し活用されて意味を持つようになります。

ビッグデータを分析することで、異変の察知、近未来に起こる出来事の予測などが可能です。

それらの情報を業務改善・新しい産業の創出・利用者個人のニーズに応じた商品やサービスの提供などに活かすことができます。

次に、こうしたビッグデータがどんな分野でどのように活用されるのか紹介します。

販売業・小売業

販売業や小売業では顧客のデータから、利用者の属性を分類したリ、行動履歴や購入履歴を分析することで、それぞれの顧客に最適な商品やサービスを最適なタイミングでおすすめし再購入を促すといった活用ができます。

ECサイトでも閲覧履歴や購入履歴、DMの開封率やその中に記載されているURLのクリック率などのデータを分析し、サイト利用者の特性や利用時間帯に合わせたネット広告やメールを配信するなどの形で活用できます。

優良顧客の育成や見込み客から顧客に育成するという活用方法だけでなく、顧客の離反分析にも活用できます。退会あるいは解約した顧客の特性を分析し、どんな傾向を持つ顧客が離反する可能性があるのか予測できます。

交通

GPSやIot機器を搭載した車両を利用し、相応距離・走行時間・速度・位置情報などの運行情報をリアルタイムに収集分析できます。それらを車両管理や安全運転支援システムの開発、燃費の改善などに活用できます。

農業

ビニールハウス内に設置したM2M機器により、ハウス内の温度・湿度・日照時間・二酸化炭素量などの作物育成環境のデータを収集できます。

収集されたデータは作物の品質管理や生産業務の改善に活用できます。

金融

金融業界でもビッグデータとAIによる分析が進められています。

ビッグデータの分析により顧客の分類(セグメント化)を行なうことができ、営業員が顧客をより深く知っている状態を提供できます。これは顧客満足度の向上につながります。

さらにSNSからの情報を含めたビッグデータの分析により金融市場の今後の動きを予測するということも行なわれています。

セキュリティ

ビックデータを分析し不審者が持つ特徴的な行動を割り出せます。

店内に不審者がいると防犯カメラがその人物の顔を検証し、自動的にデータベースに登録し、不審者を検索するというサービスもあります。

従業員による不正の予防

企業にとって従業員の不正防止は課題のひとつです。

従業員のメールや電話、社内コミュニケーションツールのつぶやきなどの非構造データを自動言語処理や機械学習で分析し、違法な取引や贈収賄など不正の兆候となるものを検知するという取り組みもなされています。

さらに従業員に関するそうしたデータを離職しそうな従業員の兆候を知るために利用し離職率低下に活用する方法もあります。

災害データ

2,011年の東日本大震災では、当時の携帯電話やカーナビの位置情報、Twitterのテキストデータなどの膨大な量のデータが「震災ビッグデータ」として残されました。

これらを活用し、地震直後の避難行動、被災地での復興の遅れの原因、首都圏で帰宅困難者が生まれた要因などが明らかになりました。

ビッグデータの活用事例

ビッグデータがどんな分野でどのように活用されているのか解説しました。

実際の企業はビッグデータをどのように活用しているのか3つの事例を紹介します。

ドコモヘルスケア「ムーヴバンド3」

ウェラブル端末からユーザーの身長・体重・移動距離・睡眠時間・消費カロリーなどのデータを収集できます。

集められたデータは健康状態の見える化サービス、データ分析、医療機関などへの情報提供を行なうことができ、生活習慣病改善サービスを提供しています。

これまでに集められた健康・食事・運動に関するビッグデータと個人ユーザーのデータを合わせることでヘルスケアの分野でビックデータを活用している事例です。

ソニー損保「やさしい運転キャッシュバック型」

ソニー損保のこの保険は「テレマティクス保険」と呼ばれるものです。

テレマティクス保険とは、自動車に取り付けられた機器が走行距離、急ブレーキや急発進などの運転データを分析し、その計測結果に応じて保険料が決まるというものです。

ソニー損保がこの保険サービスを2014年に実施しましたが、それ以降日本でもいくつもの保険会社がテレマティクス保険を扱うようになりました。

これも運転データを分析しそれに付加価値をつけて利用者に提供するという活用法です。

Netflix

Netflixはアプリを通じて世界中から膨大なユーザーデータを集めています。

どこで、どんなデバイスで、どんな作品を、何時に、何時間くらい見ているのか、どんなシーンや登場人物を早送りしているのか、どの俳優が人気があるのかなどのユーザーの細かな視聴パターンを把握しています。

これによりNetflixは、プロデューサーの意見や過去の常識に縛られず、ビックデータの分析から導き出した答えにより自社作品の監督や俳優を選ぶようにしました。

さらにユーザーの視聴行動を細かくトラッキングして収集したユーザーデータを複数のアルゴリズムによって処理し、それぞれのユーザーに適応した作品やジャンル、それらの並び順までを決定して、アプリのトップページに表示しています。

さらに作品のアートワーク画像(イメージ画像)も各ユーザーの属性に合わせてカスタマイズしています。

Netflixはユーザーデータをできるだけたくさん集め、それをマーケテイングに活用している最も分かりやすい事例です。

中小企業でもビッグデータは活用できる?

有名企業がビッグデータをビジネスにどのように活用しているのかその事例を紹介しました。

中小の企業にも製品・従業員・顧客などのデータがあるわけですから、それらをもちろん活用することができます。

販売管理、人材管理、顧客管理、財務会計管理など中小企業の中でも管理しなければならないデータがあります。

「ERPシステム」はそうした企業の資産ともいえる様々なデータを一元管理できるシステムです。こうしたシステムを導入すれば大企業でなくても自分たちの持っている様々なデータを有効活用できるでしょう。

 

まとめ

ビッグデータとは、ネット、スマホ、SNS、Iot機器など様々な媒体を通じてすぐに生成される大量で多種多様なデータのことでした。

ビックデータの分析により、異変の感知、将来の予測、個人のニーズを分析しそれに適応したサービスや商品の提供が可能になります。

国や企業によって集められたビッグデータは今後いかに活用されるか注目できるでしょう。テレマティクス保険やNetflixのようなビッグデータの収集と分析に基づいた新たな商品やサービスが提供されるかもしれません。

画像出典元:pixabay

最新の記事

ページトップへ