BE PLANNINGの記事

ビッグデータを高速分析!話題の「Google BigQuery」を導入事例を踏まえてご紹介!

  • このエントリーをはてなブックマークに追加
  • Pocket
  • LINEで送る

ビジネスにおいてデータ活用は無くてはならないものです。「膨大なデータ(ビッグデータ)は宝の山」と言われるように、適切に分析を行い活用すれば新たな価値の創造や最大化することが出来る何物にも代えがたいビッグデータ。
今回はそんなビッグデータを分析できる「Google BigQuery」を紹介します。一般的なツールとは異なった特徴やその導入事例と紹介していくので、ぜひ「ビッグデータ活用」を実施するための参考にしてください。

Google BigQueryとは

Googleが提供しているビッグデータプロダクトの一つです。
クラウド型のデータウェアハウスという様々なデータが保管されているシステムからビッグデータを高速で解析する事が出来るサービスです。

本来Google社内で使用されていた大規模なクエリを実行するシステムを、外部ユーザー向けに使えるようにしたサービスがこの「Google BigQuery」なのです。

一体何が出来るのか

先ほども記載した通り「ビッグデータを高速で分析」することが出来ます。しかし、それだけではありません。より有益且つスピーディーに情報を分析出来るのです。
要点を押さえ一つずつ説明していきます。

ビッグデータの高速処理

通常の分析サービスであればTB(テラバイト)規模のデータになるとクエリを行っても反応が遅くなってしまうことがあります。
しかしGoogle BigQueryはTB(テラバイト)の上、PT(ペタバイト)規模のデータも高速分析することが可能であり、約3GB(ギガバイト)のデータ処理に要した時間は1.2秒程と驚きの速さで分析ができるのです。

もともとビッグデータでの検索を目的として設計されているので、そのシステムの構造もカラム型データストアという列ごとにまとめてデータの保存ができる構造と、ツリーアーキテクチャというツリー上の分散並列処理という「速さ」に特化した作りになっています。

<カラム型データストア>
一般的な通常行単位にデータを保存するのではなく、列ごとにまとめてデータの保存を行うのがカラム型データストアの特徴です。この列ごとにまとめて保存を行うことにより、データ通信回路の最小化と高い圧縮率を可能にし、高速データ処理を実現しています。

<ツリーアーキテクチャ>
クエリを受け取るルートサーバーから、処理を実行する多数のリーフサーバーに対して、クエリがツリー構造で広がっていきます。このことにより、大規模分散処理を実現し、高速なデータ処理を可能にしています。

このようなシステム構造の為、本来であれば処理に膨大な時間がかかるビッグデータさえもあっという間に分析ができてしまうのです。

リアルタイム分析

流動的に発生するデータをリアルタイムで分析することが可能です。

例えば、ECサイトでは訪問ユーザーの各種データを取得し、商品の在庫数やプロモーション効果等の分析をすることでサイト設計の最適化を行ったり、メディアではユーザーの行動履歴を分析することで最適な関連記事をリアルタイムにレコメンドするなど、顧客体験を向上させることが出来ます。

これはストリーム分析とも呼ばれ、必要なデータをリアルタイムに取得し処理する分析方法ですが、この分析は小さなサイズのデータを扱うのが一般的でした。
しかしGoogle BigQueryは大量データの高速処理が可能な為、鮮度の高いデータをリアルタイムで分析でき、意思決定のスピードと正確性を格段に高めることを可能にしたのです。
また、Google BigQueryはリアルタイムの情報を元に機械学習を行うことにより、より精度の高い予測分析を行うことも可能にしました。

分析サービスとの連携

Google BigQueryは同じGoogle社のサービス(Google アナリティクスやGoogleスプレッドシートなど)との連携もスムーズで簡単にデータを取り込む事が可能です。もちろんGoogle社以外のSalesforceやTableauとの連携も可能なので、直感的にデータ活用を行うことが出来ます。
また、Google BigQuery MLという機能を利用することで、基礎的なSQLの知識さえあれば高品質なカスタム機械学習モデルを構築する事ができるのです。

データベースの専門知識が無くても扱えるため、非エンジニア人材でも少しの知識があれば活用可能であり、なおかつ複数のサービスと連携できる事が、多くの企業が導入する理由の一つにもなっています。

混同されやすいGoogle Bigtableとの違い

「Google BigQuery」の導入を考えた時に「Google Bigtable」とどちらを活用すれば良いのか迷ってしまう担当者も多いと思います。

Google Bigtableとは大量なデータの読み取りや書き取りを行うために最適化されたNoSQLデータベースです。

大容量のデータでも低レイテンシ(通信速度)、高スループット(処理速度)を維持するものの、NoSQLデータベースであるため、クエリの実行に制限が掛かります。

そのため、Google Bigtableはフルサイズデータを高速で読み取り・書き取りを行うデータ処理を行う際にその能力を発揮します。

Google BigQueryはデータの取り込み、格納、分析、可視化を簡素化する目的として設計されており、SQLによる比較的複雑なクエリがかけられることが大きな違いです。ビッグデータを扱いながら大規模なストレージや分析、オンライン分析処理(OLAP)、さらに機械学習モデルを作成するためのクエリの実行もできるのはGoogle BigQueryならではの魅力です。

Google Bigtableはフルサイズデータの提供や処理において、Google BigQueryは分析・クエリ実行において、それぞれの強みを持っていると考えてください。

導入事例

そんな「Google BigQuery」は現在既に多くの企業で導入されており、様々な所で成果をあげています。そんな事例をいくつか紹介していきます。

イオンリテール株式会社

大手総合スーパー「イオン」を運営するイオンリテール株式会社では、近年より一層データを活用した経営に力を入れています。総店舗数396店舗、年間数億人という大量の顧客購買データを分析活用するためのアプリ、データ分析プラットフォームをGoogle Cloud上に構築していました。

<課題>
開発されたアプリは運用開始から数か月でユーザー数が20万、30万人と急激に増加していきました。しかし当初開発時に活用していたASP(アプリケーション サービスプロバイダ)がこの会員数を捌ききれなくなりました。
結果1 つのデータ分析に30~40 秒も掛かってしまい、複数のワークフローを実行すると処理に膨大な時間が掛かり、完了は次の日の朝、、なんて可能性も出てきてしまったようです。

<導入して>
Google BigQuery に移行した後、データ分析はわずか 5 秒程度で終わるようになりました。そしてトライ&エラーがしやすくなったことで、さまざまな角度でいろいろな分析をクイックに行えるようになったそうです。
複数のワークフローをパラレルで回してもわずか 20〜30 分程度で処理が完了。現在は集計の対象ユーザー数が 400 万人以上、レコードも 2,000 万にまで増加しており、さらに当時の数倍となる 20〜30 のワークフローを回しているのですが、全てを合わせても 1 時間半くらいで終わっています。

これは、Google BigQueryを導入し強みの一つである「ビッグデータの高速処理」をうまく活かして、膨大なデータ処理・分析の課題を解決した成功事例の一つです。

▼参考・引用:イオンリテール_年間のべ数億人のお客さまが生み出す膨大な購買データを Google BigQuery によって高速に分析・活用
https://cloud.google.com/blog/ja/topics/customers/aeonretail-analyzing-purchase-data-at-high-speed-with-Google BigQuery

株式会社NTTドコモ

国内の携帯電話契約件数 8,300 万件(2021 年9 月末時点)を超える通信事業を中心にサービス展開を行う株式会社NTTドコモ。支払いにも使えるdポイントやクーポン情報や内外のニュース、スポーツ・エンタメ等の情報サービス『マイマガジン』を運営しています

<課題>
このサービスのシステムは仮想サーバーをベースとしたレガシーな構成で、記事の中から好みの記事を容易に見つけることができる機能や、気になった記事を保存できるお気に入り機能、さらにレコメンド エンジン等の機能が密結合するモノリシックで巨大なシステムになっていました。
そのため、取得する情報の追加や UI の変更などを行う際、都度広範囲な開発・テストが必要で、さらに利用者のログ分析にも多くの時間が掛かってしまうことで、多様なビジネス変化や利用者のニーズに迅速かつ柔軟に対応することが難しくなっていたそうです。

<導入して>
Google BigQueryの活用によりこれまで時間が掛かっていたログ分析をリアルタイムに行う事ができるようになりました。これによりキャンペーン施策や A/B テストの結果が迅速に得られるようになり、高速に PDCA を回すことが可能になったのです。
Google BigQueryは直感的な操作が可能で、データを可視化することで、データに基づく施策を容易に策定することができるようになりました。最適なデータ活用が出来ていることもメリットの一つだそうです。
これは、Google BigQueryを導入し強みの一つである「リアルタイム分析」をうまく活かして、ユーザーの利用状況をリアルタイムで把握・分析することでメディアとしてお客様に提供できる価値を向上させることが出来た成功例の一つです。

▼参考・引用:NTTドコモ_マネージド サービスとマイクロサービス化で価値創出や改善活動に集中できる環境を実現
https://cloud.google.com/blog/ja/topics/customers/ntt-docomo-creating-value-through-managed-services-and-microservices

Google BigQuery導入のステップ【料金】

「Google BigQuery」のメリットの一つとして低コストをあげる人も多くいます。「Google BigQuery」の料金設定の特徴は、クエリごとの料金設定や、データ保存料に対する費用設定を行うといった独特なものです。

・分析料金

オペレーション料金詳細
ストリーミング挿入$0.012 (約1.5円) / 200 MB挿入に成功した行が課金対象。最小サイズは 1 KB で、各行が計算される。
クエリ(オンデマンド)$6.00 (約765.84円) / TB毎月 1 TB まで無料。
クエリ(秒単位の Flex Slots)$4.80 (約612.67円) / 100 slots1カ月当たり$3504その後はいつでも Flex Slots をキャンセル可能。
クエリ(月定額)$2,400 (約306,336円) / 100 slots追加は100スロット単位で購入可能。
クエリ(年定額)$2,040 (約260,385.60円) / 100 slots追加は100スロット単位で購入可能。
※2022年4月末現在の記載価格(日本円換算2022年4月27日 4:38 UTC)
引用:https://cloud.google.com/Google BigQuery/pricing/?hl=ja#storage

ストレージ料金

オペレーション料金詳細
アクティブストレージ$0.023 (約2.94円) / GB毎月10GBまで無料。
長期保存$0.016 (約2.04円) / GB毎月10 GBまで無料。
Google BigQuery Storage API$1.10 (約140.40円) / TBGoogle BigQuery Storage APIは無料枠に含まれません。※米国(マルチリージョン)の場合
※2022年4月末現在の記載価格(日本円換算2022年4月27日 4:38 UTC)
引用:https://cloud.google.com/Google BigQuery/pricing/?hl=ja#storage

通常のデータベースの課金方法は1テラバイトのデータに対してサービスを利用した時間分の課金が一般的ですが、Google BigQueryの場合はデータ量に対しての課金システムとなっています。
さらに、上記で記載した操作以外で料金が発生しない為、データのインポートやエクスポートなど(下記オペレーション)は保存やストレージ使用等が発生しない場合は基本的に無料で行うことが出来ます

  • データの読み込み
  • データのコピー
  • データのエクスポート
  • データセットの削除
  • テーブル、ビュー、パーティション、関数の削除
  • メタデータ オペレーション
  • 疑似列の読み取り
  • メタテーブルの読み取り
  • ユーザー定義関数(UDF)

クエリ(オンデマンド)やストレージも毎月の無料枠がある為、Google BigQueryはとても低価格でビッグデータ分析がはじめられるサービスです。

まとめ

今回ご紹介した「Google Google BigQuery」は扱いやすいうえに高性能なビッグデータ分析サービスです。コストも抑えられるため、あまり馴染みのない非エンジニアの担当者もハードル低く導入を検討することが出来ます。
また、2020年の夏にAmazon社の「AWS」、Microsoft社の「Azure」などの外部ストレージにあるデータにアクセスしてBigQueryによる分析を実行できるマルチクラウドデータ分析の『Google BigQuery Omni』を公開しました。
さらに取り扱い出来るデータが増えたことによって、その利便性も更に向上しています。

既にGoogleアカウントをお持ちの担当者も多いと思います。
そこからスグにアクセスでき、少しのコストと少しの知識で誰でもスグにビッグデータの活用を行えるのがGoogle BigQueryの大きな魅力の一つです。
広告や販促での活用だけでなく、コストダウンや業務効率化にも大きな貢献をしてくれるサービスなのでぜひ、Google Google BigQueryの導入を検討してみてください。

ソーウェルバーではユーザーインサイト分析ツール「VALIS-Cockpit」という分析ツールをご用意しています。

「Google BigQuery」のようにビッグデータがあり、なおかつ分析できる状態が整っていても、明確な目的を持って分析を行い次のアクションへの正しい意思決定を行わなければ良い結果には繋がりません。
「VALIS-Cockpit」ではユーザーの日常的なWeb行動を人の恣意が入ることなくがAI(Valis-Engine※)が分析し、顧客の特徴/興味や貴社サイトの「外で」ユーザーが「どこで/何を」しているか可視化します。
特徴抽出や比較分析を行うユーザーインサイト分析することに特化したツールで新たなデジタルマーケティングの一手を一緒に探すお手伝いを致します。


  • このエントリーをはてなブックマークに追加
  • Pocket
  • LINEで送る