コンテンツ情報
公開日 |
2016/11/28 |
フォーマット |
PDF |
種類 |
事例 |
ページ数・視聴時間 |
2ページ |
ファイルサイズ |
1.49MB
|
要約
みずほ銀行では、毎月約3億件ものトランザクション処理が発生する。この膨大なデータを蓄積、分析するために構築したのが「データレイク」基盤だ。これにより同行は、結婚や住宅購入、子どもの教育などのライフイベントに合わせ、商品やサービスをレコメンドしていくOne to Oneマーケティングを強化していく狙いだ。
そのためには、業務システムからの構造化データはもちろん、Web閲覧ログやSNSなどの非構造化データも含めて分類、蓄積していく巨大システムが必要だった。これにより、将来的に新サービスの企画などを行う際に「必要なデータがない」といった事態も避けることができる。
システムは、分散処理基盤となるHadoopと、ハードとソフトが最適化されたアプライアンスを活用して構築。大容量データの保管コストの最適化や、SNSなどの外部データを内部データとひもづけて分析できるファジーマッチングにより、ユーザーニーズへの迅速な対応も可能となったという。本コンテンツでは、同行の事例を基に膨大なデータから新しい価値を生み出すためのヒントを探る。