製品資料
株式会社grasys
機械学習もパイプラインもSQLで実現、クラウドDWH「BigQuery」の実力とは?
コンテンツ情報
公開日 |
2019/08/26 |
フォーマット |
PDF |
種類 |
製品資料 |
ページ数・視聴時間 |
6ページ |
ファイルサイズ |
849KB
|
要約
自社に蓄積されている大量のデータを分析するには、その基盤となるデータウェアハウス(DWH)の性能が重要となる。加えて、機械学習やETLの実現に当たっては、専門知識を持つデータアナリスト/エンジニアの存在が不可欠だ。しかし、自社にそれらを持っていないことが原因で、効果的なデータ分析が行えていないケースは多い。
そうした課題を解決するのが、Google Cloud Platform(GCP)が提供するDWHである「BigQuery」だ。ペタバイト級のデータが保存できることに加え、低コストかつ高速な処理が可能な点が魅力。また標準SQLでクエリが実行できるため、MySQLやPostgreSQLなど、リレーショナルデータベースでSQLを扱った経験があれば学習コストなく利用できる。
さらに、標準SQLクエリを使用した機械学習モデルの作成や実行が可能で、データ前処理やモデル構築といったアナリストが行う予測までの一般的な工程を短縮できるほか、ストリーミングのパイプラインを実現する場合もJavaやPythonによる実装が必要ないという。本コンテンツでは、こうしたBigQueryの特長について解説する。