コンテンツ情報
公開日 |
2018/07/27 |
フォーマット |
PDF |
種類 |
技術文書・技術解説 |
ページ数・視聴時間 |
4ページ |
ファイルサイズ |
708KB
|
要約
データ活用の現状が大きく変化し、企業はデータ活用環境のハイブリッド化という新たな課題に苦慮している。サイロ化したデータを活用するには、各ニーズに対応した「適材適所」のアプローチで横断的なデータ活用基盤を構築するのが理想的だが、この理想の追求には大きな課題が立ちはだかる。
なぜなら、SNS、IoTセンサーデータなど多様化・急増する全ての種類のデータ、全てのワークロードに対応できるデータベース技術は存在せず、適材適所のデータ蓄積はできたとしても全データの統合管理は難しい。また、データレイクを物理的に1カ所に集めるという手法も、規模が大きくなるにつれデメリットがメリットを上回るケースが増えてくる。だとすれば、既存資産に関してはできる限り現状を維持したまま、それらに統一的にアクセスする手段が望ましい。
こうした課題への答えが「共通SQLエンジン」を採用したデータベースだ。JSONやHadoop、Oracle DatabaseやMicrosoft SQL Serverなど、クラウドからオンプレミスまで全ての環境のデータに共通のSQLでアクセスでき、スピーディーな処理を実現する。さらにはSparkによる機械学習の効率化までサポートする新たなデータ活用の仕組みを本資料で確認してほしい。