IT製品導入に関する技術資料を多数掲載 ホワイトペーパーダウンロードセンター
  • @IT
  • ITmedia エンタープライズ
  • ITmedia マーケティング
  • TechTarget
  • キーマンズネット
  • ITmedia ビジネスオンライン
  • ITmedia NEWS

アマゾン ウェブ サービス ジャパン 合同会社

技術文書・技術解説

アマゾン ウェブ サービス ジャパン 合同会社

エンジニアが解説する、次世代データ管理を AWS 環境で始める方法

コンテンツ情報
公開日 2025/09/19 フォーマット PDF 種類

技術文書・技術解説

ページ数・視聴時間 5ページ ファイルサイズ 7.87MB
要約
エンジニアが解説する、次世代データ管理を AWS 環境で始める方法
 Apache Icebergは、データの管理/分析に適した次世代のアーキテクチャとして注目されている。オープンソースのテーブルフォーマットで、HadoopやHiveに依存せず、大規模なデータレイク環境において「スキーマの進化」「ACIDトランザクション」を実現するものだ。

 これまでデータレイクを構築する際には、Hive互換形式のParquetがデファクトスタンダードとして採用されてきた。しかし、この形式では、データを上書きする際にファイル全体を作り直さなければならず、スキーマを変更した際に互換性を維持するため多大な労力を要していたという。また、パーティション数が増えるとデータベースのパフォーマンスが極端に落ちるという問題もあった。

 本資料では、これらの問題を根本から解決するApache Icebergの魅力を、実務で利用しているエンジニアの視点から解説する。併せてAmazon Web Services(AWS)環境にApache Icebergを導入する方法についても解説しているので、ぜひ参考にしてほしい。