Apache Kafka(以下、Kafka)は、イベントを使用して大規模なストリーミングデータを高速かつリアルタイムに処理できる分散型メッセージングシステムだ。フォーチュン100に名を連ねる企業の80%以上が使用するなどデータ活用の基盤として、デファクトスタンダードとなっている。
その背景には、デジタル化の急激な進展に伴い、オンプレミス/クラウド/エッジなどにデータソースが分散したことが挙げられる。こうした状況において「分散環境でも高速なデータの収集と処理が可能」「オープンソース由来なので導入のハードルが低い」といった特長のあるKafkaが、業界の標準となるのは当然といえる。その一方で、監視や管理などの継続的な運用には、専任の人材と専用のリソースが求められるため、運用が失敗に終わるケースも少なくない。
本資料では、Kafkaの運用が失敗に終わる一般的な理由を6つ挙げている。併せて、Kafkaを中核とする完全マネージド型基盤の採用など、「運用の失敗を回避するための対策」「リスクを軽減する方法」についても解説しているので、参考にしてほしい。