技術文書・技術解説
Talend株式会社
低品質データがコスト急増を招く? ビッグデータ時代のデータ管理の在り方とは
コンテンツ情報
公開日 |
2019/09/02 |
フォーマット |
PDF |
種類 |
技術文書・技術解説 |
ページ数・視聴時間 |
13ページ |
ファイルサイズ |
4.21MB
|
要約
これまでデータ品質の管理は、データエンジニアが個人で取り組むタスクだと思われがちだった。しかし、低品質なデータが原因で発生するコストが急速に増加する中、そうした考え方は通用しなくなってきており、現在では、ビジネスのさまざまな方面の専門家を巻き込んで全社的に取り組むべき戦略的な優先事項となりつつある。
また従来の管理モデルでは、データにアクセスして分析できるのは少数の経験豊富なデータ専門家だけだったが、これではビッグデータ時代のスケーラビリティに対応することも難しい。そこで求められているのが、チームスポーツのように連携してデータ品質の管理を行う新たなアプローチだ。
多様で膨大な生データを専門家でなくとも利用可能なスマートデータに変換し、知識豊富なビジネスユーザーがコンテンツプロバイダーやキュレーターの役割を担えるようにする。さらにガバナンスも確立し、チームとして協調的で制御されたデータ管理モデルを実現する。本資料では、この新たなデータ活用手法と、そのためのチームビルディングのノウハウを解説する。