The Doppler Quarterly (日本語) 夏 2017 - Page 14

テクニカルガイド ハウツーガイド: エンタープライズ データレイクを設計する際に 留意すべきアーキテクチャーのパターン Sudi Bhattacharya、 Neal Matthews この記事では、エンタープライズデー タレイクのビジネス価値、ストレージ、 セキュリティ、ガバナンスの設計、およ び有益な情報を引き出すための中核 的な資産としてビッグデータを活用す る方法に焦点を当てます。 たく新しい可能性を切り開きます。 スピード 今日の動的なビジネス環境では、データ消費に関する新た な要件やユースケースが急速に増加しており、データストアや データスキーマに必要な変更を反映した要件のドキュメントが 作成されるまでに、ユーザーが別の、また場合によっては相反 するスキーマの変更を進めてしまうケースが少なくありません。 一方、データレイクは、全体的な指針として未知のユースケース ビジネスケース への対応を中心に展開され、制御構造またはスキーマが一切 まず、データレイクの標準的な定義から見ていきましょう。 れると、新たに追加されたユースケースへの対応がはるかに容 「データレイクは、構造化データ、半構造化データ、および構 造化されていないデータを含む大量の raw データをネイティ ブ形式で保持するストレージレポジトリで、データの構造と要 件は、データが必要になるまで定義されません。」 では、なぜ データレイクを重視すべきなのでしょうか。 組み込まれていない中央の単一のレイクにソースデータが置か 易になります。 セルフサービス IT 部門にレポートを要求してから最終的に必要な情報が含ま れた作業レポートが組織内に展開されるまでの平均時間は、 きわめて多くのケースで数週間から場合によっては数か月と イノベーション なっています。データレイクを適切に設計してビジネスコミュニ 大企業の場合、データレイクがもたらす最も大きな効果は、お ジネスインテリジェンスを実現し、ビジネスユーザーが必要とす そらくイノベーションの実現でしょう。私たちは、数多くの数 十億ドル規模の組織がデータ主導型のインサイトとイノベー ションの文化の確立に苦慮する状況を目の当たりにしてきまし たが、こうした組織は、部門または区分ごとに分けられたデー タストアを孤立させる、データ所有権に関する大規模な組織的 政策が反映された構造のサイロによって動きが取れない状態 に陥っています。実装するのは容易ではありませんが、エンター プライズデータレイクは、全社的なデータアクセスの問題を 根本から解決するのに必要な基盤を提供し、これまで不可能 だった探索的分析とデータマイニングを行えるようにして、まっ 12 | THE DOPPLER | 2017 年夏号 ティで十分なトレーニングを行えば、確実にセルフサービスビ るデータのすべてのスライスにアクセスできるようにして、その ユーザーに必要なレポートを作成させたり、幅広いツールを使 用させたりすることが可能になります。そして IT 部門は、クラウ ド上のインフラストラクチャとデータを管理する役割を果たすよ うになり、ビジネス側はデータの探索とマイニングに責任を負 います。