The Doppler Quarterly (日本語) 夏 2016 | Page 47
データレイクの留意事項と各段階の対応付け
1. 戦略と経済性 – データレイクには、組織内の意思決定を向上させて、収益と顧
客満足度にプラスの効果をもたらすことができる、戦略と経済性に関する特定の
要素が含まれています。
2. セキュリティとガバナンス – データレイクには多数のデータが保存されるた
め、セキュリティとガバナンスにおいて、従来の組織の役割、またはワークフローの
範囲を超えて結合および分析されるデータに関連するリスクを検討しなければな
りません。
3. アプリケーションポートフォリオアセスメント – データレイクプロジェクトで
は必ず、記録の情報源の評価結果をドキュメント化するなど、データ使用量の観
点から見たアプリケーションの評価を含める必要があります。
アプリケーション移行 – データレイクに関しては、アプリケーション移行の作業は
きわめて少なく、むしろデータレイクをサポートするための新しい機能の実装や既
存のシステムとの統合に重点が置かれます。
4. DevOps – データレイクの場合、 DevOpsモデルによって組織内の人物が分析モ
デルを開発し、キュレートされた組織に関するデータのレポジトリにアクセスできる
ため、ビジネスの管理と理論の検証を効果的に行うことが可能になります。
5. CloudOps – データレイクには、多くの可動部分と相互接続されたシステムがあ
り、監視、応答、インシデント管理、およびスタッフのトレーニングをサポートする
強力なCloudOpsモデルによって信頼性が確保されます。またCloudOpsには、サ
ービスが適切に起動および停止されるようにするとともに、管理者がコストを監視
して組織の目標や投資収益率に合致させることができるようにするためのコスト
制御の要素も含まれます。
6. DataOps – 事実に基づいて意思決定と推奨が行われるよう、データレイクでは
データの品質が最も重要となります。メタデータの管理、データの結合、品質、キュ
レーション、およびアーカイブを含むDataOpsは、すべてのデータレイク環境に重
要な要素です。
データの品質とモデリング
データレイクの主な役割は、簡単にアクセスできるうえ、品質が高く整合性のある、さ
まざまなデータセットの単一のレポジトリを提供することにあります。データセットや関
連するデータを容易に見つけることが可能になるため、データの品質は最も重要となり
ますが、データレイク内のデータの品質の測定尺度として使用できるベストプラクティス
には、以下のようにさまざまなものがあります。
2016年夏号 | THE DOPPLER | 45