The Doppler Quarterly (日本語) 秋 2017 - Page 21

データカタログを クラウドデータ戦略の 要にする理由 Joey Jablonski、 Neal Matthews 優れたデータ駆動型の組織は、デー タカタログを使用して、簡単に使用で き、一元的に管理できるロケーション で利用可能なデータを完全に可視化 しています。 合っていません。この難しさは、データが多くの異なる場所か データレイクは、多くの組織のデータ環境の基盤となっていま ていくことができないためです 1 。データカタログによって企業 す。これらのデータレイクによって新しい機能が提供されます が、複数の新しいインターフェイス、ツール、データセット、統 合ポイントの管理にかかる運用オーバーヘッドのために、多く の企業がその価値を最大限に引き出せずにいます。これらの データレイク ( データの湖 ) は、データセットの発見、必要に応 じた分離、ビジネスに対する根本的な価値の特定のための明 確な手法がないまま大量のデータが取り込まれているため、し ばしば「データの沼」 となってしまっていることがあります。 データカタログの価値 データカタログ機能の導入を検討する必要があるのはなぜで ら、さまざまな量の構造で取り込まれることに起因します。 データカタログは、すべてのデータレイク導入でデータセット を追跡し、ビジネスの用語によって特定可能にし、制御および 管理できるようにするために非常に重要な要素です。 『フォー ブス』の寄稿者である Dan Woods が、戦略として暗黙の了解 に頼ることに対して組織に警告しているのは、それでは拡張し のデータガバナンスポリシーを具体的に実践できるため、ポリ シー適用の原動力となり、コンプライアンス監査のツールとも なります。包括的な性質を持つデータカタログは、コラボレー ションや、組織全体からアクセス可能な既知のロケーションで の一元化された情報共有に利用できます。 データカタログは、分析的用途に向けて豊富なデータセットを 作成することに焦点を当てるデータエンジニアを介して、組織 中のデータサイエンティストなどの分析担当ユーザーに向けた エントリーポイントとなります ( 図 1)。データカタログによって、 これらの分散されたチームはデータセットの質、使用方法、ビ ジネスにおける説明に関して互いに協力できます。 しょうか。それは、多くの組織が企業データを一元化すること の重要性を理解していますが、たいていの組織はいまだに、そ のデータに効率的かつ安全にアクセスすることの難しさに向き 2017 年秋号 | THE DOPPLER | 19