The Doppler Quarterly (日本語) 夏 2016 | Page 39
ビッグデータ成熟度レベル
人員
プロセスの成熟度
レベル1 - データアクセス • IT/コンピューターに関する
基本的なスキル • 記憶に基づく
レベル2 - コンソリデーション • ETL、 DBA • 経験に基づく
レベル3 - レポート •
•
• データ品質 • ドキュメント化、再現可能
レベル4 - アラート • 高度な統計情報 • 自動化
レベル5 - エンゲージ • NLP、予測、モデリング、
数学、機械学習 • 学習、進化
統計情報
開発
図2: ビッグデータの成熟度
図 2 は、組織内でビッグデータ導入の成熟度がどのように向上するのかを概説したも
ので、組織は、テクノロジー、人員、およびプロセスコンポーネントの面で成熟してい
きます。一般的にレベル 3 からレベル 4、そしてレベル 5 への移行をサポートするため
に展開されるデータレイクは、高度なテクノロジーを実行するためのプラットフォームと
スタッフがデータ分析とデータサイエンスのスキルセットを向上させるための場所を提供
します。
データレイクのビジネス価値
データレイクの最も重要な価値は、複雑なデータセットを分析するためのスケーラブル
なプラットフォームで柔軟性を向上させることができる点にあります。このような分析で
は、予測分析ツール、データモデリング、データ品質、機械学習といった、多様なテク
ノロジーが活用されるようになると思われますが、分析のワークフローにおいては最初
にデータが処理され、その後、一般的には図 3 に示すように、取り込み、クラスター化、
インデックス化、そして最終的にはデータレイク内のデータの分析が行われます。これ
らの手順は、質の高いデータを統合して適切に関連付け、データサイエンティストが準
備されたデータを分析できるように整理するうえで重要となります。
取り込み
複数のソースからデータを取り込んで関連付ける
クラスター化 パターンと関係を見出す
インデックス化 高速でアクセスできるようにデータを整理して配置する
分析
関係を明らかにして分析する
図3: データ分析における分析のアプローチ
2016年夏号 | THE DOPPLER | 37