The Doppler Quarterly (日本語) 夏 2016 - Page 39

ビッグデータ成熟度レベル 人員 プロセスの成熟度 レベル1 - データアクセス • IT/コンピューターに関する 基本的なスキル • 記憶に基づく レベル2 - コンソリデーション • ETL、 DBA • 経験に基づく レベル3 - レポート • • • データ品質 • ドキュメント化、再現可能 レベル4 - アラート • 高度な統計情報 • 自動化 レベル5 - エンゲージ • NLP、予測、モデリング、 数学、機械学習 • 学習、進化 統計情報 開発 図2: ビッグデータの成熟度 図 2 は、組織内でビッグデータ導入の成熟度がどのように向上するのかを概説したも ので、組織は、テクノロジー、人員、およびプロセスコンポーネントの面で成熟してい きます。一般的にレベル 3 からレベル 4、そしてレベル 5 への移行をサポートするため に展開されるデータレイクは、高度なテクノロジーを実行するためのプラットフォームと スタッフがデータ分析とデータサイエンスのスキルセットを向上させるための場所を提供 します。 データレイクのビジネス価値 データレイクの最も重要な価値は、複雑なデータセットを分析するためのスケーラブル なプラットフォームで柔軟性を向上させることができる点にあります。このような分析で は、予測分析ツール、データモデリング、データ品質、機械学習といった、多様なテク ノロジーが活用されるようになると思われますが、分析のワークフローにおいては最初 にデータが処理され、その後、一般的には図 3 に示すように、取り込み、クラスター化、 インデックス化、そして最終的にはデータレイク内のデータの分析が行われます。これ らの手順は、質の高いデータを統合して適切に関連付け、データサイエンティストが準 備されたデータを分析できるように整理するうえで重要となります。 取り込み 複数のソースからデータを取り込んで関連付ける クラスター化 パターンと関係を見出す インデックス化 高速でアクセスできるようにデータを整理して配置する 分析 関係を明らかにして分析する 図3: データ分析における分析のアプローチ 2016年夏号 | THE DOPPLER | 37