The Doppler Quarterly (日本語) 夏 2016

ビッグデータ成熟度レベル人員プロセスの成熟度レベル1 - データアクセス • IT/コンピューターに関する基本的なスキル • 記憶に基づくレベル2 - コンソリデーション • ETL、 DBA • 経験に基づくレベル3 - レポート • • • データ品質 • ドキュメント化、再現可能レベル4 - アラート • 高度な統計情報 • 自動化レベル5 - エンゲージ • NLP、予測、モデリング、数学、機械学習 • 学習、進化統計情報開発図2: ビッグデータの成熟度図 2 は、組織内でビッグデータ導入の成熟度がどのように向上するのかを概説したもので、組織は、テクノロジー、人員、およびプロセスコンポーネントの面で成熟していきます。一般的にレベル 3 からレベル 4、そしてレベル 5 への移行をサポートするために展開されるデータレイクは、高度なテクノロジーを実行するためのプラットフォームとスタッフがデータ分析とデータサイエンスのスキルセットを向上させるための場所を提供します。データレイクのビジネス価値データレイクの最も重要な価値は、複雑なデータセットを分析するためのスケーラブルなプラットフォームで柔軟性を向上させることができる点にあります。このような分析では、予測分析ツール、データモデリング、データ品質、機械学習といった、多様なテクノロジーが活用されるようになると思われますが、分析のワークフローにおいては最初にデータが処理され、その後、一般的には図 3 に示すように、取り込み、クラスター化、インデックス化、そして最終的にはデータレイク内のデータの分析が行われます。これらの手順は、質の高いデータを統合して適切に関連付け、データサイエンティストが準備されたデータを分析できるように整理するうえで重要となります。取り込み複数のソースからデータを取り込んで関連付けるクラスター化パターンと関係を見出すインデックス化高速でアクセスできるようにデータを整理して配置する分析関係を明らかにして分析する図3: データ分析における分析のアプローチ 2016年夏号 | THE DOPPLER | 37

The Doppler Quarterly (日本語) 夏 2016 | Page 39