The Doppler Quarterly (日本語) 冬 2017 | Page 58
第2世代のビッグデータ
プラットフォームへの大規模な移行
Joey Jablonski
データセンターの運用の課題があることから、現在多
くのお客様が、主要なパブリッククラウドプロバイダー
の提供するネイティブのサービスや機能を活用したいと
考えています。
第 1 世代のビッグデータプラットフォームには、多くの場合に Cloudera 社、 Hortonworks
社、 DataStax 社、またはそれらに類似するベンダーのソフトウェアスタックを実行する物理
サーバー上にオンプレミスで展開されるという特徴があります。これらの旧世界のプラット
フォームにより、多くの企業はアナリストに独自の機能セットを提供し、新たな方法でデータ
を分析できるようになりました。また、このような大きな変革をもたらすビッグデータプラット
フォームにより、企業は新たな方法で市場での競争を勝ち抜くことができます。
これらのシステムは、新たな機能を提供する一方でコストがかかることが多く、実証されてい
ない機能を購入するための資本支出と複雑なプラットフォームの機能を維持するための運用
コストの両方が必要です。パブリッククラウドサービスの運用の要件と比較した場合、多くの
オンプレミス環境は、プラットフォームのメンテナンス、容量の管理、インシデント対応、アッ
プグレードの管理、およびプラットフォームユーザーの教育に 3 倍の運用リソースが必要なこ
とから敬遠されています。また、プラットフォームのメンテナンスですべてのリソースが消費さ
れるため ( 図 1)、これらのビッグデータプラットフォームに保存されているデータから価値を
引き出したいと考えているアプリケーション開発者やデータサイエンティストを十分にサポー
トできません。
このような運用の課題があることから、現在多くのお客様が、主要なパブリッククラウドプロ
バイダーの提供するネイティブのサービスや機能を活用するために、ビッグデータのワーク
ロードを第 2 世代のプラットフォームへと積極的に移行しています。AWS 社、 Google 社、お
よび Azure はいずれも、急速に成熟しつつある、競争力の高いマネージドサービスと PaaS
機能を提供しており、多くの組織はこれらを活用することで、データ統合、データ分析、レポー
トといった主要なビジネスニーズや高度な機能にリソースを集中させることができます。
第 2 世代のビッグデータプラットフォームでも、データ品質、モデルの正確性、およびデータ
統合の課題は残されていますが、これからは、サービスの展開やプラットフォームの安定性
の維持といった運用面ではなく、こうした課題を解決したり、データとビジネスニーズを整合
させたりする作業にスタッフが投入されることになると思われます。
56 | THE DOPPLER | 2017 年冬号