The Doppler Quarterly (日本語) 冬 2018 | Page 59
DL における現在の最先端技術は、 Google が開発した DeepMind の AlphaGo Zero で
す。DeepMind のアルゴリズムと Google の膨大な raw データを組み合わせることで、画
像認識や音声認識など、難しい問題の解決に対して飛躍的な進歩を遂げています。また、
AlphaGo Zero が碁の世界チャンピオンをあっさりと打ち負かしたという事実も忘れることは
できません。
AI の要素
ここまでは大きなトピックの詳細を説明してきました。次に、 AI に取り組む際に考慮すべき要
素の一部を紹介します。
データ取り込み
冒頭で述べた大量のデータは、何よりもまず、取り込まなければなりません。ここで、データ
取り込みが重要となるのです。ソーシャルメディアストリーム、企業のトランザクションシステ
ム、センサーデータ ( モノのインターネットとも呼ばれる ) などのデータソースを想定してくだ
さい。こうしたデータは、ファイル、トランザクション、またはストリームの形式を問わず、取り
込まれてレポジトリに保存されるケースが少なくありません。ストレージ容量が事実上無制限
で、コストも抑えられるため、パブリッククラウドが有力な保存先となります。
データマンジング
CTP では、データマンジングという用語を使用して、一般的に AI に関わる作業全体の 80 ∼
90% を含むいくつかの概念を網羅しています。これには、以下が含まれます。
• ETL ( 抽出、変換、ロード ) により、データを共通のフォーマットに入力
• 不完全なデータまたは破損したデータのクレンジングまたは削除
• 重複排除により、異なるソースから取り込まれた可能性のある重複したデータを削除
• 補強により、分析対象となる、より包括的なデータセットを提供する可能性のあるサード
パーティのデータを追加
このプロセスの大部分は自動化できますが、すべてのデータをデータサイエンティストが分
析に着手できる状態にするという、依然として手間のかかる作業を回避できる秘策はありま
せん。
データ分析
データが取り込まれ、使用できる状態に変換されると、機械学習とディープラーニングのコン
ピューティング技術を適用し始めることができます。これは精密科学ではなく、一般的に、試
行錯誤を繰り返す必要があります。また、適用可能な専門知識を十分に織り込むことも重要
です。たとえば、マーケティングデータを見ている場合は、実施しているマーケティングのタ
イプを理解した担当者と共同で作業した方がよいでしょう。また、産業機械用の予測メンテ
ナンスを改善しようとしている場合は、機械の仕組みに精通した担当者と連携すべきです。
2018 年冬号 | THE DOPPLER | 57