The Doppler Quarterly (DEUTSCHE) Sommer 2017 - Page 20

Abbildung 3: Eine AWS-basierte Architektur für die Metadatenspeicherung im Data Lake bank gespeichert werden. Der daraus resultierende DynamoDB-basierte Datenkatalog kann von Elastic- search indiziert werden, sodass Geschäftsanwender eine Volltextsuche durchführen können. AWS Glue: ein Produkt, das in Kürze veröffentlicht werden soll und das eine Reihe automatisierter Tools zur Unterstützung der Katalogisierung von Daten- quellen bietet. AWS Glue kann Datenquellen durch- suchen und einen Datenkatalog mit vordefinierten Klassifikatoren für viele gängige Quellformate und Datentypen erstellen, einschließlich JSON, CSV, Par- quet und vieles mehr. In diesem Zusammenhang bie- tet es das potenzielle Versprechen für Unter- nehmensimplementierungen. den Analysekontext geeignete geschäftlich sinnvolle Bedeutung auf den Datensatz anwenden kann. Dieser Ansatz bietet viele Vorteile, einschließlich der Nut- zung verschiedener Tools für den Zugriff auf die Daten für verschiedene Zwecke. Datenverarbeitung Sobald die Ebene der unveränderlichen Rohdaten im Da ѕ͕Ёа͕Mɕɔ)ЁٕɅɉѕѕѕѕմUѕɹ)ٕ͍ݕչ͛ԁɷٝ)́ͥ ȁٽȁ͍ɥ)խɥѕMȸiԁ͍Yɟ)մѕ͕ȁխɥѕѕ)ȁəɑɱͥ)]ȁ-չѕхͥչ)ȁ镹ɅYɅ͕չȁф1)%ѥչԁ$-ѥٕ͍ȁѕ)MI$չɕѕȁѕ)ѕ͕՝ɥչ5(MɥєЁ́є5ѕȁȁ ɕ)չQɅ͙ɵѥչȁ́!՛񝕸)͍́ḾԁѕٽȁȁM)չȀխɥѕɕѥѕ)]ɕ́аͥɕф1)՘ٱɕ5ѕȃL+i͍ɕ`Ĺٕɡа́ȁɥɔ)ѕȁЁٽٽɝ)Mиѕݕɑչٕȴ)ɉѕѕȁȁЁٕɅɉѕѕɵ)аݽ͕́ݕɭ՜(Q!=AA1HM=55H+$ɵͥչ+$ ɕչ饕չY݅չ)MɬЁմɕQȁYɅȴ)չȁIѕݽɑմٕ͍)ݕ͍խɥєѕ)ѕ)ф]ɕͥ)%饕ݕչ͛ݥ)!չ̵ф]ɕ͕̤͕M)ٝݕ͔ME0ɅѕAх)є ɕ͛ɕչ͕ȁ͍)͕ɝ͔ɸ%͕͕)Mٝݕ͔Q%ɕȁѕ́%ɕ