The Doppler Quarterly (FRANÇAIS) Hiver 2018 | Page 60
Lorsque vous associez cette analyse expérimentale avec les connaissances
d’un spécialiste qui maîtrise bien les processus sous-jacents de génération des
données, vous avez de bonnes chances d’obtenir des résultats raisonnablement
fi ables. L’objectif générique est d’être capable de prendre des décisions
stratégiques qui soient égales ou supérieures à celles qui seraient prises par un
humain.
Visualisation des données
La visualisation des données appartient à la dernière partie souvent négligée
du processus, qui consiste à examiner la sortie produite lors des étapes
antérieures. Les meilleurs résultats impliquent souvent une quantité égale de
science informatique, d’art et de neurosciences pour bien comprendre les sub-
tilités de notre perception visuelle. Le vieil adage selon lequel « une photo parle
d’elle-même » entre certainement ici en ligne de compte.
À cet égard, il convient de faire deux observations. Tout d’abord, nous avons
mentionné les sorties produites lors des états antérieurs. Ces techniques et
technologies ne sont pas seulement utiles du point de vue du résultat fi nal de
vos analyses ; elles peuvent également se révéler extrêmement effi caces pour
mener à bien le diffi cile processus de data munging. Il ne faut pas oublier que
nous parlons ici de données volumineuses, ce qui implique généralement une
quantité de colonnes et de lignes de données bien supérieure à ce que notre
Figure 1|: Cet exemple d’algorithme de visualisation de données identifi e deux groupes distincts, sim-
plement en analysant les activités des utilisateurs. Une caractéristique surprenante distingue les
points jaunes et bleus|: les femmes et les hommes.
Source : KDnuggets
58 | THE DOPPLER | HIVER 2018