Bien que les origines du terme soient insaisissables et même débattues, les mégadonnées sont l'un de ces concepts que beaucoup connaissent, mais elles défient une définition simple. Au cœur des mégadonnées, comme le terme l'indique directement, se trouve un volume de données extrêmement important. Ces informations proviennent souvent de sources diverses et même de différents types de données, qui sont ensuite analysées à l'aide de techniques analytiques avancées qui, nous l'espérons, permettent de dégager des modèles pouvant conduire à des conclusions utiles.
Le Big Data déduit également les trois V: volume, variété et vélocité. Le volume fait référence à la taille des données, la variété indique que les ensembles de données ne sont pas homogènes et la vitesse est la vitesse à laquelle l'analyse a lieu, souvent dans le but de réaliser une analyse en temps réel.
Les ensembles de données impliqués sont en effet très volumineux – nous parlons de téraoctets à zettaoctets (1ZB équivaut à 909,494,701TB, pour les curieux). En plus de la taille de ces ensembles de données, les données peuvent être de différents types: structurées, semi-structurées et non structurées, plus elles peuvent être tirées de plusieurs sources.
Cela pose la question de savoir d'où proviennent toutes ces données. Il provient de tous les types d'endroits, y compris le Web, les médias sociaux, les réseaux, les fichiers journaux, les fichiers vidéo, les capteurs et les appareils mobiles.
Ces derniers sont particulièrement importants car la plupart d'entre nous gardent leurs téléphones avec nous et 24 heures sur 24 et 7 jours sur 7, et ils ont une gamme de capteurs, y compris le GPS, des caméras, un microphone et un capteur de mouvement. En outre, la majorité de l'utilisation du smartphone n'est pas la communication vocale, mais plutôt d'autres activités, y compris les e-mails, les jeux, la navigation sur le Web et les applications sociales – ce qui se traduit finalement par 90% de l'utilisation étant des applications mobiles. Un grand moteur du big data est ces données mobiles, qui sont générées à un rythme effréné.
- Lisez notre avis sur le Xerox VersaLink C405 ici
- Lisez notre avis sur le Xerox VersaLink C500DN ici
- Lisez notre avis sur le Xerox VersaLink C7000DN ici
- Lisez notre avis sur le Xerox WorkCentre 6515 ici
Sommaire
Exploration de données
Mais les données sans analyse ne valent pas grand-chose, et c'est l'autre partie du processus de Big Data. Cette analyse est appelée exploration de données, et elle s'efforce de rechercher des modèles et des anomalies dans ces grands ensembles de données. Ces modèles génèrent ensuite des informations qui sont utilisées à diverses fins, telles que l'amélioration des campagnes de marketing, l'augmentation des ventes ou la réduction des coûts. L'approche du big data et du data mining a non seulement le pouvoir de transformer des industries entières, mais elle l'a déjà fait.
Par exemple, Trainline est l'un des principaux détaillants européens indépendants de billets de train, vendant des billets nationaux et transfrontaliers dans 173 pays, avec environ 127 000 trajets quotidiens effectués par les clients. L'entreprise a utilisé le Big Data pour moderniser son approche du voyage, en mettant l'accent sur l'amélioration de l'expérience client via l'innovation via son application.
Les résultats sont que les clients reçoivent désormais des notifications de perturbation améliorées via l'application. Plus que de simples notifications de retards, ces notifications améliorées sont spécifiques au voyage de chaque voyageur, une première pour l'industrie ferroviaire britannique. L'entreprise a également innové en termes de tarification prédictive, qui est en mesure de prédire quand les tarifs anticipés augmenteront par rapport au taux réduit initial, permettant aux passagers d'acheter des tarifs à des prix inférieurs.
Les mégadonnées ont également été utilisées dans les restaurants, et en particulier dans l'industrie de la restauration rapide. McDonald's est la plus grande chaîne de restaurants au monde en termes de revenus et sert quotidiennement plus de 69 millions de clients dans plus de 36 900 emplacements dans plus de 100 pays.
En raison du seul volume, des tonnes de données sont générées, et McDonald's a donc adopté une culture axée sur les données, dans le but d'améliorer sa compréhension au niveau de chaque emplacement individuel, dans le but global d'une meilleure chaîne de restaurants.
Grâce au Big Data, McDonald's a optimisé son expérience de conduite, en prenant par exemple note de la taille des voitures qui transitent et en se préparant à un pic de demande lorsque de plus grandes voitures rejoignent la file d'attente.
Une autre innovation du Big Data a été ces écrans de menu numériques qui peuvent afficher de manière flexible les éléments de menu sur la base d'une analyse en temps réel des données. Les menus déplacent les éléments en surbrillance en fonction de données telles que l'heure de la journée et la météo à l'extérieur, en promouvant spécifiquement les boissons froides quand il fait chaud à l'extérieur et plus d'aliments réconfortants les jours plus frais. Cette approche a stimulé les ventes dans les emplacements canadiens de 3% à 3,5%.
Questions de santé
Cette approche du Big Data a également été appliquée aux soins de santé. Un exemple évident est le changement majeur de la cartographie « stylo et papier '' où les données de votre médecin sont enfermées dans un classeur au bureau, vers les dossiers de santé électroniques (DSE), qui ont désormais toutes les informations sur les patients soigneusement saisies dans une base de données informatique , prêt à être extrait.
Cette approche promet d'être perturbatrice, avec une publication récente dans l'European Heart Journal promettant le «potentiel d'améliorer notre compréhension de la causalité et de la classification des maladies pertinentes pour une traduction précoce et de contribuer à des analyses exploitables pour améliorer la santé et les soins de santé».
Les avantages des mégadonnées dans les soins de santé iront au-delà de l'exploration de données du DSE. Un défi important pour les hôpitaux est la dotation en personnel, qui doit être adéquate en tout temps, avec le potentiel d'augmenter en période de pointe.
Au sein d'un groupe de quatre hôpitaux parisiens qui composent l'Assistance Publique-Hôpitaux de Paris (AP-HP), ils cherchent à améliorer la flexibilité des effectifs. Ils ont utilisé un ensemble de données de 10 ans de dossiers d'admission à l'hôpital, jusqu'à un niveau granulaire du nombre d'admissions par jour, ainsi que l'heure de la journée, et l'ont combiné avec des données météorologiques, des profils de grippe et des jours fériés.
À l'aide de l'apprentissage automatique, ils ont ensuite perfectionné leurs algorithmes pour les tendances futures afin de prédire le nombre d'admissions à venir pour différents jours et heures. Le résultat est qu'ils ont maintenant une interface basée sur un navigateur facile à utiliser pour l'administration hospitalière, ainsi que du personnel clinique qui est en mesure de prévoir les taux d'admission au cours des 15 prochains jours, qui est utilisé pour obtenir du personnel supplémentaire à des moments où une plus grande nombre d'admissions est prévu.
Les données, et en particulier les données mobiles étant générées à un rythme ridiculement rapide, l'approche des mégadonnées est nécessaire pour transformer cette masse massive d'informations en renseignements exploitables. Dans les exemples que nous avons cités ci-dessus, le défi a été relevé et, à mesure que davantage de données sont collectées, il y aura plus d'opportunités d'améliorer la qualité et l'efficacité dans un certain nombre d'industries diverses via une analyse plus rapide et meilleure de ces ensembles de données tentaculaires disparates.