Note 1
Thème : Data Analytics ou comment donner de la valeur aux données...
Big Data c'est quoi ?
Big data signifie "Mégadonnées", ou données massive. Cela conrrespond à des données massives qui vont permettre d'analyse de façon plus précis le monde, les marchés ou encore les comportements.
Introduction fin 90, 2000 avec les GAFAM que le big data est vraiment sortie.
Une masse de données collosale est créée chaque jour. Ses données ont été multiplié par 30 au cours des 10 derniers années.
2 zeta 2010=>64 zeta 2020 => 180 zeta 2025
On parle de tout type de données, des images, de la musique écouté, des mails lus ou encore des recherches web. L'être humain ne peut pas gérer cette quantité de données, c'est pourquoi le big data est devenu une révolution.
Où le retrouve-t-on ?
On peut prendre comme exemple Amazon ou Netflix, qui vont utiliser les données récoltées lors de nos achat ou visionnage pour contribuer à créer notre profil consommateur Pour nous proposer des produits ou encore des séries basées sur nos précédents visionnage.
Les défis ?
Liée à la gestion et au stockage, mais aussi à la protection des données. Infrastructure couteuse et évolutive. Diverses source, données structurées, semi-structurées ou non-structurées. Un défi pour les intégrées, les normaliser et les analyser.
Vitesse de génération des données très importante.
Volume, variété et vitesse = 3V du big data
- véracité (exactitude et fiabilité massive des données, pas forcément assuré)
- variabilité (des données structurées ou pas)
Sécurité et protection de la vie privée, les entreprises doivent garantir la confidentialité des données. L'éthique est un enjeu majeur également, car les entreprises doivent tout mettre en oeuvres pour éviter les biais dans l'analyse.
Volume de données trop important par rapport aux analyses classiques (base de données relationnelle), grande variétés de données. Le traitement des données est quasiment en temps réel à la différence des analyses classique.
Big Data à pour objectif : la prédiction, la découverte de nouvelle infos, la génération d'infos en temps réelle.
Big data doit être hautement évolutif, pour suivre la croissance des données, c'est un gros enjeu. Ainsiq que de pouvoir ajouter facilement des ressources, sans pour autant freiner les traitement en cours. L'évolution est extrêmement rapide avec les nouvelles technos qui améliore les process.
Podcast 'Diginov, ep5'