Le Big Data

Par Jean-Michel

Le big data fait référence à un volume de données qui serait généralement trop coûteux à stocker, gérer et analyser à l’aide de systèmes de base de données traditionnels, ordinateurs ou serveurs traditionnels.

Habituellement, de tels systèmes sont peu adaptés en raison de leur manque de flexibilité pour stocker des données non structurées (telles que des images, du texte et de la vidéo), le traitement des données en temps réel ou une mise à jour très importante de données.

Pour cette raison, ces dernières années de nouvelles approches de gestion et de traitement de vos big data ont été adoptées, y compris les systèmes de bases de données Apache Hadoop et NoSQL. Pour plus d’informations vous pouvez faire une recherche sur MapReduce ou encore Spark.

Introduction au Big Data

C’est un fait, le Big Data a pris le monde d’assaut et est devenu l’un des mots à la mode ces dernières années.

Eric Schmidt, ancien PDG de Google, a déclaré en 2010 : “Il y a eu 5 Exabyte d’informations créées entre l’aube de la civilisation jusqu’en 2003, mais désormais, cette même quantité d’informations est maintenant créée tous les 2 jours et cette rapidité augmente….”

Cela montre à quel point le Big Data est devenu énorme. L’aspect intéressant est que le Big Data peut être utilisé dans presque tous les secteurs d’activité tels que la banque, la logistique, le commerce de détail, le commerce électronique et les médias sociaux. Toutes ces industries ont adopté des pratiques directement liées au Big Data qui ont connu un succès impressionnant.

Quelques exemples des intérêts pour les industries d’utiliser l’analyse du Big Data

  • Les banques du monde entier peuvent utiliser la technologie Big Data pour fidéliser leurs clients.

    Les banques en émettant des cartes de crédit ont l’opportunité d’analyser un grand nombres d’informations pour réduire les risques de fraude par carte de crédit. Elles sont également en possessions de vos listes de crédits souscrits, habitudes d’achat, voyages, revenus, âge, sexe…

  • Facebook, a été en mesure de prédire l’opinion politique, l’intelligence et la stabilité émotionnelle de ses utilisateurs en fonction de leur activité sur le réseau social.

    Facebook est en mesure de fournir les actualités ou les annonces dont nous avons besoin, en fonction de notre comportement sur le site et cela n’a été possible que grâce au Big Data.

  • Les industries du commerce de détail et du commerce électronique ont utilisé le Big Data pour prévoir les demandes de produits, analyser les comportements des consommateurs, etc.

    Les entreprises ont été en mesure de comprendre les habitudes d’achat des clients et ont commencé leur production en fonction des résultats. Toutes les grandes décisions commerciales ont été guidées par l’analyse des Big Data pour prévoir la demande de produits, les comportements des consommateurs et les mécanismes de la chaîne d’approvisionnement. Par exemple, le Big Data peut être utilisé pour analyser le comportement des clients et leurs habitudes d’achat et cette information peut, à son tour, aider les commençants à vendre exactement ce dont le client a besoin. A votre avis, pourquoi vous propose-t-on une carte fidélité dans la plupart des grandes enseignes. Ces cartes leur permettent d’analyser en temps réel vos habitudes d’achat en ayant pris soin au préalable lors de la souscription à la carte fidélité de vous demander toutes vos coordonnées, ainsi que d’autres informations personnelles pour mieux traiter les données qui suivront lors de l’utilisation de la carte.

    Les casinos ont également adopté cette méthode avec des cartes “privilèges” proposées pour chacun des joueurs permettant ainsi de mieux les cibler par la suite et connaître leurs habitudes de jeux, leurs budget, leurs périodes de jeux…

Les caractéristiques du Big Data

Pour comprendre et surtout retenir les caractéristiques du Big data, vous pouvez mémoriser le règle des 4 V.

Les 4 V du Big Data

Volume

Il représente la quantité de données et est l’une des principales caractéristiques du “big” data. Cela fait référence à la quantité massive de données que les sociétés ont essayé d’exploiter et à améliorer la prise de décision au sein de l’entreprise.

Vélocité

Cette caractéristique représente la vitesse de mouvement des données. Désormais le mouvement de données est maintenant presque en temps réel et le traitement des mises à jour est réduit à la fraction de seconde. C’est justement dans le cadre de la création de données en temps réel que les entreprises ont beaucoup investi pour développer des solutions Big Data qui pourraient traiter des données en continu dans les processus métier et la prise de décision.

Variété

Elle définit différents types de données et de ressources de données. Le monde a dépassé les moyens traditionnels de données structurées comme les relevés bancaires qui incluaient des informations telles que la date, le montant et le temps. De nouvelles catégories ont été ajoutées à la liste des types de données.

Les données non structurées, c’est-à-dire les données qui ne disposent pas d’un ensemble de règles bien définies, telles que les flux Twitter, les fichiers audio, les images, les vidéos, les pages Web et les journaux Web, ont énormément contribué à l’essor du Big Data.

Véracité

Il peut également être considéré comme la fiabilité des données, c’est-à-dire le calcul des bruits, des biais et des anomalies dans les données. Nous pouvons également définir la véracité comme le niveau de fiabilité associé à certains types de données.

Le big data peut être appliqué à la détection de fraude en temps réel, à l’analyse concurrentielle complexe, à l’optimisation des centres d’appels, à l’analyse du profil des consommateurs, à la gestion intelligente du trafic que ce soit pour un site web ou encore d’autres environnements et encore bien d’autres applications…

Il y a quatre types de traitement du Big Data qui aident vraiment les entreprises

Prescriptive – Ce type d’analyse révèle quelles actions devraient être prises. C’est le type d’analyse le plus précieux et aboutit généralement à des règles et des recommandations pour les actions à venir.

Prédictive – Une analyse des scénarios probables de ce qui pourrait arriver. Les livrables sont généralement une prévision prédictive.

Diagnostic – Un regard sur les performances passées pour déterminer ce qui s’est passé et pourquoi. Le résultat de l’analyse est souvent un tableau de bord analytique.

Descriptif – Ce qui se passe maintenant en fonction des données entrantes. Pour extraire les analyses, vous utilisez généralement un tableau de bord et / ou des rapports électroniques en temps réel.

L’analyse du big data à travers quelques exemples

L’analyse prescriptive est vraiment utile, mais peu utilisée. Lorsque l’analyse du Big data se concentre sur un sujet, l’analyse prescriptive vous donne un focus pour répondre à des questions spécifiques. Par exemple, dans le secteur des soins et de la santé , vous pouvez mieux gérer les patients en utilisant des analyses prescriptives pour mesurer le nombre de patients cliniquement obèses, et parfois anticiper des problèmes comme le diabète et le cholestérol. Le même modèle prescriptif peut être appliqué à de nombreux secteurs.

L’analyse prédictive traite des données volumineuses pour identifier les modèles passés afin de prédire l’avenir. Par exemple, certaines entreprises utilisent l’analyse prédictive pour la notation des prospects. Certaines entreprises ont fait un pas de plus en utilisant l’analyse prédictive pour l’ensemble du processus de vente, en analysant la source principale, le nombre de communications, les types de communications, les médias sociaux, les documents, les données CRM, etc. ou pour d’autres types de prévisions complexes.

L’analyse diagnostique est utilisée pour la découverte ou pour déterminer pourquoi quelque chose s’est passé. Par exemple, pour une campagne de marketing sur les médias sociaux, vous pouvez utiliser l’analyse descriptive pour évaluer le nombre de messages, mentions, abonnés, fans, pages vues, avis, épingles, etc. Il peut y avoir des milliers de comportements en ligne pouvant être analysés. C’est une opportunité de voir ce qui a fonctionné dans vos campagnes passées et ce qui n’a pas fonctionné.

Les analyses descriptives ou l’exploration de données sont au bas de la chaîne de valeur du Big data, mais elles peuvent être utiles dans certains cas. Un exemple simple d’analyse descriptive serait l’évaluation du risque de crédit; utiliser la performance financière passée pour prédire la capacité financière probable d’un client. L’analyse descriptive peut être utile dans le processus de vente, par exemple, pour catégoriser les clients en fonction de leurs habitudes d’achat et donc leurs préférences produits.

Comme vous pouvez le constater, exploiter le big data peut apporter une grande valeur aux activités clients ou prospects, en ajoutant un contexte aux données qui racontent une histoire plus complète. Si vous comprenez comment traiter et analyser les données à disposition de vos clients, la valeur de vos actions commerciales sera décuplée.

La notion de big data fait donc référence au traitement d’un très grande nombre de données en temps réel pour finalement mieux analyser nos comportements, nos habitudes et finalement mieux nous servir. Certains y voient un progrès énorme, une façon de mieux comprendre et anticiper les besoins des consommateurs mais d’autres y voient une menace, un danger pour le respect de la vie privée… Ce qu’il faut retenir c’est que désormais c’est incontournable entre tous les objets connectés que nous utilisons au quotidien, les mobiles, gps et autres le re-marketing a un énorme avenir. C’est justement en passant par le traitement de ce volume massif de données que les entreprises pourront mieux vous servir…

Et vous, au moment où vous lisez cet article, êtes vous connecté à votre compte google/gmail sur votre mobile androïd ? si c’est le cas, sachez que vous venez d’alimenter les données de google 😉 … Alors de votre côté vous sentez vous menacé ou pas par ce traitement massif de données en temps réel ?