Cloud Computing

IoT Datastreaming et Big Data

Les appareils électroniques équipés de nombreux capteurs sont aujourd'hui omniprésents. D'innombrables données sont générées et collectées chaque jour, que ce soit dans la vie privée, dans le sport professionnel ou dans la vie professionnelle. Mais qu'est-ce qui se cache derrière ces données, à quoi servent-elles? Et comment utiliser au mieux les données collectées.

Par Lukas Heusser, Analytics Consultant

18 décembre 2018

Big Data Analytics

Le terme "Big Data" est devenu incontournable dans le vocabulaire des entreprises modernes. La collecte de données se fait selon le principe "plus c'est plus". Mais la collecte et le stockage des données sont plus faciles à dire qu'à faire. Souvent, cela implique des coûts élevés et des efforts supplémentaires. Une fois les données rassemblées, la question se pose de savoir ce que l'on fait de ces données? C'est pourquoi il est important de collecter les données qui racontent quelque chose. L'analyse des grandes données est semblable à la narration d'une histoire. De nombreuses données peuvent constituer une excellente histoire avec beaucoup de substance. Sur la base de celles-ci, des décisions fondamentales peuvent être prises par la direction ou bien les pannes et le temps de réaction peuvent être réduits au minimum. D'un autre côté, les données mal interprétées racontent une histoire qui n'est pas comprise et qui soulève plus de questions qu'elle n'apporte de réponses.

Au printemps 2018, Swisscom Analytics a créé une "preuve de concept" (PoC) pour l'entreprise immobilière de Swisscom. L'objectif était d'équiper les salles de réunion au sein de Swisscom de certains capteurs afin de créer un climat de travail optimal et d'obtenir une utilisation efficace de l'énergie.

Recherche d'informations

Sources de données

Avant de lancer le PoC, il fallait déterminer quels capteurs seraient utiles pour le test de faisabilité. Nous avons réalisé le PoC avec les capteurs suivants:

Capteur de température
Capteur d'humidité
Capteur de lumière
Capteur à ultrasons

Le capteur de température devait vérifier s'il y avait une température agréable ou si elle devait être ajustée vers le haut ou vers le bas. Le capteur d'humidité fait de même pour l'humidité de l'air. Le capteur de lumière permet de vérifier si l'éclairage de la pièce est allumé ou éteint. Le capteur à ultrasons permet de vérifier si quelqu'un entre ou sort de la pièce.

Sélection des frameworks

L'une des conditions du PoC était d'utiliser Hortonworks Hadoop. Dans le cadre de ces exigences, nous étions libres de choisir les frameworks. Tous les frameworks utilisés sont inclus dans l'installation standard de Hortonworks Hadoop.

Kafka
Kafka a été utilisé pour charger les données des capteurs dans l'environnement Hadoop. Kafka est une plateforme de streaming distribuée qui est optimale pour les applications de streaming en temps réel. De plus, Kafka est compact et tolérant aux erreurs.

Flume
Pour que les données de Kafka soient disponibles dans le système de fichiers Hadoop, elles doivent être chargées dans le HDFS à partir de ce que l'on appelle le topic Kafka. Pour cela, on utilise Flume.

Hive
Comme l'accès depuis les frameworks de visualisation est plus facile si les requêtes peuvent être effectuées via des requêtes SQL, on utilise Hive. Hive permet d'interroger les données dans le HDFS avec la syntaxe SQL connue.

Visualisierungsframework
Pour le framework de visualisation, il est possible d'utiliser celui avec lequel l'utilisateur se sent le plus à l'aise, mais il faut s'assurer que le framework est compatible avec Hive. Zeppelin a été utilisé pour le PoC. D'autres possibilités sont SAP Lumira Discovery, Tableau, etc.

Possibilités

Les capteurs actuels indiquent s'il fait trop chaud ou trop froid, si l'humidité est à un niveau confortable pour les utilisateurs et quelle est l'intensité de la lumière.

Le capteur à ultrasons est plus intéressant. Il permet de vérifier si la porte est ouverte ou fermée, ou combien de personnes ont traversé la pièce. Pour cela, il faudrait compter le nombre de fois où la barrière sonore a été brisée. Les capteurs à ultrasons pourraient également être placés au-dessus des sièges, ce qui permettrait d'analyser où une personne est assise.

Les données obtenues permettent par exemple d'utiliser des humidificateurs d'air spécifiques lorsque l'humidité de l'air est trop basse. Mais la lumière peut aussi être tamisée lorsque le soleil brille plus fort, ce qui permet d'économiser des frais d'électricité. Si le capteur à ultrasons détermine s'il y a encore des personnes dans la salle de réunion, la lumière peut être allumée ou éteinte en conséquence.

En plus du potentiel des capteurs existants, il y a encore beaucoup d'autres capteurs qui pourraient être installés. Par exemple, des capteurs de bruit pour mesurer le niveau sonore.

Contact

Swisscom Analytics" se fera un plaisir de réaliser une étude de faisabilité pour tes besoins en matière de big data et te soutiendra sur la voie d'une analyse réussie des données que tu as collectées.

Les personnes à contacter chez Swisscom sont les suivantes:

Tim Giger (tim.giger@swisscom.com(ouvre une nouvelle fenêtre)) – Hadoop Lead

Matthias Mohler (matthias.mohler@swisscom.com(ouvre une nouvelle fenêtre)) – Analytics Lead

Lukas Heusser (lukas.heusser@swisscom.com(ouvre une nouvelle fenêtre)) – Analytics Consultant