Artificial Intelligence

L'IA appliquée à l'analyse de texte

La solution d'analyse automatique des contrats de Swisscom bénéficie de l'utilisation de l'IA et des technologies d'apprentissage automatique pour aider les services juridiques à obtenir les informations décisives.

Par Sergio Jimenez-Otero, Senior Data & Analytics Consultant

23 novembre 2017

"L'ère de la numérisation ..."

Nous vivons à l'ère de la numérisation. Aujourd'hui, il y a une demande croissante pour la numérisation de notre environnement physique, la transformation des entreprises traditionnelles en leurs équivalents numériques et la création de nouvelles valeurs ajoutées pour les entreprises en utilisant de nombreuses sources d'informations sous forme numérique.

Nous voulons transformer notre monde en une représentation numérique qui nous permette de le manipuler facilement, d'interagir avec lui, d'acquérir de nouvelles connaissances et, au final, d'étendre nos capacités intelligentes.

En cherchant à atteindre cet objectif, les données stockées et disponibles autour de nous augmentent constamment et de manière exponentielle. Il existe de nombreux types et sources de données : textes, sons, signaux, images, vidéos, appareils IoT, ordinateurs, téléphones portables, marchés boursiers, appareils médicaux, etc.

“Data Deluge …”

L'ère de la numérisation nous fait donc entrer dans l'ère du big data et de l'utilisation de technologies de pointe dans le domaine de l'apprentissage automatique et de l'intelligence artificielle. Ces outils sont nécessaires pour analyser et utiliser une telle quantité de données.

Une grande partie des informations qui seront numérisées se présentent sous forme de texte. Il y a déjà un déluge de données si l'on regarde les données textuelles qui sont stockées : Documents, Twitter, blogs, réseaux sociaux, sites web, chats, articles d'actualité, etc.

En même temps, le besoin d'analyser ces sources de données textuelles augmente afin de filtrer les connaissances qui s'y cachent, qui sont d'une grande valeur pour les décisions commerciales, qui prévoient les problèmes et qui peuvent être combinées avec d'autres types de données afin d'obtenir d'autres connaissances.

“…legal departments”

Un secteur traditionnel typiquement touché par la numérisation se trouve dans les services juridiques de nombreuses grandes entreprises.

Il y a une grande tendance à numériser les dossiers historiques, les documents, les contrats, la correspondance, etc. De plus, les processus commerciaux doivent être simplifiés et automatisés, et les départements juridiques doivent recevoir de nouvelles fonctions de recherche et intelligentes. La conséquence est que le nombre de documents texte enregistrés chaque jour augmente de manière spectaculaire.

Le flot de données, les réglementations de plus en plus strictes, la conformité, les contraintes et les clauses contractuelles, la complexité des contrats (liens, versionnage), les litiges, etc. rendent la vérification par des experts juridiques très coûteuse et chronophage, et en plus sujette aux erreurs. Tout cela, associé à des risques supplémentaires, peut conduire les entreprises à se retrouver dans des situations graves.

Les changements rapides de réglementation aggravent la situation et posent de nouveaux défis.

“…data challenges”

Nous avons besoin de plus de fonctions pour l'indexation des textes, mais aussi de processus automatisés intelligents qui s'occupent du text-data-mining, de la recherche d'informations en cas de litige, du résumé de texte, de la classification des sujets, etc.

Pour ces défis, les ordinateurs sont les mieux placés pour trouver des modèles complexes, découvrir de nouvelles connaissances et relations et fournir aux entreprises des informations pertinentes afin qu'elles puissent prendre des décisions éclairées.

Chez Swisscom, nous sommes confrontés aux mêmes défis en matière de données. Les juristes passent chaque année de nombreuses heures de leur temps de travail à faire des vérifications, des litiges, etc.

Les réglementations sont de plus en plus complexes. C'est pourquoi de nombreuses heures, voire des semaines, sont actuellement nécessaires pour trouver les bonnes informations dans l'énorme quantité de pages de texte.

Pour compliquer les choses, les documents juridiques sont stockés sur différents sous-systèmes, sous forme d'images scannées, avec des métadonnées différentes, redondantes, incomplètes, bruyantes et on peut même trouver des (presque) doublons et des versions du même contrat ou document juridique.

“…machine text analyses”

Les nouvelles technologies de pointe dans le domaine de l'intelligence artificielle et de l'apprentissage automatique sont utilisées pour résoudre ces nouveaux défis modernes avec un succès étonnant.

Ces techniques d'apprentissage automatique sont capables de reconnaître des modèles cachés lorsqu'elles sont confrontées à des données réelles. Elles sont en cela meilleures que les humains et moins sujettes aux erreurs.

Les connaissances obtenues à partir de ces analyses de textes automatiques permettent aux utilisateurs juridiques de prendre des décisions commerciales rapides et bien fondées qui profitent à leur entreprise.

Chez Swisscom, nous avons décidé d'apporter ces nouvelles technologies et ces fonctions intelligentes dans le quotidien d'un utilisateur juridique.

“Automatic Contract Analysis …”

La première chose que tu dois faire est de comprendre comment les acteurs légaux fonctionnent, quels sont les processus commerciaux, quels sont les problèmes actuels et ceux qui sont à prévoir dans un avenir proche.

Il faut également comprendre les problèmes auxquels ils sont confrontés dans leurs activités quotidiennes et comment la technologie peut les aider de manière intelligente.

Nous avons défini plusieurs objectifs pour un premier PoC (IA) pour les affaires juridiques.

Être capable de numériser tous les documents historiques et de les rendre accessibles en un seul clic
Pouvoir indexer les documents et filtrer les informations en fonction des métadonnées disponibles, ainsi que rechercher des mots-clés
Trouve automatiquement les documents associés, identifie les sections du contrat et reconnaît la langue du document
Création automatique de catégories de documents et de hiérarchies de documents associées
Pouvoir classer automatiquement les documents par thème et en déduire des catégories pour les nouveaux documents
Utilise des fonctionnalités intelligentes supplémentaires basées sur ces technologies
Et rends-le complètement évolutif et sûr en ce qui concerne la confidentialité des données.

Le projet PoC s'est avéré être un grand succès et a dépassé les attentes des parties prenantes juridiques. On nous a donc demandé de développer un premier produit entièrement fonctionnel, basé sur les technologies développées et intégrant de nouvelles fonctionnalités.

La solution "Analyse automatique des contrats", développée chez Swisscom, a été récemment validée et mise à la disposition du Groupe Swisscom Steering.

“…competitive advantage”

Les avantages liés à ce projet ne reposent pas seulement sur les fonctionnalités mentionnées ci-dessus, mais aussi sur l'avantage concurrentiel que représente la mise à disposition des services juridiques de technologies de pointe.

De plus, ce projet a permis d'optimiser les processus commerciaux et tous les documents disponibles sont disponibles sous forme numérique et peuvent être consultés de manière sécurisée et authentifiée via un seul système.

De plus, des (presque) doublons et des versions du même document ont été trouvés, et des modèles inattendus et d'autres connaissances qui étaient totalement inconnues des utilisateurs juridiques sont désormais disponibles.

La nouvelle phase du projet va bientôt commencer, au cours de laquelle nous introduirons d'autres fonctions intelligentes grâce à l'intelligence artificielle, à l'apprentissage automatique et aux technologies de traitement du langage naturel.

L'utilisation de ces technologies, surtout en ce qui concerne la représentation automatique de textes et le deep learning, peut également être appliquée à de nombreux autres processus commerciaux en ce qui concerne l'analyse de texte et le text mining.

“…to whet your appetite”

Pour te mettre en appétit, je pourrais mentionner quelques-uns des cas d'utilisation prévus:

Résumés automatiques des textes
Classification automatique de la correspondance, des e-mails, des fax, des plaintes des utilisateurs, etc.
Audits de contrats automatiques et à grande échelle
Extraction automatique de documents qui peuvent être utilisés en cas de litige
Soutien du service clientèle
Analyse de l'humeur sur les sites sociaux internes
Détection des spams
Découverte de plagiat, examen de brevet
Due diligence approfondie pour les fusions et acquisitions
Évaluation des risques de nouvelles sources de risques combinées à des données non structurées, etc.
Analyse prédictive basée sur l'analyse de texte
Stratégies de marketing ciblées sur les sites sociaux
Recommandations de produits
Chat bots

Sergio Jimenez-Otero

Senior Data & Analytics Consultant

Plus d’articles getIT

Prêts pour Swisscom

Trouve le Job ou l’univers professionnel qui te convient. Où tu veux co-créer et évoluer.

Ce qui nous définit, c’est toi.