Page non complète

Intelligence artificielle

Les avis ne sont pas unanimes sur le machine learning et l'intelligence artificielle en général. Effectivement, certaines utilisations malfaisantes sont imaginables. Utilisée à bon escient elle est d'une grande d'aide pour l'Homme et la compréhension du monde. Elle aide les entreprises à fournir de meilleurs produits et services, et permet de faire avancer la recherche sur divers sujets.

Cette page a pour but de présenter différentes applications de l'intelligence artificielle, son utilisation et donner plus généralement un aperçu global de son intégration.

Son fonctionnement n'est néammoins pas décrit ci-dessous.

NLP

NLP est l'acronyme de Natural Language Processing, ce qui signifie : traitement automatique du langage naturel.

Assistants connectés, chatbots, traductions automatiques, reconnaissance vocale : tous ces services utilisent des systèmes de traitement automatique du langage naturel. Ce ne sont pas les seuls. En réalité, il existe une multitude d'applications utilisant de près ou de loin cette technologie.

L'objectif des systèmes de traitement du langage naturel est de comprendre le langage humain, et d'arriver à l'intepréter pour en tirer des informations. Ces informations pourront alors être traitées de plusieurs manières à l'aide d'algorithmes.

Reconnaissance vocale

La reconnaissance vocale est peut-être l'une des applications les plus réputées de cette technologie.

Elle permet de retranscrire sous forme de texte un énoncé (speech-to-text en anglais). Ensuite, plusieurs applications sont disponibles :

  • fonctionnalités de recherche
  • détection des intentions de l'utilisateur
  • traduction automatique

Reconnaissance optique

La reconnaissance optique, et notamment la reconnaissance des caractères, permet de limiter les frictions liés aux restrictions technologiques du quotidien (un ordinateur a besoin de données correctement structurées et formatées pour fonctionner).

Grâce à la reconnaissance optique, certains logiciels sont désormais capables de transformer une photographie en un document éléctronique (sous format PDF par exemple), ou bien fournir de la traduction automatique à base de photographies.

Génération de langage naturel

La génération de langage naturel permet de délivrer aux utilisateurs des réponses sous forme de phrases dans une langue donnée. Elle est fortement utilisée dans les assistants vocaux.

Elle permet à l'utilisateur de recevoir une réponse agréable à interpréter, et non une réponse formatée comme ce qu'un ordinateur pourrait traiter.

Présentation de Google Duplex à la Google I/O 2018

C'est sur ce type d'utilisation du NLP qu'est basé le très populaire test de Turing.

Analyse des sentiments

L'analyse de sentiments (ou sentiment analysis en anglais) est une application du NLP moins connue du grand public mais qui a un fort potentiel d'utilisation pour les entreprises. Elle permet de comprendre et d'analyser les avis d'utilisateurs sur un produit, un service, une notion...

A partir d'une source d'informations, il est alors possible pour une entreprise d'évaluer l'appréciation d'un de ses produits. Ce type d'analyse a plusieurs avantages :

  • receuillir des avis sincères, non ou moins biaisés que celles recueillies via un formulaire
  • bénéficier d'une analyse continue des avis, et non ponctuelle liée à des campagnes ou formulaires
  • interprétation détaillée des avis clients/consommateurs. Celle-ci peut permettre une catégorisation des avis sur différents aspects du sujet étudié (exemple : pour une voiture nous pourrions catégoriser et discerner les plaintes liées à des problèmes techniques et celles liées à des problèmes esthétiques).
  • tracker facilement l'évolution d'un opinion sur un sujet donné plus ou moins abstrait

La source d'information peut s'agir de commentaires sur une page produit ou une vidéo, de posts sur les médias sociaux, etc.

Les utilisations de ce type de traitement du langage naturel sont diverses, et ne se limitent pas à l'évalutation de l'appréciation d'un produit.

A Complete Guide To Sentiment Analysis And Its Applications

Voitures connectées et conduite autonome

Tesla, Waymo, NVIDIA

Pour le grand public, lorsque l'on parle de voitures autonomes, le nom de Tesla vient assez vite. En effet, Tesla fait parti des quelques entreprises se consacrant à la fois sur les véhicules et le logiciel de conduite autonome. De nos jours, la capacité de conduite autonome n'est pas encore achevée, même si Tesla annonce y travailler intensément. Mais les options sont déjà là : depuis quelques années, Tesla propose à ses clients l'Autopilot, un logiciel maison qui accompagne le conducteur dans sa conduite. Le logiciel est capable de reconnaître les panneaux de signalisations, de changer de file, de s'arrêter au niveau des feux si besoin, et bien d'autres solutions d'utilités à la conduite.

Waymo, société de voitures autonomes appartenant à Google est un grand acteur du milieu, et se démarque notamment grâce à ses expérimentations. Sa stratégie est bien différente de celle de Tesla, et ses applications et essais se font beaucoup plus discrets.

Voiture Waymo

Fait moins connu, NVIDIA se lance également dans les technologies de voitures autonomes, notamment en annonçant en juin 2020 un partenariat avec Mercedes-Benz

Malgré les avancées technologiques, la conduite autonome suscite toujours de nombreux débats, moraux et juridiques particulièrement.

Deepmind

DeepMind est une entreprise britannique spécialisée dans l'intelligence artificielle. Originellement appelée DeepMind Technologies Limited et fondée en 2010 par Demis Hassabis, Mustafa Suleyman (en) et Shane Legg (en), elle est rachetée le 26 janvier 2014, par Google pour plus de 628 millions de dollars américains.

Alphago

AlphaGo est un programme informatique capable de jouer au jeu de go, développé par l'entreprise britannique Google DeepMind.

En octobre 2015, il devient le premier programme à battre un joueur professionnel (le français Fan Hui) sur un goban de taille normale (19×19) sans handicap. Il s'agit d'une étape symboliquement forte puisque le programme joueur de go est alors un défi complexe de l'intelligence artificielle. En mars 2016, il bat Lee Sedol, un des meilleurs joueurs mondiaux (9e dan professionnel). Le 27 mai 2017, il bat le champion du monde Ke Jie et la retraite du logiciel est annoncée.

L'algorithme d'AlphaGo combine des techniques d'apprentissage automatique et de parcours de graphe, associées à de nombreux entrainements avec des humains, d'autres ordinateurs, et surtout lui-même.

Cet algorithme sera encore amélioré dans les versions suivantes. AlphaGo Zero en octobre 2017 atteint un niveau supérieur en jouant uniquement contre lui-même. AlphaZero en décembre 2017 surpasse largement, toujours par auto-apprentissage, le niveau de tous les joueurs humains et logiciels, non seulement au go, mais aussi aux échecs et au shōgi.

OpenAI

OpenAI (« AI » pour Artificial Intelligence, ou Intelligence artificielle) est une entreprise à « but lucratif plafonné » en intelligence artificielle, basée à San Francisco. Avant mars 2019, elle était reconnue association à but non lucratif. L'objectif de cette société est de promouvoir et développer une intelligence artificielle à visage humain qui bénéficiera à toute l'humanité.

Elle a été cofondée par Elon Musk, et a élaboré de nombreux projets portant sur l'intelligence artificielle.

Logo de l'entreprise OpenAI

GPT-3

GPT-3 est un modèle de langage développé par la société OpenAI annoncé le 28 mai 2020 et ouvert aux utilisateurs via l'API d'OpenAI en juillet 2020. Au moment de son annonce, GPT-3 est le plus gros modèle de langage jamais entraîné avec 175 milliards de paramètres. GPT-2, sorti en 2019, n'avait que 1,5 milliards de paramètres.

L'artiste Mario Klingemann a utilisé GPT-3 pour générer des pastiches de grands auteurs (en anglais).

Parmi les utilisations possibles figurent des recherches en langue naturelle dans des documents. Par exemple GPT-3 peut répondre en langue naturelle à la question « pourquoi le pain est gonflé » en se basant sur l'article Wikipédia « pain ».

Il est possible d'avoir des discussions rapides, complexes et cohérentes en langue naturelle dans le but de générer des idées, recommander des livres et des films, raconter des histoires interactives ou à participer à une réunion11. GPT-3 peut fournir une assistance aux clients automatique en ligne sur les sites internet par exemple11.

GPT-3 permet d'analyser et synthétiser du texte sous forme de tableaux, de résumer des discussions, d'élargir des contenus à partir d'idées de base.

GPT-3 peut être utilisé pour traduire des textes d'une langue à l'autre. Il peut également transformer un texte en langue courante en un texte juridique.

GPT-3 peut être utilisé pour générer des codes informatiques à partir d'instructions en langue naturelle par exemple des boutons, des tableaux de données, ou même la recréation de la page d'accueil de Google.

DALL-E

DALL-E stylisé DALL-E, est un programme d'intelligence artificielle qui crée des images à partir de descriptions textuelles, révélé par OpenAI le 5 janvier 2021 Il utilise une version à 12 milliards de paramètres du modèle de transformateur GPT-3 pour interpréter les entrées en langage naturel (comme "un sac à main en cuir vert en forme de pentagone" ou "une vue isométrique d'un capybara triste") et générer les images correspondantes. Il est capable de créer des images d'objets réalistes ("un vitrail avec l'image d'une fraise bleue") ainsi que des objets qui n'existent pas dans la réalité ("un cube avec la texture d'un porc-épic"). Le nom de DALL-E est un portmanteau de WALL-E et Dalí.

Texte entré (traduction) : "une illustration d'un bébé radis blanc dans un tutu qui promène un chien"

Test de Turing

Le test de Turing est une proposition de test d’intelligence artificielle fondée sur la faculté d'une machine à imiter la conversation humaine. Décrit par Alan Turing en 1950 dans sa publication Computing Machinery and Intelligence, ce test consiste à mettre un humain en confrontation verbale à l’aveugle avec un ordinateur et un autre humain.

Si la personne qui engage les conversations n’est pas capable de dire lequel de ses interlocuteurs est un ordinateur, on peut considérer que le logiciel de l’ordinateur a passé avec succès le test. Cela sous-entend que l’ordinateur et l’humain essaieront d’avoir une apparence sémantique humaine.

Pour conserver la simplicité et l’universalité du test, la conversation est limitée à des messages textuels entre les protagonistes.

Tay : mise en lumière de biais d'apprentissage

Tay, une intelligence artificielle développée par Microsoft, et mis en application sur Twitter se retrouve confrontée à des biais d'apprentissage communs dans ce genre de projet. Cela illustre l'importance de la qualité des données d'apprentissage, et notamment lorsque ces données proviennent d'intéractions humaines présentant des risques pour le projet.

Quantum machine learning

/**

A développer

**/

Quantum NLP

Cambridge QNLP 1

Multidimensionalité et systèmes de recommandations

Voici une vidéo qui explique très bien le problème de multidimensionalité notamment utilisé dans les systèmes de recommandations. Cette vidéo souligne aussi l'importance de l'algèbre linéaire pour l'optimisation des algorithmes.

Mots clés concernant cette notion :

  • SVD (Singular Value Decomposition) ou décomposition en valeurs singulières
  • valeurs singulières
  • vecteurs propres
  • axes principaux
  • ACP (Analyse en composantes principales)

La réduction de la dimensionalité peut notamment être appliquée pour optimiser des algorithmes de recommandations de films.


  1. Datant du 2 mars 2021