Comment fonctionne l’intelligence artificielle Google Duplex ?

Au cours de la conférence de développeurs Google I/O qui s’est tenue cette semaine aux Etats-Unis, Google présenté une nouvelle intelligence artificielle Google Duplex qui est une nouvelle technologie permettant de mener des conversations naturelles pour effectuer des tâches «réelles» par téléphone.

La technologie est orientée vers l’accomplissement de tâches spécifiques, telles que la planification de certains types de rendez-vous. Pour de telles tâches, le système rend l’expérience conversationnelle aussi naturelle que possible, permettant aux gens de parler normalement, comme ils le feraient à une autre personne, sans avoir à s’adapter à une machine.

L’une des principales idées de recherche était de contraindre Duplex à des domaines fermés, qui sont suffisamment étroits pour être explorés de manière approfondie. Duplex ne peut effectuer des conversations naturelles qu’après avoir été profondément formé dans de tels domaines. Il ne peut pas effectuer de conversations générales.

Voici des exemples d’appels téléphoniques en duplex (en utilisant différentes voix):

Duplex entrain de prendre un rendez-vous dans un salon de coiffure:
Duplex appelle un restaurant:

Tout semble donc naturel, ces exemples et d’autres sont des conversations entre un système informatique entièrement automatique et de vraies entreprises.

Le changement d’étape réalisé avec Google Duplex est sa capacité à tenir des conversations de façon naturelle grâce à ses avancées dans la compréhension, l’interaction, le timing et la parole, ce qui évite aux destinataires de devoir s’adapter à une machine. C’est cette capacité à «tromper» la personne à l’autre bout de la ligne qui a suscité des préoccupations philosophiques et éthiques.

Google a depuis répondu en indiquant que Google Duplex s’identifierait correctement au cours de ses conversations.

Comment Google Duplex parvient-il à atteindre cet objectif?

Google Duplex utilise la plate-forme d’apprentissage automatique TensorFlow Extended (TFX) pour créer un réseau neuronal récurrent (RNN) avec des fonctions de traitement vocal via un moteur ASR (Automatic Speech Recognition) et un système TTS (Text To Speech) contrôlant l’intonation en fonction des circonstances.

 

Pour atteindre la qualité d’interaction requise, Google Duplex est formé dans des domaines étroits, tels que la réservation d’un rendez-vous capillaire. La formation est effectuée en temps réel et est supervisée par un opérateur humain qui surveillera les interactions et interviendra en cas de besoin. Ces instructeurs hautement qualifiés surveillent la formation jusqu’à ce que la conversation se déroule au niveau de qualité requis. À ce stade, Google Duplex est libre d’opérer seul.

Google Duplex, au fur et à mesure qu’il s’étend dans d’autres domaines, peut également nécessiter de connaître davantage les informations personnelles afin de répondre à vos demandes.L’utilisateur peut décider de ne pas fournir cette information mais au détriment de la qualité du service que Google Duplex peut fournir.

Parler et écouter comme un humain

Google utilise une combinaison d’un moteur concaténant de synthèse vocale (TTS) et d’un moteur TTS de synthèse (utilisant Tacotron et WaveNet ) pour contrôler l’intonation en fonction des circonstances.

Le système semble aussi plus naturel grâce à l’incorporation de diffluences de la parole (par exemple « hmm » et « euh »). Ceux-ci sont ajoutés lors de la combinaison d’unités sonores très différentes dans le TTS concaténant ou lors de l’ajout d’attentes synthétiques, ce qui permet au système de signaler de façon naturelle qu’il est toujours en cours de traitement. (C’est ce que les gens font souvent quand ils recueillent leurs pensées.) Dans les études d’utilisateur, Google a trouvé que les conversations utilisant ces diffluences semblent plus familières et naturelles.

Comprendre les réponses des humains est encore plus difficile car nous utilisons des phrases complexes, parfois contradictoires, souvent non structurées, qui reposent sur le contexte, avec un bruit de fond.  Par exemple : »OK pour 4″, pendant les conversations plus longues peuvent se référer à l’heure de la réservation ou pour le nombre de personnes.

Exemple d’une instruction complexe: 

Avantages pour les entreprises et les utilisateurs
Les entreprises qui utilisent des réservations de rendez-vous prises en charge par Duplex et qui ne sont pas encore alimentées par des systèmes en ligne peuvent bénéficier de Duplex en permettant aux clients de réserver via l‘Assistant Google sans devoir modifier leurs pratiques quotidiennes ni former leurs employés. L’utilisation de Duplex permet également de réduire les non-présentations aux rendez-vous en rappelant aux clients leurs rendez-vous à venir de manière à faciliter l’annulation ou le rééchelonnement.

Duplex appelant un restaurant:

Dans un autre exemple, les clients appellent souvent les entreprises pour se renseigner sur les informations qui ne sont pas disponibles en ligne, telles que les heures d’ouverture pendant les vacances. Duplex peut appeler l’entreprise pour se renseigner sur les heures d’ouverture et rendre l’information disponible en ligne avec Google, ce qui réduit le nombre d’appels reçus par les entreprises, tout en rendant l’information plus accessible à tous. Les entreprises peuvent fonctionner comme elles l’ont toujours fait, il n’y a pas de courbe d’apprentissage ou de changements à faire pour bénéficier de cette technologie.

Duplex demandant des heures de vacances:

Pour les utilisateurs, Google Duplex facilite les tâches prises en charge. Au lieu de passer un appel téléphonique, l’utilisateur interagit simplement avec l’Assistant Google, et l’appel se déroule entièrement en arrière-plan sans intervention de l’utilisateur.

Les étapes à venir pour Google Duplex

Plusieurs scénarios sont envisagés dans le futur par la firme américaine concernant son nouvel assistant.

Compte tenu d’un niveau élevé d’intégration dans les voitures que nous avons aujourd’hui, envisager un scénario où par exemple, lors d’un accident, si nos airbags se déploient, Google Duplex peut appeler les services d’urgence en notre nom automatiquement.

L’apparition d’un accident vasculaire cérébral peut entraîner des troubles de la parole, un autre scénario où Duplex pourrait être utilisé pour appeler les services d’urgence. Avec le simple placement de boutons de maison intelligentes et économiques autour de la maison, combiné avec IFTTT, Google Duplex pourrait demander de l’aide pour les personnes âgées en cas de problème.

Les tâches qui semblent banales pour la majorité peuvent être extrêmement difficiles pour les personnes handicapées. Dans ces genres de scénarios, Google Duplex s’avérera vraiment utiles et indispensables pour ces catégories de personnes.

Maintenant que vous savez à peu près tout de Google Duplex, qu’en pensez-vous ?

Source

Bob Fabien

Bob Fabien

Passionné de nouvelles technologies et de l'univers Android.