Google Duplex : une discussion plus naturelle avec les machines

Sauriez-vous distinguer la voix d’un être humain de celle d’une machine ? Lors de sa conférence annuelle, Google a réalisé une démonstration assez impressionnante : la conversation de son nouvel assistant vocal Google Duplex avec des commerçants. Une belle avancée qui soulève cependant quelques problèmes…

Partager
Google Duplex : une discussion plus naturelle avec les machines

Oui, d’un point de vue technologique, les prouesses de l’assistant vocal Google Duplex sont impressionnantes. Lors de sa conférence I/O qui s’est déroulée le 8 mai en Californie, Google a fait la démonstration d’une conversation entre l’homme (des commerçants) et la machine (son assistant). De quoi en émerveiller plus d’un… ou de les effrayer. « D’un point de vue technologique, l’assistant vocal Google Duplex est très impressionnant, remarque Manuel Davy, fondateur de Vekia, une entreprise française spécialisée dans l’intelligence artificielle. Reconnaissance vocale, interprétation du langage naturel, synthèse vocale, recherche dans l’agenda… c’est au moins un enchaînement de cinq technologies dont chacune dispose de ses propres algorithmes. » Pour la reconnaissance de parole, précise cet ancien chercheur CNRS en IA, c’est le deep learning qui a permis son amélioration. Tandis que pour la prise de rendez-vous, il s’agirait plutôt de technologies relativement simples dites d’optimisations, c’est-à-dire de la recherche sous contrainte.

Sur son blog, Google explique que la conversation de Google Duplex est naturelle grâce à un réseau de neurones récurrent construit en utilisant TensorFlow Extended (TFX), une plateforme d'IA. Le réseau de neurones a réalisé son apprentissage en s’appuyant sur des données de conversations téléphoniques anonymisées. Il utilise également une technologie de reconnaissance vocale automatique de Google ainsi que d’autres paramètres comme l’historique de conversation. L’assistant utilise également deux outils de synthèse vocale lui permettant de contrôler l’intonation de la voix en fonction du contexte. Pour paraître plus naturel encore, le système intègre des petites réponses du type « hmm hmm », un peu comme le ferait naturellement une personne au téléphone.

A lire également : Google Lens, l'application qui scanne les objets du quotidien

Qu’est-ce qui fait donc la différence chez Google ? « Ce qui est remarquable avec Google, ajoute Manuel Davy, c’est la qualité d’interaction orale avec la machine. Cela nécessite pour les chercheurs de savoir imiter le rythme de parole, trouver des réponses à des questions anodines. Pour cela, il faut avoir une base de données d’exemples d’échanges standards gigantesque permettant de savoir comment les gens interagissent de manière informelle. » Il faut une base de données suffisamment grande pour que le système puisse apprendre et avoir un comportement naturel. Cette base doit être multipliée au nombre de pays existant.

Bonne ou mauvaise chose ?

« Toute technologie est porteuse de bonne et mauvaise choses », relativise Manuel Davy. « Encadrer la technologie est donc légitime, mais la question doit se poser pour toutes les technologies et non uniquement pour l’intelligence artificielle. » L’homme ajoute d’ailleurs que ce qui est assez difficile avec l’intelligence artificielle, c’est qu’elle n’est pas comprise par le grand public et qu’il est nécessaire de faire un travail pour différencier ce qui est la réalité et le fantasme.

Aujourd’hui, l’intelligence artificielle apporte différentes avancées, par exemple en médecine ou pour l’agriculture. En revanche, « il ne faudrait pas faire passer le robot pour un être humain », ajoute Manuel Davy. « Ce n’est pas parce que c’est une machine qu’elle peut faire n’importe quoi. »

SUR LE MÊME SUJET

Sujets associés

NEWSLETTER L'hebdo de la techno

Nos journalistes sélectionnent pour vous les articles clés de l'innovation technologique

Votre demande d’inscription a bien été prise en compte.

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes...

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes du : Groupe Moniteur Nanterre B 403 080 823, IPD Nanterre 490 727 633, Groupe Industrie Service Info (GISI) Nanterre 442 233 417. Cette société ou toutes sociétés du Groupe Infopro Digital pourront l'utiliser afin de vous proposer pour leur compte ou celui de leurs clients, des produits et/ou services utiles à vos activités professionnelles. Pour exercer vos droits, vous y opposer ou pour en savoir plus : Charte des données personnelles.

LES ÉVÉNEMENTS L'USINE NOUVELLE

Tous les événements

LES PODCASTS

Raymond Kopa, de la mine au stade de foot

Raymond Kopa, de la mine au stade de foot

Au nord, c’étaient les corons, la terre c'était le charbon, le ciel l’horizon, les hommes des mineurs de fond. Parmi eux, Kopaszewski Raymond.

Écouter cet épisode

Poundbury, cité idéale à la mode Charles III

Poundbury, cité idéale à la mode Charles III

S’il n’est pas encore roi, le prince Charles semble avoir un coup d’avance sur l’environnement. Au point d’imaginer une ville nouvelle zéro carbone.

Écouter cet épisode

A Grasse, un parfum de renouveau

A Grasse, un parfum de renouveau

Dans ce nouvel épisode de La Fabrique, Anne Sophie Bellaiche nous dévoile les coulisses de son reportage dans le berceau français du parfum : Grasse. Elle nous fait découvrir un écosystème résilient, composé essentiellement...

Écouter cet épisode

Les recettes de l'horlogerie suisse

Les recettes de l'horlogerie suisse

Dans ce nouvel épisode de La Fabrique, notre journaliste Gautier Virol nous dévoile les coulisses de son reportage dans le jura suisse au coeur de l'industrie des montres de luxe.

Écouter cet épisode

Tous les podcasts

LES SERVICES DE L'USINE NOUVELLE

Trouvez les entreprises industrielles qui recrutent des talents

ADSEARCH

Responsable Assurance Qualité (H/F)

ADSEARCH - 31/03/2023 - CDD - Bérengeville-la-Campagne

+ 550 offres d’emploi

Tout voir
Proposé par

Accédez à tous les appels d’offres et détectez vos opportunités d’affaires

02 - CLESENCE

Entretien et nettoyage des parties communes et service des ordures ménagères. Relance lots 11 et 12

DATE DE REPONSE 02/05/2023

+ de 10.000 avis par jour

Tout voir
Proposé par

ARTICLES LES PLUS LUS