Quaero, arène de la recherche multimédia
Par Aurélie Barbaux - Publié le | L'Usine Nouvelle n° 3197Le consortium de recherche, dédié à l'analyse automatique de contenus non textuels, organise des concours entre ses vingt-six membres pour sélectionnerles meilleures pistes technologiques.
C'est une tradition dans le domaine de l'analyse d'images. Les laboratoires de recherche du monde entier, qui travaillent sur la reconnaissance de contenus dans des images fixes ou animées, participent régulièrement à des concours. Sur un même jeu de données, ils testent leurs derniers algorithmes et priment la meilleure équipe. Le projet de recherche collaboratif Quaero (« je cherche », en latin), lancé en 2008 pour cinq ans et doté d'un budget de 199 millions d'euros (dont 50 % financés par Oséo), a adopté le même principe pour développer des outils d'analyse automatique de contenus non textuels. Une manière efficace de faire collaborer ses vingt-six membres et les quelques 300 chercheurs impliqués, issus de PME, de groupes industriels et de laboratoires publics.
« Nous avons instauré en interne un système de "coopétition" selon des procédures pensées par le CNRS et la Direction générale de l'armement (DGA), deux membres du consortium », explique Pieter van der Linden, chef du projet chez Technicolor et pilote du projet Quaero, qui présentait récemment ses résultats à mi-parcours. Après avoir mis en commun leur vision sur les axes possibles de développement dans cinq grands chantiers de recherche (l'image, la vidéo, la musique, la linguistique et les interfaces), les partenaires partagent leur expérience. Puis, chacun des acteurs concernés travaille sur un cas concret, le même pour tous. « Les jeux de données de concours internationaux ne sont pas adaptés aux besoins industriels », remarque Pieter van der Linden. Ensuite, celui qui obtient les meilleurs résultats explique aux autres comment il y est parvenu, pour construire en-semble une solution plus aboutie. Chacun gardant par ailleurs la propriété intellectuelle de ses développements.
LE SITE WEB DE L'ELYSÉE, PREMIÈRE VITRINE
C'est sur ce principe qu'ont été mis au point les premiers démonstrateurs issus de Quaero, comme la Live Interactive TV, développée en commun pour la chaîne France 24, par la start-up Yacast (plate-forme numérique de diffusion radio et TV, qui a rejoint le consortium fin 2009), les spécialistes du traitement de la voix Vecsys et Vecsys Research, le moteur de recherche d'entreprise Exalead (qui vient d'être acquis par l'éditeur Dassault Systèmes) et le laboratoire Limsi-CNRS. En combinant des technologies de reconnaissance vocale et d'analyse sémantique, les paroles des locuteurs peuvent ainsi être transcrites et synchronisées avec les images, permettant une recherche précise de termes prononcés dans un enregistrement vidéo. De son côté, Exalead a adapté cette technologie au sein du logiciel Voxalead, que l'on peut tester sur le site web de l'Elysée où il indexe les discours de la présidence.
PAS DE CONCURRENCE DIRECTE AVEC GOOGLE
Sur le même principe, Orange, Vecsys, l'INA, le Limsi-CNRS, l'Ircam et LTU Technologies ont confronté leur expertise pour développer un système de recherche musicale capable de reconnaître différents genres musicaux en fonction du rythme et d'établir des résumés.
« En aucun cas, Quaero n'a pour but de développer un moteur de recherche multimédia unique », rappelle Pieter van der Linden. Le rêve du président Jacques Chirac, qui avait soutenu le projet en 2005, de doter l'Europe d'un concurrent à Google, est donc très loin. Pour autant, malgré des débuts laborieux, le programme remplit sa mission d'accélérateur de recherche-développement. En deux ans, vingt brevets ont déjà été déposés.











