Un logiciel qui répondrait aux questions sur un texte

 

Une équipe de linguistique informatique à l’Université de la Sarre [1] travaille actuellement au développement d’un logiciel de compréhension de langage qui permettrait d’établir des liens dans un texte afin d’en saisir le sens global. Deux des projets menés sont soutenus financièrement par l’entreprise Google. Les bénéficiaires sont Ivan Titov, chef du groupe de recherche « Apprentissage automatique pour le traitement du langage », et Hans Uszkoreit [2], professeur de linguistique informatique à l’Université de la Sarre et directeur scientifique du Centre allemand de recherche sur l’intelligence artificielle de Kaiserslautern (DFKI – Rhénanie-Palatinat). Ces bourses sont destinées à soutenir des projets d’intérêt pour le moteur de recherche et pour l’informatique en général. Le soutien total de l’industriel représente 360.000 dollars.

Les informaticiens autour d’Ivan Titov développent actuellement une méthode pour permettre à un ordinateur de mettre en relation logique les éléments d’un texte. Il serait donc possible dans un futur proche pour un ordinateur de répondre à une question ciblée d’un utilisateur sur un texte donné. Le logiciel analyserait le texte en le plaçant dans son contexte et donnerait la bonne réponse à l’utilisateur. L’idée de l’équipe est d’aboutir à un programme qui répondrait à des questions sur un article long, non connu du lecteur et dont seulement un résumé ou une partie de l’écrit présenterait un intérêt.

L’équipe de recherche travaille à la fois à Sarrebruck (Sarre) et à Amsterdam. Ivan Titov, premier bénéficiaire de la bourse de recherche, travaille à rendre possible une sorte d’apprentissage par l’ordinateur, par la mise en relation des mots au sein d’une phrase pour en comprendre le sens. « Nous avons conçu un modèle pour simuler la façon dont l’homme écrit des textes. Nos ordinateurs travaillent dans le sens inverse pour comprendre ces textes : l’ordinateur va saisir le sens du texte, voire les intentions de l’auteur », indique le chercheur. Les ordinateurs ne devront pas uniquement mettre en relation des mots et des phrases, mais également lier les mots à leur signification dans un contexte donné. Ainsi, une partie implicite du discours devrait être saisie par l’ordinateur qui pourra dans un second temps répondre aux questions d’un utilisateur ou rédiger un résumé du texte incluant ces éléments.


[1] Depuis 2007, le cluster d’excellence de l’Université de la Sarre « Informatique et interaction multimodale » est soutenu par le gouvernement fédéral.

[2] Hans Uszkoreit est le deuxième bénéficiaire de la bourse de recherche. Son travail, complémentaire à celui d’Ivan Titov, se penche sur la reconnaissance des contextes linguistiques dans de grandes bases de données.

 

Pour en savoir plus, contacts :

– Sur l’informatique linguistique et le cluster d’excellence « Informatique et interaction multimodale » de l’Université de la Sarre : http://www.coli.uni-saarland.de & http://www.mmci.uni-saarland.de
– Gordon Bolduan, chargé de communication, cluster d’excellence « Informatique et interaction multimodale » – tél. : +49 681 302 70741 – email : bolduan(at)mmci.uni-saarland.de

 

Sources :

« Textverständnis: Ein kleiner Satz für den Menschen, ein großer Schritt für den Computer », dépêche idw, communiqué de presse de l’Université de la Sarre – 18/07/2013 – http://idw-online.de/pages/en/news544125

 

Rédacteurs :

Aurélien Filiali, aurelien.filiali@diplomatie.gouv.fr – https://www.science-allemagne.fr