|
Les corpus comparables, qui regroupent des textes dans différentes langues qui ne sont en correspondance de traduction, constituent une ressource textuelle multilingue en progression constante sur le web. Metricc propose d’exploiter les possibilités offertes par ces corpus dans le cadre de trois applications industrielles : les mémoires de traduction, la recherche d’informations interlingue et la catégorisation multilingue. Ce projet aborde la question des corpus comparables d’une façon complète et originale. Il vise à répondre à plusieurs défis fondamentaux relatifs à la construction de corpus comparables, l’extraction de ressources bilingues et leur exploitation dans les applications identifiées. |
|