Partenariat : Le projet rassemble 15 chercheurs appartenant à une dizaine d’unités nationales différentes. Il est coordonné au sein de l’unité LRL. Toile http://corpuscomere.wordpress.com/
CoMéRé a pour objectif, à l’horizon 2014 ,de créer un noyau de corpus de communication médiée par les réseaux (Computer Mediated Communication – CMC) en français. Chaque corpus rassemblera un ensemble de conversations intervenant sur la Toile et les réseaux. Les membres s’intéressent à une variété de systèmes de communication synchrone ou asynchrone, mono ou multimodaux (éventuellement) : blogues, tweets, SMS / textos, courriels , clavardage, forums, etc. Les corpus et leurs métadonnées seront structurés suivant des formats standards : TEI (Text Encoding Initiative), CLARIN, OLAC. La banque de corpus sera diffusée en accès libre en 2014 sur le site Ortolang. L’assemblage des corpus se fera sur les serveurs de la MSH (Maison des Sciences de l’Homme) de Clermont-Ferrand et du Laboratoire de Recherche sur le Langage (LRL). Le travail s’effectue avec partenariat européen sur la TEI (groupe d’annotation TEI-CMC) avec relation avec l’infrastructure DARIAH. Ce noyau de corpus sera intégré au futur « Corpus de référence du français ». Le projet a reçu l’appui de Corpus-écrits et de Ortolang.