Veuillez choisir le dossier dans lequel vous souhaitez ajouter ce contenu :
Membre a labase
Erick Velazquez-Godinez : École de technologie supérieure
Lorsque vient le moment de suivre un évènement dans le détail, le lecteur attentif de l’actualité n’a plus le choix ; il doit sélectionner les sources d’information qu’il veut privilégier. L’information est là et partout, en plusieurs langues et s’exprimant au travers de multiples points de vue. Cette disparité dans le traitement crée ce que l’on pourrait appeler des trous informatifs qu’il est impossible de combler sans lire l’ensemble de ce qui s’est écrit sur le sujet. Notre méthodologie comporte quatre étapes : la construction du corpus documentaire de manière semi-automatique, l'alignement des sources, l'identification des trous informationnels, la visualisation et la validation des résultats. Notre corpus de travail est construit en utilisant des modèles probabilistes qui permettent de dégager les documents, rédigés en français et en anglais, relatant les mêmes faits historiques. L'alignement des sources s'effectuent après avoir encodé les textes dans une structure de graphes qui, une fois projetée dans un espace de moindre dimension, permettra à l'utilisateur d'identifier les couvertures médiatiques semblables et distinctes, ces dernières venant ainsi combler les trous informatifs. La visualisation résultante sera validée auprès d'experts. Ce projet contribue à donner aux utilisateurs le potentiel d'innover en étant à même d'appréhender toute la richesse de nos sources documentaires afin de mieux les explorer et, par le fait même, de les étudier.
Thème du communication :
Domaine de la communication :