Veuillez choisir le dossier dans lequel vous souhaitez ajouter ce contenu :
Filtrer les résultats
Tirer parti de la masse grandissante de textes disponibles sur la toile constitue un enjeu tant universitaire qu'industriel. Dans cette présentation, nous proposons un tour d’horizon des travaux en extraction ouverte d’information, en prenant soin d’en montrer les limites. Nous décrivons ensuite des scénarios d’utilisation de ces technologies pour les sciences humaines. Nous nous appuyons sur une expérience réalisée au RALI dans laquelle l’information extraite de Wikipédia a été mise à profit pour étiqueter des entités extraites de la base documentaire d’Érudit.
L'extraction automatique de connaissances à partir de données textuelles en partie structurées trouve un nombre croissant d'applications comme l'aide interactive au furetage de grande collections de documents, le recensement d'informations implicites dans les textes ou encore la réponse à des questions complexes. Dans cette présentation je compte décrire des chaînes de traitement développées par la communauté du traitement des langues et proposer des scénarios possibles de leur intégration dans une plateforme de furetage interactive dédiée à Érudit. La première étape de cette réalisation consiste à construire une base de connaissances sous la forme d'une (large) collection de triplets <sujet,relation,prédicat> à …