Veuillez choisir le dossier dans lequel vous souhaitez ajouter ce contenu :
Filtrer les résultats
Nous présentons dans cet article une méthode de construction de lexiques bilingues pour les entités nommées basée sur les corpus parallèle. Les types des entités nommées étudiées sont les noms de personnes, des lieux et des organisations. Une application est faite sur la paire de langues anglais-arabe.La construction des lexiques des entités nommées de type organisation se base sur différentes ressources linguistiques dont les ontologies comme DBPedia ou des listes préétablies comme JRC-Names.La construction des lexiques des entités nommées de type noms de personnes et lieux, se base sur un modèle de translitération pour chaque entité nommée à partir de …
Ce projet de recherche concerne l’exploitation de wikipédia comme étant une ressource semi-structurée de connaissances linguistiques et en particulier comme étant un corpus comparable, pour l'extraction de terminologie bilingue.L'approche tend à extraire d’abord des paires de terme et traduction à partir de types des informations, liens et textes de Wikipédia. Une deuxième approche basée sur l’information linguistique, afin de ré-ordonner les termes et leurs traductions pertinentes et ainsi éliminer les termes cibles inutiles, est utilisée.Les évaluations préliminaires utilisant les paires de langues français-anglais, japonais-français et japonais-anglais ont montré une bonne qualité des paires de termes extraits. Cette étude est très …