Title
Explotación de Wikipedia para el enriquecimiento de un traductor automático

Speaker
Josu Boldoba

Room
Omega S-208 Campus Nord - UPC

Date
Thu Jun 26, 2014

Time
11:00h

Abstract

Presentaré el trabajo desarrollado en el marco de mi proyecto final de carrera. Discutiré el proceso de explotación de Wikipedia para el desarrollo de traductores automáticos entre inglés y castellano. Dicho proceso incluye (1) la generación de corpus comparables de áreas temáticas específicas a partir de artículos de Wikipedia; (2) la extracción de corpus paralelos a nivel de oraciones a partir de corpus comparables y (3) la utilización de dichas oraciones paralelas para enriquecer un traductor automático. Además de los métodos utilizados, discutiré los resultados obtenidos en cada etapa y expondré futuras líneas de investigación.

Bio
Josu Boldoba (A Coruña), se estableció en Barcelona para realizar los estudios de Ingeniería en Informática en la FIB en 2006. Entre 2008 y 2011 compaginó sus estudios con actividades laborales en distintas empresas. Cabe destacar su participación en la empresa GTD, entre 2012 y 2014, en la que participó en proyectos del Centre National d'Études Spatiales (CNES, Francia). En 2014 ha trabajado bajo la supervisión de investigadores del Talp Research Center en tareas de procesamiento de lenguaje natural y recuperación de información.

Scroll to Top