16/09/2014 - Eva Martínez - Document-Level Machine Translation as a Re-translation Process

Title Document-Level Machine Translation as a Re-translation Process
Speaker Eva Martínez
Room Omega-S208 Campus Nord - UPC
Date To be confirmed
Time 11:00h
Abstract

Most of the current Machine Translation systems are designed to translate a document sentence by sentence ignoring discourse information and producing incoherencies in the final translations. In this paper we present some documentlevel-oriented post-processes to improve translations coherence and consistency. Incoherences are detected and new partial translations are proposed. The work focuses on studying two phenomena: words with inconsistent translations throughout a text and also, gender and number agreement among words. Since we deal with specific phenomena, an automatic evaluation does not reflect significant variations in the translations. However, improvements are observed through a manual evaluation.

Slides  

23/09/2014 - Ahmed Guessoum - Research Work on Arabic Language Processing at the TALAA Research Group

Title Research Work on Arabic Language Processing at the TALAA Research Grou
Speaker Ahmed Guessoum
Room Omega-S208 Campus Nord - UPC
Date Tue Sep 23, 2014
Time 11:00h
Abstract

The main points I would be developing will be:

  • Corpus Building
  • Arabic POS-Tagging
  • Arabic Information Extraction
  • Development of an Arabic Grammar
  • Automatic Induction of Arabic Grammar
  • Text Summarization
  • Machine Translation
Slides  

26/06/2014 - Josu Boldoba - Explotación de Wikipedia para el enriquecimiento de un traductor automático

Title Explotación de Wikipedia para el enriquecimiento de un traductor automático
Speaker Josu Boldoba
Room Omega S-208 Campus Nord - UPC
Date Thu Jun 26, 2014
Time 11:00h
Abstract

Presentaré el trabajo desarrollado en el marco de mi proyecto final de carrera. Discutiré el proceso de explotación de Wikipedia para el desarrollo de traductores automáticos entre inglés y castellano. Dicho proceso incluye (1) la generación de corpus comparables de áreas temáticas específicas a partir de artículos de Wikipedia; (2) la extracción de corpus paralelos a nivel de oraciones a partir de corpus comparables y (3) la utilización de dichas oraciones paralelas para enriquecer un traductor automático. Además de los métodos utilizados, discutiré los resultados obtenidos en cada etapa y expondré futuras líneas de investigación.

Bio Josu Boldoba (A Coruña), se estableció en Barcelona para realizar los estudios de Ingeniería en Informática en la FIB en 2006. Entre 2008 y 2011 compaginó sus estudios con actividades laborales en distintas empresas. Cabe destacar su participación en la empresa GTD, entre 2012 y 2014, en la que participó en proyectos del Centre National d'Études Spatiales (CNES, Francia). En 2014 ha trabajado bajo la supervisión de investigadores del Talp Research Center en tareas de procesamiento de lenguaje natural y recuperación de información.

Subcategories

  • Join us

    Job Offers and Research Positions

  • Awards

    Scientific awards Best: Publications, Thesis, Demos, ...

  • Seminars

    Framework to promote research related with Natural Language Processing or Speech Processing.

  • Thesis

    TALP PhD dissertation

  • Events

    Information about Courses, Conferences, workshops, talks, ...

  • Call For Papers

    Relevant Conference, workshops or special issues call for papers announcement

  • Relevant Publications
  • Members

    Professors, students and colaborators visiting TALP.

    New members incorporation and former members carreer.

  • Projects

    TALP research and innovation projects

  • Press

    Selected articles and reports about the TALP Research Center taken from the international press

  • Formation

Additional information