PangeaMT – ¡Nuestra propia gama de soluciones MT!

PangeaMT es la división de tecnología de la traducción exclusiva de Pangeanic, con un claro enfoque en la traducción automática (MT, en sus siglas inglesas) personalizada y para campos específicos del conocimiento.

Como proveedor de servicios lingüísticos mediante tecnologías abiertas y con miras al futuro, Pangeanic gana en 2007 un contrato de postedición para trabajar para la Comisión Europea como posteditor de MT. En ese momento es cuando nos familiarizamos con las necesidades institucionales de los usuarios y volvemos a evaluar varios productos de MT comerciales que habíamos utilizado anteriormente. En poco tiempo decidimos desarrollar nuestra propia tecnología de MT.

Ahora somos fervientes seguidores del paradigma de MT estadística y, por tanto, PangeaMT, nuestra gama de soluciones de MT, está basado en traducción automática estadística y Moses. Sin embargo, hemos podido superar algunas de las limitaciones de Moses. Nuestras soluciones van más allá de las MT basadas en texto y son capaces de admitir y producir material en estándares de la industria, como TMX y XLIFF. La utilización de estándares abiertos implica no volver a adquirir jamás costosos programas de software de memorias de traducción. Nuestras soluciones evitan que se quede atrapado con un software año tras año debido a caras actualizaciones.

Otro gran avance de PangeaMT es nuestro analizador de código de etiquetaje intralineal. Los sistemas de traducción automática estadística producen normalmente material en texto plano porque es, además, el único formato que pueden procesar. No obstante, estamos ansiosos por ver las soluciones de PangeaMT en pleno uso y adaptadas a los requisitos más exigentes de la industria lingüística. Hemos centrado nuestros esfuerzos en el desarrollo de motores de traducción automática estadística capaces de manejar codificaciones intralineales, típicas de otros formatos de contenido utilizados en los entornos de producción de localización. Gracias a este analizador de código, PangeaMT puede identificar intralíneas (inlines) sin intentar traducirlas, colocándolas además en el texto resultante. Un marcador intralineal actúa primero copiando y transfiriendo toda la información XML y de código en un módulo independiente. El motor de traducción hace su trabajo y, a continuación, coloca la intralínea de nuevo en el segmento traducido. Desde nuestro punto de vista, nuestro analizador de código intralineal constituye una importante innovación en comparación con el nivel actual de madurez de los conocidos sistemas de traducción automática estadística.

Seguimos aprendiendo y mejorando con cada desarrollo encargado por clientes, tanto actuales como nuevos, y las distintas combinaciones lingüísticas. Por tanto, estamos abiertos a la aplicación de nuevas técnicas (hibridación) que investigamos e implementamos nosotros mismos o que podríamos desarrollar junto con otros. Somos conscientes del hecho de que para algunas combinaciones lingüísticas será necesario contar con ciertas técnicas lingüístico-informativas que formarán parte de las fases de pre- y post-procesamiento. Lograr el correcto reordenamiento de palabras y frases en el texto de salida de una traducción automática no es una tarea sencilla, especialmente cuando los idiomas en cuestión no están lingüísticamente emparentados o cuando uno de los dos tiene un orden de palabras realmente flexible y, por tanto, representa todo un reto para la MT. Podrían ser necesarios arreglos específicos para cada idioma. En algunos casos, podría ser útil utilizar un idioma como pivote para entrenar motores en idiomas realmente cercanos. Estas y otras técnicas podrían utilizarse o tomarse como base para la expansión de nuestra gama de soluciones de PangeaMT.

Nuestras soluciones y nuestra división de PangeaMT se han tratado y presentado en multitud de eventos de la industria GILT (globalización – internacionalización – localización – traducción).

Visite nuestro otro sitio web para aprender más acerca de PangeaMT. ¡Gracias por su interés!

Next time you think languages, think Pangeanic