Servicio de análisis de frases con FreeLing

textanalysisHace tiempo os mostramos como montar el sistema de análisis de frases FreeLing en un sistema Unix y utilizarlo con la API para Java. Hoy os traemos un nuevo servicio REST de nuestra Web para realizar este análisis sin necesidad de tener montado el sistema. La idea surge de la necesidad de realizar análisis de las frases de manera rápida y desde cualquier lugar. El uso de este servicio no está necesariamente dirigido a la investigación, cualquier persona que necesite obtener que elementos componen una frase, cual es el sentido más probable de una palabra que tiene varios sentidos (ambigua) dentro del contexto de la frase o simplemente por sacar mejores notas en lenguaje, puede utilizarlo.

El objetivo es ofrecer una herramienta para el análisis de frases de fácil uso y que pueda servir para todo aquel que necesite, de alguna manera, analizar frases. En la web oficial de Freeling existe un demostrador de la herramienta para que podáis ver todo el potencial que posee. Nuestro servicio está montado sobre la versión de SVN de FreeLing, utiliza Wordnet 3.0 para la desambiguación de los elementos y también ofrece un sistema de traducción de los términos EAGLE para no tener que buscar exactamente qué significa cada elemento. El servicio REST devuelve un JSON con los análisis que, en principio, nosotros hemos necesitado en nuestras investigaciones. Además, también hemos realizado un cliente en Java que hemos dejado en github para que cualquier persona interesada pueda utilizarlo.

Un ejemplo de los resultados que ofrece con el cliente que hemos publicado es el siguiente:
Frase: ME GUSTA LA LECHE. [size:5]

Terna:ME
que es:PP1CS000
que es para humanos:PRONOMBRE
palabra raiz:ME
tipo:PERSONAL
persona:PRIMERA
genero:COMUN
numero:SINGULAR
caso:DESCONOCIDO
poseedor:DESCONOCIDO
cortes:DESCONOCIDO
estructura chunk: [grup-verb][patons][paton-s]

Terna:GUSTA
que es:VMIP3S0
que es para humanos:VERBO
palabra raiz:GUSTAR
tipo:PRINCIPAL
persona:TERCERA
genero:DESCONOCIDO
numero:SINGULAR
tiempo:PRESENTE
modo:INDICATIVO
sentidos:Experience-Mental
WSD:01777210-v
estructura chunk: [grup-verb][grup-verb][verb]

Terna:LA
que es:DA0FS0
que es para humanos:DETERMINANTE
palabra raiz:EL
tipo:ARTICULO
persona:DESCONOCIDO
genero:FEMENINO
numero:SINGULAR
poseedor:DESCONOCIDO
estructura chunk: [grup-verb][sn][espec-fs][j-fs]

Terna:LECHE
que es:NCFS000
que es para humanos:NOMBRE
palabra raiz:LECHE
tipo:COMUN
genero:FEMENINO
numero:SINGULAR
sentidos:Comestible-Liquid-Natural-Substance
WSD:07844042-n
estructura chunk: [grup-verb][sn][grup-nom-fs][n-fs]

Terna:.
que es:FP
que es para humanos:MARCAPUNTUACION
palabra raiz:.
estructura chunk: [grup-verb][F-term]

Como puede verse, da bastante información útil acerca de los términos desambiguados (códigos de Wordnet 3.0) así como del papel que desempeña el elemento dentro de la Frase. Una cosa más, este servicio, en principio, está pensado para investigaciones y pruebas. El mantenimiento lo hacemos nosotros mismos en nuestros ratos libres por lo que si os encontráis con que deja de funcionar o no responde, os agradeceríamos que nos lo dijerais para intentar solucionarlo.

Esperamos que este nuevo servicio os sirva en vuestras investigaciones.

Patxi Galan García
Acerca de
Investigador de S3lab
Expertise: Natural Language Processing, Android, Cyberbullying

Deja un comentario

Tu dirección de correo electrónico no será publicada.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.