Guardiola no es el único que habla de feeling estos días, tras quitarse de un plumazo a Etoo. La semana pasada leí por lo menos tres o cuatro artículos sobre Sentiment Analysis, uno en el New York Times, otros dos en El Pais, La red comercializa tus sentimientos y Mi empresa vigila atentamente tu blog, etc..Es evidente que el rollito de extraer feelings de datos en Internet está de moda. Software que no solo monitoriza, sino interpreta y te dice que es lo que la web social dice de ti y tus productos. Pero ojo, esto no es nuevo, Autonomy sin ir mas lejos lleva hablando de Meaning-Based Computing por lo menos cuatro años…
Luego hoy me despierto con el ultimo post del blog de Colbenson, que habla del proyecto de clasificación automática de incidencias y tras conversar con las personas del equipo técnico sobre los retos que han tenido que superar para lograr indices altos de éxito, me han venido a la cabeza todos estos articulos más las conversaciones que he mantenido en distintos foros (en el blog de Netoraton, K-Government, Estrategia Digital, Busqueda Empresarial, etc..) sobre la “extracción” de significado o la capacidad de interpretar un pedazo de texto e inferir un “sentimiento” que el software tiene a día de hoy.
Entiendo y respeto que cada cual tiene su perspectiva sobre el tema. Mi visión desde un prisma técnico, tras unos cuantos años como consultor en proyectos de procesado de texto no estructurado, como son los de búsqueda, categorización y personalización de información, es que se está avanzando mucho pero aun es sumamente complejo automatizar procesos que “entiendan” el significado de un texto y realicen acciones sobre el mismo de manera desatendida. Esto por supuesto no quiere decir que este tipo de proyecto no deba abordarse, sino todo lo contrario, todo lo que quiero decir es que aun debemos de contemplar escenarios donde los procesos automáticos de extracción de sentido de un texto deben ser supervisados y analizados por personas expertos en la materia. Me preguntaban el otro día en uno de estos debates, ¿que es mejor un analista con una herramienta de “sentyment analysis” o sin ella? pues verdaderamente la respuesta no es sencilla, si la herramienta es muy muy muy buena, no hay duda! pero si en cambio el analista se va a pasar más tiempo ordenando y desordenando ideas dentro de la herramienta quizás hubiese ahorrado su tiempo observando de manera manual las 10-15-20 fuentes que desea monitorizar y extraer sus propias conclusiones.
A ver, como apasionado de las tecnologías que soy, está claro que yo tiro por investigar, diagnosticar y personalizar algún producto hacia las necesidades de una empresa, bien sea para clasificar incidencias o para determinar el sentido o efecto que una campaña de marketing ha tenido en las redes sociales, pero simplemente quiero advertir del peligro que estos proyectos contraen si la percepción del cliente no es la idónea a la hora de asumir expectativas.
He participado en proyectos donde un planteamiento de categorización mediante procesos manuales de clasificación han dado muy buenos resultados, al igual que hemos aplicado con exito procesos no supervisados de clasificación mediante métodos como la extracción de entidades y otras técnicas semánticas y probabilísticas de aprendizaje y entrenamiento de textos, que han arrojado grandes resultados. Como dato anecdótico este caso (via the Noisy Channel de mi amigo Daniel Tunkelang, experto americano en búsqueda y procesado de información) “Netbase Thinks You Can Get Rid Of Jews With Alcohol And Salt”. Puede resultar gracioso ver como una regla semnatica nos dice que ser Judio es una causa de sida que se cura con alcohol y sal, pero creedme, este tipo de “cagadas” las he vivido en más de una ocasión: el lenguaje y su evolución son impredecibles, en algunos casos podemos llegar a semi-estructurar texto, pero hablar de extraer el sentimiento de un texto mediante reglas y métodos semánticos es sumamente ambicioso.
Si alguien me demuestra lo contrario, le seré eternamente agradecido, puesto que hay un gran business detrás de todo este mundo, tal y como el New York Times y el Pais se han lanzado a proclamar.





6 comentarios to '¿podemos extraer el feeling de un pedazo de texto sin leerlo?'
7, septiembre, 2009
[...] ¿podemos extraer el feeling de un pedazo de texto sin leerlo? — Buscar, sugerir y personalizar local.encontrabilidad.org/2009/09/07/%C2%BFpodemos-extraer-el-feeling-de-un-pedazo-de-texto-sin-leerlo – view page – cached Guardiola no es el único que habla de feeling estos días, tras quitarse de un plumazo a Etoo. La semana pasada leí por lo menos tres o cuatro artículos sobre Sentiment Analysis, uno en el New York Times, otros dos en El Pais, La red comercializa tus sentimientos y Mi empresa vigila atentamente tu blog, etc..Es evidente que el rollito de extraer feelings de datos en Internet está de moda. Software que no solo monitoriza, sino interpreta y te dice que es lo que la web social dice de ti y tus productos. Pero ojo, esto no es nuevo, Autonomy sin ir mas lejos lleva hablando de Meaning-Based Computing por lo menos cuatro años… — From the page [...]
7, septiembre, 2009
Estoy de acuerdo: me encanta que hay gente siguiendo el proyecto “sumamente ambicioso” de automaticamente comprender el idioma humano natural, pero hoy podemos optimizar la interaction entre el ser humano y la computadora usando las capacidades de los dos.
7, septiembre, 2009
Me sumo a este debate y lo hago enfatizando otro reto para el Sentiment Analyisis:
El reto no es interpretar el sentido de un conjunto de textos, ni formular estrategias que tomen esto en consideración, el verdadero reto, es que para poder ver la efectividad de dichas estrategias, para poder medirlas, es preciso volver a conducir otra vez Sentiment Analysis!
Pretender interpretar el sentido de las opiniones no es solución al requisito obvio de dominar el medio, no es solución, por muchos motivos, tecnológicos sobre todo, pero ante todo porque es una solución demasiado evidente.
8, diciembre, 2009
Hola Borja,
Me ha alegrado ver tu post, no puedo estar más de acuerdo. Hoy en día las herramientas aún no parecen maduras para poder extraer sentimientos. En muchas ocasiones es mejor tener a un par de analistas con una lista de urls relevantes, y que ellos clasifiquen los comentarios según un criterio homogéneo. No solo es más efectivo, sino que pueden extraer muchos más matices.
Un saludo,
Pedro Máiquez
7, septiembre, 2009
estamos todos de acuerdo, sentiment analysis si, pero supervisado por un analista http://bit.ly/sp5A9
This comment was originally posted on Twitter
7, septiembre, 2009
@mikelodeon creo que este debate sobre extraer significado al texto te puede interesar ;) http://bit.ly/OBQfc
This comment was originally posted on Twitter
Deja un comentario