Actualizado el 19/11/2024

icon Facebook icon Twiiter icon RSS icon EMAIL
  1. Portada
  2. >
  3. Opiniones
  4. >
  5. “Sentiment analysis”: ¿Qué es, cómo funciona, para qué sirve?

“Sentiment analysis”: ¿Qué es, cómo funciona, para qué sirve?

Escrito por Jordi Vallverdú el 30/03/2011 a las 00:13:29
15703

Podemos definir el análisis sentimental (“Sentiment Analysis”) aplicado al mundo Web como el “tratamiento computacional de las opiniones, sentimientos y fenómenos subjetivos en los textos”.
Dicho de otro modo: a partir de la técnica computacional, un programa es capaz de entender, interpretar, discernir y traducir el significado (polaridad) de un texto digital haciéndolo operativo para su análisis y ordenarlo y clasificarlos en objetivo / subjetivo; y dentro de los subjetivos, en positivos o negativos.
 
 
Utilidad del análisis sentimental
 
 
El valor creciente que está adquiriendo el “Sentiment Analysis” viene determinado por las múltiples utilidades para la actividad de empresas y organizaciones en diferentes áreas pero especialmente en la de márketing y seguimiento de la presencia en internet, en los medios sociales.
Cada una de estas utilidades o aplicaciones aporta un valor añadido importante, Y en muchos casos mesurable.
 
 
Las técnicas y programas de análisis sentimental aplicados a las herramientas de monitorización de la red y los medios sociales representan una forma más rápida y eficiente que el trabajo “manual” que deben realizar los responsables de averiguar lo que se dice en internet con otro tipo de herramientas menos sofisticadas.
 
 
Dado el creciente rol de internet en todos los ámbitos y a la dificultad de hacer su seguimiento es normal que se haya ampliado el campo de utilización de estas herramientas a diferentes áreas de la empresa y de las organizaciones. De forma más intensiva en marketing y comunicación.
 
 
A modo de ejemplo: las empresas pueden seguir la valoración de sus productos/servicios por parte de sus clientes y usuarios. Evaluar el nivel de reputación de la compañía a partir de los comentarios de la red, conocer su nivel de posicionamiento y resonancia en los medios sociales, elaborar estrategias de marketing digital mucho más elaboradas y efectivas, etc...
 
 
Por parte de las organizaciones que no actúan en el ámbito económico, estas herramientas encuentran su aplicación por parte de formaciones políticas; instituciones y administraciones de gobierno. Dado su interés en monitorizar la información y opinión de ciudadanos y votantes en un medio tan nuevo como las plataformas de la red, pueden realizar seguimientos más afinados para conocer con mucho detalle los comentarios y opiniones que aquellos generan.
 
 
Estas implementaciones son las básicas y más inmediatas que se han aplicado. En la medida que el análisis semántico irá sofisticándose más amplio será el campo de aplicación. 
 
 
Y esto es obvio porque si ya desde sus inicios internet – el mundo web- se ha caracterizado por generar volúmenes de información imposibles de manejar, el incipiente mundo del análisis semántico contribuye a hacer más fácil su seguimiento.
 
 
La base técnica
 
 
Aunque no de forma generalizada, la mayoría de sistemas de “sentiment analysis” utiliza algoritmos basados en técnicas de “Machine Learning”. 
 
 
Este tipo de técnicas se caracterizan por trabajar mediante un extenso conjunto de textos –que conocemos como corpus – y que actúan como sistema de entrenamiento. Esto significa que, a partir de estos textos, el algoritmo es capaz de “aprender” a diferenciar el significado o polaridad de las opiniones y comentarios.
 
 
En el caso del “sentiment analysis”, los corpus de entrenamiento son previamente clasificados y ordenados entre positivos y negativos. El algoritmo los procesa y extrae patrones, probabilidades y estructuras del texto, que posteriormente utiliza para realizar el análisis sentimental de los textos.
Como ya comentamos, la mayoría de estos algoritmos hacen una clasificación binaria donde se suelen clasificar las opiniones en 2 categorias: positivas y negativas. 
 
 
Un ejemplo de este tipo de algoritmo lo encontramos con: Thumbs up?: sentiment classification using machine learning techniques (Pang et al.)
 
 
También encontramos algoritmos que van un paso más allá ya que realizan dos procesos: en un primer paso extraen las partes subjetivas y objetivas de forma separada.
 
 
Y es sobre las determinadas como subjetivas que se realiza el análisis para averiguar si su signo es positivo o negativo. 
 
 
Este sistema permite obtener mejores resultados facilitando, además, obtener de forma casi instantánea la categoría implícita de resultados neutrales (aquellos que no contienen opinión).
Un ejemplo de este tipo de algoritmo lo encontramos con: Sentiment Analysis Using Subjectivity Summarization Based on Minimum Cuts (Pang and Lee)
 
 
 
A los modelos de algoritmos anteriores que realizan un tipo de clasificación binaria, podemos añadir los que realizan una clasificación en forma de rango. En este caso los “corpus” utilizados se clasifican de acuerdo con una estructura de valor (por ejemplo de 1 a 5). El algoritmo es entrenado por los corpus correspondientes a cada rango y aplica esta tipología a los textos que analiza.
 
 
Un ejemplo de este tipo de algoritmo lo encontramos con: Seeing stars, exploiting class relationships for sentiment categorization with respect to rating scales (Pang and Lee).
 
 
Retos y dificultades técnicas
 
 
El nivel de precisión y fiabilidad alcanzado por las técnicas de análisis semántico se sitúa en la actualidad, en torno al 80%. 
 
 
¿Dónde se hallan las principales dificultades desde el punto de vista técnico?
El lenguaje textual no es matemático. Los significantes no siempre corresponden a los significados. Podemos encontrar textos claramente negativos sin la utilización de una sola palabra negativa, y viceversa. 
 
 
Por ejemplo: “el director ha conseguido superarse a sí mismo una vez más y nos ha brindado una experiencia que difícilmente olvidaremos” Aparentemente positiva pero puede ser perfectamente negativa o muy negativa. 
 
 
El lenguaje es maleable. Puede ser ambiguo, confuso, impreciso. La utilización de metáforas y expresiones de ironía son difíciles de procesar. De una secuencia de palabras no se desprende un resultado unívoco. De ahí su riqueza. 
 
 
Existe un contexto que determina y condiciona los comentarios y opiniones. Una voluntariedad e intención en el que escribe, y sobre todo, mucha subjetividad. 
Por ejemplo: Si en el contexto de un comentario sobre películas encontramos “cómprate el libro”, más que probablemente es un comentario negativo en referencia a la película objeto del comentario.
 
 
Este es el reto para las técnicas del “sentiment analysis”: crear fórmulas para analizar cada vez con menor margen de error los significados de los comentarios. Saber trabajar en los contextos y entender cada vez mejor las estructuras.