Conseguir que el buscador de tu canal online sea relevante, es decir que los usuarios encuentren lo que buscan y el negocio logre conversión bottom-line no es una tarea banal. Ni siquiera es una cuestión tecnológica. La clave para mejorar la conversión de las búsquedas es de método.
A continuación presentamos 5 buenas prácticas para lograr mejorar la relevancia de tu buscador:
1) Mejorar calidad de datos: Blanco y en botella. Un buscador nunca funcionará de manera óptima si los datos no tienen una calidad aceptable. Es fundamental trabajar sobre (a) normalización estructura datos y procesos publicación (p.ej. formar a publicadores sobre etiquetado contenidos) y (b) enriquecimiento de datos mediante técnicas de analítica de texto y detección de entidades.
2) Adaptar búsquedas populares a negocio: El primer paso para mejorar la conversión es trabajar sobre el cuello de la larga cola: las búsquedas más populares las cuales dependiendo del sector, suelen rondar en horquilla de 60%-40% hasta 80%-20%, es decir el 80% de las búsquedas ocurren con el 20% de los términos. La práctica más extendida en este caso es la utilización de enlaces destacados y sinónimos mediante la figura de un administrador del buscador (i.e. Search Manager): detecta las búsquedas más populares y asigna enlaces y sinónimos a dichos keywords.
3) Adaptar búsquedas fracasadas a negocio: El siguiente paso es el de introducir nuevos indicadores que detecten cuales son las búsquedas con baja conversión, las que fracasan: (a) 0 resultados (b) alto grado de paginación (c) abandono y (d) re-búsqueda. Una vez se detectan se pueden corregir de múltiples formas, entre ellas mediante uso de sugerencias auto-suggest, enlaces destacados, búsqueda por facets, búsquedas relacionadas, etc…todas ellas lideradas por la figura del Search Manager.
4) Adaptar búsquedas fracasadas a comportamiento usuarios | Behavioural Data Driven Search: Bien, aquí empieza la cosa a ponerse interesante. Una vez que tenemos procesos de monitorización de búsquedas fracasadas, debemos buscar mecanismos para detectar posibles candidatos a esas búsquedas, pero no mediante “negocio” (i.e. Search Manager) sino mediante comportamiento de usuarios. Es decir, una práctica que se está extendiendo en este campo es la detección de contenidos con altos niveles de CTR y de engagement (i.e. duración en página, porcentajes de rebote, scroll, acciones sobre contenidos como añadir a carrito, votar, recomendar, etc..) y el posicionamiento de los mismos en el ranking orgánico y como enlaces destacados. Esta práctica funciona fenomenal puesto que automatiza muchas tareas hasta día de hoy manuales y principalmente porque adapta el buscador continuamente a las patrones de búsquedas y pautas de consumo de los usuarios. El buscador que aprende solo…esto lo habíais escuchado antes verdad?
5) A/B Testing: Cada día más extendida en optimización de ranking en buscadores. Las búsquedas con baja conversión exponen diferentes sets de resultados según grupos de usuarios representativos. Es recomendable aplicar este método de manera esporádica y controlada sobre sub-sets de usuarios y franjas horarias con altos niveles de tráfico, para poder analizar datos significativos “estadísticamente” sobre los modelos de ranking testeados.
Como veréis la tendencia tiende hacia “socializar” la relevancia y continuamente adaptarla hacia los patrones de búsqueda de los usuarios. Es importante promocionar contextualmente una campaña con el buscador, pero ¿que pasa si nadie pincha sobre ella?
Al final la relevancia no es lo que uno piensa que un buscador debería ofrecer, sino lo que los usuarios deciden pinchar tras una búsqueda. La métrica dicta lo que es relevante, no el equipo de Marketing (por lo menos directamente como hasta ahora).
¿Tenéis alguna otra recomendación? ¿alguna técnica de mejorar un buscador que funcione y no hayamos tocado en este post?
Si el año pasado apostamos por un 2010 donde los sistemas de recomendación y entrega de información serían el eje en la evolución de los patrones de Encontrabilidad, para el 2011 pronosticamos un escenario donde el dato cobra vida alimentándose y disolviéndose con el comportamiento cada vez más conocido de sus usuarios.
Instant Search ha sido sin lugar a la más mínima duda el gran hito en términos de experiencia de consumo de información, un ejemplo perfecto del impacto de la personalización y un hito histórico en términos de Encontrabilidad que el 2010 nos ha dejado.
Instant Search recrea un acercamiento inmediato de la información al usuario, anticipando paquetes de información antes de que sean demandados de tal forma que llegado el momento de petición ya están ahí.
Me recuerda a una anécdota que una amiga de un hotel de gran lujo me contó sobre Tom Cruise, cuyo deseo era tener un Capuchino en la puerta de su habitación recién hecho independientemente de a que hora se levantara, de tal modo que a cada 2 minutos subían un Capuchino, y bajaban el anterior hasta que Mr. Cruise abría la puerta y recogía su Capuchino recién hecho sin necesidad de pedirlo.
Poco a poco y de forma previsiblemente creciente durante el 2011, los usuarios seremos personas cada vez más “conocidas” para las fuentes online de consumo.
Nunca antes había sido posible evidenciar el perfil de una persona tras unas pautas de uso online con tanta fidelidad, nunca había sido posible geo-referenciar a tantos usuarios en tantos hábitos de consumo, nunca antes habíamos dispuesto de tanta riqueza de opinión sobre productos y servicios, nunca antes cientos de millones de personas habían compartido de forma abierta y continuada sus sentimientos, sus gustos e incluso sus sueños.
Todo esto es el caldo de cultivo ideal para que los datos cobren vida propia, nutriéndose insaciablemente y colmando con mayor efectividad nuevas experiencias que permitan alcanzar los más altos niveles de satisfacción de usuario.
Hace tan sólo 3 ó 4 años un usuario consumiendo cual quiera que sea el producto, servicio o información online, era un extraño, un forastero desconocido visitando un hostal de carretera. Hace 2 ó 3 años comenzó a ser un cliente previsible y agrupable en pautas comunes de un Holiday Inn mientras que hoy en día y en cada vez más escenarios es posible conocer y cruzar infinidad de detalles que permiten anticipar todo tipo de intenciones como si de un hotel de gran lujo y un cliente VIP se tratara.
Los grandes hitos que surjan durante el 2011 en términos de consumo de información, productos y servicios online se sustentarán precisamente en la creciente capacidad de prever las necesidades de los usuarios.
En las redes sociales como Twitter, Facebook o Linkedin encontramos el ejemplo ideal de esta pauta. Dichas redes cultivan datos que viven para recortar la distancia que separa a un perfil de un consumible.
Si en el 2010 los datos florecieron, en el 2011 se transformarán en árboles frutales de profunda raíz y jugosos frutos, ofreciendo posibilidades de negocio donde las mejores estrategias de búsqueda, procesado y enriquecimiento de información juegan un papel esencial al éxito.
La forma en la que buscamos información está cambiando. No solo están cambiando los sistemas y fuentes de información, sino que los propios dispositivos desde los que buscamos nos obligan a cambiar nuestros hábitos de búsqueda.
Todos seguimos siendo usuarios frecuentes de buscadores web genéricos como Google, pero cada vez más, descubrimos información mediante personas y no sistemas. Es decir, utilizamos nuestros contactos como filtradores de información. El PageRank ahora lo definimos nosotros en base a quien seguimos en nuestras redes. Pero el eje de esta entrada no es este tema en cuestión, el cual ya ha suscitado numerosas conversaciones en este blog, sino como están cambiando los hábitos de búsqueda en otros dispositivos, como por ejemplo los móviles, iPads, the “Internet of Things” etc..
Nuestra visión es que la búsqueda no se va a representar como hasta ahora, escribir termino en cajón y mostrar 10 resultados, sino que la búsqueda va a ser ubicua, va a estar presente en todos lados, tanto a nivel alto como buscador de aplicaciones, como dentro de las propias aplicaciones a nivel de contenido y de navegación.
A partir de ahora el propio texto que estés leyendo podrá ser utilizado para disparar nuevas acciones de búsqueda y recomendaciones. Ya no hace falta ir a Google, puedes buscar desde la propia noticia! En un iPad o en tu blackberry ir a Google requiere abrir un nuevo navegador, teclear la url, pegar el texto en el cajón, lanzar la búsqueda, revisar la página de resultados, etc..todo esto va a desaparecer mediante las nuevas formas de interaccionar con texto no estructurado.
Os enseño algunos ejemplos interesantes:
- Apture: Detecta entidades (personajes, lugares, organizaciones, canciones, libros, etc..) y crea mashups de datos.
- Dixio: Clickando sobre una palabra conseguimos saber su significado.
- HighlightClickconnect de Emantix & Connect: permite clickar o seleccionar cualquier pedazo de texto e hiper-vincularlo de diferentes maneras (búsquedas, links relacionados, etc..)
- Tynt: the Copy & Paste Company: Su servicio de pop-up, detecta cuando un texto copiado es susceptible de ser una intención de búsqueda y la lanza automáticamente.
Todos estos ejemplos son posibles principalmente gracias a los avances realizados en el campo de la minería, analítica y procesamiento de texto no estructurado (semántico & probabilístico), lo cual permite interpretar el significado de un pedazo de texto antes de ejecutar una acción, y también, no nos olvidemos, a los avances en experiencia de usuario, los cuales nos permiten interactuar con el texto en múltiples maneras en múltiples dispositivos, permitiendo nuevas experiencias de uso. En este hilo, recomiendo esta lectura sobre Pervasive Ubiquitous Design.
En resumen, las nuevas formas de buscar y de interactuar con texto ya están aquí! Con clickar sobre el texto ya podemos activar acciones de búsqueda, recomendaciones, etc…decid adiós al cajón de búsqueda tal y como lo conocéis hasta ahora!!
Los que nos dedicamos a esto de la busqueda empresarial debemos estar continuamente hablando de las diferencias entre un buscador de empresa (normalmente el buscador “interno” desde donde los empleados buscan en todos los sistemas de su empresa y/o el buscador “público” de su web corporativa) y un buscador web general como puede ser Google, Yahoo, Bing, etc.. Todos ellos empiezan con un cajón de búsqueda, pero poco más tienen en común.
En este sentido me ha gustado un post acerca de micro-IR (i.e. micro information retrieval). No voy a entrar en la parte teórica, pero me atrae el concepto de micro-IR como “the practice of farming information needs out across multiple applications”, es decir buscar información en fuentes y principalmente con intenciones predefinidas. En otras palabras buscadores de empresa, site search, buscadores verticales, buscadores de aplicaciones y dispositivos moviles, etc..Muchos os preguntareis que mas da! al final el buscador debe facilitar encontrar información bien sea en la web o en un sitio web de una empresa o gobierno. Pues no, cuando se pueden anticipar las intenciones de búsqueda de un usuario y tenemos unos datos con una estructura de meta-data particular, el buscador debe de adaptarse a estos patrones de acceso y orientar al usuario haciendo uso de determinadas herramientas como pueden ser filtros de navegación (faceted navigation), uso de tags y entidades de negocio, ranking personalizado etc.. Mucha gente en este mundillo engloban este tipo de busquedas como todo exploratory search.
En este sentido estoy totalmente de acuerdo con Daniel Tunkelang del blog The Nosiy Channel:
I feel that the distinction between macro- and micro-IR is in the same vein: micro-IR settings (e.g., site search, enterprise search,vertical search) drive needs for more richer interfaces and support for interaction, while macro-IR application developers (e.g., general web search) worry mostly about producing a reasonable answer for the query..
Guardiola no es el único que habla de feeling estos días, tras quitarse de un plumazo a Etoo. La semana pasada leí por lo menos tres o cuatro artículos sobre Sentiment Analysis, uno en el New York Times, otros dos en El Pais, La red comercializa tus sentimientos y Mi empresa vigila atentamente tu blog, etc..Es evidente que el rollito de extraer feelings de datos en Internet está de moda. Software que no solo monitoriza, sino interpreta y te dice que es lo que la web social dice de ti y tus productos. Pero ojo, esto no es nuevo, Autonomy sin ir mas lejos lleva hablando de Meaning-Based Computing por lo menos cuatro años…
Luego hoy me despierto con el ultimo post del blog de Colbenson, que habla del proyecto de clasificación automática de incidencias y tras conversar con las personas del equipo técnico sobre los retos que han tenido que superar para lograr indices altos de éxito, me han venido a la cabeza todos estos articulos más las conversaciones que he mantenido en distintos foros (en el blog de Netoraton, K-Government, Estrategia Digital, Busqueda Empresarial, etc..) sobre la “extracción” de significado o la capacidad de interpretar un pedazo de texto e inferir un “sentimiento” que el software tiene a día de hoy.
Entiendo y respeto que cada cual tiene su perspectiva sobre el tema. Mi visión desde un prisma técnico, tras unos cuantos años como consultor en proyectos de procesado de texto no estructurado, como son los de búsqueda, categorización y personalización de información, es que se está avanzando mucho pero aun es sumamente complejo automatizar procesos que “entiendan” el significado de un texto y realicen acciones sobre el mismo de manera desatendida. Esto por supuesto no quiere decir que este tipo de proyecto no deba abordarse, sino todo lo contrario, todo lo que quiero decir es que aun debemos de contemplar escenarios donde los procesos automáticos de extracción de sentido de un texto deben ser supervisados y analizados por personas expertos en la materia. Me preguntaban el otro día en uno de estos debates, ¿que es mejor un analista con una herramienta de “sentyment analysis” o sin ella? pues verdaderamente la respuesta no es sencilla, si la herramienta es muy muy muy buena, no hay duda! pero si en cambio el analista se va a pasar más tiempo ordenando y desordenando ideas dentro de la herramienta quizás hubiese ahorrado su tiempo observando de manera manual las 10-15-20 fuentes que desea monitorizar y extraer sus propias conclusiones.
A ver, como apasionado de las tecnologías que soy, está claro que yo tiro por investigar, diagnosticar y personalizar algún producto hacia las necesidades de una empresa, bien sea para clasificar incidencias o para determinar el sentido o efecto que una campaña de marketing ha tenido en las redes sociales, pero simplemente quiero advertir del peligro que estos proyectos contraen si la percepción del cliente no es la idónea a la hora de asumir expectativas.
Via este post del blog Jeff’s Search Engine Caffe doy con la presentación de Jeff Dean de Google en el pasado WSDM 2009 (Web Search & Data Mining) celebrado en Barcelona. Es muy técnica, habla mucho de como ha crecido Google en infraestructura desde el 1999 hasta el 2009. Habla de arquitectura de índices (docs + queries), encoding, sistemas de caché, crawling vs indexing, etc..Para todos los lectores “técnicos” en búsqueda & Information Retrieval recomiendo la lectura.
Como nota final, resaltaría tres de los challenges o retos que Jeff resalta:
1) Continuously improving translation quality & large-scale systems work to deal with larger and more
complex language models.2) Building retrieval systems that efficiently deal with ACLs that vary widely in size
3) algorithms/techniques for improved extraction of structured information from unstructured/semi-structured sources
Podeis ver el video completo de la presentación desde aquí.
Os suena todo esto verdad? Nosotros desde Colbenson, estamos trabajando muy duro en el punto 3 de extracción de entidades (el punto dos de gestionar la seguridad de los documentos ya lo controlamos gracias a la tecnología IDOL Server de Autonomy :)). El futuro de la búsqueda pasa por Exploratory Search el cual se respalda en entidades extraidas de información no estructurada.
Via el blog de Mark Logic doy con esta presentación de Christine Conners de Dow Jones, uno de los medios lideres en EEUU parte de News Corp, sobre el uso de tecnologías semánticas. En particular me gusta el modelo de enriquecimiento “semántico” de contenidos que propone: Asses > Design > Build > Maintain. Principalmente te viene a decir que comienzas por una architectura de la información con un esquema de atributos fijo, el cual se va enriqueciendo dinámicamente mediante la extracción de entidades (“indexación inteligente” que etiqueta nombres de lugares, personajes, categorías o nodos de taxonomías, etc), y cada día más con componenttes sociales como son comentarios, analítica de uso, etc…Esto refleja nuestro espíritu de que un contenido es el eje de una conversación que se enriquece de manera dinámica con todas las interacciones “sociales” que lo rodean.
¿No os resulta curioso que una editorial tenga una Directora de tecnologías semánticas?