El mercado de Enterprise Search se ha transformado, ha cambiado definitivamente. El proyecto de buscador corporativo como lo conocíamos ha dejado de ser un proyecto estratégicamente clave dentro de la empresa, ahora la estrategia de búsqueda, analítica y procesado de datos corporativos se ha convertido en el caballo de batalla de toda organización que quiera ser competitiva. Lo importante no es ofrecer una pagina con 10 resultados, ahora se trata de empujar el contenido a los clientes y empleados según sus intereses, bien sea a través de un cajón de texto libre o bien sea según la navegación, perfil, departamento, histórico de compras, grupo de contactos, etc.. del usuario en cuestión.

Los proyectos de búsqueda son ahora mucho más especializados. El foco de los proyectos ha dejado de ser la tecnología, ahora todo se enfoca en la experiencia de usuario y en generar valor bottom-line (incrementar ventas, conversión campañas, minimizar costes atención usuario, etc..). Los que nos dedicamos a este mundillo de la búsqueda y procesado de datos estamos de enhorabuena, entramos en una fase llena de nuevos retos y oportunidades:
- El concepto Enterprise Search está caduco. El reto de las empresas ya no es poder buscar en sus múltiples repositorios de información, sino procesar datos para que sean más encontrables, accesibles, contextualizables y personalizables a su negocio y sus clientes.
- El mercado de búsqueda Empresarial se ha fragmentado. Por un lado los big players (Microsoft Fast, Autonomy, IBM, etc..) se están posicionando fuertes en proyectos Enterprise de plataforma integral de datos (ECM + DCM+ Business Intelligence + Search…) y por otro lado vemos mucha diversificación y especialización de otras empresas con productos verticales para eCommerce, Medios, eDiscovery, etc, y horizontales como Customer Service, sistemas de recomendación, personalización, etc.
- Como consecuencia de esta fragmentación de mercado Gartner ha decidido eliminar el Magic Quadrant para Enterprise Search y ahora produce un simple MarketScope. Esto ha dado mucho que hablar, recomiendo la lectura de este debate en el grupo de LinkedIn de Enterprise Search.
- La tecnología ha dejado de ser un diferenciador en los proyectos de búsqueda. La gran mayoría de fabricantes ofrecen las mismas funcionalidades en sus productos, los cuales son ya casi una “commodity”. El factor de éxito de un proyecto de búsqueda no es la tecnología sino los conocimientos del integrador y su capacidad para sacar el máximo rendimiento al producto y saber adaptarlo al negocio (datos corporativos vs expectativas usuarios).
“ The other side of the argument was that companies are no longer will to pay big money for key word retrieval.” Stephen Arnold, Beyond Search, “Enterpire Search: Baloney Six Ways, like Herring”
-Las empresas ya no están dispuestas en invertir entre 200.000 y 500.000€ en implantar un buscador corporativo para que devuelva un listado de 10 resultados. Las tres grandes empresas en este área (Microsoft Fast, Autonomy y Endeca) ya lo han notado en sus cuentas de resultados y buscan nuevos nichos.
- La irrupción de tecnología de búsqueda Open Source ha sido espectacular, una autentica revolución, y ha actuado como un gran catalizador de cambios en el mercado de ES. La estabilidad, madurez y adaptabilidad de esta tecnología ha hecho que muchas empresas se hayan decantado por sustituir su actual plataforma de búsqueda sobre software comercial por soluciones libres como Lucene/Solr (The Guardian, Biblioteca Nacional, etc).
- Por otro lado, la diversificación del mercado ha propiciado una nueva ola de productos Open Source empaquetizados y especializados como LucidWorks Enterprise, SearchBroker, etc.
- Open Source Search no es futuro, sino presente. Analistas como IDC así lo advierten. La propuesta de valor de soluciones abiertas de búsqueda son principalmente “ rapid time-to-market, high-level functionality, flexibility and customization, low entry-level cost”. Lo curioso es que no es una cuestión puramente económica: las empresas no solamente están cansadas de incurrir en gastos de licencias, sino que demandan transparencia, escalabilidad y una comunidad con la cual compartir experiencias para adaptar dicho sistema a sus necesidades.
En el siguiente post de la mutación del Enterprise Seacrh hablaremos de la ubicuidad del buscador dentro de la empresa, y de los proyectos en los que se emplea.
La forma en la que buscamos información está cambiando. No solo están cambiando los sistemas y fuentes de información, sino que los propios dispositivos desde los que buscamos nos obligan a cambiar nuestros hábitos de búsqueda.
Todos seguimos siendo usuarios frecuentes de buscadores web genéricos como Google, pero cada vez más, descubrimos información mediante personas y no sistemas. Es decir, utilizamos nuestros contactos como filtradores de información. El PageRank ahora lo definimos nosotros en base a quien seguimos en nuestras redes. Pero el eje de esta entrada no es este tema en cuestión, el cual ya ha suscitado numerosas conversaciones en este blog, sino como están cambiando los hábitos de búsqueda en otros dispositivos, como por ejemplo los móviles, iPads, the “Internet of Things” etc..
Nuestra visión es que la búsqueda no se va a representar como hasta ahora, escribir termino en cajón y mostrar 10 resultados, sino que la búsqueda va a ser ubicua, va a estar presente en todos lados, tanto a nivel alto como buscador de aplicaciones, como dentro de las propias aplicaciones a nivel de contenido y de navegación.
A partir de ahora el propio texto que estés leyendo podrá ser utilizado para disparar nuevas acciones de búsqueda y recomendaciones. Ya no hace falta ir a Google, puedes buscar desde la propia noticia! En un iPad o en tu blackberry ir a Google requiere abrir un nuevo navegador, teclear la url, pegar el texto en el cajón, lanzar la búsqueda, revisar la página de resultados, etc..todo esto va a desaparecer mediante las nuevas formas de interaccionar con texto no estructurado.
Os enseño algunos ejemplos interesantes:
- Apture: Detecta entidades (personajes, lugares, organizaciones, canciones, libros, etc..) y crea mashups de datos.
- Dixio: Clickando sobre una palabra conseguimos saber su significado.
- HighlightClickconnect de Emantix & Connect: permite clickar o seleccionar cualquier pedazo de texto e hiper-vincularlo de diferentes maneras (búsquedas, links relacionados, etc..)
- Tynt: the Copy & Paste Company: Su servicio de pop-up, detecta cuando un texto copiado es susceptible de ser una intención de búsqueda y la lanza automáticamente.
Todos estos ejemplos son posibles principalmente gracias a los avances realizados en el campo de la minería, analítica y procesamiento de texto no estructurado (semántico & probabilístico), lo cual permite interpretar el significado de un pedazo de texto antes de ejecutar una acción, y también, no nos olvidemos, a los avances en experiencia de usuario, los cuales nos permiten interactuar con el texto en múltiples maneras en múltiples dispositivos, permitiendo nuevas experiencias de uso. En este hilo, recomiendo esta lectura sobre Pervasive Ubiquitous Design.
En resumen, las nuevas formas de buscar y de interactuar con texto ya están aquí! Con clickar sobre el texto ya podemos activar acciones de búsqueda, recomendaciones, etc…decid adiós al cajón de búsqueda tal y como lo conocéis hasta ahora!!
El año pasado comenzamos a escuchar el nuevo concepto de Enterprise Social Search en distintos foros sobre busqueda empresarial al otro lado del charco. Este nuevo término no se refiere a la implantación de redes sociales en su organización (i.e. Facebook, Twitter, Yammer, etc..), sino a como mejorar la búsqueda y encontrabilidad de información conectando las redes y perfiles de sus empleados y colaboradores en los procesos de recuperación. En muchas ocasiones es tan importante encontrar un buen documento sobre un determinado tema de interés, como dar con un experto en la materia que me pueda asistir. Además de información, buscamos expertos o personas que hayan demostrado algún interés sobre la materia previamente. Pasamos de Information Retrieval a User Retrieval.
La siguiente presentación de @brynn y @semanticwill muestra algunos de los caminos en los que estamos trabajando con nuestros clientes en la actualidad, relacionar perfiles* de usuario a temas y areas de concomiento y ofrecer estos datos durante los procesos de búsqueda de manera contextual y relevante.
*Nota: cuando me refiero a perfiles, un término de por sí muy vago y subjetivo, me refiero tanto a perfiles explícitos (como por ejemplo datos provenientes del directorio activo como departamento, funciones, redes, etc y otros generados por el propio usuario, como tags, documentos recomendados y/o votados, etc) como también a perfiles ímplicitos (tales como comportamientos de navegación, lectura y búsqueda de dicho usuario reflejado en históricos y otros lugares).
Los autores de la presentación distinguen entre tres tipos de búsqueda social:
Este tema es delicado amigos, tiene miga la cosa. El otro dia John Batelle comentaba en su blog: mirad, salgo primero en Google para la búsqueda “Predictions 2009“. Y todos los que le leemos pensamos, pues será para ti figura, porque tu no sales ni siquiera en mi primera pagina!
The days of “normal” search results that everyone sees are now over. Personalized results are the “new normal,” and the change is going to shift the search world and society in general in unpredictable ways. Search Engine Land Blog
Durante el pasado año vimos el resurgir de la personalización en las búsquedas en Google, estuvieses o no logeado. Google guarda en tu navegador todo tu historial de búsquedas (i.e. cookies) y lo utiliza junto con los datos de tu ubicación (i.e. dirección IP) para personalizar las futuras búsquedas que realices. Es una nueva vuelta de rosca al PageRank. Es decir, si tu has pinchado en un resultado de 20minutos.es, pues entenderá que ese medio online es uno de tu interés y por lo tanto, lo subirá en la pagina de resultados de tus futuras búsquedas.
La personalización es algo inevitable y que veremos cada día más de ello en todo tipo de aplicaciones. La relevancia de una búsqueda es algo muy intrínsicamente ligado a la persona, al usuario. No debería de ofrecer los mismos resultados una búsqueda de “reutilización informacion sector público” para un abogado del estado que para un empresario de Internet. Y claro, esta tendencia no solo ocurre en las búsquedas, lo vemos y veremos cada vez más en noticias, en publicidad, en videos y televisión online, en libros ahora que el eBook está tan de moda, etc…Ya no solo somos consumidores, ahora somos productores. No se donde lei el otro día un nuevo palabro: prosumidores. Google ya lo hace con News (esta entrevista a Erick Schmidt merece la pena) y tambien con Adwords. Nosotros llevamos años hablando de personalización implícita y explícita, y puedes seguir nuestra última iniciativa desde Empathy Software.
Bueno, volviendo al hilo de este post, Google entiende que hay que socializar la búsqueda, y hay que intentar ofrecer a cada usuario lo que sea de su interés. Al carajo con las búsquedas universales y genéricas, ya nunca será lo mismo posicionarse en buscadores. Una búsqueda nunca más ofrecerá los mismo resultados a varios usuarios. ¿Esto quiere decir que los esfuerzos dedicados al SEO van a ser en balde? ¿cual es el impacto de esta nueva tendencia?
Vamos por partes:
Este articulo de S. Arnold de Beyond Search acerca de la guerra de precios entre Microsoft y Google por servicios de email corporativo me ha hecho reflexionar:
Microsoft has recently stepped up efforts to sells its online applications as Google intensifies its efforts to replace Exchange/Outlook and IBM Lotus Notes on desktops. Earlier this month, it dropped its prices by up to 50% on Exchange Online. Companies using or migrating to Exchange Online include GlaxoSmithKline, with 110,000 seats, and Aon, with 36,000 seats.
Es evidente, nosotros ya lo vemos cada vez más, que las empresas están perdiendo el miedo a externalizar servicios, en ocasiones tan críticos como el correo corporativo. Gmail de repente ya no es una locura para una empresa.
¿cuanto tiempo van a tardar las empresas en contratar el software de búsqueda empresarial en modo SaaS? Ya tenemos muchos ejemplos de que la tendencia es la de contratar la búsqueda como un servicio y no como un proyecto de implantación.
¿que opinais?
Guardiola no es el único que habla de feeling estos días, tras quitarse de un plumazo a Etoo. La semana pasada leí por lo menos tres o cuatro artículos sobre Sentiment Analysis, uno en el New York Times, otros dos en El Pais, La red comercializa tus sentimientos y Mi empresa vigila atentamente tu blog, etc..Es evidente que el rollito de extraer feelings de datos en Internet está de moda. Software que no solo monitoriza, sino interpreta y te dice que es lo que la web social dice de ti y tus productos. Pero ojo, esto no es nuevo, Autonomy sin ir mas lejos lleva hablando de Meaning-Based Computing por lo menos cuatro años…
Luego hoy me despierto con el ultimo post del blog de Colbenson, que habla del proyecto de clasificación automática de incidencias y tras conversar con las personas del equipo técnico sobre los retos que han tenido que superar para lograr indices altos de éxito, me han venido a la cabeza todos estos articulos más las conversaciones que he mantenido en distintos foros (en el blog de Netoraton, K-Government, Estrategia Digital, Busqueda Empresarial, etc..) sobre la “extracción” de significado o la capacidad de interpretar un pedazo de texto e inferir un “sentimiento” que el software tiene a día de hoy.
Entiendo y respeto que cada cual tiene su perspectiva sobre el tema. Mi visión desde un prisma técnico, tras unos cuantos años como consultor en proyectos de procesado de texto no estructurado, como son los de búsqueda, categorización y personalización de información, es que se está avanzando mucho pero aun es sumamente complejo automatizar procesos que “entiendan” el significado de un texto y realicen acciones sobre el mismo de manera desatendida. Esto por supuesto no quiere decir que este tipo de proyecto no deba abordarse, sino todo lo contrario, todo lo que quiero decir es que aun debemos de contemplar escenarios donde los procesos automáticos de extracción de sentido de un texto deben ser supervisados y analizados por personas expertos en la materia. Me preguntaban el otro día en uno de estos debates, ¿que es mejor un analista con una herramienta de “sentyment analysis” o sin ella? pues verdaderamente la respuesta no es sencilla, si la herramienta es muy muy muy buena, no hay duda! pero si en cambio el analista se va a pasar más tiempo ordenando y desordenando ideas dentro de la herramienta quizás hubiese ahorrado su tiempo observando de manera manual las 10-15-20 fuentes que desea monitorizar y extraer sus propias conclusiones.
A ver, como apasionado de las tecnologías que soy, está claro que yo tiro por investigar, diagnosticar y personalizar algún producto hacia las necesidades de una empresa, bien sea para clasificar incidencias o para determinar el sentido o efecto que una campaña de marketing ha tenido en las redes sociales, pero simplemente quiero advertir del peligro que estos proyectos contraen si la percepción del cliente no es la idónea a la hora de asumir expectativas.
Hojeando las presentaciones del pasado evento del 16 de Junio sobre la Empresa 2.0, me ha llamado la atención un diagrama de la presentacion de Genis Roca:
La cuestión que me planteo es la siguiente: es evidente que el consumo de información está cambiando radicalmente con el uso de redes sociales, de hecho ya hemos hablado en este blog que el futuro de la búsqueda no es la búsqueda, ya no buscamos la información sino que la información llega a nosotros via nuestros contactos, pero a la misma vez me surgen muchas preguntas:
Todas estas preguntas requieren tecnologia para acercar informacion relevante y gente interesante a cada usuario de la red. La tecnologia está ahí, preparada para hacer este trabajo sucio para cada uno de nosotros. Por poner un ejemplo, el equipo de Colbenson está trabajando en un proyecto que promete mucho: tecnologia de empatía. Ya nos contarán como van las pruebas con TwitterSAID.
Si os fijais en el diagrama de arriba, la siguiente ola tras las redes sociales, es Social News, y luego Targeted, no os suena muy parecido a mis preguntas de arriba? Targeted segun mi entendiemiento quiere decir que los medios, las empresas, la Administracion, etc..serán capaces de filtrarme y seleccionarme la informacion que a mi me interesa. Brillante!
Podeis ver más presentaciones de Genis en su Slideshare.
En mi anterior post, hace ya mas de un mes según veo (que barbaridad, desde que tuiteo más asiduamente mi volumen de posts aqui ha bajado drasticamente, será que Twitter te hace más vago?), hablaba sobre la búsqueda en tiempo real, sus retos y las posibilidades que se abren. Hoy me gustaria profundizar un poco más sobre el propio ranking de una búsqueda en tiempo real. ¿Que elementos deberían de participar en el algoritmo de ranking de una búsqueda en Twitter por ejemplo? ¿en base a que criterios deberían de “ordenarse” los resultados de una busqueda en tiempo-real?
Todas estas preguntas me rondaban la cabeza durante las ultimas semanas, pero este post y los comentarios de este otro, me ha provocado a venir aqui y escribir estas lineas:
Twitter will be improving Twitter Search to index content beyond Twitter.com by crawling links within Twitter posts, and also by adding a ranking algorithm to the search results.
….Twitter hopes to build a ranking algorithm that not only takes into account relevancy, but also the current hot trends and reputation of the Twitter users.
A continuación expongo bajo mi criterio cuales son los ingredientes importantes (no están en orden de prioridad):
Como habreis apreciado en este blog estamos cada día más fascinados con el poder de la comunicación en tiempo real, conexión persistente a tus contactos, a las redes sociales mediante herramientas de microblogging como Twitter. Pero lo que a mi particularmente me pone no es Twitter en si por ejemplo, sino las enormes posibilidades que se abren, y el impacto directo que ha tenido en la forma en la que consumo información. De repente se abre una nueva puerta: los micro-posts o tuits de la gente que sigo es mi primera fuente de información – claro está sin dejar de lado mis mails :(. Hace años accedía a información navegando a sitios web de medios, luego los blogs y los sindicadores RSS tomaron cuerpo y se adueñaron de mi tiempo, ahora frecuento mucho menos mi GReader, simplemente hago un Following de los blogueros, los medios, las empresas y los amigos que me interesan!
Otro punto interesante que surge a partir de aqui: la búsqueda en tiempo real. Si me interesa saber algo que está ocurriendo en la actualidad, ahora mismo, que es lo que la gente opina y (micro)bloguea sobre ello, hago una busqueda no en Google sino en Twitter. Evidentemente hay un claro shift hacia otros “índices” de información: en muchos casos, ya no busco documentos sino conversaciones.
Hablabamos de los retos de la busqueda en tiempo real (indexación, acceso a paginas bajo contraseña como FB, etc..), pero ahora surge una nueva pregunta: ¿como determinamos la relevancia de un tuit frente a otro en un listado de resultados?
Este post de S. Arnold de Beyond Search, habla de un nuevo producto para buscar noticias en Twitter. Este producto, OneRiot, es un claro indicador de que las noticias hay que llevarlas a nuevos canales como Twitter, etc…pero lo que a mi me interesa es su modelo de ranking: lo importante no es “solo” la popularidad del post, sino su inmediatez, su frescura:
Unlike Google, which uses page rank and authority to display top results, OneRiot displays the most recent links Tweeted first. The results are updated constantly. Below each linked article, you can see who found it first and how many people have Tweeted it since. Users can also jump in and participate in the conversations.
Interesante, seguiremos observando nuevos movimientos….
Angel Maldonado
Las redes sociales amplifican, conectan y nos hacen llegar información sin necesitar que la busquemos. Emplear redes sociales y seguir Blogs via RSSs en Internet reduce nuestro consumo de buscadores generalistas, dinamiza y enriquece los procesos de información.
Por primera vez, Twitter representa un riesgo importante al crecimiento de Google (Lew Moorman).
Las redes sociales reducen nuestro consumo de buscadores y otros puntos de acceso a Internet.
Aquí documento mis experiencias sobre twitter que me han llevado a pensar esto:
Sin realizar una sola búsqueda he encontrado los pedazos más valiosos de información, he dado con información directamente relacionada con mis intenciones de búsqueda más retantes.