Los que nos dedicamos a esto de la busqueda empresarial debemos estar continuamente hablando de las diferencias entre un buscador de empresa (normalmente el buscador “interno” desde donde los empleados buscan en todos los sistemas de su empresa y/o el buscador “público” de su web corporativa) y un buscador web general como puede ser Google, Yahoo, Bing, etc.. Todos ellos empiezan con un cajón de búsqueda, pero poco más tienen en común.
En este sentido me ha gustado un post acerca de micro-IR (i.e. micro information retrieval). No voy a entrar en la parte teórica, pero me atrae el concepto de micro-IR como “the practice of farming information needs out across multiple applications”, es decir buscar información en fuentes y principalmente con intenciones predefinidas. En otras palabras buscadores de empresa, site search, buscadores verticales, buscadores de aplicaciones y dispositivos moviles, etc..Muchos os preguntareis que mas da! al final el buscador debe facilitar encontrar información bien sea en la web o en un sitio web de una empresa o gobierno. Pues no, cuando se pueden anticipar las intenciones de búsqueda de un usuario y tenemos unos datos con una estructura de meta-data particular, el buscador debe de adaptarse a estos patrones de acceso y orientar al usuario haciendo uso de determinadas herramientas como pueden ser filtros de navegación (faceted navigation), uso de tags y entidades de negocio, ranking personalizado etc.. Mucha gente en este mundillo engloban este tipo de busquedas como todo exploratory search.
En este sentido estoy totalmente de acuerdo con Daniel Tunkelang del blog The Nosiy Channel:
I feel that the distinction between macro- and micro-IR is in the same vein: micro-IR settings (e.g., site search, enterprise search,vertical search) drive needs for more richer interfaces and support for interaction, while macro-IR application developers (e.g., general web search) worry mostly about producing a reasonable answer for the query..
Otro de los sectores donde la tecnología de búsqueda está pegando muy fuerte, además de Banca, Medios y Gobierno es el sector de la venta minorista online o en otras palabras sitios de eCommerce. La propuesta principal es la de ofrecer una navegación guiada por un catálogo de producto con el fin de que el cliente “encuentre” lo que busca mientras filtra o navega por diferentes categorías de un producto, como pueden ser precio, color, modelo, y otras caracteristicas técnicas del producto. Esta funcionalidad de “búsqueda via navegación” (a.k.a. faceted search o exploratory search) cada fabricante la llama de diferente manera por obvios motivos marketinianos (Guided Navigation, Refinamiento Paramétrico, Directed Navigation, búsqueda federada, etc), y permite acceder y encontrar información navegando: es una acción de búsqueda pero sin necesidad de introducir una palabra clave. Resulta interesante ver como expertos y académicos en el campo de Information Retrieval ven la busqueda de exploración como una herramienta no solo para buscar, sino sobre todo para aprender e investigar (Lookup, Learn, Investigate). El buscador como “descubridor” de información. Pero bueno todo este tema de patrones de acceso requiere toda una nueva entrada, siguiendo la anterior de el buscador como solución para responder y para aprender.
Volviendo al foco de esta entrada: la aplicación del buscador como herramienta de navegación en sitios de venta minorista (por ejemplo una tienda online de vinos, ropa, electrodomésticos, libros, etc..). El buscador permite encontrar productos y sobe todo descubrir nuevos! Estos lugares online deben de asegurarse que el usuario encuentre lo que busca en su catálogo; un abandono de la búsqueda simplemente se traduce en una pérdida económica directa. Para ello la información debe de ser previamente categorizada mediante atributos, en muchos casos extraidos mediante etiquetas y entidades. De esta manera un usuario puede encontrar por ejemplo un restaurante mediante precio, o tipo de comida, o ubicación geográfica hasta que da con el deseado.
Si están interesados en como el buscador puede incrementar las ventas de su portal online, la empresa de software Endeca ofrece un webinar interesante sobre este tema: Excellence in eCommerce, el proximo miercoles 18.
Tras el anuncio de los dos productos de búsqueda low-cost de Microsoft (Search Server and Search Server Express), la empresa de Redmond desvela su roadmap de Enterprise Search al completo. De momento anuncian que van a garantizar soporte para los actuales clientes de FAST por un periodo mínimo de 10 años, tambien anuncian que van a seguir soportando plataformas UNIX, Linux y Windows ;-), y van a mantener al equipo comercial “sobreviviente” de FAST y sus actuales distribuidores VAR para su futura comercialización. Su precio de lista actual es de 25.000$ por servidor. Toda la información será presentada formalmente en el Fast Forward 09 en la Vegas.
No obstante aun quedan muchas dudas por despejar, debido al solapamiento evidente funcional entre varios de sus productos. Como bien lo describe la gente de Enterprisesearchblog.com:
Some questions remain. For example, Microsoft Search Server qualifies as a pretty decent search technology, and its crawler can fetch data from intranet sites. ESP for SharePoint provides some exciting Enterprise Search 2.0 capabilities including faceted search, powerful search federation, and a wide variety of connectors, and for companies that need the capability can get it now.
What will the upgrade path be to migrate from ESP for SharePoint to FAST Search for SharePoint? How will they be positioned versus Search Server?
El modelo de ranking o relevancia es la piedra angular de un buen buscador. Google lo borda con el PageRank para búsquedas en paginas web. No obstante, la búsqueda en contenidos más ricos en interacciones como puede ser un blog y sus comentarios aun son terrenos verdes sin pastar donde muchas start-ups experimentan. Tenemos buscadores como Twingly y Wikio que se especializan en ello, se habla sobre formulas de BlogRank o el famoso Authority de blogs de Technorati, etc…todas ellas son fuentes de donde podemos sacar muchas conclusiones acerca de la importancia de inlinks, tracbacks, etc…
Uno de los grandes retos es saber personalizar un modelo de ranking de blogs de manera vertical, dirigido hacia las necesidades de un sector o una comunidad de lectores en particular. En un pronto futuro veremos muchos casos como este…un nuevo buscador 2.0 de información legal nos habla sobre los elementos que intervienen en la búsqueda en blogs de derecho:
…..modelo de ranking para blogs de derecho. Nuestra receta (matemática) de relevancia de blogs toma en consideración los siguientes aspectos asociados a su métrica correspondiente:
1) Autoridad del blog
- promedio de citas entrantes (i.e. inlinks / trackbacks) por entrada
- promedio de duración de sesión (tiempo de permanencia de un usuario en el blog)
- calidad de las categorías y etiquetas
- Volumen de suscriptores
- crecimiento mensual de suscripciones2) Popularidad & Aceptación Social del Blog:
- promedio de comentarios por entrada
- promedio de términos por comentario3) Contribución del blog
- Numero de entradas por mes / numero de meses blogueando
- Numero de palabras por entrada / número de entradas
Pueden leer el resto de la entrada original, pinche aqui.
Muchos de vosotros (clientes, lectores, compañeros, etc) me preguntáis a menudo acerca de fuentes de información, tales como foros de debate, blogs y demás sobre búsqueda empresarial. Me acabo de encontrar con un post de uno que suelo seguir en esta materia hablando de esto precisamente, y me he animado a ello:
Foros & Grupos (funcionales y técnicos):
- El grupo de Yahoo Search_Dev es un foro bastante dinámico. Los posts suelen ser bastante técnicos pero recomiendo su seguimiento, puesto que siempre surge algo interesante. Una de las ventajas es que no es muy biased hacia ningun producto en concreto; es decir, existen posts tanto de GSA, como de Autonomy, Endeca, FAST y todos los demás fabricantes. Obviamente predominan más unos productos que otros, pero al igual que su penetración en el mercado. De hecho, existe otro grupo Yahoo dedicado exclusivamente a tecnologia Autonomy. Uno de los moderadores de este foro es Miles Kehoe.
- Grupo IT Tool Box dispone también foros técnicos de Autonomy , Sharepoint, Opentext, etc.. los cuales está moderados por gente con mucha experiencia en este mundillo, algunos de ellos conocidos nuestros desde nuestros primeros pasos allá por el 2003.
- Grupo LinkedIn Enterprise Search Professionals para los que esteis conectados en esta cada dia más popular red social profesional. Alli nos podreis encontrar a algunos de nosotros.
Blogs de interés:
- Uno de los activos es el blog Steven Arnold Beyond Search en el que habla continuamente de todos los fabricantes en este nicho de busqueda dentro de la empresa o como la define el search-behind-the-firewall.
- Otra fuente interesante es CMS Watch, donde analizan el mercado, comercializan infomres, etc..
- Entreprise Search Practice Blog de Gilbane Group (analistas de mercado al igual que CMS, Forrester, Gartner, etc..), pero especializados en este area tecnologico en particular.
- El blog de NIE no es muy activo pero merece la pena. Recomiendo los newsletters sobre Enterprise Search de la misma empresa New Idea Engineering.
- The Nosiy Channel tambien es un blog que merece la pena seguir de cerca.
- El blog oficial de Google Enterprise lo podeis encontrar aqui. Habla bastante sobre otros temas como Google Docs y otras apps, pero de vez en cuando tratan el tema de enterprise search. Sinceramente me sorprende de Google, que no apuesten de manera más agresiva en marketing y desarrollo prodcuto del GSA.
- MSN tambien toca temas de buscadores de empresa en su blog oficial.
- Aqui teneis el blog de otro fabricante de software de busqueda empresaril Vivisimo, se llama Search Done Right.
- como vereis, lamentablemente, la seleccion de blogs que he realizado son en inglés. En castellano, podemos leer el blog de Colbenson ;-), un interesante blog acerca del mundillo de buscadores dentro de la empresa, donde asiduamente escribo.
Bueno, creo que estos son los principales, luego ha bastantes más, pero con una inclinación más hacia SEO y serach en la web, o search engine marketing.
Seguro que se me escapa alguno, osea que por favor comentadnos si conoceis algun blogs, informes, etc., que merezca la pena!
Es más que evidente que los medios tradicionales o se renuevan o mueren:
- Internet ha superado a los diarios como fuente informativa en Estados Unidos, según una encuesta del Pew Research Center.
- En España, los lectores de diarios digitales son ya casi el 50% de los lectores de prensa tradicional y rozan los siete millones de personas.
- En Internet: los nuevos medios (i.e. “solo” digitales) y los medios locales y regionales crecen más que los tradicionales.
- Los españoles estamos entre los europeos que más prensa digital leemos en Internet.
Todos estamos seguros de una cosa: el futuro de los medios tradicionales pasa por su apuesta por el soporte digital. Los medios deberán de ser diferentes en sus contenidos, deberán de publicar contenidos originales, ofrecer más multimedia, introducir herramientas de red social para conseguir que la información sea participativa, más agregadores de noticias y blogs de calidad, etc…Como podemos apreciar, la tecnología va a jugar un papel fundamental en la salvación de los medios; sin duda, la capacidad de un medio a adaptarse a las nuevas tecnologías y no solo exclusivamente a los contenidos como hasta ahora, será una de las principales claves de éxito de los medios de comunicación y de la convergencia de sus ingresos mediante nuevos canales, tales como Internet.
Como continuación a la interesante entrada de Angel y tras haber participado personalmente en el internacionalmente publicitado proyecto del Servicio Extremeño de Salud al que hace mención, me permito añadir una serie de comentarios.
El principal valor obtenido tras la implantación de tecnología de búsqueda para la asistencia en la prescripción médica ha sido el de alertar al facultativo en el mismo momento de dar de alta una receta que uno o varios de los fármacos prescritos pueden causar un riesgo (leve/moderado/grave o muy grave)en el paciente. El propio sistema puede de manera indirecta minimizar el riesgo de una prescripción desafortunada en un paciente.
El propio sistema realiza en tiempo real una serie de consultas cruzadas entre datos procedentes de bases de datos externas de fármacos, como por ejemplo el BOT del Consejo Gral. de Colegios Farmacéuticos, Guía Terapéutica GPT, etc.. y los propios datos del paciente (edad, sexo, alergias, histórico de tratamientos, etc..) con el fin de identificar “incompatibilidades” en la prescripción. El sistema trata de verificar que los fármacos que pretenden ser prescritos no van a interactuar de manera negativa entre si y/o con el paciente; en caso de detectar cualquier situación de riesgo, el sistema genera las siguientes alertas automaticamente:
Angel Maldonado
¿Qué son búsquedas federadas?
En un vistazo rápido, consiste en lanzar una consulta contra otros índices (o buscadores).
¿Cuándo federar?
¿Federar en búsqueda empresarial?
Federar es bueno, bueno para el usuario ya que incrementa la cobertura (aspecto esencial en un proyecto de búsqueda trasversal) y bueno para la infraestructura al realizar una gestión efectiva de índices.
Dicho esto, es justo destacar que existen muchos retos en la materialización de búsquedas federadas en general (paginados, combinación resultados, detección entidades, gestión duplicados, etc) sumados a retos específicos en la federación de búsquedas en el marco empresarial.
En anteriores entradas (La Larga Cola de búsqueda y El Largo Cuello de búsqueda), hemos hablado sobre analítica de búsqueda y en particular sobre el famoso Long Tail como herramienta para mejorar la calidad de resultados de su buscador. Esta representación gráfica de las tendencias de uso, nos indica claramente que los usuarios seguimos patrones comunes y casi siempre buscamos lo mismo. Según nuestro análisis de los buscadores en varios de nuestros clientes de Banca & Seguros y de Gobierno, alrededor del 70% de las búsquedas se realizan con el 20% de palabras clave. Este fenómeno es respaldado y detallado por Randy Woods de la empresa canadiense NLC, en su presentación en el ultimo evento de Gilbane en San Francisco este mes pasado.

Su discurso en cuanto a cómo mejorar un buscador de empresa discurre por separar las búsquedas no en dos, sino en tres áreas: el Short Tail y el Long Tail de los cuales ya hemos hablado anteriormente, sino además propone considerar el Mid Tail como un area más de análisis y estrategia de tuning de resultados.
Angel Maldonado
¿A quién se le han ocurrido estos nombres?
Personalmente Enterprise Search me suena fatal, no digamos Búsqueda Empresarial (y esto dicho desde un blog en busquedaempresarial.com!).
Nombres simples a problemas complejos
Compliance (cumplimiento?), Records Management (tal cual; sin traducción) Inteligencia de Negocio (este es total), etc. Son solo etiquetas, pretenden ser simples pero detrás se cada una de ellas se esconden universos desconocidos, aventuras y desventuras de las que hablar es para muchos anti-comercial.