Buscar, sugerir y personalizar

Todo lo relacionado con el problema de localización de información y datos (texto, audio, video) ya sea generada en ámbito empresarial, social o institucional.

Archive for 'Búsqueda Vertical'

Este tema es delicado amigos, tiene miga la cosa. El otro dia John Batelle comentaba en su blog: mirad, salgo primero en Google para la búsqueda “Predictions 2009“. Y todos los que le leemos pensamos, pues será para ti figura, porque tu no sales ni siquiera en mi primera pagina!

The days of “normal” search results that everyone sees are now over. Personalized results are the “new normal,” and the change is going to shift the search world and society in general in unpredictable ways. Search Engine Land Blog

Durante el pasado año vimos el resurgir de la personalización en las búsquedas en Google, estuvieses o no logeado. Google guarda en tu navegador todo tu historial de búsquedas (i.e. cookies) y lo utiliza junto con los datos de tu ubicación (i.e. dirección IP) para personalizar las futuras búsquedas que realices. Es una nueva vuelta de rosca al PageRank. Es decir, si tu has pinchado en un resultado de 20minutos.es, pues entenderá que ese medio online es uno de tu interés y por lo tanto, lo subirá en la pagina de resultados de tus futuras búsquedas.

La personalización es algo inevitable y que veremos cada día más de ello en todo tipo de aplicaciones. La relevancia de una búsqueda es algo muy intrínsicamente ligado a la persona, al usuario. No debería de ofrecer los mismos resultados una búsqueda de “reutilización informacion sector público” para un abogado del estado que para un empresario de Internet. Y claro, esta tendencia no solo ocurre en las búsquedas, lo vemos y veremos cada vez más en noticias, en publicidad, en videos y televisión online, en libros ahora que el eBook está tan de moda, etc…Ya no solo somos consumidores, ahora somos productores. No se donde lei el otro día un nuevo palabro: prosumidores. Google ya lo hace con News (esta entrevista a Erick Schmidt merece la pena) y tambien con Adwords. Nosotros llevamos años hablando de personalización implícita y explícita, y puedes seguir nuestra última iniciativa desde Empathy Software.

Bueno, volviendo al hilo de este post, Google entiende que hay que socializar la búsqueda, y hay que intentar ofrecer a cada usuario lo que sea de su interés. Al carajo con las búsquedas universales y genéricas, ya nunca será lo mismo posicionarse en buscadores. Una búsqueda nunca más ofrecerá los mismo resultados a varios usuarios. ¿Esto quiere decir que los esfuerzos dedicados al SEO van a ser en balde? ¿cual es el impacto de esta nueva tendencia?

Vamos por partes:


Continuar leyendo…

Borja Ramirez Borja Ramirez

Via este post del blog Jeff’s Search Engine Caffe doy con la presentación de Jeff Dean de Google en el pasado WSDM 2009 (Web Search & Data Mining) celebrado en Barcelona. Es muy técnica, habla mucho de como ha crecido Google en infraestructura desde el 1999 hasta el 2009. Habla de arquitectura de índices (docs + queries), encoding, sistemas de caché, crawling vs indexing, etc..Para todos los lectores “técnicos” en búsqueda & Information Retrieval recomiendo la lectura.

Googles keynote WSDN09

Googles keynote WSDN09

Como nota final, resaltaría tres de los challenges o retos que Jeff resalta:

1) Continuously improving translation quality & large-scale systems work to deal with larger and more
complex language models.

2) Building retrieval systems that efficiently deal with ACLs that vary widely in size

3) algorithms/techniques for improved extraction of structured information from unstructured/semi-structured sources

Podeis ver el video completo de la presentación desde aquí.

Os suena todo esto verdad? Nosotros desde Colbenson, estamos trabajando muy duro en el punto 3 de extracción de entidades (el punto dos de gestionar la seguridad de los documentos ya lo controlamos gracias a la tecnología IDOL Server de Autonomy :)). El futuro de la búsqueda pasa por Exploratory Search el cual se respalda en entidades extraidas de información no estructurada.

Borja Ramirez Borja Ramirez

En este blog hemos hablado con asiduidad sobre la necesidad de los medios en buscar soluciones, muchas de ellas tecnológicas, para sobrevivir en un mundo digital. Mientras todos hablamos de como los medios locales deben reconvertirse al mundo digital, este artículo de Jonathan Weber de New West, un nuevo medio “local” digital estadounidense ofrece una visión práctica, simplista y efectiva:

We have a very active photo group on Flickr, and get great feature photography from that. We mostly use Google for fact-checking – not fool-proof, but it works. We use Twitter and Facebook and RSS to push our stories out into the world. We do great video-driven stories when we can, and happily link to others’ videos. In fact, we happily link to a lot of stuff, sometimes in combination with our own reporting and sometimes not. We have lively comment threads, which we manage with as light a hand as we can and which are often additive to the stories in addition to being entertaining. We have very active event calendars in our local markets - separate from our main sites but well-integrated, and with a dedicated editor. We’re experimenting with a new social media site in Missoula, and we’ll see where that goes.

Portada New West

Portada New West

Otros conceptos interesantes que introduce son los local blogs, ofrecer nuevos modelos de publicidad híbridos digital + eventos locales (New West experience) para los anunciantes, el uso de widgets externos para mejorar y enriquecer la experiencia de usuario, etc.. la verdad es que recomiendo la lectura de este post a todos nuestros lectores de Medios.

Yo soy de los que pienso que hay que ABRIR la información y explotar multiples canales para buscar rentabilidad: redistribuir contenidos por otros canales como redes sociales, blogs, microblogs, mapas, videos, TV sobre IP, etc…hay que facilitar la reutilización de contenidos, poner facilidades y no trabas!. Ahí está la rentabilidad! lo del pago por contenido is part of the past!

Estoy deseoso de ver los resultados de estos grandes ejemplos de reutilizacion de contenidos, la Open Platform del The Guardian, y el TimesPeople API de NY Times.

Me quedo con este comentario de Juan Varela: “Es la ecuación de casi todos los medios con futuro: más acceso y menos restricciones, más audiencia y mercado distribuido.”

Borja Ramirez Borja Ramirez

Llevo tratando de escribir acerca de servicios SaaS por lo menos 3 meses, creo que ha llegado el momento ;)

Algunos de vosotros (cada día menos) os preguntareis que es SaaS. Bien, las siglas SaaS corresponden a Software as a Service, es decir software bajo demanda o software como servicio web. En otras palabras, se refiere a software en la nube que puedes utilizar con tu navegador y conexión a Internet; por ejemplo Gmail es un servicio SaaS de email. Pero ojo, SaaS no es lo mismo que ASP. ASP era principalmente un modelo de financiación, y fracasó entre otras razones porque las aplicaciones que servía no eran nativas Web, como lo son a día de hoy.

Bueno, tras esta breve intro, vamos al ajo: cada día son más los clientes que nos preguntan: ¿abordo mi proyecto de buscador de empresa internamente (i.e. comprar licencias e implantarlas) o “alquilo” el sistema en modo SaaS? Existen varios criterios que deben considerarse para tomar este tipo de decisión: de carácter económico (¿es más barato alquilar SaaS que un proyecto de implantación a medio plazo?), de seguridad (¿donde va a residir la documentación privada de la empresa?), de mantenimiento y administración de sistemas (¿que garantías me da un sistema sobre el cual no tengo control directo?), de disponibilidad o tiempos de puesta en marcha, etc.. que voy a intentar exponer en las siguientes lineas.

Por supuesto, no existe una formula mágica, la decisión correcta depende de muchos factores (proveedor, tecnología, calidad servicio, etc.) pero la realidad es que para un proyecto de búsqueda empresarial en particular, los indices de adopción en modo SaaS ya son del 57%, según este informe de eConsultancy. Como este informe bien indica, el uso de SaaS es diferente según la tecnología, por ejemplo esta tendencia es aún más pronunciada en proyectos de gestión de contenidos (CMS) (59%), o incluso en email Archiving (77%), y lógicamente no es tan recurrente por ejemplo en aplicativos de productividad como Office. El efecto “cloud computing” todavía no es una realidad es nuestras clásicas aplicaciones de cliente pesado como Office (Outlook, Word, etc..), pero tiempo al tiempo.

SaaS usage across business areas

SaaS usage across business areas


Continuar leyendo…

Borja Ramirez Borja Ramirez

Otro de los sectores donde la tecnología de búsqueda está pegando muy fuerte, además de Banca, Medios y Gobierno es el sector de la venta minorista online o en otras palabras sitios de eCommerce. La propuesta principal es la de ofrecer una navegación guiada por un catálogo de producto con el fin de que el cliente “encuentre” lo que busca mientras filtra o navega por diferentes categorías de un producto, como pueden ser precio, color, modelo, y otras caracteristicas técnicas del producto. Esta funcionalidad de “búsqueda via navegación” (a.k.a. faceted search o exploratory search) cada fabricante la llama de diferente manera por obvios motivos marketinianos (Guided Navigation, Refinamiento Paramétrico, Directed Navigation, búsqueda federada, etc), y permite acceder y encontrar información navegando: es una acción de búsqueda pero sin necesidad de introducir una palabra clave. Resulta interesante ver como expertos y académicos en el campo de Information Retrieval ven la busqueda de exploración como una herramienta no solo para buscar, sino sobre todo para aprender e investigar (Lookup, Learn, Investigate). El buscador como “descubridor” de información. Pero bueno todo este tema de patrones de acceso requiere toda una nueva entrada, siguiendo la anterior de el buscador como solución para responder y para aprender.

Volviendo al foco de esta entrada: la aplicación del buscador como herramienta de navegación en sitios de venta minorista (por ejemplo una tienda online de vinos, ropa, electrodomésticos, libros, etc..). El buscador permite encontrar productos y sobe todo descubrir nuevos! Estos lugares online deben de asegurarse que el usuario encuentre lo que busca en su catálogo; un abandono de la búsqueda simplemente se traduce en una pérdida económica directa. Para ello la información debe de ser previamente categorizada mediante atributos, en muchos casos extraidos mediante etiquetas y entidades. De esta manera un usuario puede encontrar por ejemplo un restaurante mediante precio, o tipo de comida, o ubicación geográfica hasta que da con el deseado.

busqueda por navegación

busqueda por navegación

Si están interesados en como el buscador puede incrementar las ventas de su portal online, la empresa de software Endeca ofrece un webinar interesante sobre este tema: Excellence in eCommerce, el proximo miercoles 18.

Borja Ramirez Borja Ramirez
Más sobre la caida de la inversión en publicidad en buscadores: según eMarketer el mercado de la publicidad en los buscadores bajará en EEUU desde el casi 30% actual hasta un 12% en tres años. En España actualmente supone un 51% del mercado de publicidad online. Desde luego, la publicidad online necesita nuevos formatos.

Search Advertisement market 2007-2013

Search Advertisement market 2007-2013

Para un analisis más detallado de este informe de eMarketer, ver este post de Periodistas 21.

Borja Ramirez Borja Ramirez

Siguiendo la linea del anterior post, donde los datos de un estudio de eye tracking demuestran como los jovenes ignoran los adwords, esta mañana leo este articulo en Soitu.es donde directamente cuestionan la viabilidad del negocio de publicidad en buscadores desde ya (como veis en la imagen de abajo, actualmente alrededor de un 95 % de los ingresos de GOOG proceden de publicidad, la mitad procedente de google.com y la otra via networks con Adsense, el restante 5% provienen de software y licencias):

Segmentación negocio Google 2008

Segmentación negocio Google 2008

Porque el precio de la publicidad en internet sigue cayendo. La gente paga cada vez menos por los anuncios, lo que obliga a Google a resolver un dilema: aumentar la cantidad de inventario y seguir bajando los precios o apostar por un mercado de más calidad con menos publicidad pero más cara.

Un dilema que afecta a todo el mercado de internet por la posición de dominio del buscador y cuando los contextuales son más robustos que el resto de la publicidad, cuyo CPM (coste por millar) no para de bajar. La publicidad gráfica ha rebajado su precio a la mitad en 2008, según algunos estudios.

Todo esto me hace reflexionar, estamos ante un momento historico, el modelo tradicional de beneficios de Google mengua, los anuncios en los buscadores pierden fuelle, ¿cual será la siguiente innovación de publicidad online que sea efectiva? Todo hace pensar que la publicidad online seguirá segmentandose aun más hacia redes sociales, multimedia (videos & TV), publicidad local, dispositivos de mobilidad, etc…¿quien será el siguiente Google? Será Google capaz de captar estos nuevos mercados?

Y a este hilo, ¿conseguirán los grandes medios algún día igualar o superar los ingresos que actualmente generan por publicidad en papel? o ¿deberán de acogerse a un modelo intervencionista de estado a-la-Sarkozy?

Borja Ramirez Borja Ramirez
Llegó el día D: el nuevo buscador vertical de información legal ha comenzado su andadura.

legalsolo.com

legalsolo.com

Más información aquí: 30 Enero 2009, 15:33 hrs: Legalsolo.com goes live!!!

Borja Ramirez Borja Ramirez

Interesante investigación de Mark McDonald de Gartner, los directores de sistemas (i.e. CIOs) tienen cada cía más presión para demostrar el retorno de la inversión de sus proyectos de nuevas tecnologías. De hecho, se aventura a pronosticar que son 4 meses de vida lo que tienen desde el comienzo de un proyecto hasta el “delivery”. If not, out the door!

“Based on Gartner’s findings, the top technology priorities of global CIOs involves harvesting value from existing core technologies in a way that solidifies business intelligence, enterprise applications, and virtualization. In this environment, there are some technologies that will get left out in the cold –

“Basically, anything new,” McDonald said – but Web 2.0 tools are not among them.
McDonald said anecdotal evidence, including conversations with CIOs, indicates that social computing tools are on a different plane because such tools are not prohibitively expensive to adopt. “What’s the average cost of implementation of a new business intelligence capability? McDonald asked. “It’s not $5, but companies are implementing web 2.0 technology for very little money.
“Investments in BI and CRM and ERP were viewed as investments, and fairly significant capital expenditures. Companies are doing web 2.0 things almost as a straight operating expense.”
That’s true, he added, whether companies apply Web 2.0 tools internally to foster collaboration, or externally to attract new customers and retain existing ones. McDonald advised against favoring one approach over the other. The deteriorating economy does not mean that any aspect of social computing, which Gartner cited as a top emerging trend in 2008, should be placed on the back burner.”

Podeis leer el resto del articulo desde aqui. Gracias Thomas por el post.

Un claro indicador de que cada dia serán más importantes los servicios SaaS, servicios que enchufas y mides resultados desde el primer dia. Adiós a los largos proyectos de implantación!!!

Borja Ramirez Borja Ramirez

Mientras todos los periódicos echan cuentas de los días que les quedan, y vuelcan sus esfuerzos en sus versiones digitales, sale a la venta un nuevo periódico de blogs en EEUU, The Printed Blog. Interesante concepto: estará financiado por publicidad local y clasificados en versión papel (existirán 50 versiones diferentes para cada ciudad, todas ellas gratuitas y de tirada semanal de momento) y por publicidad online , y otro dato llamativo es que la selección de los contenidos en papel será previamente realizada por sus lectores online. Esto supone verdaderamente un nuevo modelo de negocio híbrido sustentado en los usuarios (inclinación como no dospuntocerista) y complementada con una versión gratuita en papel…seguiremos el caso de cerca.

Gracias por el link David.

The Printed Blog

The Printed Blog

Creative Commons License
Esta obra está bajo una licencia de Creative Commons.
Powered by WordPress | Theme design based on "Corporate" by Ori Pearl