Buscar, sugerir y personalizar

Todo lo relacionado con el problema de localización de información y datos (texto, audio, video) ya sea generada en ámbito empresarial, social o institucional.

Archive for 'Búsqueda Externa'

Borja Ramirez Borja Ramirez

Esta es la pregunta que muchos os preguntais y que nosotros tratamos de responder con más o menos acierto. La respuesta es muy simple: DEPENDE!!! Pero no depende tanto del producto que se utilice (Autonomy, FAST, Google, etc..), sino de la calidad de las fuentes que se deseen indexar! Depende de la calidad de los datos (i.e. metadatos) (más que del propio volumen de datos), depende de los requisitos funcionales (se requiere categorizar, extraer entidades, hipervincular datos entre si, introducir enlaces destacados, geo-posicionar contenidos, etc..), depende de la necesidades de seguridad (i.e. ¿existen permisos de lectura y usuarios a nivel de documento?), depende de las expectativas en el ranking de resultados y del tuning final del sistema, depende de las necesidades de arquitectura (i.e. no es lo mismo satisfacer 5 QPS que hacerlo para 80), etc…Un proyecto de implantación de un buscador empresarial puede ir desde un mes hasta unos 6 meses. Si todo está pensado y en su sitio al principio del proyecto, por ejemplo los datos están limpios, el interfaz diseñado (i.e. página de resultados, etc..), los escenarios de uso maquetados, etc…el proyecto se puede hacer en 2 semanas, pero si todos estos asuntos están áun verdes al inicio, el proyecto se demora.  Lo que sí es verdaderamente fundamental para el éxito de su proyecto es trabajar con expertos en proyectos de búsqueda empresarial para que hagan las preguntas oportunas al principio del proyecto y no al final, cuando se haya metido la pata.

Aqui en el grupo de LinkedIn de Enterprise Search teneis diversas respuestas a esta pregunta por algunos expertos en este tipo de proyectos.

Rarely, if ever, can you drop in a search engine, index the content and expect the user to be satisfied with the out-of-box results. Deployment is an iterative process of tuning the relevancy, massaging the data, reindexing, testing, repeating.

What can drag out the deliverable, and something often overlooked in the preliminary stages of an implementation are the acceptance requirements. Nailing these down at the start is key – sample queries, expected responses, indexing times, QPS requirements, navigation constructs ( categorization, entity extraction, etc..)….

… I’m sorry , I realize this hasn’t answered the question, but it reminds me of the question posed to the Sales guy : ” How much does a search engine cost?” His response, ” How long is a piece of string?”.

Borja Ramirez Borja Ramirez

Este articulo de John Batelle, gurú en esto de buscadores como Google, me ha hecho reflexionar, pero paradójicamente aun más los comentarios que el post ha suscitado entre sus lectores. John habla del cambio en las pautas de uso de internet que todos estamos adoptando, de la rapidez con la que muchos de nosotros nos hemos lanzado a conversar en multitud de sitios Web, micro-blogs, redes sociales, etc..de repente hemos pasado de ser consumidores de información a contribuidores, ahora hablamos de lo que estamos haciendo en este momento, lo que se nos pasa por la cabeza, compartimos un post que nos gusta, opinamos sobre las ultimas elecciones, etc..pero ¿que quiere decir todo esto? ahora yo si quiero buscar información sobre algo de actualidad, no lo busco en Google, lo busco en Twitter, porque no me interesa tanto la noticia, sino lo que la gente comenta sobre la misma ahora mismo, y sobre todo la gente que a mi me interesa.

Twitter Search

Twitter Search

Esto muchos lo llaman Social Search, y otros simplemente dicen que Search se queda corto, porque ahora en vez de buscar escucho a la gente que yo quiero escuchar. ¿Ahora entendéis porque Google está que se caga con Facebook y Twitter, y Facebook con Twitter a la misma vez? La puerta de acceso a Internet ya no es Google sino mis contactos (tanto redes sociales como Facebook, LinkedIn, etc..) como los blogs y microblogs de la gente que sigo. Una cosa es evidente, Google tiene muchos retos por delante como poder rastrear y facilitar búsqueda en tiempo real y también acceder a páginas personales protegidas como son las de Facebook o LinkedIn por ejemplo. Entonces ¿como van a ser capaces de decirme lo que dice la gente?, pero bueno eso es otro tipo de conversación y debate sobre The Future of Search…(solo quiero lanzar otro dato más para los más escépticos ;), el numero de visitas en este blog procedentes de Twitter desde que abrí una cuenta (http://twitter.com/borja_ramirez) está creciendo como la espuma y en un futuro cercano estoy seguro que igualará o superará a las visitas orgánicas de buscadores como Google. Este dato es demoledor!).

¡Vivimos tiempos apasionantes!

Borja Ramirez Borja Ramirez

Llevo tratando de escribir acerca de servicios SaaS por lo menos 3 meses, creo que ha llegado el momento ;)

Algunos de vosotros (cada día menos) os preguntareis que es SaaS. Bien, las siglas SaaS corresponden a Software as a Service, es decir software bajo demanda o software como servicio web. En otras palabras, se refiere a software en la nube que puedes utilizar con tu navegador y conexión a Internet; por ejemplo Gmail es un servicio SaaS de email. Pero ojo, SaaS no es lo mismo que ASP. ASP era principalmente un modelo de financiación, y fracasó entre otras razones porque las aplicaciones que servía no eran nativas Web, como lo son a día de hoy.

Bueno, tras esta breve intro, vamos al ajo: cada día son más los clientes que nos preguntan: ¿abordo mi proyecto de buscador de empresa internamente (i.e. comprar licencias e implantarlas) o “alquilo” el sistema en modo SaaS? Existen varios criterios que deben considerarse para tomar este tipo de decisión: de carácter económico (¿es más barato alquilar SaaS que un proyecto de implantación a medio plazo?), de seguridad (¿donde va a residir la documentación privada de la empresa?), de mantenimiento y administración de sistemas (¿que garantías me da un sistema sobre el cual no tengo control directo?), de disponibilidad o tiempos de puesta en marcha, etc.. que voy a intentar exponer en las siguientes lineas.

Por supuesto, no existe una formula mágica, la decisión correcta depende de muchos factores (proveedor, tecnología, calidad servicio, etc.) pero la realidad es que para un proyecto de búsqueda empresarial en particular, los indices de adopción en modo SaaS ya son del 57%, según este informe de eConsultancy. Como este informe bien indica, el uso de SaaS es diferente según la tecnología, por ejemplo esta tendencia es aún más pronunciada en proyectos de gestión de contenidos (CMS) (59%), o incluso en email Archiving (77%), y lógicamente no es tan recurrente por ejemplo en aplicativos de productividad como Office. El efecto “cloud computing” todavía no es una realidad es nuestras clásicas aplicaciones de cliente pesado como Office (Outlook, Word, etc..), pero tiempo al tiempo.

SaaS usage across business areas

SaaS usage across business areas


Continuar leyendo…

Borja Ramirez Borja Ramirez

Otro de los sectores donde la tecnología de búsqueda está pegando muy fuerte, además de Banca, Medios y Gobierno es el sector de la venta minorista online o en otras palabras sitios de eCommerce. La propuesta principal es la de ofrecer una navegación guiada por un catálogo de producto con el fin de que el cliente “encuentre” lo que busca mientras filtra o navega por diferentes categorías de un producto, como pueden ser precio, color, modelo, y otras caracteristicas técnicas del producto. Esta funcionalidad de “búsqueda via navegación” (a.k.a. faceted search o exploratory search) cada fabricante la llama de diferente manera por obvios motivos marketinianos (Guided Navigation, Refinamiento Paramétrico, Directed Navigation, búsqueda federada, etc), y permite acceder y encontrar información navegando: es una acción de búsqueda pero sin necesidad de introducir una palabra clave. Resulta interesante ver como expertos y académicos en el campo de Information Retrieval ven la busqueda de exploración como una herramienta no solo para buscar, sino sobre todo para aprender e investigar (Lookup, Learn, Investigate). El buscador como “descubridor” de información. Pero bueno todo este tema de patrones de acceso requiere toda una nueva entrada, siguiendo la anterior de el buscador como solución para responder y para aprender.

Volviendo al foco de esta entrada: la aplicación del buscador como herramienta de navegación en sitios de venta minorista (por ejemplo una tienda online de vinos, ropa, electrodomésticos, libros, etc..). El buscador permite encontrar productos y sobe todo descubrir nuevos! Estos lugares online deben de asegurarse que el usuario encuentre lo que busca en su catálogo; un abandono de la búsqueda simplemente se traduce en una pérdida económica directa. Para ello la información debe de ser previamente categorizada mediante atributos, en muchos casos extraidos mediante etiquetas y entidades. De esta manera un usuario puede encontrar por ejemplo un restaurante mediante precio, o tipo de comida, o ubicación geográfica hasta que da con el deseado.

busqueda por navegación

busqueda por navegación

Si están interesados en como el buscador puede incrementar las ventas de su portal online, la empresa de software Endeca ofrece un webinar interesante sobre este tema: Excellence in eCommerce, el proximo miercoles 18.

Borja Ramirez Borja Ramirez

Tras el anuncio de los dos productos de búsqueda low-cost de Microsoft (Search Server and Search Server Express), la empresa de Redmond desvela su roadmap de Enterprise Search al completo. De momento anuncian que van a garantizar soporte para los actuales clientes de FAST por un periodo mínimo de 10 años, tambien anuncian que van a seguir soportando plataformas UNIX, Linux y Windows ;-), y van a mantener al equipo comercial “sobreviviente” de FAST y sus actuales distribuidores VAR para su futura comercialización. Su precio de lista actual es de 25.000$ por servidor. Toda la información será presentada formalmente en el Fast Forward 09 en la Vegas.

No obstante aun quedan muchas dudas por despejar, debido al solapamiento evidente funcional entre varios de sus productos. Como bien lo describe la gente de Enterprisesearchblog.com:

Some questions remain. For example, Microsoft Search Server qualifies as a pretty decent search technology, and its crawler can fetch data from intranet sites. ESP for SharePoint provides some exciting Enterprise Search 2.0 capabilities including faceted search, powerful search federation, and a wide variety of connectors, and for companies that need the capability can get it now.

What will the upgrade path be to migrate from ESP for SharePoint to FAST Search for SharePoint? How will they be positioned versus Search Server?

Borja Ramirez Borja Ramirez

Esta semana, tras más de un año desde la adquisición de FAST, Microsoft empieza a enseñar sus cartas en el área Enterprise Search. Muchos de nosotros nos preguntábamos como iban a posicionarse en el mercado, como iban a integrar la gama de productos FAST sobre tecnología Linux, como diferenciarse de su actual solución de búsqueda Sharepoint, etc…Pues bien, de momento Microsoft ha anunciado que va a hacer un release de dos soluciones de búsqueda “low-cost”. Es decir, Microsoft se mete de lleno en la pelea de gallinero contra el GSA de Google, ambos productos por debajo de los 2.000€ (con sus limitaciones en numero de documentos, seguridad, etc..). Aun queda por saber la propuesta de Microsoft para proyectos corporativos de infraestructura de acceso y procesado de contenidos.

Con este comunicado, es evidente la segmentación en el area de Enterprise Search:

- “Low Cost” Enterprise Search: Site Search & (limited) intranet search. Este mercado ofrece respuestas a las empresas que requieren poner un cajón de búsqueda en su sitio Web o incluso en su Intranet (behind-the-firewall search), aunque con evidentes limitaciones, como la disponibilidad de seguridad no-mapeada. En este campo juegan Google GSA, Microsoft Search Server, Autonomy IDOL Lite o Ultraseek, soluciones Open Source como Lucene o SOLR, etc…

- Enterprise Search & Content Processing: Aquí la propuesta es diferente, no solo se trata de búsqueda, se trata de procesar contenidos, tratarlos, extraer entidades, analítica de texto, etc…como solución global de acceso a contenidos dentro de una empresa. También permiten a las empresas auditar sus contenidos, como las soluciones de eDiscovery, soluciones de almacenamiento y minería de datos, acceso a contenidos multimedia (audio & video), clusterización, etc..Los players en este campo son Autonomy, Vivisimo, Endeca, Exalead, etc… Suponemos que Microsoft también se posicionará en este campo una vez integre el software noruego que compró el año pasado.


Continuar leyendo…

Borja Ramirez Borja Ramirez
Más sobre la caida de la inversión en publicidad en buscadores: según eMarketer el mercado de la publicidad en los buscadores bajará en EEUU desde el casi 30% actual hasta un 12% en tres años. En España actualmente supone un 51% del mercado de publicidad online. Desde luego, la publicidad online necesita nuevos formatos.

Search Advertisement market 2007-2013

Search Advertisement market 2007-2013

Para un analisis más detallado de este informe de eMarketer, ver este post de Periodistas 21.

Borja Ramirez Borja Ramirez

Siguiendo la linea del anterior post, donde los datos de un estudio de eye tracking demuestran como los jovenes ignoran los adwords, esta mañana leo este articulo en Soitu.es donde directamente cuestionan la viabilidad del negocio de publicidad en buscadores desde ya (como veis en la imagen de abajo, actualmente alrededor de un 95 % de los ingresos de GOOG proceden de publicidad, la mitad procedente de google.com y la otra via networks con Adsense, el restante 5% provienen de software y licencias):

Segmentación negocio Google 2008

Segmentación negocio Google 2008

Porque el precio de la publicidad en internet sigue cayendo. La gente paga cada vez menos por los anuncios, lo que obliga a Google a resolver un dilema: aumentar la cantidad de inventario y seguir bajando los precios o apostar por un mercado de más calidad con menos publicidad pero más cara.

Un dilema que afecta a todo el mercado de internet por la posición de dominio del buscador y cuando los contextuales son más robustos que el resto de la publicidad, cuyo CPM (coste por millar) no para de bajar. La publicidad gráfica ha rebajado su precio a la mitad en 2008, según algunos estudios.

Todo esto me hace reflexionar, estamos ante un momento historico, el modelo tradicional de beneficios de Google mengua, los anuncios en los buscadores pierden fuelle, ¿cual será la siguiente innovación de publicidad online que sea efectiva? Todo hace pensar que la publicidad online seguirá segmentandose aun más hacia redes sociales, multimedia (videos & TV), publicidad local, dispositivos de mobilidad, etc…¿quien será el siguiente Google? Será Google capaz de captar estos nuevos mercados?

Y a este hilo, ¿conseguirán los grandes medios algún día igualar o superar los ingresos que actualmente generan por publicidad en papel? o ¿deberán de acogerse a un modelo intervencionista de estado a-la-Sarkozy?

Borja Ramirez Borja Ramirez

Este post de Colbenson requiere una reflexión. Nos habla sobre como todos nosotros, habituales usuarios de buscadores Web como Google, nos hemos habituado a ignorar los elementos de publicidad, y nos hemos vuelto inmunes a todo lo que rodea una lista de resultados. Nuestro foco de atención se dirige directamente al primer resultado; todo lo demás es redundante. El equipo de Colbenson reitera las conclusiones de un estudio de eye tracking sobre Google Adwords con datos de sus clientes. La imagen de abajo muestra los resultados de dicho estudio.

Mapa Calor estudio Eye Tracking sobre Adwords

Mapa Calor estudio Eye Tracking sobre Adwords

Muchas empresas comienzan a “esconder” o mejor dicho a integrar resultados “predefinidos” y asociados a determinadas palabras clave (lease enlaces patrocinados) entre los propios resultados de una búsqueda, debido a este efecto de inmunidad que provocan los Adwords de Google. Esto comienza a ser una practica común en los buscadores de empresa (tanto en los internos de INternet como en los externos para cliente) e incluso en los de algunas instituciones públicas.

¿Que opinais al respecto? ¿creeis que cuando un resultado procede de un enlace, el usuario debería de ser notificado? Todo un tema para debate…

Borja Ramirez Borja Ramirez

I post below my comments re:enterprise search software in the cloud, say in SaaS mode, taken from the LinkedIn Enterprise Search Proffessionals Group.  If you´re not yet subscribed, I highly recommend doig so.

Interesting conversation….my answer re: cloud based search is that it is a good fit for site search, but not so good for intranet search. Nevertheless, all enterprise search software companies will be obliged to offer their product line in a SaaS basis in order to be competitive in the near future.

I´ve read all your comments with great detail, and I agree with most of you in the sense that an enterprise search through a SaaS or IaaS approach shows many pros or cons…my personal take on this is that most site search projects will tend to live in the cloud very soon, and in the other hand most corporate “behind-the-firewall” search projects will tend to be managed and hosted internally. Some of you have already highlighted the underlying criteria for hosting corporate access infrastructures internally (internal compliance re: corporate data hosting, not being able to have all security control settings such as direct synch-ups with user directories & doc ACLs living outside the company, having control over indexing processes, scaling hw when needed, fault tolerance, etc..), these are too many hurdles to cross for an internal secured access platform to be externalized to the cloud.


Continuar leyendo…

Creative Commons License
Esta obra está bajo una licencia de Creative Commons.
Powered by WordPress | Theme design based on "Corporate" by Ori Pearl