En mi anterior post, hace ya mas de un mes según veo (que barbaridad, desde que tuiteo más asiduamente mi volumen de posts aqui ha bajado drasticamente, será que Twitter te hace más vago?), hablaba sobre la búsqueda en tiempo real, sus retos y las posibilidades que se abren. Hoy me gustaria profundizar un poco más sobre el propio ranking de una búsqueda en tiempo real. ¿Que elementos deberían de participar en el algoritmo de ranking de una búsqueda en Twitter por ejemplo? ¿en base a que criterios deberían de “ordenarse” los resultados de una busqueda en tiempo-real?
Todas estas preguntas me rondaban la cabeza durante las ultimas semanas, pero este post y los comentarios de este otro, me ha provocado a venir aqui y escribir estas lineas:
Twitter will be improving Twitter Search to index content beyond Twitter.com by crawling links within Twitter posts, and also by adding a ranking algorithm to the search results.
….Twitter hopes to build a ranking algorithm that not only takes into account relevancy, but also the current hot trends and reputation of the Twitter users.
A continuación expongo bajo mi criterio cuales son los ingredientes importantes (no están en orden de prioridad):
1) Autoridad o CREDIBILIDAD o REPUTACION del usuario Twitter. Al igual que Google otorga un PageRank determinado a sitios web en base a su popularidad, frecuencia de publicación, si es gubernamental o comercial, etc..Twitter deberá “cualificar” metricamente la credibilidad y autoridad de un Twitero. No es lo mismo que yo diga algo, a que lo haga Obama o Tim Oreilly, Chris Anderson, Guy Kawasaki, etc..por citar a algunos de los twiteros más famosos. Bien, ¿como determinamos la credibilidad de un usuario? Es importante por poner un ejemplo el volumen de Followers o el ratio de Followers / Following? O por poner otro ejemplo, podemos medir la credibilidad de un usuario en base al volumen de ReTwitts (i.e. RTs) que la comunidad realiza de sus twitts?
Vamos a enumerar algunos de ellos:
- Numero de Followers: Es importante saber cuantos usuarios te siguen, pero no es trascendental. De hecho, hay servicios de empresas con muchos followers, pero eso no quiere decir que tenga buena reputacion o credibilidad como fuente. Lo importante no es saber cuantos followers tienes, sino quienes son tus followers. La clave está en cualificar quienes son tus followers analizando a quien hacen following tus followers; es decir, si tus followers tienen un TwitterReputation alto, entonces hace que tu usuario tenga un TwitterReputaion ranking alto. Es similar al concepto de PagRank, dime quien te enlaza y te diré quien eres ;)
- Numero de Following: Tampoco dice mucho que un usuario siga a muchos otros bajo mi punto de vista.
- Numero de Co-followers. Me parece interesante este concepto que avanzan en este post. Para determinadas aplicaciones puede ser interesante la relacion entre los followers; es decir, que los que te hacen following tambien conectados entre sí. Esto implica una comunidad especifica y otorga credibilidad a ese determinado grupo de usuarios por sus interconexiones.
- Numero de retuits de mensajes propios. Cuando alguien retwitea algo, significa intención de amplificar un mensaje a otra comunidad. Si un mensaje es muy retwiteado implica bajo mi opinión que el mensaje y su autor por extensión son interesantes.
- Frecuencia de twiteo. No lo veo muy relevante.
- Antiguedad en Twitter. Tampoco.
2) Actualidad o FRESCURA del micro-post. Sin duda alguna, la fecha (hora y dia) de un micro-post es un dato trascendental. Acordaos que la finalidad de una búsqueda en tiempo real reside en saber que esta diciendo la gente ahora sobre determinado tema.
3) Twitt VS documentos enlazados. Las caraterísticas de la fuente son un elemento fundamental a la hora de ponderar atributos y ordenar un set de resultados. En el caso de Twitter, los mensajes estan compuestos por uno o dos elementos: el mensaje en si (i.e. el tuit), y los documentos enlazados, los cuales son igual o inluso mas importantes aun que el propio mensaje. En nuestros experimentos en Colbenson con el API de Twitter Search, hemos llegado a la conclusión de que es más importante & relevante lo que enlazamos que lo que decimos, extraño verdad?





4 comentarios to '¿Como será el PageRank de Twitter?'
20, mayo, 2009
[...] Leer el resto de post desde aquí. [...]
24, mayo, 2009
[...] de micro-blogging. Pero la duda de todos es saber qué factores tendrá en cuenta esta búsqueda. Borja realiza un muy buen análisis que, con su permiso, [...]
24, mayo, 2009
Aquí mi complemento a tu buen artículo, Borja: http://blog.francescgrau.com/%C2%BFtweetrank
Un saludo!
Francesc
26, mayo, 2009
Excelente articulo el tuyo Francesc! Me alegro haberte “iluminado” e impulsado a escribir sobre el TweetRank!
Lo voy a recomendar por Twitter ahora mismo ;)
Un saludo,
Borja
Deja un comentario