En uno de los mas estúpidos movimientos de la ya bastante lastimada compañía, America On Line a  decidido publicar una gran cantidad de búsquedas reales ligadas a usuarios reales, pretendiendo servir a la comunidad científica. AOL a removido rápidamente el link oficial para descargar las 20 millones de búsquedas reales ligadas a usuarios después de la reacción de la opinión publica, sin embargo ya existen muchos mirrors de la descarga.

Considera lo siguiente:

AOL acaba de publicar las búsquedas de 500,000 de sus usuarios recolectadas en 3 meses a principios de este año. Esto quiere decir, que si tu resultas ser usuario de AOL y eres uno de los elegidos, todas las búsquedas que realizaste de Marzo a Mayo del 2006, son ahora información publica en Internet.

Esto no fue un error, fue intencional. En su desesperación por adquirir reconocimiento de la comunidad científica, AOL decidió que comprometería su integridad al proveer un gran set de datos que seria citado regularmente en investigaciones: “Por favor has referencia a esta publicación cuando utilices esta colección” era el mensaje antes de la descarga oficial.

Los datos incluyen numero de usuario, búsqueda, fecha, hora y datos de clickeo. Entre ellas podemos encontrar búsqueda de los mas espantosas como “como asesinar a tu esposa” o de lo mas chistosas/irónicas como es el caso de la búsqueda:

11467570 como apagar mis búsquedas recientes en aol 2006-05-28 18:44:42

Naturalmente esta información esta ya siendo usada para keyword research y por supuesto podemos esperar mareas de search engine spam basado en este set de datos. Esta información se puede utilizar también para análisis competitivo así como para muchos mas usos creativos.

En the consumerist podemos encontrar el primer caso publicado de un usuario que ha sido identificado en el mundo real, a través de esta información.

Una herramienta para manipular esta información con la que he estado jugando es SEO Sleuth.

Por supuesto la descarga, incluso considerando que las búsquedas son en ingles, es muy recomendable y sera muy útil para aquellos lo suficientemente creativos para encontrarle uso a los datos a pesar de no ser en español.