Román Cortés

Las palabras más frecuentes de Internet

14 de Abril del 2008

El año pasado analicé un total de 200.000 páginas web para realizar estadísticas. Empleé un sistema relativamente complejo para que las páginas fuesen seleccionadas de forma pseudoaleatoria y la estadística quedase bien distribuida.

No voy a entrar en todos los detalles del proceso de selección dado que sería demasiado largo para un post, pero aclaro que la búsqueda se realizó entre cientos de buscadores de todos los paises, en todos los idiomas e incluye todo tipo de webs, indiferentemente de su importancia o valoración por buscadores.

De este proceso obtuve alrededor de 120.000 webs que se podrían considerar elegidas al azar. Uno de los estudios sobre estas páginas fue la frecuencia de aparición de palabras y aquí os dejo el listado para que lo podáis analizar. Son más de 100.000, sólo he dejado las que aparecían 3 o más veces y están ordenadas por frecuencia.

En este post no pretendo publicar conclusiones ni gráficas sobre estos datos, sino que espero que algún lector se anime a hacerlo; sería muy interesante ver cualquier tipo de resultado.

Un comentario RSS

Comentar