Estudio de Uso de Tecnologías en el millón de páginas más vistas según Alexa
Partiendo de la idea del blog de de Andros, y del post sobre su estudio del uso de WordPress con un ejemplo de Clojure. He iniciado un proyecto secundario sobre el uso de las tecnologías usadas en las, más de 1.000.000 principales webs de Internet según Alexa. La idea, es la de ampliar la publicación de datos hasta cubrir el millón de páginas principales de Alexa.
Para realizar el trabajo he creado un proyecto basado en Python, utilizando el detector de tecnologías de Wappalizer, y una versión en python 3 de la biblioteca wappalizer. He almacenado los resultados en una BBDD MongoDB para su posterior revisión y utilizado Plotly par generar las gráficas.
- Jquery es una biblioetca JS de manipulación del DOM
- ZeptoJS es una biblioteca JS que substituye a Jquery
- Nginx es un servidor web ligero y balanceador de carga
- Tengine es un servidor web heredado de Nginx
- Google Web Server es una versión propietaria de servidor web de Google
- RequireJS es una biblioteca cargadora de ficheros JS
- Varnish es un servidor de cache web
- Apache Traffic Server es un servidor de cache web
Comments