El Almanaque de la Web 2022: una fuente de datos sobre la gigantesca red de hipertexto
El Almanaque de la Web 2022 contiene 22 capítulos explicativos sobre los datos recogidos por el Archivo HTTP, que es el sitio en el que la gente del Archivo de Internet (Archive.org) guarda permanentemente los datos de la World Wide Web.
Los 22 capítulos están divididos en cuatro secciones:
- Contenidos de las páginas: CSS, JavaScript, Fuentes…
- Experiencia de usuario: SEO, accesibilidad, versión móvil…
- Publicación de contenidos: CMS (sistemas de contenidos), sostenibilidad…
- Distribución de contenidos: Peso de las páginas, HTTP(s)
Los expertos que se encargan de cada uno de los apartados analizan los datos más actualizados que hay en el inmenso archivo para extraer algunas tendencias y conclusiones. ¿En qué idiomas están escritas las páginas web? ¿Cuántos contienen metadatos sociales en formato Open Graph? ¿Qué atributos se suelen asociar con los enlaces de hipertexto?
Igual de interesante que los datos en sí son las herramientas que se usan para los análisis, desde Lighthouse de Google a Parsel para los CSS o el Wappalyzer que detecta hasta 98 «tecnologías» (laxo término) de unas 3.800 que se conocen y pueden detectar en la Web.
Relacionado:
Powered by WPeMatico