Calidad Sobre Cantidad para la Indexación de Google

Dos tendencias han impactado cómo Google lleva a cabo la indexación. Mientras que la web abierta ha disminuido, Google necesita rastrear a través de grandes plataformas de contenido como YouTube, Reddit y TikTok, que a menudo están construidas sobre marcos JS "complejos", para encontrar nuevo contenido. Al mismo tiempo, la IA está cambiando las dinámicas subyacentes de la web al hacer redundante el contenido mediocre y pobre.
En mi trabajo con algunos de los sitios más grandes de la web, he notado últimamente una relación inversa entre las páginas indexadas y el tráfico orgánico. Más páginas no son automáticamente malas, pero a menudo no cumplen con las expectativas de calidad de Google. O, en mejores términos, la definición de calidad ha cambiado. Las apuestas para los SEOs son altas: si se expande demasiado agresivamente, todo su dominio podría sufrir. Necesitamos cambiar nuestra mentalidad sobre la calidad y desarrollar sistemas de monitoreo que nos ayuden a entender la calidad del dominio a nivel de página.
Satisfecho
Google ha cambiado la forma en que trata los dominios, comenzando alrededor de octubre de 2023: ningún ejemplo mostró la relación inversa antes de octubre. Además, Google tuvo problemas de indexación cuando lanzaron la actualización del algoritmo principal de octubre de 2023, tal como ocurrió ahora durante la actualización de agosto de 2024.
Antes del cambio, Google indexaba todo y priorizaba el contenido de la más alta calidad de un dominio. Piensa en ello como la búsqueda de oro, donde llenas una pala con grava, suelo y agua y luego giras y revuelves hasta que solo queda material valioso.
Ahora, un dominio y su contenido necesitan demostrar su valor antes de que Google siquiera intente buscar oro. Si el dominio tiene demasiado contenido de baja calidad, es posible que Google solo indexe algunas páginas o ninguna en casos extremos.
Un ejemplo es doordash.com, que agregó muchas páginas en los últimos 12 meses y perdió tráfico orgánico en el proceso. Al menos algunas, tal vez todas, de las nuevas páginas no cumplían con las expectativas de calidad de Google.

¿Pero por qué? ¿Qué ha cambiado? Razono que:
- Google quiere ahorrar recursos y costos a medida que la compañía se mueve hacia un estado de mente de eficiencia operativa.
- La indexación parcial es más efectiva contra el contenido de baja calidad y el spam. En lugar de indexar y luego tratar de clasificar nuevas páginas de un dominio, Google observa la calidad general de un dominio y maneja las nuevas páginas con el escepticismo correspondiente.
- Si un dominio produce continuamente contenido de baja calidad, no obtiene la oportunidad de contaminar aún más el índice de Google.
- La barra de calidad de Google ha aumentado porque hay mucho más contenido en la web, pero también para optimizar su índice para RAG (visiones generales de IA) y entrenar modelos.
Este énfasis en la calidad del dominio como una señal significa que debes cambiar la forma de monitorear tu sitio web para tener en cuenta la calidad. Mi principio rector: “Si no puedes añadir nada nuevo o mejor a la web, es probable que no sea lo suficientemente bueno.”
Comida de Calidad
La calidad del dominio es mi término para describir la relación entre las páginas indexadas que cumplen con el estándar de calidad de Google frente a las que no. Ten en cuenta que solo las páginas indexadas cuentan para la calidad. El porcentaje máximo de páginas "malas" antes de que Google reduzca el tráfico a un dominio no está claro, pero ciertamente podemos ver cuándo se cumple:



Defino la calidad del dominio como una señal compuesta de 3 áreas: experiencia del usuario, calidad del contenido y condición técnica:
- Experiencia del usuario: ¿los usuarios están encontrando lo que buscan?
- Calidad del contenido: ganancia de información, diseño del contenido, exhaustividad
- Técnicamente optimizado: contenido duplicado, renderizado, contenido en la página para contexto, “rastreados, no indexados/descubiertos”, soft 404s

Un aumento repentino en las páginas indexadas generalmente indica un problema técnico como contenido duplicado por parámetros, internacionalización o paginaciones rotas. En el ejemplo a continuación, Google redujo inmediatamente el tráfico orgánico a este dominio cuando una lógica de paginación se rompió, causando mucho contenido duplicado. Nunca había visto a Google reaccionar tan rápido a errores técnicos, pero ese es el nuevo estado del SEO en el que estamos.

En otros casos, un aumento en las páginas indexadas indica un juego de SEO programático donde el dominio lanzó muchas páginas utilizando la misma plantilla. Cuando la calidad del contenido en las páginas programáticas no es lo suficientemente buena, Google rápidamente cierra el grifo del tráfico.


En respuesta, Google a menudo reduce la cantidad de palabras clave que clasifican en las posiciones de los primeros 3. La cantidad de palabras clave que se clasifican en otras posiciones a menudo se mantiene relativamente estable.



El tamaño aumenta el problema: la calidad del dominio puede ser un problema mayor para sitios más grandes, aunque los más pequeños también pueden verse afectados.
Agregar nuevas páginas a tu dominio no es malo en sí mismo. Solo debes tener cuidado al respecto. Por ejemplo, publicar nuevo contenido de liderazgo de pensamiento o marketing de productos que no apunte directamente a una palabra clave aún puede ser muy valioso para los visitantes del sitio. Por eso es crítico medir el compromiso y la satisfacción del usuario además de las métricas de SEO.
Plan de Dieta
La forma más crítica de mantener la “grasa” (páginas de baja calidad) fuera y reducir el riesgo de ser afectado por una actualización principal es establecer el sistema de monitoreo adecuado. Es difícil mejorar lo que no mides.
En el corazón de un sistema de monitoreo de calidad de dominio está un panel que rastrea métricas para cada página y las mide contra el promedio. Si pudiera elegir solo tres métricas, mediría la tasa de rebote inversa, las conversiones (soft y hard), y clics + posiciones por tipo de página por página contra el promedio. Idealmente, tu sistema te alertaría cuando se produzca un aumento en la tasa de rastreo, especialmente para las nuevas páginas que no fueron rastreadas antes.
Como escribo en Cómo las mejores empresas miden la calidad del contenido:
1/ Para la calidad de producción, mide métricas como el puntaje del editor SEO, puntaje de Flesch/lectura, o el número de errores ortográficos/gramaticales
2/ Para la calidad de rendimiento, mide métricas como el número de posiciones en el top 3, la relación de tiempo en la página frente al tiempo de lectura estimado, tasa de rebote inversa, profundidad de desplazamiento o valor del pipeline
3/ Para la calidad de preservación, mide métricas de rendimiento a lo largo del tiempo y año tras año
Ignora páginas como los Términos de Servicio o Acerca de nosotros al monitorear tu sitio porque su función es irrelevante para el SEO.
Fase de Ganancia
El monitoreo es el primer paso para entender la calidad del dominio de tu sitio. No siempre necesitas agregar más páginas para crecer. A menudo, puedes mejorar tu inventario de páginas existentes, pero necesitas un sistema de monitoreo para descubrir esto en primer lugar.
Adidas es un buen ejemplo de un dominio que pudo aumentar su tráfico orgánico simplemente optimizando sus páginas existentes.

Otro ejemplo es Redfin, que mantuvo un número consistente de páginas mientras aumentaba significativamente su tráfico orgánico.

Citando al Sr. Director de Crecimiento de Producto en mi Redfin Deep Dive sobre cumplir con el estándar de calidad correcto:
Traer nuestra experiencia local al sitio web: ser la autoridad en el mercado de vivienda, responder a cómo es vivir en un área, ofrecer un conjunto completo de inventario en venta y alquiler en toda Estados Unidos.
Manteniendo la excelencia técnica: nuestro sitio es grande (más de 100 millones de páginas), así que no podemos descuidar cosas como el rendimiento, la salud del rastreo y la calidad de los datos. A veces, los esfuerzos menos "sexys" pueden ser los más impactantes.”
Empresas como Lending Tree o Progressive vieron ganancias significativas al reducir páginas que no cumplían con sus estándares de calidad (ver capturas de pantalla de las profundidades a continuación).


Conclusión
Google recompensa a los sitios que se mantienen en forma. En 2020, escribí sobre cómo el índice de Google podría ser más pequeño de lo que pensamos. El tamaño del índice solía ser un objetivo al principio. Pero hoy, se trata menos de indexar tantas páginas como sea posible y más de tener las páginas correctas. La definición de “bueno” ha evolucionado. Google es más exigente acerca de a quién deja entrar al club.
En el mismo artículo, planteé una hipótesis de que Google cambiaría a una API de indexación y dejaría que los propietarios de sitios asumieran la responsabilidad de la indexación. Eso no se ha materializado, pero podrías decir que Google está utilizando más APIs para la indexación:
- El acuerdo de $60/año entre Google y Reddit proporciona una décima parte de los resultados de búsqueda de Google (suponiendo que Reddit esté presente en el top 10 para casi cada palabra clave).
- En el comercio electrónico, donde más listados orgánicos aparecen más altos en los resultados de búsqueda, Google se basa más en el feed de productos en el Merchant Center para indexar nuevos productos y cuidar su Shopping Graph.
- Las características de SERP como Top Stories, que son críticas en la industria de noticias, son pequeños servicios con su propia lógica de indexación.
Mirando hacia el futuro, la gran pregunta sobre la indexación es cómo se transformará cuando más usuarios busquen a través de visiones generales de IA y chatbots de IA. Supongamos que los LLMs aún necesitarán poder renderizar páginas, el trabajo de SEO técnico sigue siendo esencial; sin embargo, la motivación para indexar cambia de mostrar resultados web a entrenar modelos. Como resultado, el valor de las páginas que no ofrezcan nada nuevo será incluso más cercano a cero que hoy.
Deja una respuesta