¿Cómo detectar y resolver el Thin Content dentro de la web de nuestro eCommerce?
¿Sabes qué es el Thin Content o "Contenido Pobre" y cómo solucionarlo en tu web, en caso de cometer esta irregularidad?
Pues si tienes una tienda online, deberías estar ya familiarizado con este tema, porque es un problema muy frecuente que te puede hacer perder mucho tráfico y ventas.
En el artículo de hoy, hablamos sobre cómo detectar y resolver esta incidencia.
¿Qué es Thin Content?
El Thin Content es el contenido de baja calidad o contenido que, según criterios de Google, no aporta valor añadido sobre una temática concreta, en una página concreta.
Podemos estar hablando de páginas sin contenido o páginas donde el texto incluido no tiene mucho sentido o mucho interés para el usuario.
¿Cuáles son los tipos de Thin content que existen?
En esta página de Google de ayuda a webmasters, se mencionan los principales tipos de contenido de baja calidad o Thin content.
Los más relevantes de cara a un comercio electrónico serían los siguientes:
1. Páginas Doorway
Las páginas Doorway o Páginas Puerta, que suena bastante menos “cool”, son URLs o páginas de aterrizaje, donde no aportamos ningún valor al usuario para la intención de búsqueda por la que debería llegar al sitio.
Si generamos sistemáticamente páginas que contienen términos clave en sus URLs, pero luego no tenemos el producto o la información adecuados para satisfacer la intención de búsqueda, estamos ante un caso de páginas doorway.
Suelen ser páginas donde el usuario al final termina siempre realizando la misma acción, independientemente de la página en la que aterrice.
Por ejemplo, se ve obligado a realizar una búsqueda interna o a hacer clic en una llamada a la acción.
Un caso muy típico es cuando tenemos en un sitio web una página para cada ciudad o región, pero no hay contenido de calidad adaptado a esa búsqueda.
No es lo mismo colocar una página de aterrizaje con la información (servicios, horarios, departamentos…) de un centro comercial concreto en una ciudad concreta (como hace por ejemplo El Corte Inglés), que coloca una URL por cada ciudad tratando de posicionar una keyword concreta (típicamente una búsqueda local), pero con el mismo contenido en cada URL, como hace algún tiempo hacían muchas floristerías online.
2. Contenido generado automáticamente
Cuando hablamos de contenido generado automáticamente, nos referimos a textos generados mediante programación.
Se trata de contenido que puede haberse creado con una intención de engañar a los robots de rastreo, pero no tiene relevancia para el usuario.
Por ejemplo, textos sin sentido que incluyen keywords, textos traducidos de otros portales, textos autogenerados a partir de otras fuentes o de otros algoritmos que están simplemente ideados para generar contenido, pero sin pensar en el usuario.
La clave es valorar si el contenido está aportando algo al usuario o no.
El gran salto en Google con respecto a estos tipos de contenido de baja calidad, fue con el Google Panda Update de 2011.
Cuando Google, se cansó de ver páginas de contenido pobre, sin valor añadido, creadas con la intención de manipular los rankings.
3. Contenido copiado
Como su propio nombre indica, el contenido duplicado se refiere a textos que han sido copiados de otras fuentes o portales.
Lógicamente es mucho más sencillo copiar contenido de páginas web que ya están apareciendo en las primeras posiciones, que generar contenido de igual valor para el usuario para un sitio web.
Seguro que has encontrado alguna vez una página de dudosa reputación que están contando exactamente lo mismo que otro portal mucho más popular, con las mismas palabras.
Probablemente esté copiando el feed de ese portal y publicando en el suyo.
También hay programas de scraping que alteran el vocabulario utilizado mediante sinónimos y construcciones de frases distintas para camuflarlo.
Esta es una conocida técnica black hat SEO muy frecuente y penalizada por Google.
4. Páginas Vacías de contenido
Las páginas vacías de contenido, serían aquellas URLs de tu e-commerce, que no tienen texto y por tanto no se diferencian del resto de URLs con un contenido único.
Típicamente cuando tenemos listados de productos que no tienen texto o URLs para determinados productos que no tienen texto.
Son páginas que al final tienen prácticamente el mismo código fuente y no se diferencian entre sí.
¿Cómo afecta a un comercio electrónico?
El Thin content es un problema muy común en tiendas online.
Porque, a menudo tenemos listados de productos que no cuentan con contenido único.
A veces generamos URLs a través de los filtros, que se indexan en buscadores, pero que no aportan un valor añadido o diferenciación sobre el resto de páginas.
Por tanto, nos encontramos con que Google puede estar empleando desperdiciando presupuesto de rastreo o Pagerank (enlazado interno) en páginas que no están optimizadas para SEO y que no las incluyen en su índice o no consiguen buenos rankings.
Yo he trabajado con tiendas online que no terminaban de despegar en cuanto a posicionamiento orgánico por problemas de Thin Content.
Y al resolver estos problemas, en algunos casos sin apenas aplicar otras técnicas (ej. construcción de enlaces), han triplicado su tráfico orgánico en menos de 3 meses.
Además, un eCommerce grande puede llegar a perder grandes cantidades de tráfico orgánico, por una de las acciones manuales o penalizaciones algorítmicas de Google en lo que se refiere a contenido basura.
Zalando fue una de las primeras tiendas online en darse cuenta de la importancia de crear contenido original para sus categorías de producto, tratando de dar respuesta a la intención de búsqueda del usuario.
Si entras en cualquier categoría de esta tienda online, puedes ver cómo, a pesar de ver lo primero el listado de productos, al final de la página (haciendo scroll) hay un texto que explica todo lo relacionado con esa categoría y que puede ser de interés para el usuario.
¿Cómo detectar el Thin content?
Aquí te dejo un listado de herramientas para detectar Thin Content.
» Google Analytics + Google Search Console
Lo más práctico para detectar contenido duplicado es utilizar Google Analytics en combinación con Search Console.
Al tener vinculados los datos que nos dan estas dos herramientas, podemos ver las páginas que están consiguiendo peor rendimiento en Google.
Páginas que no tienen impresiones o esas son muy residuales y no generan visitas porque no tienen el contenido de valor como para aparecer en primeras posiciones.
» Dinorank
Dinorank es una nueva herramienta SEO de Blogger3cero, que cuenta con una funcionalidad para detectar este tipo de contenido de escaso valor.
Basta con sincronizar los datos de Analytics y Search Console, para que el sistema pueda detectar automáticamente este problema como hemos visto en el apartado anterior.
Le indicamos el rango de fechas que queremos valorar, y nos va indicando una a una las URLs sospechosas de Thin Content.
» Oncrawl
Oncrawl es una herramienta muy potente para tiendas online.
Lo mejor de Oncrawl, es que te permite analizar de manera exhaustiva el rendimiento de tu e-commerce en las búsquedas a partir de datos de los accesos reales que hacen los robots (y los usuarios) y que quedan registrados en los logs del servidor.
Además, te permite integrar los datos de la propia herramienta y de tus servidores, con herramientas de terceros más especializadas en otros parámetros (ej. keyword research, analítica web…).
Así, puedes cruzar los datos de accesos reales de Google a páginas concretas, con los datos de experiencia de usuario que te proporciona Google Analytics.
Incluso hay una función para ver el número de palabras de cada página según su nivel de profundidad y su pagerank.
Lo cual es muy útil para ver qué nivel de calidad de contenido tienen las páginas que supuestamente son más importantes en el sitio web.
¿Qué hacer para arreglar el problema de Thin Content?
- Generar contenido nuevo para las páginas verdaderamente relevantes:
- Al menos 300 palabras en las categorías de producto.
- Al menos 150 palabras en las fichas de producto. Te recuerdo que hay un módulo muy interesante en Prestashop para crear descripciones únicas para las variaciones de un mismo producto.
- Utilizar la etiqueta <link rel="canonical" href="https: //www. tutienda. com/categoria-producto-x/ " /> hacia la página realmente relevante para la intención de búsqueda concreta. Una solución perfecta para cuando tenemos Thin Content generado por la paginación de los listados de productos.
- Unificar todas las páginas que presenten contenido duplicado, en una misma página.
- Eliminar contenido que no es relevante y hacer la redirección correspondiente:
- 301 si tenemos o vamos a crear un contenido nuevo que pueda satisfacer la intención de búsqueda del que hemos eliminado
- 410 si no vamos a tener contenido que lo sustituya
- Utilizar la etiqueta <meta name="robots" content="noindex,nofollow"/> para que los robots no utilicen esa URL para su índice. Esta solución es aplicable cuando tenemos contenido escaso en páginas generadas por los filtros de una categoría determinada.
Conclusión
En cualquier tienda online es probable encontrarse con alguno de los tipos de problemas de contenido escaso o Thin content que menciono arriba, pero detectarlo y resolverlo es más sencillo de lo que parece.
Como norma general, la clave está en generar contenido único para aquellas páginas que realmente interesan y que deben adquirir autoridad porque son las más relevantes para los usuarios dentro del sitio web.
Generalmente el contenido más relevante es el correspondiente a los listados de productos, que es donde podemos atraer a mayor número de usuarios, ya responden a intenciones de búsqueda más masivas.
En un segundo nivel de importancia, nos encontraremos con las fichas de producto. Que también debemos trabajar, porque pueden atraer muchas búsquedas, pero son búsquedas más residuales en comparación a las categorías a las que pertenecen.
Para este tipo de páginas, podemos generar descripciones de manera automática basadas en patrones y variables, como las que se crean en el módulo CombiFeatures.
Si se trata de un proyecto pequeño sin demasiados medios económicos para resolver estos errores de manera masiva, siempre es posible trabajarlas progresivamente, comenzando por las más rentables y terminar por las menos relevantes.
¡Está en tu mano conseguir ese tráfico que estás dejando escapar!
Imagen principal de Freepik.