Si disponen de una página web de más de 100 URLs tienes que saber que alguna de ellas están penalizando tu posicionamiento web debido a su indexación en Google.
En este artículo te explico: porqué no deberías indexar URLs en Google
Ahora que ya sabes el porqué vamos a profundizar en el cómo lo hacemos y que posibilidades disponemos.
Antes debemos entender que significa desindexar de Google si ya lo sabes sáltatelo 😉
¿Qué significa desindexar?
«noindex» o no indexar en Google significa que los motores de búsqueda no deben indexar una página web y, por lo tanto, no deben mostrarse en las páginas de resultados del motor de búsqueda.
Por otro lado «nofollow» significa que las arañas de los motores de búsqueda no deben seguir los enlaces de esa página.
Puede agregar estos valores a su metaetiqueta robots. La metaetiqueta robots es un fragmento de código en la sección de cabecera de una página web . Le dice a los motores de búsqueda cómo rastrear y si indexar una página.
Diferentes métodos para desindexar una URL
Aquí tienes 6 Formas para no indexar URLs en los buscadores que existen en la actualidad
1. Eliminar el contenido
Si eliminas la página y publicas un código de estado 404 (no encontrado) o 410 (desaparecido), la página se eliminará del índice poco después de que se vuelva a rastrear.
Hasta que se elimine, la página puede seguir apareciendo en los resultados de búsqueda.
Incluso si la página en sí ya no está disponible, una versión en caché de la página puede estar disponible temporalmente (30 días).
Cuándo podría necesitar una opción diferente:
- Necesito una remoción más inmediata. Consulte la sección de la herramienta de eliminación de URL .
- Necesito consolidar señales como enlaces. Vea la sección de canonicalización.
- Necesito la página disponible para los usuarios. Vea si las secciones de acceso restringido o sin índice se ajustan a su situación.
2. Noindex
Una metaetiqueta de robots noindex o una respuesta de encabezado x-robots le indicará a los motores de búsqueda que eliminen una página del índice.
La metaetiqueta robots funciona para páginas donde la respuesta x-robots funciona para páginas y tipos de archivos adicionales como PDF.
Para que se vean estas etiquetas, un motor de búsqueda debe poder rastrear las páginas, así que asegúrese de que no estén bloqueadas en robots.txt .
Además, tenga en cuenta que eliminar páginas del índice puede evitar la consolidación del enlace y otras señales.
Ejemplo de un meta robots noindex:
<meta name = "robots" content = "noindex">
Ejemplo de etiqueta noindex de x-robots en la respuesta del encabezado:
HTTP / 1.1 200 OK Etiqueta de X-Robots: noindex
Cuándo podría necesitar una opción diferente:
- No quiero que los usuarios accedan a estas páginas. Consulte la sección de restricción de acceso.
- Necesito consolidar señales como enlaces. Vea la sección de canonicalización.
3. Restringir el acceso
Si desea que la página sea accesible para algunos usuarios pero no para los motores de búsqueda, lo que probablemente desee sea una de estas tres opciones:
- Algún tipo de sistema de inicio de sesión
- Autenticación HTTP (donde se requiere una contraseña para acceder)
- Lista blanca de IP (que solo permite que direcciones IP específicas accedan a las páginas)
Este tipo de configuración es mejor para cosas como redes internas, contenido solo para miembros o para sitios de ensayo, de prueba o de desarrollo.
Permite que un grupo de usuarios acceda a la página, pero los motores de búsqueda no podrán acceder a ellos y no indexarán las páginas.
Cuándo podría necesitar una opción diferente:
Necesito una remoción más inmediata. Consulte la sección de la herramienta de eliminación de URL . En este caso particular, es posible que desee una eliminación más inmediata si el contenido que está tratando de ocultar se ha almacenado en caché y necesita evitar que los usuarios vean ese contenido.
4. Herramienta de eliminación de URL
El nombre de esta herramienta de Google es un poco engañoso ya que la forma en que funciona es que ocultará temporalmente el contenido. Google seguirá viendo y rastreando este contenido, pero las páginas no aparecerán para los usuarios.
Este efecto temporal tiene una duración de 6 meses en Google.
Estas herramientas deben usarse en los casos más extremos para cuestiones como problemas de seguridad, fugas de datos, información de identificación personal ( PII ), etc.
Para Google, use la Herramienta de eliminación
Aún debe aplicar otro método junto con el uso de la herramienta de eliminación para que las páginas se eliminen durante un período más largo (sin índice o eliminación) o evitar que los usuarios accedan al contenido si aún tienen los enlaces (eliminar o restringir el acceso).
Esto solo le brinda una forma más rápida de ocultar las páginas mientras la eliminación tiene tiempo de procesarse. La solicitud puede tardar hasta un día en procesarse.
5. Canonicalización
Cuando tiene varias versiones de una página y desea consolidar señales como enlaces a una sola versión, lo que desea hacer es alguna forma de canonicalización.
Esto es principalmente para evitar contenido duplicado mientras se consolidan múltiples versiones de una página en una única URL indexada .
Tienes varias opciones de canonicalización:
- Etiqueta canónica: Esto especifica otra URL como la versión canónica o la versión que desea que se muestre. Si las páginas están duplicadas o son muy similares, debería estar bien. Cuando las páginas son demasiado diferentes, la canónica puede ignorarse, ya que es una sugerencia y no una directiva.
- Redirecciones: Una redirección lleva a un usuario y un robot de búsqueda de una página a otra. 301 es el redireccionamiento más utilizado por los SEO y les dice a los motores de búsqueda que desea que la URL finalsea la que se muestra en los resultados de búsqueda y donde se consolidan las señales. Una redirección 302 o temporal le dice a los motores de búsqueda que desea que la URL originalsea la que permanezca en el índice y consolide las señales allí.
- Manejo de parámetros de URL: Se añade un parámetro al final de la URL y normalmente incluye un signo de interrogación. Esta herramienta de Google le permite decirles cómo tratar las URL con parámetros específicos. Por ejemplo, puede especificar si el parámetro cambia el contenido de la página o si solo está destinado a realizar un seguimiento del uso.
Cómo priorizar las eliminaciones
Si tiene varias páginas para eliminar del índice de Google, entonces deben priorizarse en consecuencia.
- Máxima prioridad: estas páginas suelen estar relacionadas con la seguridad o con datos confidenciales. Esto incluye contenido que contiene datos personales ( PII ), datos de clientes o información de propiedad.
- Prioridad media: Por lo general, se trata de contenido destinado a un grupo específico de usuarios. Intranets de la empresa o portales de empleados, contenido destinado solo a miembros y entornos de ensayo, prueba o desarrollo.
- Prioridad baja: Estas páginas suelen incluir contenido duplicado de algún tipo. Algunos ejemplos de esto incluirían páginas servidas desde múltiples URL, URL con parámetros y, nuevamente, podrían incluir entornos de ensayo, prueba o desarrollo. Aquí tienes la herramienta: https://www.google.com/webmasters/tools/crawl-url-parameters?
Casos prácticos sobre Desindexar URLs de Google
Como Desindexar URLS en Google