Usá site:tudominio para encontrar problemas
El comando site, sirve para restringir la búsqueda en Google a un dominio o subdominio en particular. Es decir, en vez de buscar en toda la web, busca solo en el dominio especificado. Por ejemplo, ingresando en el buscador lo siguiente:<div>
</div><div>auto site:grippo.com.ar </div><div>
</div><div>
</div>
Sólo busca "auto" en el dominio grippo.com.ar. Ahora bien, si sólo busco:
entonces obtengo información interesante. En este instante me dice que el index de Google tien 2.260.000 páginas de grippo.com.ar. Ese dato es muy variable de todas maneras, ya que Google siempre está mezclando versiones viajes del sitio con versiones más nuevas, asique oscila mucho. De todas maneras, mirando los resultados (te recomiendo entrar en preferencias y ajustar el valor a 100 resultados por página), siempre se encuentran problemas a simple vista.
Por ejemplo, páginas indexadas que no deberían estar indexadas, como ser plantillas o documentos, o listings de directorios que quedaron dentro del espacio virtual de la web. En la próxima imagen, el segundo resultado es una versión en japonés de la documentación de Apache, que descubrí indexada hace más de un mes, y todavía no lo logro:
Google había indexado otras 100 páginas en japonés, correspondientes a la documentación de Apache. Este otro ejemplo es muy triste, por alguna razón faltaban los index.html:
Muchas veces así se indexan cartas de alguna novia/o al/la cual ya no seguimos, o alguna foto comprometedora que sin querer quedó al descubierto. El comando "site:" viene en nuestra ayuda para descubrir todos esos problemas a simle vista.
¿Por qué problema y por qué SEO? Porque muchas veces con este comando site: descubrimos duplicación de contenidos. La mayoría de los programadores somos vagos, y cuando empezamos algun proyecto nuevo, tratamos de basarnos en alguno anterior que sea parecido, abusando del copiar y pegar. A medida que unos proyectos avanzan, otros siempre quedan en la cola. Mientras están en la cola, podrían estar siendo indexados por Google. Eso me pasó y acabo de descubrir 100 mil urls indexadas duplicadas. OMG.
Mi solución siempre que quiero hacer desaparecer algo de Google, consiste en:
- Hacer que el http server responda "410 Gone" a todo request que quiero eliminar del index de Google.
- Ir a Webmasters Tools, e incrementar la velocidad de crawling al máximo.
No ser canuto: probá ahora con tus dominios y comentá qué macana te mandaste!