Bien souvent, vous utilisez un site de développement ou « site miroir » pour sauvegarder votre contenu ou encore réaliser des mises à jour pour une nouvelle version de votre site.

Pour ne pas pénaliser votre SEO pour contenu dupliqué et éviter que votre sous-domaine soit indexé, vous pouvez bloquer l’accès aux robots en utilisant une URL de développement spécifique, exemple 12334.com/monprojetdedev avec une identification par ID et mot de passe.

Dans le cas ou tout le contenu et le code sont dupliqués, vous pouvez utiliser un fichier htaccess en utilisant la directive RewriteRule avec la variable qui correspond au domaine demandé. Si le domaine demandé est le sous-domaine, on établit une redirection vers un autre fichier robots.txt qui bloque l’accès au site.

Il y a une astuce : utiliser la directive « RewriteRule » avec la variable, qui correspond au nom de domaine demandé. Si le nom de domaine demandé est le sous-domaine, on redirige le navigateur sur un autre fichier « robots.txt » qui interdit l’accès au site.

Exemple de rewrite ci-dessous :
RewriteEngine on
RewriteCond % ^miroir.monsite.fr$
RewriteRule ^robots.txt$ robots-2.txt

Lorsqu’un internaute ou un robot arrive sur la page de votre domaine principal, le site sera chargé normalement, s’il arrive sur le sous-domaine il sera redirigé vers le fichier robots-2.
Dans le fichier robots-2.txt, précisez les instructions interdisant l’accès et le référencement du sous-domaine :
User-agent: *
Disallow: /