Qu'est-ce qu'un fichier robotstxt et comment l'utiliser ?

Le Lundi 13 février 2023
Un fichier robotstxt est un fichier qui permet aux robots d'indexation de mieux comprendre votre site et comment il doit être indexé. Cela peut être très utile pour les sites qui ont beaucoup de contenu ou qui ont des pages qui ne doivent pas être indexées. Le fichier robotstxt se situe à la racine de votre site et doit être nommé robots.txt. Si vous ne l'avez pas encore créé, vous pouvez le faire vous-même avec un éditeur de texte. Vous pouvez également utiliser un outil en ligne comme Google Webmaster Tools pour générer le fichier pour vous. Une fois que vous avez créé le fichier, vous devez l'uploader sur votre serveur web. Si vous hébergez votre site sur WordPress, vous pouvez télécharger le fichier directement dans l'administration de votre site. Une fois le fichier en place, vous pouvez commencer à l'utiliser pour bloquer les robots d'indexation de certains fichiers ou dossiers de votre site. Par exemple, si vous avez un dossier qui contient des images que vous ne souhaitez pas que les robots indexent, vous pouvez ajouter cette ligne au fichier : User-agent: * Disallow: /images/ Cela indiquera aux robots qu'ils ne doivent pas indexer le dossier /images/. Vous pouvez également bloquer l'accès à des fichiers spécifiques, comme votre fichier htaccess. Pour ce faire, vous pouvez ajouter cette ligne au fichier : User-agent: * Disallow: /.htaccess Cela indiquera aux robots qu'ils ne doivent pas accéder au fichier htaccess. Si vous avez un fichier index.php dans un dossier que vous ne voulez pas que les robots indexent, vous pouvez l'exclure en ajoutant cette ligne au fichier : User-agent: * Disallow: /folder/index.php Vous pouvez également spécifier quels types de fichiers les robots peuvent ou ne peuvent pas indexer. Par exemple, si vous ne voulez pas que les robots indexent les fichiers PDF de votre site, vous pouvez ajouter cette ligne au fichier : User-agent: * Disallow: /*.pdf$ Cela indiquera aux robots de ne pas indexer les fichiers qui se terminent par .pdf. Vous pouvez également bloquer l'accès à des fichiers spécifiques, comme votre fichier htaccess. Pour ce faire, vous pouvez ajouter cette ligne au fichier : User-agent: * Disallow: /.htaccess Cela indiquera aux robots qu'ils ne doivent pas accéder au fichier htaccess. Si vous avez un fichier index.php dans un dossier que vous ne voulez pas que les robots indexent, vous pouvez l'exclure en ajoutant cette ligne au fichier : User-agent: * Disallow: /folder/index.php Vous pouvez également spécifier quels types de fichiers les robots peuvent ou ne peuvent pas indexer. Par exemple, si vous ne voulez pas que les robots indexent les fichiers PDF de votre site, vous pouvez ajouter cette ligne au fichier : User-agent: * Disallow: /*.pdf$ Cela indiquera aux robots de ne pas indexer les fichiers qui se terminent par .pdf.

Contactez-nous


Pour une réponse plus rapide, décrivez au mieux votre projet, détaillez votre besoin et les compétences dont vous avez besoin.

Adresse : 18 Rue Félibre Gaut, 13100 Aix-en-Provence

Téléphone : +33 9 81 88 25 84

E-mail : [email protected]

CGV - Mentions légales