question sur le fichier robots.txt
Auteur Sujet

Post 
bonjour,
J'ai une petite question concernant le fichier robots.txt, actuellement j'ai le fichier suivant:
User-agent: *
Disallow: /admin
Disallow: /banners
Disallow: /config
Disallow: /config-old
Disallow: /error
Disallow: /header
Disallow: /footer
Disallow: /pntables
Disallow: /images
Disallow: /includes
Disallow: /themes
Disallow: /pnTemp
Disallow: /docs
Disallow: /javascript
et je me pose la question suivante:
Il y a t-il des conséquences néfastes à le transformer de la sorte:
User-agent: *
allow: /
Ou il y a t-il des répertoires qui doivent être conservés en Disallow? si oui lesquels?
merci par avance de votre réponse
cordialement
Tunsia

Mieux vaut voyager plein d'espoir que d'arriver au but.
Données personnelles Accueil

Post 
C'est une sécurisation suplémentaire que d'emêcher l'indexation du contenu dans ces dossier.
Maintenant je te conseille d'autoriser un dossier que tu désire ou un dossier alloué au contenu que tu désires mettre en ligne.

++


Gilles  ><>°
Données personnelles Accueil

Post 
Il n'y a pas de conséquences néfastes directes, mais les robots risquent d'indexer tout ce qui ce trouve dans ces dossiers.

Au final tu auras du contenu indexé sur les moteurs de recherche que tu ne désirais pas vraiment voir indexé, le fichier robots.txt permet donc d'éviter cela et la liste des répertoires que tu as indiqué, il n'y a pas besoin de l'indexer, car il ne contiennent pas du contenu qui soit directement visible/affichable.

-------------------------------------------
...n'oubliez pas que l'outil Recherche est votre ami !
...bien souvent il répond à nos questions avant même que l'on ne se les pose ! ^^
Données personnelles Accueil

Post 
Merci à vous pour ces informations icon_wink
A bientôt

Mieux vaut voyager plein d'espoir que d'arriver au but.
Données personnelles Accueil

Post 
pourquoi tu voulais le supprimer ?
Données personnelles Accueil

Post 
non je ne voulais pas le supprimer mais je me disais que cela pouvait bloquer en partie l'indexation de mon site dans les moteurs.
vu qu'en ce moment je travaille sur le référencement de celui-ci, je suis allé voir le contenu du fichier robots.txt (je ne l'avais pas fais avant aujourd'hui icon_rolleyes )


Mieux vaut voyager plein d'espoir que d'arriver au but.
Données personnelles Accueil

Post 
ok si c'est pour du référencement, rajoute juste le contenu qui apparait de façon dupliqué sur ton site (note que les wild card sont autorisés)

genre
Citation :
Disallow:module-Forum-viewtopic-topic-*-start-0.html


permet de supprimer les pages comme

Citation :
http://www.postnuke-france.org/module-Forum-viewtopic-topic-1374-start-0.html


vu que sont contenu est déjà indexé par

Citation :
http://www.postnuke-france.org/module-Forum-viewtopic-topic-1374.html


modifié par : mumuri, 03 Avr 2008 - 13:43
Données personnelles Accueil

Post 
euh... j'ai pas tous compris... désolé!
Citation :
rajoute juste le contenu qui apparait de façon dupliqué sur ton site

pourquoi le contenu est-il dupliqué? comment trouver le contenu dupliqué?
Citation :
note que les wild card sont autorisés

qu'est ce que les wild card ?
icon_confused
Données personnelles Accueil
Post 
le étoile *
Données personnelles Accueil