webleads-tracker

autoriser moteur de recherche 1.8 mais bloquer google [CLOTURE]

Vincent StartUp
Avatar
Bonjour,

Dans un site où il y a d'installer le nouveau moteur de recherche 1.8beta, je ne voudrais qu'aucun moteur de recherche puisse indexer les pages sauf biensur celui interne au site.
Si je mets la balise
<meta name="robots" content="noindex, nofollow">
, ça va bloquer également le moteur interne ?

Si c'est le cas, comment faire autrement ?

Bon après-midi.
Vincent - StartUp Communication

Vincent StartUp
Avatar
Petite précision, et pas des moindres, le moteur de recherche est dans un mini-site, du coup je ne peux pas utiliser le robots.txt car il bloquerait le site parent.

Et question similaire à la 1ere, est-ce que le moteur de recherche interne tient compte du fichier robots.txt ?
Vincent - StartUp Communication

Vincent StartUp
Avatar
Après quelques tests, la baliste noindex empêche bien le moteur de recherche internet d'indexer le site, donc je suis bien obligé de me servir du robots.txt pour bloquer les autres moteurs de recherche.

Quel syntaxe dois-je mettre dans le robots.txt pour bloquer tous les robots sauf celui interne au site ?


Comment faire pour avoir un fichier robots dans un mini-site indépendant du site principale ? J'imagine que ceci nécessite l'intervention du labo ?
Vincent - StartUp Communication

Vincent StartUp
Avatar
up !
Vincent - StartUp Communication

Vincent StartUp
Avatar
Est-ce que dans la 1.8 on peut avoir un fichier robots par mini-site via l'onglet referencement ? ou autre solution
Vincent - StartUp Communication

Vincent StartUp
Avatar
@Medialibs : up !
Vincent - StartUp Communication

Vincent StartUp
Avatar
UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP
UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP
UP UP UP __ UP UP UP __ UP UP UP UP UP __ __ __ __ __ UP UP __ UP UP
UP UP UP __ UP UP UP __ UP UP UP UP UP __ UP UP UP __ UP UP __ UP UP
UP UP UP __ UP UP UP __ UP UP UP UP UP __ UP UP UP __ UP UP __ UP UP
UP UP UP __ UP UP UP __ UP UP UP UP UP __ UP UP UP __ UP UP __ UP UP
UP UP UP __ UP UP UP __ UP UP UP UP UP __ UP UP UP __ UP UP __ UP UP
UP UP UP __ UP UP UP __ UP UP UP UP UP __ __ __ __ __ UP UP __ UP UP
UP UP UP __ UP UP UP __ UP UP UP UP UP __ UP UP UP UP UP UP __ UP UP
UP UP UP __ UP UP UP __ UP UP UP UP UP __ UP UP UP UP UP UP UP UP UP
UP UP UP __ __ __ __ __ UP UP UP UP UP __ UP UP UP UP UP UP __ UP UP
UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP
UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP

:)
Vincent - StartUp Communication

William - Medialibs
Avatar
Très joli dessin Vincent, je salut la performance artistique ;)

Pour répondre à ta question, le useragent du moteur d'e-majine est "mnogosearch". Normalement avec le nom du moteur ce devrait être plus facile pour interdire l'indexation aux moteurs de recherche extérieurs.
En revanche à l'heure actuelle il n'y a qu'un seul robot.txt dans e-majine et non un par mini-site. Pour mettre en place ce type de configuration il faudrait demander un développement spécifique.

Au sujet du fichier robot.txt.
Par exemple pour interdir l'indexation d'un répertoire du site à tous les moteurs il faut écrire :
User-agent: *
Disallow: /repertoire-x/

Je ne connais pas assez bien le contexte de ton site pour te donner la config exacte, mais tu peux affiner la configuration du fichier robot.txt grâce à http://robots-txt.com/.
Community Manager - Medialibs

Vincent StartUp
Avatar
Salut William,

Oui je ne suis pas mécontent de moi :)

Merci pour ta réponse, le useragent va me servir.

Sii ça s'avère nécessaire, je ferais une demande au labo pour le 2eme fichier robots.txt pour le mini-site.

Bonne soirée,
Vincent - StartUp Communication