- GianlucaLover Member
- Posts : 2239
Età : 27
Registrato Dal : 03.06.10
Il File Robots.txt
Mar Lug 12 2011, 11:46
- Il file robots.txt, cos’è e a cosa serve ?
Il file Robots.txt (www.robotstxt.org) serve ad indicare agli spider quali directory NON visionare ed eventualmente bloccare user agent indesiderati. Il file Robots.txt è un semplice file txt che va creato nella root (directory iniziale) del sito (www.sito.it/robots.txt) e contiene 2 campi: User-agent che indica il nome dello spider e Disallow l’istruzione riferite allo spider .
Nel caso non vogliamo porre limiti agli spider è consigliato creare un file robots.txt vuoto per evitare che venga restituito ai motori l’ errore 404 (file non trovato).
- Esempi di istruzioni da inserire nel Robots.txt
Googlebot non deve visionare la directory ‘cartella_personale’
Codice:
User-agent: googlebot
Disallow: /cartella_personale/
_______________________________
Googlebot non deve visionare nulla
Codice:
User-agent: googlebot
Disallow: /
________________________________
Tutti gli spider non devono visionare la directory ‘cartella_personale’
Codice:
User-agent: *
Disallow: /cartella_personale/
____________________________
Non ci sono limitazioni per gli spider
Codice:
User-agent: *
Disallow:
______________________________
Fonte: giorgiotave.it
Il file Robots.txt (www.robotstxt.org) serve ad indicare agli spider quali directory NON visionare ed eventualmente bloccare user agent indesiderati. Il file Robots.txt è un semplice file txt che va creato nella root (directory iniziale) del sito (www.sito.it/robots.txt) e contiene 2 campi: User-agent che indica il nome dello spider e Disallow l’istruzione riferite allo spider .
Nel caso non vogliamo porre limiti agli spider è consigliato creare un file robots.txt vuoto per evitare che venga restituito ai motori l’ errore 404 (file non trovato).
- Esempi di istruzioni da inserire nel Robots.txt
Googlebot non deve visionare la directory ‘cartella_personale’
Codice:
User-agent: googlebot
Disallow: /cartella_personale/
_______________________________
Googlebot non deve visionare nulla
Codice:
User-agent: googlebot
Disallow: /
________________________________
Tutti gli spider non devono visionare la directory ‘cartella_personale’
Codice:
User-agent: *
Disallow: /cartella_personale/
____________________________
Non ci sono limitazioni per gli spider
Codice:
User-agent: *
Disallow:
______________________________
Fonte: giorgiotave.it
- ValerioLover Member
- Posts : 3300
Età : 27
Registrato Dal : 31.07.10
Re: Il File Robots.txt
Mar Lug 12 2011, 13:48
Non ne avevo mai sentito parlare di questo file robots... complimenti, bravo ;)
- Elia
- Posts : 18
Età : 27
Registrato Dal : 10.07.11
Re: Il File Robots.txt
Mer Lug 13 2011, 08:26
Qualche mese fà realizzai una guida su come usare questo file robots.txt. E' veramente utile ma ormai tutti i CMS dal pannello di controllo hanno una funzione dedicata al file robots.txt
Permessi in questa sezione del forum:
Non puoi rispondere agli argomenti in questo forum.