Avrete oramai compreso che non è semplice
inserire tutte le parole chiave all'interno della parte iniziale
della pagina (meta tags, title e righe iniziali), soprattutto se si
utilizzano delle immagini anziché semplici scritte. Ci sono diversi
siti che elencano semplicemente le keywords all'inizio della pagina,
condizionando la grafica del sito web.
I metodi per aggirare questo problema sono diversi ma il migliore è
quello dell'utilizzo dei tag hidden. Tag che non sono visibili per
l'utente che con il suo browser visualizza la pagina in questione.
Questo tag va nel "corpo" della pagina, all'interno dei tag <body>
</body>:
<input type="hidden" value="la lista delle keyword va qui"> Per la
precisione questo tag va inserito immediatamente dopo il tag , prima
di ogni altra cosa. Alcuni motori infatti, tengono conto solo dei
primi 200 caratteri circa di una pagina, così e necessario
posizionare i tag hidden prima di immagini e loghi grafici.
La cosa migliore dei tag hidden è che sono completamente invisibili
e quindi non condizionano la grafica; alcuni motori di ricerca li
considerano alla stregua di testo.
Altri motori di ricerca invece, rilevano e penalizzano questo
espediente. Prima di utilizzare il tag hidden per questo scopo
analizzare motore per motore e effettuare le modifiche se
necessario. Fate delle prove, se il tag hidden non da risultati non
continuate ad utilizzarlo. E ricorda che i motori di ricerca
modificano continuamente le loro regole.
L'unico modo per vedere cosa funziona è testare. Se trovi la formula
giusta usala nuovamente.
INDIRIZZIAMO I RAGNI
Abbiamo visto che, qualsiasi cosa facciamo, siamo
noi a doverci adattare agli spider dei search engine. E' possibile
però far adattare i robots alle nostre esigenze, indirizzandoli (Cloaking)
all'interno del sito, a nostro piacimento.
Se foste in possesso di un dominio, è possibile creare un file di
nome robots.txt che va inserito nella root principale
(www.dominio.com/robots.txt). In questo file, vanno inserite le
istruzioni per "governare" il ragno. Ad esempio:
Escludere tutti i robots dai files contenuti nel dominio:
User-agent: *
Disallow: /
Consentire l'accesso a tutti i robots:
User-agent: *
Disallow:
(è anche possibile non creare il file o lasciarlo vuoto)
Escludere tutti i robots da una o più cartelle:
User-agent: *
Disallow: /cgi_bin/
Disallow: /secret/
Escludere un robot (nell'esempio quello di Excite) da alcune
cartelle:
User-agent: ArchitextSpider
Disallow: /cgi_bin/
Disallow: /secret/
Escludere un robot (nell'esempio quello di Altavista) da tutti
i file del dominio:
User-agent: Scooter
Disallow: /
Lasciare passare un unico robot (nell'esempio quello di Hotbot):
User-agent: Slurp
Disallow:
User-agent: *
Disallow: /
Per conoscere i nomi dei ragni di altri motori di ricerca,
rimandiamo alle pagine dei rispettivi search engines.
Se non in possesso di un dominio, esiste un meta tag ad hoc, che
nonostante la minore flessibilità e potenza rispetto all'inserimento
del file robots.txt, consente un discreto risultato:
<meta name="robots" content="noindex, nofollow">
Il Cloaking, se usato in maniera scorretta inviando informazioni
sbagliate agli indicizzatori, può portare al "banneraggio" del sito
Articolo
gentilmente concesso a titolo gratuito dallo studio di
Andrea
Cappello