Il
punto di partenza
A volte durante le nostre ricerche nel web con GOOGLE
capita di trovare links a pagine web senza contenuto
testuale, o con un contenuto minimo e poche pagine
interne di riferimento) tra i primi 10-20 risultati di
ricerca.
Quest'eventualità è meno rara di quanto si pensi e non è
l'effetto di fantomatici bugs presenti nel codice
sorgente dello spider.
La causa va identificata nel modo unico, e a volte
controverso, con cui GOOGLE indicizza le pagine web
presenti nel suo database.
Tecnologia Made in GOOGLE
Google utilizza una tecnologia basata su hardware e
software avanzato. La velocità con cui possono essere
eseguite le ricerche è attribuibile in parte
all'efficienza dell'algoritmo di ricerca e in parte
all'elevato numero di PC collegati in rete, che,
insieme, contribuiscono a creare un motore di ricerca
superveloce.
Il nucleo principale del software è rappresentato da
PageRank(TM)... PageRank sfrutta la vastissima rete di
collegamenti associati alle singole pagine per
determinarne il valore. In pratica, Google interpreta un
collegamento dalla pagina A alla pagina B come un "voto"
espresso dalla prima in merito alla seconda. Tuttavia,
non si limita a calcolare il numero di voti, o
collegamenti, assegnati a una pagina. Oltre a effettuare
questo calcolo, Google prende in esame la pagina che ha
assegnato il voto. I voti espressi da pagine
"importanti" hanno più rilevanza e quindi contribuiscono
a rendere "importanti" anche le pagine collegate...
Google integra PageRank con sofisticate procedure di
ricerca testo per trovare le pagine che sono rilevanti e
rispondono ai criteri di ricerca indicati...
>>> fonte
http://www.google.com/intl/it/why_use.html
Premessa importante
GOOGLE non affida l'indicizzazione di una pagina al solo
PageRank, come specificato nel paragrafo precedente, è
pur vero che un buon PageRank aumenta le
probabilità di apparire tra i primi risultati
di ricerche specifiche (a parità di altri fattori).
Capire il PageRank: la formula ufficiale
I fondatori di GOOGLE (Sergey Brin e Lawrence Page)
hanno reso pubblico l'algoritmo utilizzato per calcolare
il PageRank di una pagina web all'indirizzo web:
http://www-db.stanford.edu/~backrub/google.html
La Formula:
PR[A] = (1 - d) + d * (PR[T1]/C[T1] + ... + PR[Tn]/C[Tn])
PR[A]: il PageRank da calcolare del
sito A
PR[T1] ... PR[Tn]: il PageRank dei siti
web (da T1 a Tn) che contengono almeno un link verso il
sito A
C[T1] ... C[Tn]: il numero di links
esterni contenuti dai siti web (da T1 a Tn).
d(damp): è il Fattore GOOGLE il cui
valore probabilmente è settato a 0,85 (variazioni medie
tra 0,80 e 0,90). Questo Fattore può essere modificato
da GOOGLE.
PR su Base logaritmica
Il PR (PageRank) mostrato da GOOGLE nella sua Toolbar è
espresso molto probabilmente in base logaritmica.
Supponiamo che la base sia 10.
Questo vuol dire ad esempio che il PR = 3 vale 10 volte
un PR = 2 e 100 volte un PR = 1.
Nell'esempio che segue i PR riportati sono LINEARI,
ossia non espressi su base logaritmica.
Solo al termine dell'esempio estrapoleremo il PR su base
log. dal PR lineare ottenuto.
Un esempio pratico
Supponiamo che la home page del nostro sito A (esempiorank.com
- nome ipotetico) sia linkata da 5 pagine web esterne
(T1, T2, T3, T4, T5).
GOOGLE interpreterà i links pubblicati sulle pagine T1...T5
come voti espressi ad esempiorank.com
a) Assegnamo un PageRank alle pagine web che ci linkano:
T1 = 200, T2=120, T3=260, T4=400, T5=40
b) Assegnamo un numero di links esterni ad ognuna di
queste pagine: T1link = 3, T2link=10, T3link=4,
T4link=20, T5link=1
c) Calcoliamo l'ipotetico PageRank:
PR[esempiorank.com/index.html] = (1 - 0,85) + 0,85 *
(200/3 + 120/10 + 260/4 + 400/20 + 40/1)
Risultato: 173,27 - arrotondato alla seconda cifra
Il PR su base log. della home page di esempiorank.com è
di 2
Links interni e PageRank
Discorso a parte meritano i links interni ad una pagina
web (esempiorank.com/index.html, esempiorank.com/pagina1.html
etc...)
L'importanza di una pagina è data dai "voti esterni" che
questa riceve. Nel caso di links interni ad
esempiorank.com, questi determinano il PageRank delle
altre pagine presenti nel sito. Per cui nella struttura
ad albero di esempiorank.com, la home page avrà un
valore necessariamente più alto rispetto a quello delle
sue pagine interne (il cui PR sarà immediatamente
inferiore) e così via scendendo in profondità.
Esemplificando: L'effetto eco di links esterni a pagine
interne ad esempiorank.com comporterà un incremento del
PR relativo a tali pagine e del PR della Home Page; al
contrario se i links esterni portano alla Home Page,
l'effetto eco farà alzare il PR delle pagine interne
linkate dalla Home.
Effetto PageRank: Linkami!
L'esempio precedente ci offre dei consigli sul come e
perché effettuare degli Scambi Links (o banners) con
altri siti web.
Assunto: Più una pagina web è linkata da altri siti e
più il suo PageRank è elevato.
Non sempre una pagina web con PR più alto del nostro
rappresenta il miglior investimento pubblicitario.
Secondo la Formula il PR di una pagina web viene diviso
per il numero di links esterni riportati su di essa.
Estremizzando: una pagina web con PR = 4(es. 10000) e 60
link esterni ci porterà meno punti di una pagina con
PR=2(es. 200) e 1 solo link esterno.
Questa estremizzazione è utile per chiarire che un sito
Web il cui PR è costruito sull'esposizione di decine e
decine di link non necessariamente ha una capacità di
Voto realmente Forte se contrapposto al Voto di una
Pagina web con PR più basso ma con solo un paio di links
indovinati.
La politica pubblicitaria del
PageRank
In che modo aumentare il Page Rank di un sito web per
migliorare le probabilità di apparire
tra i primi risultati di ricerca di GOOGLE?
Un paio di suggerimenti per creare un'adeguata politica
pubblicitaria sfruttando la Formula del PR:
a) farsi linkare da più siti web (siti web con PageRank
inferiore al nostro non danno nessuna penalità!).
b) dare la priorità a pagine web con buoni PR e che non
abbiano, se possibile, un numero eccessivo di links
esterni...
c) scambiare la cortesia esponendo i links dei nostri
"amici", se possibile evitando di linkarli tutti sulla
nostra Home Page per non inficiarne la capacità di Voto! |