|
| Il punto di partenza A volte durante le nostre ricerche nel web con GOOGLE capita di trovare links a pagine web senza contenuto testuale, o con un contenuto minimo e poche pagine interne di riferimento) tra i primi 10-20 risultati di ricerca. Quest'eventualità è meno rara di quanto si pensi e non è l'effetto di fantomatici bugs presenti nel codice sorgente dello spider. La causa va identificata nel modo unico, e a volte controverso, con cui GOOGLE indicizza le pagine web presenti nel suo database. Tecnologia Made in GOOGLE Google utilizza una tecnologia basata su hardware e software avanzato. La velocità con cui possono essere eseguite le ricerche è attribuibile in parte all'efficienza dell'algoritmo di ricerca e in parte all'elevato numero di PC collegati in rete, che, insieme, contribuiscono a creare un motore di ricerca superveloce. Il nucleo principale del software è rappresentato da PageRank(TM)... PageRank sfrutta la vastissima rete di collegamenti associati alle singole pagine per determinarne il valore. In pratica, Google interpreta un collegamento dalla pagina A alla pagina B come un "voto" espresso dalla prima in merito alla seconda. Tuttavia, non si limita a calcolare il numero di voti, o collegamenti, assegnati a una pagina. Oltre a effettuare questo calcolo, Google prende in esame la pagina che ha assegnato il voto. I voti espressi da pagine "importanti" hanno più rilevanza e quindi contribuiscono a rendere "importanti" anche le pagine collegate... Google integra PageRank con sofisticate procedure di ricerca testo per trovare le pagine che sono rilevanti e rispondono ai criteri di ricerca indicati... >>> fonte http://www.google.com/intl/it/why_use.html Premessa importante GOOGLE non affida l'indicizzazione di una pagina al solo PageRank, come specificato nel paragrafo precedente, è pur vero che un buon PageRank aumenta le probabilità di apparire tra i primi risultati di ricerche specifiche (a parità di altri fattori). Capire il PageRank: la formula ufficiale I fondatori di GOOGLE (Sergey Brin e Lawrence Page) hanno reso pubblico l'algoritmo utilizzato per calcolare il PageRank di una pagina web all'indirizzo web: http://www-db.stanford.edu/~backrub/google.html La Formula: PR[A] = (1 - d) + d * (PR[T1]/C[T1] + ... + PR[Tn]/C[Tn]) PR[A]: il PageRank da calcolare del sito A PR[T1] ... PR[Tn]: il PageRank dei siti web (da T1 a Tn) che contengono almeno un link verso il sito A C[T1] ... C[Tn]: il numero di links esterni contenuti dai siti web (da T1 a Tn). d(damp): è il Fattore GOOGLE il cui valore probabilmente è settato a 0,85 (variazioni medie tra 0,80 e 0,90). Questo Fattore può essere modificato da GOOGLE. PR su Base logaritmica Il PR (PageRank) mostrato da GOOGLE nella sua Toolbar è espresso molto probabilmente in base logaritmica. Supponiamo che la base sia 10. Questo vuol dire ad esempio che il PR = 3 vale 10 volte un PR = 2 e 100 volte un PR = 1. Nell'esempio che segue i PR riportati sono LINEARI, ossia non espressi su base logaritmica. Solo al termine dell'esempio estrapoleremo il PR su base log. dal PR lineare ottenuto. Un esempio pratico Supponiamo che la home page del nostro sito A (esempiorank.com - nome ipotetico) sia linkata da 5 pagine web esterne (T1, T2, T3, T4, T5). GOOGLE interpreterà i links pubblicati sulle pagine T1...T5 come voti espressi ad esempiorank.com a) Assegnamo un PageRank alle pagine web che ci linkano: T1 = 200, T2=120, T3=260, T4=400, T5=40 b) Assegnamo un numero di links esterni ad ognuna di queste pagine: T1link = 3, T2link=10, T3link=4, T4link=20, T5link=1 c) Calcoliamo l'ipotetico PageRank: PR[esempiorank.com/index.html] = (1 - 0,85) + 0,85 * (200/3 + 120/10 + 260/4 + 400/20 + 40/1) Risultato: 173,27 - arrotondato alla seconda cifra Il PR su base log. della home page di esempiorank.com è di 2 Links interni e PageRank Discorso a parte meritano i links interni ad una pagina web (esempiorank.com/index.html, esempiorank.com/pagina1.html etc...) L'importanza di una pagina è data dai "voti esterni" che questa riceve. Nel caso di links interni ad esempiorank.com, questi determinano il PageRank delle altre pagine presenti nel sito. Per cui nella struttura ad albero di esempiorank.com, la home page avrà un valore necessariamente più alto rispetto a quello delle sue pagine interne (il cui PR sarà immediatamente inferiore) e così via scendendo in profondità. Esemplificando: L'effetto eco di links esterni a pagine interne ad esempiorank.com comporterà un incremento del PR relativo a tali pagine e del PR della Home Page; al contrario se i links esterni portano alla Home Page, l'effetto eco farà alzare il PR delle pagine interne linkate dalla Home. Effetto PageRank: Linkami! L'esempio precedente ci offre dei consigli sul come e perché effettuare degli Scambi Links (o banners) con altri siti web. Assunto: Più una pagina web è linkata da altri siti e più il suo PageRank è elevato. Non sempre una pagina web con PR più alto del nostro rappresenta il miglior investimento pubblicitario. Secondo la Formula il PR di una pagina web viene diviso per il numero di links esterni riportati su di essa. Estremizzando: una pagina web con PR = 4(es. 10000) e 60 link esterni ci porterà meno punti di una pagina con PR=2(es. 200) e 1 solo link esterno. Questa estremizzazione è utile per chiarire che un sito Web il cui PR è costruito sull'esposizione di decine e decine di link non necessariamente ha una capacità di Voto realmente Forte se contrapposto al Voto di una Pagina web con PR più basso ma con solo un paio di links indovinati.
La politica pubblicitaria del PageRank |
Copyright © 2001-2004 Calshop. Tutti i diritti sono riservati.
Ideazione, Progettazione e Realizzazione a cura di Luigi Palamara e Bruna Italia Massara
|