Cosa sono la Link Analysis e il Google PageRank?
A cura
di
Raffaele Galano
|
Cercare nei motori di ricerca ha sempre significato ottenere
come risultato migliaia di documenti, ordinati secondo la rilevanza
dei termini della nostra query, misurata su moltissimi parametri
legati alla presenza e alla posizione dei termini nella pagina.
La maggior parte delle tecnologie utilizzate dai motori di ricerca,
che oggi conosciamo e usiamo frequentemente, fanno riferimento
invece anche ai link da e verso un pagina web (Inbound
e Outbound link), per valutare l'importanza e determinare
il posizionamento della pagina nei confronti di una data keyword.
Sapere come i motori di ricerca considerano i link fra le pagine
Internet è quindi importante per conoscerli un po' di più
e comprendere sempre meglio i motivi che "muovono" le
nostre pagine all'interno dei loro database.
In questo articolo faremo riferimento anche alle dichiarazioni
dei rappresentanti di Google, FAST e AskJeeves/Teoma
nella Search Engine Strategies Conference di Boston (Marzo
2002) e al whitepaper che Wisenut mette a disposizione
sul suo sito.
In origine, alla base, di tutto c'è stato il problema/obiettivo
di riuscire ad usare un parametro "umano" per
determinare quanto fosse rilevante una pagina sulle altre, rispetto
a un certo termine. Ma come fare questo senza dover coinvolgere
(e quindi pagare) un gran numero di persone e studiare un sistema
valido per consentire loro di dare valutazioni "oggettive"?
L'unico modo era creare un sistema matematico incentrato sulla
valutazione, spesso non espressamente riconosciuta, di un sito
da parte di altri responsabili, amministratori e creatori di website.
In pratica il sistema doveva poter rispondere alla domanda "Cosa
pensano gli altri del mio sito?
Quanto lo valutano pertinente e interessante rispetto ad un dato
argomento?".
Google sembra essere stato un pioniere
nell'utilizzo dei collegamenti ipertestuali per la creazione di
un sistema di valuazione dell'importanza di un website.
Grazie alla tecnologia chiamata PageRank, Google
riesce oggi a fornire risultati altamente pertinenti stabilendo
in modo del tutto automatizzato una misurazione oggettiva dell'importanza
di ogni singola pagina web presente nel suo database. PageRank
utilizza un'equazione di circa 500 milioni di variabili e 2
miliardi di termini per creare una struttura dei link della
Rete che poi utilizza come strumento di organizzazione e valutazione.
Questo sistema non esegue semplicemente un conteggio dei link
al nostro sito presenti nelle pagine da lui indicizzate (cioè
la Link Popularity: esempio
con MotoriDiRicerca.IT) e un conteggio dei link dal nostro
sito verso queste stesse pagine, ma valuta anche la provenienza
e quindi la "qualità" dei link, o meglio
la pertinenza rispetto all'argomento trattato nella
nostra pagina.
Per poter avere idea del proprio PageRank ed in generale
della rete di link che gravita attorno al nostro sito, bisogna
scaricare la Google
Toolbar ed è anche utile interrogare altri motori
per sapere quanti link alle nostre pagine sono presenti nei loro
database.
Pensiamo infatti a Yahoo!: sicuramente ha un enorme numero di
link in tutto il Web e tanti probabilmente anche da siti di carattere
scentifico, ma non si può dire che sia anche il sito più
autorevole e pertinente rispetto alla query "fisica quantistica".
Cerchiamo di comprendere meglio questo strumento: Google interpreta
un link dalla pagina A alla pagina B come un voto
di A per B e se a sua volta anche B ha un
link verso A entrambe ricevono un voto ancora più
alto (Feedback-Link).
Se la pagina B ha un PageRank più alto il valore
di un suo link è ancora più elevato, ma se ha un
valore più basso non esiste nessuna penalità.
L'importanza di una pagina è data dal voto che questa riceve
"dalla Rete" nella sua globalità e i link interni
al nostro sito determinano il PageRank delle pagine interne.
Se infatti i link che otteniamo dall'esterno sono diretti all'Home
Page questa avrà una valore più elevato e le pagine
del nostro sito direttamente collegate ad essa (ad esempio quelle
relative alle sezioni principali) avranno un valore di PageRank
immediatamente minore, ma più elevato di quelle non linkate.
Interessante quindi valutare criticamente la struttura gerarchica
delle nostre pagine in fase di restyling del sito oppure di creazione
del sito ex-novo, in modo da prevedere sistemi utili a suggerire
collegamenti fra le pagine soprattutto in base alla pertinenza
di una con l'altra. Con l'obiettivo di aumentare il PageRank
delle pagine più importanti potremmo inserire, ad esempio,
link diretti dall'Home Page ad alcune pagine con articoli o servizi
che si trovano nel 4° o 5° livello.
Il fattore principale nella determinazione del PageRank sono
i link provenienti dall'esterno, quelli più difficili
da ottenere e mantenere se il nostro sito non presenta contenuti
validi e facilmente accessibili.
Non solo: è fondamentale che i link siano testuali e che
il testo ad essi associato contenga parole-chiave in tema alla
pagina alla quale puntano. Su questi fattori sono concordi i principali
esponenti delle tecnologie di ricerca oggi presenti sul Web, non
solo Google, ma anche Ask Jeeves/Teoma e FAST.
Tutti consigliano di tessere una rete di relazioni con altri siti
del settore, evitando di associarsi a siti mal strutturati e che
a loro volta hanno un numero troppo esiguo di link dall'esterno.
Ricordiamo, comunque, che i parametri che partecipano al ranking
delle nostre pagine, su Google come su altri motori, sono influenzati
solo in parte dai link, mentre non ci stancheremo mai di ripetere
quanto anche il semplice titolo delle nostre pagine sia fondamentale.
Raffaele Galano
Ad Maiora
Luglio 2002
|