Newsletter sui motori di ricerca
31 Maggio 1999

LE ULTIME NOVITà
- IL GRUPPO L'ESPRESSO SCEGLIE INKTOMI
Il gruppo editoriale L'Espresso ha definito un ambizioso progetto
di portal italiano, basato su un motore di ricerca con tecnologia
Inktomi. L'accordo, effettuato dalla società del gruppo Kataweb,
permette al gruppo italiano di utilizzare una delle più note
tecnologie di ricerca già collaudata da Yahoo!, HotBot, Snap
e molti altri. L'esordio, avvenuto il 17 maggio su Repubblica.it,
permette di accedere alle potenti funzioni di ricerca sull'archivio
Inktomi che conta oltre 100 milioni di pagine web di tutto il
mondo. E' comunque evidente come l'implementazione sia ancora
alle prime battute, vista la lentezza dell'esecuzione delle
ricerche e la mancanza della funzione di inserimento di nuovi
siti.
- SFUMA L'ACQUISIZIONE DI LYCOS
Gli azionisti di Lycos hanno ritenuto
inadeguata l'offerta di 83 milioni di dollari prevista per l'ingresso
in USA Network, il gruppo televisivo americano già proprietario
di Ticketmaster Online e CitySearch. Per cui l'accordo di febbraio
sfuma, anche se è stata definita un'intesa commerciale per attività
di cross promotion on-line. Si fanno già i nomi di altri potenziali
acquirenti (come la NBC - già presente in Snap e nel gruppo
c|net - che era già stata data come acquirente prima di USA
Network), specie ora che il network di Lycos nel suo insieme
(con HotBot, Tripod,...) ha raggiunto la popolarità di Yahoo!,
addirittura superandolo nella rilevazione di Media Matrix di
marzo.
- A PROPOSITO DI LYCOS...
Una piccola curiosità. Provate a fare una ricerca con la parola
"yahoo" (uno dei primi dieci termini usati sulla Rete) sulla
versione americana di Lycos: il risultato è una pagina speciale
dove Lycos invita ad utilizzare il suo nuovo catalogo di siti
Open Directory (acquisito da Netscape) anziche Yahoo! Ovviamente,
dopo aver magnificato le caratteristiche di Lycos, viene comunque
indicato il link a Yahoo!... :)
- IL MOTORE CON L'ARCHIVIO PIU' GRANDE
Si chiama FAST ed è una nuova
tecnologia di classificazione dei siti Web capace di superare
per dimensioni tutti gli attuali motori di ricerca. La società
norvegese che ha creato FAST, punta a fornire il proprio "engine"
come base per siti e portal, un pò come fa già Inktomi con Yahoo!,
Snap e HotBot. Ma ciò che contraddistingue
FAST è il suo dichiarato obiettivo di censire "tutto" il web.
Esiste già un esempio di implementazione (http://www.alltheweb.com)
che contiene 80 milioni di pagine web (più di Excite,
Infoseek e Lycos),
ma a luglio saranno oltre 200 milioni. Ricordiamo che, mentre
si stimano 500 milioni di pagine web in totale, Altavista
ne censisce attualmente "solo" 150 milioni. Northern
Light, che attualmente cataloga 140 milioni di pagine, ha
anch'essa dichiarato che a luglio il suo archivio supererà i
200 milioni di documenti.
IL VOLTO UMANO DEI MOTORI
Ci sono due scuole di pensiero nella gestione dell'archivio di un motore di ricerca: la prima che si propone di automatizzare completamente il processo di classificazione delle pagine web, la seconda che ritiene opportuno un sostanziale intervento umano nel censimento dei siti.
In questo articolo analizzeremo questa seconda impostazione, anche in relazione al successo di molti strumenti di ricerca dove la componente umana è basilare nella struttura del servizio.
Va premesso che ci riferimento ai motori di ricerca in senso lato, racchiudendo anche le cosiddette "directory" ed i servizi di ricerca in generale.
Naturalmente il primo motore di ricerca umano a cui si pensa è Yahoo!, il cui archivio è realizzato attraverso l'analisi dei siti da parte uno staff di oltre 300 redattori. Il fatto che Yahoo! sia il sito web più visitato in assoluto, è indubbiamente un segnale forte in merito al gradimento di questo tipo di siti da parte degli utenti della Rete.
Altra conferma di questo, è il crescente successo di Looksmart, un sito simile a Yahoo! come impostazione, nel senso che cataloga i siti per tipologia attraverso il lavoro di un gruppo di redattori. Looksmart è arrivato in un anno ad essere uno dei primi 25 siti al mondo, anche attraverso degli accordi con altri siti importanti (Netscape, Altavista, MSN e molti altri) ai quali Looksmart fornisce la sua directory, oltre a 135 provider in tutto il mondo tra i quali IBM.net.
Looksmart cataloga oltre un milione di pagine web suddivise in 24.000 categorie, attraverso il lavoro di 150 redattori (su un totale di 250 dipendenti). Rispetto ai principali siti al mondo, è quello con la maggiore percentuale di utenti di sesso femminile (61%) rispetto al totale dei suoi visitatori.
Chiaramente, l'impostazione di Yahoo! e Looksmart impone dei grossi profitti tali da poter mantenere uno staff di redattori molto corposo. Così, ad alcune aziende è venuta un'idea: anzichè assumere delle persone per recensire dei siti, perchè non cercare dei volontari sulla Rete che facciano questo lavoro?
L'anno scorso nacque così NewHoo (il nome vi ricorda qualcosa?), un catalogo di siti divisi per categoria, dove ogni ramo dell'archivio è gestito da un volontario, tipicamente esperto di quel settore specifico. Le richieste di registrazione dei siti, arrivano direttamente a questi redattori volontari che decidono se e come aggiungere il sito in archivio.
Il progetto NewHoo ha trovato subito una grande accoglienza sulla Rete, tanto che ha interessato addirittura Netscape che l'ha assorbito a fine 1998, rinominandolo Open Directory Project. Ciò ha reso un pò meno romantico il progetto iniziale, impostato sull'indipendenza degli utenti nella scelta dei siti anziche demandarla a redattori stipendiati, ma i numeri sono cresciuti ugualmente in modo esponenziale. Attualmente Open Directory censisce 590 mila siti distinti in 88 mila categorie, sulle quali lavorano oltre 11 mila redattori.
La Open Directory permesso poi a Netscape di sviluppare accordi con importanti aziende sulla rete, il più recente che ha visto protagonisti Lycos e HotBot che l'anno adottata come guida tematica dei siti.
Anche About.com è un motore di ricerca con caratteristiche simili a Open Directory, nel senso che viene organizzato da redattori volontari di tutto il mondo. Il sito, noto come MiningCo e che ha cambiato nome in About.com il 18 maggio scorso, censisce 400.000 mila siti suddivisi in 18 macro categorie e 650 argomenti analitici.
About.com punta la sua strategia sulla qualità nella creazione del suo archivio, attraverso una scelta molto selettiva dei redattori. Per diventare esperti di un'area specifica di About.com infatti, occorrono almeno 16 settimane di training e solo il 25% degli aspiranti redattori viene poi effettivamente scelto.
Uno dei più recenti successi sulla rete è quello di AskJeeves, dove la componente umana nei motori di ricerca trova una sua interpretazione innovativa. Il sito propone una serie di risposte a domande già preimpostate: basta chiedere al Signor Jeeves le proprie esigenze in linguaggio naturale (per ora solo in inglese), ed il sistema riporta una serie di risposte generalmente molto vicine alle necessità di ricerca.
AskJeeves sta raccogliendo moltissimi consensi da parte degli utenti della Rete e sta rapidamente arrivando ad essere uno dei siti più conosciuti, anche per merito dell'accordo con Altavista che lo integra nei suoi risultati di ricerca.
Attualmente gestisce 7 milioni di risposte che saranno oltre 20 milioni il prossimo anno. Nel frattempo è anche uscita un'edizione dedicata ai bambini (AJKids) ed il sistema è stato scelto dalla Dell, uno dei principali costruttori di pc, per organizzare il customer support on line, ridefinito Ask Dudley.
In Italia, un servizio che riprende l'idea di AskJeeves è stato realizzato da Virgilio: si chiama Genio e gestisce attualmente oltre 2.000 risposte suddivise per argomento. Ogni utente può sottoporre la sua richiesta ma può anche candidarsi per fornire le risposte alle domande in attesa di soluzione.
L'estremizzazione dell'intervento umano nei motori di ricerca, è quello delle richieste su commissione. Ogni utente può infatti esprimere delle sue esigenze specifiche, ed un team di esperti si mette all'opera per trovare i siti che soddisfano la richiesta. Questo servizio è normalmente erogato a fronte di una commissione, ed ha avuto tra i suoi pionieri un'azienda chiamata Human Research. Sembra anche che in Italia il motore di ricerca Il Trovatore voglia offrire un servizio analogo, ma a tutt'oggi non ci sono ancora stati forniti i dettagli dell'operazione.
Restando in Italia, merita infine una segnalazione URL, una directory di siti molto originale, sviluppata interamente a mano da uno staff editoriale specializzato. I siti nell'archivio sono presentati attraverso una dettagliata scheda informativa e sono frutto di una scelta puramente qualitativa, capace di presentare delle risorse poco note ma di sicuro interesse.
Mauro Lupi
mupi@admaiora.com
SITI INTERESSANTI
TUTTA L'AFRICA
http://www.mosaique.net
Mosaique e' un nuovo catalogo di siti ed informazioni dedicato all'Africa
CUCINA E RICETTE
http://www.cookingindex.com
Si chiama Internet Cooking Index e propone una lista ragionata di link legate al mondo della cucina, ricette, libri, ecc.
OPERA E MUSICA LIRICA
http://www.aria-database.com/
Un completo archivio di oltre 1.000 arie musicali dalle piu' famose opere. Oltre alle informazioni relative all'autore, per molte sono disponibili i file audio ed i link di approfondimento
IL MOTORE GIURIDICO
http://www.diritto.it
Cicerone e' il primo motore italiano pensato per la ricerca di atti giuridici
AUTOMOBILI A GOGO
http://www.autodirectory.com/
Oltre 3.000 link di siti relativi al mondo dell'automobile
TUTTE LE CITTA' D'AMERICA
http://www.stateconnect.com
Una guida di riferimento per tutte le principali citta' degli Stati Uniti. Per ognuna e' disponibile un catalogo di siti divisi per argomento
|