A cura di Francesco Bedussi.
Un problema tipico delle ricerche in rete è la difficoltà di "centrare" il documento o la risorsa che ci interessa, e di essere quindi sommersi da un mare di
risposte non significative, in mezzo alle quali annega ciò che stiamo cercando. In questa situazione possono tornare utili gli
strumenti di ricerca avanzata, in particolare gli operatori
logici.
L’obiettivo della ricerca avanzata è quello di permettere un interrogazione abbastanza specifica, in modo da escludere documenti non rilevanti. Per fare questa selezione è necessario definire il maggior numero possibile di caratteristiche che il documento che stiamo cercando deve possedere, più specifica è la descrizione,
meno sono i documenti che vi corrispondono, e più pertinente è il loro
contenuto.
Il contenuto di un documento in rete è descritto o dalla sua collocazione in una particolare categoria di un catalogo, o dalle parole che lo compongono e lo descrivono che vengono indicizzate dai motori di ricerca. Per recuperare un documento che ci interessa si può quindi chiedere al catalogo di mostrarci tutti quelli che compaiono in una determinata categoria, oppure chiedere al motore di ricerca tutti quelli che sono associati a determinate parole.
L’uso di un catalogo è abbastanza intuitivo, e questo è uno dei suoi pregi maggiori. L’interrogazione di un motore di ricerca può risultare invece più problematica. Vediamo quali sono i passi da compiere.
Prima di tutto dobbiamo sapere cosa stiamo cercando.
Gli operatori logici tornano utili soprattutto quando abbiamo un’idea chiara di ciò che vogliamo, e lo possiamo quindi descrivere in modo adeguato.
Chiarirsi le idee è quindi la cosa fondamentale.
I motori di ricerca associano ad ogni documento tutte le parole che contiene e delle parole aggiuntive che gli autori hanno definito come sua descrizione, ordinate in base alla loro rilevanza. Se
abbiamo ben presente il contenuto del documento che stiamo cercando, sappiamo quali parole può contenere o quali lo possano descrivere. Il modo migliore di procedere è cominciare l’interrogazione con una parola o
frase altamente specifica, come può essere un termine tecnico o il nome di una persona. Spesso questo è sufficiente.
Se non otteniamo alcun risultato o ne otteniamo troppo pochi, prima di cambiare
parola chiave si può provare con le sue declinazioni grammaticali
(maschile/femminile e singolare/plurale per i sostantivi, e i diversi tempi e
modi per i verbi). A questo scopo può essere utile il segno *
(asterisco).
Se i risultati sono troppi,
oppure non ci vengono in mente che parole generiche, possiamo cominciare ad aggiungere parole chiave legate da
AND. Un modo alternativo per scremare i risultati è l’uso di
NOT. Se facendo così abbiamo ridotto troppo il campo della ricerca si può utilizzare
OR per allargarlo leggermente. Procedendo per aggiustamenti successivi, utilizzando se necessario le
parentesi, mettendo o togliendo parole chiave per mezzo di AND o ponendo alternative per mezzo di OR, si riesce in genere a ridurre i risultati ad un piccolo numero veramente rilevante.
Oltre che nel contenuto ci sono altri aspetti di un
documento che possono essere descritti, ad esempio la sua fonte. Supponiamo di voler informarci sui danni prodotti dai telefoni
cellulari, possiamo decidere da quale fonte preferiamo trarre l’informazione, ad esempio
da un’università o da un movimento di consumatori, in questi casi "università" o "consumatori" potrebbero essere alcune parole chiave.
Ad esempio:
| Interrogazione |
Risultati * |
| "telefoni cellulari" and (danni near salute) |
25 |
| "telefoni cellulari" and (danni near salute) and consumatori |
10 (connessi in alle
associazioni o ai movimenti dei consumatori) |
| "telefoni cellulari" and (danni near salute) and università |
4 (di provenienza istituzionale) |
*Ricerca effettuata su altavista.it il 2/5/2000.
Le funzioni di ricerca
avanzata variano nei diversi motori di ricerca, ma quasi tutti supportano gli
operatori logici. Per utilizzarli è
spesso necessario accedere ad una specifica interfaccia per la ricerca avanzata,
dove sono in genere disponibili molte altre funzioni. Vediamo alcune particolarità di due
importanti motori di ricerca, uno internazionale e uno italiano:
Altavista permettere di:
- restringere la ricerca ad un medium specifico (mp3, immagini, testo)
- scegliere la lingua in cui deve essere scritto il documento
- utilizzare tutti gli operatori logici di base e
molte altre possibilità
- ordinare i risultati in base a criteri diversi
- specificare l’intervallo temporale in cui deve ricadere il documento cercato
Arianna consente di:
- utilizzare le estensioni linguistiche. Si possono effettuare le ricerche utilizzando non solo la parola data ma anche le sue estensioni (singolare-plurale, maschile-femminile, forme verbali etc.). Cercando "gatto" si troveranno anche i documenti relativi a "gatti" e "gatte". Cercando "vincere" si troverà anche "vinto", "vincerò", ecc.
- limitare la ricerca a specifiche porzioni di
testo. E’ possibile limitare la zona in cui effettuare le ricerche al solo titolo. Questo può tornare utile quando si utilizzino dei termini comuni per la ricerca, perché limita il numero di risposte..
- limitare la ricerca ad un sito specificato.
Le possibilità quindi sono tante. L'unica cosa
da evitare è, davanti a 37569 risultati, cominciare a sfogliarli uno per
uno.
Buona ricerca.
GLOSSARIO
OPERATORI LOGICI O BOOLEANI
Gli operatori logici o booleani prendono il loro nome da George Boole, matematico inglese della prima metà dell’800
che formalizzo la logica binaria che sta alla base dei moderni calcolatori. I
principali e più diffusi sono
AND, OR, e NOT, a cui si
può aggiungere negli strumenti di ricerca NEAR.
ASTERISCO (*)
Alcuni motori di ricerca accettano l'asterisco
come sostituto di una o più lettere.
L'asterisco può quindi essere usato per cercare tutte le declinazioni di una
parola, come il genere ed il numero dei sostantivi o il tempo e il modo dei
verbi. Ad esempio, "Cavall*" sta per cavalla, cavallo, cavalli,
cavallerizzo, e per tutte le altre parole che cominciano per "caval".
"Vend*" sta per venderò, venduto, vendessi, vendendo, vendesi, ecc.
L'asterisco può essere usato anche all'interno di una parola, ad esempio quando
non si è sicuri della sua ortografia ("invec*e" cerca sia
"invece" che "invecie", ma anche "invecchiate").
VIRGOLETTE (" ")
Le virgolette alte ("
") indicano al motore di ricerca che il loro contenuto deve essere trattato
come una frase, cioè come una sequenza di parole che devono comparire nel testo
come un blocco unico (ad esempio "sport estremo", ma anche "Giuseppe Verdi").
Se inseriamo una frase senza racchiuderla tra virgolette il motore di ricerca interpreta le parole come legate da
OR, e quindi, invece di restringere l’ambito della ricerca, lo allarga. Nel nostro caso non troverà solo i
documenti che contengono la frase "sport estremo" ma tutti quelli che contengono la parola "sport" e tutti quelli che contendono la parola "estremo". Nel caso di nomi propri, visto che cognome e nome possono presentarsi in ordine diverso o addirittura separati da titoli (es. Carlo Dr. Grassi) si può usare anche
NEAR.
Esempio di differenza
tra AND, NEAR e la ricerca per frasi.
NEAR
Due o più parole legate da NEAR devono comparire entrambe nel testo e a distanza ravvicinata (tipicamente a distanza massima di 10 parole). E’ quindi una condizione più restrittiva della semplice
AND, ma meno restrittiva della ricerca di una frase. Può essere utile per cercare nomi di persone, in cui il nome e il cognome possono essere ordinati in modo diverso e addirittura separati da titoli, e più in generale in quelle situazioni in cui si cerca termini in relazione tra
loro, come un aggettivo e il suo sostantivo .
Esempio
di differenza tra AND, NEAR e la ricerca per frasi.
AND
Se uniamo due più parole chiave con l’operatore AND, significa che volgiamo solo i documenti che contengono tutte le parole indicate (questo E quello). Si usa AND, quindi, per restringere il campo della ricerca.
Esempio di differenza tra
AND, NEAR e la ricerca per frasi.
Le parole vanno inserite in ordine di importanza, le più importanti cioè vanno per prime. Se stiamo cercando gli accordi delle canzoni di Ligabue, è meglio inserire "Ligabue AND accordi" pittosto che "accordi AND Ligabue", visto che prima di tutto ci interessano le pagine dedicate al cantate, e tra queste, quelle che riportano gli accordi.
DIFFERENZA TRA AND, NEAR
E RICERCA PER FRASE
Supponiamo di volere informazioni sulle moto
italiane:
| Interrogazione |
Pagine trovate * |
| moto |
37837 |
| moto AND italiane |
2009 |
| moto NEAR italiane |
70 |
| "moto italiane" |
19 |
*Ricerca effettuata su
altavista.it il 2/5/2000.
Con la sola parola generica "moto" i risultati
eccedono qualsiasi umana capacità di vaglio. Con l'operatore AND il numero
dei risultati cala, ma resta sempre alto e soprattutto poco pertinente
perché contiene anche documenti che parlano di moto giapponesi e scarpe
italiane. Con l'uso di NEAR facciamo centro, i risultati sono pochi, quindi
controllabili uno ad uno e sono probabilmente pertinenti, visto che l'aggettivo,
essendogli vicino, dovrebbe riferirsi al nome. La frase "moto
italiane" come prevedibile seleziona ancora di più, ma probabilmente
elimina anche documenti pertinenti, come quelli che parlano delle "moto
costruite dalle case italiane".
NOT
Una parola chiave preceduta da AND NOT indica al motore di ricerca che non vogliamo i documenti che contengono quella parola. Naturalmente bisognerà indicare anche quali sono le parole che vogliamo compaiano nei nostri documenti. L’uso di NOT è importante quando vogliamo escludere delle sottocategorie di documenti. Ad esempio
facendo delle ricerche sulla composizione chimica degli oli essenziali
contenuti nel basilico si pone questa interrogazione:
"oli essenziali" AND
basilico
I risultati che ci interessano sono però
inquinati da un grande numero di documenti che si riferiscono sì agli oli
essenziali del basilico, ma dal punto di vista delle medicine alternative e del
massaggio. Specificare
"oli essenziali" AND
basilico AND scienza
non risolve il problema perché anche i documenti che non
ci interessano potevano contenere espressioni del tipo "...la scienza
riconosce molte proprietà agli oli essenziali contenuti le basilico...". La soluzione
più pratica è un'interrogazione del tipo:
"oli essenziali" AND
basilico AND NOT (cura OR massaggi)
Nelle interfacce di ricerca semplice l'operatore
AND NOT è in genere sostituito dal segno - (meno).
OR
Unendo due o più parole unite da OR chiediamo al motore di ricerca di darci tutti i documenti che contengono o una parola o l’altra, o anche tutte e due. L’uso di OR, quindi, allarga il campo della ricerca. "Alberghi OR pensioni" cerca i documenti che parlano sia di alberghi che di pensioni. Nelle
interfacce di ricerca semplice OR è sostituito dal segno + (più).
PARENTESI
Tutti gli operatori logici possono essere inseriti in espressioni complesse del tipo
riccione AND (alberghi OR pensioni)
Le parentesi indicano che l’oggetto dell’operatore che le precede, in questo caso AND, non è la parola immediatamente seguente (alberghi) ma l’intera espressione contenuta tra le parentesi (alberghi OR pensioni).
Stiamo chiedendo di darci tutti i documenti che contengono la parola "riccione" e
una delle due tra "alberghi" e "pensioni" (o anche tutte e due).
Esattamente come nelle espressioni algebriche si possono aprire parentesi all’interno di altre
parentesi