Home

Federica EU

1/35

Rossana Valenti » 3.La ricerca on-line per i docenti e per gli studenti

La ricerca online

La rete come “deposito” di informazioni
- Alcune riflessioni preliminari
- L’Information retrieval
I motori di ricerca
- Le tecniche di ricerca
Siti e portali
Dal dato alla conoscenza
Gli scenari futuri

La rete come deposito di informazioni

Alcune riflessioni preliminari

A partire dalla metà del Novecento si è via via compreso che accanto al mondo dell’energia e della materia esiste il mondo dell’informazione: un elemento concreto e nel contempo impalpabile, che ha raggiunto rapidamente proporzioni e ampiezza impressionanti, rivelandosi capace di attirare investimenti massicci e di impegnare innumerevoli ricercatori e tecnici.

La rete come deposito di informazioni

La rete si è rapidamente configurata come un immenso deposito di dati, in continua evoluzione, e rappresenta oggi il più grande contenitore di informazione mai assemblata dall’uomo. Documenti e risorse multimediali, presenti in rete, riguardano qualsiasi argomento immaginabile. Questa informazione è disponibile istantaneamente a ogni utente, in qualunque parte del mondo, purché provvisto di una connessione Internet.

La rete come deposito di informazioni

Il successo del web è dovuto al fatto che esso è decentralizzato e universale: le pagine web risiedono su computer sparsi in tutto il mondo e ogni documento può rimandare a qualsiasi altro documento, ovunque collocato. Ogni utente può aggiungere informazioni al web contribuendo istantaneamente alla sua crescita, che in pochi anni è diventata esponenziale.
La rete si è trasformata rapidamente in un’estensione delle nostre conoscenze e dei nostri atti: in questa ottica è assolutamente essenziale saper trovare, tra milioni di dati, l’informazione che ci serve.

La rete come deposito di informazioni

L’Information retrieval

L’Information retrieval (IR) (lett: recupero d’informazioni) è l’insieme delle tecniche utilizzate per il recupero mirato dell’informazione in formato elettronico.
Il termine è stato coniato da Calvin Mooers alla fine degli anni ‘40 del Novecento e oggi è usato quasi esclusivamente in ambito informatico.

La rete come deposito di informazioni

L’IR è un campo interdisciplinare che nasce dall’incrocio di discipline diverse.
Coinvolge la psicologia cognitiva, l’architettura informativa, la filosofia, la linguistica, la semiotica, la scienza dell’informazione e l’informatica.
Molte università e biblioteche pubbliche utilizzano sistemi di IR per fornire accesso a pubblicazioni, libri ed altri documenti.

La rete come deposito di informazioni

Per recuperare l’informazione, i sistemi IR usano i linguaggi di interrogazione basati su comandi testuali. Due concetti sono di fondamentale importanza: query ed oggetto.

La query (“interrogazione”) è una stringa di parole-chiave rappresentanti l’informazione richiesta. Viene digitata dall’utente in un sistema IR (per esempio, un motore di ricerca).
Un oggetto è un’entità che mantiene o racchiude informazioni in una banca dati. Un documento di testo, per esempio, è un oggetto di dati.

La rete come deposito di informazioni

Una tipica ricerca di IR ha come input un comando dell’utente.
Poi la sua query viene messa in relazione con gli oggetti presenti nella banca dati.
In risposta, il sistema fornisce un insieme di dati che soddisfano le condizioni richieste.

I motori di ricerca

I motori di ricerca del web sono le applicazioni più note ed ovvie delle teorie di Information retrieval.
I più noti sono i seguenti:

Alltheweb
Altavista
Gigablast
Google (che presenta una schermata di ricerca anche in latino!)
Wisenut

I motori di ricerca

Molti motori di ricerca si configurano come portali.
Un portale è un sito web che costituisce il punto di partenza, una sorta di “porta di ingresso”, a risorse di Internet organizzate in gruppi.
I più noti portali sono:

I motori di ricerca

Alcuni portali presentano una tecnologia di ricerca molto avanzata: questo è il caso di Teoma, il cui nome in gaelico
significa “esperto”. La spiegazione risiede nel fatto che Teoma aggiunge ai normali risultati di un motore di ricerca i siti più popolari tra gli esperti dell’argomento che si sta cercando.
AskJeeves prende il nome dal famoso maggiordomo della saga umoristica di Woodehouse. Il motore ha la capacità di
rispondere a domande formulate in linguaggio naturale, come se dall’altra parte del sistema ci fosse una persona, “il maggiordomo”, in carne ed ossa. Esempio: “Where can I buy a Latin dictionary online?”

I motori di ricerca

Le risposte hanno creato, negli anni, un database di notevoli dimensioni che risponde quasi a tutte le 12 milioni di domande che Ask.com riceve ogni giorno. I risultati di AskJeeves sono il prodotto di almeno 4 distinti database:

Le risposte dei redattori alle domande.
I link sponsorizzati.
I link a pagamento del Google AdWords.
I risultati del motore di ricerca Teoma, di proprietà dello stesso AskJeeves.

I motori di ricerca

Un motore di ricerca particolare, di grande efficacia sul piano didattico, è e-Class, nato all’interno di un progetto curato da Rossana Valenti.
Si tratta di un motore che seleziona i siti di interesse antichistico, indicizzati per nome di autore antico, divisi in testi, materiale didattico, saggi scientifici. Il motore consente a ogni studioso di giungere rapidamente ai siti di suo interesse, evitando la dispersione (il “rumore”) dei siti generalisti, come Google, che spesso presentano, accanto ai dati pertinenti, molte informazioni inutili o errate.

Esempio: Cicero in Google

I motori di ricerca

Oltre una funzione di “filtraggio”, e-Class presenta due aspetti significativi per quanto concerne le tecnologie didattiche: è un esempio di “intelligenza condivisa”, di lavoro e apprendimento collaborativo in rete; impone a ogni “redattore” (in molti casi uno studente) un lavoro di selezione e valutazione delle risorse presenti in Internet. e-Class, infatti, è stato realizzato all’interno dei corsi di Informatica avanzata per gli studenti di Lettere classiche dell’Università Federico II di Napoli.

e-Class

Le tecniche di ricerca

Per rendere più efficace la ricerca all’interno dei motori, è importante usare gli operatori booleani: si tratta di strumenti che devono il proprio nome al matematico inglese George Boole (1815-1864), padre della moderna logica simbolica, e che sono stati adottati come standard dai più diffusi motori di ricerca.
Sono quattro operatori principali: AND, NOT, OR, NEAR. Essi consentono di restringere e raffinare la ricerca.

I motori di ricerca

AND consente di collegare due o più parole: in questo modo il motore restituirà in risposta tutti i documenti indicizzati nel web che contengono tutte le parole inserite.
NOT, che ha un funzionamento opposto a quello di AND, esclude dalla ricerca quei documenti che hanno al loro interno una certa parola chiave.
OR si usa quando la ricerca si concentra su più termini, e non è necessario che li comprenda tutti, ma solo qualcuno o uno di essi.
NEAR funziona in modo simile a AND, ma restringe ulteriormente il campo di ricerca, stabilendo che i termini devono trovarsi a una certa distanza l’uno dall’altro.

I motori di ricerca

Un esempio di uso degli operatori booleani applicato a ricerche sul latino può essere visto nella banca dati Poetria nova, presentata nella prima lezione di questo corso. In figura è mostrata la schermata di ricerca della banca dati, relativa all’uso degli operatori.

Schermata di ricerca della banca dati

Siti e portali

Ti presentiamo alcuni siti di grande utilità per lo studioso di discipline classiche:

Ti presentiamo, inoltre, una rassegna di siti relativi alla ricerca bibliografica in Internet.

Perseus Project

Intratext

Poeti d’Italia in lingua latina

Ricerca bibliografica

Siti e portali

Ti presentiamo alcuni siti elaborati dagli studenti e da loro prevalentemente usati:

Studentville (“sfogliato” nelle varie sezioni)

Altre risorse

Dal dato alla conoscenza

All’interno della nuova condizione comunicativa, nella quale tutti – giovani e vecchi, studenti e docenti, illetterati e intellettuali – siamo immersi, cambiano gli ambienti di formazione, le procedure cognitive, gli strumenti, mediante i quali si sviluppa il processo dell’insegnamento.
La scuola è dunque profondamente toccata da questa rivoluzione, che sta modificando radicalmente anche il ruolo del docente.

Dal dato alla conoscenza

Nella “scuola del passato”, intendendo con questa espressione la struttura scolastica anche di pochi anni fa, il docente è colui che “possiede” le informazioni necessarie a svolgere un compito o a colmare una lacuna, e pertanto trasmette le conoscenze necessarie e insegna come ottenerle e gestirle.
Oggi, gli studenti conoscono e possiedono i mezzi per acquisire rapidamente informazioni su qualsiasi argomento.
Ma chi trasforma quelle informazioni in cultura, la documentazione in apprendimento, la consultazione in studio?

Dal dato alla conoscenza

Il ruolo del docente, in questa prospettiva, è tutt’altro che ridotto: al contrario, ha acquistato rilevanza ancora più grande, perché solo il docente deve far nascere la domanda, che sta dietro le singole, frammentarie ricerche; deve insegnare a filtrare e valutare le informazioni, e a inserire i dati acquisiti in una struttura concettuale forte e coerente.
I risultati di queste azioni vanno molto al di là dei confini della singola disciplina, perché investono le modalità di acquisizione e gestione delle conoscenze, che non possono essere affidati, per ora, a nessuna macchina, per quanto intelligente essa sia.

Dal dato alla conoscenza

Il primo compito che il docente si assume, a proposito di un uso didattico della ricerca on line, riguarda dunque la chiarezza e la necessità della domanda, da cui prenderanno avvio le ricerche; poi andrà messa in evidenza la relatività delle informazioni, per promuovere una “cultura” non della diffidenza ma del controllo delle informazioni; infine i dati ottenuti dovranno essere organizzati in una struttura concettuale chiara e definita dal punto di vista epistemologico.

Gli scenari futuri

Nonostante l’uso e la messa a punto dei motori di ricerca, reperire informazioni in rete è ancora molto problematico: spesso trovare il documento giusto è un’operazione complessa, soggetta a molte variabili.
Il principale ostacolo consiste nel fatto che il web non è stato progettato per essere interpretato, a livello semantico, da computer o da “agenti intelligenti”, ma solo dall’uomo.

Gli scenari futuri

Se infatti è vero che il web si presenta oggi come una grande rete di informazioni, bisogna considerare che, affinché l’informazione diventi conoscenza, deve essere analizzata semanticamente: i motori di ricerca trovano stringhe di caratteri (cfr. l’esempio relativo alla parola Cicero), ma non la “interpretano” come il nome del celebre autore latino, bensì solo come una sequenza di caratteri.

Gli scenari futuri

La tecnologia attuale non permette alcun tipo di analisi semantica: questa è affidata, per ora, solo all’utente, che, all’interno delle informazioni offerte dal motore di ricerca, deve selezionare quelle pertinenti e utili da quelle superflue o devianti.
Questo limite del web è dovuto al fatto che l’informazione è strutturata a un solo livello tramite il linguaggio HTML.

Gli scenari futuri

Si è pensato di ovviare a questi limiti del web mettendo a punto una nuova tecnologia, che ha preso il nome di web semantico: il promotore di questo progetto è Tim Berners-Lee, che a suo tempo “inventò” il web, il quale ha proposto di aumentare la rete attuale con linguaggi che possono esplicitare l’informazione contenuta nelle pagine; non si tratta quindi di definire un nuovo web, ma di estendere quello già presente facendo in modo che l’informazione sia interpretabile dalle macchine, come dall’uomo.

Gli scenari futuri

A questo scopo è stato realizzato il linguaggio XML (eXtensible Markup Language): è un linguaggio di marcatura come l’HTML, che però può estendere i tag, al fine di descrivere i dati semanticamente.

Gli scenari futuri

Ma, al di là degli aspetti meramente applicativi e strumentali, gli sviluppi del web coinvolgono profondamente, potremmo dire “epistemologicamente”, il futuro della filologia. Gregory Crane, lo studioso statunitense autore del Perseus Project, ha scritto in un recente articolo (consultabile in rete), che l’ePhilology, la filologia elettronica, sta evolvendo in una disciplina e una pratica qualitativamente molto diverse dalle forme del passato.

G. Crane: ePhilology

Gli scenari futuri

Secondo Crane, sono sei gli aspetti che definiscono le risorse in un ambiente digitale:
ogni testo può essere inviato da ogni punto della terra in qualunque momento;
i testi sono fondamentalmente ipertestuali, presentando links pertinenti a ogni tipo di informazione (enciclopedie, dizionari, mappe, cronologie, simulazioni…), così da rendere “evidente” ogni argomentazione.

Gli scenari futuri

Il documento interagisce così con altre fonti correlate, che istantaneamente sono pronte a fornire informazioni di fondo o a divenire esse stesse il focus;
piccole e definite unità di informazione possono essere dinamicamente messe in relazione tra loro per essere usate da particolari utenti in momenti particolari;
le risorse in rete “imparano” da sole, applicando processi automatici come la creazione di indici, l’analisi morfologica e sintattica, l’elaborazione di mappe;

Gli scenari futuri

Le risorse “imparano” dai loro lettori, facendo immediatamente uso delle loro conoscenze implicite o esplicite; le risorse si adattano automaticamente all’ambiente e agli obiettivi specifici dei loro utenti, modificando e selezionando il loro assetto. In questo mondo digitale, le idee si incontrano all’incrocio di lingue e culture diverse, con una velocità e una autenticità mai sperimentate finora nella storia umana.

Gli scenari futuri

Quello che si profila davanti ai nostri occhi è un ambiente digitale che integra un crescente numero di strumenti (televisione, personal computer, telefoni cellulari, videocamere che “dialogano” tra loro, come avviene adesso, con le riprese fatte con il videocellulare e riportate in rete), rendendo dinamica la stessa informazione: per usare l’efficace metafora che costituisce il titolo dell’articolo di Crane, libri che leggono e imparano gli uni dagli altri e dai loro lettori umani.

Gli scenari futuri

La sfida che ci aspetta e ci coinvolge in quanto classicisti e docenti non sta nell’imparare a usare questi strumenti, ma nel portare la complessità (e la bellezza) delle nostre discipline dentro questo mondo, contribuendo a disegnarlo.

Esercitazione