Alcune riflessioni preliminari
A partire dalla metà del Novecento si è via via compreso che accanto al mondo dell’energia e della materia esiste il mondo dell’informazione: un elemento concreto e nel contempo impalpabile, che ha raggiunto rapidamente proporzioni e ampiezza impressionanti, rivelandosi capace di attirare investimenti massicci e di impegnare innumerevoli ricercatori e tecnici.
La rete si è rapidamente configurata come un immenso deposito di dati, in continua evoluzione, e rappresenta oggi il più grande contenitore di informazione mai assemblata dall’uomo. Documenti e risorse multimediali, presenti in rete, riguardano qualsiasi argomento immaginabile. Questa informazione è disponibile istantaneamente a ogni utente, in qualunque parte del mondo, purché provvisto di una connessione Internet.
Il successo del web è dovuto al fatto che esso è decentralizzato e universale: le pagine web risiedono su computer sparsi in tutto il mondo e ogni documento può rimandare a qualsiasi altro documento, ovunque collocato. Ogni utente può aggiungere informazioni al web contribuendo istantaneamente alla sua crescita, che in pochi anni è diventata esponenziale.
La rete si è trasformata rapidamente in un’estensione delle nostre conoscenze e dei nostri atti: in questa ottica è assolutamente essenziale saper trovare, tra milioni di dati, l’informazione che ci serve.
L’Information retrieval
L’Information retrieval (IR) (lett: recupero d’informazioni) è l’insieme delle tecniche utilizzate per il recupero mirato dell’informazione in formato elettronico.
Il termine è stato coniato da Calvin Mooers alla fine degli anni ‘40 del Novecento e oggi è usato quasi esclusivamente in ambito informatico.
L’IR è un campo interdisciplinare che nasce dall’incrocio di discipline diverse.
Coinvolge la psicologia cognitiva, l’architettura informativa, la filosofia, la linguistica, la semiotica, la scienza dell’informazione e l’informatica.
Molte università e biblioteche pubbliche utilizzano sistemi di IR per fornire accesso a pubblicazioni, libri ed altri documenti.
Per recuperare l’informazione, i sistemi IR usano i linguaggi di interrogazione basati su comandi testuali. Due concetti sono di fondamentale importanza: query ed oggetto.
I motori di ricerca del web sono le applicazioni più note ed ovvie delle teorie di Information retrieval.
I più noti sono i seguenti:
Molti motori di ricerca si configurano come portali.
Un portale è un sito web che costituisce il punto di partenza, una sorta di “porta di ingresso”, a risorse di Internet organizzate in gruppi.
I più noti portali sono:
Alcuni portali presentano una tecnologia di ricerca molto avanzata: questo è il caso di Teoma, il cui nome in gaelico
significa “esperto”. La spiegazione risiede nel fatto che Teoma aggiunge ai normali risultati di un motore di ricerca i siti più popolari tra gli esperti dell’argomento che si sta cercando.
AskJeeves prende il nome dal famoso maggiordomo della saga umoristica di Woodehouse. Il motore ha la capacità di
rispondere a domande formulate in linguaggio naturale, come se dall’altra parte del sistema ci fosse una persona, “il maggiordomo”, in carne ed ossa. Esempio: “Where can I buy a Latin dictionary online?”
Le risposte hanno creato, negli anni, un database di notevoli dimensioni che risponde quasi a tutte le 12 milioni di domande che Ask.com riceve ogni giorno. I risultati di AskJeeves sono il prodotto di almeno 4 distinti database:
Un motore di ricerca particolare, di grande efficacia sul piano didattico, è e-Class, nato all’interno di un progetto curato da Rossana Valenti.
Si tratta di un motore che seleziona i siti di interesse antichistico, indicizzati per nome di autore antico, divisi in testi, materiale didattico, saggi scientifici. Il motore consente a ogni studioso di giungere rapidamente ai siti di suo interesse, evitando la dispersione (il “rumore”) dei siti generalisti, come Google, che spesso presentano, accanto ai dati pertinenti, molte informazioni inutili o errate.
Esempio: Cicero in Google
Oltre una funzione di “filtraggio”, e-Class presenta due aspetti significativi per quanto concerne le tecnologie didattiche: è un esempio di “intelligenza condivisa”, di lavoro e apprendimento collaborativo in rete; impone a ogni “redattore” (in molti casi uno studente) un lavoro di selezione e valutazione delle risorse presenti in Internet. e-Class, infatti, è stato realizzato all’interno dei corsi di Informatica avanzata per gli studenti di Lettere classiche dell’Università Federico II di Napoli.
Per rendere più efficace la ricerca all’interno dei motori, è importante usare gli operatori booleani: si tratta di strumenti che devono il proprio nome al matematico inglese George Boole (1815-1864), padre della moderna logica simbolica, e che sono stati adottati come standard dai più diffusi motori di ricerca.
Sono quattro operatori principali: AND, NOT, OR, NEAR. Essi consentono di restringere e raffinare la ricerca.
Un esempio di uso degli operatori booleani applicato a ricerche sul latino può essere visto nella banca dati Poetria nova, presentata nella prima lezione di questo corso. In figura è mostrata la schermata di ricerca della banca dati, relativa all’uso degli operatori.
Ti presentiamo alcuni siti di grande utilità per lo studioso di discipline classiche:
Ti presentiamo, inoltre, una rassegna di siti relativi alla ricerca bibliografica in Internet.
Ti presentiamo alcuni siti elaborati dagli studenti e da loro prevalentemente usati:
Studentville (“sfogliato” nelle varie sezioni)
All’interno della nuova condizione comunicativa, nella quale tutti – giovani e vecchi, studenti e docenti, illetterati e intellettuali – siamo immersi, cambiano gli ambienti di formazione, le procedure cognitive, gli strumenti, mediante i quali si sviluppa il processo dell’insegnamento.
La scuola è dunque profondamente toccata da questa rivoluzione, che sta modificando radicalmente anche il ruolo del docente.
Nella “scuola del passato”, intendendo con questa espressione la struttura scolastica anche di pochi anni fa, il docente è colui che “possiede” le informazioni necessarie a svolgere un compito o a colmare una lacuna, e pertanto trasmette le conoscenze necessarie e insegna come ottenerle e gestirle.
Oggi, gli studenti conoscono e possiedono i mezzi per acquisire rapidamente informazioni su qualsiasi argomento.
Ma chi trasforma quelle informazioni in cultura, la documentazione in apprendimento, la consultazione in studio?
Il ruolo del docente, in questa prospettiva, è tutt’altro che ridotto: al contrario, ha acquistato rilevanza ancora più grande, perché solo il docente deve far nascere la domanda, che sta dietro le singole, frammentarie ricerche; deve insegnare a filtrare e valutare le informazioni, e a inserire i dati acquisiti in una struttura concettuale forte e coerente.
I risultati di queste azioni vanno molto al di là dei confini della singola disciplina, perché investono le modalità di acquisizione e gestione delle conoscenze, che non possono essere affidati, per ora, a nessuna macchina, per quanto intelligente essa sia.
Il primo compito che il docente si assume, a proposito di un uso didattico della ricerca on line, riguarda dunque la chiarezza e la necessità della domanda, da cui prenderanno avvio le ricerche; poi andrà messa in evidenza la relatività delle informazioni, per promuovere una “cultura” non della diffidenza ma del controllo delle informazioni; infine i dati ottenuti dovranno essere organizzati in una struttura concettuale chiara e definita dal punto di vista epistemologico.
Nonostante l’uso e la messa a punto dei motori di ricerca, reperire informazioni in rete è ancora molto problematico: spesso trovare il documento giusto è un’operazione complessa, soggetta a molte variabili.
Il principale ostacolo consiste nel fatto che il web non è stato progettato per essere interpretato, a livello semantico, da computer o da “agenti intelligenti”, ma solo dall’uomo.
Se infatti è vero che il web si presenta oggi come una grande rete di informazioni, bisogna considerare che, affinché l’informazione diventi conoscenza, deve essere analizzata semanticamente: i motori di ricerca trovano stringhe di caratteri (cfr. l’esempio relativo alla parola Cicero), ma non la “interpretano” come il nome del celebre autore latino, bensì solo come una sequenza di caratteri.
La tecnologia attuale non permette alcun tipo di analisi semantica: questa è affidata, per ora, solo all’utente, che, all’interno delle informazioni offerte dal motore di ricerca, deve selezionare quelle pertinenti e utili da quelle superflue o devianti.
Questo limite del web è dovuto al fatto che l’informazione è strutturata a un solo livello tramite il linguaggio HTML.
Si è pensato di ovviare a questi limiti del web mettendo a punto una nuova tecnologia, che ha preso il nome di web semantico: il promotore di questo progetto è Tim Berners-Lee, che a suo tempo “inventò” il web, il quale ha proposto di aumentare la rete attuale con linguaggi che possono esplicitare l’informazione contenuta nelle pagine; non si tratta quindi di definire un nuovo web, ma di estendere quello già presente facendo in modo che l’informazione sia interpretabile dalle macchine, come dall’uomo.
A questo scopo è stato realizzato il linguaggio XML (eXtensible Markup Language): è un linguaggio di marcatura come l’HTML, che però può estendere i tag, al fine di descrivere i dati semanticamente.
Ma, al di là degli aspetti meramente applicativi e strumentali, gli sviluppi del web coinvolgono profondamente, potremmo dire “epistemologicamente”, il futuro della filologia. Gregory Crane, lo studioso statunitense autore del Perseus Project, ha scritto in un recente articolo (consultabile in rete), che l’ePhilology, la filologia elettronica, sta evolvendo in una disciplina e una pratica qualitativamente molto diverse dalle forme del passato.
Secondo Crane, sono sei gli aspetti che definiscono le risorse in un ambiente digitale:
ogni testo può essere inviato da ogni punto della terra in qualunque momento;
i testi sono fondamentalmente ipertestuali, presentando links pertinenti a ogni tipo di informazione (enciclopedie, dizionari, mappe, cronologie, simulazioni…), così da rendere “evidente” ogni argomentazione.
Il documento interagisce così con altre fonti correlate, che istantaneamente sono pronte a fornire informazioni di fondo o a divenire esse stesse il focus;
piccole e definite unità di informazione possono essere dinamicamente messe in relazione tra loro per essere usate da particolari utenti in momenti particolari;
le risorse in rete “imparano” da sole, applicando processi automatici come la creazione di indici, l’analisi morfologica e sintattica, l’elaborazione di mappe;
Le risorse “imparano” dai loro lettori, facendo immediatamente uso delle loro conoscenze implicite o esplicite; le risorse si adattano automaticamente all’ambiente e agli obiettivi specifici dei loro utenti, modificando e selezionando il loro assetto. In questo mondo digitale, le idee si incontrano all’incrocio di lingue e culture diverse, con una velocità e una autenticità mai sperimentate finora nella storia umana.
Quello che si profila davanti ai nostri occhi è un ambiente digitale che integra un crescente numero di strumenti (televisione, personal computer, telefoni cellulari, videocamere che “dialogano” tra loro, come avviene adesso, con le riprese fatte con il videocellulare e riportate in rete), rendendo dinamica la stessa informazione: per usare l’efficace metafora che costituisce il titolo dell’articolo di Crane, libri che leggono e imparano gli uni dagli altri e dai loro lettori umani.
La sfida che ci aspetta e ci coinvolge in quanto classicisti e docenti non sta nell’imparare a usare questi strumenti, ma nel portare la complessità (e la bellezza) delle nostre discipline dentro questo mondo, contribuendo a disegnarlo.
Allestimento ed uso di materiale didattico al computer
1. Il ruolo del docente nell'utilizzo delle TIC. Risorse e banche dati
3. La ricerca on-line per i docenti e per gli studenti
4. Allestimento e uso di materiale didattico al computer
6. Le immagini: la valenza didattica
7. Le immagini: trattamento e uso
8. Siti Web: spazi di condivisione didattica
10. Studio di casi
F. Metitieri- R. Ridi, Ricerche bibliografiche in Internet, Milano 1998.
G. Crane, ePhilology: when the books talk to their readers, in Blackwell Companion to Digital Literary Studies (Forthcoming), New York London 2007
Altre risorse per gli studenti
Crane, ePhilology: When the Books Talk to Their Readers, Blackwell, 2007.
Gli strumenti per la ricerca bibliografica