STORM: Duolingo insegna le lingue mentre traduce il web | STREAM!

STORM: Duolingo insegna le lingue mentre traduce il web

STORM: da reCAPTCHA a Duolingo, il crowdsourcing al servizio della conoscenza.

Luis von Ahn -classe ‘79, nato in Guatemala ma americano d’adozione- è professore associato d’Informatica della Carnegie Mellon University. È uno di quei visionari le cui innovazioni permeano rapidamente nella nostra quotidianità online e mettono la tecnologia al nostro servizio per affrontare problemi di natura complessa. Ad esempio, qual è il modo più veloce per tradurre il web? 

I contenuti che si trovano online sono per la maggior parte in inglese e questo li rende inaccessibili a chi non parla questa lingua, rendendo il World Wide Web un po’ meno orientato a tutto il ‘world’. E se dei traduttori professionisti decidessero di tradurre questi contenuti nelle altre lingue più parlate al mondo ci vorrebbe un’eternità e costerebbe una fortuna. Luis von Ahn,invece, ha progettato una soluzione focalizzata sul concetto di crowdsourcing -al quale lavora ben dal 2001- grazie alla quale l’intera Wikipedia potrebbe essere tradotta dall’inglese allo spagnolo in sole 80 ore.

Ma andiamo per ordine.

A von Ahn (più altri tre ricercatori) dobbiamo, innanzitutto, l’invenzione dei CAPTCHA, che sono quelle sequenze di letteri e numeri che dobbiamo digitare, ad esempio, al momento della registrazione ad un sito o per scrivere un commento ad un blog. L’acronimo CAPTCHA sta per ‘completely automated public Turing test to tell computers and humans apart’ ed è uno strumento che impedisce che i bot utilizzino determinati servizi perché, mentre l’occhio umano è in grado di leggere quei caratteri distorti ed offuscati, i computer non sono ancora in grado di farlo.

Certo è che ognuno di noi tira un sospiro di stizzita rassegnazione quando si ritrova davanti ad un test CAPTCHA, magari mentre cerca di accaparrarsi gli ultimi biglietti in offerta di Ryanair, magari in piena notte con gli occhi che a stento si tengono ancora aperti.

Questo lo ho capito presto anche von Ahn che, osservando che circa 200 milioni di CAPTCHA venivano digitati ogni giorno, ha pensato di migliorare il servizio facendo in modo che quei 10 secondi che ognuno di noi impiega per digitare un CAPTCHA non fossero tempo sprecato. È nato così reCAPTCHA  (acquistato poi da Google) che permette di digitalizzare il testo di libri, giornali e vecchi show radiofonici, al motto di ‘Stop spam. Read books’.

Fra i siti che usano questo servizio ci sono Facebook, Twitter e TicketMaster e reCAPTCHA fornisce loro immagini (scannerizzate) di parole che i software di riconoscimento ottico dei caratteri non sono stati in grado di leggere. E qui entriamo in gioco noi, che una parola alla volta, contribuiamo ad archiviare e rendere più accessibili (la trasformazione da immagine a testo è fondamentale per facilitare ricerche e conservazione dei dati) parti del nostro patrimonio letterario. Quindi abbiamo poco da sbuffare.

Ma torniamo all’idea di tradurre il web e renderlo più accessibile anche a chi non parla inglese. L’ultima creatura del professor Von Ahn si chiama Duolingo ed è un sito che permette di imparare gratuitamente le lingue. Per ora è disponibile per apprendere spagnolo, tedesco e francese (per gli anglofoni) e inglese (per chi parla spagnolo e portoghese). 

Ad una prima occhiata, Duolingo –uscito dalla fase beta a giugno- sembra molto simile a molti altri corsi online in cui si succedono esercizi e frasi da tradurre. Alcune di queste frasi vengono dal materiale standard su cui si basa un comunissimo corso di lingua, mentre altre sono parti di testi tratti dal web. La difficoltà delle traduzioni aumenta progressivamente, a seconda dei risultati ottenuti dagli studenti, che vengono valutati sia da Duolingo -che assegna loro un punteggio paragonando le varie traduzioni degli altri studenti, sia da questi ultimi, che possono votare a loro volta ogni traduzione pubblicata sul sito. Su Duolingo s’impara “by doing” e i punti guadagnati traducendo e votando le traduzioni altrui sono essenziali per sbloccare l’accesso ai livelli più avanzati. 

Von Ahn ha condotto dei primi test per accertarsi che Duolingo sia efficace per l’apprendimento di una nuova lingua almeno quanto i principali software in commercio e che le traduzioni siano accurate. I risultati sono incoraggianti. Il meccanismo sembra funzionare: infatti, nel far tradurre la stessa frase ad un gruppo di persone a diversi livelli di conoscenza di una lingua e scegliendo fra queste la migliore, il risultato è comparabile alla traduzione di un singolo traduttore professionista. 

Ad ora, i 250mila alunni/traduttori di Duolingo hanno il potenziale di rendere accessibile tutto il contenuto di Wikipedia in spagnolo in 2 settimane e mezzo. Ma von Ahn punta al milione di user, così basterebbero solo 80 ore. 

Volete unirvi a lui?

Elisa Cecilli 

Photo credits: Duolingo & CAPTCHArt

(i CAPTCHArt associano un’immagine, disegno o fumetto alle composizioni più assurde o più divertenti di due parole generata automaticamente dai test CAPTCHA)

Recent comments

Blog comments powered by Disqus
Join our Mailing List