mardi 8 novembre 2011

Consulenza sulla traduzione automatica per le imprese

Blog de Translation 2.0 Translation 2.0 Search Engine Marketing & Branding for Translators Translation 2.0 di Jean-Marie Le Ray S.a.s. in English Translation 2.0 di Jean-Marie Le Ray S.a.s. in Italiano Translation 2.0 di Jean-Marie Le Ray S.a.s. en français @ Translation 2.0 di Jean-Marie Le Ray S.a.s. RSS Feed for Translation 2.0 Blog Translation 2.0 on Twitter Translation 2.0 on Facebook Jean-Marie Le Ray on LinkedIn Some Clouds on Wordle Some presentations on SlideShare Some video-sharing on YouTube

E' probabile che presto i grandi protagonista della Traduzione Automatica, tra cui Google e Microsoft ai primi posti, metteranno a disposizione degli utenti soluzioni personalizzate di TA (o MT in inglese, per Machine Translation, da non confondere con TM, che sta per Translation Memory, memoria di traduzione).

Dove s'intende per "soluzione personalizzata" la possibilità per ognuno di crearsi un motore di TA, alimentato e "formato" con i propri dati.

Ma perché costruire il proprio motore di TA? Ovviamente non è cosa necessaria per tutti, per chi le soluzioni online gratuite o a pagamento già disponibili vanno più che bene, ma sarà senz'altro molto utile per una larga fascia di utenti - generalmente più società che privati -, i quali fanno regolarmente tradurre materiale commerciale, tecnico, promozionale o altro.

Grandi o piccole e medie imprese e industrie che realizzano una parte importante del proprio fatturato all'estero sanno già l'importanza di poter contare su seri professionisti della traduzione, che hanno ovviamente un costo adeguato alla propria professionalità. Per cui un'impresa che fa spesso tradurre i suoi manuali/documenti deve affrontare dei costi alti di traduzione, e in quel caso potrebbe avere senso implementare un motore di TA dedicato ai propri prodotti/servizi.

Sento già arrivare le prime obiezioni sulla qualità dei testi che passeranno sotto le forche caudine del motore di TA, o meglio, sulla non-qualità dell'output di un testo umiliato o mortificato dalla TA!

Un'immagine ben presente nel 99% dei clienti e persino dei traduttori, ma che per fortuna non corrisponde più a quello che sta diventando la traduzione automatica.

Che non è un sostituto del traduttore, bensì un nuovo tool nelle mani del traduttore. Un tool estremamente potente se concepito e usato con criterio.

Tutto l'equivoco della traduzione automatica nasce da lì: da sempre viene erroneamente percepita come qualcosa di un po' misterioso destinato a sostituire in tutto e per tutto il lavoro del traduttore, ma questo punto di vista è più una superstizione che un approccio concreto e razionale alla realtà dei fatti.

E i fatti sono che la traduzione automatica ha senso solo se adoperata in modo complementare al lavoro del traduttore, e sotto il suo diretto controllo. Un nuovo modo di tradurre, quindi, che avrà successo solo presso clienti e traduttori capaci di abbattere le superstizioni per riflettere su questa nuova opportunità e valutarne attentamente i pro e i contro.

Ma di che parliamo esattamente? Oggi l'ambiente di lavoro del traduttore si basa sulla traduzione assistita dal computer, che permette di riunire in una sola postazione diversi strumenti utili, le cui principali funzionalità sono la gestione terminologica e le memorie di traduzione:
Nell'uso comune del termine, una memoria di traduzione è un semplice database di campi contenenti il segmento nella lingua sorgente, la traduzione del segmento, e altre informazioni (paragonabili a metadati) sul segmento stesso (data di creazione, ultima modifica, nome del traduttore, ecc.).
L'altro grosso vantaggio di una memoria è di poter vedere le parole nel loro contesto, e di vedere in modo parallelo contesto sorgente e contesto target: in traduzione, non si fa mai niente di buono se non si conosce il contesto!

Altri strumenti molto usati sono i programmi di dettatura vocale, che consentono un grosso risparmio di tempo: dettare è molto più veloce che scrivere alla tastiera. Spesso infine, tutti questi strumenti vengono usati contemporaneamente, con lo scopo di ottimizzare la resa, e cioè la quantità di parole tradotte in un giorno.

Ora, normalmente la resa giornaliera di un traduttore è di ca. 2500 parole al giorno, come minimo, e fino al doppio o più in certi casi o per un numero ridotto di traduttori molto veloci e specializzati, che conoscono perfettamente il loro campo d'intervento. Comunque, anche volendo avventurarci in una forbice di 2.500/10.000 parole al giorno per la traduzione umana, non può essere in nessun modo paragonabile con la capacità quasi illimitata di un motore di TA (dell'ordine di milioni di parole al giorno).

Dunque con queste medie umane, un grafico di AsiaOnline può aiutarci a capire meglio quanti giorni ci vogliono, grosso modo, per un dato tipo di progetto :


ma fino a un certo punto, oltre il quale tempi e costi diventono talmente elevati da essere anti-economici. Ragion per cui grande quantità di contenuti che potrebbero/dovrebbero essere tradotti, in realtà non lo sono: troppo lungo, troppo costoso! AsiaOnline fa l'esempio della traduzione in inglese della base giapponese dei brevetti: circa 13 milioni di parole che richiederebbe ad un traduttore, secondo tempi e costi attuali, più di 150 mille anni con una fattura di ca. 40 miliardi €!!!

Un doppio problema che scompare con la TA ... purché la qualità possa essere garantita. Anche se prima di tutto è necessario mettersi d'accordo sul termine stesso di qualità e sui suoi significati: non c'è UNA qualità assoluta, tanto meno in traduzione, ma diverse gradazioni di qualità: è il concetto del "good enough", e cioè del livello "accettabile" secondo l'uso finale al quale è destinato il lavoro e/o secondo il destinatario (o l'utilizzatore finale, secondo diversa terminologia...).

Inoltre, nella traduzione automatica, la qualità dell'output è strettamente proporzionale alla qualità dell'input (il "Garbage in = Garbage-out" sarebbe la regola piuttosto che l'eccezione in questo campo, a giudicare dalla qualità delle memorie di traduzione in circolazione), e non c'è qualità dell'input senza la supervisione del traduttore.

E' la nozione di "clean data" propugnata da AsiaOnline:

Ma come si alimenta un motore di TA?

Ci vogliono due corpora distinti per ogni coppia linguistica (qui mi referisco soltanto alle lingue europee più comuni):
  1. un corpus bilingue che assomiglia ad una memoria di traduzione, e cioè una serie di frasi e/o segmenti corrispondenti in lingua sorgente e target;
  2. un corpus monolingue della lingua di specialità (target) in modo che il motore possa imparare dalla morfosintassi di quella lingua.
Secondo uno specialista dei motori di TA con chi ho discusso di questi temi, per ottenere i migliori risultati ci vogliono circa 5000 frasi per il "tuning" (cioè la messa a punto iniziale), circa 1-1,5 milioni di frasi/segmenti bilingue (300.000 come minimo ma con risultati sensibilmente inferiori) per il "training" (cioè "formare" il motore), e circa 500.000 frasi monolingue per il "tooling" (cioè il motore impara le "regole" della lingua), tre operazioni completate poi dal "testing" per misurare la "qualità" dei risultati (Bleu score, ad esempio).

Ho specificato "lingua di specialità" (o "tecnica" nel senso lato, se preferite), perché bisogna capire che il motore creato in questo modo s'inserisce poi nel motore generico della coppia linguistica di interesse. Quindi, concretamente, se intendo tradurre testi di informatica dall'inglese al francese, devo creare un motore "verticale" (circoscritto all'informatica, in questo caso), che si aggiunge poi al motore di base (la lingua generica) EN --> FR. Ovviamente, nuovi corpora vanno creati per ogni coppia linguistica e/o settore tecnico diverso.

Ma non finisce qui: le operazioni di pre- e post-editing sono altrettanto importanti per migliorare la qualità del motore.

Il pre-editing consiste nel "pulire" il testo bilingue, sia manualmente sia in modo automatizzato, ed è fondamentale per la qualità finale. Più il corpus di partenza è pulito, più sarà pulita la traduzione finale. Anche l'armonizzazione dei formati di documenti deve essere calcolata.

Altra pre-operazione da non sottovalutare è l'anonimizzazione del corpus (nel campo giuridico e contrattuale, ad esempio, ma non solo), per prevenire poi ogni problematica a livello legale, un aspetto spesso cruciale in traduzione, dove garantire l'assoluta confidenzialità dei dati fa parte dell'incarico.

Ma nell'ambito "corporate", il lavoro a monte si può anche estendere alla redazione dei documenti in vista della loro traduzione. E' la sfida del linguaggio controllato:
Per quanto riguarda il post-editing, invece, che consiste nel correggere/migliorare il testo tradotto in automatico, è un'operazione che serve all'auto-apprendimento del motore e va ripetuta finché non si è soddisfatti della TA in output. Ovviamente, più il motore apprende in questo modo, e più il post-editing guadagna in velocità.

In conclusione, ho tentato di spiegare un po' i meccanismi senza entrare troppo nei dettagli, cercando di dare un'idea delle quantità di frasi/segmenti necessari per ogni coppia linguistica/settore. Molte soluzioni online propongono già di creare "motori personalizzati" cominciando da 50.000 segmenti in su, ma creare un motore di TA serio e di livello professionale richiederà senz'altro un minimo di investimento e di pianificazione se si vuole ottenere risultati all'altezza delle proprie aspettative.

In ogni caso, la traduzione automatica potrà senz'altro rivelarsi un'ottima opportunità per tutte le aziende (comprese le società di traduzioni!) che sapranno rilevare la sfida con giudizio e criterio.

Idem per i traduttori, che dovrebbero cominciare a considerare la traduzione automatica per quello che è (o che sarà a breve...), e cioè uno strumento potente per aiutarli a produrre di più e meglio, e, di conseguenza, a guadagnare di più.

Infine, per i clienti, spero che saranno sempre più consapevoli che il giusto prezzo non va misurato con la minore offerta (per quanto pagata poco, una traduzione fatta male costerà sempre troppo!), ma con il rapporto adeguato tra investimento e ROI.

Consulenza su richiesta.

Aucun commentaire:

Enregistrer un commentaire