Affichage des articles dont le libellé est Traduzione automatica. Afficher tous les articles
Affichage des articles dont le libellé est Traduzione automatica. Afficher tous les articles

lundi 2 avril 2012

Communication sur Microsoft® Translator Hub

Blog de Translation 2.0 Translation 2.0 Search Engine Marketing & Branding for Translators Translation 2.0 di Jean-Marie Le Ray S.a.s. in English Translation 2.0 di Jean-Marie Le Ray S.a.s. in Italiano Translation 2.0 di Jean-Marie Le Ray S.a.s. en français @ Translation 2.0 di Jean-Marie Le Ray S.a.s. RSS Feed for Translation 2.0 Blog Translation 2.0 on Twitter Translation 2.0 on Facebook Jean-Marie Le Ray on LinkedIn Some Clouds on Wordle Some presentations on SlideShare Some video-sharing on YouTube

Voici maintenant un mois que la traduction automatique a un nouvel acteur : Microsoft ! Le géant de Redmond, déjà actif dans la TA avec Bing, offre depuis fin février aux internautes de toutes les langues une véritable plateforme dédiée : http://hub.microsofttranslator.com, dont l’objectif philanthropique avoué - protéger les langues en danger d'extinction - se double du désir de mettre à la disposition des entreprises et des professionnels, mais surtout des fournisseurs de services linguistiques, une technologie capable d'apprendre à partir de textes déjà traduits : un nouvel outil fort utile pour aider à traduire dans divers domaines productifs.

Or le résultat de la traduction automatique étant strictement dépendant de la qualité et la quantité de textes déjà traduits par des professionnels, d’importants opérateurs du secteur testent déjà le système, disponible à tous, dont Soget, en collaboration avec Translation 2.0 (versione italiana) sur les couples de langues et les domaines suivants :
Les résultats des tests seront disponibles avant la fin de ce trimestre.

Développé sur Windows Azure™, Microsoft Translator Hub, qui est une extension de la plateforme et des services de traduction de Microsoft, permet aux entreprises de créer leur propre moteur de traduction automatique, personnalisé en fonction de la terminologie « maison » qu’elles utilisent pour mieux promouvoir leurs offres commerciales à l’international.

Idem pour les communautés linguistiques et culturelles qui pourront développer des systèmes de TA sur mesure, afin de faciliter l'accès de leurs membres à une information désormais mondialisée. Avec un double avantage : permettre à des communautés restreintes de mieux partager des connaissances locales dans le village global de l’Internet, et assurer la vitalité de leurs langues pour garantir à long terme un bénéfice socioculturel à l’intention des générations futures.

Les applications de ce nouveau système de traduction automatique sont nombreuses :
  • localisation et actualisation permanentes de la présence institutionnelle des entreprises sur le Web,
  • traduction de leurs bases de connaissances, des FAQ, de leur documentation technique et commerciale, etc.
Un potentiel énorme, donc, mais qui nécessite cependant une utilisation judicieuse de l'outil en y ajoutant des fonctionnalités pointues de post-édition pour améliorer en permanence les traductions obtenues.

Un succès garanti pour toutes les sociétés qui ne recherchent pas uniquement un bénéfice immédiat bien que partiel, mais plutôt une solution de moyen-long terme visant à réduire les délais et les coûts grâce à une intégration intelligente entre la technologie de pointe d’une part, et l’expertise professionnelle traditionnelle de l’autre.

mardi 8 novembre 2011

Consulenza sulla traduzione automatica per le imprese

Blog de Translation 2.0 Translation 2.0 Search Engine Marketing & Branding for Translators Translation 2.0 di Jean-Marie Le Ray S.a.s. in English Translation 2.0 di Jean-Marie Le Ray S.a.s. in Italiano Translation 2.0 di Jean-Marie Le Ray S.a.s. en français @ Translation 2.0 di Jean-Marie Le Ray S.a.s. RSS Feed for Translation 2.0 Blog Translation 2.0 on Twitter Translation 2.0 on Facebook Jean-Marie Le Ray on LinkedIn Some Clouds on Wordle Some presentations on SlideShare Some video-sharing on YouTube

E' probabile che presto i grandi protagonista della Traduzione Automatica, tra cui Google e Microsoft ai primi posti, metteranno a disposizione degli utenti soluzioni personalizzate di TA (o MT in inglese, per Machine Translation, da non confondere con TM, che sta per Translation Memory, memoria di traduzione).

Dove s'intende per "soluzione personalizzata" la possibilità per ognuno di crearsi un motore di TA, alimentato e "formato" con i propri dati.

Ma perché costruire il proprio motore di TA? Ovviamente non è cosa necessaria per tutti, per chi le soluzioni online gratuite o a pagamento già disponibili vanno più che bene, ma sarà senz'altro molto utile per una larga fascia di utenti - generalmente più società che privati -, i quali fanno regolarmente tradurre materiale commerciale, tecnico, promozionale o altro.

Grandi o piccole e medie imprese e industrie che realizzano una parte importante del proprio fatturato all'estero sanno già l'importanza di poter contare su seri professionisti della traduzione, che hanno ovviamente un costo adeguato alla propria professionalità. Per cui un'impresa che fa spesso tradurre i suoi manuali/documenti deve affrontare dei costi alti di traduzione, e in quel caso potrebbe avere senso implementare un motore di TA dedicato ai propri prodotti/servizi.

Sento già arrivare le prime obiezioni sulla qualità dei testi che passeranno sotto le forche caudine del motore di TA, o meglio, sulla non-qualità dell'output di un testo umiliato o mortificato dalla TA!

Un'immagine ben presente nel 99% dei clienti e persino dei traduttori, ma che per fortuna non corrisponde più a quello che sta diventando la traduzione automatica.

Che non è un sostituto del traduttore, bensì un nuovo tool nelle mani del traduttore. Un tool estremamente potente se concepito e usato con criterio.

Tutto l'equivoco della traduzione automatica nasce da lì: da sempre viene erroneamente percepita come qualcosa di un po' misterioso destinato a sostituire in tutto e per tutto il lavoro del traduttore, ma questo punto di vista è più una superstizione che un approccio concreto e razionale alla realtà dei fatti.

E i fatti sono che la traduzione automatica ha senso solo se adoperata in modo complementare al lavoro del traduttore, e sotto il suo diretto controllo. Un nuovo modo di tradurre, quindi, che avrà successo solo presso clienti e traduttori capaci di abbattere le superstizioni per riflettere su questa nuova opportunità e valutarne attentamente i pro e i contro.

Ma di che parliamo esattamente? Oggi l'ambiente di lavoro del traduttore si basa sulla traduzione assistita dal computer, che permette di riunire in una sola postazione diversi strumenti utili, le cui principali funzionalità sono la gestione terminologica e le memorie di traduzione:
Nell'uso comune del termine, una memoria di traduzione è un semplice database di campi contenenti il segmento nella lingua sorgente, la traduzione del segmento, e altre informazioni (paragonabili a metadati) sul segmento stesso (data di creazione, ultima modifica, nome del traduttore, ecc.).
L'altro grosso vantaggio di una memoria è di poter vedere le parole nel loro contesto, e di vedere in modo parallelo contesto sorgente e contesto target: in traduzione, non si fa mai niente di buono se non si conosce il contesto!

Altri strumenti molto usati sono i programmi di dettatura vocale, che consentono un grosso risparmio di tempo: dettare è molto più veloce che scrivere alla tastiera. Spesso infine, tutti questi strumenti vengono usati contemporaneamente, con lo scopo di ottimizzare la resa, e cioè la quantità di parole tradotte in un giorno.

Ora, normalmente la resa giornaliera di un traduttore è di ca. 2500 parole al giorno, come minimo, e fino al doppio o più in certi casi o per un numero ridotto di traduttori molto veloci e specializzati, che conoscono perfettamente il loro campo d'intervento. Comunque, anche volendo avventurarci in una forbice di 2.500/10.000 parole al giorno per la traduzione umana, non può essere in nessun modo paragonabile con la capacità quasi illimitata di un motore di TA (dell'ordine di milioni di parole al giorno).

Dunque con queste medie umane, un grafico di AsiaOnline può aiutarci a capire meglio quanti giorni ci vogliono, grosso modo, per un dato tipo di progetto :


ma fino a un certo punto, oltre il quale tempi e costi diventono talmente elevati da essere anti-economici. Ragion per cui grande quantità di contenuti che potrebbero/dovrebbero essere tradotti, in realtà non lo sono: troppo lungo, troppo costoso! AsiaOnline fa l'esempio della traduzione in inglese della base giapponese dei brevetti: circa 13 milioni di parole che richiederebbe ad un traduttore, secondo tempi e costi attuali, più di 150 mille anni con una fattura di ca. 40 miliardi €!!!

Un doppio problema che scompare con la TA ... purché la qualità possa essere garantita. Anche se prima di tutto è necessario mettersi d'accordo sul termine stesso di qualità e sui suoi significati: non c'è UNA qualità assoluta, tanto meno in traduzione, ma diverse gradazioni di qualità: è il concetto del "good enough", e cioè del livello "accettabile" secondo l'uso finale al quale è destinato il lavoro e/o secondo il destinatario (o l'utilizzatore finale, secondo diversa terminologia...).

Inoltre, nella traduzione automatica, la qualità dell'output è strettamente proporzionale alla qualità dell'input (il "Garbage in = Garbage-out" sarebbe la regola piuttosto che l'eccezione in questo campo, a giudicare dalla qualità delle memorie di traduzione in circolazione), e non c'è qualità dell'input senza la supervisione del traduttore.

E' la nozione di "clean data" propugnata da AsiaOnline:

Ma come si alimenta un motore di TA?

Ci vogliono due corpora distinti per ogni coppia linguistica (qui mi referisco soltanto alle lingue europee più comuni):
  1. un corpus bilingue che assomiglia ad una memoria di traduzione, e cioè una serie di frasi e/o segmenti corrispondenti in lingua sorgente e target;
  2. un corpus monolingue della lingua di specialità (target) in modo che il motore possa imparare dalla morfosintassi di quella lingua.
Secondo uno specialista dei motori di TA con chi ho discusso di questi temi, per ottenere i migliori risultati ci vogliono circa 5000 frasi per il "tuning" (cioè la messa a punto iniziale), circa 1-1,5 milioni di frasi/segmenti bilingue (300.000 come minimo ma con risultati sensibilmente inferiori) per il "training" (cioè "formare" il motore), e circa 500.000 frasi monolingue per il "tooling" (cioè il motore impara le "regole" della lingua), tre operazioni completate poi dal "testing" per misurare la "qualità" dei risultati (Bleu score, ad esempio).

Ho specificato "lingua di specialità" (o "tecnica" nel senso lato, se preferite), perché bisogna capire che il motore creato in questo modo s'inserisce poi nel motore generico della coppia linguistica di interesse. Quindi, concretamente, se intendo tradurre testi di informatica dall'inglese al francese, devo creare un motore "verticale" (circoscritto all'informatica, in questo caso), che si aggiunge poi al motore di base (la lingua generica) EN --> FR. Ovviamente, nuovi corpora vanno creati per ogni coppia linguistica e/o settore tecnico diverso.

Ma non finisce qui: le operazioni di pre- e post-editing sono altrettanto importanti per migliorare la qualità del motore.

Il pre-editing consiste nel "pulire" il testo bilingue, sia manualmente sia in modo automatizzato, ed è fondamentale per la qualità finale. Più il corpus di partenza è pulito, più sarà pulita la traduzione finale. Anche l'armonizzazione dei formati di documenti deve essere calcolata.

Altra pre-operazione da non sottovalutare è l'anonimizzazione del corpus (nel campo giuridico e contrattuale, ad esempio, ma non solo), per prevenire poi ogni problematica a livello legale, un aspetto spesso cruciale in traduzione, dove garantire l'assoluta confidenzialità dei dati fa parte dell'incarico.

Ma nell'ambito "corporate", il lavoro a monte si può anche estendere alla redazione dei documenti in vista della loro traduzione. E' la sfida del linguaggio controllato:
Per quanto riguarda il post-editing, invece, che consiste nel correggere/migliorare il testo tradotto in automatico, è un'operazione che serve all'auto-apprendimento del motore e va ripetuta finché non si è soddisfatti della TA in output. Ovviamente, più il motore apprende in questo modo, e più il post-editing guadagna in velocità.

In conclusione, ho tentato di spiegare un po' i meccanismi senza entrare troppo nei dettagli, cercando di dare un'idea delle quantità di frasi/segmenti necessari per ogni coppia linguistica/settore. Molte soluzioni online propongono già di creare "motori personalizzati" cominciando da 50.000 segmenti in su, ma creare un motore di TA serio e di livello professionale richiederà senz'altro un minimo di investimento e di pianificazione se si vuole ottenere risultati all'altezza delle proprie aspettative.

In ogni caso, la traduzione automatica potrà senz'altro rivelarsi un'ottima opportunità per tutte le aziende (comprese le società di traduzioni!) che sapranno rilevare la sfida con giudizio e criterio.

Idem per i traduttori, che dovrebbero cominciare a considerare la traduzione automatica per quello che è (o che sarà a breve...), e cioè uno strumento potente per aiutarli a produrre di più e meglio, e, di conseguenza, a guadagnare di più.

Infine, per i clienti, spero che saranno sempre più consapevoli che il giusto prezzo non va misurato con la minore offerta (per quanto pagata poco, una traduzione fatta male costerà sempre troppo!), ma con il rapporto adeguato tra investimento e ROI.

Consulenza su richiesta.