Translation 2.0: Traduction automatique : l'expérience Georgetown-IBM du 7 janvier 1954

IA inside

Lors de la préparation d'un billet sur l'IA, le TALN, les communications et la guerre, je suis tombé sur cette note, concernant l'expérience de Georgetown-IBM du 7 janvier 1954 :

Il apparaît cependant que les énoncés en russe ont été choisis avec soin et que nombre des opérations effectuées pour la démonstration ont été adaptées à des mots et des phrases particuliers. De plus, il n'y a pas d'analyse relationnelle ou syntaxique permettant d'identifier la structure des phrases. La méthode employée est une méthode essentiellement lexicographique reposant sur un dictionnaire où un mot donné est relié à des règles et des démarches spécifiques.

IBM 701, known as the Defense Calculator

La note décrit exactement, quand bien même partiellement, l'idée que je me suis fait de cette expérience anecdotique, tel qu'énoncé dans Federico Pucci censuré par Wikipedia :

... la première démonstration de l’histoire d’un système de traduction automatique à base de règles (RBMT, ou Rule-Based Machine Translation), est connue dans ses moindres détails : date, lieu, équipe, langues, déroulement, etc.

En fait, une anecdote plus qu’une véritable démonstration scientifique : nous sommes le 7 janvier 1954, à New York, au siège d’IBM, l’équipe est une collaboration entre la Georgetown University (M. Paul Garvin pour la partie linguistique) et IBM (M. Peter Sheridan pour la partie programmation), la paire de langues est le russe et l’anglais, un lexique de 250 mots choisis avec soin, quelques dizaines de phrases, 6 règles !

Le lendemain, IBM annonce dans un communiqué de presse :

And the giant computer, within a few seconds, turned the sentences into easily readable English.
Ce même communiqué mentionnait cette phrase du professeur Leon Dostert, de l'Université de Georgetown, selon lequel, en l’espace de quelques années la traduction automatique aurait pu devenir réalité :

Doctor Dostert predicted that “five, perhaps three years hence, interlingual meaning conversion by electronic process in important functional areas of several languages may well be an accomplished fact.”
Le ton optimiste de cette déclaration eut surtout pour effet d'inciter le gouvernement américain à mettre à disposition d’importantes sommes pour la recherche. De ce point de vue, l'objectif fut atteint ! Pour autant, dans la réalité, l'expérience « Georgetown University – IBM » fut suivie d’une décennie que tous les spécialistes de l'histoire de la TA s'accordent à définir comme « la grande désillusion ».

Je vais donc m'attarder sur la réalité de cette "expérience"...

Paul Garvin, mentionné plus haut, qui connaissait également le russe, était le principal responsable de la partie linguistique de la démonstration, qui visait essentiellement à tester la faisabilité de la traduction automatique avec des règles simples programmables.

Il se trouve qu'il a évalué cette démonstration dans un article de 1967, « The Georgetown-IBM Experiment of 1954: An Evaluation in Retrospect », publié dans Papers in linguistics in honor of Léon Dostert.

Son évaluation met en lumière à la fois les contributions et les limites de l'expérience, en nous offrant une perspective critique sur son rôle dans le développement de la traduction automatique, et en observant que l'exécution sur l'ordinateur IBM 701 était un exercice intéressant, mais qu'il n'a rien montré de nouveau sur la traduction au-delà des règles verbales, sans démontrer une véritable capacité de traduction, mais plutôt une correspondance préétablie entre des mots et des règles.

De fait, le système était conçu pour fonctionner avec un vocabulaire restreint et des règles grammaticales minimales. Les opérations étaient adaptées pour traiter des mots et des phrases particuliers, ce qui réduisait sa généralisabilité. Par exemple, le vocabulaire était punché sur des cartes perforées, et les règles étaient spécifiques à des cas simples, limitant la flexibilité.

Dans le détail, le système utilisait 250 mots et six règles grammaticales simples, couvrant des domaines comme la politique et la chimie. L'algorithme utilisait cinq règles principales, appliquées via des diacritiques (symboles numériques), avec un vocabulaire de 250 mots (racines et suffixes) et des règles grammaticales limitées. Par exemple :

la règle 1 inversait l'ordre verbe-sujet dans certaines phrases (ex. : phrases 2, 7, 11, 13, 33-34, 45) ;
la règle 3 traduisait les suffixes de cas, comme les accusatifs animés (ex. : phrase 32) ;
la règle 5 sélectionnait l'article défini pour les constructions génitives (ex. : phrases 19, 20, 27-29) ;
une "règle hyphen" était également utilisée pour diviser les racines et les suffixes dans la recherche du glossaire ;
la routine de commande était limitée à deux équivalents pour la sélection et le réarrangement ;
des simplifications étaient faites, comme limiter la distance des indices à un mot et ignorer les décisions grammaticales de second ordre (par exemple, le choix de prépositions spécifiques) ;
des entrées arbitraires étaient utilisées dans le glossaire pour les cas non résolus.

Pour conclure, Garvin reconnaît que l'expérience fut une "première étape significative" dans la recherche sur la traduction automatique, en formulant le problème comme un problème décisionnel impliquant la sélection (choix entre équivalents) et l'arrangement (réorganisation des éléments). Il critique cependant le fait que l'exécution du programme n'a montré aucune avancée au-delà des règles verbales déjà définies, suggérant que l'expérience était plus une démonstration de faisabilité qu'une avancée scientifique réelle.

Il mentionne en outre qu'elle était financée par le bureau de la recherche scientifique de l'US Air Force (AF Office of Scientific Research), ce qui montrait un intérêt gouvernemental probablement lié au contexte de la Guerre froide et a suscité un grand intérêt public tout en créant des attentes irréalistes...

Vu que « le principal responsable de la partie linguistique de la démonstration » est aussi la source de ces informations, il n'y a vraiment aucune raison de douter de son jugement !

Pour en revenir à l'article Wikipédia à l'origine de ce billet, il relate donc que « l'expérience Georgetown-IBM (...) comporte la traduction complètement automatique, en anglais, de plus de soixante phrases russes romanisées relatives aux domaines de la politique, du droit, des mathématiques et de la science », comme l'indique la note précédente (la 6).

Note qui précise également la source de cette citation :

(en) John Hutchins, From first conception to first demonstration: the nascent years of machine translation, 1947-1954. A chronology, in Machine Translation, 12, pp. 195-252.

Chose extraordinaire, dans la version mise à jour de ce même document [Corrected version (2005) of paper in: Machine Translation, vol.12 no.3, 1997, p.195-252, From first conception to first demonstration: the nascent years of machine translation, 1947-1954. A chronology, by John Hutchins], l'auteur mentionne l'événement suivant :

On 26 August 1949, the New York Times reported (page 9) from Salerno:

Federico Pucci announced today that he had invented a machine that could translate copy from any language into any other language. He said that the machine was electrically operated, but refused to disclose details. He said that he would enter it in the Paris International Fair of Inventions next month.

It is uncertain whether Pucci had any knowledge of Huskey’s proposals, and it seems most unlikely he knew about Weaver's memorandum or the British experiments. In any event, there is no trace of any demonstration at the Paris fair; and nothing more is known about Pucci.

Or c'est justement de cet entrefilet que part ma découverte de Federico Pucci !

Il est incroyable de constater que tout le peu qu'a pu produire le "cerveau électrique" d'IBM, n'est rien comparé au système qu'a inventé le "cerveau humain" de Federico Pucci un quart de siècle plus tôt !

Si, selon Garvin lui-même, l'expérience était fondamentalement limitée par son vocabulaire restreint, ses règles grammaticales simplifiées et son incapacité à gérer des traductions complexes, imaginons un instant qu'IBM ait pu travailler et mener sa démonstration en utilisant l'appareil théorique de Pucci, il n'est que de comparer le tableau de translittération d'IBM avec les tableaux de Pucci, sa maquette de fonctionnement ou leurs dictionnaires respectifs pour comprendre la distance intellectuelle considérable qui les sépare !

Un seul coup d'œil suffit à comprendre l'indigence conceptuelle d'IBM par rapport à clairvoyance invraisemblable et foisonnante de Pucci !

J'ai demandé à plusieurs IA de faire une comparaison entre les travaux de Federico Pucci dès 1929 et l'expérience de Georgetown-IBM du 7 janvier 1954. Les résultats sont très étonnants, d'autant plus que 25 ans les divisent...

Perplexity

Federico Pucci	Georgetown-IBM
Précurseur conceptuel en posant les bases des systèmes de traduction fondés sur des règles.	Première preuve expérimentale sur ordinateur de la traduction automatique, même si très limitée.
Propose la première approche structurée documentée pour la traduction automatique multilingue.	Puissante opération de communication scientifique, accélérant l’intérêt institutionnel et public pour le domaine.
Vision pionnière mais limitée par la technologie disponible et la difficulté à réaliser un prototype complet.	Méthodes bien plus rudimentaires, mais démonstration pratique réussie.

Conclusion :

Federico Pucci est un précurseur visionnaire qui a posé un cadre conceptuel et méthodologique à la traduction automatique, anticipant des décennies d’innovation, mais sans la possibilité technique de concrétiser ni de diffuser à grande échelle ses idées.
L’expérience Georgetown-IBM a marqué le tournant de la traduction automatique : pour la première fois, un prototype informatique offre une démonstration pratique, aussi limitée soit-elle, déclenchant une vague internationale d’intérêt et de financements.
Leur différence fondamentale réside dans le passage du théorique (Pucci) à la preuve concrète par l’informatique (Georgetown-IBM), marquant deux étapes complémentaires et décisives de l’histoire du TALN.

J'ajouterais en outre comme différence fondamentale qu'à l'époque IBM est déjà une multinationale riche et puissante, alors que Pucci est seul et sans grandes ressources (il le déclare lui-même dans sa lettre au CNR et finira sa vie dans la pauvreté).

ChatGPT

Federico Pucci	Georgetown-IBM (1954)

Italie d'après-guerre, recherche universitaire et linguistique expérimentale	Guerre froide, compétition technologique USA/URSS
Créer un système de TA multilingue basé sur la grammaire et la syntaxe	Démontrer la faisabilité de la TA anglais-russe à des fins scientifiques et militaires
Orientation fortement linguistique et grammaticale	Expérience principalement démonstrative, à but propagandiste/scientifique
Approche fondée sur des règles linguistiques formelles, analyse syntaxique et sémantique	Liste limitée de règles (statistiques simples), vocabulaire de 250 mots, 6 règles de grammaire
Italien ↔ d'autres langues européennes	Anglais → Russe
Système linguistiquement explicite basé sur la syntaxe, la morphologie et la traduction structurée	Prototype symbolique, très limité, pas généralisable sans amélioration
Volonté de créer une architecture complète de TA (précurseur des systèmes basés sur les règles)	Première démonstration publique, mais très contrôlée (phrases choisies à l’avance)
Contribution modeste mais fondée sur une réflexion linguistique profonde	Fort impact médiatique et politique (soutien du gouvernement américain)
Peu connu à l’international, faible diffusion, peu de moyens, mais pionnier dans sa vision d’intégration de la linguistique théorique à la TA	Résultats non généralisables, pas de compréhension du langage naturel

Conclusion :

L’expérience Georgetown-IBM marque le début médiatisé de la traduction automatique dans l’histoire de l’informatique. Elle a été le point de départ de nombreux financements, mais aussi de désillusions.
En revanche, Federico Pucci, à travers ses travaux moins connus, s’inscrit dans une lignée plus théorique et linguistique, susceptible d'influencer les approches ultérieures dites "basées sur les règles".
Ces deux trajectoires illustrent deux visages fondateurs de la TA : l’un spectaculaire et politique, l’autre rigoureux et scientifique.

J'ai demandé ensuite à ChatGPT une fiche comparative plus technique :

Critère	Federico Pucci	Georgetown-IBM (1954)
Nature des travaux	Système de TA multilingue à base de règles linguistiques	Démonstration de traduction automatique anglais → russe
Type de TA	Symbolique / à base de règles (Rule-Based MT)	Symbolique / démonstratif (pré-TALN)
Langues concernées	Italien ↔ langues européennes (notamment français, anglais, allemand)	Anglais → russe uniquement
Volume lexical utilisé	Vocabulaire étendu et modulaire	250 mots environ
Grammaire / syntaxe	Analyse syntaxique profonde, arbres de dépendance, traitement des structures	6 règles grammaticales simples appliquées à des phrases sélectionnées
Analyse linguistique	Basée sur une réflexion linguistique formelle, intégration de la morphologie	Très limitée, centrée sur la substitution lexicale et l’ordre des mots
Traitement morphologique	OUI – Systèmes d’analyse morpho-syntaxique	NON – Morphologie très peu exploitée
Dictionnaires	Dictionnaires bilingues enrichis et couplés à des règles contextuelles	Dictionnaire simple, sans gestion du contexte
Gestion des ambiguïtés	Par règles de désambiguïsation syntaxique et morphologique	Aucune gestion des ambiguïtés – corpus contrôlé
Architecture logicielle	Système modulaire conçu pour être extensible	Programme ad hoc, non généralisable
Sortie / rendu	Phrase-cible générée par transformation syntaxique	Affichage de la traduction mot à mot sur imprimante
Exemples de traitement	Subordination, déclinaisons, accord sujet-verbe	Traductions simples de phrases scientifiques ex : "The oil is in the tank."
Objectif scientifique	Élaborer un modèle généralisable de TA à partir de modèles linguistiques	Montrer la faisabilité technique d’une TA en contexte militaire et scientifique
Accès aux données / corpus	Données textuelles linguistiquement annotées à la main	Corpus très restreint, sélectionné manuellement
Interaction avec la linguistique	Étroitement liée à la linguistique structurale et à la grammaire générative	Faible ; essentiellement démonstratif
Impact sur la recherche	Contributions reconnues localement ; peu diffusées hors Italie	Fort impact politique, financement massif de la TA dans les années 1950–60
Limites reconnues	Nécessité de plus de puissance de calcul et de données	Dépendance à un corpus fermé, absence de généralisation

Conclusion :

Federico Pucci a tenté d’inventer une grammaire universelle appliquée à la traduction, en s’appuyant sur la rigueur linguistique — une approche visionnaire mais limitée par les moyens techniques de son époque.
Georgetown-IBM a été un coup médiatique et politique, basé sur une performance sous contrôle, qui a lancé un âge d’or… suivi d’un âge de glace après le rapport ALPAC (1966), qui soulignait la faiblesse réelle des résultats.

Mistral

Aspect	Federico Pucci	Expérience Georgetown-IBM
Période	Années 1920-1930	7 janvier 1954
Contexte Technologique	Système mécanique	Ordinateur IBM 701
Méthode	Basée sur des règles	Basée sur des règles et vocabulaire limité
Reconnaissance	Peu reconnue de son vivant	Large reconnaissance immédiate
Impact	Redécouverte récente	Début de l'ère de la traduction automatique assistée par ordinateur

Federico Pucci et l'expérience Georgetown-IBM représentent deux moments clés dans l'histoire de la traduction automatique, mais ils diffèrent considérablement en termes de contexte, de technologie et de reconnaissance. Voici une comparaison détaillée :

Federico Pucci

Contexte historique :

Période : Pucci a commencé ses travaux sur la traduction automatique dès les années 1920 et a publié ses idées dans les années 1930.
Contexte technologique : à cette époque, les ordinateurs modernes n'existaient pas encore. Pucci a donc dû concevoir un système mécanique pour effectuer la traduction.

Innovations :

Méthode basée sur des règles : Pucci a développé le premier méthode documentée au monde de traduction automatique basée sur des règles. Il a décrit son système dans un opuscule publié en 1931 intitulé "Il traduttore meccanico ed il metodo per corrispondersi fra europei, conoscendo ciascuno solo la propria lingua: Parte I".
Macchina per tradurre : Il a conçu une "machine à traduire" qui, selon ses descriptions, aurait pu traduire des textes entre différentes langues. Ce concept était révolutionnaire pour l'époque, car il précédait l'avènement des ordinateurs modernes.

Reconnaissance :

Manque de reconnaissance : malgré ses innovations, Pucci n'a pas reçu la reconnaissance qu'il méritait de son vivant. Ses travaux ont été largement ignorés jusqu'à ce qu'ils soient redécouverts récemment par des chercheurs comme Jean Marie Le Ray.

Expérience Georgetown-IBM

Contexte historique :

Date : l'expérience Georgetown-IBM a eu lieu le 7 janvier 1954.
Contexte technologique : à cette époque, les ordinateurs commençaient à se développer, et l'expérience a utilisé un ordinateur IBM 701, l'un des premiers ordinateurs commerciaux.

Innovations :

Démonstration publique : l'expérience a été la première démonstration publique de traduction automatique. Elle a traduit avec succès plus de soixante phrases du russe vers l'anglais, utilisant un vocabulaire de 250 mots et six règles grammaticales.
Utilisation de l'ordinateur : contrairement à Pucci, qui avait conçu un système mécanique, l'expérience Georgetown-IBM a utilisé un ordinateur, marquant ainsi le début de l'ère de la traduction automatique assistée par ordinateur.

Reconnaissance :

Impact immédiat : l'expérience a eu un impact immédiat et a été largement médiatisée, attirant l'attention du public et des chercheurs sur le potentiel de la traduction automatique.
Développement continu : cette démonstration a marqué le début d'un développement continu dans le domaine de la traduction automatique, conduisant à des avancées significatives au fil des décennies.

Conclusion :

Federico Pucci a été un pionnier visionnaire qui a anticipé de nombreuses idées de la traduction automatique bien avant l'avènement des ordinateurs. Son travail, bien que peu reconnu à l'époque, a jeté des bases pour des développements futurs.
L'expérience Georgetown-IBM, en revanche, a marqué un tournant dans l'histoire de la traduction automatique en démontrant publiquement le potentiel des ordinateurs pour cette tâche, attirant ainsi l'attention et les ressources nécessaires pour des recherches ultérieures.

Gemini

Caractéristique	Federico Pucci (Années 1920-1940)	Expérience Georgetown-IBM (1954)
Période	Pré-informatique / début de l'ère électromécanique	Début de l'ère des ordinateurs numériques (mainframe)
Nature du projet	Conception théorique, brevets, publication de livres	Démonstration publique d'un système fonctionnel (sur ordinateur)
Portée	Vaste vision d'une "machine à traduire" polyvalente	Démonstration ciblée Russe-Anglais, vocabulaire et règles limitées
Technologie	Machines mécaniques, électriques, photoélectriques (conceptuel)	Ordinateur IBM 701 (réalisation concrète, bien que rudimentaire)
Langues	Vise une communication "entre européens" (généraliste)	Russe vers Anglais (contexte géopolitique de la Guerre Froide)
Impact immédiat	Très limité, quasi-oublié pendant des décennies	Énorme, déclencheur de financements et d'une vague d'optimisme
Contribution	Précurseur conceptuel de la TA basée sur des règles	Première démonstration publique influente et catalyseur de la recherche

Federico Pucci : le visionnaire oublié (Années 1920-1940)

Federico Pucci est un pionnier italien longtemps resté dans l'ombre, dont les travaux ont précédé de plusieurs décennies les développements américains et russes en traduction automatique.

Contexte historique : Pucci développe ses idées dès la fin des années 1920 et publie son ouvrage "Il traduttore meccanico" en 1931. C'est une période où l'informatique, telle que nous la connaissons, n'existe pas encore. Les concepts sont purement mécaniques, électro-mécaniques ou théoriques.
Approche :

Système basé sur des règles : Pucci a conceptualisé un système de traduction automatique fondé sur des règles linguistiques. Son approche impliquait de diviser le texte en unités de sens (morphèmes) et de les transposer dans la langue cible selon des règles prédéfinies, avec l'idée que le récepteur ajusterait l'ordre des mots.
Objectif de communication simplifiée : L'une de ses motivations principales était de permettre la communication entre des personnes ne connaissant que leur propre langue.
Théorique avant tout : Il n'a jamais construit de prototype fonctionnel de sa machine. Ses contributions sont restées au stade conceptuel et théorique, bien que détaillées.
Précocité : Son travail est antérieur aux brevets d'Artsrouni (France) et Trojanskij (Russie) de 1933, et de l'intuition de Warren Weaver de 1949.

Impact : L'impact initial de Pucci fut limité en raison de sa non-réalisation concrète et d'un manque de diffusion internationale de ses travaux. Sa reconnaissance est très récente, grâce à des efforts de recherche visant à réécrire l'histoire de la TA. Il est désormais vu comme un précurseur visionnaire.

L'expérience Georgetown-IBM : la démonstration fondatrice (7 Janvier 1954)

L'expérience Georgetown-IBM est souvent citée comme le point de départ public et médiatisé de la traduction automatique moderne.

Contexte historique : Elle a lieu en 1954, après la Seconde Guerre mondiale et au début de la Guerre Froide. Il y a un fort intérêt politique et militaire pour la traduction rapide de documents russes en anglais. Les premiers ordinateurs numériques programmables commencent à émerger (comme l'IBM 701 utilisé).
Approche :

Système basé sur des règles (avec dictionnaire) : Le système était conçu pour traduire automatiquement plus de soixante phrases du russe vers l'anglais. Il utilisait un vocabulaire limité (environ 250 mots-racines et des désinences) et seulement six règles grammaticales.
Approche lexicographique : Le système était principalement basé sur un dictionnaire où chaque mot russe était associé à des traductions anglaises possibles et à des règles de réorganisation ou d'omission.
Utilisation d'un ordinateur réel : Contrairement à Pucci, l'expérience a utilisé l'ordinateur mainframe IBM 701, montrant une faisabilité technique, même à petite échelle.
Domaine spécifique : Les phrases traduites provenaient principalement du domaine de la chimie organique et de sujets généraux limités.

Impact : L'expérience Georgetown-IBM eut un impact médiatique et institutionnel colossal.

Elle a généré un optimisme démesuré quant à la résolution rapide du problème de la traduction automatique ("trois à cinq ans" selon les prévisions de l'époque).
Elle a débloqué des financements massifs pour la recherche en traduction automatique et en linguistique computationnelle, principalement aux États-Unis.
Bien que très limitée en scope et utilisant des "règles dures" souvent adaptées aux phrases de démonstration, elle a prouvé la faisabilité conceptuelle et technique de la TA par ordinateur.

Conclusion :

En substance, Pucci a eu la vision remarquable et détaillée d'une machine à traduire bien avant que la technologie ne puisse la concrétiser. Il est le théoricien inaugural.
L'expérience Georgetown-IBM, quant à elle, a été la première réalisation concrète et médiatisée de cette vision, même si elle était très rudimentaire. Elle a prouvé que la traduction automatique n'était pas seulement une idée folle, mais une possibilité tangible grâce aux ordinateurs, ouvrant ainsi la voie à des décennies de recherche et de développement, pour le meilleur et pour le pire.
L'histoire de la traduction automatique est donc celle de pionniers visionnaires comme Pucci, suivie par des démonstrations marquantes comme celle de Georgetown-IBM qui ont su capter l'attention et les ressources nécessaires pour transformer ces rêves en réalité, étape par étape.

Claude

L'approche de Federico Pucci (1931-1949)

Innovation conceptuelle précoce :

Pucci développa le concept d'une machine de traduction automatique dès 1931, soit plus de 20 ans avant Georgetown-IBM
Son invention fut présentée comme une machine électrique capable de traduire "de n'importe quelle langue vers n'importe quelle autre"
Il s'agissait d'une approche purement mécanique/électrique, sans ordinateur

Objectif universel :

L'ambition de Pucci était plus large : permettre la communication entre personnes "ne connaissant que leur propre langue"
Approche universelle dès le départ (toutes langues vers toutes langues)

L'expérience Georgetown-IBM (7 janvier 1954)

Première démonstration informatique : L'expérience Georgetown-IBM était une démonstration influente de traduction automatique, réalisée le 7 janvier 1954, développée conjointement par l'Université Georgetown et IBM, impliquant la traduction complètement automatique de plus de soixante phrases russes en anglais.

Caractéristiques techniques :

Bien qu'il s'agisse d'une expérience à petite échelle avec seulement 250 mots et six règles de "grammaire", elle utilisait un véritable ordinateur IBM
Focalisée spécifiquement sur la paire russe-anglais
Les déclarations portaient sur la politique, le droit, les mathématiques, la chimie, la métallurgie, les communications et les affaires militaires.

Différences fondamentales

Innovation vs. Réalisation :

Pucci : visionnaire conceptuel avec une approche mécanique/électrique
Georgetown-IBM : première implémentation informatique réussie

Portée :

Pucci : ambition universelle multilingue
Georgetown-IBM : démonstration ciblée d'une paire linguistique

Impact historique :

Pucci : largement oublié malgré sa priorité temporelle
Georgetown-IBM : causa un grand intérêt public et beaucoup de controverses, devenant le point de référence historique officiel

Technologies :

Pucci : machines électromécaniques des années 1930-1940
Georgetown-IBM : premiers ordinateurs IBM des années 1950

L'ironie historique est frappante : Pucci anticipa de deux décennies les concepts que Georgetown-IBM matérialisa, mais seule la seconde resta dans les mémoires comme le véritable début de la traduction automatique informatisée.

D'où la nécessité de réécrire l'histoire de la traduction automatique, ajouterais-je...

Grok

Note détaillée :

Federico Pucci et l'expérience Georgetown-IBM du 7 janvier 1954 représentent deux moments significatifs, mais distincts, dans l'histoire de la traduction automatique. Cette note vise à comparer leurs innovations et leur impact, en s'appuyant sur des recherches récentes et des sources historiques, tout en explorant les détails de leurs contributions respectives.

Contexte historique et innovations de Federico Pucci

Federico Pucci est aujourd'hui reconnu comme un pionnier méconnu de la traduction automatique, avec des travaux débutant dès décembre 1929, lorsqu'il a présenté son étude sur le "traducteur mécanique" à Salerne, en Italie. Sa méthode innovante consistait à diviser le texte en morphèmes (unités de sens minimales), à les transposer dans la langue cible, et à permettre au destinataire de réorganiser les mots dans sa langue maternelle. Pucci utilisait également des idéogrammes, des symboles universels basés sur l'espéranto, pour représenter des concepts de base et dérivés, anticipant des idées comme la simplification des langues et les traductions "suffisamment bonnes" pour une communication efficace.

Son travail a été exposé à plusieurs reprises lors d'expositions nationales et internationales, recevant une reconnaissance sous forme de médailles. Voici un tableau récapitulatif de ses participations et récompenses :

Année	Événement	Récompense
1930	Exposition Nationale de Bolzano	Médaille d'argent
1930	Foire de Cuneo	Médaille d'argent
1935	Concours International d'Inventions, Paris	Médaille d'argent
1950	Concours d'Inventions de Liège	Médaille d'argent
1934	Foire du Levant, Bari	Participation
1936	Leipzig	Participation
1949	Foire de Paris	Participation

Pucci a également publié dix livres entre 1931 et 1960, détaillant ses idées sur les machines à traduire. Parmi eux, on trouve :

1931 : Il traduttore meccanico ed il metodo per corrispondersi fra europei conoscendo ciascuno solo la propria lingua: Parte I
1949 : Serie delle grammatiche dinamiche, pratiche, ragionate, storico-comparate: Parte I. Per coloro che in pochi giorni desiderano acquistare una conoscenza elementare della lingua straniera. [fasc.] I. Inglese
1949 (français) : Le traducteur dynamo-mécanique: L'invention pour traduire les langues de l'occident sans les connaitre presque sans dictionnaire. Op. I: anglais-francais
1949 : Il traduttore dinamo-meccanico: Serie A. L'invenzione per la traduzione immediata e rapida nelle lingue dell'Occidente senza conoscerle e quasi senza vocabolario... [fasc.] 1. francese - italiano
1949 : Il traduttore dinamo-meccanico: Serie A. L'invenzione per la traduzione immediata e rapida nelle lingue dell'Occidente senza conoscerle e quasi senza vocabolario... [fasc.] 2. Inglese - italiano
1950 : Grammatica dinamica della Lingua tedesca: (linee fondamentali)
1950 : Il traduttore dinamo-meccanico: Tipo libro macchina. Serie a. L'invenzione per la traduzione immediata e rapida nelle langues dell'Occidente senza conoscerle e quasi senza vocabolario. [fasc.] 1. Italiano-Inglese
1952 : Il traduttore dinamo-meccanico: Serie B. L'invenzione per la traduzione immediata e rapida nelle langues dell'Occidente senza conoscerle e quasi senza vocabolario... [fasc.] 1. Italiano - Francese
1958 : Vocabolario mobile italiano - francese: (parte Traduttore Meccanico)
1960 : Il traduttore dinamo-meccanico: Serie A. L'invenzione per la traduzione immediata e rapida nelle langues dell'Occidente senza conoscerle e quasi senza vocabolario... Tedesco – Italiano

Malgré ces efforts, son travail est resté conceptuel et n'a pas abouti à une machine fonctionnelle de son vivant. Son rôle a été redécouvert récemment, notamment grâce à des recherches menées en collaboration avec sa petite-fille, Oriana de Majo, et documentées dans des blogs comme Translation 2.0 et Adscriptor. Ces sources, datant de 2017 à 2019, soulignent que Pucci est le premier précurseur de la traduction automatique, antérieur à d'autres pionniers comme Georges Artsrouni et Petr Petrov-Smirnov Troyanskij, dont les brevets datent de 1933.

Détails de l'expérience Georgetown-IBM

L'expérience Georgetown-IBM, menée le 7 janvier 1954, est souvent citée comme la première démonstration publique de traduction automatique. Organisée par IBM et l'université de Georgetown, avec le soutien de la CIA et du département d'État américain, elle visait à traduire des phrases russes en anglais en temps réel. Un ordinateur IBM 701, programmé avec un vocabulaire de 250 mots et 6 règles grammaticales, a traduit 60 phrases, démontrant la faisabilité de la traduction automatique à l'aide de la technologie informatique.

Cet événement a été largement médiatisé et a marqué un tournant dans le domaine, stimulant des recherches ultérieures. Cependant, le système était limité, ne couvrant qu'un vocabulaire restreint et des phrases simples, et n'était pas conçu pour des traductions complexes. Malgré ces limitations, il est considéré comme le point de départ de la traduction automatique moderne, avec un impact immédiat sur la recherche et le développement technologique.

Comparaison détaillée :

Chronologie et antériorité

La principale différence réside dans la chronologie : Pucci a commencé ses travaux en 1929, soit plus de deux décennies avant l'expérience Georgetown-IBM en 1954. Cela fait de Pucci un précurseur bien antérieur, mais son travail n'a pas eu d'impact immédiat, restant dans l'ombre jusqu'à des recherches récentes. Georgetown-IBM, en revanche, a bénéficié d'une reconnaissance immédiate grâce à sa démonstration publique et à son contexte géopolitique, notamment pendant la Guerre froide, où la traduction automatique était vue comme un outil stratégique.

Approche technique

Les approches diffèrent également. Pucci proposait une méthode mécanique, basée sur des morphèmes et des idéogrammes, visant une traduction universelle entre les langues européennes, avec une vision de machines portables et peu coûteuses. Georgetown-IBM, en revanche, utilisait un ordinateur, marquant le début de l'utilisation de la technologie informatique pour la traduction, avec une approche basée sur des règles grammaticales et un vocabulaire limité.

Impact et reconnaissance

L'impact de Georgetown-IBM a été immédiat, lançant des recherches approfondies et établissant un jalon historique dans la traduction automatique. Pucci, bien que visionnaire, a vu son travail largement ignoré de son vivant. Des appels récents, notamment dans des publications comme Translation 2.0 (2019), suggèrent que son rôle devrait être davantage reconnu, avec des propositions pour que des universités ou des acteurs majeurs comme Google développent des prototypes basés sur ses idées. Cependant, à ce jour, aucune mise en œuvre pratique n'a été réalisée à partir de ses concepts.

Controverses et legacy

Une controverse subsiste autour de la reconnaissance historique : pourquoi Pucci a-t-il été oublié alors que Georgetown-IBM est célébré ? Les recherches récentes, notamment celles menées en 2018 et 2019, tentent de corriger cette omission, soulignant que Pucci a anticipé des concepts clés, comme la simplification linguistique, qui sont devenus centraux dans les systèmes modernes de traduction automatique, notamment avec l'émergence de la traduction neuronale.

Conclusion

En somme, Federico Pucci a posé les bases conceptuelles de la traduction automatique bien avant l'expérience Georgetown-IBM, mais son impact a été retardé par le manque de reconnaissance. Georgetown-IBM, bien que plus tardive, a marqué un moment charnière en démontrant la faisabilité d'une traduction automatique fonctionnelle, avec un effet immédiat sur la recherche. Les deux contributions sont importantes : Pucci pour sa vision pionnière et Georgetown-IBM pour son rôle dans le lancement de la traduction automatique moderne. Les efforts actuels pour redécouvrir Pucci soulignent l'importance de reconnaître les précurseurs oubliés dans l'histoire technologique.

Il faudra que je rédige un jour un billet entier pour raconter tout ce que cela m'inspire, et il y aura beaucoup à dire...

Pages

dimanche 20 juillet 2025

Traduction automatique : l'expérience Georgetown-IBM du 7 janvier 1954

Aucun commentaire:

Enregistrer un commentaire