DeepL, cos’è e come rende le traduzioni professionali

DeepL
  1. Home
  2. Intelligenza Artificiale
  3. DeepL, cos’è e come rende le traduzioni professionali

Giganti tech come Microsoft, Facebook, Amazon, Alibaba, e Google investono risorse nel campo dei sistemi di traduzione automatica (machine translation – MT). In questo settore, però, trova spazio anche una startup come DeepL che propone un servizio MT professionale (in 31 lingue e principalmente rivolto alle aziende), lanciato nel 2017 e basato su reti neurali.

DeepL Translate, prodotto della startup tedesca DeepL – i cui dirigenti hanno deciso di tenere segreti i particolari della tecnologia AI che ne sta alla base, come spiega Jaroslaw “Jarek” Kutylowsk, fondatore e Ceo dell’azienda in una recente intervista – è un’espressione tra le più riuscite della crescente diffusione dei modelli Neural Machine Translation (NMT).

Indice degli argomenti:

DeepL: l’evoluzione delle traduzioni automatiche

La traduzione automatica, distinta da quella assistita o Computer-Aided Translation (CAT), in cui il traduttore umano ricorre a strumenti informatici che lo aiutano a svolgere il lavoro, ha ricevuto un notevole impulso grazie al connubio con la tecnologia AI.

WHITEPAPER

Gestione documentale e firma digitale: abilita un processo full digital sicuro
.a{fill:#0097b5;} Fatturazione elettronica
.a{fill:#0097b5;} Archiviazione

Limitati in un ambito ristretto e di ricerca, i sistemi MT hanno avuto sviluppo grazie all’avvento di Internet, posta elettronica e pagine web. È in questo nuovo quadro che hanno cominciato a comparire i primi servizi di traduzione automatica online. Noto il caso di Babel Fish, proposto dal motore di ricerca Altavista nel 1997 e basato sulla tecnologia Systran, realtà storica attiva nel campo MT sin dagli anni Sessanta, ancora oggi presente in rete con Systran Translate.

D’altra parte, i tool di traduzione automatica sono disponibili su app per dispositivi mobili come tablet e smartphone, la cui diffusione ha ulteriormente concorso a renderli più accessibili presso un più ampio numero di utenti.

Neural Machine Translation – NMT

I servizi MT online, inoltre, da un periodo iniziale caratterizzato da traduzioni di bassa qualità, si sono progressivamente evoluti, migliorando le prestazioni e abbracciando la più avanzata tecnologia AI. Allo stato attuale, siamo passati alla fase della traduzione neurale (Neural Machine Translation – NMT), vale a dire a sistemi di traduzione che integrano reti neurali artificiali.

L’approccio NMT – come sottolineano i ricercatori di Google nel documento elaborato per illustrare la nuova architettura di Google Translate, introdotta nel 2016 – rappresenta una innovazione per colmare il divario tra traduzione umana e automatica.

In questa ottica, viene superata l’architettura basata su un approccio dei sistemi statistici di traduzione automatica (SMT – Statistical machine translation), insieme alla traduzione rule-based (basata su regole), una tra le due tipologie MT precedentemente adottate e prevalenti.

I sistemi SMT lavorano su banche date testuali bilingui, collezioni di testi con rispettive traduzioni (corpora). Le corrispondenze del testo originale rispetto alla lingua in cui si traduce vengono identificati in base a una analisi probabilistica degli algoritmi.

Nel caso della traduzione rule-based, si analizzano le frasi del testo di partenza, si scompongono, si etichettano i singoli lemmi, si creano diagrammi ad albero che si trasforma nella lingua tradotta, attraverso la sostituzione delle parole con i loro equivalenti.

I sistemi NMT, che possono funzionare anche in combinazione con modelli SMT, superano questo approccio considerando l’intera frase di input come una unità per la traduzione. Si tratta di applicazione di reti neurali artificiali (nello specifico di Google Translate reti neurali ricorrenti LSTM) e deep learning al NLP con reti encoding e decoding, accompagnati da un meccanismo di attention per correggere la perdita di performance in caso di testi lunghi.

Come DeepL sfrutta il machine learning per migliorare le traduzioni

Lo sviluppo di DeepL si è giovato di continui investimenti per migliorare il sistema di traduzione automatica che si fonda sull’impiego di reti neurali profonde. Via via che l’azienda cresce aumenta di pari passo l’impegno finanziario sulla ricerca per far progredire il sistema SMT.

L’innovazione di DeepL è stata implementata in quattro distinte aree: architettura, dati di training, metodologia di training e dimensioni della rete.

Il translator di DeepL comprende l’architettura delle reti neurali Transformer inclusi meccanismi di attenzione. Tuttavia, sono state apportate modifiche che migliorano la qualità della traduzione.

Per ciò che concerne il training data, DeepL ha sviluppato speciali web crawler che mirano ad acquisire dati che aiutano le reti a raggiungere risultati superiori rispetto alla concorrenza.

Quanto alla metodologia di training, si utilizza l’apprendimento supervisionato (algoritmi di machine learning ML), unitamente ad altre tecniche ML per l’addestramento delle reti neurali.

Grazie, infine, a una ricerca mirata all’efficienza del training con miliardi parametri DeepL riesce a ottenere una qualità di traduzione anche con le reti più piccole e veloci. Garantendo, pertanto, ottime performance anche per il servizio offerto online gratuitamente.

I test di valutazione condotti da Intento (State of Machine Translation) nonché da ricercatori dell’Università di Strasburgo, organizzazioni come Globalization and Localization Association (GALA), e piattaforme come Text United, secondo uno studio di Rutgers University, confermano giudizi molto positivi sulla qualità delle traduzioni di DeepL Translate.

DeepL Pro: i vantaggi della versione a pagamento per utenti professionali

Oltre a quella gratuita, DeepL Translator – la cui startup fondatrice ha raggiunto lo status di unicorno superando il valore di 1 miliardo di dollari – ha una versione Pro a pagamento. È disponibile in diverse versioni ed è rivolto a utenti privati e ad aziende. La versione Pro consente di ovviare i limiti di traduzione di quella gratis, ottenendo una traduzione illimitata di testi e aumentando il numero di documenti traducibili in vari formati, potendo conservare la formattazione originaria.

Attualmente, la versione Pro supporta 31 lingue con circa 800 possibili combinazioni. Ha anche opzioni di personalizzazione avanzate e sicurezza e privacy garantite e rafforzate.

DeepL: l’integrazione con strumenti e piattaforme

Il servizio DeepL, oltreché avere applicazioni desktop integrabili a sistemi Windows e MacOS, è disponibile anche per le piattaforme iOS e Android.

D’altra parte, è possibile usufruire di estensioni per vari browser come Edge, Firefox e Chrome. Inoltre, la startup tedesca include nelle sue offerte un’API parte del servizio DeepL Pro. In questo caso, siamo di fronte a una interfaccia che permette ai programmatori di integrare la traduzione automatica in differenti prodotti e strumenti. Le aziende possono sfruttare l’API per la traduzione di siti web e piattaforme eCommerce (localizzandole) o integrare il traduttore DeepL nei sistemi di comunicazione interna (Confluence, SharePoint o Zendesk).

In più, è possibile, in questo modo, tradurre le conversazioni di chat in tempo reale o integrare la traduzione DeepL nei software CAT.

L’API DeepL può essere utilizzata nelle app per auricolari che consentono una traduzione automatica e simultanea. Oppure nel settore della realtà aumentata per tradurre cartelli nelle lingue ricomprese dopo aver puntato la fotocamera del cellulare sull’obiettivo. Ma, integrata nei sistemi, permette anche la traduzione automatica nei software di posta elettronica.

Il mercato delle traduzioni automatiche

Quello delle traduzioni automatiche supportate da tecnologia AI è un mercato in via di espansione con un volume di affari per ora limitato ma che Research Nester prevede possa crescere fino a raggiungere su scala internazionale quota 5 miliardi di dollari da qui al 2035. A trainare questo settore, c’è lo sviluppo delle piattaforme eCommerce che consentono lo shopping online a utenti di vari paesi e la domanda collegata alla necessità di comunicazione multilingue in un mondo sempre più interconnesso e in una economia a dimensione globale.

Anche app e social network come Instagram o Facebook, che gestisce ogni giorno miliardi di traduzioni di post, utilizzano sistemi MT. D’altra parte, a farne uso sono sia aziende che istituzioni. L’Unione europea, ad esempio, mette a disposizione il sistema eTranslation per la traduzione automatica di testi e documenti.

Conclusioni

La funzione di traduzione puntuale e multilingue diventa sempre più cruciale per aziende e organizzazione che svolgono la loro attività in diversi mercati e paesi. Per questa ragione, i sistemi di traduzione automatica hanno fatto presa e con l’avvento della tecnologia AI si è sviluppato l’approccio NMT (Neural Machine Translation). In questo quadro, accanto e in concorrenza con i sistemi proposti dai big tech, ha guadagnato spazio una start-up come DeepL. La sfida è consentire traduzioni più avanzate e real-time che riescano a cogliere contesto e sfumature della lingua, puntando a migliorare continuamente la ricerca nelle reti neurali applicate alla realtà MT.

WHITEPAPER

Supply chain planning: una guida ai trend delle migliori soluzioni del 2023 secondo Gartner
.a{fill:#0097b5;} Eprocurement
.a{fill:#0097b5;} Esourcing