Drie miljoen innovatiesubsidie voor Tilburgs onderzoeksproject

Tilburg center for Cognition and Communication (TiCC) heeft samen met andere partners een grote Europese subsidie (ERC) van 3 miljoen euro binnengehaald voor een ICT-project, waarin systemen worden ontwikkeld die patronen herkennen om automatisch vertalen van teksten te verbeteren.

Doel van het project, dat de titel TraMOOC draagt, is om kwalitatief hoogstaande, automatische vertaalsystemen te ontwikkelen voor het vertalen van de diverse soorten tekst (zoals blogs, presentaties, ondertiteling van colleges, etc.) van het Engels naar het Duits, Italiaans, Portugees, Nederlands, Bulgaars, Grieks, Pools, Tsjechisch, Kroatisch, Russisch, en Chinees.

De subsidie is toegekend in het kader van de Europese wetenschap subsidiepot Horizon2020 , waarmee de Europese Commissie Europees onderzoek en innovatie wil stimuleren. Onderzoeker Menno van Zaanen van de School of Humanities van Tilburg University: ‘Het aantal online cursussen – Massive Open Online Courses – groeit snel, maar ze zijn over het algemeen slechts beschikbaar in één taal. Hoewel automatisch vertalen van teksten mogelijk is, is de kwaliteit van dat soort vertalingen niet altijd voldoende. En als je bijvoorbeeld naar het Italiaans probeert te vertalen, is de kwaliteit veel lager.’

Crowdsourcing

Door patronen te herkennen over onder meer de volgorde van woorden en die te verbinden met gegevens van crowdsourcing, kunnen veel voorbeeldteksten worden gemaakt die omgezet worden naar een andere taal. Google Translate gebruikt vergelijkbare technieken, maar in dit project wordt gebruik gemaakt van de gespecialiseerde onderwerpen van de cursussen, waardoor een hogere kwaliteit van de vertaalde teksten gehaald zal kunnen worden.

Onderzoekers zullen de subsidie gebruiken om machinaal vertaalsystemen op te zetten.