Promotie dhr. D.J.A. de Kok: Reversible stochastic attribute-value grammars
Wanneer: | do 11-04-2013 om 16:15 |
Promotie: dhr. D.J.A. de Kok, 16.15 uur, Academiegebouw, Broerstraat 5, Groningen
Proefschrift: Reversible stochastic attribute-value grammars
Promotor(s): prof.dr. G.J.M. van Noord, prof.dr. ir. J. Nerbonne
Faculteit: Letteren
Computers kunnen met slechts één component zinnen ontleden en produceren
Computers kunnen met slechts één component zinnen ontleden en produceren. Dat is de voornaamste conclusie van het proefschrift van Daniël de Kok. Tot dusver werden er gescheiden componenten gebruikt voor het ontleden en produceren van zinnen. De vloeiendheid van een zin en de waarschijnlijkheid van een ontleding kunnen bepaald worden met een klein aantal taalkundig-gemotiveerde eigenschappen.
Een bekende vraag in de taalkunde is de vraag of de mens twee onafhankelijke modules heeft voor taalbegrip en taalproductie. In de computertaalkunde zijn taalbegrip (ontleding) en taalproductie (generatie) in de recente geschiedenis eigenlijk altijd als twee afzonderlijke taken en dus modules behandeld. De hoofdstelling van De Koks proefschrift is dat ontleding en generatie op een computer door één component uitgevoerd kan worden, zonder slechter te presteren dan afzonderlijke componenten voor ontleding en generatie. De onderliggende redenering is dat veel voorkeuren gedeeld moeten zijn tussen productie en begrip, omdat het anders niet mogelijk zou zijn om een geproduceerde zin te begrijpen.
Om deze stelling te onderbouwen is er eerst een generator voor het Nederlands ontwikkeld. Deze generator is vervolgens geïntegreerd met een bestaande ontleder voor het Nederlands. De Kok laat zien dat er inderdaad geen significant verschil is tussen de prestaties van de geïntegreerde module en afzonderlijke begrips- en productiecomponenten. Om een beter begrip te krijgen hoe het gecombineerde model werkt, wordt er zogenaamde `feature selectie’ toegepast. Dit is een techniek om de belangrijkste eigenschappen die een begrijpelijke en vloeiende zin karakteriseren op te sporen. Het proefschrift toont aan dat dit met een klein aantal, voornamelijk taalkundig geïnformeerde eigenschappen bepaald kan worden.
Daniël de Kok (Groningen, 1982) studeerde Informatiekunde aan de Rijksuniversiteit Groningen. Hij verrichtte zijn onderzoek aan het Center for Language and Cognition Groningen, Faculteit der Letteren. De Kok werkt nu als ontwikkelaar taaltechologie bij Gridline in Amsterdam.