Parse selection with support vector machines
Promotie: dhr. F. Dellatorre Borges, 13.15 uur, Academiegebouw, Broerstraat 5, Groningen
Proefschrift: Parse selection with support vector machines
Promotor(s): prof.dr.ir. J. Nerbonne
Faculteit: Letteren
Contact: Francisco Dellatorre Borges, tel. 010-281 80 97 (werk), francisco.borges@gmail.com
MaxEnt geschikter voor parse selection dan SVM’s
Het doel van het promotieonderzoek van Francisco Dellatorre Borges was om SVM’s (Support Vector Machines) toe te passen op het probleem van parse selection. In het bijzonder onderzocht hij het gebruik van SVM’s bij de parse trees die Alpino genereert, om de prestaties te kunnen vergelijken met het huidige Alpino disambiguatieonderdeel, dat gebaseerd is op Maximum Entropy. Het bleek dat MaxEnt beter presteerde dan de gebruikte modellen.
De eerste vraag was of het probleem als een classificatieprobleem of als een regressieprobleem beschouwd moest worden. Volgens Dellatorre Borges is het eigenlijk een skewed regression-probleem. Hij heeft daarom voor SV Regressie gekozen. Dellatorre Borges is begonnen met het uitvoeren van kleine experimenten om de prestaties van verschillende SVR implementations en van verschillende kernels te evalueren. De MaxEnt resultaten waren beter dan de beste resultaten die met SVM verkregen waren (op dezelfde dataset). Daarna zijn SVR modellen gebouwd zonder de gebruikte hoeveelheid data te beperken. Dit legde meteen het grootste probleem bloot van het werken met SVM’s: de grote hoeveelheid computationele middelen, die nodig is voor het trainen en evalueren van de modellen. Dellatorre Borges heeft verschillende kleine modellen getraind en hun voorspellingen lineair gecombineerd. De eerste uitkomst was dat de prestatie van de voorspellingen van een enkel model inderdaad lager was dan die van de gecombineerde voorspellingen, wat laat zien dat het combineren van de resultaten van kleine modellen significante prestatievoordelen oplevert. De tweede was dat door toename van de modelgrootte, de prestaties ook significant omhoog gingen. Terwijl de prestatietoename in verhouding met de eerdere experimentele opzet veel hoger was voor SVM-modellen dan voor MaxEnt, presteerde MaxEnt nog steeds beter dan de gebruikte modellen.
Francisco Dellatorre Borges (Brazilië, 1977) studeerde natuurkunde aan de universiteit van Sao Paulo. Hij verrichtte zijn onderzoek bij de vakgroep alfa-informatica aan de Faculteit der Letteren van de Rijksuniversiteit Groningen. Dellatorre Borges werkt bij EMC.
Laatst gewijzigd: | 13 maart 2020 01:16 |
Meer nieuws
-
16 december 2024
Jouke de Vries: ‘De universiteit zal wendbaar moeten zijn’
Aan het einde van 2024 blikt collegevoorzitter Jouke de Vries terug op het afgelopen jaar. Daarbij gaat hij in op zijn persoonlijke hoogte- en dieptepunten en kijkt hij vooruit naar de toekomst van de universiteit in financieel moeilijke tijden.
-
10 juni 2024
Om een wolkenkrabber heen zwermen
In Makers van de RUG belichten we elke twee weken een onderzoeker die iets concreets heeft ontwikkeld: van zelfgemaakte meetapparatuur voor wetenschappelijk onderzoek tot kleine of grote producten die ons dagelijks leven kunnen veranderen. Zo...