Kunstmatige Intelligentie leert beter dankzij afleiding
Hoe train je een kunstmatig intelligent systeem? Die vraag is belangrijk, want veel systemen gebaseerd op ‘deep learning’ zijn nog zwarte dozen. Computerwetenschappers uit Nederland en Spanje hebben nu vastgesteld hoe een systeem dat geschikt is voor beeldherkenning de omgeving leert herkennen. Daarmee wisten ze het leerproces te vereenvoudigen door het systeem te dwingen zich ook te richten op minder belangrijke informatie.
Het gaat om Convolutional Neural Networks (CCNs), een op de biologie geïnspireerde vorm van deep learning binnen de Kunstmatige Intelligentie. Dit systeem leert beelden herkennen dankzij de interactie van duizenden ‘neuronen’ die de werking van onze hersenen nabootsen. ‘Deze CNNs zijn erg nuttig, maar we begrijpen niet goed hoe ze werken’, zegt Estefania Talavera Martinez, docent-onderzoeker aan het Bernoulli Instituut voor Wiskunde, Computerwetenschap en Kunstmatige Intelligent van de RUG.
Voedsel
Zij gebruikt zelf CNNs in onderzoek naar menselijk gedrag, om beelden te analyseren die gemaakt zijn met een draagbare camera. Talavera Martinez bestudeert onder meer onze interactie met voedsel, dus wilde ze dat het systeem verschillende situaties kan herkennen waarin mensen voedsel tegen komen. ‘Het viel mij daarbij op dat het systeem fouten maakte bij het goed identificeren van de omgeving op bepaalde foto’s, en ik wilde weten waarom dat gebeurde.’
Aan de hand van ‘heat maps’ analyseerde zij welke delen van de beelden door de CNNs gebruikt zijn om de situatie te herkennen. ‘Dat leidde tot de hypothese dat het systeem niet voldoende details uit het beeld gebruikte’, legt zij uit. Wanneer een KI systeem bijvoorbeeld geleerd heeft om een mok te associëren met de keuken, zal het een woonkamer of kantoor, waar mokken ook worden gebruikt, verkeerd classificeren. De oplossing die Talavera Martinez hiervoor bedacht, samen met haar Spaanse collega’s David Morales (Andalusian Research Institute in Data Science and Computational Intelligence, Universiteit van Granada) en Beatriz Remeseiro (Department of Computer Science, Universiteit van Oviedo), was om het systeem af te leiden van de primaire doelen.
Vervaagd
Zij trainden CNNs met standaardbeelden van vliegtuigen of auto’s en achterhaalden via heat maps welke delen waren gebruikt voor de classificatie. Vervolgens zijn deze delen van het beeld vervaagd, waarna een tweede trainingsronde volgde. ‘Dit dwingt het systeem om andere delen van het beeld te gebruiken voor identificatie. En door deze extra informatie mee te nemen, ontstaat een betere classificatie.’
De aanpak werkte prima met standaard foto’s, en is vervolgens ook met succes toegepast op de beelden die Talavera Martinez had verzameld met de draagbare camera’s. ‘Onze manier van trainen levert een vergelijkbaar resultaat op met andere technieken, maar is veel eenvoudiger en kost minder rekentijd.’ Eerdere pogingen om de classificatie van beelden te verbeteren gebruikten bijvoorbeeld een combinatie van verschillende soorten CNNs. De aanpak die Talavera Martinez en haar collega’s gebruikten is minder zwaar. ‘Dit onderzoek gaf ons een beter idee van hoe deze CNNs leren. En dat heeft ons geholpen het trainingsprogramma te verbeteren.’
Referentie: David Morales, Estefania Talavera and Beatriz Remeseiro: Playing to distraction: towards a robust training of CNN classifiers through visual explanation techniques. Neural Computing and Applications, online 9 juli 2021.
Laatst gewijzigd: | 26 augustus 2021 11:10 |
Meer nieuws
-
10 juni 2024
Om een wolkenkrabber heen zwermen
In Makers van de RUG belichten we elke twee weken een onderzoeker die iets concreets heeft ontwikkeld: van zelfgemaakte meetapparatuur voor wetenschappelijk onderzoek tot kleine of grote producten die ons dagelijks leven kunnen veranderen. Zo...
-
21 mei 2024
Uitslag universitaire verkiezingen 2024
De stemmen zijn geteld en de uitslag van de universitaire verkiezingen is binnen!