datacarriere.com

Waarom GPT niet kan denken zoals wij

Nieuws
21-02-2025
Martha Lewis
Kunstmatige intelligentie (AI) wordt steeds beter in het oplossen van complexe problemen, maar hoe goed begrijpt een AI-model eigenlijk de logica achter zijn antwoorden? Nieuw onderzoek testte de ‘analogievaardigheden’ van GPT-modellen—oftewel hun vermogen om patronen en verbanden te herkennen en toe te passen op nieuwe situaties.

GPT-modellen schieten tekort als de problemen worden aangepast, wat belangrijke zwakheden in hun redeneercapaciteiten blootlegt.

Analogisch redeneren is het vermogen om een ​​vergelijking te trekken tussen twee verschillende dingen op basis van hun overeenkomsten in bepaalde aspecten. Het is een van de meest voorkomende methoden waarmee mensen proberen de wereld te begrijpen en beslissingen te nemen. Een voorbeeld van analoog redeneren: een kopje is tot koffie wat soep is tot ??? (het antwoord is: kom).

Kunnen AI-modellen echt redeneren?

Grote taalmodellen zoals GPT-4 presteren goed op allerlei tests, waaronder die waarbij analoog redeneren belangrijk is. Maar kunnen deze AI-modellen écht redeneren, of herkennen ze simpelweg patronen uit hun trainingsdata? Zijn ze net zo flexibel en robuust als mensen bij het maken van analogieën?

[....]

Lees verder op: uva.nl

Gerelateerde vacatures

Geïnteresseerd in een carrière bij organisaties in ditzelfde vakgebied? Bekijk hieronder de gerelateerde vacatures en vind de perfecte match voor jou!
NN
8.446 - 11.262
Senior
Den Haag
Als Engineering Manager Customer Contact Experience bij Nationale-Nederlanden (NN) leid je 30+ engineers over meerdere teams voor klantcontact- en omnichannel platformen (Salesforce/Genesys), borg je kwaliteit/security/compliance, en stuur je cloud-native AWS/TypeScript...
Assets Only
Marktconform
Junior, Medior
Amsterdam
Als Senior Data Governance Consultant bij Assets Only richt je data governance in en verbeter je structuren rond datakwaliteit, eigenaarschap, lineage en controls, en vertaal je Risk/Compliance/ESG-eisen naar werkbare processen...
ABN AMRO
5.847 - 8.353
Medior, Senior
Amsterdam
As a AI Techlead at ABN AMRO, you set the technical direction for GenAI products (Voice AI, RAG, agentic workflows), drive delivery from discovery to production, stay hands-on in code,...
Achmea
4.664 - 6.578
Medior
Apeldoorn
Als DevOps Engineer - Analyse Platform Azure bij Achmea optimaliseer en schaal je het Azure-analyseplatform end-to-end, migreer je naar Fabric, borg je security/monitoring/compliance, los je complexe incidenten op (RCA) en...