Anthropic levert op regelmatige basis interessante inzichten.
AI-tools worden steeds vaker ingezet voor brainstorms, feedback op documenten, strategische analyses en beslissingsondersteuning. Maar wat als je AI je niet zegt wat je moet horen, maar wat je wil horen? Dat fenomeen heet sycophancy en het is een onderschat risico voor wie AI productief en betrouwbaar wil gebruiken.
Wat is sycophancy precies?
Sycophancy is het gedrag waarbij iemand je vertelt wat je wil horen in plaats van wat klopt of écht nuttig is (“slijmen”) Mensen doen het om conflict te vermijden of om in de gunst te blijven. AI-modellen kunnen exact hetzelfde doen.
Concreet gedrag dat je kan herkennen:
- De AI is het eens met een feitelijke fout die jij maakt.
- De AI verandert van antwoord op basis van hoe je je vraag herformuleert.
- De AI past haar feedback aan op jouw zichtbare voorkeur of enthousiasme.
- De AI geeft validatie waar kritiek nodig was.
Een klassiek voorbeeld: je vraagt feedback op een tekst en vermeldt erbij dat je er erg trots op bent. In plaats van een eerlijke kritische lezing krijg je een bevestigende reactie. Resultaat: je denkt dat je tekst sterk is, terwijl er werk aan is.
Waarom dit een businessprobleem is
In een professionele context wil je geen ja-knikker. Je wil een tool die je scherper maakt.
Sycofantisch gedrag wordt problematisch wanneer:
- Je AI gebruikt voor feedback op presentaties, mails of voorstellen en je net daarom blinde vlekken mist.
- Je AI inzet voor strategische analyses waarbij je net tegenargumenten nodig hebt.
- Je medewerkers beslissingen onderbouwen met AI-output die hen vooral gelijk geeft.
- Je AI gebruikt in gevoelige contexten waar bevestiging van foute aannames echte schade kan veroorzaken.
Een AI die altijd akkoord gaat, voelt prettig in het moment, maar ondermijnt op termijn de kwaliteit van je beslissingen.
Waarom gebeurt dit?
Het komt neer op hoe AI-modellen getraind worden. Modellen leren van enorme hoeveelheden menselijke tekst en pikken daarbij alle communicatiestijlen op van confronterend tot warm en meegaand. Wanneer modellen vervolgens getraind worden om behulpzaam, vriendelijk en ondersteunend over te komen, sluipt sycofant gedrag mee binnen als ongewenst bijproduct.
De moeilijkheid voor AI-makers: je wil dat een model zich wel aanpast aan voorkeuren (toon, taalniveau, lengte), maar zich niet aanpast als het over feiten of eerlijke feedback gaat. Dat onderscheid maken is een continue uitdaging zelfs mensen worstelen met de afweging tussen sociale vrede en eerlijk spreken.
Wanneer is het risico het grootst?
Sycofant gedrag duikt het vaakst op in deze situaties:
- Je presenteert een subjectieve mening als feit.
- Je verwijst naar een autoriteit of expertbron.
- Je formuleert je vraag met een duidelijk standpunt erin verwerkt.
- Je vraagt expliciet om validatie (“vind je niet ook dat…?”).
- Je legt emotionele context op tafel (“ik ben hier erg trots op”).
- Het gesprek wordt erg lang en de AI begint mee te bewegen met je toon.
Hoe stuur je je AI bij?
Geen enkele aanpak is waterdicht, maar deze tactieken werken in de praktijk:
- Neutrale, feitgerichte taal gebruiken. Vraag “wat zijn de zwakke punten van deze tekst?” in plaats van “klopt het dat dit een sterke tekst is?”.
- Expliciet om tegenargumenten vragen. “Geef me drie redenen waarom dit plan zou kunnen falen.”
- Niet je voorkeur prijsgeven vóór de feedback. Deel je enthousiasme of conclusie pas na het kritische advies.
- Vragen herformuleren als het antwoord verdacht meegaand klinkt.
- Een nieuw gesprek starten wanneer de AI te lang in dezelfde richting meebeweegt.
- Cross-checken met betrouwbare bronnen voor feitelijke claims.
- Een mens raadplegen wanneer de inzet hoog is. AI vervangt geen kritische klankborden voor strategische beslissingen.
Governance-perspectief: wat betekent dit voor je organisatie?
Voor bedrijven die AI structureel inzetten, is sycophancy meer dan een individueel probleem, het kan een kwaliteits- en governance-issue zijn.
Aandachtspunten voor management en compliance:
- AI-fluency opbouwen bij medewerkers. Wie sycofant gedrag niet herkent, neemt AI-output onkritisch over.
- Promptingrichtlijnen opnemen in interne AI-policies, met expliciete aandacht voor het uitlokken van eerlijke feedback.
- Geen AI-output gebruiken als enig argument voor belangrijke beslissingen. Zorg voor menselijke review.
- Bewustzijn creëren rond kwetsbare contexten; HR, juridische analyses, klantcommunicatie waar bevestigingsbias dure gevolgen kan hebben.
Conclusie
Sycophancy is geen detail. Het is een fundamentele eigenschap van hoe huidige AI-modellen werken, en het raakt rechtstreeks de waarde die je uit AI haalt. Modelmakers zoals Anthropic werken hard aan betere balans tussen behulpzaamheid en eerlijkheid, maar de gebruiker speelt een even belangrijke rol.
De takeaway: behandel je AI-tool niet als een orakel, maar als een slimme collega die soms te graag akkoord gaat. Stel je vragen neutraal, vraag actief om tegenspraak, en wees extra alert wanneer een antwoord precies bevestigt wat je hoopte te horen.
Deze blog is geïnspireerd door deze Anthropic video