Zephyrnet-logo

Bountyprogramma om LLM-bias te identificeren gelanceerd door DoD AI

Datum:

De eerste fase van het AI Bias Bounty-programma, een crowdsourcing-inspanning om vooroordelen in AI-systemen te vinden, is gelanceerd door het Chief Digital and Artificial Intelligence Office (CDAO) van het Amerikaanse ministerie van Defensie (DoD).

Het Chief Digital and Artificial Intelligence Office (CDAO) van het Amerikaanse ministerie van Defensie heeft een grote stap gezet in de richting van de eerste fase van het kunstmatige intelligentie (AI) Bias Bounty-programma. Het programma is een crowdsourced initiatief dat is ontworpen om vooroordelen in AI-systemen te identificeren, te beginnen met grote taalmodellen (LLM).

Het premieprogramma omvat twee oefeningen, waarvan de eerste nu open is voor het publiek en loopt van 29 januari tot 27 februari 2024. De eerste oefening is open voor het publiek en iedereen wordt geadviseerd om registreren. Er is geen uitgebreide codeerkennis nodig om te registreren, en geldelijke premies worden toegekend op basis van scores en evaluatie door ConductorAI-Bugcrowd. Meer details over de tweede oefening zijn echter nog niet onthuld.

De Bounty-oefening

Volgens het DoD is het doel van de eerste premieoefening het identificeren van onbekende risicogebieden in grote taalmodellen (LLM's), te beginnen met open-source chatbots. Dit werk kan dus de doordachte beperking en beheersing van dergelijke risico's ondersteunen.

Craig Martell, Chief Digital and Artificial Intelligence Officer, zei dat de uitkomst van deze premies een aanzienlijke impact zou kunnen hebben op het toekomstige DoD AI-beleid en de adoptie ervan. Hij verklaarde ook dat het CDAO dit gebied actief monitort, gezien de huidige focus van het departement op de risico's verbonden aan LLM's.

Het DoD kan de resultaten van deze premies bovendien overwegen voor verder onderzoek, analyse, best practices en beleidsaanbevelingen. Dit benadrukt de inzet van de afdeling om onbevooroordeelde AI-systemen te garanderen bij al haar activiteiten. De twee bias-premies worden geleid door de CDAO Responsible AI (RAI) Division. Ze ontwikkelden en voerden partnerschappen uit met COnductorAI-Bugcrowd en BiasBounty.AI en worden geadviseerd door het CDAO Digital Services Directorate.

AI-strategieën

Het DoD onthulde in november 2023 een strategie om de integratie van geavanceerde AI-mogelijkheden te bespoedigen. De focus lag op het veiligstellen van blijvende beslissingssuperioriteit voor Amerikaanse soldaten op het slagveld in de komende jaren.

De nieuwe strategie, opgesteld door het Chief Digital and AI Office, overtreft echter die van 2018 AI-strategie en de herziene datastrategie uit 2020. Deze fundamentele documenten hebben als gevolg daarvan de weg geëffend voor de strategie van de afdeling voor de inzet van door AI ondersteunde capaciteiten.

De oefeningen worden bovendien uitgevoerd om nieuwe benaderingen van algoritmische auditing en red-teaming-modellen voor kunstmatige intelligentie te ontwikkelen. Dit zal het experimenteren met het aanpakken van geïdentificeerde risico's vergemakkelijken en ervoor zorgen dat de systemen niet bevooroordeeld zijn, gezien hun specifieke implementatiecontext.

Het CDAO

De CDAO werd in juni 2022 opgericht om AI-mogelijkheden in het hele DoD te integreren en te optimaliseren. Dit kantoor is verantwoordelijk voor het versnellen van de adoptie van data, analyses en AI binnen de afdeling en voor de bescherming tegen huidige en opkomende bedreigingen.

Het is veelbetekenend dat het Ministerie van Defensie met deze eerste kunstmatige-intelligentie-bounty-oefening een voorbeeld stelt voor andere organisaties om prioriteit te geven aan onbevooroordeelde AI-systemen. Deze stap zorgt ervoor dat kunstmatige intelligentie ethisch wordt gebruikt ten behoeve van de samenleving, en niet alleen dat het eerlijkheid bevordert. De wereld als geheel wil anticiperen op de resultaten van deze oefening en hoe dit het toekomstige DoD-beleid met betrekking tot kunstmatige intelligentie zal vormgeven.

spot_img

Laatste intelligentie

spot_img