Zephyrnet-logotyp

DALL·E 3 är nu tillgänglig i ChatGPT Plus och Enterprise

Datum:

Vi använder ett säkerhetssystem i flera nivåer för att begränsa DALL·E 3:s förmåga att generera potentiellt skadliga bilder, inklusive våldsamt, vuxet eller hatiskt innehåll. Säkerhetskontroller kör över användarmeddelanden och de resulterande bilderna innan de visas för användarna. Vi arbetade också med tidiga användare och experter på röda team för att identifiera och åtgärda luckor i täckningen för våra säkerhetssystem som uppstod med nya modellfunktioner. Till exempel hjälpte feedbacken oss att identifiera kantfall för generering av grafiskt innehåll, såsom sexuella bilder, och stresstesta modellens förmåga att generera övertygande vilseledande bilder. 

Som en del av arbetet som gjorts för att förbereda DALL·E 3 för distribution, har vi också vidtagit åtgärder för att begränsa modellens sannolikhet att generera innehåll i stil med levande konstnärer, bilder av offentliga personer och för att förbättra demografisk representation över genererade bilder. För att läsa mer om arbetet som gjorts för att förbereda DALL·E 3 för bred utbyggnad, se DALL·E 3 systemkort.

Användarfeedback hjälper till att se till att vi fortsätter att förbättras. ChatGPT-användare kan dela feedback med vårt forskarteam genom att använda flaggikonen för att informera oss om osäkra utdata eller utdata som inte korrekt återspeglar uppmaningen du gav till ChatGPT. Att lyssna på en mångsidig och bred gemenskap av användare och ha en verklig förståelse är avgörande för att utveckla och distribuera AI på ett ansvarsfullt sätt och är kärnan i vårt uppdrag.

Vi undersöker och utvärderar en första version av en härkomstklassificerare – ett nytt internt verktyg som kan hjälpa oss att identifiera huruvida en bild har genererats av DALL·E 3 eller inte. I tidiga interna utvärderingar är den över 99 % korrekt när det gäller att identifiera om en bild genererades av DALL·E när bilden inte har modifierats. Den förblir över 95 % korrekt när bilden har blivit föremål för vanliga typer av ändringar, såsom beskärning, storleksändring, JPEG-komprimering, eller när text eller utklipp från riktiga bilder överlagras på små delar av den genererade bilden. Trots dessa starka resultat på interna tester kan klassificeraren bara berätta för oss att en bild troligen genererades av DALL·E, och ännu inte gör det möjligt för oss att dra definitiva slutsatser. Denna härkomstklassificerare kan bli en del av en rad tekniker för att hjälpa människor att förstå om ljud- eller bildinnehåll är AI-genererat. Det är en utmaning som kommer att kräva samarbete över hela AI-värdekedjan, inklusive med plattformarna som distribuerar innehåll till användare. Vi förväntar oss att lära oss mycket om hur det här verktyget fungerar och var det kan vara mest användbart, och att förbättra vårt tillvägagångssätt med tiden.

plats_img

Senaste intelligens

plats_img