Zephyrnet-logo

Google open source bestandsidentificerend Magika AI-model

Datum:

Google heeft Magika, een interne door machine learning aangedreven bestandsidentificator, open source beschikbaar gesteld als onderdeel van zijn AI Cyber ​​Defense Initiative, dat tot doel heeft IT-netwerkverdedigers en anderen betere geautomatiseerde tools te bieden.

Het achterhalen van de ware inhoud van een door een gebruiker ingediend bestand is misschien moeilijker dan het lijkt. Het is niet veilig om het bestandstype aan te nemen op basis van bijvoorbeeld de extensie, en te vertrouwen op heuristieken en door mensen gemaakte regels – zoals die in de veelgebruikte libmagic – het identificeren van de werkelijke aard van een document aan de hand van de gegevens ervan is volgens Google “tijdrovend en foutgevoelig”.

Kortom, als iemand een .JPG naar uw online service uploadt, wilt u er zeker van zijn dat het een JPEG-afbeelding is en niet een of ander script dat zich als zodanig voordoet, wat u later in uw reet zou kunnen bijten. Dan komt Magika aan de orde, dat een getraind model gebruikt om snel bestandstypen uit bestandsgegevens te identificeren, en het is een aanpak die volgens Big G goed genoeg werkt om in de productie te gebruiken. Magika wordt, zo wordt ons verteld, gebruikt door Gmail, Google Drive, Chrome's Safe Browsing en VirusTotal om gegevens correct te identificeren en door te sturen voor verdere verwerking.

Uw kilometerstand kan variëren. Libmagic zou bijvoorbeeld goed genoeg voor u kunnen werken. Magika is in ieder geval een voorbeeld van Google dat intern kunstmatige intelligentie gebruikt om de beveiliging te versterken, en hoopt dat anderen ook van die technologie kunnen profiteren. Een ander voorbeeld zou zijn RETVec, een meertalig tekstverwerkingsmodel dat wordt gebruikt om spam te detecteren. Dit komt op een moment dat we allemaal worden gewaarschuwd dat onverlaten blijkbaar meer gebruik maken van machine learning-software om inbraken en onderzoek naar kwetsbaarheden te automatiseren.

Beleidsmakers, beveiligingsprofessionals en het maatschappelijk middenveld hebben de kans om eindelijk de cyberbeveiligingsbalans te laten kantelen van aanvallers naar cyberverdedigers

“AI bevindt zich op een definitief kruispunt – een kruispunt waar beleidsmakers, beveiligingsprofessionals en het maatschappelijk middenveld de kans hebben om eindelijk de cyberbeveiligingsbalans te laten kantelen van aanvallers naar cyberverdedigers”, zeggen Phil Venables, Chief Information Security Officer bij Google Cloud, en Royal Hansen, van engineering voor privacy, veiligheid en beveiliging, zei op vrijdag. 

“Op een moment waarop kwaadwillende actoren met AI experimenteren, hebben we gedurfde en tijdige actie nodig om de richting van deze technologie vorm te geven.”

Het paar gelooft Magiek kan door netwerkverdedigers worden gebruikt om snel en op grote schaal de ware inhoud van bestanden te identificeren, wat een eerste stap is in malwareanalyse en inbraakdetectie. Eerlijk gezegd zou dit deep-learning-model nuttig kunnen zijn voor iedereen die door gebruikers aangeleverde documenten moet scannen: video's die feitelijk uitvoerbare bestanden zijn, zouden bijvoorbeeld een alarm moeten veroorzaken en nadere inspectie vereisen. E-mailbijlagen die niet zijn wat ze zeggen te zijn, moeten in quarantaine worden geplaatst. Je snapt het idee.

Meer in het algemeen kunnen AI-modellen in de context van cyberbeveiliging niet alleen bestanden inspecteren op verdachte inhoud en broncode op kwetsbaarheden, ze kunnen ook patches genereren om bugs op te lossen, beweren de Googlers. De ingenieurs van het megacorp hebben ermee geëxperimenteerd Gemini om ook het geautomatiseerde fuzzing van open source-projecten te verbeteren.

Google beweert dat Magika 50 procent nauwkeuriger is in het identificeren van bestandstypen dan het vorige systeem van handgemaakte regels van de biz, dat het milliseconden nodig heeft om een ​​bestandstype te identificeren en dat het in tests minstens 99 procent accuraat is. Het is echter niet perfect en slaagt er ongeveer drie procent van de tijd niet in om bestandstypen te classificeren. Het heeft een licentie onder Apache 2.0, de code is hier, en het model weegt 1 MB.

De Chocolate Factory wijkt af van Magika en zal, als onderdeel van dit nieuwe AI Cyber ​​Defense Initiative, ook samenwerken met 17 startups in Groot-Brittannië, de VS en Europa, en hen trainen in het gebruik van dit soort geautomatiseerde tools om hun veiligheid te verbeteren. 

Het zal ook zijn $15 miljoen kostende Cybersecurity Seminars Program uitbreiden om universiteiten te helpen meer Europese studenten op te leiden in veiligheid. Dichter bij huis beloofde het twee miljoen dollar aan subsidies om onderzoek naar cybercriminaliteit te financieren, evenals grote taalmodellen ter ondersteuning van academici van de Universiteit van Chicago, Carnegie Mellon en Stanford.

“De AI-revolutie is al aan de gang. Hoewel mensen de belofte van nieuwe medicijnen en wetenschappelijke doorbraken terecht toejuichen, zijn we ook enthousiast over het potentieel van AI om de veiligheidsuitdagingen van generaties op te lossen en ons tegelijkertijd dichter bij de veilige, beveiligde en vertrouwde digitale wereld te brengen die we verdienen”, concludeerden Venables en Hansen. ®

spot_img

Laatste intelligentie

spot_img