Zephyrnet Logo

Modelo Magika AI de identificação de arquivos de código aberto do Google

Data:

O Google abriu o código-fonte do Magika, um identificador interno de arquivos baseado em aprendizado de máquina, como parte de sua Iniciativa de Defesa Cibernética de IA, que visa fornecer aos defensores da rede de TI e outros melhores ferramentas automatizadas.

Descobrir o verdadeiro conteúdo de um arquivo enviado pelo usuário talvez seja mais difícil do que parece. Não é seguro assumir o tipo de arquivo a partir, digamos, de sua extensão, e confiar em heurísticas e regras criadas por humanos – como aquelas no amplamente utilizado libmagic – identificar a natureza real de um documento a partir de seus dados é, na opinião do Google, “consumidor de tempo e sujeito a erros”.

Basicamente, se alguém enviar um .JPG para o seu serviço online, você quer ter certeza de que é uma imagem JPEG e não algum script disfarçado de tal, que mais tarde poderá morder sua bunda. Entra em cena o Magika, que usa um modelo treinado para identificar rapidamente os tipos de arquivo a partir dos dados do arquivo, e é uma abordagem que o Big G acha que funciona bem o suficiente para ser usada na produção. Magika é, segundo nos disseram, usado pelo Gmail, Google Drive, Navegação segura do Chrome e VirusTotal para identificar e rotear adequadamente os dados para processamento posterior.

Sua milhagem pode variar. Libmagic, por exemplo, pode funcionar bem o suficiente para você. De qualquer forma, Magika é um exemplo de como o Google usa internamente inteligência artificial para reforçar sua segurança e espera que outros também possam se beneficiar dessa tecnologia. Outro exemplo seria RETVec, que é um modelo de processamento de texto multilíngue usado para detectar spam. Isso ocorre em um momento em que todos somos avisados ​​de que os criminosos aparentemente estão fazendo mais uso de software de aprendizado de máquina para automatizar invasões e pesquisas de vulnerabilidades.

Os decisores políticos, os profissionais de segurança e a sociedade civil têm a oportunidade de finalmente alterar o equilíbrio da segurança cibernética, passando de atacantes para defensores cibernéticos

“A IA está em uma encruzilhada definitiva – onde os legisladores, profissionais de segurança e a sociedade civil têm a chance de finalmente inclinar o equilíbrio da segurança cibernética de invasores para defensores cibernéticos”, Phil Venables, diretor de segurança da informação do Google Cloud, e Royal Hansen, vice-presidente de engenharia para privacidade, segurança e proteção, dito na sexta-feira. 

“Num momento em que agentes maliciosos estão a fazer experiências com IA, precisamos de ações ousadas e oportunas para moldar a direção desta tecnologia.”

A dupla acredita Magica pode ser usado pelos defensores da rede para identificar, de forma rápida e em escala, o verdadeiro conteúdo dos arquivos, o que é um primeiro passo na análise de malware e detecção de invasões. Para ser honesto, este modelo de aprendizagem profunda pode ser útil para qualquer pessoa que precise digitalizar documentos fornecidos pelo usuário: vídeos que são realmente executáveis, por exemplo, devem disparar algum alarme e exigir uma inspeção mais detalhada. Anexos de e-mail que não são o que dizem devem ser colocados em quarentena. Você entendeu a ideia.

De modo mais geral, no contexto da segurança cibernética, os modelos de IA podem não apenas inspecionar arquivos em busca de conteúdo suspeito e códigos-fonte em busca de vulnerabilidades, mas também podem gerar patches para corrigir bugs, afirmaram os Googlers. Os engenheiros da megacorporação têm experimentado Gemini para melhorar também a difusão automatizada de projetos de código aberto.

O Google afirma que o Magika é 50% mais preciso na identificação de tipos de arquivos do que o sistema anterior de regras artesanais do negócio, leva milissegundos para identificar um tipo de arquivo e tem pelo menos 99% de precisão nos testes. No entanto, não é perfeito e falha na classificação dos tipos de arquivos em cerca de três por cento das vezes. Está licenciado sob Apache 2.0, o código é SUA PARTICIPAÇÃO FAZ A DIFERENÇA, e seu modelo pesa 1 MB.

Afastando-se da Magika, a Fábrica de Chocolate também irá, como parte desta nova Iniciativa de Defesa Cibernética de IA, fazer parceria com 17 startups no Reino Unido, EUA e Europa, e treiná-las para usar esses tipos de ferramentas automatizadas para melhorar sua segurança. 

Também expandirá o seu Programa de Seminários sobre Segurança Cibernética, no valor de 15 milhões de dólares, para ajudar as universidades a formar mais estudantes europeus em segurança. Mais perto de casa, prometeu 2 milhões de dólares em subvenções para financiar investigação em crimes cibernéticos, bem como grandes modelos linguísticos para apoiar académicos da Universidade de Chicago, Carnegie Mellon e Stanford.

“A revolução da IA ​​já está em andamento. Embora as pessoas aplaudam, com razão, a promessa de novos medicamentos e avanços científicos, também estamos entusiasmados com o potencial da IA ​​para resolver desafios de segurança geracionais, ao mesmo tempo que nos aproxima do mundo digital seguro e confiável que merecemos”, concluíram Venables e Hansen. ®

local_img

Inteligência mais recente

local_img