제퍼넷 로고

비밀 메시지는 AI 생성 미디어에 숨길 수 있습니다 | 콴타 매거진

시간

개요

27년 2010월 10일, FBI는 뉴욕시 근처에서 미국 전문가로 거주하고 일하던 러시아 스파이 XNUMX명을 체포했습니다. 위조 신원과 비밀 회의의 복잡한 시스템을 밝힌 이 사건은 냉전 종식 이후 미국에서 가장 큰 스파이 네트워크 중 하나를 폭로하고 쇼에 영감을 주었습니다. 미국인.

또한 다른 메시지 내에서 비밀 메시지를 위장하는 방법인 스테가노그래피에 주목했습니다. 뉴욕 스파이들은 공개적으로 사용 가능한 웹사이트에 게시된 무해해 보이는 이미지의 픽셀 내에서 통신을 인코딩하여 눈에 잘 띄는 곳에 비밀을 숨겼습니다. 이를 읽으려면 수신자는 이미지를 다운로드하고 이진 코드의 1과 0으로 변환하고 순서대로 변경된 숫자가 비밀을 철자하는지 알아야 했습니다. 

예술이자 과학인 스테가노그래피는 암호화로 알려진 더 잘 알려진 비밀 통신 방법과 다릅니다. 암호화가 의도적으로 메시지 내용을 숨기고 메시지를 복잡한 텍스트나 숫자로 변환하는 경우 스테가노그래피는 비밀이 존재한다는 사실을 숨깁니다. 스테가노그래피는 메시지의 존재를 숨긴다. 크리스티안 카친베른 대학교의 컴퓨터 과학자이자 암호학자입니다. "적이 숨겨진 메시지를 감지할 수 있다면 발신자는 게임에서 진 것입니다." 

은밀한 통신 방법과 마찬가지로 문제는 완벽하게 보안을 유지하는 방법입니다. 즉, 사람이나 기계 탐지기가 비밀을 숨기는 메시지를 의심하지 않습니다. 스테가노그래피의 경우 이것은 오랫동안 이론적인 가능성이었지만 실제 인간 커뮤니케이션으로는 달성할 수 없는 것으로 간주되었습니다.

ChatGPT와 같은 대규모 언어 모델의 출현은 다른 방식을 제안합니다. 사람이 만든 텍스트에 대한 보안을 보장하는 것은 불가능할 수 있지만, 새로운 증거 텍스트, 이미지, 비디오 또는 기타 미디어 등 기계 생성 메시지에서 스테가노그래피에 대한 완벽한 보안을 달성하는 방법을 처음으로 제시합니다. 저자는 또한 보안 메시지를 생성하는 일련의 알고리즘을 포함하고 있으며 이를 인기 있는 앱과 결합하는 방법을 연구하고 있습니다.

"AI 모델과 인터페이스하는 것이 매우 흔한 사회가 되면서 사람들이 항상 사용하는 미디어에 비밀 정보를 인코딩할 기회가 점점 더 많아지고 있습니다."라고 말했습니다. 사무엘 소코타, 새로운 알고리즘 개발을 도운 Carnegie Mellon University의 컴퓨터 과학자.

개요

그 결과는 모든 종류의 커뮤니케이션을 이해하기 위한 수학적 틀을 제공하는 정보 이론의 세계에서 나옵니다. 실제 스테가노그래피의 복잡하고 지저분한 것과는 대조적으로 추상적이고 깔끔한 분야입니다. 세계는 종종 겹치지 않는다고 말했다 제시카 프리드리히, 디지털 미디어에서 데이터를 숨기고 감지하는 방법을 연구하는 Binghamton University의 연구원. 그러나 새로운 알고리즘은 보안에 대한 오랜 이론적 기준을 충족하고 기계 생성 콘텐츠에 메시지를 숨기는 실용적인 응용 프로그램을 제안함으로써 두 가지를 통합합니다. 새로운 알고리즘은 New York Russians와 같은 스파이에 의해 활용될 수 있지만 암호화된 채널을 금지하는 국가에서 정보를 얻으려는 사람들을 도울 수도 있습니다.

면도한 머리 및 기타 전략

스테가노그래피(그리스어로 "커버된 쓰기")의 체계는 디지털 미디어보다 수천 년 앞서 있습니다.

가장 초기에 알려진 예는 역사 기원전 5세기에 쓰여진 헤로도토스에 의해. 한 이야기에서 메시지는 나무 판에 쓰여지고 여행 중에 가로채는 것을 피하기 위해 밀랍 층으로 숨겨집니다. 다른 하나는 전술가 아이네아스(Aeneas)의 것으로 추정되는 메시지가 특정 문자 위에 보이지 않는 잉크 점을 숨겨서 진정한 메시지를 철자합니다. 더 극단적인 예에서 폭군 지도자 Histiaeus는 발각되지 않고 조카에게 전략을 전달하기를 원하기 때문에 노예의 머리를 깎고 남자의 머리에 메시지를 문신으로 새기고 머리카락이 다시 자랄 때까지 기다렸다가 메신저를 보냅니다. 도착하자마자 조카는 메신저의 머리를 깎고 계획을 밝힙니다.

이러한 전략은 지속되었고 기술은 새로운 전략을 허용했습니다. 제XNUMX차 세계 대전 당시 독일 스파이들은 마이크로도트를 통해 정보를 전송하는 방법을 찾았습니다. 그들은 문서를 복사하고 축소하여 "i"의 점만큼 작게 만들었습니다.

정치인들도 기만적인 예술에 눈을 돌렸습니다. 1980년대에 일련의 언론 유출이 있은 후 영국 총리 마가렛 대처(Margaret Thatcher)는 각 장관의 워드 프로세서를 재프로그래밍하여 거의 감지할 수 없지만 고유한 단어 간격 패턴을 갖게 했다고 주장했습니다. 이 약간의 수정으로 유출된 문서의 출처를 추적할 수 있었습니다.

선과 악에 대한 접근 방식은 21세기에도 계속 번창하고 있습니다. 현대 스테가노그래피 전략에는 눈에 보이지 않는 잉크로 메시지 쓰기(뉴욕의 러시아 스파이가 사용하는 또 다른 전술), 그림 세부 사항에 아티스트 서명 숨기기, 숨겨진 트랙 또는 뒤로 트랙이 있는 오디오 파일 디자인이 포함됩니다. Fridrich는 디지털 미디어의 스테가노그래피 접근 방식이 음성 메일 파일의 이미지를 숨기거나 러시아 스파이의 경우처럼 조작된 사진에 작성된 텍스트를 배치하는 데 도움이 될 수 있다고 말합니다.

비밀 유지 공식화

1980년대가 되어서야 수학자 및 컴퓨터 과학자들이 스테가노그래피에 대한 형식적이고 수학적 규칙을 찾기 시작했다고 Cachin은 말했습니다. 그들은 다음과 같이 시작된 분야인 정보 이론으로 전환했습니다. 클로드 섀넌의 중요한 1948년 논문 "A Mathematical Theory of Communication"은 채널을 통한 정보 송수신에 대한 분석적 접근 방식을 확립했습니다. (Shannon은 전신선을 모델링했지만 오늘날 디지털 기술의 토대를 마련했습니다.) 그는 "엔트로피"라는 용어를 사용하여 변수의 정보량(예: 문자나 메시지를 인코딩하는 데 필요한 비트 수)을 정량화했습니다. 1949년에 그는 완벽하게 안전한 암호화를 위한 규칙을 만들었습니다. 그러나 Shannon은 스테가노그래피에서 보안을 다루지 않았습니다.

거의 50년 후, Cachin은 그렇게 했습니다. Shannon의 정신에 입각한 그의 접근 방식은 언어를 확률론적으로 생각하는 것이었습니다. 스테가노그래피를 통해 메시지를 전달하고 적인 Eve로부터 메시지를 비밀로 유지하려는 두 에이전트 Alice와 Bob을 생각해 보십시오. Alice가 Bob에게 무해한 메시지를 보낼 때 그녀는 전체 영어 어휘집에서 단어를 선택합니다. 이러한 단어에는 관련된 확률이 있습니다. 예를 들어 "the"라는 단어가 "lexicon"보다 선택될 가능성이 더 높습니다. 전체적으로 단어는 확률 분포로 나타낼 수 있습니다. Alice가 스테가노그래피를 사용하여 인코딩된 메시지를 Bob에게 보내는 경우 해당 메시지는 고유한 확률 분포를 갖게 됩니다.

정보 이론가들은 상대 엔트로피라는 척도를 사용하여 확률 분포를 비교합니다. 이것은 추상적인 종류의 거리를 측정하는 것과 같습니다. 두 분포 사이의 상대적 엔트로피가 XNUMX이면 비밀을 밝히기 위해 "통계 분석에 의존할 수 없습니다"라고 말했습니다. 크리스티안 슈뢰더 드 비트, 새 논문을 작업한 옥스퍼드 대학의 컴퓨터 과학자. 즉, 미래의 스파이가 비밀을 밀수하기 위해 완벽하게 안전한 알고리즘을 개발한다면 어떤 통계 기반 감시도 이를 탐지할 수 없을 것입니다. 그들의 전송은 완벽하게 숨겨질 것입니다.

그러나 Cachin의 증명은 표지 텍스트로 알려진 비밀을 숨기는 메시지에 대한 중요한 가정에 의존했습니다. 원래의 무해한 메시지와 구별할 수 없는 새로운 메시지를 제시하려면 커버 텍스트 배포의 완벽한 시뮬레이션을 만들어야 한다고 Cachin은 말했습니다. 예를 들어 서면 메시지에서 이는 사람의 언어를 완벽하게 시뮬레이션할 수 있는 도구를 사용하는 것을 의미합니다. 그러나 인간이 생성한 텍스트는 너무 지저분합니다. ChatGPT 및 기타 대규모 언어 모델은 설득력 있는 시뮬레이션을 생성할 수 있지만 정확하지는 않습니다. Cachin은 "인간이 생성한 텍스트의 경우 이는 불가능합니다."라고 말했습니다. 이러한 이유로 완벽하게 안전한 스테가노그래피는 오랫동안 손이 닿지 않는 것처럼 보였습니다.

사진이나 문자 메시지와 같은 인간이 만든 디지털 미디어에 메시지를 숨기는 복잡한 현실 세계의 복잡성에 초점을 맞춘 연구를 수행하는 Fridrich는 완벽한 시뮬레이션은 결코 충족되지 않을 조건이라고 말했습니다. "디지털 미디어의 문제는 실제 모델을 절대 가질 수 없다는 것입니다."라고 그녀는 말했습니다. “너무 복잡합니다. 스테가노그래피는 결코 완벽할 수 없습니다.”

완벽을 달성하다

그러나 기계로 생성된 텍스트는 물론 인간이 만든 것이 아닙니다. 언어 또는 이미지나 소리를 생성하는 다른 모델에 초점을 맞춘 생성 모델의 최근 부상은 현실 세계에서 완벽하게 안전한 스테가노그래피가 가능할 수 있음을 시사합니다. 결국 이러한 모델은 대부분의 경우 설득력 있게 인간처럼 보이는 텍스트 생성의 일부로 잘 정의된 샘플링 메커니즘을 사용합니다.

Sokota와 Schroeder de Witt는 이전에 스테가노그래피가 아니라 기계 학습에 대해 연구했습니다. 그들은 다양한 채널을 통해 정보를 전송하는 새로운 방법을 추구해 왔으며 어느 시점에서 최소 엔트로피 결합이라는 정보 이론의 비교적 새로운 개념을 배웠습니다.

개요

Sokota는 “이런 종류의 기본적인 도구처럼 보이지만 잘 연구되지 않았습니다.”라고 말했습니다. 최소 엔트로피 결합에서 연구원은 두 확률 분포를 두 시스템을 나타내는 단일 공동 분포로 결합할 수 있습니다. 스테가노그래피의 경우 이러한 분포 중 하나는 표지 텍스트를 나타내고 다른 분포는 숨겨진 메시지를 포함하는 암호문을 나타냅니다. 공동 배포를 통해 두 텍스트를 통계적으로 구분할 수 없도록 하여 완벽하게 안전한 메시지를 생성할 수 있습니다.

Sokota, Schroeder de Witt 및 그들의 팀은 딥 러닝에 대한 새로운 접근 방식을 위해 도구를 활용할 방법을 찾으려고 노력했습니다. 그러나 어느 날 Sokota는 그들의 공동 작업자인 Martin Strohmeier가 최소 엔트로피 결합에 대한 작업이 그에게 스테가노그래피와 관련된 보안 문제를 상기시켰다고 언급했다고 회상했습니다.

Strohmeier는 아무렇지 않은 말을 했지만 Sokota와 Schroeder de Witt는 진지하게 받아들였습니다. 이 그룹은 실제 기계 학습 시스템의 맥락에서 완벽한 보안을 위한 Cachin의 요구 사항을 충족하는 스테가노그래피 절차를 설계하기 위해 최소 엔트로피 결합을 사용하는 방법을 곧 알아냈습니다.

"스테가노그래피에 이렇게 멋진 응용 프로그램이 있다는 사실에 놀랐습니다."라고 말했습니다. 무라트 코카오글루, Purdue University의 전기 및 컴퓨터 엔지니어. 그는 스테가노그래피로 작업하지 않았지만 다음 중 하나를 설계하는 데 도움을 주었습니다. 알고리즘 종이에 사용된 팀. "이 작업은 최소 엔트로피 결합과 잘 연결되어 있습니다."

그런 다음 팀은 더 나아가 스테가노그래피 체계가 가능한 한 계산적으로 효율적이려면 최소 엔트로피 결합을 기반으로 해야 한다는 것을 보여주었습니다. 새로운 전략은 보안과 효율성을 모두 달성하는 방법에 대한 명확한 방향을 제시하고 두 가지가 함께 진행되도록 제안합니다.

"우리의 결과는 이것이 완벽하게 안전하지 않은 접근 방식보다 훨씬 더 효율적이라는 것을 시사하는 것 같습니다."라고 Sokota는 말했습니다.

실제 세계

한계가 있습니다. Cachin은 진정한 최소 엔트로피 결합을 찾는 것이 NP-hard 문제라고 지적했습니다. 이는 기본적으로 완벽한 솔루션이 실용적이기에는 계산 비용이 너무 많이 든다는 것을 의미하며 효율성 문제로 돌아갑니다.

Sokota와 Schroeder de Witt는 그 문제를 인정합니다. 최적의 결합은 실제로 계산하기에는 너무 복잡할 것입니다. 그러나 이러한 병목 현상을 해결하기 위해 저자는 Sokota와 Schroeder de Witt가 개발한 근사 절차(그리고 Kocaoglu가 도입한 방법을 기반으로 함)를 사용했습니다. 이 절차는 여전히 보안과 합리적인 효율성을 보장합니다.

실제 작동 방식은 다음과 같습니다. 반체제 인사나 인권 운동가가 봉쇄된 국가 밖으로 문자 메시지를 보내고 싶어 한다고 가정해 보겠습니다. 슈뢰더 드 위트는 왓츠앱이나 시그널 같은 앱용 플러그인이 알고리즘을 많이 들어올릴 것이라고 말했다. 첫 번째 단계는 암호문을 숨길 표지 텍스트 배포, 즉 ChatGPT 또는 유사한 대규모 언어 모델에서 제공되는 것처럼 메시지에 사용할 수 있는 거대한 단어 모음을 선택하는 것입니다. 그런 다음 프로그램은 해당 언어 모델을 사용하여 표지 텍스트와 암호문 사이의 최소 엔트로피 결합을 추정하고 해당 결합은 텍스트로 전송되는 문자열을 생성합니다. 외부의 적에게 새 텍스트는 무고한 기계 생성 메시지와 구별할 수 없습니다. 또한 텍스트일 필요도 없습니다. 알고리즘은 예를 들어 음성 메일을 위해 기계 생성 아트(ChatGPT 대신) 또는 AI 생성 오디오를 샘플링하여 작동할 수 있습니다.

새로운 알고리즘은 비밀 메시지의 크기 측면에서 제한적입니다. Schroeder de Witt는 오늘날의 기술을 사용하면 시스템이 약 225초 동안 기계에서 생성된 음성 메일에 약 30KB의 이미지(또는 다른 메시지)를 숨길 수 있다고 추정합니다. 그러나 성공하기 위해 거대할 필요는 없습니다. 상당한 메시지가 검열관이나 당국을 통과하기에 충분합니다.

Fridrich는 이론을 고려하기보다는 현실 세계의 한계에 맞서 작업하는 데 더 익숙하다고 말했습니다. 그녀는 "다른 면을 보는 것이 흥미롭다"고 말했다. 그녀에게 새로운 작업은 이론적인 증명과 현실 세계의 혼란 사이의 간극을 메우기 시작합니다. 사람들이 기계 생성 콘텐츠를 사용하지 않는 경우 새 체계는 보안을 보장하지 않습니다. 그러나 그것이 더 널리 퍼질수록 완벽한 보안의 가능성은 더 커질 것이라고 그녀는 말했다.

"모든 것은 전형적인 것이 무엇인지에 달려 있습니다."라고 그녀는 말했습니다. 기계가 자연스러워 보이는 무해한 이미지를 생성하고 사람들이 이에 익숙해지면 비밀 메시지가 풍부한 이미지 소스를 쉽게 만들 수 있습니다. "생성 모델을 통해 이 접근 방식은 두 가지 접근 방식이 만날 수 있는 가능한 경로를 제공합니다."라고 그녀는 말했습니다.

분명히 양날의 검이기도 합니다. Fridrich는 "범죄자들이 이를 사용할 것이지만 선의로 사용될 수도 있습니다."라고 말했습니다.

spot_img

최신 인텔리전스

spot_img