제퍼넷 로고

2022년은 AI가 마침내 광고에 부응하기 시작한 해였습니다.

시간

이제까지 s딥 러닝은 2012년에 주류가 되었고 AI 연구 종종 앞섰다 그것의 현실. 그러나 지난 XNUMX년 동안 일련의 돌파구와 주요 이정표는 기술이 마침내 그 약속에 부응할 수 있음을 시사합니다.

딥 러닝의 명백한 잠재력에도 불구하고, 지난 XNUMX년 동안 폭주하는 초지능의 위험과 기술 실업의 전망에 대한 정기적인 경고는 대부분의 AI 시스템이 고양이 이미지를 식별하거나 영어에서 의심스러운 번역으로 중국인.

그러나 작년에는 AI 시스템의 기능에 부정할 수 없는 단계적 변화가 있었습니다. 창조 산업, 기초 과학컴퓨터 프로그래밍. 게다가 이러한 AI 시스템과 그 결과물은 점점 더 일반 사람들이 볼 수 있고 접근할 수 있게 되었습니다.

창의적인 작업에 몰두하는 수많은 모델을 일컫는 포괄적인 용어인 생성 AI의 급성장하는 분야보다 더 발전이 분명한 곳은 없습니다.

이것은 주로 덕분이었습니다. 변압기라고 불리는 일종의 모델, 실제로 2017년 Google에서 처음 공개했습니다. 실제로 올해 헤드라인을 장식한 많은 AI 시스템은 개발자가 한동안 작업해 온 모델의 업데이트이지만 2022년에 생성한 결과는 이전보다 훨씬 뛰어났습니다. 물 밖으로 반복.

그 중 가장 눈에 띄는 것은 OpenAI의 GPT-3 대형 언어 모델의 최신 버전을 기반으로 한 AI 챗봇인 ChatGPT입니다. XNUMX월 말에 공개되어 서비스가 시작되었습니다. 놀라운 사람들 자연스러운 대화에 참여하고, 복잡한 기술 질문에 답하고, 설득력 있는 산문과 시를 만들어내는 묘한 능력을 갖추고 있습니다.

올해 초 DALL-E 2라는 또 다른 OpenAI 모델은 생성 능력으로 인터넷을 강타했습니다. 초현실적 이미지 "1990년대 윔블던에서 테니스를 치는 너구리"나 "고대 로마의 스파이더맨"과 같은 기괴한 메시지에 대한 응답으로. Meta는 XNUMX월에 생산할 수 있는 시스템으로 한 단계 더 발전했습니다. 짧은 비디오 클립 텍스트 프롬프트에서 Google 연구원은 심지어 AI를 만들 수 있습니다. 음악 생성 오디오 클립 스타일로 재생됩니다.

AI 창의성과 유창성에서 이러한 폭발의 의미는 지금 당장 측정하기 어렵지만 이미 예측에 박차를 가했습니다. 전통적인 검색 엔진 대체, 대학 에세이를 죽여라, 그리고 예술의 죽음.

이것은 이러한 모델의 기능이 향상되었기 때문입니다.ir ChatGPT, DALL-E 2 및 텍스트를 이미지로 변환하는 생성기 Midjourney와 같은 서비스를 통해 모든 사람에게 무료로(적어도 현재로서는) 개방되어 접근성이 향상됩니다. 더 나아가 독립적인 AI 연구소 S테이블 Diffusion은 심지어 text-to-image AI를 오픈 소스화했습니다., 적당히 강력한 컴퓨터를 가진 사람이라면 누구나 스스로 실행할 수 있습니다.

AI는 또한 작년에 더 평범한 작업에서 진전을 이루었습니다. 지난 XNUMX월 딥마인드는 AI 기반 코드 생성기인 알파코드(AlphaCode)를 공개했다. 평균적인 프로그래머와 일치 코딩 대회에서 비슷한 맥락에서, GitHub 부조종사, an GitHub와 OpenAI가 개발한 AI 코딩 도구는 프로토타입에서 상용 구독 서비스로 이동했습니다.

이 분야의 또 다른 주요 밝은 점은 기초 과학에서 AI의 점점 더 두드러지는 역할입니다. XNUMX월에 DeepMind는 획기적인 AlphaFold AI가 거의 모든 단백질의 구조를 예측 과학계에 알려져 생명 과학과 신약 개발 모두에서 잠재적인 혁명을 일으켰습니다. 회사는 또한 지난 XNUMX월에 휘젓는 플라즈마를 제어하는 ​​AI 실험적인 핵융합로 내부에서 발견되었습니다.

AI는 지난 XNUMX년 동안 그 분야에서 몰두했던 장난감 문제에서 점차 멀어지고 있는 것처럼 보이지만 AI 연구의 주류 중 하나인 게임에서도 큰 진전을 이루었습니다.

11 월, Meta는 상위 10% 플레이어에 속하는 AI를 선보였습니다. 보드게임 외교, 전략과 다른 플레이어와의 자연어 협상의 도전적인 조합이 필요합니다. 같은 달에 Nvidia의 한 팀은 AI를 다음과 같이 훈련했습니다. 복잡한 3D 비디오 게임 Minecraft 플레이 높은 수준의 자연어 명령만 사용합니다. 그리고 XNUMX월에는 DeepMind 엄청나게 복잡한 게임 Stratego를 깨뜨렸습니다., 장기 계획, 허세, 건전한 불확실성이 포함됩니다.

그러나 모든 것이 평범한 항해는 아닙니다. ChatGPT와 같은 제너레이티브 AI 출력의 표면적으로 인상적인 특성에도 불구하고 많은 사람들은 매우 설득력이 있다고 빠르게 지적했습니다. 헛소리 생성기. 그들은 인터넷에서 다양한 품질의 엄청난 양의 텍스트에 대해 훈련을 받았습니다. 그리고 궁극적으로 그들이 하는 일은 프롬프트 다음에 나올 가능성이 가장 높은 텍스트를 추측하는 것뿐이며 출력의 진실성을 판단할 수 있는 능력이 없습니다. 이로 인해 인터넷이 곧 엄청난 양의 설득력 있는 넌센스로 범람할 수 있다는 우려가 제기되었습니다.

이것은 학술 논문을 요약하고, 수학 문제를 풀고, 과학자들이 연구 속도를 높이는 데 도움이 되는 컴퓨터 코드를 작성하기로 되어 있는 Meta의 Galactica AI의 출시로 밝혀졌습니다. 문제는 그것이 그럴듯하게 들리는 자료를 생산할 것이라는 점이었습니다. 완전히 잘못되었거나 매우 편향된, 단 XNUMX일 만에 서비스가 종료되었습니다.

편향은 이전 모델이 제공한 보다 신중하게 선별된 데이터 세트가 아닌 인터넷의 방대한 자료에 대해 훈련되는 이 새로운 유형의 AI에 중요한 문제입니다. 비슷한 문제가 ChatGPT에서도 나타났습니다. OpenAI가 필터를 적용했음에도 불구하고 w하이트와 동양인 남성은 좋은 과학자가 된다. 그리고 인기 있는 AI 이미지 생성 앱인 Lensa가 출시되었습니다. 성적z여성의 초상화를 그린다, 특정한ly 아시안 드의s센트.

AI의 다른 영역도 a 별보다 적은 해. 가장 널리 알려진 실제 사용 사례 중 하나인 자율주행차는 상당한 차질을 겪었습니다. 포드와 폭스바겐이 지원하는 아르고의 폐쇄테슬라 사기 혐의 방어 전달 실패에 대해 "full s꼬마 요정-drving'을 외치며 점점 더 커져가는 목소리의 합창 업계는 틀에 박힌.

명백한 진전에도 불구하고 그건 딥 러닝이 만들어졌다고 말하는 Gary Marcus와 같은 사람들도 있습니다. 한계에 도달하다, 학습 중인 자료를 진정으로 이해할 수 없고 대신 설득력 있지만 종종 결함이 있는 결과를 생성할 수 있는 통계적 연결을 만드는 방법을 배우기 때문입니다.

그러나 올해 가장 인상적인 결과를 얻은 사람들에게 2022년은 다가올 일의 맛보기일 뿐입니다. 많은 사람들이 다음 큰 돌파구가 올 것이라고 예측합니다. 다중 모달 모델 텍스트에서 이미지 및 오디오에 이르기까지 모든 분야에서 점점 더 강력한 기능을 결합합니다. 이 분야가 2023년에도 추진력을 유지할 수 있을지는 두고 봐야겠지만, 어느 쪽이든 올해는 AI 연구의 분기점으로 내려갈 가능성이 높습니다.

이미지 신용 : Deepmind / Unsplash

spot_img

최신 인텔리전스

spot_img