제퍼넷 로고

AI 생성 모델의 한계

시간

최근 여러 이야기에서 모델이라는 주제가 등장했고, 반복되는 주제 중 하나는 AI가 필요한 추상화 모델을 생성하는 데 도움이 될 수 있다는 것입니다. 어떤 경우에는 이것이 사실일 수도 있지만 다른 경우에는 매우 위험합니다.

일반화하면 AI는 결과가 주로 연속적이지만 불연속성이 문제를 일으키는 모든 모델에 적합해야 합니다. 이를 발견하고 그에 대한 경계 조건을 어떤 방식으로든 식별하지 않는 한 훈련의 부적절함을 반영하는 결과를 얻을 수 있습니다. 이는 입력의 아주 작은 변화만으로도 기껏해야 당황스러운 결과를 얻을 수 있는 오늘날의 이미지 인식과 유사합니다.

여기서의 교훈은 항상 더 많은 데이터 포인트, 더 복잡한 네트워크, 더 많은 계산 능력이 필요하다는 것입니다. 이로 인해 생성된 모델의 이점이 줄어듭니다. 이 정확성 문제가 사라지거나 허용될 수 있습니까? 그것은 결과에 얼마나 의존하고 있는지에 달려 있습니다. 어떤 경우에는 신경 쓰지 않을 수도 있지만 다른 경우에는 그렇습니다.

나에게 가장 큰 문제는 AI가 겸손하지 않다는 것이다. “모르겠어요.”라고 말하는 것을 좋아하지 않습니다.

Serge Leef가 DARPA에서 근무할 때 비슷한 문제를 제기했으며 시뮬레이션을 더 빠르게 실행할 수 있는 방법이 있는지 알아보고 싶었습니다. 그가 나에게 한 질문 중 하나는 "다음번에 동일한 입력으로 동일한 상태에 있을 때 결과를 계산하는 대신 결과를 조회할 수 있도록 기능적 시뮬레이션 결과를 캐시하는 방법이 있습니까?"였습니다.

대답은 '예'입니다. 하지만 메모리를 감당할 수 있습니까? 모델이 완성되려면 디자인이 가질 수 있는 모든 가능한 상태에 대한 메모리 요소와 입력 수와 동일한 단어 너비가 필요합니다. 그리고 그렇습니다. 모든 것은 단순히 메모리 조회일 뿐입니다. 대부분의 경우 메모리를 희소 행렬로 축소할 수 있지만 이는 이제 다중 레벨 메모리 조회이기 때문에 복잡성이 가중되고 작업 속도가 느려집니다. 극단적인 경우, 최소 메모리를 유지하는 데 필요한 알고리즘은 알고리즘 형식, 즉 모델로 표현되는 시스템의 기능입니다.

저는 수십 년 전에 ROM을 사용하여 로직 기능을 구현하는 메모리 조회 기술을 활용했으며 이는 FPGA 조회 테이블에서도 유사하게 구현되었습니다. 하지만 확장되지는 않습니다. 이것이 조회 테이블이 XNUMX~XNUMX개의 입력에서 멈추는 경향이 있는 이유입니다. ROM을 사용하여 상태 머신을 구현하는 것도 가능합니다. 여기서 다음 주소는 ROM에 저장된 값으로 인코딩됩니다. 다시 말하지만, 이것은 확장되지 않습니다.

메모리 확장 문제는 검증 문제의 "크기"에 사용된 문제와 동일한 문제입니다. 모든 메모리 비트가 전체 상태 공간을 2로 만드는 데 기여한다고 가정합니다.n. 여기에는 몇 가지 오류가 있습니다. 첫째, 모든 주가 유효한 것은 아닙니다. 둘째, 더 중요한 것은 대부분의 시스템에는 한 시스템이 다른 시스템에 영향을 미칠 수 없는 여러 개의 독립 상태 공간이 포함되어 있다는 것입니다.

이를 통해 AI가 해당 지역을 어떻게 식별할 수 있는지 확인할 수 있으며, 이것이 바로 AI가 큰 함정에 빠지게 되는 지점입니다. 당신은 그들이 독립적인지 확실히 알 수 없습니다. 시스템에서 가장 중요한 버그가 무엇인지 놓치는 것은 사실이 아닌 경우 하나만 있으면 됩니다. 이는 결론을 내리기 전에 시간이 지남에 따라 가능한 모든 입력을 고려할 수 있다는 점에서 공식 검증의 가장 큰 매력 중 하나입니다. 물론 형식적인 것은 확장 가능하지 않습니다.

그래서 AI가 기능적 모델을 만드는 데 사용되는 것에 대한 우려가 있습니다. 하지만 열 모델과 같은 것들은 어떻습니까? 그것이 상황이 훨씬 더 매력적으로 보이는 곳입니다. 기능의 불연속성은 장기간에 걸쳐 많은 기능이 실행되는 집합체인 열에 영향을 미치지 않습니다. 모든 것이 평균화되며 최악의 경우 결과가 XNUMX~XNUMX% 차이가 나는 것입니다.

이 모든 것은 오래된 질문으로 귀결됩니다. 모델로부터 무엇을 기대합니까? 이 질문을 이해해야만 올바른 모델을 선택하고 해당 모델 사용과 관련된 위험을 알 수 있습니다. 모델의 정확성과 충실도는 무엇입니까? 이를 실행하는 데 드는 비용과 비교하여 평가해야 합니다.

공짜로 무언가를 얻는 경우는 드뭅니다. 우리는 끊임없이 여러 문제의 균형을 맞추는 절충의 세계에 살고 있습니다. 모델 생성기를 사용하면 모델을 구축하거나 업데이트하는 데 드는 시간과 비용이 명확하지 않을 수 있으므로 더욱 복잡해집니다. 이를 다시 시뮬레이터, 에뮬레이터 및 신속한 프로토타이핑 시스템이 있는 기능 검증과 연관시킬 수 있습니다. 각각은 모델의 실행 엔진입니다. 시뮬레이터는 가장 정확한 모델을 실행하며 변경 후 처리 시간은 매우 빠르지만 실행 시간은 느립니다. 에뮬레이터는 더 빠르게 실행되고, 변경 후 실행 준비에 더 오랜 시간이 걸리며, 디자인의 일부 측면을 정확하게 반영할 수 없습니다. 신속한 프로토타이핑은 변경 후 실행할 준비를 갖추는 데 훨씬 더 오랜 시간이 걸리지만 실행 속도가 가장 빠르고 실제 모델에서 벗어나는 영역 수가 늘어납니다. 마찬가지로 여기에 스펙트럼 전반에 걸친 모델의 제어 가능성 및 관찰 가능성과 같은 다른 차원을 추가할 수 있습니다.

결론은 AI는 충실도가 중요한 문제가 아닌 모델을 생성하는 데에만 적합하다는 것입니다. 작은 부정확성은 추상적 모델에서 발견되는 것과 마찬가지로 허용됩니다. 하지만 어디에서 상당히 잘못된 결과가 나올 수 있는지 이해해야 합니다. 그리고 그렇습니다. 추상 모델도 이 작업을 수행할 수 있으므로 모델의 품질이 무엇인지 올바르게 이해하는 것이 중요합니다.

spot_img

최신 인텔리전스

spot_img