로컬 장치에서 실행할 수 있는 15개 이상의 가장 작은 LLM

개요

클라우드 서비스나 강력한 서버에 의존하지 않고 개인용 컴퓨터나 모바일 장치에서 바로 고급 언어 모델의 기능을 활용한다고 상상해 보십시오. 정말 놀랍지 않나요? 글쎄, 이 작은 언어 모델은 이 꿈을 현실로 만듭니다. NLP에서 우리는 인간처럼 텍스트를 동화하고 생성하는 거대한 언어 모델의 출현을 관찰했습니다. 결과가 놀라운 경우가 많지만 계산 요구 사항도 마찬가지로 큽니다. 결과적으로 처리 센터 외부에서 실행하기가 어렵습니다. 그러나 그것은 빠르게 변하고 있습니다! 좋은 소식은 연구원과 엔지니어가 로컬 장치에서 실행하기에 충분하고 유용한 작업에 적용할 수 있는 충분한 성능을 갖춘 작은 LLM을 생산하는 데 심혈을 기울였다는 것입니다.

이 기사에서는 자신의 장치에서 편안하게 로컬로 실행할 수 있는 가장 작고 강력한 언어 모델을 살펴보겠습니다. 이 컴팩트한 경이로움은 성능과 리소스 효율성 사이의 완벽한 균형을 이루어 개발자, 연구원, 매니아 모두에게 가능성의 세계를 열어줍니다.

차례

소규모 LLM의 이점은 무엇입니까?

대규모 LLM(Large Language Model)과 비교하여 소규모 LLM(대형 언어 모델)을 사용하면 다음과 같은 몇 가지 주요 이점을 얻을 수 있습니다.

낮은 하드웨어 요구 사항: 소형 LLM은 매개변수가 훨씬 적고 계산 능력이 덜 필요하므로 랩톱, 스마트폰, 임베디드 시스템과 같이 하드웨어 리소스가 제한된 장치에서 실행하는 데 이상적입니다. 이를 통해 더 광범위한 사용자와 애플리케이션을 위해 LLM을 사용하여 더 쉽게 접근하고 민주화할 수 있습니다.
더 빠른 추론: 더 적은 매개변수와 더 작은 모델 크기로 작은 LLM은 더 빠른 추론을 수행할 수 있으며, 이는 더 빠른 응답 시간과 더 낮은 대기 시간을 의미합니다. 이는 다음과 같은 실시간 애플리케이션에 특히 중요합니다. 대화 형 AI, 반응성이 매우 중요합니다.
낮은 에너지 소비: 모델이 작을수록 작동하는 데 에너지가 덜 필요하므로 에너지 효율이 높고 환경 친화적입니다. 이는 에너지 효율성이 중요한 배터리 구동 장치에 특히 유용합니다.
더욱 쉬워진 배포 및 이식성: 소형 LLM은 크기가 작아 배포 및 배포가 더 쉽습니다. 전문적인 하드웨어나 대규모 인프라 없이도 다양한 애플리케이션과 시스템에 통합될 수 있습니다. 이러한 이식성은 더 폭넓은 채택을 허용하고 더 분산된 엣지 기반 애플리케이션의 개발을 가능하게 합니다.
개인정보 보호 및 데이터 주권: 소규모 LLM을 로컬에서 실행함으로써 사용자는 데이터에 대한 더 큰 제어권을 유지하고 민감한 정보를 원격 서버나 클라우드 플랫폼으로 보낼 필요성을 줄일 수 있습니다. 이는 개인 정보 보호 문제를 해결하고 데이터 보호 규정을 준수하는 데 도움이 될 수 있습니다.
비용 효율성: 모델이 작을수록 일반적으로 더 적은 계산 리소스가 필요하므로 특히 클라우드 플랫폼이나 임대 하드웨어에서 실행할 때 운영 비용이 낮아질 수 있습니다. 이러한 비용 효율성은 LLM 소규모 조직과 개인 개발자가 더 쉽게 접근할 수 있는 기술입니다.
전문화된 애플리케이션: 작은 모델은 일반 작업에서 큰 모델과 동일한 수준의 성능을 달성하지 못할 수 있지만 특정 응용 프로그램이나 도메인에 맞게 미세 조정 및 최적화될 수 있으므로 해당 전문 영역에서는 잠재적으로 큰 모델보다 성능이 뛰어납니다.

소규모 LLM의 이점은 대규모 LLM에 비해 성능과 기능이 상충된다는 점에 유의하는 것이 중요합니다. 그러나 리소스 효율성, 이식성 및 비용 효율성 측면에서 소규모 LLM의 장점은 고급 성능이 중요한 요구 사항이 아닌 많은 응용 프로그램에서 강력한 선택이 될 수 있습니다.

로컬 장치에서 실행할 수 있는 가장 작은 LLM

디스틸버트

모델 사이즈: 기본 버전에는 BERT의 66M 매개변수보다 훨씬 작은 약 110M 매개변수가 있습니다.
상품 설명: DitilBERT는 BERT 모델의 증류된 버전으로 BERT의 성능을 대부분 유지하면서 더 작고 빠르게 설계되었습니다. 지식 증류 기술을 사용하여 대규모 BERT 모델을 더 작은 버전으로 압축하여 로컬 장치에 보다 효율적이고 쉽게 배포할 수 있습니다.
하드웨어 요구 사항: DistilBERT는 크기가 작아 노트북, 데스크톱, 고급형 모바일 기기 등 다양한 로컬 기기에서 실행할 수 있습니다.

포옹하는 얼굴 링크: 디스틸버트

타이니버트

모델 사이즈: TinyBERT-4에는 약 14M의 매개변수가 있는 반면 TinyBERT-6에는 약 67M의 매개변수가 있습니다.
상품 설명: TinyBERT는 Carnegie Mellon University와 Google Brain의 연구원들이 개발한 BERT의 더욱 컴팩트한 버전입니다. 다양한 NLP 작업에서 경쟁력 있는 성능을 유지하면서 상당한 모델 압축을 달성하기 위해 레이어별 및 주의 증류와 같은 고급 기술을 사용합니다.
하드웨어 요구 사항: TinyBERT는 크기가 매우 작기 때문에 저가형 노트북, 임베디드 시스템, 모바일 장치를 포함한 다양한 로컬 장치에서 실행할 수 있습니다.

포옹하는 얼굴 링크: 타이니버트

모바일BERT

모델 사이즈: MobileBERT는 원래 BERT 기반보다 훨씬 작은 약 25M 매개변수를 갖습니다.
상품 설명: MobileBERT는 모바일 및 엣지 디바이스를 위한 컴팩트하고 효율적인 BERT 모델입니다. 지식 증류 및 양자화와 같은 기술을 사용하여 모델 크기를 줄이는 동시에 광범위한 NLP 작업에서 높은 성능을 유지합니다.
하드웨어 요구 사항: 이름에서 알 수 있듯이 MobileBERT는 모바일 장치 및 기타 리소스가 제한된 환경에서 실행되도록 최적화되어 있습니다.

포옹하는 얼굴 링크: 모바일BERT

ALBERT

모델 사이즈: 구성에 따라 다릅니다. 가장 작은 것 중 하나는 12개의 레이어와 12개의 어텐션 헤드가 있는 ALBERT 베이스입니다.
상품 설명: ALBERT(A Lite BERT)는 효율적인 메모리 사용과 빠른 추론을 위해 설계되었습니다. 이는 레이어 간 매개변수 공유 메커니즘과 감소된 임베딩 크기를 특징으로 합니다. 원래 BERT보다 가볍지만 다양한 NLP 작업에 효과적입니다.
하드웨어 요구 사항: ALBERT의 효율적인 설계를 통해 적당한 처리 능력으로 다양한 로컬 장치에서 실행할 수 있습니다.

포옹하는 얼굴 링크: ALBERT

GPT-2 소형

모델 사이즈: GPT-2 Small은 약 117M 매개변수를 가지며, 이는 대형 GPT-2 모델보다 훨씬 작습니다.
상품 설명: GPT-2 Small은 OpenAI에서 개발한 인기 있는 GPT-2(Generative Pre-trained Transformer 2) 모델의 작은 버전입니다. 다른 모델만큼 컴팩트하지는 않지만 GPT-2 Small은 상대적으로 가볍기 때문에 텍스트 생성, 요약, 언어 모델링과 같은 작업에 사용할 수 있습니다.
하드웨어 요구 사항: GPT-2 Small은 중급형 노트북이나 데스크탑 등 적당한 하드웨어 사양을 갖춘 개인용 컴퓨터에서 실행할 수 있습니다.

포옹하는 얼굴 링크: GPT-2 소형

데시코더-1B

모델 사이즈: 1억 개의 매개변수
상품 설명: DeciCoder-1B는 코드 생성 및 이해에 중점을 둔 언어 모델입니다. 코드 완성, 프로그래밍 언어 간 번역, 코드 설명과 같은 코딩 작업을 지원할 수 있습니다. 이는 소스 코드와 자연어 설명으로 구성된 대규모 코퍼스에 대해 훈련되었습니다.
하드웨어 요구 사항: 상대적으로 작은 1억 개의 매개변수 크기를 갖춘 DeciCoder-1B는 랩톱, 데스크톱 및 잠재적으로 고급형 모바일 장치나 단일 보드 컴퓨터와 같은 다양한 로컬 장치에서 실행될 수 있습니다.

포옹하는 얼굴 링크: 데시코더 – 1B

파이-1.5

모델 사이즈: 1.5억 개의 매개변수
상품 설명: Phi-1.5는 텍스트 생성, 질문 답변, 자연어 이해 및 기타 NLP 작업이 가능한 범용 언어 모델입니다. 미세 조정이나 프롬프트를 통해 다양한 영역과 작업에 적응하도록 설계되었습니다.
하드웨어 요구 사항: Phi-1.5의 콤팩트한 1.5억 매개변수 크기 덕분에 랩탑, 데스크탑, 잠재적으로 고급형 모바일 또는 단일 보드 컴퓨팅 장치와 같은 적당한 컴퓨팅 리소스를 갖춘 로컬 장치에 배포할 수 있습니다.

포옹하는 얼굴 링크: 파이-1.5

돌리-v2-3b

모델 사이즈: 3억 개의 매개변수
상품 설명: Dolly-v2-3b는 다양한 작업에 걸쳐 상세한 다단계 프롬프트와 지침을 이해하고 실행하는 데 탁월한 명령 따르기 언어 모델입니다.
하드웨어 요구 사항: 3억 개의 매개변수를 사용하는 Dolly-v2-3b에는 고급 노트북, 데스크탑 또는 워크스테이션과 같이 중간에서 높은 컴퓨팅 성능을 갖춘 로컬 장치가 필요합니다.

포옹하는 얼굴 링크: 돌리-v2-3b

안정LM-Zepyr-3B

모델 사이즈: 3억 개의 매개변수
상품 설명: StableLM-Zephyr-3B는 신뢰할 수 있고 진실된 응답을 제공하도록 훈련된 언어 모델입니다. 다양한 자연어 처리 작업을 위한 안정적이고 신뢰할 수 있는 모델로 설계되었습니다.
하드웨어 요구 사항 : Dolly-v2-3b와 마찬가지로 3억 개의 매개변수 StableLM-Zepyr-3B는 고급 노트북, 데스크톱 또는 워크스테이션과 같이 중간 수준에서 높은 수준의 컴퓨팅 성능을 갖춘 로컬 장치에서 실행될 수 있습니다.

포옹하는 얼굴 링크: 안정LM-Zepyr-3B

데시LM-7B

모델 사이즈: 7억 개의 매개변수
상품 설명: DeciLM-7B는 다양한 자연어 처리 작업을 위한 범용 언어 모델입니다. 7억 개의 더 큰 매개변수 크기는 작은 모델에 비해 향상된 성능을 제공하면서도 로컬 배포에 충분히 컴팩트합니다.
하드웨어 요구 사항: DeciLM-7B를 로컬에서 실행하려면 사용자는 GPU 또는 TPU를 갖춘 고급 데스크톱이나 워크스테이션과 같이 보다 강력한 하드웨어를 갖춘 시스템에 액세스해야 합니다.

포옹하는 얼굴 링크: 데시LM-7B

미스트랄-7B-Instruct-v0.2

모델 사이즈: 7억 개의 매개변수
상품 설명: Mistral-7B-Instruct-v0.2는 복잡한 다단계 명령과 작업을 효과적으로 처리할 수 있는 명령 따르기 언어 모델입니다.
하드웨어 요구 사항: DeciLM-7B와 유사하게 Mistral-7B-Instruct-v0.2는 7억 개의 매개변수를 실행하려면 강력한 데스크탑 또는 워크스테이션과 같은 고급 로컬 하드웨어가 필요합니다.

포옹하는 얼굴 링크: 미스트랄-7B-Instruct-v0.2

오르카-2-7B

모델 사이즈: 7억 개의 매개변수
상품 설명: Orca-2-7B는 안전하고 진실되며 인간에 맞춰진 응답을 제공하는 오픈 소스 언어 모델입니다. 인간의 가치와 윤리에 부합하는 결과를 창출하는 것을 목표로 합니다.
하드웨어 요구 사항: 7억 개의 매개변수 Orca-2-7B가 효과적으로 작동하려면 고성능 데스크탑이나 워크스테이션과 같은 강력한 로컬 하드웨어가 필요합니다.

포옹하는 얼굴 링크: 오르카-2-7B

호박색

모델 사이즈: 7억 개의 매개변수
상품 설명: Amber는 도메인과 애플리케이션 전반에 걸쳐 다양한 자연어 처리 작업을 고성능으로 처리하도록 설계된 다중 작업 언어 모델입니다.
하드웨어 요구 사항: Amber의 7억 개 매개변수를 로컬에서 실행하려면 GPU 또는 TPU를 갖춘 강력한 데스크탑이나 워크스테이션과 같은 고급 하드웨어에 대한 액세스가 필요합니다.

포옹하는 얼굴 링크: 호박색

OpenHathi-7B-Hi-v0.1-Base

모델 사이즈: 7억 개의 매개변수
상품 설명: OpenHathi-7B-Hi-v0.1-Base는 힌디어에 대해 공개적으로 사용 가능한 가장 큰 모델 중 하나인 대규모 힌디어 언어 모델입니다. 힌디어 텍스트를 이해하고 생성할 수 있습니다.
하드웨어 요구 사항: 다른 7B 모델과 마찬가지로 OpenHathi-7B-Hi-v0.1-Base도 효과적으로 실행하려면 강력한 데스크탑이나 워크스테이션과 같은 고성능 로컬 하드웨어가 필요합니다.

포옹하는 얼굴 링크: OpenHathi-7B-Hi-v0.1-Base

SOLAR-10.7B-v1.0

모델 사이즈: 10.7억 개의 매개변수
상품 설명: SOLAR-10.7B-v1.0은 소비자 하드웨어에서 로컬로 실행할 수 있는 것의 한계를 뛰어넘는 대규모 일반 언어 모델입니다. 다양한 NLP 작업에 향상된 성능을 제공합니다.
하드웨어 요구 사항: SOLAR-10.7B-v1.0을 로컬로 배포하려면 사용자는 강력한 GPU 또는 다중 GPU 설정을 갖춘 고급 소비자 하드웨어에 액세스해야 합니다.

포옹하는 얼굴 링크: SOLAR-10.7B-v1.0

NexusRaven-V2-13B

모델 사이즈: 13억 개의 매개변수
상품 설명: NexusRaven-V2-13B는 다양한 도메인과 애플리케이션에 걸쳐 개방형 텍스트 생성에 초점을 맞춘 대규모 언어 모델입니다.
하드웨어 요구 사항: 13억 개의 매개변수가 있는 NexusRaven-V2-13B는 소비자 장치에서 로컬로 실행되기 위해 고급 워크스테이션 또는 다중 GPU 설정과 같은 매우 강력한 하드웨어가 필요합니다.

포옹하는 얼굴 링크: NexusRaven-V2-13B

이러한 소형 LLM은 상당한 이식성과 리소스 효율성 이점을 제공하지만 특정 복잡한 NLP 작업에서는 대규모 LLM과 동일한 수준의 성능을 달성하지 못할 수 있다는 점에 유의하는 것이 중요합니다. 그러나 최첨단 성능이 필요하지 않은 많은 응용 프로그램의 경우 이러한 작은 모델은 특히 계산 리소스가 제한된 로컬 장치에서 실행될 때 실용적이고 접근 가능한 솔루션이 될 수 있습니다.

결론

결론적으로, 귀하의 장치에서 로컬로 실행될 수 있는 소규모 언어 모델의 가용성은 AI 및 NLP. 이러한 모델은 성능, 효율성 및 접근성의 이상적인 조합을 제공하므로 클라우드 서비스나 강력한 데이터 센터에 의존하지 않고도 고급 자연어 처리 작업을 수행할 수 있습니다. 이러한 컴팩트 LLM을 실험하면서 노련한 개발자, 연구원, 취미생활자 등 프로젝트에서 혁신과 창의성을 위한 새로운 길을 열 수 있습니다. 그만큼 AI의 미래 더 이상 대규모 모델에만 국한되지 않습니다. 대신 이미 보유하고 있는 하드웨어의 잠재력을 극대화하는 것입니다. 작지만 강력한 모델이 여러분을 위해 무엇을 성취할 수 있는지 알아보세요!

이 기사가 통찰력이 있었기를 바랍니다. 기사와 관련하여 제안할 사항이 있으면 아래에 의견을 남겨주세요. 더 많은 기사를 보려면 다음을 참조하세요. 링크.

SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
PlatoData.Network 수직 생성 Ai. 자신에게 권한을 부여하십시오. 여기에서 액세스하십시오.
PlatoAiStream. 웹3 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
플라톤ESG. 탄소, 클린테크, 에너지, 환경, 태양광, 폐기물 관리. 여기에서 액세스하십시오.
PlatoHealth. 생명 공학 및 임상 시험 인텔리전스. 여기에서 액세스하십시오.
출처: https://www.analyticsvidhya.com/blog/2024/04/smallest-llms-that-you-can-run-on-local-devices/

생성 데이터 인텔리전스

로컬 장치에서 실행할 수 있는 15개 이상의 최소 LLM

개요

차례

소규모 LLM의 이점은 무엇입니까?

로컬 장치에서 실행할 수 있는 가장 작은 LLM

디스틸버트

타이니버트

모바일BERT

ALBERT

GPT-2 소형

데시코더-1B

파이-1.5

돌리-v2-3b

안정LM-Zepyr-3B

데시LM-7B

미스트랄-7B-Instruct-v0.2

오르카-2-7B

호박색

OpenHathi-7B-Hi-v0.1-Base

SOLAR-10.7B-v1.0

NexusRaven-V2-13B

결론

헌터x헌터: 넨x임팩트, 젠스루 공개

이번 주 Disney Dreamlight Valley “Thrills & Frills” 업데이트, 패치 노트 및 예고편

최신 인텔리전스

Avianca Group은 13분기에 XNUMX만 달러의 순이익을 기록했습니다.

KLM Royal Dutch Airlines는 토론토 FC와 다년간의 파트너십을 발표하여 팀의 공식 국제 항공사가 되었습니다.

커피와 PC 게임장이 완벽한 조화를 이루는 이 멋진 스칸디 나무 사우나 테마 빌드입니다.

확인해야 할 새로운 신속한 엔지니어링 리소스 3가지 – KDnuggets

캔디 크러쉬와 포켓몬 고에 교회 자금 40,000만 달러 이상을 지출한 혐의로 경찰에 의해 기소된 신부는 자신이...

Veed.io: 이 AI 도구는 비디오를 쉽게 편집하는 데 도움이 됩니다