Yli 15 pienintä LLM:tä, joita voit käyttää paikallisilla laitteilla

esittely

Kuvittele, että hyödynnät edistyneiden kielimallien tehoa suoraan henkilökohtaisella tietokoneellasi tai mobiililaitteellasi ilman, että sinun tarvitsee turvautua pilvipalveluihin tai tehokkaisiin palvelimiin. Kuulostaa uskomattomalta, eikö? No, nämä pienet kielimallit tekevät tästä unelmasta totta. NLP:ssä olemme havainneet valtavien kielimallien ilmaantumista, jotka omaksuvat ja luovat tekstiä aivan kuten ihminen. Vaikka tulokset ovat usein merkittäviä, laskentavaatimukset ovat yhtä suuret. Tämän seurauksena niitä on vaikea käyttää käsittelykeskuksen ulkopuolella. Mutta se muuttuu nopeasti! Hyvä uutinen on, että tutkijat ja insinöörit ovat vuodattaneet sydämensä tuottaakseen pieniä LLM:itä, jotka riittävät toimimaan paikallisilla laitteillasi ja joilla on riittävästi tehoa mihin tahansa hyödylliseen tehtävään.

Tässä artikkelissa tutkimme pienimpiä ja mahtavimpia kielimalleja, joita voit käyttää paikallisesti oman laitteen rauhassa. Nämä kompaktit ihmeet löytävät täydellisen tasapainon suorituskyvyn ja resurssitehokkuuden välillä avaten mahdollisuuksia niin kehittäjille, tutkijoille kuin harrastajillekin.

Sisällysluettelo

Mitkä ovat pienten LLM-yritysten edut?

Tässä on joitain tärkeimpiä etuja pienten LLM:ien (Large Language Models) käyttämisestä suurempiin vastineisiinsa verrattuna:

Pienemmät laitteistovaatimukset: Pienillä LLM:illä on huomattavasti vähemmän parametreja ja ne vaativat vähemmän laskentatehoa, joten ne sopivat ihanteellisesti käytettäviksi laitteissa, joilla on rajalliset laitteistoresurssit, kuten kannettavissa tietokoneissa, älypuhelimissa ja sulautetuissa järjestelmissä. Tämä tekee niistä helpommin saavutettavia ja demokratisoi LLM:ien avulla laajemman joukon käyttäjiä ja sovelluksia.
Nopeampi päättely: Pienemmillä parametreilla ja pienemmillä mallikooilla pienet LLM:t voivat tehdä nopeampia päätelmiä, mikä tarkoittaa nopeampia vasteaikoja ja pienempää latenssia. Tämä on erityisen tärkeää reaaliaikaisissa sovelluksissa, kuten keskusteleva AI, jossa reagointikyky on ratkaisevan tärkeää.
Pienempi energiankulutus: Pienemmät mallit kuluttavat vähemmän energiaa, mikä tekee niistä energiatehokkaampia ja ympäristöystävällisempiä. Tämä on erityisen hyödyllistä akkukäyttöisissä laitteissa, joissa energiatehokkuus on kriittistä.
Helpompi käyttöönotto ja siirrettävyys: Pienet LLM:t on helpompi ottaa käyttöön ja jakaa niiden kompaktin koon ansiosta. Ne voidaan integroida erilaisiin sovelluksiin ja järjestelmiin ilman erikoislaitteistoa tai laajamittaista infrastruktuuria. Tämä siirrettävyys mahdollistaa laajemman käyttöönoton ja mahdollistaa hajautetumpien ja reunapohjaisten sovellusten kehittämisen.
Yksityisyys ja tietosuoja: Käyttämällä pieniä LLM-yrityksiä paikallisesti, käyttäjät voivat hallita paremmin tietojaan ja vähentää tarvetta lähettää arkaluonteisia tietoja etäpalvelimille tai pilvialustoille. Tämä voi auttaa ratkaisemaan tietosuojaongelmia ja noudattamaan tietosuojamääräyksiä.
Kustannustehokkuus: Pienemmät mallit vaativat yleensä vähemmän laskentaresursseja, mikä voi johtaa alhaisempiin käyttökustannuksiin, erityisesti käytettäessä pilvialustoja tai vuokrattuja laitteita. Tämä kustannustehokkuus voi tehdä OTK teknologia on helpommin saatavilla pienempien organisaatioiden ja yksittäisten kehittäjien käyttöön.
Erikoissovellukset: Vaikka pienemmät mallit eivät välttämättä saavuta samaa suorituskykyä kuin suuret mallit yleisissä tehtävissä, niitä voidaan hienosäätää ja optimoida tiettyjä sovelluksia tai verkkotunnuksia varten, mikä saattaa ylittää suuremmat mallit näillä erikoisalueilla.

On tärkeää huomata, että pienten LLM-yritysten edut sisältävät kompromisseja suorituskyvyn ja ominaisuuksien suhteen suurempiin kollegoihinsa verrattuna. Pienten LLM-yritysten edut resurssitehokkuudessa, siirrettävyydessä ja kustannustehokkuudessa voivat kuitenkin tehdä niistä vakuuttavan valinnan moniin sovelluksiin, joissa huippuluokan suorituskyky ei ole kriittinen vaatimus.

Pienimmät LLM:t, joita voit käyttää paikallisilla laitteilla

DistilBERT

Mallin koko: Perusversiossa on noin 66 miljoonaa parametria, huomattavasti vähemmän kuin BERTin 110 miljoonaa parametria.
Kuvaus: DistilBERT on tislattu versio BERT-mallista, joka on suunniteltu pienemmäksi ja nopeammaksi säilyttäen samalla suurimman osan BERT:n suorituskyvystä. Se käyttää tiedon tislaustekniikoita suuren BERT-mallin pakkaamiseen pienempään versioon, mikä tekee siitä tehokkaamman ja helpomman käyttöönoton paikallisissa laitteissa.
Laitteistovaatimukset: DistilBERT:n pieni koko mahdollistaa sen käytön useissa paikallisissa laitteissa, kuten kannettavissa tietokoneissa, pöytätietokoneissa ja jopa huippuluokan mobiililaitteissa.

Halaavien kasvojen linkki: DistilBERT

Pieni BERT

Mallin koko: TinyBERT-4:llä on noin 14 miljoonaa parametria, kun taas TinyBERT-6:lla on noin 67 miljoonaa parametria.
Kuvaus: TinyBERT on entistä kompaktimpi versio BERT:stä, jonka ovat kehittäneet Carnegie Mellon Universityn ja Google Brainin tutkijat. Se käyttää kehittyneitä tekniikoita, kuten kerroskohtaista ja tarkkaavaista tislaamista, saavuttaakseen merkittävän mallin pakkaamisen samalla kun se säilyttää kilpailukykyisen suorituskyvyn erilaisissa NLP-tehtävissä.
Laitteistovaatimukset: TinyBERT:n äärimmäisen pieni koko mahdollistaa sen käytön useissa paikallisissa laitteissa, mukaan lukien halvemmat kannettavat tietokoneet, sulautetut järjestelmät ja mobiililaitteet.

Halaavien kasvojen linkki: Pieni BERT

MatkapuhelinBERT

Mallin koko: MobileBERTillä on noin 25 miljoonaa parametria, huomattavasti pienempi kuin alkuperäinen BERT-kanta.
Kuvaus: MobileBERT on kompakti ja tehokas BERT-malli mobiili- ja reunalaitteisiin. Se käyttää tekniikoita, kuten tiedon tislaamista ja kvantisointia mallin koon pienentämiseen säilyttäen samalla korkean suorituskyvyn monissa NLP-tehtävissä.
Laitteistovaatimukset: Kuten nimestä voi päätellä, MobileBERT on optimoitu toimimaan mobiililaitteissa ja muissa resurssirajoitteisissa ympäristöissä.

Halaavien kasvojen linkki: MatkapuhelinBERT

ALBERT

Mallin koko: Se vaihtelee kokoonpanon mukaan; Yksi pienimmistä on ALBERT-jalusta, jossa on 12 kerrosta ja 12 huomiopäätä.
Kuvaus: ALBERT (A Lite BERT) on suunniteltu tehokkaaseen muistin käyttöön ja nopeampaan päättelyyn. Siinä on kerrosten välinen parametrien jakamismekanismi ja pienempi upotuskoko. Se on tehokas erilaisiin NLP-tehtäviin, vaikka se on kevyempi kuin alkuperäinen BERT.
Laitteistovaatimukset: ALBERTin tehokkaan suunnittelun ansiosta se toimii useissa paikallisissa laitteissa kohtuullisella prosessointiteholla.

Halaavien kasvojen linkki: ALBERT

GPT-2 Pieni

Mallin koko: GPT-2 Smallilla on noin 117 miljoonaa parametria, huomattavasti pienempiä kuin suuremmissa GPT-2-malleissa.
Kuvaus: GPT-2 Small on OpenAI:n kehittämä suositun GPT-2 (Generative Pre-trained Transformer 2) -mallin pienempi versio. Vaikka GPT-2 Small ei olekaan niin kompakti kuin jotkut muut mallit, se on silti suhteellisen kevyt ja sitä voidaan käyttää esimerkiksi tekstin luomiseen, yhteenvetoon ja kielen mallintamiseen.
Laitteistovaatimukset: GPT-2 Smallia voidaan käyttää henkilökohtaisissa tietokoneissa, joissa on kohtalaiset laitteistovaatimukset, kuten keskitason kannettavissa tietokoneissa tai pöytätietokoneissa.

Halaavien kasvojen linkki: GPT-2 Pieni

DeciCoder-1B

Mallin koko: 1 miljardi parametria
Kuvaus: DeciCoder-1B on kielimalli, joka keskittyy koodin luomiseen ja ymmärtämiseen. Se voi auttaa koodaustehtävissä, kuten koodin viimeistelyssä, ohjelmointikielten välisessä kääntämisessä ja koodin selittämisessä. Se on koulutettu laajalle lähdekoodin ja luonnollisen kielen kuvauksille.
Laitteistovaatimukset: Suhteellisen pienellä 1 miljardin parametrikoonsa ansiosta DeciCoder-1B voi toimia useissa paikallisissa laitteissa, kuten kannettavissa tietokoneissa, pöytätietokoneissa ja mahdollisesti huippuluokan mobiililaitteissa tai yksilevyisissä tietokoneissa.

Halaavien kasvojen linkki: DeciCoder – 1B

Phi-1.5

Mallin koko: 1.5 miljardi parametria
Kuvaus: Phi-1.5 on yleiskäyttöinen kielimalli, joka pystyy tuottamaan tekstiä, vastaamaan kysymyksiin ja ymmärtämään luonnollista kieltä ja muita NLP-tehtäviä. Se on suunniteltu mukautumaan eri aloille ja tehtäviin hienosäädön tai kehotteen avulla.
Laitteistovaatimukset: Phi-1.5:n kompakti 1.5 miljardin parametrikoko mahdollistaa sen käytön paikallisissa laitteissa, joissa on kohtalaiset laskentaresurssit, kuten kannettavissa tietokoneissa, pöytätietokoneissa ja mahdollisesti korkealaatuisissa mobiililaitteissa tai yhden levyn tietokoneissa.

Halaavien kasvojen linkki: Phi-1.5

Dolly-v2-3b

Mallin koko: 3 miljardi parametria
Kuvaus: Dolly-v2-3b on ohjeita seuraava kielimalli, joka ymmärtää ja suorittaa erinomaisesti yksityiskohtaiset, monivaiheiset kehotteet ja ohjeet eri tehtävien aikana.
Laitteistovaatimukset: Dolly-v3-2b vaatii 3 miljardilla parametrilla paikallisia laitteita, joiden laskentateho on kohtalainen tai korkea, kuten huippuluokan kannettavat tietokoneet, pöytäkoneet tai työasemat.

Halaavien kasvojen linkki: Dolly-v2-3b

StableLM-Zephyr-3B

Mallin koko: 3 miljardi parametria
Kuvaus: StableLM-Zephyr-3B on kielimalli, joka on koulutettu antamaan luotettavia ja totuudenmukaisia vastauksia. Se on suunniteltu vakaaksi ja luotettavaksi malliksi erilaisiin luonnollisen kielen käsittelytehtäviin.
Laitteistovaatimukset: Kuten Dolly-v2-3b, 3 miljardia parametria StableLM-Zephyr-3B voi toimia paikallisissa laitteissa, joissa on kohtalainen tai korkea laskentakyky, kuten huippuluokan kannettavissa tietokoneissa, pöytätietokoneissa tai työasemissa.

Halaavien kasvojen linkki: StableLM-Zephyr-3B

DeciLM-7B

Mallin koko: 7 miljardi parametria
Kuvaus: DeciLM-7B on yleiskäyttöinen kielimalli erilaisiin luonnollisen kielen käsittelytehtäviin. Sen suurempi 7 miljardin parametrin koko tarjoaa paremman suorituskyvyn pienempiin malleihin verrattuna, mutta on silti riittävän kompakti paikallista käyttöä varten.
Laitteistovaatimukset: Käyttääkseen DeciLM-7B:tä paikallisesti, käyttäjät tarvitsevat pääsyn järjestelmiin, joissa on tehokkaampia laitteistoja, kuten huippuluokan pöytätietokoneita tai työasemia, joissa on kykenevät GPU- tai TPU:t.

Halaavien kasvojen linkki: DeciLM-7B

Mistral-7B-Instruct-v0.2

Mallin koko: 7 miljardi parametria
Kuvaus: Mistral-7B-Instruct-v0.2 on käskyjä seuraava kielimalli, joka pystyy käsittelemään tehokkaasti monimutkaisia monivaiheisia ohjeita ja tehtäviä.
Laitteistovaatimukset: Kuten DeciLM-7B, Mistral-7B-Instruct-v0.2 vaatii huippuluokan paikallista laitteistoa, kuten tehokkaita pöytäkoneita tai työasemia, suorittaakseen 7 miljardia parametria.

Halaavien kasvojen linkki: Mistral-7B-Instruct-v0.2

Orca-2-7B

Mallin koko: 7 miljardi parametria
Kuvaus: Orca-2-7B on avoimen lähdekoodin kielimalli, joka tarjoaa turvallisia, totuudenmukaisia ja ihmisläheisiä vastauksia. Sen tavoitteena on tuottaa inhimillisten arvojen ja etiikan mukaisia tuotoksia.
Laitteistovaatimukset: 7 miljardin parametrin Orca-2-7B edellyttää tehokasta paikallista laitteistoa, kuten suorituskykyisiä pöytäkoneita tai työasemia, toimiakseen tehokkaasti.

Halaavien kasvojen linkki: Orca-2-7B

Keltainen

Mallin koko: 7 miljardi parametria
Kuvaus: Amber on usean tehtävän kielimalli, joka on suunniteltu käsittelemään erilaisia luonnollisen kielen prosessointitehtäviä tehokkaasti eri aloilla ja sovelluksissa.
Laitteistovaatimukset: Amberin 7 miljardin parametrin käyttäminen paikallisesti vaatii pääsyn korkealuokkaisiin laitteistoihin, kuten tehokkaisiin pöytäkoneisiin tai työasemiin, joissa on kyvykkäät GPU- tai TPU:t.

Halaavien kasvojen linkki: Keltainen

OpenHathi-7B-Hi-v0.1-Base

Mallin koko: 7 miljardi parametria
Kuvaus: OpenHathi-7B-Hi-v0.1-Base on suuri hindin kielen malli, yksi suurimmista avoimesti saatavilla olevista hindin kielen malleista. Se voi ymmärtää ja luoda hinditekstiä.
Laitteistovaatimukset: Kuten muutkin 7B-mallit, OpenHathi-7B-Hi-v0.1-Base vaatii tehokkaan paikallisen laitteiston, kuten tehokkaita pöytäkoneita tai työasemia, toimiakseen tehokkaasti.

Halaavien kasvojen linkki: OpenHathi-7B-Hi-v0.1-Base

SOLAR-10.7B-v1.0

Mallin koko: 10.7 miljardi parametria
Kuvaus: SOLAR-10.7B-v1.0 on suuri yleinen kielimalli, joka ylittää rajoja sille, mitä voidaan käyttää paikallisesti kuluttajalaitteistolla. Se tarjoaa parannetun suorituskyvyn erilaisiin NLP-tehtäviin.
Laitteistovaatimukset: Käyttääkseen SOLAR-10.7B-v1.0:aa paikallisesti, käyttäjät tarvitsevat pääsyn korkealuokkaisiin kuluttajalaitteistoihin, joissa on tehokkaat GPU:t tai usean näytönohjaimen asetukset.

Halaavien kasvojen linkki: SOLAR-10.7B-v1.0

NexusRaven-V2-13B

Mallin koko: 13 miljardi parametria
Kuvaus: NexusRaven-V2-13B on suuri kielimalli, joka keskittyy avoimeen tekstin luomiseen eri aloilla ja sovelluksissa.
Laitteistovaatimukset: 13 miljardin parametrin NexusRaven-V2-13B vaatii erittäin tehokkaan laitteiston, kuten huippuluokan työasemien tai usean grafiikkasuorittimen, toimiakseen paikallisesti kuluttajalaitteissa.

Halaavien kasvojen linkki: NexusRaven-V2-13B

Vaikka nämä kompaktit LLM:t tarjoavat merkittäviä siirrettävyyden ja resurssitehokkuuden etuja, on tärkeää huomata, että ne eivät välttämättä saavuta samaa suoritustasoa kuin suuremmat kollegansa tietyissä monimutkaisissa NLP-tehtävissä. Kuitenkin monille sovelluksille, jotka eivät vaadi huippuluokan suorituskykyä, nämä pienemmät mallit voivat olla käytännöllinen ja helppokäyttöinen ratkaisu, erityisesti käytettäessä paikallisia laitteita, joilla on rajoitetut laskentaresurssit.

Yhteenveto

Yhteenvetona voidaan todeta, että pienten kielimallien saatavuus, jotka voivat toimia paikallisesti laitteillasi, on merkittävä askel eteenpäin tekoälyssä ja NLP. Nämä mallit tarjoavat ihanteellisen yhdistelmän tehoa, tehokkuutta ja saavutettavuutta, minkä ansiosta voit suorittaa kehittyneitä luonnollisen kielen käsittelytehtäviä ilman, että sinun tarvitsee luottaa pilvipalveluihin tai tehokkaisiin tietokeskuksiin. Kun kokeilet näitä kompakteja LLM:itä, avaat uusia väyliä innovaatioille ja luovuudelle projekteissasi, olitpa sitten kokenut kehittäjä, tutkija tai harrastaja. The AI:n tulevaisuus ei rajoitu enää massiivisiin malleihin; sen sijaan kyse on jo olemassa olevan laitteiston potentiaalin maksimoinnista. Ota selvää, mitä nämä pienet mutta mahtavat mallit voivat saavuttaa puolestasi!

Toivottavasti pidit tämän artikkelin ymmärtäväisenä. Jos sinulla on ehdotuksia artikkeliin liittyen, kommentoi alle. Lisää artikkeleita löydät tästä linkkiä.

SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
PlatoData.Network Vertical Generatiivinen Ai. Vahvista itseäsi. Pääsy tästä.
PlatoAiStream. Web3 Intelligence. Tietoa laajennettu. Pääsy tästä.
PlatoESG. hiili, CleanTech, energia, ympäristö, Aurinko, Jätehuolto. Pääsy tästä.
PlatonHealth. Biotekniikan ja kliinisten kokeiden älykkyys. Pääsy tästä.
Lähde: https://www.analyticsvidhya.com/blog/2024/04/smallest-llms-that-you-can-run-on-local-devices/

Generatiivinen tiedustelu