Logotip Zephyrnet

Posodobitev Snorkel Flow ponuja popolnoma nov pristop k upravljanju podatkov podjetja

Datum:

Eden najpomembnejših stalnih izzivov za podjetja, ki razvijajo umetno inteligenco, je vključevanje ogromnih količin podatkov podjetja v svoje modele umetne inteligence.

Ti podatki so življenjska sila številnih aplikacij AI, vendar je njihovo upravljanje lahko zapleten in dolgotrajen proces. Snorkel Flow, nedavna posodobitev platforme Snorkel AI, želi poenostaviti ta postopek za podjetja, ki želijo izkoristiti Lama 3, zmogljiv model AI podjetja Meta AI, in Gemini AI, še en Googlov napredni model AI.

Zakaj je upravljanje podatkov podjetja ključnega pomena?

Podatki podjetij zajemajo široko paleto informacij, ki jih podjetja zbirajo med svojim vsakodnevnim poslovanjem. To lahko vključuje podatke o strankah, finančne evidence, rezultate marketinških kampanj, podatke senzorjev iz strojev in še veliko več. Učinkovito upravljanje teh podatkov je ključnega pomena iz več razlogov.

Prvič, podjetjem omogoča prepoznavanje trendov in vzorcev, ki bi jih sicer lahko spregledali. Na primer, z analizo zgodovine nakupov strank lahko podjetje odkrije, kateri izdelki se pogosto kupujejo skupaj, kar jim omogoča prilagajanje promocij in strategij promocijskega prikazovanja izdelkov.

Drugič, podatke podjetja je mogoče uporabiti za izboljšanje odločanja. Na primer, finančna institucija lahko analizira pretekle podatke o posojilih, da razvije natančnejše modele ocene tveganja. Končno so podatki podjetja bistveni za usposabljanje modelov AI. Ti modeli zahtevajo ogromne količine označenih podatkov za učenje in učinkovito izvajanje nalog.

Snorkel Flow upravljanje podatkov podjetja
Podatki podjetja so ključnega pomena za aplikacije umetne inteligence, saj omogočajo identifikacijo trendov, izboljšujejo odločanje in zagotavljajo označene podatke za usposabljanje modelov (Image kredit)

Vendar pa je lahko upravljanje teh podatkov velik izziv. Podatki podjetja se pogosto nahajajo v različnih formatih in na različnih lokacijah, kar otežuje dostop in integracijo. Tudi postopek označevanja podatkov za usposabljanje z umetno inteligenco je lahko drag in dolgotrajen.

Tukaj je Tok potapljanja z masko pride.

Ukrotiti poplavo podatkov

Snorkel Flow je posodobitev platforme Snorkel AI, zasnovana za poenostavitev integracije poslovnih podatkov z modeli AI, zlasti Llama 3 in Gemini AI. Snorkel uporablja tehniko, imenovano šibko označevanje, ki uporabnikom omogoča uporabo neoznačenih podatkov za namene usposabljanja. To se doseže z definiranjem hevristik ali »funkcij označevanja«, ki lahko samodejno dodelijo oznake podatkovnim točkam na podlagi posebnih meril.

Na primer, predstavljajte si podjetje, ki želi usposobiti model AI za prepoznavanje vstopnic za podporo strankam, ki zahtevajo nujno pozornost. Lahko bi ustvarili funkcijo označevanja za identifikacijo vstopnic, ki vsebujejo določene ključne besede ali besedne zveze, na primer »nujno« ali »kritično«. Čeprav te oznake morda niso popolne, so lahko še vedno koristne za usposabljanje modela AI.

Snorkel Flow gradi na tem konceptu z uvedbo poenostavljenega delovnega toka za upravljanje procesa označevanja podatkov. Uporabnikom omogoča definiranje funkcij označevanja, upravljanje virov podatkov in spremljanje kakovosti ustvarjenih oznak. To lahko znatno skrajša čas in vire, potrebne za pripravo podatkov podjetja za usposabljanje z umetno inteligenco.

Snorkel Flow upravljanje podatkov podjetja
Nova posodobitev Snorkel AI naslavlja izzive v podjetniških podatkih z uporabo šibkih tehnik označevanja, kar uporabnikom omogoča, da izkoristijo neoznačene podatke za usposabljanje z definiranjem funkcij označevanja na podlagi posebnih meril. (Image kredit)

Razširjene integracije LLM in virov podatkov

V blog post, je Snorkel AI podrobno razložil novosti, ki so jih prinesli v Snorkel Flow. Tu so značilnosti prenovljene dihalke Flow:

  • LLM integracije: Snorkel Flow zdaj podpira fino nastavitev ne le uveljavljenih modelov, ampak tudi Googlove družine Gemini in Metine Llame 3. To podjetjem razširja možnosti, da izberejo LLM, ki najbolj ustreza njihovim potrebam.
  • Integracije podatkovnih virov: Nove integracije z Databricks Unity Catalog, Vertex AI in Microsoft Azure Machine Learning poenostavijo dostop do podatkov za namene označevanja, urejanja in razvoja. Podjetja lahko izkoristijo svojo obstoječo podatkovno infrastrukturo znotraj Snorkel Flow.

Multimodalna podatkovna podpora (Beta)

  • Obdelava slik: Snorkel Flow uvaja funkcije programskega označevanja slik (trenutno v različici beta). To podjetjem omogoča, da poleg besedilnih podatkov izkoristijo slikovne podatke za usposabljanje LLM. Podjetja lahko to funkcijo uporabljajo za pridobivanje vpogledov iz vizualnih podatkov in njihovo integracijo s svojimi rešitvami AI.

Izboljšana varnost in dostopnost

  • Nadzor dostopa na podlagi vlog (RBAC): Ta funkcija omogoča skrbnikom natančen nadzor nad dostopom do podatkov znotraj Snorkel Flow. To zagotavlja zaščito občutljivih informacij z omejevanjem dostopa do določenih uporabnikov in virov podatkov.
    Izboljšana obdelava dokumentov:
  • Potek dela PDF, ki ga poganja Foundation Model (FM).: Snorkel Flow zdaj vključuje namenski uporabniški vmesnik s pozivi PDF za označevanje PDF-jev. To izkorišča napredne temeljne modele za poenostavitev postopka pridobivanja dragocenih vpogledov iz kompleksnih dokumentov.

Poenostavljena integracija LLM:

  • Izboljšan SDK: Nadgrajeni SDK omogoča lažjo integracijo z različnimi storitvami LLM po meri, kar podjetjem zagotavlja večjo prilagodljivost v procesu razvoja umetne inteligence.
  • Integracija Databricks: Brezhibna združljivost s katalogom Databricks Unity Catalog omogoča preprosto uvajanje modelov znotraj obstoječih delovnih tokov. Podobna integracija je na voljo z Vertex AI in Azure Machine Learning.

Poenostavljeno označevanje podatkov

  • Večopravilna opomba (predogled izdaje R2): Ta funkcija, ki je trenutno v predogledu, omogoča malim in srednjim podjetjem (strokovnjakom za zadeve), da dodajo opombe k podatkom za več nalog znotraj enega projekta. To izboljša učinkovitost s skrajšanjem časa za nastavitev projekta in racionalizacijo delovnih tokov.
Snorkel Flow upravljanje podatkov podjetja
Snorkel AI se zdaj integrira z zmogljivimi modeli LLM, kot sta Llama 3 iz Meta AI in Gemini AI iz GooglainImage kredit)

Integracija z Llama 3 in Gemini AI

Snorkel Flow se posebej integrira z Llama 3 in Gemini AI, dvema zmogljivima modeloma AI. Llama 3, ki ga je razvila Meta AI, je dejanski jezikovni model, usposobljen na ogromnem naboru podatkov besedila in kode. To mu omogoča razumevanje zapletenih poizvedb in odgovor nanje na informativen način. Po drugi strani pa je Gemini AI generativni jezikovni model, ki je sposoben ustvarjati različne kreativne besedilne formate, kot so pesmi, koda, scenariji, glasbena dela, e-pošta, pisma itd.

Z integracijo Snorkel Flow s temi modeli lahko podjetja izkoristijo moč umetne inteligence za pridobivanje vpogledov iz svojih poslovnih podatkov in avtomatizacijo različnih nalog. Llama 3 bi lahko na primer uporabili za analizo mnenj strank in prepoznavanje pogostih tem ali pritožb. Gemini AI bi medtem lahko uporabili za ustvarjanje kreativne marketinške kopije ali opisov izdelkov na podlagi obstoječih podatkov.

S poenostavitvijo postopka označevanja podatkov in združljivostjo z zmogljivimi modeli, kot sta Llama 3 in Gemini AI, ima Snorkel Flow potencial za odklepanje novih možnosti za podjetja, ki želijo izkoristiti moč AI.


Zasluga predstavljene slike: rawpixel.com/Freepik

spot_img

Najnovejša inteligenca

spot_img