Obraz wygenerowany za pomocą Leonardo.Ai
W tym rozległym krajobrazie sztucznej inteligencji pojawiła się rewolucyjna siła w postaci modeli wielkojęzykowych (LLMS). To nie tylko modne hasło, ale nasza przyszłość. Ich zdolność do rozumienia i generowania tekstu podobnego do ludzkiego sprawiła, że znaleźli się w centrum uwagi i obecnie stało się to jednym z najgorętszych obszarów badań. Wyobraź sobie chatbota, który może odpowiadać Ci tak, jakbyś rozmawiał ze znajomymi, lub wyobraź sobie system generowania treści, w którym trudno będzie rozróżnić, czy jest napisany przez człowieka, czy przez sztuczną inteligencję. Jeśli intrygują Cię takie rzeczy i chcesz głębiej zagłębić się w serce LLM, to jesteś we właściwym miejscu. Zebrałem obszerną listę zasobów, począwszy od artykułów informacyjnych, kursów i repozytoriów GitHub po odpowiednie artykuły badawcze, które mogą pomóc Ci lepiej je zrozumieć. Bez dalszej zwłoki rozpocznijmy naszą niesamowitą podróż w świecie LLM.
Image by Polina Tankilewicz na Pexelsie
1. Specjalizacja Deep Learning – Coursera
Połączyć: Specjalizacja Deep Learning
Opis: Głębokie uczenie się stanowi podstawę LLM. Ten kompleksowy kurs prowadzony przez Andrew Ng obejmuje podstawowe tematy sieci neuronowych, podstawy widzenia komputerowego i przetwarzania języka naturalnego oraz sposoby strukturyzowania projektów uczenia maszynowego.
2. Stanford CS224N: NLP z głębokim uczeniem się – YouTube
Połączyć: Stanford CS224N: NLP z głębokim uczeniem się
Opis: Jest to kopalnia wiedzy i zapewnia dokładne wprowadzenie do najnowocześniejszych badań w zakresie głębokiego uczenia się w NLP.
3. Kurs HuggingFace Transformers – HuggingFace
Połączyć: Kurs HuggingFace Transformers
Opis: Ten kurs uczy NLP przy użyciu bibliotek z ekosystemu HuggingFace. Obejmuje wewnętrzne działanie i wykorzystanie następujących bibliotek z HuggingFace:
- Transformatory
- Tokenizatory
- Zbiory danych
- Przyśpieszyć
4. Szybka inżynieria ChatGPT dla programistów – Coursera
Połączyć: Szybki kurs inżynieryjny ChatGPT
Opis: ChatGPT to popularny LLM i ten kurs udostępnia najlepsze praktyki i podstawowe zasady pisania skutecznych podpowiedzi w celu lepszego generowania odpowiedzi.
Obraz wygenerowany za pomocą Leonardo.Ai
1. Uniwersytet LLM – Cohere
Połączyć: Uniwersytet LLM
Opis: Cohere oferuje specjalistyczny kurs pozwalający opanować LLM. Ich sekwencyjna ścieżka, która szczegółowo omawia teoretyczne aspekty NLP, LLM i ich architekturę, jest skierowana do początkujących. Ich niesekwencyjna ścieżka jest przeznaczona dla doświadczonych osób zainteresowanych bardziej praktycznymi zastosowaniami i przypadkami użycia tych potężnych modeli, a nie ich wewnętrznym działaniem.
2. Stanford CS324: Modele wielkojęzyczne – witryna Stanford
Połączyć: Stanford CS324: Modele wielkojęzyczne
Opis: Ten kurs pozwala głębiej poznać zawiłości tych modeli. Poznasz podstawy, teorię, etykę i praktyczne aspekty tych modeli, zdobywając jednocześnie praktyczne doświadczenie.
3. Princeton COS597G: Zrozumienie modeli dużych języków – witryna Princeton
Połączyć: Zrozumienie modeli dużych języków
Opis: Jest to kurs na poziomie magisterskim oferujący kompleksowy program nauczania, co czyni go doskonałym wyborem do pogłębionej nauki. Poznasz podstawy techniczne, możliwości i ograniczenia modeli, takich jak modele BERT, GPT, T5, modele złożone z ekspertów, modele oparte na wyszukiwaniu itp.
4. ETH Zurich: Modele dużego języka (LLM) – RycoLab
Połączyć: ETH Zurych: Modele wielkojęzykowe
Opis: Ten nowo zaprojektowany kurs oferuje wszechstronną eksplorację LLM. Zagłęb się w podstawy probabilistyczne, modelowanie sieci neuronowych, procesy szkoleniowe, techniki skalowania i krytyczne dyskusje na temat bezpieczeństwa i potencjalnych nadużyć.
5. Full Stack LLM Bootcamp – Full Stack
Połączyć: Obóz szkoleniowy Full Stack LLM
Opis: Obóz startowy Full Stack LLM to kurs odpowiedni dla branży, który obejmuje takie tematy, jak techniki szybkiego projektowania, podstawy LLM, strategie wdrażania i projekt interfejsu użytkownika, dzięki czemu uczestnicy są dobrze przygotowani do tworzenia i wdrażania aplikacji LLM.
6. Dostrajanie dużych modeli językowych – Coursera
Połączyć: Dostrajanie dużych modeli językowych
Opis: Fine Tuning to technika, która pozwala dostosować LLM do konkretnych potrzeb. Po ukończeniu tego kursu zrozumiesz, kiedy zastosować dostrajanie, przygotowanie danych do dostrajania oraz jak szkolić LLM na nowych danych i oceniać jego wydajność.
Obraz wygenerowany za pomocą Leonardo.Ai
1. Co robi ChatGPT… i dlaczego to działa? – Stevena Wolframa
Połączyć: Co robi ChatGPT… i dlaczego to działa?
Opis: Ta krótka książka została napisana przez Stevena Wolframa, znanego naukowca. Omawia podstawowe aspekty ChatGPT, jego pochodzenie w sieciach neuronowych oraz postępy w dziedzinie transformatorów, mechanizmów uwagi i przetwarzania języka naturalnego. Jest to doskonała lektura dla osób zainteresowanych odkrywaniem możliwości i ograniczeń LLM.
2. Zrozumienie modeli wielkojęzykowych: transformacyjna lista lektur – Sebastian Raschka
Połączyć: Zrozumienie modeli dużych języków: transformacyjna lista lektur
Opis: Zawiera zbiór ważnych artykułów naukowych i chronologiczną listę lektur, począwszy od wczesnych artykułów na temat rekurencyjnych sieci neuronowych (RNN) po wpływowy model BERT i nie tylko. Jest to nieocenione źródło informacji dla badaczy i praktyków umożliwiające badanie ewolucji NLP i LLM.
3. Seria artykułów: Modele wielkojęzykowe – Jay Alammar
Połączyć: Seria artykułów: Modele wielkojęzykowe
Opis: Blogi Jaya Alamara są skarbnicą wiedzy dla każdego, kto studiuje duże modele językowe (LLM) i transformatory. Jego blogi wyróżniają się unikalnym połączeniem wizualizacji, intuicyjnych wyjaśnień i wszechstronnego ujęcia tematu.
4. Budowanie aplikacji LLM na potrzeby produkcji – Chip Huyen
Połączyć: Tworzenie aplikacji LLM dla produkcji
Opis: W tym artykule omówiono wyzwania związane z produkcją LLM. Oferuje wgląd w możliwości komponowania zadań i prezentuje obiecujące przypadki użycia. Każdy, kto interesuje się praktycznymi LLM, uzna je za naprawdę cenne.
Image by RealToughCandy.com na Pexelsie
1. Awesome-LLM ( 9 tys. ⭐ )
Połączyć: Niesamowite-LLM
Opis: Jest to wyselekcjonowany zbiór artykułów, frameworków, narzędzi, kursów, samouczków i zasobów skupiających się na dużych modelach językowych (LLM), ze szczególnym naciskiem na ChatGPT.
2. LLMsPracticalGuide ( 6.9 tys. ⭐ )
Połączyć: Praktyczne przewodniki po modelach wielkojęzykowych
Opis: Pomaga praktykom poruszać się po ekspansywnym krajobrazie LLM. Opiera się on na artykule ankietowym zatytułowanym: Wykorzystanie mocy LLM w praktyce: ankieta na temat ChatGPT i nie tylko i to blog.
3. LLMSurvey ( 6.1 tys. ⭐ )
Połączyć: LLMSurvey
Opis: Jest to zbiór artykułów i materiałów ankietowych opartych na artykule zatytułowanym: Przegląd dużych modeli językowych. Zawiera także ilustrację ewolucji technicznej modeli serii GPT, a także wykres ewolucji prac badawczych przeprowadzonych na LLaMA.
4. Niesamowity wykres-LLM ( 637 ⭐ )
Połączyć: Niesamowity wykres-LLM
Opis: Jest to cenne źródło dla osób zainteresowanych skrzyżowaniem technik opartych na grafach z LLM. zapewnia zbiór artykułów naukowych, zbiorów danych, testów porównawczych, ankiet i narzędzi, które zagłębiają się w tę wschodzącą dziedzinę.
5. Niesamowity Langchain ( 5.4 tys. ⭐ )
Połączyć: niesamowite-langchain
Opis: LangChain to szybka i wydajna platforma dla projektów LLM, a to repozytorium jest centrum śledzenia inicjatyw i projektów związanych z ekosystemem LangChain.
- "Pełna ankieta na temat ChatGPT w erze AIGC” – To świetny punkt wyjścia dla początkujących w LLM. Kompleksowo omawia podstawową technologię, aplikacje i wyzwania ChatGPT.
- "Przegląd dużych modeli językowych” – Obejmuje najnowsze postępy w LLM, szczególnie w czterech głównych aspektach: szkolenia wstępnego, strojenia adaptacyjnego, wykorzystania i oceny zdolności.
- "Wyzwania i zastosowania dużych modeli językowych” – Omawia wyzwania związane z LLM i skuteczne obszary zastosowań LLM.
- "Uwaga jest wszystkim, czego potrzebujesz” – Transformatory służą jako kamień węgielny dla GPT i innych LLM, a ten artykuł przedstawia architekturę Transformerów.
- "Opisany Transformator” – Zasób z Uniwersytetu Harvarda, który zawiera szczegółowe i opatrzone komentarzami wyjaśnienie architektury Transformera, która jest podstawą wielu LLM.
- "Ilustrowany Transformator” – Wizualny przewodnik, który pomaga dogłębnie zrozumieć architekturę Transformera, czyniąc złożone koncepcje bardziej przystępnymi.
- "BERT: Wstępne szkolenie z głębokich transformatorów dwukierunkowych do zrozumienia języka” – W tym artykule przedstawiono BERT, bardzo wpływową szkołę LLM, która wyznacza nowe standardy dla wielu zadań związanych z przetwarzaniem języka naturalnego (NLP).
W tym artykule przygotowałem obszerną listę zasobów niezbędnych do opanowania dużych modeli językowych (LLM). Jednakże uczenie się jest procesem dynamicznym, a jego sercem jest dzielenie się wiedzą. Jeśli masz na myśli dodatkowe zasoby, które Twoim zdaniem powinny znaleźć się na tej obszernej liście, nie wahaj się udostępnić ich w sekcji komentarzy. Twój wkład może być nieoceniony dla innych na ich drodze edukacyjnej, tworząc interaktywną przestrzeń współpracy i wzbogacania wiedzy.
Kanwal Mehreen jest początkującym programistą, żywo zainteresowanym nauką o danych i zastosowaniami sztucznej inteligencji w medycynie. Kanwal został wybrany jako Google Generation Scholar 2022 dla regionu APAC. Kanwal uwielbia dzielić się wiedzą techniczną, pisząc artykuły na popularne tematy, i pasjonuje się ulepszaniem reprezentacji kobiet w branży technologicznej.
- Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
- PlatoData.Network Pionowe generatywne AI. Wzmocnij się. Dostęp tutaj.
- PlatoAiStream. Inteligencja Web3. Wiedza wzmocniona. Dostęp tutaj.
- PlatonESG. Węgiel Czysta technologia, Energia, Środowisko, Słoneczny, Gospodarowanie odpadami. Dostęp tutaj.
- Platon Zdrowie. Inteligencja w zakresie biotechnologii i badań klinicznych. Dostęp tutaj.
- Źródło: https://www.kdnuggets.com/a-comprehensive-list-of-resources-to-master-large-language-models?utm_source=rss&utm_medium=rss&utm_campaign=a-comprehensive-list-of-resources-to-master-large-language-models