شعار زيفيرنت

مجموعة أوراق الغش في KDnuggets 2023 – KDnuggets

التاريخ:

مجموعة أوراق الغش في KDnuggets 2023
الصورة التي أنشأها المؤلف باستخدام DALL•E 3
 

هل تبحث عن مراجع سريعة مفيدة لمجموعة متنوعة من المواضيع المتعلقة بعلوم البيانات والتعلم الآلي وبرمجة بايثون وهندسة البيانات والذكاء الاصطناعي؟ هل ترغب في البقاء على اطلاع مع تعزيز مهاراتك في هذه المجالات؟ تهدف مجموعة أوراق الغش التي أنشأتها KDnuggets على مدار عام 2023 إلى مساعدتك على تحقيق هذه الأهداف.

ستجد أوراق الغش هذه بمثابة موارد قيمة لإبقائك في طليعة بعض الأدوات والتقنيات والمفاهيم الأكثر فائدة وذات صلة لهذا العام. سواء كنت عالم بيانات متمرسًا، أو من عشاق التعلم الآلي الناشئ، أو متخصصًا في هندسة البيانات، فإن هذه الموارد المصممة بشكل احترافي ستوفر بلا شك نقاطًا ذات أهمية كبيرة.

بدءًا من التطبيقات العملية لـ ChatGPT في علوم البيانات وحتى إتقان أدوات البيانات القيمة مثل GitHub CLI وPlotly Express وcuDF، تم تصميم كل ورقة غش لتقديم رؤى موجزة وقابلة للتنفيذ. تعلم التعلم الآلي مع Streamlit. اكتشف تنظيف البيانات باستخدام Python. انطلق إلى عالم الذكاء الاصطناعي باستخدام ملحقات Chrome المفيدة وأدوات الذكاء الاصطناعي الإبداعية. اعتبر هذه المجموعة بوابتك لإتقان (وتعزيزها بمرور الوقت) المفاهيم والأدوات المعقدة، مما يضمن لك البقاء في المقدمة في هذا المجال.

لذا، تابع واطلع على أوراق الغش التالية من KDnuggets واطلع على الأفكار المتوفرة.

 
ورقة الغش في ChatGPT لعلوم البيانات

يهدف ChatGPT (وبالفعل، أقوى وأحدث إصدارات GPT3) إلى مساعدة (هذا صحيح... مساعدة!) الأشخاص الذين يقررون استخدامه على هذا النحو، وبقليل من المساعدة من أصدقائك في KDnuggets، ستتمكن من: اصقل مهاراتك الهندسية السريعة للقيام بأشياء مفيدة مثل إنشاء التعليمات البرمجية والمساعدة في عملية البحث وتحليل البيانات.

 
GitHub CLI لورقة الغش في علوم البيانات

ليس من المستغرب أن GitHub CLI هي أداة GitHub التي تسمح بالتفاعل مع منصة GitHub مع واجهة سطر الأوامر. سيسمح لك إتقان الأوامر الأكثر استخدامًا بأن تصبح منتِجًا لفريق التطوير ، سواء كان ذلك فريق تطوير تطبيقات الويب ، أو بشكل أكثر تحديدًا لأغراضنا ، أو علم البيانات ، أو هندسة البيانات ، أو فريق هندسة التعلم الآلي.

 
Plotly Express للحصول على ورقة غش لتصور البيانات

تتناول ورقة الغش أولاً كيفية البدء، مثل تثبيت المكتبة وصياغتها الأساسية. بعد ذلك، تغطي الموارد إنشاء أنواع مخططات شائعة باستخدام Plotly Express، بما في ذلك: مخطط مبعثر، رسم بياني، خريطة تمثيل الكثافة، مخطط دائري، مخطط مربع. أخيرًا، ستكتسب بعض التعرض لتخصيص قطعة الأرض، بما في ذلك ضبط العلامات والتخطيطات.

 
ورقة الغش RAPIDS cuDF

يعد بدء استخدام cuDF أمرًا سهلاً ، خاصة إذا كان لديك خبرة في استخدام Python والمكتبات مثل Pandas. على الرغم من أن كلاً من cuDF و Pandas يقدمان واجهات برمجة تطبيقات متشابهة لمعالجة البيانات ، إلا أن هناك أنواعًا محددة من المشكلات التي يمكن أن يوفر فيها cuDF تحسينات كبيرة في الأداء على Pandas ، بما في ذلك مجموعات البيانات واسعة النطاق والمعالجة المسبقة للبيانات والهندسة والتحليلات في الوقت الفعلي وبالتوازي بالطبع يعالج. كلما كبرت مجموعة البيانات ، زادت فوائد الأداء.

 
ورقة الغش في ChatGPT لمقابلة علوم البيانات

يعد إتقان المقابلات في علم البيانات مهارة خاصة بهم ، والتحضير لها هو مفتاح النجاح. مثلما قيل لي ذات مرة أن تعلم كيفية كتابة الامتحانات الجامعية هو مهارة خاصة بها ، بالإضافة إلى تعلم المواد التي يتم اختبارها ، فإن المقابلات الفنية المتخصصة متشابهة للغاية.

 
10 ملحقات ChatGPT لورقة الغش في علوم البيانات

للحصول على نظرة عامة حول ما نعتقد أنه أفضل 10 مكونات إضافية لـ ChatGPT لعلوم البيانات، راجع أحدث ورقة الغش الخاصة بنا، والتي تحمل اسم 10 مكونات إضافية لـ ChatGPT لعلم البيانات. ستجد مكونات إضافية للبرمجة والتحليل والبحث على الويب واستجواب المستندات والمزيد.

 
Streamlit لورقة الغش في تعلم الآلة

يعد الجمع بين التعلم الآلي وStreamlit معًا خيارًا شائعًا لعلماء البيانات وغيرهم من متخصصي البيانات الذين يتطلعون إلى تجربة البيانات أو النماذج الأولية أو مشاركة النتائج. أصبحت معرفة كيفية تشغيل تطبيقات البيانات بسرعة مهارة أساسية للعاملين في مجال البيانات، وهذا المزيج يسمح بذلك بالتأكيد. إذا كنت لا تعرف كيفية استخدام Streamlit، نقترح عليك أن تتعلم الآن.

 
التعلم الآلي باستخدام ورقة الغش في ChatGPT

مع ChatGPT، أصبح إنشاء مشروع التعلم الآلي أسهل من أي وقت مضى. بمجرد كتابة مطالبات المتابعة وتحليل النتائج، يمكنك تدريب النموذج بسرعة وسهولة للرد على استعلامات المستخدم وتقديم رؤى مفيدة. في ورقة الغش هذه، تعرف على كيفية استخدام ChatGPT للمساعدة في مهام التعلم الآلي التالية: تخطيط المشروع، وهندسة الميزات، والمعالجة المسبقة للبيانات، واختيار النموذج، وضبط المعلمات الفائقة، وتتبع التجربة، وعمليات MLOps.

 
Scikit-Learn لورقة الغش الخاصة بالتعلم الآلي

تجعل واجهة API الموحدة لـ Scikit-learn تعلم كيفية تنفيذ مجموعة متنوعة من الخوارزميات والمهام أسهل بكثير مما قد يكون عليه الأمر بخلاف ذلك. بمجرد أن تتعلم نمط كيفية إجراء مكالمات Scikit-Learn، تكون جاهزًا للعمل. الشيء الوحيد الذي تحتاجه بعد ذلك، بما يتجاوز خيالك وتصميمك، هو مرجع مفيد. تغطي ورقة الغش هذه أساسيات ما هو مطلوب لمعرفة كيفية استخدام Scikit-Learn للتعلم الآلي، وتوفر مرجعًا للمضي قدمًا في مشاريع التعلم الآلي الخاصة بك.

 
ورقة الغش عامل ميناء لعلوم البيانات

أصبح Docker أداة أساسية لعلم البيانات للمساعدة في بناء بيئات قابلة للتكرار وقابلة للتطوير. يسمح Docker بتعبئة التعليمات البرمجية والتبعيات في حاويات، مما يتيح لعلماء البيانات توزيع نماذجهم عبر منصات مختلفة. يساعد هذا في كل من التطوير والإنتاج، ويعمل على منع الأخطاء والتناقضات التي يمكن أن تنشأ من إصدارات مختلفة من تكوينات البرامج أو الأجهزة.

 
الشروع في العمل مع ورقة الغش لاستعلامات قاعدة بيانات الرسم البياني

في استعلامات الرسم البياني، نفقد بعض بناء الجملة من SQL ونكتسب بناء جملة آخر. تم استبدال SELECT بـ MATCH. تم تجاهل FROM وJOIN. ولكن يتم استخدام أوامر WHERE وORDER BY بنفس الطريقة. الوظائف المجمعة مثل SUM وAVG كلها موجودة، ولكن تم تجاهل GROUP BY. والأهم من ذلك هو أننا نكتسب القدرة على الاستعلام عن الأنماط في الرسم البياني باستخدام علاقات العقد. في ورقة الغش المرفقة، سترى قائمة بطرق الاستعلام الأكثر استخدامًا.

 
تنظيف البيانات باستخدام ورقة غش بايثون

في ورقة الغش هذه، ننتقل من اكتشاف البيانات المفقودة ومعالجتها، والتعامل مع التكرارات وإيجاد حلول للنسخ المكررة، واكتشاف العناصر الخارجية، وترميز الملصقات، والتشفير السريع للميزات الفئوية، إلى التحويلات، مثل تسوية MinMax والتطبيع القياسي. علاوة على ذلك، يستغل هذا الدليل الأساليب التي توفرها ثلاث مكتبات من أشهر مكتبات بايثون، وهي Pandas وScikit-Learn وSeaborn لعرض المخططات.

 
ورقة الغش للتحكم في تدفق بايثون

لقد قطعت حالة التحكم في التدفق شوطا طويلا منذ أيام غوتو. هناك العديد من أنماط التنفيذ الشائعة المتوفرة في غالبية لغات البرمجة الحديثة، على الرغم من اختلاف تركيبها من لغة إلى أخرى. تمتلك لغة Python مجموعة خاصة بها من عناصر التحكم في التدفق، والتي يمكن قراءتها بشكل عام، وهذا ما تركز عليه أحدث ورقة الغش لدينا. استعد لتعلم التحكم في التدفق والحصول على مرجع مفيد للمضي قدمًا أثناء غزو عالم البرمجة.

 
ورقة الغش لإضافات الكروم AI لعلماء البيانات

تتضمن مجموعة الأدوات المقدمة في ورقة الغش هذه SciSpace Copilot، وهو مساعد بحث يعمل بالذكاء الاصطناعي مصمم لمساعدتك على فهم النص والرياضيات والجداول في الأدبيات العلمية. كما يتم عرض Fireflies، وهو مساعد الذكاء الاصطناعي المدعوم من GPT-4. يمكن لهذه الأداة الثورية تصفح الويب وتلخيص أنواع مختلفة من المحتوى، بما في ذلك المقالات ومقاطع فيديو YouTube ورسائل البريد الإلكتروني، بكفاءة تشبه كفاءة الإنسان. و اكثر.

 
أفضل أدوات بايثون لبناء تطبيقات الذكاء الاصطناعي التوليدية

تتضمن بعض الميزات المميزة التي تم تناولها OpenAI للوصول إلى نماذج مثل ChatGPT، وTransformers للتدريب والضبط الدقيق، وGradio لبناء واجهات مستخدم بسرعة للنماذج التجريبية، وLangChain لربط نماذج متعددة معًا، وLlamaIndex لاستيعاب البيانات الخاصة وإدارتها. بشكل عام، تحتوي ورقة الغش هذه على ثروة من الإرشادات العملية في صفحة واحدة. يمكن لكل من المبتدئين الذين يتطلعون إلى البدء باستخدام الذكاء الاصطناعي التوليدي في Python وكذلك الممارسين ذوي الخبرة الاستفادة من وجود هذا المرجع المكثف لأفضل الأدوات والمكتبات في متناول أيديهم.

 
ورقة الغش LangChain

باستخدام LangChain ، يمكن للمطورين إنشاء تطبيقات تستند إلى لغة الذكاء الاصطناعي دون إعادة اختراع العجلة. يجعل هيكله القابل للدمج من السهل مزج المكونات ومطابقتها مثل LLMs والقوالب الفورية والأدوات الخارجية والذاكرة. يعمل هذا على تسريع النماذج الأولية ويسمح بالتكامل السلس للإمكانيات الجديدة بمرور الوقت. سواء كنت تتطلع إلى إنشاء روبوت محادثة أو روبوت QA أو وكيل تفكير متعدد الخطوات ، يوفر LangChain اللبنات الأساسية لتجميع الذكاء الاصطناعي المتقدم بسرعة.

 
10 ورقة غش لمشاريع ChatGPT

ترتبط ورقة الغش بالبرامج التعليمية لكل مشروع، حيث يتم تنفيذ التنفيذ خطوة بخطوة مع الاستفادة من مطالبات المحادثة الخاصة بـ ChatGPT. تشمل أبرز الميزات استخدام ChatGPT لنموذج تصنيف الموافقة على القروض، ومحلل السيرة الذاتية، ومترجم اللغة في الوقت الفعلي، وتحليل البيانات الاستكشافية، وحتى دمج إمكاناته في جداول بيانات Google. سواء كنت جديدًا في ChatGPT أو تتطلع إلى تجاوز حدوده، تعمل هذه المجموعة من المشاريع بمثابة منصة انطلاق لتعزيز الإنتاجية وتسريع التطوير بمساعدة الذكاء الاصطناعي.
 
 

ماثيو مايو (@ mtmayo13) حاصل على درجة الماجستير في علوم الكمبيوتر ودبلوم الدراسات العليا في استخراج البيانات. بصفته رئيس تحرير KDnuggets، يهدف ماثيو إلى تسهيل الوصول إلى مفاهيم علم البيانات المعقدة. تشمل اهتماماته المهنية معالجة اللغات الطبيعية وخوارزميات التعلم الآلي واستكشاف الذكاء الاصطناعي الناشئ. إنه مدفوع بمهمة إضفاء الطابع الديمقراطي على المعرفة في مجتمع علوم البيانات. كان ماثيو يبرمج منذ أن كان عمره 6 سنوات.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة