जेफिरनेट लोगो

GenAI का उपयोग करके कैलोरी सलाहकार ऐप कैसे बनाएं?

दिनांक:

परिचय

Artificial Intelligence इसके कई उपयोग के मामले हैं, और कुछ सर्वश्रेष्ठ स्वास्थ्य उद्योग में हैं। यह वास्तव में लोगों को स्वस्थ जीवन बनाए रखने में मदद कर सकता है। जैसे-जैसे तेजी बढ़ती जा रही है जनरेटिव ए.आई., कुछ अनुप्रयोग इन दिनों कम जटिलता के साथ बनाये जाते हैं। एक बहुत ही उपयोगी एप्लिकेशन जिसे बनाया जा सकता है वह है कैलोरी एडवाइजर ऐप। इस लेख में, हम केवल अपने स्वास्थ्य की देखभाल से प्रेरित होकर इस पर गौर करेंगे। हम एक सरल कैलोरी सलाहकार ऐप बनाएंगे जहां हम भोजन की छवियों को इनपुट कर सकते हैं, और ऐप हमें भोजन में मौजूद प्रत्येक वस्तु की कैलोरी की गणना करने में मदद करेगा। यह प्रोजेक्ट न्यूट्रीजेन का एक हिस्सा है, जो एआई के माध्यम से स्वास्थ्य पर ध्यान केंद्रित करता है।

पोषक तत्व

सीखने का उद्देश्य

  • इस लेख में हम जो ऐप बनाएंगे वह बुनियादी प्रॉम्प्ट इंजीनियरिंग और इमेज प्रोसेसिंग तकनीकों पर आधारित होगा।
  • हम अपने उपयोग के मामले में Google जेमिनी प्रो विज़न एपीआई का उपयोग करेंगे।
  • फिर, हम कोड की संरचना बनाएंगे, जहां हम इमेज प्रोसेसिंग और प्रॉम्प्ट इंजीनियरिंग करेंगे। अंत में, हम स्ट्रीमलिट का उपयोग करके यूजर इंटरफेस पर काम करेंगे।
  • उसके बाद, हम अपना ऐप तैनात करेंगे गले लगना मुफ़्त में प्लेटफ़ॉर्म.
  • हम आउटपुट में कुछ समस्याओं का भी सामना करेंगे जहां मिथुन एक खाद्य पदार्थ को चित्रित करने में विफल रहता है और उस भोजन के लिए गलत कैलोरी गिनती देता है। हम इस समस्या के विभिन्न समाधानों पर भी चर्चा करेंगे।

ज़रूरी

आइए अपनी परियोजना को लागू करना शुरू करें, लेकिन उससे पहले, कृपया सुनिश्चित करें कि आपको जेनरेटिव एआई और एलएलएम की बुनियादी समझ है। यदि आप बहुत कम जानते हैं तो कोई बात नहीं, क्योंकि इस लेख में हम चीजों को शुरू से लागू करेंगे।

एसेंशियल पायथन प्रॉम्प्ट इंजीनियरिंग के लिए, जेनेरेटिव एआई की बुनियादी समझ और Google जेमिनी से परिचित होना आवश्यक है। इसके अतिरिक्त, का बुनियादी ज्ञान स्ट्रीमलाइट, Github, तथा गले लगना पुस्तकालय आवश्यक है. छवि प्रीप्रोसेसिंग उद्देश्यों के लिए पीआईएल जैसे पुस्तकालयों से परिचित होना भी फायदेमंद है।

इस लेख के एक भाग के रूप में प्रकाशित किया गया था डेटा साइंस ब्लॉगथॉन।

विषय - सूची

प्रोजेक्ट पाइपलाइन

इस लेख में, हम एक एआई सहायक के निर्माण पर काम करेंगे जो पोषण विशेषज्ञों और व्यक्तियों को उनके भोजन विकल्पों के बारे में सूचित निर्णय लेने और स्वस्थ जीवन शैली बनाए रखने में सहायता करेगा।

प्रवाह इस प्रकार होगा: इनपुट छवि -> छवि प्रसंस्करण -> शीघ्र इंजीनियरिंग -> भोजन की इनपुट छवि का आउटपुट प्राप्त करने के लिए अंतिम फ़ंक्शन कॉलिंग। यह एक संक्षिप्त अवलोकन है कि हम इस समस्या कथन को कैसे देखेंगे।

जेमिनी प्रो विजन का अवलोकन

मिथुन प्रो एक मल्टीमॉडल है एलएलएम Google द्वारा निर्मित. इसे शुरू से ही मल्टीमॉडल होने के लिए प्रशिक्षित किया गया था। यह इमेज कैप्शनिंग सहित विभिन्न कार्यों पर अच्छा प्रदर्शन कर सकता है। वर्गीकरण, सारांश, प्रश्न-उत्तर, आदि। इसके बारे में दिलचस्प तथ्यों में से एक यह है कि यह हमारे प्रसिद्ध ट्रांसफार्मर डिकोडर आर्किटेक्चर का उपयोग करता है। इसे कई प्रकार के डेटा पर प्रशिक्षित किया गया, जिससे मल्टीमॉडल इनपुट को हल करने की जटिलता कम हो गई और गुणवत्तापूर्ण आउटपुट प्रदान किए गए।

चरण 1: आभासी वातावरण बनाना

वर्चुअल वातावरण बनाना हमारी परियोजना और उसकी निर्भरता को अलग करने के लिए एक अच्छा अभ्यास है ताकि वे दूसरों के साथ मेल न खाएं, और हमारे पास हमेशा अलग-अलग आभासी वातावरण में पुस्तकालयों के विभिन्न संस्करण हो सकते हैं जिनकी हमें आवश्यकता होती है। इसलिए, अब हम परियोजना के लिए एक आभासी वातावरण बनाएंगे। ऐसा करने के लिए, नीचे दिए गए चरणों का पालन करें:

  • प्रोजेक्ट के लिए डेस्कटॉप पर एक खाली फ़ोल्डर बनाएं।
  • इस फ़ोल्डर को VS कोड में खोलें.
  • टर्मिनल खोलें।

निम्न आदेश लिखें:

pip install virtualenv
python -m venv genai_project

यदि आपको निष्पादन नीति त्रुटि प्राप्त हो रही है तो आप निम्न आदेश का उपयोग कर सकते हैं:

Set-ExecutionPolicy RemoteSigned -Scope Process

अब हमें अपने वर्चुअल वातावरण को सक्रिय करने की आवश्यकता है, इसके लिए निम्नलिखित कमांड का उपयोग करें:

.genai_projectScriptsactivate

हमने अपना आभासी वातावरण सफलतापूर्वक बना लिया है।

चरण Google Colab में वर्चुअल वातावरण बनाएं

हम Google Colab में अपना वर्चुअल वातावरण भी बना सकते हैं; ऐसा करने की चरण-दर-चरण प्रक्रिया यहां दी गई है:

  • एक नया कोलाब नोटबुक बनाएं
  • नीचे दिए गए आदेशों का चरण दर चरण उपयोग करें
!which python
!python --version
#to check if python is installed or not
%env PYTHONPATH=
# setting python path environment variable in empty value ensuring that python
# won't search for modules and packages in additional directory. It helps
# in avoiding conflicts or unintended module loading.
!pip install virtualenv 
# create virtual environment 
!virtualenv genai_project
!wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh

#This will help download the miniconda installer script which is used to create
# and manage virtual environments in python
!chmod +x Miniconda3-latest-Linux-x86_64.sh
# this command is making our mini conda installer script executable within
# the colab environment. 
!./Miniconda3-latest-Linux-x86_64.sh -b -f -p /usr/local
# this is used to run miniconda installer script and 
# specify the path where miniconda should be installed
!conda install -q -y --prefix /usr/local python=3.8 ujson
#this will help install ujson and python 3.8 installation in our venv.
import sys
sys.path.append('/usr/local/lib/python3.8/site-packages/')
#it will allow python to locate and import modules from a venv directory
import os
os.environ['CONDA_PREFIX'] = '/usr/local/envs/myenv'

# used to activate miniconda enviornment 
!python --version
#checks the version of python within the activated miniconda environment

इसलिए, हमने Google Colab में अपना वर्चुअल वातावरण भी बनाया। अब, आइए देखें और देखें कि हम वहां एक बुनियादी .py फ़ाइल कैसे बना सकते हैं।

!source myenv/bin/activate
#activating the virtual environment
!echo "print('Hello, world!')" >> my_script.py
# writing code using echo and saving this code in my_script.py file
!python my_script.py
#running my_script.py file

यह आउटपुट में हमारे लिए हैलो वर्ल्ड प्रिंट करेगा। तो यह बात है। यह सब Google Colab में वर्चुअल वातावरण के साथ काम करने के बारे में था। अब, आइए परियोजना को जारी रखें।

चरण 2: आवश्यक पुस्तकालय आयात करना

import streamlit as st
import google.generativeaias genai 
import os 
from dotenv import load_dotenv
load_dotenv()
from PIL import Image

यदि आपको उपरोक्त किसी भी लाइब्रेरी को आयात करने में परेशानी हो रही है, तो आप इसे स्थापित करने के लिए हमेशा "पिप इंस्टॉल लाइब्रेरी_नाम" कमांड का उपयोग कर सकते हैं।

हम बुनियादी उपयोगकर्ता इंटरफ़ेस बनाने के लिए स्ट्रीमलिट लाइब्रेरी का उपयोग कर रहे हैं। उपयोगकर्ता एक छवि अपलोड करने और उस छवि के आधार पर आउटपुट प्राप्त करने में सक्षम होगा।

हम एलएलएम प्राप्त करने के लिए Google जेनरेटिव का उपयोग करते हैं और अपने भोजन में आइटम-वार कैलोरी गणना प्राप्त करने के लिए छवि का विश्लेषण करते हैं।

छवि का उपयोग कुछ बुनियादी छवि प्रीप्रोसेसिंग करने के लिए किया जा रहा है।

चरण 3: एपीआई कुंजी सेट करना

उसी निर्देशिका में एक नई .env फ़ाइल बनाएं और अपनी API कुंजी संग्रहीत करें। आप Google से प्राप्त कर सकते हैं जेमिनी एपीआई से की गूगल मेकरसुइट.

चरण 4: रिस्पांस जेनरेटर फ़ंक्शन

यहां, हम एक प्रतिक्रिया जनरेटर फ़ंक्शन बनाएंगे। आइए इसे चरण दर चरण तोड़ें:

सबसे पहले, हमने जीन का उपयोग किया। Google MakerSuite वेबसाइट से हमारे द्वारा बनाई गई API को कॉन्फ़िगर करने के लिए कॉन्फ़िगर करें। फिर, हमने फ़ंक्शन get_gemini_response बनाया, जो 2 इनपुट पैरामीटर लेता है: इनपुट प्रॉम्प्ट और छवि। यह प्राथमिक फ़ंक्शन है जो टेक्स्ट में आउटपुट लौटाएगा।

genai.configure(api_key=os.getenv("GOOGLE_API_KEY"))

def get_gemini_response(input_prompt, image):

    model = genai.GenerativeModel('gemini-pro-vision')

    response = model.generate_content([input_prompt, image[0]])

    return response

यहां, हम 'जेमिनी-प्रो-विज़न' मॉडल का उपयोग कर रहे हैं क्योंकि यह मल्टीमॉडल है। जिन्न.जेनरेटिवमॉडल निर्भरता से अपने मॉडल को कॉल करने के बाद, हम बस अपना प्रॉम्प्ट और छवि डेटा मॉडल में भेज रहे हैं। अंत में, प्रॉम्प्ट में दिए गए निर्देशों और हमारे द्वारा खिलाए गए छवि डेटा के आधार पर, मॉडल टेक्स्ट के रूप में आउटपुट लौटाएगा जो छवि में मौजूद विभिन्न खाद्य पदार्थों की कैलोरी गिनती का प्रतिनिधित्व करता है।

चरण5: छवि प्रीप्रोसेसिंग

यह फ़ंक्शन जाँचता है कि क्या upload_file पैरामीटर कोई नहीं है, जिसका अर्थ है कि उपयोगकर्ता ने एक फ़ाइल अपलोड की है। यदि कोई फ़ाइल अपलोड की गई है, तो कोड upload_file ऑब्जेक्ट की getvalue() विधि का उपयोग करके फ़ाइल सामग्री को बाइट्स में पढ़ने के लिए आगे बढ़ता है। यह अपलोड की गई फ़ाइल के कच्चे बाइट्स लौटा देगा।

अपलोड की गई फ़ाइल से प्राप्त बाइट्स डेटा कुंजी-मूल्य जोड़ी "mime_type" और "डेटा" के तहत एक शब्दकोश प्रारूप में संग्रहीत किया जाता है। "mime_type" कुंजी अपलोड की गई फ़ाइल के MIME प्रकार को संग्रहीत करती है, जो सामग्री के प्रकार को इंगित करती है (उदाहरण के लिए, छवि/जेपीईजी, छवि/पीएनजी)। "डेटा" कुंजी अपलोड की गई फ़ाइल के कच्चे बाइट्स को संग्रहीत करती है।

छवि डेटा को फिर image_parts नामक एक सूची में संग्रहीत किया जाता है, जिसमें अपलोड की गई फ़ाइल के MIME प्रकार और डेटा के साथ एक शब्दकोश होता है।

def input_image_setup(uploaded_file):
    if uploaded_file isnotNone:
        #Read the file into bytes
        bytes_data = uploaded_file.getvalue()
        image_parts = [
            {
                "mime_type":uploaded_file.type, 
                "data":bytes_data
            }
        ]
        return image_parts
    else:
        raise FileNotFoundError("No file uploaded")

चरण6: यूआई बनाना

तो, आखिरकार, हमारे प्रोजेक्ट के लिए यूजर इंटरफेस बनाने का समय आ गया है। जैसा कि पहले उल्लेख किया गया है, हम फ्रंट एंड के लिए कोड लिखने के लिए स्ट्रीमलिट लाइब्रेरी का उपयोग करेंगे।

## initialising the streamlit app
st.set_page_config(page_title="Calories Advisor App")
st.header("Calories Advisor App")
uploaded_file = st.file_uploader("Choose an image...", type=["jpg", "jpeg", "png"])
image = ""
if uploaded_file isnotNone:
    image = Image.open(uploaded_file)
    st.image(image, caption="Uploaded Image", use_column_width=True)
submit = st.button("Tell me about the total calories")

प्रारंभ में, हमने set_page_config का उपयोग करके पेज कॉन्फ़िगरेशन सेट किया और ऐप को एक शीर्षक दिया। फिर, हमने एक हेडर बनाया और एक फ़ाइल अपलोडर बॉक्स जोड़ा जहां उपयोगकर्ता छवियां अपलोड कर सकते हैं। सेंट इमेज वह छवि दिखाती है जिसे उपयोगकर्ता ने यूआई पर अपलोड किया है। अंत में, एक सबमिट बटन है, जिसके बाद हम अपने बड़े भाषा संस्करण, जेमिनी प्रो विजन से आउटपुट प्राप्त करेंगे।

चरण7: सिस्टम प्रॉम्प्ट लिखना

अब रचनात्मक होने का समय है. यहां, हम अपना इनपुट प्रॉम्प्ट बनाएंगे, जिसमें मॉडल को विशेषज्ञ पोषण विशेषज्ञ के रूप में कार्य करने के लिए कहा जाएगा। नीचे दिए गए संकेत का उपयोग करना आवश्यक नहीं है; आप अपना कस्टम प्रॉम्प्ट भी प्रदान कर सकते हैं. हम अपने मॉडल से फिलहाल एक निश्चित तरीके से कार्य करने के लिए कह रहे हैं। प्रदान किए गए भोजन की इनपुट छवि के आधार पर, हम अपने मॉडल से उस छवि डेटा को पढ़ने और आउटपुट उत्पन्न करने के लिए कह रहे हैं, जो हमें छवि में मौजूद खाद्य पदार्थों की कैलोरी गिनती देगा और यह निर्णय देगा कि भोजन स्वस्थ है या नहीं या अस्वस्थ. यदि भोजन हानिकारक है, तो हम उससे अपनी छवि के खाद्य पदार्थों के लिए अधिक पौष्टिक विकल्प देने के लिए कहते हैं। आप इसे अपनी आवश्यकताओं के अनुसार और अधिक अनुकूलित कर सकते हैं और अपने स्वास्थ्य पर नज़र रखने का एक उत्कृष्ट तरीका प्राप्त कर सकते हैं।

कभी-कभी यह छवि डेटा को ठीक से पढ़ने में सक्षम नहीं हो सकता है, हम इस लेख के अंत में इसके संबंध में समाधान पर भी चर्चा करेंगे।

input_prompt = """

You are an expert nutritionist where you need to see the food items from the 
image and calculate the total calories, also give the details of all 
the food items with their respective calorie count in the below fomat.

        1. Item 1 - no of calories

        2. Item 2 - no of calories

        ----

        ----

Finally you can also mention whether the food is healthy or not and also mention 
the percentage split ratio of carbohydrates, fats, fibers, sugar, protein and 
other important things required in our diet. If you find that food is not healthy 
then you must provide some alternative healthy food items that user can have 
in diet.

"""
if submit:

    image_data = input_image_setup(uploaded_file)

    response = get_gemini_response(input_prompt, image_data)

    st.header("The Response is: ")

    st.write(response)

अंत में, हम जाँच कर रहे हैं कि यदि उपयोगकर्ता सबमिट बटन पर क्लिक करता है, तो हमें छवि डेटा प्राप्त होगा

इनपुट_इमेज_सेटअप फ़ंक्शन जिसे हमने पहले बनाया था। फिर, हम अपना इनपुट प्रॉम्प्ट और यह छवि डेटा उस get_gemini_response फ़ंक्शन को पास करते हैं जिसे हमने पहले बनाया था। हम प्रतिक्रिया में संग्रहीत अंतिम आउटपुट प्राप्त करने के लिए पहले बनाए गए सभी फ़ंक्शन को कॉल करते हैं।

चरण8: गले मिलते चेहरे पर ऐप को तैनात करना

अब तैनाती का समय आ गया है. चलो शुरू करें।

हमारे द्वारा बनाए गए इस ऐप को तैनात करने का सबसे सरल तरीका बताएंगे। अगर हम अपना ऐप तैनात करना चाहते हैं तो दो विकल्प हैं जिन पर हम गौर कर सकते हैं: एक है स्ट्रीमलिट शेयर, और दूसरा है हगिंग फेस। यहां, हम परिनियोजन के लिए हगिंग फेस का उपयोग करेंगे; यदि आप चाहें तो स्ट्रीमलिट शेयर iFaceu पर परिनियोजन की खोज करने का प्रयास कर सकते हैं। उसके लिए संदर्भ लिंक यहां दिया गया है - स्ट्रीमलिट शेयर पर परिनियोजन

सबसे पहले, आइए शीघ्रता से आवश्यकताएँ.txt फ़ाइल बनाएँ जो हमें परिनियोजन के लिए आवश्यक है।

टर्मिनल खोलें और एक require.txt फ़ाइल बनाने के लिए नीचे दिया गया कमांड चलाएँ।

pip freeze > requirements.txt1plainText

यह आवश्यकताओं नामक एक नई टेक्स्ट फ़ाइल बनाएगा। सभी परियोजना निर्भरताएँ वहाँ उपलब्ध होंगी। यदि इससे कोई त्रुटि उत्पन्न होती है तो कोई बात नहीं. आप हमेशा अपनी कार्यशील निर्देशिका में एक नई टेक्स्ट फ़ाइल बना सकते हैं और मेरे द्वारा आगे दिए गए GitHub लिंक से require.txt फ़ाइल को कॉपी और पेस्ट कर सकते हैं।

अब, सुनिश्चित करें कि ये फ़ाइलें आपके पास उपलब्ध हैं (क्योंकि परिनियोजन के लिए हमें इन्हीं की आवश्यकता है):

  • ऐप.पी.ई
  • .env (एपीआई क्रेडेंशियल के लिए)
  • requirements.txt

यदि आपके पास एक नहीं है, तो इन सभी फ़ाइलों को लें और गले मिलते हुए एक खाता बनाएं। फिर, एक नया स्थान बनाएं और वहां फ़ाइलें अपलोड करें। बस इतना ही। इस तरह आपका ऐप स्वचालित रूप से तैनात हो जाएगा। आप यह भी देख पाएंगे कि वास्तविक समय में तैनाती कैसे हो रही है। यदि कोई त्रुटि होती है, तो आप इसे हमेशा सरल इंटरफ़ेस और निश्चित रूप से, हगिंग फेस समुदाय के साथ समझ सकते हैं, जिसमें तैनाती के दौरान कुछ सामान्य बग को हल करने पर बहुत सारी सामग्री होती है।

कुछ देर बाद आप ऐप को काम करता हुआ देख पाएंगे। वू हू! हमने अंततः अपना कैलोरी पूर्वानुमानक ऐप बना और तैनात कर लिया है। बधाई हो!!, आप ऐप के कामकाजी लिंक को अपने द्वारा अभी बनाए गए दोस्तों और परिवार के साथ साझा कर सकते हैं।

यहां उस ऐप का कार्यशील लिंक दिया गया है जिसे हमने अभी बनाया है - द अलोरकैलोरीज़र ऐप

आइए अपने ऐप को एक इनपुट छवि प्रदान करके उसका परीक्षण करें:

पहले:

पोषक तत्व

बाद:

पोषक तत्व

यहाँ पूरा है जीथब रिपॉजिटरी लिंक जिसमें स्रोत कोड और परियोजना के संबंध में अन्य उपयोगी जानकारी शामिल है।

आप रिपॉजिटरी को क्लोन कर सकते हैं और इसे अपनी आवश्यकताओं के अनुसार कस्टमाइज़ कर सकते हैं। अपने प्रॉम्प्ट में अधिक रचनात्मक और स्पष्ट होने का प्रयास करें, क्योंकि इससे आपके मॉडल को सही और उचित आउटपुट उत्पन्न करने की अधिक शक्ति मिलेगी।

सुधार की गुंजाइश

मॉडल द्वारा उत्पन्न आउटपुट में उत्पन्न होने वाली समस्याएं और उनके समाधान:

कभी-कभी, ऐसी स्थितियाँ हो सकती हैं जहाँ आपको मॉडल से सही आउटपुट नहीं मिलेगा। ऐसा इसलिए हो सकता है क्योंकि मॉडल छवि का सही अनुमान लगाने में सक्षम नहीं था। उदाहरण के लिए, यदि आप अपने भोजन की इनपुट छवियां देते हैं और आपके खाद्य पदार्थ में अचार है, तो हमारा मॉडल इसे कुछ और मान सकता है। यह यहां की प्राथमिक चिंता है.

  • इससे निपटने का एक तरीका प्रभावी प्रॉम्प्ट इंजीनियरिंग तकनीकों के माध्यम से है, जैसे कि कुछ-शॉट प्रॉम्प्ट इंजीनियरिंग, जहां आप मॉडल को उदाहरणों के साथ फीड कर सकते हैं, और फिर यह उन उदाहरणों से सीखने और आपके द्वारा प्रदान किए गए प्रॉम्प्ट के आधार पर आउटपुट उत्पन्न करेगा।
  • एक अन्य समाधान जिस पर यहां विचार किया जा सकता है वह है हमारा कस्टम डेटा बनाना और उसे ठीक करना। हम एक कॉलम में खाद्य पदार्थ की छवि और दूसरे कॉलम में मौजूद खाद्य पदार्थों का विवरण वाला डेटा बना सकते हैं। इससे हमारे मॉडल को अंतर्निहित पैटर्न सीखने और प्रदान की गई छवि में वस्तुओं की सही भविष्यवाणी करने में मदद मिलेगी। इस प्रकार, भोजन की तस्वीरों के लिए कैलोरी गणना के अधिक सही आउटपुट प्राप्त करना आवश्यक है।
  • हम उपयोगकर्ता से उसके पोषण लक्ष्यों के बारे में पूछकर और मॉडल को उसके आधार पर आउटपुट उत्पन्न करने के लिए कहकर इसे आगे बढ़ा सकते हैं। (इस तरह, हम मॉडल द्वारा उत्पन्न आउटपुट को अनुकूलित करने और अधिक उपयोगकर्ता-विशिष्ट आउटपुट देने में सक्षम होंगे।)

निष्कर्ष

हमने कैलोरी सलाहकार ऐप के निर्माण पर ध्यान केंद्रित करते हुए स्वास्थ्य सेवा में जेनरेटिव एआई के व्यावहारिक अनुप्रयोग पर ध्यान केंद्रित किया है। यह परियोजना व्यक्तियों को उनके भोजन विकल्पों के बारे में सूचित निर्णय लेने और स्वस्थ जीवन शैली बनाए रखने में सहायता करने के लिए एआई की क्षमता को प्रदर्शित करती है। हमारे पर्यावरण की स्थापना से लेकर छवि प्रसंस्करण और शीघ्र इंजीनियरिंग तकनीकों को लागू करने तक, हमने आवश्यक कदमों को कवर किया है। हगिंग फेस पर ऐप की तैनाती व्यापक दर्शकों तक इसकी पहुंच को दर्शाती है। छवि पहचान संबंधी अशुद्धियों जैसी चुनौतियों का समाधान प्रभावी त्वरित इंजीनियरिंग जैसे समाधानों से किया गया। जैसा कि हम निष्कर्ष निकालते हैं, कैलोरी सलाहकार ऐप कल्याण को बढ़ावा देने में जेनरेटिव एआई की परिवर्तनकारी शक्ति के प्रमाण के रूप में खड़ा है।

चाबी छीन लेना

  • हमने अब तक बहुत चर्चा की है, प्रोजेक्ट पाइपलाइन से शुरुआत और फिर बड़े भाषा मॉडल जेमिनी प्रो विज़न का बुनियादी परिचय।
  • फिर, हमने व्यावहारिक कार्यान्वयन शुरू किया। हमने Google MakerSuite से अपना वर्चुअल वातावरण और API कुंजी बनाई।
  • फिर, हमने अपनी सभी कोडिंग बनाए गए वर्चुअल वातावरण में निष्पादित की। इसके अलावा, हमने चर्चा की कि ऐप को हगिंग फेस और स्ट्रीमलिट शेयर जैसे कई प्लेटफार्मों पर कैसे तैनात किया जाए।
  • इसके अलावा, हमने उन संभावित समस्याओं पर विचार किया जो उत्पन्न हो सकती हैं, और उन समस्याओं के समाधान पर चर्चा की।
  •  इसलिए, इस प्रोजेक्ट पर काम करना मजेदार था। इस लेख के अंत तक बने रहने के लिए धन्यवाद; मुझे आशा है कि आपको कुछ नया सीखने को मिला होगा।

आम सवाल-जवाब

Q1। Google जेमिनी प्रो विज़न मॉडल क्या है?

Google ने जेमिनी प्रो विज़न विकसित किया है, जो एक प्रसिद्ध एलएलएम है जो अपनी मल्टीमॉडल क्षमताओं के लिए जाना जाता है। यह इमेज कैप्शनिंग, जेनरेशन और सारांशीकरण जैसे कार्य करता है। जेमिनी प्रो विज़न तक पहुंचने के लिए उपयोगकर्ता मेकरसुइट वेबसाइट पर एक एपीआई कुंजी बना सकते हैं।

Q2। जेनरेटिव एआई को हेल्थकेयर/न्यूट्रिशन डोमेन पर कैसे लागू किया जा सकता है?

A. जेनेरेटिव एआई में वास्तविक दुनिया की समस्याओं को हल करने की काफी संभावनाएं हैं। इसे स्वास्थ्य/पोषण क्षेत्र में लागू करने के कुछ तरीके इस प्रकार हैं कि यह डॉक्टरों को लक्षणों के आधार पर दवा के नुस्खे देने और पोषण सलाहकार के रूप में कार्य करने में मदद कर सकता है, जहां उपयोगकर्ता अपने आहार के लिए स्वस्थ सिफारिशें प्राप्त कर सकते हैं।

Q3। प्रॉम्प्ट इंजीनियरिंग जेनरेटिव एआईयूज़ मामले को कैसे हल करती है?

उ. इन दिनों शीघ्र इंजीनियरिंग में महारत हासिल करना एक आवश्यक कौशल है। बुनियादी से लेकर उन्नत तक ट्रॉम्प्ट इंजीनियरिंग सीखने के लिए सबसे अच्छी जगह यहां है - https://www.promptingguide.ai/

Q4। अधिक सही आउटपुट उत्पन्न करने के लिए मॉडल की क्षमता कैसे बढ़ाएं?

A. अधिक सही आउटपुट उत्पन्न करने के लिए मॉडल की क्षमता बढ़ाने के लिए, हम निम्नलिखित युक्तियों का उपयोग कर सकते हैं: प्रभावी प्रॉम्प्टिंग, फाइन ट्यूनिंग, और रिट्रीवल-ऑगमेंटेड जेनरेशन (आरएजी)।

इस लेख में दिखाया गया मीडिया एनालिटिक्स विद्या के स्वामित्व में नहीं है और इसका उपयोग लेखक के विवेक पर किया जाता है।

स्पॉट_आईएमजी

नवीनतम खुफिया

स्पॉट_आईएमजी