जेफिरनेट लोगो

अमेज़ॅन बेडरॉक के लिए नॉलेज बेस के साथ दवा की खोज के लिए आरएजी का उपयोग करें | अमेज़न वेब सेवाएँ

दिनांक:

अमेज़ॅन बेडरॉक अमेज़ॅन और तृतीय-पक्ष प्रदाताओं से मॉडलों की एक विस्तृत श्रृंखला प्रदान करता है, जिसमें एंथ्रोपिक, एआई21, मेटा, कोहेयर और स्टेबिलिटी एआई शामिल हैं, और टेक्स्ट और छवि निर्माण, एम्बेडिंग, चैट, उच्च-स्तरीय एजेंटों सहित उपयोग के मामलों की एक विस्तृत श्रृंखला को कवर करता है। तर्क और आयोजन के साथ, और भी बहुत कुछ। अमेज़ॅन बेडरॉक के लिए ज्ञानकोष आपको AWS और थर्ड-पार्टी मॉडल दोनों का उपयोग करके AWS और थर्ड-पार्टी वेक्टर स्टोर्स के शीर्ष पर परफॉर्मेंट और कस्टमाइज्ड रिट्रीवल ऑगमेंटेड जेनरेशन (RAG) एप्लिकेशन बनाने की अनुमति देता है। अमेज़ॅन बेडरॉक के लिए नॉलेज बेस आपके वेक्टर स्टोर के साथ आपके डेटा के सिंक्रनाइज़ेशन को स्वचालित करता है, जिसमें अपडेट होने पर डेटा को अलग करना, दस्तावेज़ लोड करना और चंकिंग के साथ-साथ सिमेंटिक एम्बेडिंग भी शामिल है। यह आपको अपने RAG संकेतों और पुनर्प्राप्ति रणनीतियों को सहजता से अनुकूलित करने की अनुमति देता है - हम स्रोत एट्रिब्यूशन प्रदान करते हैं, और हम मेमोरी प्रबंधन को स्वचालित रूप से संभालते हैं। नॉलेज बेस पूरी तरह से सर्वर रहित है, इसलिए आपको किसी भी बुनियादी ढांचे को प्रबंधित करने की आवश्यकता नहीं है, और नॉलेज बेस का उपयोग करते समय, आपसे केवल आपके द्वारा उपयोग किए जाने वाले मॉडल, वेक्टर डेटाबेस और स्टोरेज के लिए शुल्क लिया जाता है।

आरएजी एक लोकप्रिय तकनीक है जो निजी डेटा के उपयोग को बड़े भाषा मॉडल (एलएलएम) के साथ जोड़ती है। आरएजी उपयोगकर्ता की क्वेरी के आधार पर डेटा स्टोर (आमतौर पर एक वेक्टर इंडेक्स) से प्रासंगिक दस्तावेजों को पुनर्प्राप्त करने के प्रारंभिक चरण से शुरू होता है। इसके बाद यह पुनर्प्राप्त दस्तावेज़ों और मूल क्वेरी दोनों पर विचार करके प्रतिक्रिया उत्पन्न करने के लिए एक भाषा मॉडल का उपयोग करता है।

इस पोस्ट में, हम प्रदर्शित करते हैं कि दवा खोज उपयोग के मामले के लिए अमेज़ॅन बेडरॉक के लिए नॉलेज बेस का उपयोग करके आरएजी वर्कफ़्लो कैसे बनाया जाए।

अमेज़ॅन बेडरॉक के लिए ज्ञानकोष का अवलोकन

अमेज़ॅन बेडरॉक के लिए नॉलेज बेस सामान्य फ़ाइल प्रकारों की एक विस्तृत श्रृंखला का समर्थन करता है, जिसमें .txt, .docx, .pdf, .csv, और बहुत कुछ शामिल हैं। निजी डेटा से प्रभावी पुनर्प्राप्ति को सक्षम करने के लिए, एक सामान्य अभ्यास यह है कि पहले इन दस्तावेज़ों को प्रबंधनीय टुकड़ों में विभाजित किया जाए। नॉलेज बेस ने एक डिफ़ॉल्ट चंकिंग रणनीति लागू की है जो आपको तेजी से आरंभ करने की अनुमति देने के लिए ज्यादातर मामलों में अच्छी तरह से काम करती है। यदि आप अधिक नियंत्रण चाहते हैं, तो नॉलेज बेस आपको पूर्व-कॉन्फ़िगर विकल्पों के एक सेट के माध्यम से चंकिंग रणनीति को नियंत्रित करने देता है। आप एम्बेडिंग को सुसंगत संदर्भ प्रदान करने के लिए अधिकतम टोकन आकार और टुकड़ों में बनाए जाने वाले ओवरलैप की मात्रा को नियंत्रित कर सकते हैं। अमेज़ॅन बेडरॉक के लिए नॉलेज बेस आपके डेटा को सिंक्रनाइज़ करने की प्रक्रिया का प्रबंधन करता है अमेज़न सरल भंडारण सेवा (अमेज़ॅन S3) बकेट, इसे छोटे टुकड़ों में विभाजित करता है, वेक्टर एम्बेडिंग उत्पन्न करता है, और एम्बेडिंग को वेक्टर इंडेक्स में संग्रहीत करता है। यह प्रक्रिया बुद्धिमान अंतर, थ्रूपुट और विफलता प्रबंधन के साथ आती है।

रनटाइम पर, उपयोगकर्ता की क्वेरी को वेक्टर में बदलने के लिए एक एम्बेडिंग मॉडल का उपयोग किया जाता है। फिर उपयोगकर्ता क्वेरी वेक्टर के साथ दस्तावेज़ वेक्टर की तुलना करके उपयोगकर्ता की क्वेरी के समान दस्तावेज़ ढूंढने के लिए वेक्टर इंडेक्स से पूछताछ की जाती है। अंतिम चरण में, वेक्टर इंडेक्स से प्राप्त शब्दार्थ समान दस्तावेज़ों को मूल उपयोगकर्ता क्वेरी के संदर्भ के रूप में जोड़ा जाता है। उपयोगकर्ता के लिए प्रतिक्रिया उत्पन्न करते समय, शब्दार्थ रूप से समान दस्तावेज़ों को टेक्स्ट मॉडल में ट्रेसेबिलिटी के लिए स्रोत एट्रिब्यूशन के साथ संकेत दिया जाता है।

अमेज़ॅन बेडरॉक के लिए नॉलेज बेस कई वेक्टर डेटाबेस का समर्थन करता है, जिसमें शामिल हैं Amazon OpenSearch सर्वर रहित, अमेज़न अरोड़ा, पाइनकोन, और रेडिस एंटरप्राइज क्लाउड। रिट्रीव और रिट्रीवएंडजेनरेट एपीआई आपके एप्लिकेशन को प्रत्येक अलग वेक्टर डेटाबेस के लिए अलग-अलग एपीआई सीखने के बिना एकीकृत और मानक सिंटैक्स का उपयोग करके सीधे इंडेक्स को क्वेरी करने की अनुमति देते हैं, जिससे आपके वेक्टर स्टोर के खिलाफ कस्टम इंडेक्स क्वेरी लिखने की आवश्यकता कम हो जाती है। रिट्रीव एपीआई आने वाली क्वेरी को लेता है, इसे एक एम्बेडिंग वेक्टर में परिवर्तित करता है, और वेक्टर डेटाबेस स्तर पर कॉन्फ़िगर किए गए एल्गोरिदम का उपयोग करके बैकएंड स्टोर पर क्वेरी करता है; RetrieveAndGenerate API अमेज़ॅन बेडरॉक द्वारा प्रदान किए गए उपयोगकर्ता-कॉन्फ़िगर एलएलएम का उपयोग करता है और प्राकृतिक भाषा में अंतिम उत्तर उत्पन्न करता है। मूल ट्रैसेबिलिटी समर्थन किसी प्रश्न का उत्तर देने के लिए उपयोग किए गए स्रोतों के बारे में अनुरोध करने वाले एप्लिकेशन को सूचित करता है। उद्यम कार्यान्वयन के लिए, नॉलेज बेस समर्थन करता है AWS प्रमुख प्रबंधन सेवा (एडब्ल्यूएस केएमएस) एन्क्रिप्शन, AWS क्लाउडट्रिल एकीकरण, और भी बहुत कुछ।

निम्नलिखित अनुभागों में, हम प्रदर्शित करते हैं कि दवा खोज उपयोग के मामले के लिए एक असंरचित नैदानिक ​​​​परीक्षण डेटासेट का विश्लेषण करने के लिए, ओपनसर्च सर्वरलेस वेक्टर इंजन द्वारा समर्थित अमेज़ॅन बेडरॉक के लिए नॉलेज बेस का उपयोग करके आरएजी वर्कफ़्लो कैसे बनाया जाए। यह डेटा जानकारी से भरपूर है लेकिन काफी हद तक विविध हो सकता है। अंतर्दृष्टि का पता लगाने और विश्लेषणात्मक अखंडता सुनिश्चित करने के लिए विभिन्न प्रारूपों में विशेष शब्दावली और अवधारणाओं का उचित संचालन आवश्यक है। अमेज़ॅन बेडरॉक के लिए नॉलेज बेस के साथ, आप सरल, प्राकृतिक प्रश्नों के माध्यम से विस्तृत जानकारी तक पहुंच सकते हैं।

अमेज़ॅन बेडरॉक के लिए एक ज्ञान आधार बनाएं

इस अनुभाग में, हम कंसोल के माध्यम से अमेज़ॅन बेडरॉक के लिए एक ज्ञान आधार बनाने की प्रक्रिया का प्रदर्शन करते हैं। निम्नलिखित चरणों को पूरा करें:

  1. अमेज़ॅन बेडरॉक कंसोल पर, नीचे वाद्य-स्थान नेविगेशन फलक में, चुनें नॉलेज बेस.
  2. चुनें ज्ञान का आधार बनाएं.

  1. में ज्ञान आधार विवरण अनुभाग, एक नाम और वैकल्पिक विवरण दर्ज करें।
  2. में आईएएम अनुमतियां अनुभाग चुनें एक नई सेवा भूमिका बनाएं और उसका उपयोग करें.
  3. के लिए सेवा का नाम भूमिका, अपनी भूमिका के लिए एक नाम दर्ज करें, जो इससे शुरू होना चाहिए AmazonBedrockExecutionRoleForKnowledgeBase_.
  4. चुनें अगला.

  1. में डेटा स्रोत अनुभाग में, अपने डेटा स्रोत और S3 URI के लिए एक नाम दर्ज करें जहां डेटासेट स्थित है। नॉलेज बेस निम्नलिखित फ़ाइल स्वरूपों का समर्थन करता है:
    • सादा पाठ (.txt)
    • मार्कडाउन (.md)
    • हाइपरटेक्स्ट मार्कअप लैंग्वेज (.html)
    • माइक्रोसॉफ्ट वर्ड दस्तावेज़ (.doc/.docx)
    • अल्पविराम से अलग किए गए मान (.csv)
    • माइक्रोसॉफ्ट एक्सेल स्प्रेडशीट (.xls/.xlsx)
    • पोर्टेबल दस्तावेज़ प्रारूप (.pdf)
  1. के अंतर्गत अतिरिक्त सेटिंग्स¸ अपनी पसंदीदा चंकिंग रणनीति चुनें (इस पोस्ट के लिए, हम चुनते हैं निश्चित आकार का टुकड़ा) और प्रतिशत में चंक आकार और ओवरले निर्दिष्ट करें। वैकल्पिक रूप से, आप डिफ़ॉल्ट सेटिंग्स का उपयोग कर सकते हैं।
  2. चुनें अगला.

  1. में एंबेडिंग मॉडल अनुभाग, अमेज़ॅन बेडरॉक से टाइटन एंबेडिंग मॉडल चुनें।
  2. में वेक्टर डेटाबेस अनुभाग चुनें शीघ्रता से एक नया वेक्टर स्टोर बनाएं, जो वेक्टर स्टोर स्थापित करने की प्रक्रिया का प्रबंधन करता है।
  3. चुनें अगला.

  1. सेटिंग्स की समीक्षा करें और चुनें ज्ञान का आधार बनाएं.

  1. ज्ञान आधार निर्माण पूरा होने और उसकी स्थिति की पुष्टि होने तक प्रतीक्षा करें तैयार.
  2. में डेटा स्रोत अनुभाग, या पृष्ठ के शीर्ष पर बैनर पर या परीक्षण विंडो में पॉपअप पर, चुनें सिंक S3 बकेट से डेटा लोड करने की प्रक्रिया को ट्रिगर करने के लिए, इसे आपके द्वारा निर्दिष्ट आकार के टुकड़ों में विभाजित करना, चयनित टेक्स्ट एम्बेडिंग मॉडल का उपयोग करके वेक्टर एम्बेडिंग उत्पन्न करना, और उन्हें अमेज़ॅन बेडरॉक के लिए नॉलेज बेस द्वारा प्रबंधित वेक्टर स्टोर में संग्रहीत करना।

सिंक फ़ंक्शन अमेज़ॅन S3 में दस्तावेज़ों में परिवर्तन के आधार पर वेक्टर इंडेक्स से दस्तावेज़ों को शामिल करने, अपडेट करने और हटाने का समर्थन करता है। आप भी उपयोग कर सकते हैं StartIngestionJob AWS SDK के माध्यम से सिंक को ट्रिगर करने के लिए एपीआई।

जब सिंक पूरा हो जाता है, तो सिंक इतिहास स्थिति दिखाता है पूरा कर लिया है।

ज्ञान आधार पर प्रश्न पूछें

इस अनुभाग में, हम प्रदर्शित करते हैं कि सीधे और स्वाभाविक प्रश्नों के माध्यम से ज्ञान आधार में विस्तृत जानकारी तक कैसे पहुंचा जाए। हम पीडीएफ फाइलों से युक्त एक असंरचित सिंथेटिक डेटासेट का उपयोग करते हैं, प्रत्येक की पृष्ठ संख्या 10-100 पृष्ठों तक होती है, जो सांख्यिकीय विश्लेषण विधियों और प्रतिभागी सहमति प्रपत्रों सहित प्रस्तावित नई दवा की नैदानिक ​​​​परीक्षण योजना का अनुकरण करती है। हम अमेज़ॅन बेडरॉक के लिए ज्ञानकोष का उपयोग करते हैं retrieve_and_generate और retrieve एपीआई के साथ अमेज़ॅन बेडरॉक लैंगचेन एकीकरण.

इससे पहले कि आप अमेज़ॅन बेडरॉक एपीआई का उपयोग करने वाली स्क्रिप्ट लिख सकें, आपको अपने वातावरण में एडब्ल्यूएस एसडीके का उचित संस्करण स्थापित करना होगा। पायथन स्क्रिप्ट के लिए, यह होगा अजगर के लिए AWS SDK (Boto3):

pip install langchain
pip install boto3

इसके अतिरिक्त, अमेज़ॅन टाइटन एंबेडिंग मॉडल और एंथ्रोपिक क्लाउड v2 या v1 तक पहुंच सक्षम करें। अधिक जानकारी के लिए देखें मॉडल पहुंच.

अमेज़ॅन बेडरॉक का उपयोग करके प्रश्न उत्पन्न करें

हम क्लिनिकल परीक्षण डेटासेट पर पूछे जाने वाले प्रश्नों की एक सूची प्रस्तावित करने के लिए अमेज़ॅन बेडरॉक के लिए एंथ्रोपिक क्लाउड 2.1 का उपयोग कर सकते हैं:

import boto3
from langchain.llms.bedrock import Bedrock

bedrock_client = boto3.client("bedrock-runtime")

# Start with the query
prompt = "For medical research trial consent forms to sign, what are the top 5 questions can be asked?"

claude_llm = Bedrock(
    model_id="anthropic.claude-v2:1",
    model_kwargs={"temperature": 0, "top_k": 10, "max_tokens_to_sample": 3000},
    client=bedrock_client,
)

# Provide the prompt to the LLM to generate an answer to the query without any additional context provided
response = claude_llm(prompt)
questions = [
    item.split(".")[1].strip() for item in response.strip().split("nn")[1:-1]
]
questions
>>> answer:
'What is the purpose of the study? Make sure you understand the goals of the research and what the study procedures will entail',
'What are the risks and potential benefits? The form should explain all foreseeable risks, side effects, or discomforts you might experience from participating',
'What will participation involve? Get details on what tests, medications, lifestyle changes, or procedures you will go through, how much time it will take, and how long the study will last',
'Are there any costs or payments? Ask if you will be responsible for any costs related to the study or get paid for participating',
'How will my privacy be protected? The form should explain how your personal health information will be kept confidential before, during, and after the trial'

Amazon Bedrock RetrieveAndGenerate API का उपयोग करें

पूरी तरह से प्रबंधित आरएजी अनुभव के लिए, आप अमेज़ॅन बेडरॉक के लिए मूल ज्ञानकोष का उपयोग कर सकते हैं RetrieveAndGenerate सीधे उत्तर प्राप्त करने के लिए एपीआई:

bedrock_agent_client = boto3.client("bedrock-agent-runtime")

kb_id = "<YOUR_KNOWLEDGE_BASE_ID>"

def retrieveAndGenerate(
    input: str,
    kbId: str,
    region: str = "us-east-1",
    sessionId: str = None,
    model_id: str = "anthropic.claude-v2:1",
):
    model_arn = f"arn:aws:bedrock:{region}::foundation-model/{model_id}"

    if sessionId:
        return bedrock_agent_client.retrieve_and_generate(
            input={"text": input},
            retrieveAndGenerateConfiguration={
                "type": "KNOWLEDGE_BASE",
                "knowledgeBaseConfiguration": {
                    "knowledgeBaseId": kbId,
                    "modelArn": model_arn,
                },
            },
            sessionId=sessionId,
        )

    else:
        return bedrock_agent_client.retrieve_and_generate(
            input={"text": input},
            retrieveAndGenerateConfiguration={
                "type": "KNOWLEDGE_BASE",
                "knowledgeBaseConfiguration": {
                    "knowledgeBaseId": kbId,
                    "modelArn": model_arn,
                },
            },
        )

response = retrieveAndGenerate(
    "What are the potential risks and benefits of participating?", kb_id
)

generated_text = response["output"]["text"]
>>> "The potential risks include side effects from the study medication lithium such as nausea, loose stools, thirst, urination changes, shakiness, headaches, sweating, fatigue, decreased concentration, and skin rash. There is also a risk of lithium interaction with other medications. For women, there is a risk of birth defects if lithium is taken during pregnancy. There are no guaranteed benefits, but possible benefits include new information that could help the participant from the interviews and tests conducted during the study."

उद्धृत सूचना स्रोत निम्नलिखित कोड के माध्यम से प्राप्त किया जा सकता है (संक्षिप्तता के लिए कुछ आउटपुट को संशोधित करके):

response["citations"]

>>> [
    {
        "generatedResponsePart": {
            "textResponsePart": {
                "text": " The potential risks include side effects from the study...",
                "span": {"start": 0, "end": 361},
            }
        },
        "retrievedReferences": [
            {
                "content": {
                    "text": "590 ICF#2 Page 7 of 19 The primary risks and discomforts of participation…"
                },
                "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
            },
            {
                "content": {
                    "text": "N/A CSP 590 ICF#2 Page 10 of 19 Risks associated with suddenly stopping study medications..."
                },
                "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
            },
        ],
    },
    {
        "generatedResponsePart": {
            "textResponsePart": {
                "text": " There are no guaranteed benefits, but possible benefits include...",
                "span": {"start": 363, "end": 531},
            }
        },
        "retrievedReferences": [
            {
                "content": {
                    "text": "research, not usual clinical care. After these are done we ask..."
                },
                "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
            }
        ],
    },
]

की सत्र आईडी पास करके RetrieveAndGenerate एपीआई, आप बातचीत के संदर्भ को संरक्षित कर सकते हैं और अनुवर्ती प्रश्न पूछ सकते हैं। उदाहरण के लिए, संदर्भ के बिना, यदि आप पिछले उत्तर से अधिक विवरण मांगते हैं, तो वह सही उत्तर देने में सक्षम नहीं हो सकता है:

retrieveAndGenerate("elaborate more on the first side effect", kb_id, sessionId=None)["output"]["text"]
>>> "The search results do not provide additional details about the mild nausea side effect that would allow me to elaborate further on it."

लेकिन सत्र आईडी पास करके, आरएजी पाइपलाइन संबंधित संदर्भ की पहचान करने और प्रासंगिक उत्तर देने में सक्षम है:

retrieveAndGenerate("elaborate more on the first side effect", kb_id, sessionId=response["sessionId"])["output"]["text"]
>>> "The search results provide details that nausea from taking lithium is usually mild and goes away after days or weeks for most people. Specifically, up to 75% of people may experience mild nausea when first starting lithium, but this goes away in 90-99% of people who continue taking it."

निम्न तालिका सभी संबंधित प्रश्नों के पुनर्प्राप्त उत्तर दिखाती है।

सवाल उत्तर
अध्ययन का उद्देश्य क्या है? सुनिश्चित करें कि आप शोध के लक्ष्यों को समझते हैं और अध्ययन प्रक्रियाओं में क्या शामिल होगा। अध्ययन का उद्देश्य यह परीक्षण करना है कि क्या लिथियम अवसाद या द्विध्रुवी विकार वाले रोगियों में बार-बार होने वाली आत्मघाती स्व-निर्देशित हिंसा को रोकने में प्रभावी है।
जोखिम और संभावित लाभ क्या हैं? फॉर्म में सभी संभावित जोखिमों, दुष्प्रभावों, या असुविधाओं के बारे में बताया जाना चाहिए जो आपको भाग लेने से अनुभव हो सकते हैं। संभावित जोखिमों या असुविधाओं में शामिल हैं: साक्षात्कार में असुविधा पैदा करने वाले प्रश्न, लिथियम दवा से होने वाले दुष्प्रभाव जैसे मतली, पतला मल, प्यास, पेशाब में बदलाव, कंपकंपी, सिरदर्द, पसीना, थकान, एकाग्रता में कमी, त्वचा पर लाल चकत्ते, थायरॉयड परिवर्तन, मुँहासे का बिगड़ना /सोरायसिस, लिथियम विषाक्तता, और यदि दवा अचानक बंद कर दी जाए तो जोखिम। संभावित लाभ यह है कि परीक्षणों से प्रतिभागियों को मदद करने के लिए नई जानकारी मिल सकती है, और लिथियम अवसाद या द्विध्रुवी विकार वाले लोगों के लिए बार-बार आत्मघाती स्व-निर्देशित हिंसा को रोकने में मदद कर सकता है।
भागीदारी में क्या शामिल होगा? आप किन परीक्षणों, दवाओं, जीवनशैली में बदलावों या प्रक्रियाओं से गुजरेंगे, इसमें कितना समय लगेगा और अध्ययन कितने समय तक चलेगा, इसके बारे में विवरण प्राप्त करें। भागीदारी में एक साक्षात्कार और प्रश्नावली को पूरा करना शामिल होगा जिसमें सोच, व्यवहार, मानसिक स्वास्थ्य उपचार, दवाएं, शराब और नशीली दवाओं का उपयोग, घरेलू और सामाजिक समर्थन और अनुसंधान अध्ययन की समझ शामिल होगी। इसमें लगभग दो घंटे लगते हैं और इसे कई सत्रों में, व्यक्तिगत रूप से और फ़ोन द्वारा किया जा सकता है। यदि पूर्ण अध्ययन के लिए पात्र हैं, तो एक वर्ष में लगभग 20 अध्ययन दौरे होंगे। इसमें अध्ययन दवा लेना, महत्वपूर्ण संकेतों की जांच करना, प्रश्नावली को पूरा करना, दुष्प्रभावों की समीक्षा करना और सामान्य चिकित्सा और मानसिक स्वास्थ्य देखभाल जारी रखना शामिल होगा।
क्या कोई लागत या भुगतान है? पूछें कि क्या आप अध्ययन से संबंधित किसी भी लागत के लिए जिम्मेदार होंगे या भाग लेने के लिए भुगतान प्राप्त करेंगे। हाँ, खोज परिणामों में लागतों और भुगतानों पर चर्चा की गई है। अध्ययन का हिस्सा होने वाले किसी भी उपचार या प्रक्रिया के लिए आपसे शुल्क नहीं लिया जाएगा। हालाँकि, आपको अभी भी अध्ययन से संबंधित देखभाल और दवाओं के लिए किसी भी सामान्य वीए सह-भुगतान का भुगतान करना होगा। आपको भागीदारी के लिए भुगतान नहीं किया जाएगा, लेकिन अध्ययन भागीदारी से संबंधित परिवहन, पार्किंग आदि जैसे खर्चों की प्रतिपूर्ति करेगा। प्रतिपूर्ति राशि और प्रक्रिया प्रदान की गई है।
मेरी गोपनीयता कैसे सुरक्षित रहेगी? फॉर्म में बताया जाना चाहिए कि परीक्षण से पहले, उसके दौरान और बाद में आपकी व्यक्तिगत स्वास्थ्य जानकारी को कैसे गोपनीय रखा जाएगा। निजी तौर पर साक्षात्कार आयोजित करने, बंद फाइलों और कार्यालयों में लिखित नोट्स रखने, एन्क्रिप्टेड और पासवर्ड संरक्षित फाइलों में इलेक्ट्रॉनिक जानकारी संग्रहीत करने और आपकी पहचान करने वाली जानकारी का खुलासा करने से रोकने के लिए स्वास्थ्य और मानव सेवा विभाग से गोपनीयता प्रमाणपत्र प्राप्त करने से आपकी गोपनीयता सुरक्षित रहेगी। . आपकी पहचान करने वाली जानकारी आपकी देखभाल के लिए जिम्मेदार डॉक्टरों या सरकारी एजेंसियों द्वारा ऑडिट और मूल्यांकन के लिए साझा की जा सकती है, लेकिन अध्ययन के बारे में बातचीत और कागजात आपकी पहचान नहीं करेंगे।

अमेज़ॅन बेडरॉक रिट्रीव एपीआई का उपयोग करके क्वेरी करें

अपने आरएजी वर्कफ़्लो को अनुकूलित करने के लिए, आप अपनी क्वेरी के आधार पर प्रासंगिक खंड लाने के लिए रिट्रीव एपीआई का उपयोग कर सकते हैं और इसे अमेज़ॅन बेडरॉक द्वारा प्रदान किए गए किसी भी एलएलएम में भेज सकते हैं। पुनर्प्राप्त एपीआई का उपयोग करने के लिए, इसे निम्नानुसार परिभाषित करें:

def retrieve(query: str, kbId: str, numberOfResults: int = 5):
    return bedrock_agent_client.retrieve(
        retrievalQuery={"text": query},
        knowledgeBaseId=kbId,
        retrievalConfiguration={
            "vectorSearchConfiguration": {"numberOfResults": numberOfResults}
        },
    )

संबंधित संदर्भ पुनः प्राप्त करें (संक्षिप्तता के लिए कुछ आउटपुट को संशोधित करके):

query = "What is the purpose of the medical research study?"
response = retrieve(query, kb_id, 3)
retrievalResults = response["retrievalResults"]
>>> [
    {
        "content": {"text": "You will not be charged for any procedures that..."},
        "location": {"type": "S3", "s3Location": {"uri": "s3://XXXXX/XXXX.pdf"}},
        "score": 0.6552521,
    },
    {
        "content": {"text": "and possible benefits of the study. You have been..."},
        "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
        "score": 0.6581577,
    },
    ...,
]

शीघ्र टेम्पलेट के लिए संदर्भ निकालें:

def get_contexts(retrievalResults):
    contexts = []
    for retrievedResult in retrievalResults:
        contexts.append(retrievedResult["content"]["text"])
    return " ".join(contexts)

contexts = get_contexts(retrievalResults)

पायथन मॉड्यूल आयात करें और इन-संदर्भ प्रश्न उत्तर शीघ्र टेम्पलेट सेट करें, फिर अंतिम उत्तर तैयार करें:

from langchain.prompts import PromptTemplate

PROMPT_TEMPLATE = """
Human: You are an AI system working on medical trial research, and provides answers to questions 
by using fact based and statistical information when possible.
Use the following pieces of information to provide a concise answer to the question enclosed in <question> tags.
If you don't know the answer, just say that you don't know, don't try to make up an answer.

<context>
{context_str}
</context>

<question>
{query_str}
</question>

The response should be specific and use statistics or numbers when possible.

Assistant:"""

claude_prompt = PromptTemplate(
    template=PROMPT_TEMPLATE, input_variables=["context_str", "query_str"]
)

prompt = claude_prompt.format(context_str=contexts, query_str=query)
response = claude_llm(prompt)
>>> "Based on the context provided, the purpose of this medical research study is to evaluate the efficacy of lithium compared to a placebo in preventing suicide over a 1 year period. Specifically, participants will be randomly assigned to receive either lithium or a placebo pill for 1 year, with their doctors and the participants themselves not knowing which treatment they receive (double-blind). Blood lithium levels will be monitored and doses adjusted over the first 6-8 visits, then participants will be followed monthly for 1 year to assess outcomes."

अमेज़ॅन बेडरॉक लैंगचेन एकीकरण का उपयोग करके क्वेरी

एंड-टू-एंड अनुकूलित क्यू एंड ए एप्लिकेशन बनाने के लिए, अमेज़ॅन बेडरॉक के लिए नॉलेज बेस लैंगचेन के साथ एकीकरण प्रदान करता है। लैंगचेन रिट्रीवर सेट करने के लिए, नॉलेज बेस आईडी प्रदान करें और क्वेरी से लौटने वाले परिणामों की संख्या निर्दिष्ट करें:

from langchain.retrievers.bedrock import AmazonKnowledgeBasesRetriever

retriever = AmazonKnowledgeBasesRetriever(
    knowledge_base_id=kb_id,
    retrieval_config={"vectorSearchConfiguration": {"numberOfResults": 4}},
)

अब लैंगचेन रिट्रीवलक्यूए सेट करें और ज्ञानकोष से उत्तर तैयार करें:

from langchain.chains import RetrievalQA

qa = RetrievalQA.from_chain_type(
    llm=claude_llm,
    chain_type="stuff",
    retriever=retriever,
    return_source_documents=True,
    chain_type_kwargs={"prompt": claude_prompt},
)

[qa(q)["result"] for q in questions]

यह पिछली तालिका में सूचीबद्ध उत्तरों के समान ही उत्तर उत्पन्न करेगा।

क्लीन अप

अतिरिक्त शुल्क लगने से बचने के लिए निम्नलिखित संसाधनों को हटाना सुनिश्चित करें:

निष्कर्ष

अमेज़ॅन बेडरॉक सभी स्तरों के आरएजी अनुप्रयोगों को सशक्त बनाने के लिए गहन एकीकृत सेवाओं का एक व्यापक सेट प्रदान करता है, जिससे आपकी कंपनी के डेटा का विश्लेषण शुरू करना आसान हो जाता है। अमेज़ॅन बेडरॉक के लिए नॉलेज बेस आंतरिक और ग्राहक-सामना वाले अनुप्रयोगों की एक विस्तृत श्रृंखला को सशक्त बनाने के लिए स्केलेबल दस्तावेज़ एम्बेडिंग पाइपलाइन और दस्तावेज़ पुनर्प्राप्ति सेवाओं का निर्माण करने के लिए अमेज़ॅन बेडरॉक फाउंडेशन मॉडल के साथ एकीकृत होता है। हम भविष्य को लेकर उत्साहित हैं और आपकी प्रतिक्रिया इस उत्पाद की प्रगति का मार्गदर्शन करने में महत्वपूर्ण भूमिका निभाएगी। अमेज़ॅन बेडरॉक की क्षमताओं और ज्ञानकोषों के बारे में अधिक जानने के लिए, देखें अमेज़ॅन बेडरॉक के लिए ज्ञान का आधार.


लेखक के बारे में

मार्क रॉय AWS के लिए एक प्रमुख मशीन लर्निंग आर्किटेक्ट है, जो ग्राहकों को AI/ML समाधान डिजाइन करने और बनाने में मदद करता है। मार्क का काम एमएल उपयोग के मामलों की एक विस्तृत श्रृंखला को कवर करता है, जिसमें प्राथमिक रुचि कंप्यूटर विज़न, गहन शिक्षा और पूरे उद्यम में एमएल को स्केल करना है। उन्होंने बीमा, वित्तीय सेवाओं, मीडिया और मनोरंजन, स्वास्थ्य सेवा, उपयोगिताओं और विनिर्माण सहित कई उद्योगों में कंपनियों की मदद की है। मार्क के पास एमएल स्पेशलिटी सर्टिफिकेशन सहित छह एडब्ल्यूएस प्रमाणन हैं। AWS में शामिल होने से पहले, मार्क 25 वर्षों से अधिक समय तक एक वास्तुकार, डेवलपर और प्रौद्योगिकी नेता थे, जिसमें वित्तीय सेवाओं में 19 वर्ष भी शामिल थे।

मणि खानूजा एक टेक लीड - जेनेरेटिव एआई स्पेशलिस्ट, पुस्तक की लेखिका - एप्लाइड मशीन लर्निंग एंड हाई परफॉर्मेंस कंप्यूटिंग ऑन एडब्ल्यूएस, और मैन्युफैक्चरिंग एजुकेशन फाउंडेशन बोर्ड में महिलाओं के लिए निदेशक मंडल की सदस्य हैं। वह कंप्यूटर विज़न, प्राकृतिक भाषा प्रसंस्करण और जेनरेटिव एआई जैसे विभिन्न डोमेन में मशीन लर्निंग (एमएल) परियोजनाओं का नेतृत्व करती हैं। वह ग्राहकों को बड़े पैमाने पर मशीन लर्निंग मॉडल बनाने, प्रशिक्षित करने और तैनात करने में मदद करती है। वह आंतरिक और बाहरी सम्मेलनों जैसे री:इन्वेंट, वीमेन इन मैन्युफैक्चरिंग वेस्ट, यूट्यूब वेबिनार और जीएचसी 23 में बोलती हैं। अपने खाली समय में, वह समुद्र तट के किनारे लंबी सैर करना पसंद करती हैं।

डॉ. बाइचुआन सुनवर्तमान में एडब्ल्यूएस में सीनियर एआई/एमएल सॉल्यूशन आर्किटेक्ट के रूप में कार्यरत, जेनेरिक एआई पर ध्यान केंद्रित करते हैं और व्यावहारिक, क्लाउड-आधारित व्यावसायिक समाधान प्रदान करने के लिए डेटा विज्ञान और मशीन लर्निंग में अपने ज्ञान को लागू करते हैं। प्रबंधन परामर्श और एआई समाधान वास्तुकला में अनुभव के साथ, वह रोबोटिक्स कंप्यूटर विज़न, समय श्रृंखला पूर्वानुमान और भविष्य कहनेवाला रखरखाव सहित कई जटिल चुनौतियों का समाधान करते हैं। उनका काम परियोजना प्रबंधन, सॉफ्टवेयर अनुसंधान एवं विकास और अकादमिक गतिविधियों की ठोस पृष्ठभूमि पर आधारित है। काम के अलावा, डॉ. सन यात्रा करने और परिवार और दोस्तों के साथ समय बिताने में संतुलन का आनंद लेते हैं।

डेरिक चू AWS में एक वरिष्ठ समाधान वास्तुकार हैं जो क्लाउड पर ग्राहकों की यात्रा को तेज़ करने और क्लाउड-आधारित समाधानों को अपनाने के माध्यम से उनके व्यवसाय को बदलने पर केंद्रित हैं। उनकी विशेषज्ञता फुल स्टैक एप्लिकेशन और मशीन लर्निंग डेवलपमेंट में है। वह ग्राहकों को फ्रंटएंड यूजर इंटरफेस, IoT एप्लिकेशन, एपीआई और डेटा इंटीग्रेशन और मशीन लर्निंग मॉडल को कवर करते हुए एंड-टू-एंड समाधान डिजाइन करने और बनाने में मदद करता है। अपने खाली समय में, वह अपने परिवार के साथ समय बिताना और फोटोग्राफी और वीडियोग्राफी के साथ प्रयोग करना पसंद करते हैं।

फ्रैंक विंकलर सिंगापुर स्थित AWS में एक वरिष्ठ समाधान वास्तुकार और जेनरेटिव AI विशेषज्ञ हैं, जो मशीन लर्निंग और जेनरेटिव AI में केंद्रित हैं। वह AWS पर स्केलेबल, सुरक्षित और लागत प्रभावी उत्पादों और सेवाओं को तैयार करने के लिए वैश्विक डिजिटल देशी कंपनियों के साथ काम करता है। अपने खाली समय में, वह अपने बेटे और बेटी के साथ समय बिताते हैं और आसियान की लहरों का आनंद लेने के लिए यात्रा करते हैं।

निहीर चदरवाला ग्लोबल हेल्थकेयर और लाइफ साइंसेज टीम में एक सीनियर एआई/एमएल सॉल्यूशंस आर्किटेक्ट हैं। उनकी विशेषज्ञता विशेष रूप से बायोमेडिकल, जीवन विज्ञान और स्वास्थ्य सेवा क्षेत्र में ग्राहकों की समस्याओं के लिए बिग डेटा और एआई-संचालित समाधान बनाने में है। वह क्वांटम सूचना विज्ञान और एआई के अंतर्संबंध को लेकर भी उत्साहित हैं और इस क्षेत्र में सीखने और योगदान करने का आनंद लेते हैं। अपने खाली समय में, उन्हें टेनिस खेलना, यात्रा करना और ब्रह्मांड विज्ञान के बारे में सीखना पसंद है।

स्पॉट_आईएमजी

नवीनतम खुफिया

स्पॉट_आईएमजी