شعار زيفيرنت

استخدم RAG لاكتشاف الأدوية باستخدام قواعد المعرفة لـ Amazon Bedrock | خدمات الويب الأمازون

التاريخ:

أمازون بيدروك توفر مجموعة واسعة من النماذج من Amazon وموفري الطرف الثالث، بما في ذلك Anthropic وAI21 وMeta وCohere وStability AI، وتغطي نطاقًا واسعًا من حالات الاستخدام، بما في ذلك إنشاء النصوص والصور والتضمين والدردشة والوكلاء رفيعي المستوى. مع المنطق والتنسيق، وأكثر من ذلك. قواعد المعرفة لأمازون بيدروك يتيح لك إنشاء تطبيقات توليد الاسترجاع المعزز (RAG) عالية الأداء ومخصصة أعلى AWS ومخازن المتجهات التابعة لجهات خارجية باستخدام نماذج AWS ونماذج الجهات الخارجية. تقوم قواعد المعرفة الخاصة بـ Amazon Bedrock بأتمتة مزامنة بياناتك مع متجر المتجهات الخاص بك، بما في ذلك تغيير البيانات عند تحديثها، وتحميل المستندات، والتقطيع، بالإضافة إلى التضمين الدلالي. فهو يسمح لك بتخصيص مطالبات RAG واستراتيجيات الاسترداد بسلاسة - فنحن نقدم إسناد المصدر، ونتعامل مع إدارة الذاكرة تلقائيًا. قواعد المعرفة لا تحتوي على خادم تمامًا، لذلك لا تحتاج إلى إدارة أي بنية أساسية، وعند استخدام قواعد المعرفة، لن يتم محاسبتك إلا مقابل النماذج وقواعد البيانات المتجهة والتخزين الذي تستخدمه.

RAG هي تقنية شائعة تجمع بين استخدام البيانات الخاصة ونماذج اللغات الكبيرة (LLMs). يبدأ RAG بخطوة أولية لاسترداد المستندات ذات الصلة من مخزن البيانات (وهو في الغالب فهرس متجه) بناءً على استعلام المستخدم. ثم يستخدم نموذجًا لغويًا لإنشاء استجابة من خلال النظر في كل من المستندات المستردة والاستعلام الأصلي.

في هذا المنشور، نوضح كيفية إنشاء سير عمل RAG باستخدام قواعد المعرفة لـ Amazon Bedrock لحالة استخدام اكتشاف الأدوية.

نظرة عامة على قواعد المعرفة لـ Amazon Bedrock

تدعم قواعد المعرفة الخاصة بـ Amazon Bedrock نطاقًا واسعًا من أنواع الملفات الشائعة، بما في ذلك .txt، و.docx، و.pdf، و.csv، والمزيد. لتمكين الاسترداد الفعال من البيانات الخاصة، تتمثل الممارسة الشائعة في تقسيم هذه المستندات أولاً إلى أجزاء يمكن التحكم فيها. قامت قواعد المعرفة بتطبيق إستراتيجية التجزئة الافتراضية التي تعمل بشكل جيد في معظم الحالات للسماح لك بالبدء بشكل أسرع. إذا كنت تريد المزيد من التحكم، تتيح لك قواعد المعرفة التحكم في استراتيجية التقسيم من خلال مجموعة من الخيارات المكونة مسبقًا. يمكنك التحكم في الحد الأقصى لحجم الرمز المميز ومقدار التداخل الذي سيتم إنشاؤه عبر القطع لتوفير سياق متماسك للتضمين. تدير قواعد المعرفة الخاصة بـ Amazon Bedrock عملية مزامنة البيانات من جهازك خدمة تخزين أمازون البسيطة (Amazon S3)، ويقسمها إلى أجزاء أصغر، وينشئ عمليات تضمين متجهة، ويخزن عمليات التضمين في فهرس متجه. تأتي هذه العملية مع إدارة ذكية للفرق والإنتاجية والفشل.

في وقت التشغيل، يتم استخدام نموذج التضمين لتحويل استعلام المستخدم إلى متجه. يتم بعد ذلك الاستعلام عن فهرس المتجه للعثور على مستندات مشابهة لاستعلام المستخدم من خلال مقارنة متجهات المستند بمتجه استعلام المستخدم. في الخطوة الأخيرة، تتم إضافة المستندات المتشابهة لغويًا التي تم استردادها من فهرس المتجهات كسياق لاستعلام المستخدم الأصلي. عند إنشاء استجابة للمستخدم، تتم مطالبة المستندات المتشابهة لغويًا في نموذج النص، جنبًا إلى جنب مع إسناد المصدر لإمكانية التتبع.

تدعم قواعد المعرفة الخاصة بـ Amazon Bedrock قواعد بيانات متجهة متعددة، بما في ذلك أمازون أوبن سيرش سيرفرليس, أمازون أوروراوPinecone وRedis Enterprise Cloud. تسمح واجهات برمجة التطبيقات Retrieve and RetrieveAndGenerate لتطبيقاتك بالاستعلام مباشرة عن الفهرس باستخدام بناء جملة موحد ومعياري دون الحاجة إلى تعلم واجهات برمجة التطبيقات المنفصلة لكل قاعدة بيانات متجهة مختلفة، مما يقلل الحاجة إلى كتابة استعلامات فهرس مخصصة مقابل متجر المتجهات الخاص بك. تأخذ واجهة برمجة التطبيقات Retrieve الاستعلام الوارد، وتحوله إلى ناقل تضمين، وتقوم بالاستعلام عن مخزن الواجهة الخلفية باستخدام الخوارزميات التي تم تكوينها على مستوى قاعدة بيانات المتجهات؛ تستخدم واجهة برمجة التطبيقات RetrieveAndGenerate دورة LLM تم تكوينها بواسطة المستخدم والمقدمة من Amazon Bedrock وتقوم بإنشاء الإجابة النهائية باللغة الطبيعية. يقوم دعم التتبع الأصلي بإبلاغ التطبيق الطالب بالمصادر المستخدمة للإجابة على السؤال. بالنسبة لتطبيقات المؤسسات، تدعم قواعد المعرفة خدمة إدارة مفتاح AWS تشفير (AWS KMS)، أوس كلاود تريل التكامل والمزيد.

في الأقسام التالية، نوضح كيفية إنشاء سير عمل RAG باستخدام قواعد المعرفة لـ Amazon Bedrock، المدعومة بمحرك ناقل OpenSearch Serverless، لتحليل مجموعة بيانات التجارب السريرية غير المنظمة لحالة استخدام اكتشاف الأدوية. هذه البيانات غنية بالمعلومات ولكنها يمكن أن تكون غير متجانسة إلى حد كبير. يعد التعامل السليم مع المصطلحات والمفاهيم المتخصصة بتنسيقات مختلفة أمرًا ضروريًا لاكتشاف الرؤى وضمان التكامل التحليلي. باستخدام قواعد المعرفة الخاصة بـ Amazon Bedrock، يمكنك الوصول إلى المعلومات التفصيلية من خلال استعلامات بسيطة وطبيعية.

قم ببناء قاعدة معرفية لـ Amazon Bedrock

في هذا القسم، نعرض عملية إنشاء قاعدة معرفية لـ Amazon Bedrock عبر وحدة التحكم. أكمل الخطوات التالية:

  1. على وحدة تحكم Amazon Bedrock، أسفل تزامن في جزء التنقل ، اختر قاعدة المعرفة.
  2. اختار إنشاء قاعدة المعرفة.

  1. في مجلة تفاصيل قاعدة المعرفة القسم، أدخل اسمًا ووصفًا اختياريًا.
  2. في مجلة أذونات IAM القسم، حدد إنشاء دور خدمة جديد واستخدامه.
  3. في حالة دور اسم الخدمة، أدخل اسمًا لدورك، والذي يجب أن يبدأ به AmazonBedrockExecutionRoleForKnowledgeBase_.
  4. اختار التالى.

  1. في مجلة مصدر البيانات القسم، أدخل اسمًا لمصدر البيانات الخاص بك وS3 URI حيث توجد مجموعة البيانات. تدعم قواعد المعرفة تنسيقات الملفات التالية:
    • نص عادي (.txt)
    • تخفيض السعر (.md)
    • لغة ترميز النص التشعبي (.html)
    • مستند Microsoft Word (.doc/.docx)
    • قيم مفصولة بفواصل (.csv)
    • جدول بيانات Microsoft Excel (.xls/.xlsx)
    • تنسيق المستندات المحمولة (pdf.)
  1. تحت إعدادات إضافية¸ اختر استراتيجية التقطيع المفضلة لديك (لهذا المنشور، نختار قطع حجم ثابت) وحدد حجم القطعة والتراكب بالنسبة المئوية. وبدلاً من ذلك، يمكنك استخدام الإعدادات الافتراضية.
  2. اختار التالى.

  1. في مجلة نموذج التضمين القسم، اختر نموذج Titan Embeddings من Amazon Bedrock.
  2. في مجلة قاعدة بيانات المتجهات القسم، حدد إنشاء متجر ناقلات جديد بسرعة، الذي يدير عملية إعداد متجر المتجهات.
  3. اختار التالى.

  1. راجع الإعدادات واختر إنشاء قاعدة المعرفة.

  1. انتظر حتى يكتمل إنشاء قاعدة المعرفة وتأكد من حالتها استعداد.
  2. في مجلة مصدر البيانات القسم، أو على الشعار الموجود أعلى الصفحة أو النافذة المنبثقة في نافذة الاختبار، اختر مزامنة لبدء عملية تحميل البيانات من حاوية S3، وتقسيمها إلى أجزاء بالحجم الذي حددته، وإنشاء عمليات تضمين متجهة باستخدام نموذج تضمين النص المحدد، وتخزينها في مخزن المتجهات المُدار بواسطة Knowledge Bases لـ Amazon Bedrock.

تدعم وظيفة المزامنة استيعاب المستندات وتحديثها وحذفها من فهرس المتجهات بناءً على التغييرات التي يتم إجراؤها على المستندات في Amazon S3. يمكنك أيضًا استخدام StartIngestionJob API لتشغيل المزامنة عبر AWS SDK.

عند اكتمال المزامنة، يعرض سجل المزامنة الحالة الانتهاء.

الاستعلام عن قاعدة المعرفة

نوضح في هذا القسم كيفية الوصول إلى المعلومات التفصيلية في قاعدة المعرفة من خلال الاستعلامات المباشرة والطبيعية. نحن نستخدم مجموعة بيانات تركيبية غير منظمة تتكون من ملفات PDF، يتراوح رقم صفحة كل منها من 10 إلى 100 صفحة، ومحاكاة خطة تجربة سريرية لدواء جديد مقترح بما في ذلك طرق التحليل الإحصائي ونماذج موافقة المشاركين. نحن نستخدم قواعد المعرفة لـ Amazon Bedrock retrieve_and_generate و retrieve واجهات برمجة التطبيقات مع تكامل أمازون بيدروك لانج تشين.

قبل أن تتمكن من كتابة البرامج النصية التي تستخدم Amazon Bedrock API، ستحتاج إلى تثبيت الإصدار المناسب من AWS SDK في بيئتك. بالنسبة لنصوص بايثون، سيكون هذا هو AWS SDK لـ Python (Boto3):

pip install langchain
pip install boto3

بالإضافة إلى ذلك، قم بتمكين الوصول إلى نموذج Amazon Titan Embeddings وAnthropic Claude v2 أو v1. لمزيد من المعلومات، راجع الوصول إلى النموذج.

قم بإنشاء أسئلة باستخدام Amazon Bedrock

يمكننا استخدام Anthropic Claude 2.1 لـ Amazon Bedrock لاقتراح قائمة من الأسئلة التي يجب طرحها على مجموعة بيانات التجارب السريرية:

import boto3
from langchain.llms.bedrock import Bedrock

bedrock_client = boto3.client("bedrock-runtime")

# Start with the query
prompt = "For medical research trial consent forms to sign, what are the top 5 questions can be asked?"

claude_llm = Bedrock(
    model_id="anthropic.claude-v2:1",
    model_kwargs={"temperature": 0, "top_k": 10, "max_tokens_to_sample": 3000},
    client=bedrock_client,
)

# Provide the prompt to the LLM to generate an answer to the query without any additional context provided
response = claude_llm(prompt)
questions = [
    item.split(".")[1].strip() for item in response.strip().split("nn")[1:-1]
]
questions
>>> answer:
'What is the purpose of the study? Make sure you understand the goals of the research and what the study procedures will entail',
'What are the risks and potential benefits? The form should explain all foreseeable risks, side effects, or discomforts you might experience from participating',
'What will participation involve? Get details on what tests, medications, lifestyle changes, or procedures you will go through, how much time it will take, and how long the study will last',
'Are there any costs or payments? Ask if you will be responsible for any costs related to the study or get paid for participating',
'How will my privacy be protected? The form should explain how your personal health information will be kept confidential before, during, and after the trial'

استخدم واجهة برمجة تطبيقات Amazon Bedrock RetrieveAndGenerate

للحصول على تجربة RAG مُدارة بالكامل، يمكنك استخدام قواعد المعرفة الأصلية لـ Amazon Bedrock RetrieveAndGenerate API للحصول على الإجابات مباشرة:

bedrock_agent_client = boto3.client("bedrock-agent-runtime")

kb_id = "<YOUR_KNOWLEDGE_BASE_ID>"

def retrieveAndGenerate(
    input: str,
    kbId: str,
    region: str = "us-east-1",
    sessionId: str = None,
    model_id: str = "anthropic.claude-v2:1",
):
    model_arn = f"arn:aws:bedrock:{region}::foundation-model/{model_id}"

    if sessionId:
        return bedrock_agent_client.retrieve_and_generate(
            input={"text": input},
            retrieveAndGenerateConfiguration={
                "type": "KNOWLEDGE_BASE",
                "knowledgeBaseConfiguration": {
                    "knowledgeBaseId": kbId,
                    "modelArn": model_arn,
                },
            },
            sessionId=sessionId,
        )

    else:
        return bedrock_agent_client.retrieve_and_generate(
            input={"text": input},
            retrieveAndGenerateConfiguration={
                "type": "KNOWLEDGE_BASE",
                "knowledgeBaseConfiguration": {
                    "knowledgeBaseId": kbId,
                    "modelArn": model_arn,
                },
            },
        )

response = retrieveAndGenerate(
    "What are the potential risks and benefits of participating?", kb_id
)

generated_text = response["output"]["text"]
>>> "The potential risks include side effects from the study medication lithium such as nausea, loose stools, thirst, urination changes, shakiness, headaches, sweating, fatigue, decreased concentration, and skin rash. There is also a risk of lithium interaction with other medications. For women, there is a risk of birth defects if lithium is taken during pregnancy. There are no guaranteed benefits, but possible benefits include new information that could help the participant from the interviews and tests conducted during the study."

يمكن الحصول على مصدر المعلومات المذكور عبر الكود التالي (مع تنقيح بعض المخرجات للإيجاز):

response["citations"]

>>> [
    {
        "generatedResponsePart": {
            "textResponsePart": {
                "text": " The potential risks include side effects from the study...",
                "span": {"start": 0, "end": 361},
            }
        },
        "retrievedReferences": [
            {
                "content": {
                    "text": "590 ICF#2 Page 7 of 19 The primary risks and discomforts of participation…"
                },
                "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
            },
            {
                "content": {
                    "text": "N/A CSP 590 ICF#2 Page 10 of 19 Risks associated with suddenly stopping study medications..."
                },
                "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
            },
        ],
    },
    {
        "generatedResponsePart": {
            "textResponsePart": {
                "text": " There are no guaranteed benefits, but possible benefits include...",
                "span": {"start": 363, "end": 531},
            }
        },
        "retrievedReferences": [
            {
                "content": {
                    "text": "research, not usual clinical care. After these are done we ask..."
                },
                "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
            }
        ],
    },
]

من خلال تمرير معرف الجلسة الخاص بـ RetrieveAndGenerate API، يمكنك الحفاظ على سياق المحادثة وطرح أسئلة المتابعة. على سبيل المثال، بدون السياق، إذا طلبت المزيد من التفاصيل من الإجابة السابقة، فقد لا تتمكن من الإجابة بشكل صحيح:

retrieveAndGenerate("elaborate more on the first side effect", kb_id, sessionId=None)["output"]["text"]
>>> "The search results do not provide additional details about the mild nausea side effect that would allow me to elaborate further on it."

ولكن من خلال تمرير معرف الجلسة، يستطيع مسار RAG تحديد السياق المقابل وإرجاع الإجابات ذات الصلة:

retrieveAndGenerate("elaborate more on the first side effect", kb_id, sessionId=response["sessionId"])["output"]["text"]
>>> "The search results provide details that nausea from taking lithium is usually mild and goes away after days or weeks for most people. Specifically, up to 75% of people may experience mild nausea when first starting lithium, but this goes away in 90-99% of people who continue taking it."

ويبين الجدول التالي الإجابات المستردة لجميع الأسئلة المقابلة.

سؤال إجابة
ما هو الهدف من الدراسة؟ تأكد من أنك تفهم أهداف البحث وما ستتضمنه إجراءات الدراسة. الغرض من الدراسة هو اختبار ما إذا كان الليثيوم فعالًا في منع تكرار العنف الانتحاري الموجه ذاتيًا لدى المرضى الذين يعانون من الاكتئاب أو الاضطراب ثنائي القطب.
ما هي المخاطر والفوائد المحتملة؟ يجب أن يشرح النموذج جميع المخاطر المتوقعة أو الآثار الجانبية أو المضايقات التي قد تواجهها من المشاركة. تشمل المخاطر أو المضايقات المحتملة ما يلي: أسئلة المقابلة التي تسبب عدم الراحة، والآثار الجانبية لأدوية الليثيوم مثل الغثيان، والبراز الرخو، والعطش، وتغيرات التبول، والارتعاش، والصداع، والتعرق، والتعب، وانخفاض التركيز، والطفح الجلدي، وتغيرات الغدة الدرقية، وتفاقم حب الشباب. /الصدفية، وتسمم الليثيوم، والمخاطر إذا توقف الدواء فجأة. وتتمثل الفوائد المحتملة في أن الاختبارات قد تؤدي إلى معلومات جديدة لمساعدة المشارك، وقد يساعد الليثيوم في منع العنف الانتحاري المتكرر لأولئك الذين يعانون من الاكتئاب أو الاضطراب ثنائي القطب.
ماذا ستتضمن المشاركة؟ احصل على تفاصيل حول الاختبارات أو الأدوية أو تغييرات نمط الحياة أو الإجراءات التي ستخضع لها، ومقدار الوقت الذي ستستغرقه، والمدة التي ستستغرقها الدراسة. ستتضمن المشاركة إكمال مقابلة واستبيانات تغطي التفكير والسلوكيات وعلاج الصحة العقلية والأدوية وتعاطي الكحول والمخدرات والدعم المنزلي والاجتماعي وفهم الدراسة البحثية. يستغرق هذا حوالي ساعتين ويمكن إجراؤه في جلسات متعددة شخصيًا أو عبر الهاتف. إذا كنت مؤهلاً للدراسة الكاملة، فسيكون هناك حوالي 20 زيارة دراسية على مدار عام واحد. وسيتضمن ذلك تناول أدوية الدراسة، وفحص العلامات الحيوية، واستكمال الاستبيانات، ومراجعة الآثار الجانبية، ومواصلة الرعاية الصحية الطبية والعقلية العادية.
هل هناك أي تكاليف أو دفعات؟ اسأل عما إذا كنت ستكون مسؤولاً عن أي تكاليف تتعلق بالدراسة أو ستحصل على أموال مقابل المشاركة. نعم، هناك تكاليف ومدفوعات تمت مناقشتها في نتائج البحث. لن يتم تحصيل رسوم منك مقابل أي علاجات أو إجراءات تشكل جزءًا من الدراسة. ومع ذلك، لا يزال يتعين عليك دفع أي مدفوعات مشتركة معتادة من VA مقابل الرعاية والأدوية غير المرتبطة بالدراسة. لن يتم الدفع لك مقابل المشاركة، ولكن الدراسة ستعوض النفقات المتعلقة بالمشاركة مثل النقل ومواقف السيارات وما إلى ذلك. يتم توفير مبالغ السداد وعملية السداد.
كيف سيتم حماية خصوصيتي؟ يجب أن يوضح النموذج كيف سيتم الحفاظ على سرية معلوماتك الصحية الشخصية قبل التجربة وأثناءها وبعدها. ستتم حماية خصوصيتك من خلال إجراء المقابلات على انفراد، وحفظ الملاحظات المكتوبة في ملفات ومكاتب مقفلة، وتخزين المعلومات الإلكترونية في ملفات مشفرة ومحمية بكلمة مرور، والحصول على شهادة السرية من وزارة الصحة والخدمات الإنسانية لمنع الكشف عن المعلومات التي تحدد هويتك . قد تتم مشاركة المعلومات التي تحدد هويتك مع الأطباء المسؤولين عن رعايتك أو عمليات التدقيق والتقييم التي تجريها الوكالات الحكومية، ولكن المحادثات والأوراق المتعلقة بالدراسة لن تحدد هويتك.

الاستعلام باستخدام Amazon Bedrock Retrieve API

لتخصيص سير عمل RAG الخاص بك، يمكنك استخدام Retrieve API لجلب الأجزاء ذات الصلة بناءً على استعلامك وتمريرها إلى أي LLM مقدمة من Amazon Bedrock. لاستخدام Retrieve API، قم بتعريفها كما يلي:

def retrieve(query: str, kbId: str, numberOfResults: int = 5):
    return bedrock_agent_client.retrieve(
        retrievalQuery={"text": query},
        knowledgeBaseId=kbId,
        retrievalConfiguration={
            "vectorSearchConfiguration": {"numberOfResults": numberOfResults}
        },
    )

استرجع السياق المقابل (مع تنقيح بعض المخرجات للإيجاز):

query = "What is the purpose of the medical research study?"
response = retrieve(query, kb_id, 3)
retrievalResults = response["retrievalResults"]
>>> [
    {
        "content": {"text": "You will not be charged for any procedures that..."},
        "location": {"type": "S3", "s3Location": {"uri": "s3://XXXXX/XXXX.pdf"}},
        "score": 0.6552521,
    },
    {
        "content": {"text": "and possible benefits of the study. You have been..."},
        "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
        "score": 0.6581577,
    },
    ...,
]

استخراج السياق للقالب الفوري:

def get_contexts(retrievalResults):
    contexts = []
    for retrievedResult in retrievalResults:
        contexts.append(retrievedResult["content"]["text"])
    return " ".join(contexts)

contexts = get_contexts(retrievalResults)

قم باستيراد وحدات Python وقم بإعداد قالب المطالبة للإجابة على الأسئلة في السياق، ثم قم بإنشاء الإجابة النهائية:

from langchain.prompts import PromptTemplate

PROMPT_TEMPLATE = """
Human: You are an AI system working on medical trial research, and provides answers to questions 
by using fact based and statistical information when possible.
Use the following pieces of information to provide a concise answer to the question enclosed in <question> tags.
If you don't know the answer, just say that you don't know, don't try to make up an answer.

<context>
{context_str}
</context>

<question>
{query_str}
</question>

The response should be specific and use statistics or numbers when possible.

Assistant:"""

claude_prompt = PromptTemplate(
    template=PROMPT_TEMPLATE, input_variables=["context_str", "query_str"]
)

prompt = claude_prompt.format(context_str=contexts, query_str=query)
response = claude_llm(prompt)
>>> "Based on the context provided, the purpose of this medical research study is to evaluate the efficacy of lithium compared to a placebo in preventing suicide over a 1 year period. Specifically, participants will be randomly assigned to receive either lithium or a placebo pill for 1 year, with their doctors and the participants themselves not knowing which treatment they receive (double-blind). Blood lithium levels will be monitored and doses adjusted over the first 6-8 visits, then participants will be followed monthly for 1 year to assess outcomes."

الاستعلام باستخدام تكامل Amazon Bedrock LangChain

لإنشاء تطبيق أسئلة وأجوبة مخصص وشامل، توفر قاعدة المعرفة لـ Amazon Bedrock التكامل مع LangChain. لإعداد مسترد LangChain، قم بتوفير معرف قاعدة المعرفة وحدد عدد النتائج المراد إرجاعها من الاستعلام:

from langchain.retrievers.bedrock import AmazonKnowledgeBasesRetriever

retriever = AmazonKnowledgeBasesRetriever(
    knowledge_base_id=kb_id,
    retrieval_config={"vectorSearchConfiguration": {"numberOfResults": 4}},
)

الآن قم بإعداد LangChain RetrievalQA وقم بإنشاء إجابات من قاعدة المعرفة:

from langchain.chains import RetrievalQA

qa = RetrievalQA.from_chain_type(
    llm=claude_llm,
    chain_type="stuff",
    retriever=retriever,
    return_source_documents=True,
    chain_type_kwargs={"prompt": claude_prompt},
)

[qa(q)["result"] for q in questions]

سيؤدي هذا إلى إنشاء إجابات مماثلة لتلك المذكورة في الجدول السابق.

تنظيف

تأكد من حذف الموارد التالية لتجنب تكبد رسوم إضافية:

وفي الختام

توفر Amazon Bedrock مجموعة واسعة من الخدمات المتكاملة لتشغيل تطبيقات RAG على جميع المستويات، مما يجعل من السهل البدء في تحليل بيانات شركتك. تتكامل قواعد المعرفة الخاصة بـ Amazon Bedrock مع نماذج مؤسسة Amazon Bedrock لإنشاء خطوط أنابيب قابلة للتطوير لتضمين المستندات وخدمات استرجاع المستندات لتشغيل مجموعة واسعة من التطبيقات الداخلية والتطبيقات التي تواجه العملاء. نحن متحمسون للمستقبل المقبل، وسوف تلعب ملاحظاتك دورًا حيويًا في توجيه تقدم هذا المنتج. لمعرفة المزيد حول إمكانيات Amazon Bedrock وقواعد المعرفة، راجع قاعدة المعرفة لأمازون بيدروك.


حول المؤلف

مارك روي هو مهندس رئيسي لتعلم الآلة في AWS ، يساعد العملاء على تصميم وبناء حلول AI / ML. يغطي عمل Mark مجموعة واسعة من حالات استخدام ML ، مع اهتمام أساسي برؤية الكمبيوتر والتعلم العميق وتوسيع ML عبر المؤسسة. لقد ساعد الشركات في العديد من الصناعات ، بما في ذلك التأمين والخدمات المالية والإعلام والترفيه والرعاية الصحية والمرافق والتصنيع. يحمل مارك ست شهادات AWS ، بما في ذلك شهادة التخصص في ML. قبل انضمامه إلى AWS ، كان مارك مهندسًا معماريًا ومطورًا وقائدًا في مجال التكنولوجيا لأكثر من 25 عامًا ، بما في ذلك 19 عامًا في الخدمات المالية.

ماني خانوجا هي قائدة تقنية - متخصصون في الذكاء الاصطناعي التوليدي، ومؤلفة الكتاب - التعلم الآلي التطبيقي والحوسبة عالية الأداء على AWS، وعضو مجلس إدارة مجلس إدارة مؤسسة المرأة في تعليم التصنيع. وهي تقود مشاريع التعلم الآلي (ML) في مجالات مختلفة مثل رؤية الكمبيوتر ومعالجة اللغة الطبيعية والذكاء الاصطناعي التوليدي. إنها تساعد العملاء على بناء نماذج كبيرة للتعلم الآلي وتدريبها ونشرها على نطاق واسع. وهي تتحدث في مؤتمرات داخلية وخارجية مثل Re:Invent وWomen in Manufacturing West وندوات عبر الإنترنت على YouTube وGHC 23. وفي أوقات فراغها، تحب الذهاب لمسافات طويلة على طول الشاطئ.

دكتور بايشوان صنيعمل حاليًا كمهندس أول لحلول الذكاء الاصطناعي/تعلم الآلة في AWS، ويركز على الذكاء الاصطناعي التوليدي ويطبق معرفته في علوم البيانات والتعلم الآلي لتوفير حلول أعمال عملية قائمة على السحابة. ومن خلال خبرته في الاستشارات الإدارية وهندسة حلول الذكاء الاصطناعي، فإنه يعالج مجموعة من التحديات المعقدة، بما في ذلك رؤية الكمبيوتر الروبوتية، والتنبؤ بالسلاسل الزمنية، والصيانة التنبؤية، من بين أمور أخرى. يرتكز عمله على خلفية قوية في إدارة المشاريع، والبحث والتطوير في مجال البرمجيات، والمساعي الأكاديمية. خارج العمل، يتمتع الدكتور صن بالتوازن بين السفر وقضاء الوقت مع العائلة والأصدقاء.

ديريك تشو هو مهندس حلول أول في AWS يركز على تسريع رحلة العميل إلى السحابة وتحويل أعمالهم من خلال اعتماد الحلول المستندة إلى السحابة. وتتمثل خبرته في تطبيق المكدس الكامل وتطوير التعلم الآلي. إنه يساعد العملاء على تصميم وبناء حلول شاملة تغطي واجهات المستخدم الأمامية وتطبيقات إنترنت الأشياء وواجهة برمجة التطبيقات وتكامل البيانات ونماذج التعلم الآلي. وفي أوقات فراغه، يستمتع بقضاء الوقت مع عائلته وتجربة التصوير الفوتوغرافي والفيديو.

فرانك وينكلر هو مهندس حلول أول ومتخصص في الذكاء الاصطناعي التوليدي في AWS ومقرها في سنغافورة، ويركز على التعلم الآلي والذكاء الاصطناعي التوليدي. وهو يعمل مع شركات رقمية عالمية لتصميم منتجات وخدمات قابلة للتطوير وآمنة وفعالة من حيث التكلفة على AWS. وفي أوقات فراغه، يقضي وقتًا مع ابنه وابنته، ويسافر للاستمتاع بالأمواج عبر رابطة أمم جنوب شرق آسيا.

نهير شادروالا هو مهندس حلول الذكاء الاصطناعي/تعلم الآلة في فريق الرعاية الصحية العالمية وعلوم الحياة. وتتمثل خبرته في بناء حلول البيانات الضخمة والذكاء الاصطناعي لمشاكل العملاء وخاصة في مجال الطب الحيوي وعلوم الحياة والرعاية الصحية. كما أنه متحمس أيضًا بشأن تقاطع علم المعلومات الكمومية والذكاء الاصطناعي ويستمتع بالتعلم والمساهمة في هذا الفضاء. يستمتع في أوقات فراغه بلعب التنس والسفر والتعرف على علم الكونيات.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة