شعار زيفيرنت

عندما يكون 1 أكبر من 4 بالنسبة للذكاء الاصطناعي

التاريخ:

سألت ChatGPT عن الأرقام 1 و 4. أيهما أكبر؟

في بعض الأحيان ، كان الرقم 1 أكبر. في وقت سابق ، كانت 4 أكبر. أجرى شارون زو هذه التجربة على نطاق واسع لإظهار ترتيب "نعم" و "لا" في الرد.

صورة
وهذا ما يسمى إجابة غير حتمية أو عشوائية. المدخلات المماثلة لا تنتج باستمرار مخرجات متطابقة. الإجابات لها منطق غير متسق.

نحن نعيش مع الأنظمة العشوائية يوميًا: تقارير الطقس ، و ETAs على خرائط Google ، وإنشاء محفظة الأوراق المالية. نحن عشوائيون - يمكن أن يكون البشر متقلبين المزاج ، أو يخطئون في حساباتنا ، أو يغيرون آراءنا بمعلومات جديدة.

في هذه المحادثات ، يكون الروبوت خاطئًا في بعض الأحيان ، لكن لا شك فيه. عندما ينتج النظام إجابة ، يجب أن نتحقق من صحة الإجابة. ليست الأخطاء المنطقية فقط هي التي تحدث: الهلوسة ، عندما يخترع النظام إجابات غير موجودة ، ابتليت بحوالي نصف نتائج دردشة Bing في دراسة ستانفورد هذه.

لم نقم بمعايرة أنفسنا إلى مستوى الشك للتعبير عنه ، حتى الآن. مثل العمل مع زميل جديد ، نحتاج إلى فهم نقاط القوة والضعف لديهم.

بالنسبة للمستهلكين ، يمكن أن يكون عالم النتائج المقبولة واسعًا جدًا. أ أرنب فوق شاحنة إطفاء لديه العديد من الإجابات المقبولة.

لكن في عالم B2B ، الاتساق مهم. ستطلب الشركات التي تستخدم genAI إجابات متسقة لمطالبات مثل هذه: ما هي إيرادات الشركة حسب المنطقة؟ أو كيف يمكنني إعادة تعيين كلمة المرور الخاصة بي؟ أو كم سأدفع إذا استخدمت 1000 وحدة من المنتج؟

ستحتاج GenAI إلى الكتابة والإنشاء والحساب بمعدل خطأ أفضل بكثير من البشر.

أنا أعمل مع ProductBoard لفهم كيف تخطط الشركات الناشئة المختلفة B2B للاستفادة من الذكاء الاصطناعي من خلال الاستبيان. إذا كنت تدمج GenAI في منتجك وتهتم بسماع خطط الآخرين ، يرجى تعبئتها ، وسنرسل لك البيانات الأولية مجهولة المصدر. ابحث عن النتائج التي سيتم نشرها في غضون أسابيع قليلة.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة