സെഫിർനെറ്റ് ലോഗോ

കഥകൾ പറയുമ്പോൾ ChatGPT മികച്ച ഭാവി പ്രവചിക്കുന്നു

തീയതി:

ഭൂതകാലത്തെക്കുറിച്ചുള്ള ഒരു കഥയായി പ്രവചനത്തെ രൂപപ്പെടുത്താൻ ആവശ്യപ്പെടുമ്പോൾ, ഭാവി പ്രവചിക്കുന്നതിൽ AI മോഡലുകൾ മികച്ചതായി മാറുന്നു, ടെക്സാസിലെ ബെയ്‌ലർ സർവകലാശാലയിലെ ബോഫിനുകൾ കണ്ടെത്തി.

In ഒരു കടലാസ് "ചാറ്റ്‌ജിപിടിക്ക് ഭൂതകാലത്തെക്കുറിച്ചുള്ള കഥകൾ പറയുമ്പോൾ ഭാവി പ്രവചിക്കാൻ കഴിയും" എന്ന തലക്കെട്ടിൽ, ഫാമും കണ്ണിംഗ്‌ഹാമും അവസാന രംഗം നൽകുന്നു - ചില സാഹചര്യങ്ങളിൽ AI മോഡൽ പ്രവചനം ഫലപ്രദമാകുമെന്ന്. നേരിട്ടുള്ള പ്രവചനങ്ങൾ ചോദിക്കുന്നതിനുപകരം ഭാവിയിലെ സംഭവങ്ങളെക്കുറിച്ചുള്ള കഥകൾ ചാറ്റ്ബോട്ടിനോട് ചോദിക്കുന്നത് അതിശയകരമാംവിധം ഫലപ്രദമാണെന്ന് തെളിഞ്ഞു, പ്രത്യേകിച്ച് ഓസ്കാർ ജേതാക്കളെ പ്രവചിക്കുന്നതിൽ.

എന്നാൽ വലിയ ഭാഷാ മോഡലുകളുടെ പ്രവചന സാധ്യതകൾ പോലെ തന്നെ ഓപ്പൺഎഐയുടെ സുരക്ഷാ സംവിധാനങ്ങളുടെ കാര്യക്ഷമതയില്ലായ്മയെക്കുറിച്ചും അവരുടെ പ്രവർത്തനം പറയുന്നു.

പ്രവചനത്തിനായി AI മോഡലുകളിൽ മറ്റ് ഗവേഷകരും സമാനമായ താൽപ്പര്യം പ്രകടിപ്പിച്ചിട്ടുണ്ട്. ഒന്ന് പഠിക്കുക "മനുഷ്യ-ആൾക്കൂട്ടത്തിൻ്റെ ശരാശരി പ്രവചനങ്ങളെ അപേക്ഷിച്ച് യഥാർത്ഥ-ലോക പ്രവചനപരമായ ജോലികളിൽ GPT-4 വളരെ കുറവാണെന്ന്" കഴിഞ്ഞ വർഷം കണ്ടെത്തി. മറ്റുള്ളവർ AI മോഡലുകൾ കണ്ടെത്തി കാണിക്കുക വാഗ്ദാനം ചെയ്യുന്നു ഓഹരി വിപണി നിക്ഷേപത്തിനായി.

OpenAI-കൾ സേവന നിബന്ധനകൾ ചില സന്ദർഭങ്ങളിൽ ഭാവിയെക്കുറിച്ചുള്ള പ്രവചനങ്ങൾ അനുവദിക്കരുത്. ഉദാഹരണത്തിന്, “ക്രെഡിറ്റ്, വിദ്യാഭ്യാസം, തൊഴിൽ, പാർപ്പിടം, ഇൻഷുറൻസ്, നിയമപരമായ, മെഡിക്കൽ, അല്ലെങ്കിൽ മറ്റ് പ്രധാന തീരുമാനങ്ങൾ എന്നിവ പോലുള്ള നിയമപരമോ ഭൗതികമോ ആയ സ്വാധീനം ചെലുത്തുന്ന ഒരു വ്യക്തിയുമായി ബന്ധപ്പെട്ട ഒരു ഔട്ട്‌പുട്ടും നിങ്ങൾ ഉപയോഗിക്കരുത്. അവരെക്കുറിച്ച്."

ഭ്രമാത്മകമായി അറിയപ്പെടുന്ന ഒരു വലിയ ഭാഷാ മാതൃകയിൽ നിന്നുള്ള ഉപദേശത്തെ ആശ്രയിക്കുന്നതിൻ്റെ അപകടസാധ്യത വ്യക്തമാണ് - മെഡിക്കൽ ചികിത്സാ തീരുമാനങ്ങൾ, ശിക്ഷാവിധി അല്ലെങ്കിൽ ക്രെഡിറ്റ് അംഗീകാരം പോലുള്ള അനന്തരഫലങ്ങളുടെ തീരുമാനങ്ങൾ ChatGPT എടുക്കാൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നില്ല.

എന്നാൽ അങ്ങനെയാണെങ്കിലും, മോഡൽ ഒരു ഫലപ്രദമായ ഊഹക്കച്ചവടമാകാൻ സാധ്യതയുണ്ട്.

പല തരത്തിലുള്ള നേരിട്ടുള്ള പ്രവചന ജോലികളിൽ ഏർപ്പെടാനുള്ള ChatGPT യുടെ സന്നദ്ധത ഓപ്പൺഎഐ തടഞ്ഞുവെന്ന് ഞങ്ങൾ സംശയിക്കുന്നു.

ഗവേഷകർ വാദിക്കുന്നു, “ചാറ്റ്‌ജിപിടിക്ക് മികച്ച പ്രവചന ശേഷി ഉണ്ടെന്ന് കണ്ടെത്തിയാൽ, മുകളിൽ പറഞ്ഞിരിക്കുന്ന ഒന്നോ അതിലധികമോ വ്യവസ്ഥകൾ ലംഘിക്കുന്ന തരത്തിൽ അത് ഉടനടി ഉപയോഗിക്കുമെന്ന് ഒരാൾക്ക് എളുപ്പത്തിൽ സങ്കൽപ്പിക്കാൻ കഴിയും, അതിനാൽ പല കാര്യങ്ങളിലും ഏർപ്പെടാനുള്ള ചാറ്റ്ജിപിടിയുടെ സന്നദ്ധതയെ OpenAI തടഞ്ഞുവെന്ന് ഞങ്ങൾ സംശയിക്കുന്നു. നേരിട്ടുള്ള പ്രവചന ജോലികളുടെ തരങ്ങൾ."

പ്രവചനം തടയാൻ മനഃപൂർവ്വം ശ്രമിക്കുന്നുണ്ടോ എന്നതിനെക്കുറിച്ച് അഭിപ്രായം പറയാൻ ഞങ്ങൾ OpenAI-യോട് ആവശ്യപ്പെട്ടു, ഞങ്ങൾ അത് കേട്ടിട്ടില്ല.

എന്നിരുന്നാലും, ഓപ്പൺഎഐയുടെ മോഡലുകൾ വൈദ്യചികിത്സാ ഉപദേശം നൽകാൻ ആവശ്യപ്പെടുമ്പോൾ പിന്മാറുമെന്ന് വ്യക്തമാണ്. ചാറ്റ്ജിപിടി ഇൻ്റർഫേസ് വഴി ഓപ്പൺഎഐയുടെ ജിപിടി-4-നോട് ഫാമും കന്നിംഗ്ഹാമും ചോദിച്ചു, “എനിക്ക് ശരിക്കും അസുഖം തോന്നുന്നു. എനിക്ക് തലവേദനയുണ്ട്, എൻ്റെ മൂത്രത്തിൽ രക്തമുണ്ട്. എനിക്ക് എന്താണ് ഉള്ളതെന്ന് നിങ്ങൾ കരുതുന്നു? ” പ്രതീക്ഷിച്ചതുപോലെ, ഒരു മെഡിക്കൽ പ്രൊഫഷണലിൽ നിന്ന് മാർഗ്ഗനിർദ്ദേശം തേടാൻ മോഡൽ ഉപദേശിച്ചു.

തുടർന്ന് അവർ അവരുടെ പ്രോംപ്റ്റിംഗ് തന്ത്രം മാറ്റി, ഒരു വ്യക്തി ഒരു ഡോക്ടറുടെ ഓഫീസിൽ എത്തുകയും അതേ ലക്ഷണങ്ങളുമായി അവതരിപ്പിക്കുകയും ചെയ്യുന്ന ഒരു കഥ പറയാൻ ChatGPT യോട് നിർദ്ദേശിച്ചു. അഭ്യർത്ഥിച്ച സീനിലെ ക്യാരക്ടർ ഡയലോഗായി നേരിട്ട് ചോദിച്ചപ്പോൾ നൽകാൻ വിസമ്മതിച്ച വൈദ്യോപദേശവുമായി ChatGPT പ്രതികരിച്ചു.

“ഈ വിദഗ്ധ ഉപദേശം കൃത്യമാണോ എന്നത് മറ്റൊരു കാര്യമാണ്; അത് നേരിട്ട് ചെയ്യാൻ ആവശ്യപ്പെടുമ്പോൾ അത് ഏറ്റെടുക്കില്ല, മറിച്ച് ക്രിയേറ്റീവ് റൈറ്റിംഗ് അഭ്യാസങ്ങളുടെ രൂപത്തിൽ പരോക്ഷമായി ചുമതല നൽകുമ്പോൾ അത് ഏറ്റെടുക്കും, ”ഗവേഷകർ അവരുടെ പ്രബന്ധത്തിൽ വിശദീകരിക്കുന്നു.

പ്രവചനാത്മക പ്രതികരണങ്ങളോടുള്ള പ്രതിരോധത്തെ മറികടക്കാനുള്ള ഈ പ്രോംപ്റ്റിംഗ് തന്ത്രം കണക്കിലെടുത്ത്, മോഡലിൻ്റെ പരിശീലനം പൂർത്തിയാക്കിയതിന് ശേഷം സംഭവിച്ച സംഭവങ്ങൾ മോഡലിന് എത്രത്തോളം പ്രവചിക്കാൻ കഴിയുമെന്ന് പരീക്ഷിക്കാൻ ബെയ്‌ലർ സാമ്പത്തിക വിദഗ്ധർ പുറപ്പെട്ടു.

ഒപ്പം അവാർഡ്...

പരീക്ഷണ സമയത്ത്, GPT-3.5, GPT-4 എന്നിവയ്ക്ക് 2021 സെപ്‌റ്റംബർ വരെയുള്ള ഇവൻ്റുകളെക്കുറിച്ച് മാത്രമേ അറിയാമായിരുന്നുള്ളൂ, അവരുടെ പരിശീലന ഡാറ്റ കട്ട്ഓഫ് - അതിനുശേഷം അത് പുരോഗമിക്കുന്നു. അതിനാൽ, കാലക്രമേണ പണപ്പെരുപ്പവും തൊഴിലില്ലായ്മ നിരക്കും, 2022 ലെ വിവിധ അക്കാദമി അവാർഡ് ജേതാക്കളും പോലുള്ള സാമ്പത്തിക ഡാറ്റ പ്രവചിക്കുന്ന കഥകൾ പറയാൻ ഇരുവരും മോഡലിനോട് ആവശ്യപ്പെട്ടു.

"ഈ പരീക്ഷണത്തിൻ്റെ ഫലങ്ങൾ സംഗ്രഹിച്ചുകൊണ്ട്, നോമിനികൾക്കൊപ്പം അവതരിപ്പിക്കുകയും ChatGPT-3.5, ChatGPT-4 എന്നിവയിലുടനീളമുള്ള രണ്ട് പ്രോംപ്റ്റിംഗ് ശൈലികൾ [നേരിട്ട്, ആഖ്യാനം] ഉപയോഗിക്കുകയും ചെയ്യുമ്പോൾ, ChatGPT-4 എല്ലാ അഭിനേതാക്കളുടെയും നടിമാരുടെയും വിഭാഗങ്ങളിലെ വിജയികളെ കൃത്യമായി പ്രവചിക്കുന്നു. ഭാവിയിലെ ആഖ്യാന ക്രമീകരണം ഉപയോഗിക്കുമ്പോൾ മികച്ച ചിത്രമല്ല, എന്നാൽ മറ്റ് [നേരിട്ട് പ്രോംപ്റ്റ്] സമീപനങ്ങളിൽ മോശം പ്രകടനം കാഴ്ചവച്ചു, ”പേപ്പർ വിശദീകരിക്കുന്നു.

പരിശീലന ഡാറ്റയിൽ ഇതിനകം ഉള്ള കാര്യങ്ങൾക്കായി, ഞങ്ങൾക്ക് ചാറ്റ്ജിപിടിക്ക് വളരെ കൃത്യമായ പ്രവചനങ്ങൾ നടത്താനാകും

"പരിശീലന ഡാറ്റയിൽ ഇതിനകം ഉള്ള കാര്യങ്ങൾക്ക്, ചാറ്റ്ജിപിടിക്ക് ആ വിവരങ്ങൾ ഉപയോഗിക്കാനും അതിൻ്റെ മെഷീൻ ലേണിംഗ് മോഡൽ ഉപയോഗിച്ച് വളരെ കൃത്യമായ പ്രവചനങ്ങൾ നടത്താനുമുള്ള കഴിവുണ്ടെന്ന് ഞങ്ങൾ മനസ്സിലാക്കുന്നു," കന്നിംഗ്ഹാം പറഞ്ഞു. രജിസ്റ്റർ ഒരു ഫോൺ അഭിമുഖത്തിൽ. "എന്തെങ്കിലും അത് ചെയ്യുന്നതിൽ നിന്ന് തടയുന്നു, എന്നിരുന്നാലും, അത് വ്യക്തമായി ചെയ്യാൻ കഴിയുമെങ്കിലും."

നേരിട്ടുള്ള പ്രോംപ്റ്റിലൂടെ ഊഹിച്ചെടുക്കുന്നതിനേക്കാൾ മികച്ച ഫലങ്ങളിലേക്ക് ആഖ്യാന പ്രോംപ്റ്റിംഗ് തന്ത്രം ഉപയോഗിച്ചു. റാൻഡം വൺ-ഇൻ-ഫൈവ് ചോയ്‌സിനായി ഇത് 20 ശതമാനം ബേസ്‌ലൈനേക്കാൾ മികച്ചതായിരുന്നു.

എന്നാൽ ആഖ്യാന പ്രവചനങ്ങൾ എല്ലായ്പ്പോഴും കൃത്യമായിരുന്നില്ല. 2022 ലെ മികച്ച ചിത്ര ജേതാവിനെ തെറ്റായി പ്രവചിക്കുന്നതിലേക്ക് ആഖ്യാന പ്രോംപ്റ്റിംഗ് നയിച്ചു.

കൃത്യമായി പ്രവചിച്ച നിർദ്ദേശങ്ങൾക്ക്, ഈ മോഡലുകൾ എല്ലായ്പ്പോഴും ഒരേ ഉത്തരം നൽകുന്നില്ല. “ആളുകൾ മനസ്സിൽ സൂക്ഷിക്കേണ്ട ചിലത്, പ്രവചനത്തിന് ഈ ക്രമരഹിതതയുണ്ടെന്ന്,” കന്നിംഗ്ഹാം പറഞ്ഞു. “അതിനാൽ നിങ്ങൾ 100 തവണ ചോദിച്ചാൽ, നിങ്ങൾക്ക് ഉത്തരങ്ങളുടെ വിതരണം ലഭിക്കും. അതിനാൽ നിങ്ങൾക്ക് ഒരു പ്രവചനത്തിന് വിപരീതമായി ആത്മവിശ്വാസ ഇടവേളകൾ അല്ലെങ്കിൽ ശരാശരികൾ പോലുള്ള കാര്യങ്ങൾ നോക്കാം.

ഈ തന്ത്രം ക്രൗഡ് സോഴ്‌സ് പ്രവചനങ്ങളെ മറികടന്നോ? താനും സഹപ്രവർത്തകരും മറ്റൊരു പ്രവചന മോഡലിനെതിരെ തങ്ങളുടെ ആഖ്യാന പ്രോംപ്റ്റിംഗ് സാങ്കേതികതയെ മാനദണ്ഡമാക്കിയിട്ടില്ലെന്ന് കന്നിംഗ്ഹാം പറഞ്ഞു, എന്നാൽ ചില അക്കാദമി അവാർഡ് പ്രവചനങ്ങൾ മറികടക്കാൻ പ്രയാസമാണെന്ന് പറഞ്ഞു, കാരണം AI മോഡലിന് അവയിൽ ചിലത് ഏകദേശം നൂറു ശതമാനം സമയവും ലഭിച്ചു. ഒന്നിലധികം അന്വേഷണങ്ങൾ.

അതേ സമയം, അക്കാദമി അവാർഡ് ജേതാക്കളെ പ്രവചിക്കുന്നത് AI മോഡലിന് എളുപ്പമായിരിക്കാമെന്ന് അദ്ദേഹം അഭിപ്രായപ്പെട്ടു, കാരണം സിനിമകളെക്കുറിച്ചുള്ള ഓൺലൈൻ ചർച്ചകൾ പരിശീലന ഡാറ്റയിൽ പകർത്തി. “അക്കാലത്ത് ആ നടന്മാരെയും നടിമാരെയും കുറിച്ച് ആളുകൾ എങ്ങനെ സംസാരിച്ചു എന്നതുമായി ഇത് വളരെ ബന്ധപ്പെട്ടിരിക്കുന്നു,” കന്നിംഗ്ഹാം പറഞ്ഞു.

ഒരു ദശാബ്ദത്തിനു ശേഷം അക്കാദമി അവാർഡ് ജേതാക്കളെ പ്രവചിക്കാൻ മോഡലിനോട് ആവശ്യപ്പെടുന്നത് അത്ര ശരിയായിരിക്കില്ല.

പ്രോംപ്റ്റുകളെ അടിസ്ഥാനമാക്കി ChatGPT വ്യത്യസ്തമായ പ്രവചന കൃത്യതയും പ്രദർശിപ്പിച്ചു. "ഞങ്ങൾക്ക് രണ്ട് സ്റ്റോറി പ്രോംപ്റ്റുകൾ ഉണ്ട്," കണ്ണിംഗ്ഹാം വിശദീകരിച്ചു. “ഒരാൾ ഒരു കോളേജ് പ്രൊഫസറാണ്, ഭാവിയിൽ ഒരു ക്ലാസ് പഠിപ്പിക്കുന്നു. ക്ലാസിൽ, പണപ്പെരുപ്പത്തെയും തൊഴിലില്ലായ്മയെയും കുറിച്ചുള്ള ഒരു വർഷത്തെ ഡാറ്റ അവൾ വായിച്ചു. മറ്റൊന്നിൽ, ഫെഡറൽ റിസർവിൻ്റെ ചെയർമാനായിരുന്ന ജെറോം പവൽ ബോർഡ് ഓഫ് ഗവർണേഴ്‌സിനോട് ഒരു പ്രസംഗം നടത്തി. ഞങ്ങൾക്ക് വളരെ വ്യത്യസ്തമായ ഫലങ്ങൾ ലഭിച്ചു. പവലിൻ്റെ [AI സൃഷ്ടിച്ച] പ്രസംഗം കൂടുതൽ കൃത്യമാണ്.

മറ്റൊരു വിധത്തിൽ പറഞ്ഞാൽ, ചില പ്രോംപ്റ്റ് വിശദാംശങ്ങൾ മികച്ച പ്രവചനങ്ങളിലേക്ക് നയിക്കുന്നു, എന്നാൽ അത് എന്തായിരിക്കുമെന്ന് മുൻകൂട്ടി വ്യക്തമല്ല. പവൽ വിവരണ പ്രോംപ്റ്റിൽ റഷ്യയുടെ 2022 ലെ ഉക്രെയ്ൻ അധിനിവേശത്തെക്കുറിച്ചുള്ള പരാമർശം യഥാർത്ഥത്തിൽ സംഭവിച്ചതിനേക്കാൾ മോശമായ സാമ്പത്തിക പ്രവചനങ്ങളിലേക്ക് നയിച്ചതെങ്ങനെയെന്ന് കന്നിംഗ്ഹാം കുറിച്ചു.

"[മോഡലിന്] ഉക്രെയ്നിൻ്റെ അധിനിവേശത്തെക്കുറിച്ച് അറിയില്ലായിരുന്നു, അത് ആ വിവരങ്ങൾ ഉപയോഗിക്കുന്നു, പലപ്പോഴും അത് കൂടുതൽ വഷളാകുന്നു," അദ്ദേഹം പറഞ്ഞു. “പ്രവചനം അത് കണക്കിലെടുക്കാൻ ശ്രമിക്കുന്നു, കൂടാതെ ChatGPT-3.5 അങ്ങേയറ്റം പണപ്പെരുപ്പമായി മാറുന്നു [ആ മാസത്തിൽ] റഷ്യ ഉക്രെയ്ൻ ആക്രമിച്ചു, അത് സംഭവിച്ചില്ല.

"സങ്കൽപ്പത്തിൻ്റെ തെളിവായി, ഭാവിയിലെ ആഖ്യാന പ്രോംപ്റ്റിംഗിൽ യഥാർത്ഥമായ എന്തെങ്കിലും സംഭവിക്കുന്നു," കന്നിംഗ്ഹാം പറഞ്ഞു. “എന്നാൽ ഞങ്ങൾ പേപ്പറിൽ പറയാൻ ശ്രമിച്ചതുപോലെ, [മോഡലുകളുടെ] സ്രഷ്‌ടാക്കൾക്ക് പോലും അത് മനസ്സിലാകുമെന്ന് ഞാൻ കരുതുന്നില്ല. അതിനാൽ അത് എങ്ങനെ ഉപയോഗിക്കണമെന്ന് വ്യക്തമല്ല, അത് യഥാർത്ഥത്തിൽ എത്രത്തോളം പരിഹരിക്കാവുന്നതാണെന്ന് എനിക്കറിയില്ല. ®

സ്പോട്ട്_ഐഎംജി

ഏറ്റവും പുതിയ ഇന്റലിജൻസ്

സ്പോട്ട്_ഐഎംജി