Logo na Zephyrnet

Ra'ayin jinsi a cikin AI: gina ingantaccen algorithms

kwanan wata:


Einstein shine masanin kimiyya kamar yadda Messi yake yiwa dan wasan tsakiya.
Paris tana zuwa Faransa kamar yadda Tokyo yake zuwa Japan.
Ayyuka na Apple ne kamar yadda Ballmer yake ga Microsoft.

Waɗannan kaɗan ne kawai daga cikin kwatancen da yawa waɗanda tsarin AI ke iya kammalawa daidai, godiya ga nasarorin da aka samu a cikin Tsarin Harshen Halitta. A cikin shekaru biyun da suka gabata, bincike kan tsarin da ke samar da ingantattun kalmomin kalmomi ya zo cikin nasa, tare da ƙungiyoyin bincike suna fitar da ƙarin samfura masu ƙarfi waɗanda akai-akai doke tsarin zamani na zamani. Tare da waɗannan fasahohin, kwamfutoci suna iya yin bayani da yawa game da duniyar da muke rayuwa a ciki, kamar sana'ar Lionel Messi, ko kuma kamfanin Steve Ballmer.

Amma idan akwai wasu sassan duniyarmu da suka fi dacewa da barin waɗannan tsarin fa?

Saboda cinikin iko-dawainiyar karin magana, yana da mahimmanci mu ɗauki ɗan lokaci don tattauna abubuwan da suka shafi ɗabi'a na waɗannan ci gaba: wato, dawwamar son zuciya. Musamman bambancin jinsi, kamar yadda aka saba a cikin harshe, ba tare da shiga cikin ko harshe ya kamata ko a'a ya zama tsaka tsaki na jinsi ba.

Me muke nufi da son zuciya?

Maganar baki, ana bayyana son zuciya a matsayin son zuciya ga mutum ɗaya ko ƙungiya, yawanci ta hanyar da ake ganin rashin adalci ne. An bayyana son zuciya a cikin ma'anar koyon na'ura da ɗan bambanta, azaman "kuskure daga zato na kuskure a cikin algorithm koyo." A wasu kalmomi, samfurin yana yin kuskure iri ɗaya akai-akai.

Hange na son zuciya a cikin koyan na'ura kamar darts akan allo - tsinkayar ƙirar tana da daidaito amma karkatacciya.

Lokacin da muke magana game da son zuciya a cikin NLP, zamu iya zahiri magana game da nau'ikan biyu. Rashin son zuciya da aka dade a cikin al'ummarmu yana shafar yadda muke magana da abin da muke magana akai, wanda hakan ke fassara zuwa abin da aka rubuta, wanda shine abin da muke amfani da shi don horar da tsarin koyon injin. Lokacin da muka horar da ƙirarmu ta amfani da bayanan son zuciya, yana shiga cikin ƙirarmu, wanda ke ba da damar tabbatar da son zuciya, da kuma kiyaye shi.

Don ƙarin fahimtar yadda hakan ke faruwa, da farko muna buƙatar fahimtar asali yadda shirye-shiryen kwamfuta ke iya sarrafa rubutu, da algorithms da muke amfani da su don hakan. Idan kun rasa labarinmu kan yadda injina ke fahimtar harshe, gajeriyar sigar ita ce kalmomin suna wakilta ta jerin lambobi da ake kira. shigar da kalmomi wanda ke ɓoye bayanai game da ma'anar kalmar, amfani, da sauran kaddarorin. Kwamfuta suna "koyi" waɗannan dabi'u ga kowace kalma ta hanyar ba da bayanan horo na miliyoyin layukan rubutu, inda ake amfani da kalmomi a cikin yanayin yanayin su.

Tunda shigar kalmomin lambobi ne, ana iya ganin su azaman masu daidaitawa a cikin jirgin sama, kuma tazarar da ke tsakanin kalmomi - daidai, kusurwar da ke tsakanin su - hanya ce ta auna kamanceniyarsu. Ana iya amfani da waɗannan alaƙa don samar da kwatance.

A cikin wannan misalin daga labarin da ya gabata, kiban lemu suna wakiltar sarauta, da kuma shudin kiban jinsi, suna ɗaukar dangantakar. namiji sarki ne kamar yadda mace take ga sarauniya.

Amma menene zai faru idan muna son fadada wannan kwatancin zuwa wasu kalmomi, in ji sana'a?

Namiji ya zama mai sarrafa kwamfuta kamar yadda mace take yi _________

Hankali ya ce kalmar da ta ɓace ya kamata ya zama mai tsara shirye-shiryen kwamfuta saboda kalmar ba ta asali ta jinsi ba, sabanin sarki da sarauniya. Shin za ku iya tunanin yadda kwamfutar, tare da daidaitaccen tsarin shigar da kalmomi, ta cika sarari?

Namiji ya zama mai sarrafa kwamfuta kamar yadda mace take yi mai gida (kalmar ta biyu mafi yiwuwa ita ce uwar gida)

Kuna iya gwada kwatancen ku ta amfani da wannan kayan aikin saka kalmomi.

Fassarar inji tana ba da wani misali. Tare da wasu tsarin, fassara jimlolin Hungarian na tsaka-tsakin jinsi “Ő egy orvos. Ő egy nővér,” zuwa Turanci yana haifar da “Likita ne. Ita ma’aikaciyar jinya ce,” tana ɗaukar jinsin batutuwan biyu.

Waɗannan a fili ba kyakkyawan sakamako ba ne. Bayanan horon da aka yi amfani da su a cikin tsarin harshe wanda ya samar da kwatankwacin sun haɗa da shirye-shiryen maza a cikin mahallin harshe ɗaya kamar yadda mata suke yin gida fiye da yadda mata suke yin wani abu. Mafi kyawun sakamakon shi likita/ita ma'aikaciyar jinya bata da fari da fari, amma za mu iya amfani da karin magana mai tsaka-tsakin jinsi, ba mai amfani da zaɓi na ayyana jinsi, ko aƙalla zaɓi suna iri ɗaya ga duka biyun.

Tsarin koyon injin shine abin da suke ci, kuma kayan aikin sarrafa harshe na halitta ba su da banbanci - Wannan ya zama bayyananne tare da Tay, Microsoft's AI chatbot. Akwai dabi'ar gaba ɗaya don ɗauka cewa ƙarin bayanai suna haifar da ingantattun samfura, kuma a sakamakon haka, manyan kamfanoni galibi suna tattara bayanai na yanar gizo. Tunda intanet da sauran abun ciki sun ƙunshi ainihin, harshen ɗan adam, a zahiri za su nuna son zuciya iri ɗaya da ɗan adam ke yi, kuma galibi ba a mai da hankali ga abin da ainihin rubutun ya kunsa.

Rage son zuciya

Daga ƙarshe, a wani lokaci yayin wannan tattaunawa, wani - kowa - zai yi tambaya: Idan muna son AI ta zama ainihin wakilcin ɗan adam, shin ya kamata mu yi ƙoƙarin kawar da son zuciya? Shin AI ya kamata ya kasance kawai siffanta halayen ɗan adam, ko kuma ya kamata ya zama mai kayyadewa? Tambaya ce mai adalci; duk da haka, idan ba wani abu ba, muna kuma buƙatar mu tuna cewa ƙirar ƙiyayya ba kawai suna samar da kwatankwacin gauche ba ne - wani lokacin ba daidai ba ne: mace mai shirye-shiryen kwamfuta ba ta daidai da mai gida ba.

Da yake magana a matsayin injiniyan AI, koyaushe dole ne mu yi la'akari da waɗanda za su yi amfani da tsarinmu kuma don wane dalili. A Unbabel, muna buƙatar kula da kwastomomin abokan cinikinmu, kuma mu yi ƙoƙari don isar da ingantattun fassarori da daidaito. Samun mutane a cikin madauki tabbas yana rage haɗarin samun bayanan horo na nuna son kai, yana taimakawa wajen rufe gibin inda ilimin injin ya gaza. Amma me za mu iya, a matsayinmu na injiniyoyi, don rage bambancin jinsi a cikin tsarin NLP?

Hanyar da ta fi dacewa ita ce canza bayanan horo. Idan mun san samfuranmu suna koyon son zuciya daga bayanai,
watakila muna bukatar mu dena son zuciya. Ɗaya daga cikin irin wannan fasaha ita ce "musayar jinsi," inda aka ƙara bayanin horon ta yadda ga kowace jimla ta jinsi, an ƙirƙiri ƙarin jimla, maye gurbin karin magana da kalmomin jinsi da waɗanda suka bambanta da jinsi, da maye gurbin sunaye tare da mahalli. Misali, "Maryamu ta rungumi ɗan'uwanta Tom" kuma zai ƙirƙiri "NAME-1 ya rungumi 'yar uwarsa NAME-2." Ta wannan hanyar, bayanan horon ya zama daidaitaccen jinsi, kuma ba ya koyon kowane halayen jinsi da ke da alaƙa da sunaye. Wannan zai inganta kwatankwacin da samfurin ya bayar, domin da an ga masu shirye-shiryen kwamfuta a cikin mahallin maza da mata daidai adadin sau.

Duk da haka, yana da mahimmanci a lura cewa wannan hanya madaidaiciya ce ga Ingilishi, harshe ba tare da jinsin nahawu mai amfani ba, yayin da sauran harsuna da yawa kawai musanya karin magana kamar shi/ta da sunaye kamar 'yar'uwa/dan'uwa bai wadatar ba, domin sifofi da sauran masu gyara sun bayyana. jinsi kuma. Misali, harsunan soyayya, kamar Faransanci, Fotigal ko Sipaniya, ba su da jinsi na nahawu. Kamar yadda Helena Moniz, wani masanin harshe kuma mai bincike a Jami'ar Lisbon ya bayyana, "harsunan da aka samo daga Latin sun rasa jinsin nahawunsu na tsaka tsaki tuntuni."

A iya sanina, bincike kan wannan nau'in fasaha na rashin son kai ga waɗanda ba Ingilishi ba ne ba a bincika ba.

Wata hanyar da ta keɓance ga fassarar na'ura da ke taimakawa fassarori su zama daidai-jinsi sun haɗa da ƙara metadata zuwa jimlolin da ke adana jinsin abin. Misali, yayin da jimlar “Kana da kyau” ba ta da ma’ana a cikin Ingilishi, idan jumlar ta Portuguese daidai ce “Tu és muito simpática,” za mu ƙara alamar zuwa farkon jimlar Turanci don samfurin ya koyi daidai fassarar. Bayan horarwa, idan muka nemi fassarar kuma muka samar da alamar jinsi da ake so, samfurin ya kamata ya dawo daidai ba kawai jinsin mafi rinjaye ba.

Idan an horar da tsarin Hungarian-Ingilishi ta wannan hanyar, za mu iya tambayarsa ya fassara “Ő egy orvos” kuma mu karɓi fassarar “Likita ce,” ko kuma “Ő egy nővér” kuma a karɓi “Ma’aikaciyar jinya ce.” Don yin wannan a ma'auni, za mu buƙaci horar da ƙarin samfuri wanda ke rarraba jinsin jimla da amfani da ita don yiwa jumlolin alama, ƙara daɗaɗɗen ƙima.

Waɗannan hanyoyin suna da tasiri wajen rage bambancin jinsi a cikin ƙirar NLP amma suna ɗaukar lokaci don aiwatarwa, saboda suna buƙatar ƙarin bayanan harshe waɗanda ƙila ba za a iya samu ba ko ma yiwuwa a samu.

Alhamdu lillahi, wannan batu yana zama yanki mai saurin girma na bincike. A cikin Taron Shekara-shekara na Ƙungiyar Ƙwararrun Harsuna wanda ya faru a wannan bazarar, wanda yawancin AI Unbabelers suka halarta, akwai gabaɗayan waƙa na gabatar da takarda da aka sadaukar don Bias a cikin Harshe, da kuma Taron Bita na Farko akan Bias Gender don Sarrafa Harshen Halitta.

Google kuma ya sanya hannun jari don magance wannan matsala. A cikin Disamba 2018, sun ba da sanarwar cewa Google Translate zai yi fara maido da fassarorin kalmomi guda daga harsuna huɗu zuwa Ingilishi a cikin nau'in mace da na namiji.

Yana da kyau ganin shugabannin masana'antu suna magance son zuciya a cikin algorithms, amma aikin bai ƙare ba. Har yanzu muna fama da rashin bambance-bambance a cikin masana'antar AI - a cewar MIT Technology Review, "Mata suna da kashi 18% na marubuta a manyan tarurrukan AI, 20% na farfesa na AI, da 15% da 10% na ma'aikatan bincike a Facebook da Google, bi da bi.”- kuma ba za mu iya musun cewa wannan ba wani bangare ne ke da alhakin matsalar ba. A matsayinmu na injiniyoyi, ba za mu iya guje wa batun ba, muna ɓoyewa a ƙarƙashin zaton cewa fasaha ba ta da tsaka tsaki. Musamman tun da sakamakon rashin aikin mu ba kawai labari ba ne, kamar misalan da muka raba - nuna son kai a cikin algorithms na iya haifar da wariya a cikin ayyukan hayar, aikace-aikacen lamuni, har ma a cikin tsarin shari'a na laifi.

Wannan ba sifa ba ce, kwaro ne. Kuma yayin da wayar da kanmu ke ƙaruwa, dole ne mu fahimci rawar da muke takawa wajen ƙirƙirar fasahar da ke aiki ga mutane da yawa, ba kaɗan ba.

Sources
Rage Ra'ayin Jinsi a Tsarin Harshen Halitta: Nazari na Adabi https://arxiv.org/abs/1906.08976

Source: https://unbabel.com/blog/gender-bias-artificial-intelligence/

tabs_img

Sabbin Hankali

tabs_img