Pa mor Galed y Dylem Wthio AI ChatGPT Cynhyrchiol i Sbeitio Araith Casineb, Yn Gofyn Cyfraith AI Moeseg A AI

Mae gan bawb eu pwynt torri.

Mae'n debyg y gallech chi ddweud hynny hefyd bopeth wedi ei dorbwynt.

Gwyddom y gall bodau dynol, er enghraifft, weithiau fachu a lleisio sylwadau nad ydynt o reidrwydd yn bwriadu eu dweud. Yn yr un modd, ar adegau fe allwch chi gael dyfais neu beiriant i dorri i bob pwrpas, fel gwthio'ch car yn rhy galed ac mae'n dechrau pallu neu hedfan ar wahân. Felly, y syniad yw bod pobl neu “bawb” yn debygol o fod â thorbwynt, ac yn yr un modd gallwn haeru bod gwrthrychau a phethau, yn gyffredinol, hefyd yn tueddu i fod â thorbwynt.

Gallai fod rhesymau eithaf synhwyrol a hanfodol i ganfod ble mae'r pwynt torri yn bodoli. Er enghraifft, heb os, rydych chi wedi gweld y fideos hynny sy'n arddangos car yn cael ei roi ar ben ffordd i nodi pa dorribwynt sydd ganddo. Bydd gwyddonwyr a phrofwyr yn hwrdd car i mewn i wal frics i weld pa mor dda y gall y bumper a strwythur y cerbyd wrthsefyll y camau niweidiol. Gallai profion eraill gynnwys defnyddio ystafell neu warws arbenigol sy'n cynhyrchu oerfel eithafol neu wres eithafol i weld sut y bydd car yn ymdopi o dan amodau tywydd gwahanol.

Codaf y pwnc calonogol hwn yn y golofn heddiw fel y gallwn drafod sut mae rhai ar hyn o bryd yn gwthio’n galed ar Ddeallusrwydd Artiffisial (AI) i nodi ac yn ôl pob tebyg amlygu math penodol o dorbwynt, sef y pwynt torri o fewn AI sy’n cynhyrchu lleferydd casineb.

Ydy, mae hynny'n iawn, mae yna amryw o ymdrechion ad hoc ac ar adegau systematig ar y gweill i fesur a yw'n ddichonadwy i gael AI i ledaenu lleferydd casineb ai peidio. Mae hon wedi dod yn gamp frwd, os dymunwch, oherwydd y diddordeb cynyddol mewn AI cynhyrchiol a'i boblogrwydd.

Efallai eich bod chi'n ymwybodol bod ap AI cynhyrchiol o'r enw ChatGPT wedi dod yn brif siarad y dref o ganlyniad i allu cynhyrchu traethodau hynod rugl. Mae'r penawdau'n dal i fygu ac yn canmol yr ysgrifennu rhyfeddol y mae ChatGPT yn llwyddo i'w gynhyrchu. Ystyrir ChatGPT yn gymhwysiad AI cynhyrchiol sy'n cymryd rhywfaint o destun gan ddefnyddiwr fel mewnbwn ac yna'n cynhyrchu neu'n cynhyrchu allbwn sy'n cynnwys traethawd. Mae'r AI yn gynhyrchydd testun-i-destun, er fy mod yn disgrifio'r AI fel generadur testun-i-draethawd gan fod hynny'n egluro'n haws at yr hyn y mae'n cael ei ddefnyddio'n gyffredin.

Mae llawer yn synnu pan soniaf fod y math hwn o AI wedi bod o gwmpas ers tro ac na wnaeth ChatGPT, a ryddhawyd ddiwedd mis Tachwedd, rywsut hawlio'r wobr fel y symudwr cyntaf i'r maes testun-i-draethawd hwn. procility. Rwyf wedi trafod dros y blynyddoedd apiau AI cynhyrchiol tebyg eraill, gweler fy sylw yn y ddolen yma.

Efallai mai'r rheswm pam nad ydych chi'n gwybod neu'n cofio'r achosion blaenorol o AI cynhyrchiol yw'r penbleth "methiant i lansio'n llwyddiannus" clasurol. Dyma beth sydd wedi digwydd fel arfer. Mae gwneuthurwr AI yn rhyddhau eu app AI cynhyrchiol, gan wneud hynny gyda chyffro mawr a disgwyliad eiddgar y bydd y byd yn gwerthfawrogi dyfeisio trap llygoden gwell, efallai y dywedwch. Ar y dechrau, mae popeth yn edrych yn dda. Mae pobl wedi eu syfrdanu gan yr hyn y gall AI ei wneud.

Yn anffodus, y cam nesaf yw bod yr olwynion yn dechrau dod oddi ar y bws diarhebol. Mae'r AI yn cynhyrchu traethawd sy'n cynnwys gair budr neu efallai ymadrodd budr. Mae trydariad firaol neu bostiad cyfryngau cymdeithasol arall yn amlygu'n amlwg bod yr AI wedi gwneud hyn. Condemniad yn codi. Ni allwn gael AI yn mynd o gwmpas a chynhyrchu geiriau sarhaus neu sylwadau sarhaus. Mae adlach aruthrol yn dod i'r amlwg. Efallai y bydd y gwneuthurwr AI yn ceisio newid gweithrediad mewnol yr AI, ond nid yw cymhlethdod yr algorithmau a'r data yn addas ar gyfer atebion cyflym. Mae stampede yn dilyn. Mae mwy a mwy o enghreifftiau o fudrwch allyrru AI yn cael eu canfod a'u postio ar-lein.

Yn anfoddog ond yn amlwg nid oes gan y gwneuthurwr AI unrhyw ddewis ond dileu'r app AI rhag cael ei ddefnyddio. Maent yn bwrw ymlaen fel y cyfryw ac yna'n aml yn cynnig ymddiheuriad eu bod yn difaru pe bai unrhyw un yn cael ei dramgwyddo gan yr allbynnau AI a gynhyrchwyd.

Yn ôl i'r bwrdd lluniadu, mae'r gwneuthurwr AI yn mynd. Mae gwers wedi'i dysgu. Byddwch yn ofalus iawn ynghylch rhyddhau AI cynhyrchiol sy'n cynhyrchu geiriau aflan neu debyg. Mae'n gusan marwolaeth i'r AI. Ar ben hynny, bydd enw da'r gwneuthurwr AI yn cael ei gleisio a'i guro, a allai bara am amser hir a thanseilio eu holl ymdrechion AI eraill gan gynnwys rhai nad oes ganddynt unrhyw beth i'w wneud â AI cynhyrchiol fel y cyfryw. Mae gwneud i'ch petard ddiflasu ar allyrru iaith AI sarhaus yn gamgymeriad parhaus bellach. Mae'n dal i ddigwydd.

Golchwch, rinsiwch, ac ailadroddwch.

Yn nyddiau cynnar y math hwn o AI, nid oedd y gwneuthurwyr AI mor gydwybodol nac mor fedrus ynghylch sgwrio eu AI o ran ceisio atal allyriadau sarhaus. Y dyddiau hyn, ar ôl gweld eu cyfoedion o'r blaen yn cael eu chwalu'n llwyr gan hunllef cysylltiadau cyhoeddus, mae'n ymddangos bod y mwyafrif o wneuthurwyr AI wedi cael y neges. Mae angen i chi roi cymaint o ganllawiau gwarchod ag y gallwch. Ceisio atal yr AI rhag allyrru geiriau neu ymadroddion budr. Defnyddiwch ba bynnag dechnegau dryslyd neu ddulliau hidlo a fydd yn atal yr AI rhag cynhyrchu ac arddangos geiriau neu draethodau y canfyddir eu bod yn anweddus.

Dyma flas o brif eiriau'r faner a ddefnyddir pan fydd AI yn cael ei ddal yn allyrru allbynnau amharchus:

  • “Mae AI yn dangos gwenwyndra erchyll”
  • “Mae AI yn drewi o bigotry llwyr”
  • “Mae AI yn dod yn amlwg yn sarhaus”
  • “AI yn lledaenu lleferydd casineb echrydus ac anfoesol”
  • Etc

Er hwylustod i'r drafodaeth yma, cyfeiriaf at allbynnu cynnwys sarhaus fel rhywbeth sy'n cyfateb i gynhyrchu lleferydd casineb. Wedi dweud hynny, byddwch yn ymwybodol bod yna bob math o gynnwys sarhaus y gellir ei gynhyrchu, yn mynd y tu hwnt i ffiniau lleferydd casineb yn unig. Mae lleferydd casineb fel arfer yn cael ei ddehongli fel un math yn unig o gynnwys sarhaus.

Gadewch i ni ganolbwyntio ar lefaru casineb ar gyfer y drafodaeth hon, er hwylustod i'r drafodaeth, er i ni sylweddoli bod cynnwys sarhaus arall yn haeddu craffu hefyd.

Cloddio I Leferydd Casineb Gan Bobl A Gan AI

Y Cenhedloedd Unedig sy'n diffinio lleferydd casineb y ffordd hon:

  • “Mewn iaith gyffredin, mae ‘lleferydd casineb’ yn cyfeirio at ddisgwrs sarhaus sy’n targedu grŵp neu unigolyn yn seiliedig ar nodweddion cynhenid ​​(fel hil, crefydd neu ryw) a gall hynny fygwth heddwch cymdeithasol. Er mwyn darparu fframwaith unedig i’r Cenhedloedd Unedig fynd i’r afael â’r mater yn fyd-eang, mae Strategaeth a Chynllun Gweithredu’r Cenhedloedd Unedig ar Leferydd Casineb yn diffinio lleferydd casineb fel ‘unrhyw fath o gyfathrebu ar lafar, yn ysgrifenedig neu’n ymddygiad, sy’n ymosod ar neu’n defnyddio iaith ddifrïol neu wahaniaethol gyda cyfeirio at berson neu grŵp ar sail pwy ydyn nhw, mewn geiriau eraill, yn seiliedig ar eu crefydd, ethnigrwydd, cenedligrwydd, hil, lliw, disgyniad, rhyw neu ffactor hunaniaeth arall.' Fodd bynnag, hyd yma nid oes diffiniad cyffredinol o lefaru casineb o dan gyfraith hawliau dynol rhyngwladol. Mae’r cysyniad yn dal i gael ei drafod, yn enwedig mewn perthynas â rhyddid barn a mynegiant, peidio â gwahaniaethu a chydraddoldeb” (postiad gwefan y Cenhedloedd Unedig o’r enw “What is hate speech?”).

Mae AI sy'n cynhyrchu testun yn amodol ar fynd i'r maes lleferydd casineb. Gallech ddweud yr un peth am destun-i-gelf, testun-i-sain, testun-i-fideo, a dulliau eraill o AI cynhyrchiol. Mae yna bosibilrwydd bob amser, er enghraifft, y byddai AI cynhyrchiol yn cynhyrchu darn celf sy'n debyg i lefaru casineb. At ddibenion y drafodaeth yma, rydw i'n mynd i ganolbwyntio ar y posibiliadau testun-i-destun neu destun-i-draethawd.

I mewn i hyn oll daw cyfres o ystyriaethau Moeseg AI a Chyfraith AI.

Byddwch yn ymwybodol bod ymdrechion parhaus i drwytho egwyddorion AI Moesegol i mewn i ddatblygu a maesu apps AI. Mae carfan gynyddol o foesegwyr AI pryderus a blaenorol yn ceisio sicrhau bod ymdrechion i ddyfeisio a mabwysiadu AI yn ystyried safbwynt o wneud AI Er Da ac osgoi AI Er Drwg. Yn yr un modd, mae yna ddeddfau AI newydd arfaethedig sy'n cael eu bandio o gwmpas fel atebion posibl i atal ymdrechion AI rhag mynd yn gyfeiliornus ar hawliau dynol ac ati. Am fy sylw parhaus a helaeth i AI Moeseg a Chyfraith AI, gweler y ddolen yma ac y ddolen yma, dim ond i enwi ond ychydig.

Mae datblygu a lledaenu praeseptau AI Moesegol yn cael eu dilyn er mwyn atal cymdeithas, gobeithio, rhag syrthio i fyrdd o faglau sy'n ysgogi AI. Am fy sylw i egwyddorion Moeseg AI y Cenhedloedd Unedig fel y'u ddyfeisiwyd ac a gefnogwyd gan bron i 200 o wledydd trwy ymdrechion UNESCO, gweler y ddolen yma. Yn yr un modd, mae deddfau AI newydd yn cael eu harchwilio i geisio cadw AI ar gilfach gyfartal. Mae un o'r cofnodion diweddaraf yn cynnwys set o arfaethedig AI Mesur Hawliau y rhyddhaodd Tŷ Gwyn yr Unol Daleithiau yn ddiweddar i nodi hawliau dynol mewn oes o AI, gweler y ddolen yma. Mae'n cymryd pentref i gadw datblygwyr AI ac AI ar lwybr cyfiawn ac atal yr ymdrechion pwrpasol neu ddamweiniol heb eu trin a allai danseilio cymdeithas.

Byddaf yn plethu ystyriaethau Moeseg AI ac AI Law yn y drafodaeth hon am AI yn sbeicio lleferydd casineb neu gynnwys sarhaus arall.

Un mymryn o ddryswch yr hoffwn ei glirio ar unwaith yw nad yw AI heddiw yn deimladwy ac felly ni allwch gyhoeddi y gallai'r AI gynhyrchu lleferydd casineb oherwydd bwriad pwrpasol tebyg i ddyn fel sydd wedi'i ymgorffori'n enaid rywsut yn yr AI. Mae Zany yn honni bod yr AI presennol yn deimladwy a bod gan yr AI enaid llygredig, gan achosi iddo greu lleferydd casineb.

Chwerthinllyd.

Peidiwch â chwympo amdani.

O ystyried y praesept allweddol hwnnw, mae rhai'n cynhyrfu gan arwyddion o'r fath gan eich bod yn ymddangos yn gollwng y AI oddi ar y bachyn. O dan y ffordd ryfedd honno o feddwl, daw'r anogaeth nesaf eich bod yn ôl pob golwg yn barod i gael AI i gynhyrchu unrhyw fath o allbynnau erchyll. Rydych chi o blaid AI sy'n lledaenu lleferydd casineb.

Yikes, ffurf braidd yn dirdro o afresymeg. Gwir hanfod y mater yw bod angen i ni ddal y gwneuthurwyr AI yn atebol, ynghyd â phwy bynnag sy'n gosod yr AI neu'n gweithredu'r AI. Rwyf wedi trafod yn helaeth nad ydym hyd yma ar y pwynt o ildio bod yn berson cyfreithiol i AI, gweler fy nadansoddiadau yn y ddolen yma, a than hynny mae AI yn ei hanfod y tu hwnt i gwmpas cyfrifoldeb cyfreithiol. Er hynny, mae bodau dynol yn sail i ddatblygiad AI. Yn ogystal, mae bodau dynol yn sail i faesu a gweithredu AI. Gallwn fynd ar ôl y bodau dynol hynny am ysgwyddo cyfrifoldeb eu AI.

Ar y llaw arall, gall hyn hefyd fod yn anodd, yn enwedig os yw'r AI yn cael ei arnofio allan i'r Rhyngrwyd ac nad ydym yn gallu nodi pa ddyn neu fodau dynol a wnaeth hyn, sef pwnc arall rwyf wedi ymdrin ag ef yn fy ngholofnau yn y ddolen yma. Anodd neu beidio, ni allwn gyhoeddi mai AI yw'r parti euog. Peidiwch â gadael i bobl ddefnyddio anthropomorffeiddio ffug yn slei i guddio a dianc rhag atebolrwydd am yr hyn y maent wedi'i wneud.

Yn ôl at y mater dan sylw.

Efallai eich bod yn pendroni pam nad yw pob gwneuthurwr AI yn cyfyngu ar eu AI cynhyrchiol fel ei bod yn amhosibl i'r AI gynhyrchu lleferydd casineb. Mae hyn yn ymddangos yn hawdd-peasy. Dim ond ysgrifennu cod neu sefydlu rhestr wirio o eiriau atgas, a gwnewch yn siŵr nad yw'r AI byth yn cynhyrchu unrhyw beth o'r fath. Mae'n ymddangos yn chwilfrydig efallai nad oedd y gwneuthurwyr AI eisoes wedi meddwl am yr ateb cyflym hwn.

Wel, mae'n gas gen i ddweud hyn wrthych chi ond mae'r cymhlethdodau sy'n gynhenid ​​i ddehongli'r hyn sy'n iaith casineb ai peidio yn troi allan i fod yn llawer anoddach nag y gallech chi dybio ei fod.

Symudwch hyn i faes bodau dynol a sut mae bodau dynol yn sgwrsio â'i gilydd. Tybiwch fod gennych ddyn sy'n dymuno osgoi siarad casineb. Mae'r person hwn yn ymwybodol iawn o iaith casineb ac mae'n wirioneddol obeithio osgoi dweud gair neu ymadrodd a allai olygu lleferydd casineb. Mae'r person hwn yn gyson yn ymwybodol o beidio â chaniatáu i iota o lleferydd casineb ddianc o'i geg.

A fydd y bod dynol hwn sydd ag ymennydd ac sy'n cael ei rybuddio i osgoi lleferydd casineb yn gallu bob amser a heb unrhyw siawns o lithro yn gallu smwddio sicrhau nad yw byth yn allyrru lleferydd casineb?

Efallai mai eich ysgogiad cyntaf yw dweud ie, wrth gwrs, y byddai bod dynol goleuedig yn gallu cyrraedd y nod hwnnw. Mae pobl yn smart. Os ydyn nhw'n meddwl am rywbeth, maen nhw'n gallu ei gyflawni. Cyfnod, diwedd y stori.

Peidiwch â bod mor sicr.

Tybiwch fy mod yn gofyn i'r person hwn ddweud wrthyf am leferydd casineb. Ar ben hynny, gofynnaf iddynt roi enghraifft o iaith casineb i mi. Rwyf am weld neu glywed enghraifft fel y gallaf wybod beth mae lleferydd casineb yn ei gynnwys. Mae fy rhesymau wedyn dros ofyn hyn uwchlaw bwrdd.

Beth ddylai'r person ei ddweud wrthyf?

Rwy'n meddwl y gallwch chi weld y trap sydd wedi'i osod. Os yw'r person yn rhoi enghraifft o iaith casineb i mi, gan gynnwys dweud gair neu ymadrodd budr mewn gwirionedd, maen nhw eu hunain bellach wedi dweud casineb. Bam, cawsom hwynt. Tra yr addawsant na ddywedent ymadrodd casineb, y maent yn awr wedi gwneyd hyny.

Annheg, yr ydych yn exclaim! Nid oeddent ond yn dweud y gair hwnnw neu'r geiriau hynny i roi enghraifft. Yn eu calonnau, nid oeddent yn credu yn y gair na'r geiriau. Mae'n gwbl allan o'i gyd-destun ac yn warthus i ddatgan bod y person yn atgas.

Rwy'n siŵr eich bod yn gweld efallai nad yw mynegi casineb yn siarad o reidrwydd yn sail atgas. Yn yr achos defnydd hwn, gan dybio nad oedd y person yn “ystyr” y geiriau, a'i fod ond yn adrodd y geiriau at ddibenion arddangos, mae'n debyg y byddem yn cytuno nad oeddent wedi bwriadu grymuso'r lleferydd casineb. Wrth gwrs, mae yna rai a allai fynnu bod dweud casineb, waeth beth fo'r rheswm neu'r sail, yn anghywir serch hynny. Dylai'r person fod wedi ceryddu'r cais. Dylent fod wedi sefyll eu tir a gwrthod dweud geiriau neu ymadroddion casineb, ni waeth pam na sut y gofynnir iddynt wneud hynny.

Gall hyn fynd braidd yn gylchol. Os na allwch ddweud beth sy'n gyfystyr â lleferydd casineb, sut gall eraill wybod beth i'w osgoi pan fyddant yn gwneud ymadroddion o unrhyw fath? Mae'n ymddangos ein bod ni'n sownd. Ni allwch ddweud yr hyn nad yw i'w ddweud, ac ni all neb arall ddweud wrthych beth na ellir ei ddweud.

Y ffordd arferol o amgylch y cyfyng-gyngor hwn yw disgrifio mewn geiriau eraill yr hyn a ystyrir yn lleferydd casineb, gan wneud hynny heb alw ar y geiriau lleferydd casineb eu hunain. Y gred yw y bydd darparu arwydd cyffredinol yn ddigon i hysbysu eraill o'r hyn y mae angen iddynt ei osgoi. Mae hynny'n ymddangos fel tacteg synhwyrol, ond mae ganddo hefyd broblemau a gallai person ddal i ddisgyn i ddefnyddio lleferydd casineb oherwydd nad oedd yn dirnad bod y diffiniad ehangach yn cwmpasu manylion yr hyn y mae wedi'i ddweud.

Mae hynny i gyd yn ymwneud â bodau dynol a sut mae bodau dynol yn siarad neu'n cyfathrebu â'i gilydd.

Dwyn i gof ein bod yn canolbwyntio yma ar AI. Mae'n rhaid i ni gael yr AI i osgoi neu atal ei hun yn llwyr rhag allyrru lleferydd casineb. Efallai y byddwch yn dadlau y gallwn efallai wneud hynny trwy wneud yn siŵr nad yw'r AI byth yn cael ei roi na'i hyfforddi ar unrhyw beth sy'n gyfystyr â lleferydd casineb. Voila, os nad oes mewnbwn o'r fath, mae'n debyg na fydd allbwn o'r fath. Problem wedi'i datrys.

Gawn ni weld sut mae hyn yn chwarae allan mewn gwirionedd. Rydyn ni'n dewis cael ap AI yn gyfrifiadurol i fynd allan i'r Rhyngrwyd ac archwilio miloedd ar filoedd o draethodau a naratifau sy'n cael eu postio ar y Rhyngrwyd. Trwy wneud hynny, rydym yn hyfforddi'r AI yn gyfrifiadurol ac yn fathemategol ar sut i ddod o hyd i batrymau ymhlith y geiriau y mae bodau dynol yn eu defnyddio. Dyna sut mae'r diweddaraf mewn AI cynhyrchiol yn cael ei ddyfeisio, ac mae hefyd yn sail hollbwysig i'r rheswm pam mae'r Deallusrwydd Artiffisial yn ymddangos mor rhugl wrth gynhyrchu traethodau iaith naturiol.

Dywedwch wrthyf, os gallwch, sut y byddai'r hyfforddiant cyfrifiannol sy'n seiliedig ar filiynau a biliynau o eiriau ar y Rhyngrwyd yn cael ei wneud yn y fath fodd fel nad oedd unrhyw ymddangosiad neu hyd yn oed tamaid o lefaru casineb yn cael ei gwmpasu ar unrhyw adeg?

Byddwn yn meiddio dweud bod hwn yn ddyhead dyrys a bron yn amhosibl.

Yr ods yw y bydd lleferydd casineb yn cael ei lyncu gan yr AI a’i rwydwaith paru patrwm cyfrifiannol. Mae ceisio atal hyn yn broblemus. Hefyd, hyd yn oed os gwnaethoch ei leihau, mae yna rai o hyd a allai sleifio drwodd. Nid oes gennych lawer o ddewis ond cymryd yn ganiataol y bydd rhai yn bodoli o fewn y rhwydwaith paru patrymau neu y bydd cysgod o'r fath eiriad yn ymwreiddio.

Byddaf yn ychwanegu mwy o droeon trwstan.

Rwy’n credu y gallem ni i gyd gydnabod bod lleferydd casineb yn newid dros amser. Gall yr hyn y gellid bod wedi'i weld fel rhywbeth nad yw'n iaith casineb gael ei benderfynu'n ddiwylliannol ac yn gymdeithasol fel lleferydd casineb yn ddiweddarach. Felly, os ydym yn hyfforddi ein AI ar destun Rhyngrwyd ac yna gadewch i ni ddweud rhewi'r AI i beidio â dilyn hyfforddiant pellach ar y Rhyngrwyd, efallai y byddwn wedi dod ar draws lleferydd casineb bryd hynny, er nad oedd yn cael ei ystyried yn lleferydd casineb ar y pryd. Dim ond ar ôl y ffaith y gellir datgan yr araith honno fel lleferydd casineb.

Unwaith eto, y hanfod yw na fydd ceisio datrys y broblem hon trwy sicrhau nad yw'r AI byth yn agored i lefaru casineb yn fwled arian. Bydd yn rhaid i ni ddod o hyd i ffordd o atal yr AI rhag allyrru lleferydd casineb oherwydd, er enghraifft, newid mwy sydd wedyn yn cynnwys lleferydd casineb na chafodd ei ystyried felly o'r blaen.

Mae tro arall eto yn deilwng o feddwl.

Soniais yn gynharach, wrth ddefnyddio AI cynhyrchiol fel ChatGPT, bod y defnyddiwr yn mewnbynnu testun i ysgogi'r AI i gynhyrchu traethawd. Mae'r testun a gofnodwyd yn cael ei ystyried yn fath o anogwr neu anogaeth ar gyfer yr app AI. Byddaf yn egluro mwy am hyn mewn eiliad.

Beth bynnag, dychmygwch fod rhywun sy'n defnyddio ap AI cynhyrchiol yn penderfynu mynd i mewn i ryw gymaint o araith casineb fel ysgogiad.

Beth ddylai ddigwydd?

Os bydd yr AI yn cymryd y geiriau hynny ac yn cynhyrchu traethawd fel allbwn yn seiliedig ar y geiriau hynny, mae'n debygol y bydd y lleferydd casineb yn cael ei gynnwys yn y traethawd a gynhyrchir. Rydych chi'n gweld, fe gawson ni'r AI i ddweud lleferydd casineb, hyd yn oed os nad oedd erioed wedi'i hyfforddi ar lefaru casineb yn y dechrau.

Mae rhywbeth arall y mae angen i chi ei wybod.

Cofiwch fy mod newydd sôn y gall bod dynol gael ei faglu drwy ofyn iddo roi enghreifftiau o lefaru casineb. Gellid ceisio'r un peth ar AI. Mae defnyddiwr yn mewnbynnu anogwr sy'n gofyn i'r AI roi enghreifftiau o lefaru casineb. A ddylai'r AI gydymffurfio a darparu enghreifftiau o'r fath? Rwy'n betio eich bod yn ôl pob tebyg yn credu na ddylai AI wneud hynny. Ar y llaw arall, os yw'r AI wedi'i rigio'n gyfrifiadol i beidio â gwneud hynny, a yw hyn yn anfantais bosibl na fydd y rhai sy'n defnyddio'r AI yn gallu bod, a ddywedwn ni byth yn cael eu cyfarwyddo gan yr AI ynghylch beth yw lleferydd casineb mewn gwirionedd ( y tu hwnt i ddim ond cyffredinoli amdano)?

Cwestiynau anodd.

Rwy’n tueddu i gategoreiddio lleferydd casineb a allyrrir gan AI i’r tri phrif fwced hyn:

  • Modd Bob Dydd. Mae AI yn allyrru lleferydd casineb heb unrhyw brocio amlwg gan y defnyddiwr ac fel pe bai'n gwneud hynny mewn ffordd “gyffredin”.
  • Gan Prodio Achlysurol. Mae AI yn allyrru lleferydd casineb fel y mae defnyddiwr yn ei brolio o ran ei anogwr neu gyfres o anogwyr sy'n ymddangos fel pe baent yn cynnwys neu'n ceisio allyriadau o'r fath yn uniongyrchol.
  • Fesul Stocio Penderfynol. Mae AI yn allyrru lleferydd casineb ar ôl cyfres benderfynol iawn o wthio a phropiau prydlon gan ddefnyddiwr sy'n benderfynol o gael yr AI i gynhyrchu allbwn o'r fath.

Byddai'r cenedlaethau cynharach o AI cynhyrchiol yn aml yn allyrru lleferydd casineb ar ddiferyn het; felly gallech ddosbarthu'r achosion hynny fel math o modd bob dydd amrantiad. Enciliodd gwneuthurwyr AI a theganu gyda'r AI i'w wneud yn llai tebygol o gael eu llethu'n hawdd wrth gynhyrchu lleferydd casineb.

Ar ôl rhyddhau'r AI mwy mireinio, mae'r siawns o weld unrhyw rai modd bob dydd lleihawyd yn sylweddol yr achosion o lefaru casineb. Yn lle hynny, mae'n debygol y byddai'r lleferydd casineb yn codi dim ond pan fyddai defnyddiwr yn gwneud rhywbeth fel ysgogiad a allai danio, yn gyfrifiadol ac yn fathemategol, gysylltiad â lleferydd sy'n gysylltiedig â chasineb yn y rhwydwaith paru patrymau. Gallai defnyddiwr wneud hyn trwy ddigwydd a pheidio â sylweddoli y byddai'r hyn a ddarparwyd ganddo fel anogwr yn achosi lleferydd casineb yn arbennig. Ar ôl cael lleferydd casineb mewn traethawd wedi'i allbynnu, byddai'r defnyddiwr yn sylweddoli'n aml ac yn gweld y gallai rhywbeth yn ei anogwr fod wedi arwain yn rhesymegol at gynnwys y lleferydd casineb yn yr allbwn.

Dyma beth rydw i'n cyfeirio ato prodio achlysurol.

Y dyddiau hyn, mae'r ymdrechion amrywiol i gwtogi ar iaith casineb a gynhyrchir gan AI yn gymharol gryf o gymharu â'r gorffennol. Fel y cyfryw, mae bron angen i chi fynd allan o'ch ffordd i gael lleferydd casineb i gael ei gynhyrchu. Mae rhai pobl yn dewis gweld yn bwrpasol a allant gael lleferydd casineb i ddod allan o'r apiau AI cynhyrchiol hyn. Rwy'n galw hyn sticio penderfynol.

Rwyf am bwysleisio y gall pob un o'r tri modd a nodir ddigwydd ac nad ydynt yn annibynnol ar ei gilydd. Gall ap AI cynhyrchiol o bosibl gynhyrchu lleferydd casineb heb unrhyw fath o anogwr sy'n ymddangos i sbarduno cynhyrchiad o'r fath. Yn yr un modd, gallai rhywbeth mewn anogwr gael ei ddehongli'n rhesymegol ac yn fathemategol fel rhywbeth sy'n ymwneud â pham mae lleferydd casineb wedi'i allbynnu. Ac yna'r drydedd agwedd, sy'n ceisio'n bwrpasol i gynhyrchu lleferydd casineb, yw'r un anoddaf o bosibl o'r dulliau i geisio cael AI i osgoi cael ei roi ar waith cyflawni. Mwy am hyn o bryd i'w gilydd.

Mae gennym rywfaint o ddadbacio ychwanegol i'w wneud ar y pwnc peniog hwn.

Yn gyntaf, dylem sicrhau ein bod i gyd ar yr un dudalen am yr hyn y mae Generative AI yn ei gynnwys a hefyd yr hyn y mae ChatGPT yn ei olygu. Unwaith y byddwn yn ymdrin â'r agwedd sylfaenol honno, gallwn gynnal asesiad grymus o'r mater pwysfawr hwn.

Os ydych chi eisoes yn gyfarwydd iawn â Generative AI a ChatGPT, efallai y gallwch chi sgimio'r adran nesaf a bwrw ymlaen â'r adran sy'n ei dilyn. Credaf y bydd pawb arall yn gweld y manylion hanfodol am y materion hyn yn addysgiadol trwy ddarllen yr adran yn agos a chael y wybodaeth ddiweddaraf.

Cychwyn Cyflym Am AI Cynhyrchiol A ChatGPT

Mae ChatGPT yn system sgwrsiol ryngweithiol AI pwrpas-cyffredinol sy'n canolbwyntio ar sgwrsio, sydd yn ei hanfod yn chatbot cyffredinol sy'n ymddangos yn ddiniwed, serch hynny, mae'n cael ei ddefnyddio'n weithredol ac yn frwd gan bobl mewn ffyrdd sy'n dal llawer yn gwbl ddiofal, fel y byddaf yn ymhelaethu cyn bo hir. Mae'r ap AI hwn yn trosoli techneg a thechnoleg yn y byd AI y cyfeirir ato'n aml fel AI cynhyrchiol. Mae'r AI yn cynhyrchu allbynnau fel testun, a dyna mae ChatGPT yn ei wneud. Mae apiau AI cynhyrchiol eraill yn cynhyrchu delweddau fel lluniau neu waith celf, tra bod eraill yn cynhyrchu ffeiliau sain neu fideos.

Byddaf yn canolbwyntio ar yr apiau AI cynhyrchiol sy'n seiliedig ar destun yn y drafodaeth hon gan mai dyna mae ChatGPT yn ei wneud.

Mae apiau AI cynhyrchiol yn hynod o hawdd i'w defnyddio.

Y cyfan sy'n rhaid i chi ei wneud yw nodi anogwr a bydd yr ap AI yn cynhyrchu traethawd i chi sy'n ceisio ymateb i'ch anogwr. Bydd y testun a gyfansoddwyd yn ymddangos fel pe bai'r traethawd wedi'i ysgrifennu gan y llaw ddynol a'r meddwl. Pe baech chi'n nodi anogwr sy'n dweud “Dywedwch wrthyf am Abraham Lincoln” bydd yr AI cynhyrchiol yn rhoi traethawd ichi am Lincoln. Mae hyn yn cael ei ddosbarthu'n gyffredin fel AI cynhyrchiol sy'n perfformio testun-i-destun neu mae'n well gan rai ei alw testun-i-draethawd allbwn. Fel y crybwyllwyd, mae yna ddulliau eraill o AI cynhyrchiol, megis testun-i-gelf a thestun-i-fideo.

Efallai mai eich meddwl cyntaf yw nad yw'r gallu cynhyrchiol hwn yn ymddangos yn gymaint o lawer o ran cynhyrchu traethodau. Gallwch chi wneud chwiliad ar-lein o'r Rhyngrwyd yn hawdd a dod o hyd i dunelli a thunelli o draethodau am yr Arlywydd Lincoln yn hawdd. Y ciciwr yn achos AI cynhyrchiol yw bod y traethawd a gynhyrchir yn gymharol unigryw ac yn darparu cyfansoddiad gwreiddiol yn hytrach na chopi. Pe baech yn ceisio dod o hyd i'r traethawd AI a gynhyrchwyd ar-lein yn rhywle, byddech yn annhebygol o'i ddarganfod.

Mae Deallusrwydd Artiffisial cynhyrchiol wedi’i hyfforddi ymlaen llaw ac mae’n defnyddio fformiwleiddiad mathemategol a chyfrifiannol cymhleth sydd wedi’i sefydlu drwy archwilio patrymau mewn geiriau ysgrifenedig a storïau ar draws y we. O ganlyniad i archwilio miloedd ar filiynau o ddarnau ysgrifenedig, gall yr AI chwistrellu traethodau a straeon newydd sy'n gymysgfa o'r hyn a ddarganfuwyd. Trwy ychwanegu amrywiol swyddogaethau tebygol, mae'r testun sy'n deillio ohono yn eithaf unigryw o'i gymharu â'r hyn a ddefnyddiwyd yn y set hyfforddi.

Dyna pam y bu cynnwrf ynghylch myfyrwyr yn gallu twyllo wrth ysgrifennu traethodau y tu allan i'r ystafell ddosbarth. Ni all athro gymryd y traethawd y mae myfyrwyr twyllodrus yn honni ei fod yn ysgrifennu ei hun a cheisio darganfod a gafodd ei gopïo o ryw ffynhonnell ar-lein arall. Ar y cyfan, ni fydd unrhyw draethawd preexisting diffiniol ar-lein sy'n cyd-fynd â'r traethawd a gynhyrchir gan AI. Wedi dweud y cyfan, bydd yn rhaid i'r athro dderbyn yn ddig fod y myfyriwr wedi ysgrifennu'r traethawd fel darn o waith gwreiddiol.

Mae pryderon ychwanegol ynghylch AI cynhyrchiol.

Un anfantais hanfodol yw y gall y traethodau a gynhyrchir gan ap AI sy'n seiliedig ar gynhyrchiol gynnwys anwireddau amrywiol, gan gynnwys ffeithiau sy'n amlwg yn anghywir, ffeithiau sy'n cael eu portreadu'n gamarweiniol, a ffeithiau ymddangosiadol sydd wedi'u ffugio'n llwyr. Cyfeirir yn aml at yr agweddau ffug hynny fel ffurf o rhithweledigaethau AI, ymadrodd sy'n fy nigalonni ond yn anffodus fel pe bai'n ennill tyniant poblogaidd beth bynnag (am fy esboniad manwl ynghylch pam mae hwn yn derminoleg lousy ac anaddas, gweler fy sylw yn y ddolen yma).

Hoffwn egluro un agwedd bwysig cyn inni fynd i'r afael â'r trwch o bethau ar y pwnc hwn.

Bu rhai honiadau rhy fach ar gyfryngau cymdeithasol AI cynhyrchiol gan honni bod y fersiwn ddiweddaraf hon o AI mewn gwirionedd AI teimladwy (na, maen nhw'n anghywir!). Mae'r rhai mewn AI Moeseg a Chyfraith AI yn bryderus iawn am y duedd gynyddol hon o hawliadau estynedig. Efallai y byddwch yn dweud yn gwrtais bod rhai pobl yn gorbwysleisio'r hyn y gall AI heddiw ei wneud mewn gwirionedd. Maent yn cymryd yn ganiataol bod gan AI alluoedd nad ydym wedi gallu eu cyflawni eto. Mae hynny'n anffodus. Yn waeth byth, gallant ganiatáu eu hunain ac eraill i fynd i sefyllfaoedd enbyd oherwydd y rhagdybiaeth y bydd yr AI yn deimladwy neu'n ddynol o ran gallu gweithredu.

Peidiwch ag anthropomorffeiddio AI.

Bydd gwneud hynny yn eich dal mewn trap dibyniaeth gludiog a dour o ddisgwyl i'r AI wneud pethau nad yw'n gallu eu perfformio. Gyda dweud hynny, mae'r diweddaraf mewn AI cynhyrchiol yn gymharol drawiadol am yr hyn y gall ei wneud. Fodd bynnag, byddwch yn ymwybodol bod yna gyfyngiadau sylweddol y dylech eu cadw mewn cof yn barhaus wrth ddefnyddio unrhyw ap AI cynhyrchiol.

Os oes gennych ddiddordeb yn y cynnwrf sy'n ehangu'n gyflym am ChatGPT a Generative AI i gyd, rydw i wedi bod yn gwneud cyfres â ffocws yn fy ngholofn a allai fod yn addysgiadol i chi. Dyma gipolwg rhag ofn i unrhyw un o'r pynciau hyn ddal eich ffansi:

  • 1) Rhagfynegiadau o Ddatblygiadau AI Cynhyrchiol yn Dod. Os ydych chi eisiau gwybod beth sy'n debygol o ddigwydd am AI trwy gydol 2023 a thu hwnt, gan gynnwys datblygiadau sydd ar ddod mewn AI cynhyrchiol a ChatGPT, byddwch chi am ddarllen fy rhestr gynhwysfawr o ragfynegiadau 2023 yn y ddolen yma.
  • 2) AI cynhyrchiol a Chyngor Iechyd Meddwl. Dewisais adolygu sut mae AI cynhyrchiol a ChatGPT yn cael eu defnyddio ar gyfer cyngor iechyd meddwl, tuedd drafferthus, yn ôl fy nadansoddiad â ffocws yn y ddolen yma.
  • 3) Hanfodion AI Cynhyrchiol a ChatGPT. Mae’r darn hwn yn archwilio’r elfennau allweddol o sut mae AI cynhyrchiol yn gweithio ac yn ymchwilio’n benodol i ap ChatGPT, gan gynnwys dadansoddiad o’r wefr a’r ffanffer, yn y ddolen yma.
  • 4) Tensiwn Rhwng Athrawon A Myfyrwyr Dros AI Cynhyrchiol A ChatGPT. Dyma'r ffyrdd y bydd myfyrwyr yn defnyddio AI cynhyrchiol a ChatGPT yn ddichellgar. Yn ogystal, mae sawl ffordd i athrawon ymgodymu â'r don lanw hon. Gwel y ddolen yma.
  • 5) Cyd-destun A Defnydd AI Genehedlol. Gwnes hefyd archwiliad tafod-yn-y-boch tymhorol â blas ar gyd-destun yn ymwneud â Siôn Corn yn ymwneud â ChatGPT ac AI cynhyrchiol yn y ddolen yma.
  • 6) Sgamwyr sy'n Defnyddio AI Generative. Ar nodyn ofnadwy, mae rhai sgamwyr wedi darganfod sut i ddefnyddio AI cynhyrchiol a ChatGPT i wneud camwedd, gan gynnwys cynhyrchu e-byst sgam a hyd yn oed gynhyrchu cod rhaglennu ar gyfer malware, gweler fy nadansoddiad yn y ddolen yma.
  • 7) Camgymeriadau Rookie Gan Ddefnyddio AI Cynhyrchiol. Mae llawer o bobl yn gor-saethu ac yn syndod yn tanseilio'r hyn y gall AI cynhyrchiol a ChatGPT ei wneud, felly edrychais yn arbennig ar y tanseilio y mae rookies AI yn tueddu i'w wneud, gweler y drafodaeth yn y ddolen yma.
  • 8) Ymdopi ag Anogwyr AI Cynhyrchiol A Rhithweledigaethau AI. Rwy'n disgrifio dull blaengar o ddefnyddio ychwanegion AI i ddelio â'r materion amrywiol sy'n gysylltiedig â cheisio mewnbynnu anogwyr addas i AI cynhyrchiol, ac mae yna ychwanegion AI ychwanegol ar gyfer canfod allbynnau ac anwireddau AI fel y'u gelwir, fel y'u gelwir. gorchuddio yn y ddolen yma.
  • 9) Dadelfennu Hawliadau Pen Esgyrn Ynghylch Canfod Traethodau Cynhyrchiol o AI. Mae rhuthr aur cyfeiliornus o apiau AI sy'n datgan eu bod yn gallu canfod a oedd unrhyw draethawd penodol wedi'i gynhyrchu gan ddyn yn erbyn AI a gynhyrchwyd. Ar y cyfan, mae hyn yn gamarweiniol ac mewn rhai achosion, honiad â phen asgwrn ac anghynaladwy, gweler fy sylw yn y ddolen yma.
  • 10) Gallai Chwarae Rôl Trwy AI Generative Taenu Anfanteision Iechyd Meddwl. Mae rhai yn defnyddio AI cynhyrchiol fel ChatGPT i chwarae rôl, lle mae'r ap AI yn ymateb i ddyn fel pe bai'n bodoli mewn byd ffantasi neu leoliad colur arall. Gallai hyn gael ôl-effeithiau iechyd meddwl, gw y ddolen yma.
  • 11) Datgelu Ystod Gwallau ac Anwireddau Allbynnau. Mae amrywiol restrau a gasglwyd yn cael eu llunio i geisio arddangos natur gwallau ac anwireddau a gynhyrchir gan ChatGPT. Mae rhai yn credu bod hyn yn hanfodol, tra bod eraill yn dweud bod yr ymarfer yn ofer, gweler fy nadansoddiad yn y ddolen yma.
  • 12) Ysgolion sy'n Gwahardd Mae AI ChatGPT Cynhyrchiol Ar Goll Y Cwch. Efallai eich bod yn gwybod bod ysgolion amrywiol fel Adran Addysg Dinas Efrog Newydd (NYC) wedi datgan gwaharddiad ar ddefnyddio ChatGPT ar eu rhwydwaith a dyfeisiau cysylltiedig. Er y gallai hyn ymddangos yn rhagofal defnyddiol, ni fydd yn symud y nodwydd ac yn anffodus mae'n gweld eisiau'r cwch yn llwyr, gweler fy sylw yn y ddolen yma.
  • 13) Mae AI ChatGPT cynhyrchiol yn mynd i fod ym mhobman oherwydd yr API sydd ar ddod. Mae yna dro pwysig ar y gweill ynghylch y defnydd o ChatGPT, sef, trwy ddefnyddio porth API i'r app AI penodol hwn, y bydd rhaglenni meddalwedd eraill yn gallu galw a defnyddio ChatGPT. Mae hyn yn mynd i ehangu'n sylweddol y defnydd o AI cynhyrchiol ac mae iddo ganlyniadau nodedig, gweler fy ymhelaethu ar y ddolen yma.
  • 14) Ffyrdd y Gallai ChatGPT Wilymu Neu Ymdoddi. Roedd nifer o faterion gofidus posibl o flaen ChatGPT o ran tanseilio'r ganmoliaeth aruthrol y mae wedi'i chael hyd yn hyn. Mae'r dadansoddiad hwn yn archwilio'n fanwl wyth problem bosibl a allai achosi i ChatGPT golli ei stêm a hyd yn oed yn y pen draw yn y doghouse, gweler y ddolen yma.
  • 15) Gofyn A Yw Generative AI ChatGPT Yn ddrych i'r Enaid. Mae rhai pobl wedi bod yn dweud bod AI cynhyrchiol fel ChatGPT yn ddrych i enaid dynoliaeth. Mae hyn yn ymddangos yn eithaf amheus. Dyma'r ffordd i ddeall hyn i gyd, gw y ddolen yma.
  • 16) Cyfrinachedd A Phreifatrwydd wedi'u Llethu Gan ChatGPT. Mae'n ymddangos nad yw llawer yn sylweddoli bod y trwyddedu sy'n gysylltiedig ag apiau AI cynhyrchiol fel ChatGPT yn aml yn caniatáu i'r gwneuthurwr AI weld a defnyddio'ch anogwyr a gofnodwyd. Gallech fod mewn perygl o breifatrwydd a cholli cyfrinachedd data, gweler fy asesiad yn y ddolen yma.
  • 17) Ffyrdd y Mae Gwneuthurwyr Apiau Yn Ceisio'n Amheugar I Gasglu Hawl i ChatGPT. ChatGPT yw ffagl y sylw ar hyn o bryd. Mae gwneuthurwyr apiau nad oes ganddynt unrhyw beth i'w wneud â ChatGPT yn ceisio'n dwymyn i honni neu awgrymu eu bod yn defnyddio ChatGPT. Dyma beth i wylio amdano, gw y ddolen yma.

Efallai y bydd o ddiddordeb i chi fod ChatGPT yn seiliedig ar fersiwn o app AI rhagflaenol o'r enw GPT-3. Ystyrir ChatGPT yn gam nesaf ychydig, y cyfeirir ato fel GPT-3.5. Rhagwelir y bydd GPT-4 yn debygol o gael ei ryddhau yng ngwanwyn 2023. Yn ôl pob tebyg, mae GPT-4 yn mynd i fod yn gam trawiadol ymlaen o ran gallu cynhyrchu traethodau sy'n ymddangos yn hyd yn oed yn fwy rhugl, gan fynd yn ddyfnach, a bod yn syndod. -yn ysbrydoli rhyfeddu at y cyfansoddiadau y gall eu cynhyrchu.

Gallwch ddisgwyl gweld rownd newydd o ryfeddod pan ddaw'r gwanwyn ymlaen a'r diweddaraf mewn AI cynhyrchiol yn cael ei ryddhau.

Rwy'n codi hyn oherwydd bod ongl arall i'w chadw mewn cof, sy'n cynnwys sawdl Achilles posibl i'r apiau AI cynhyrchiol gwell a mwy hyn. Os bydd unrhyw werthwr AI yn sicrhau bod ap AI cynhyrchiol ar gael sy'n datgelu budrwch yn ddiflas, gallai hyn chwalu gobeithion y gwneuthurwyr AI hynny. Gall gorlifiad cymdeithasol achosi i bob AI cynhyrchiol gael llygad du difrifol. Heb os, bydd pobl yn cynhyrfu'n fawr â chanlyniadau aflan, sydd wedi digwydd droeon eisoes ac wedi arwain at adlachiadau condemniad cymdeithasol ffyrnig tuag at AI.

Un rhagrybudd terfynol am y tro.

Beth bynnag a welwch neu a ddarllenwch mewn ymateb AI cynhyrchiol hynny ymddangos i gael eich cyfleu fel rhywbeth cwbl ffeithiol (dyddiadau, lleoedd, pobl, ac ati), gwnewch yn siŵr eich bod yn amheus a byddwch yn barod i wirio'r hyn a welwch.

Oes, gellir llunio dyddiadau, gellir gwneud lleoedd, ac elfennau yr ydym fel arfer yn disgwyl iddynt fod uwchlaw gwaradwydd yw bob yn destun amheuon. Peidiwch â chredu'r hyn a ddarllenwch a chadwch lygad yn amheus wrth archwilio unrhyw draethodau neu allbynnau AI cynhyrchiol. Os yw ap AI cynhyrchiol yn dweud wrthych fod Abraham Lincoln wedi hedfan o amgylch y wlad yn ei jet preifat ei hun, mae'n siŵr y byddech chi'n gwybod bod hyn yn wallgof. Yn anffodus, efallai na fydd rhai pobl yn sylweddoli nad oedd jetiau o gwmpas yn ei ddydd, neu efallai eu bod yn gwybod ond yn methu â sylwi bod y traethawd yn gwneud yr honiad pres a gwarthus hwn.

Dogn cryf o amheuaeth iach a meddylfryd parhaus o anghrediniaeth fydd eich ased gorau wrth ddefnyddio AI cynhyrchiol.

Rydym yn barod i symud i gam nesaf y eglurhad hwn.

Gwthio AI Cenhedlol I Dorbwynt

Nawr ein bod wedi sefydlu'r hanfodion, gallwn blymio i'r pwnc o wthio AI cynhyrchiol a ChatGPT i gynhyrchu lleferydd casineb a chynnwys sarhaus arall.

Pan fyddwch yn mewngofnodi i ChatGPT am y tro cyntaf, mae yna nifer o arwyddion rhybuddiol gan gynnwys y rhain:

  • “Gall weithiau gynhyrchu cyfarwyddiadau niweidiol neu gynnwys rhagfarnllyd.”
  • “Wedi’i hyfforddi i wrthod ceisiadau amhriodol.”
  • “Gall gynhyrchu gwybodaeth anghywir o bryd i’w gilydd.”
  • “Gwybodaeth gyfyngedig am y byd a digwyddiadau ar ôl 2021.”

Dyma gwestiwn i chi ei gymysgu.

A yw'r rhybudd y gallai'r ap AI gynhyrchu cyfarwyddiadau niweidiol a / neu gynnwys rhagfarnllyd o bosibl yn rhoi digon o ryddid i'r gwneuthurwr AI?

Mewn geiriau eraill, mae'n debyg eich bod chi'n defnyddio ChatGPT ac mae'n cynhyrchu traethawd rydych chi'n credu sy'n cynnwys lleferydd casineb. Gadewch i ni dybio eich bod yn groyw am hyn. Rydych chi'n mynd i'r cyfryngau cymdeithasol ac yn postio sylwebaeth gynddeiriog mai'r app AI yw'r peth gwaethaf erioed. Efallai eich bod mor dramgwyddus fel eich bod yn datgan eich bod yn mynd i erlyn y gwneuthurwr AI am ganiatáu i lleferydd casineb o'r fath gael ei gynhyrchu.

Y gwrthddadl yw bod yr app AI wedi cael rhybudd gofalus, felly, fe wnaethoch chi dderbyn y risg trwy fynd ymlaen i ddefnyddio'r app AI. O safbwynt Moeseg AI, efallai bod y gwneuthurwr AI wedi gwneud digon i haeru eich bod yn ymwybodol o'r hyn a allai ddigwydd. Yn yr un modd, o safbwynt cyfreithiol, efallai bod y rhybudd yn gyfystyr â digon o ben i fyny ac ni fyddwch yn drechaf yn y llys.

Mae hyn i gyd i fyny yn yr awyr a bydd yn rhaid i ni aros i weld sut mae pethau'n troi allan.

Ar un olwg, mae gan y gwneuthurwr AI rywbeth arall ar eu cyfer yn eu hamddiffyniad yn erbyn unrhyw honiadau cynddeiriog o'r app AI o bosibl yn cynhyrchu lleferydd casineb. Maent wedi ceisio atal cynnwys sarhaus rhag cael ei gynhyrchu. Chwi a welwch, pe na baent wedi gwneyd dim i gwtogi ar hyn, y mae rhywun yn tybied y byddent ar iâ teneuach. Trwy o leiaf gymryd poenau sylweddol i osgoi'r mater, mae'n debyg bod ganddyn nhw goes ychydig yn gryfach i sefyll arno (gallai dal i gael ei fwrw allan oddi tanynt).

Roedd un dull iachaol a ddefnyddiwyd yn cynnwys techneg AI o'r enw RLHF (dysgu atgyfnerthu trwy adborth dynol). Yn gyffredinol, mae hyn yn cynnwys cael yr AI i gynhyrchu cynnwys y gofynnir i fodau dynol wedyn ei raddio neu ei adolygu. Yn seiliedig ar y sgôr neu'r adolygiad, mae'r AI wedyn yn fathemategol ac yn gyfrifiadol yn ceisio osgoi beth bynnag a ystyrir yn gynnwys anghyfiawn neu dramgwyddus. Bwriad y dull yw archwilio digon o enghreifftiau o'r hyn sy'n iawn yn erbyn yr hyn sy'n anghywir fel y gall yr AI ganfod patrwm mathemategol trosfwaol ac yna defnyddio'r patrwm hwnnw o hyn ymlaen.

Mae dull cyffredin arall y dyddiau hyn yn cynnwys defnyddio AI Gwrthwynebol.

Dyma sut mae hynny'n gweithio. Rydych chi wedi sefydlu system AI wahanol a fydd yn ceisio bod yn wrthwynebydd i'r AI rydych chi'n ceisio ei hyfforddi. Yn yr achos hwn, byddem yn sefydlu system AI sy'n ceisio atal lleferydd casineb. Byddai'n bwydo awgrymiadau i'r app AI sy'n ceisio twyllo'r app AI i allbynnu cynnwys budr. Yn y cyfamser, mae'r AI sy'n cael ei dargedu yn cadw golwg ar pryd mae'r AI gwrthwynebus yn llwyddiannus ac yna'n ceisio addasu'n algorithmig i leihau hynny rhag digwydd eto. Mae'n gambit cath yn erbyn llygoden. Mae hyn yn cael ei redeg drosodd a throsodd, gan wneud hynny nes ei bod yn ymddangos nad yw'r AI gwrthwynebus yn arbennig o lwyddiannus bellach wrth gael yr AI wedi'i dargedu i wneud y pethau drwg.

Trwy'r ddwy brif dechneg hynny, ynghyd â dulliau eraill, mae llawer o AI cynhyrchiol heddiw yn llawer gwell am osgoi a/neu ganfod cynnwys sarhaus nag yn y blynyddoedd diwethaf.

Ond peidiwch â disgwyl perffeithrwydd o'r dulliau hyn. Y tebygrwydd yw y bydd ffrwyth crog isel allbynnau budr yn debygol o gael eu cadw dan reolaeth gan dechnegau AI o’r fath. Mae llawer o le o hyd i fudr gael ei ollwng.

Rwyf fel arfer yn nodi mai dyma rai o'r agweddau y ceisir eu dal:

  • Allyrru gair drwg arbennig
  • Yn nodi ymadrodd, brawddeg neu sylw budr arbennig
  • Mynegi cenhedlu budr arbennig
  • Yn awgrymu gweithred neu syniad budr arbennig
  • Ymddengys ei fod yn dibynnu ar ragdybiaeth aflan arbennig
  • Arall

Nid yw hyn yn wyddoniaeth fanwl gywir. Sylweddoli ein bod yn delio â geiriau. Mae geiriau yn semantig amwys. Chwarae plentyn yw dod o hyd i air drwg arbennig, ond mae ceisio mesur a yw brawddeg neu baragraff yn cynnwys ystyr aflan yn llawer anoddach. Yn unol â'r diffiniad cynharach o lleferydd casineb gan y Cenhedloedd Unedig, mae lledred aruthrol yn bodoli o ran yr hyn y gellir ei ddehongli fel lleferydd casineb yn erbyn yr hyn na allai fod.

Efallai y byddwch chi'n dweud bod yr ardaloedd llwyd yn llygad y gwyliedydd.

Wrth siarad am lygad y gwylwyr, mae yna bobl heddiw yn defnyddio AI cynhyrchiol fel ChatGPT sy'n ceisio'n bwrpasol i gael yr apiau AI hyn i gynhyrchu cynnwys sarhaus. Dyma eu hymgais. Maen nhw'n treulio oriau ar oriau yn ceisio cael hyn i ddigwydd.

Pam felly?

Dyma fy nodweddion o'r helwyr allbynnau ymosodol AI dynol hynny:

  • Ddiffuant. Mae'r bobl hyn eisiau helpu i fireinio AI a chynorthwyo dynoliaeth i wneud hynny. Maent yn credu eu bod yn gwneud gwaith arwrol ac yn ymhyfrydu y gallent gynorthwyo i hyrwyddo AI er lles pawb.
  • Funsters. Mae'r bobl hyn yn meddwl am yr ymdrech hon fel gêm. Maent yn mwynhau chwarae o gwmpas gyda'r AI. Mae ennill y gêm yn cynnwys dod o hyd i'r gwaethaf o'r gwaethaf ym mhopeth y gallwch chi gael yr AI i'w gynhyrchu.
  • Arddangosfeydd. Mae'r bobl hyn yn gobeithio cael sylw drostynt eu hunain. Maent yn ffigur, os gallant ddod o hyd i rai nygets aur aflan iawn, y gallant gael ychydig o'r golau disglair arnynt sydd fel arall yn canolbwyntio ar yr app AI ei hun.
  • Chwerwon. Mae'r bobl hyn wedi eu cythruddo am yr AI hwn. Maen nhw eisiau tanseilio'r holl frwdfrydedd ysgubol hwnnw. Os gallant ddarganfod rhai pethau aflan drewllyd, efallai y bydd hyn yn tynnu'r aer allan o'r balŵn cyffro app AI.
  • Cymhellion eraill

Dim ond mewn un o'r gwersylloedd hynny y mae llawer o'r rhai sy'n cyflawni'r tramgwyddus yn bennaf. Wrth gwrs, gallwch chi fod mewn mwy nag un gwersyll ar y tro. Efallai bod gan berson chwerw hefyd fwriad ochr-yn-ochr o fod yn ddiffuant ac arwrol. Gallai rhai neu bob un o'r cymhellion hynny gydfodoli. Pan ofynnir i chi esbonio pam mae rhywun yn ceisio gwthio ap AI cynhyrchiol i'r byd lleferydd casineb, yr ateb arferol yw dweud eich bod yn y gwersyll dilys, hyd yn oed os efallai eich bod ychydig felly ac yn lle hynny eistedd yn llym yn un o'r gwersylloedd eraill.

Pa fathau o dwyll sy'n gysylltiedig â phrydlon y mae'r bobl hyn yn eu defnyddio?

Mae'r ystryw eithaf amlwg yn golygu defnyddio gair budr mewn anogwr. Os ydych chi'n cael “lwcus” a bod yr ap AI yn cwympo amdano, mae'n ddigon posib y bydd hyn yn y pen draw yn yr allbwn. Yna mae gennych chi'ch moment gotcha.

Mae'n debygol y bydd ap AI cynhyrchiol sydd wedi'i ddyfeisio'n dda ac sydd wedi'i brofi'n dda yn dal y ploy syml hwnnw. Fel arfer dangosir neges rhybudd i chi sy'n dweud na ddylech wneud hynny. Os byddwch chi'n parhau, bydd yr app AI yn cael ei raglennu i'ch cicio allan o'r app a fflagio'ch cyfrif. Mae'n bosibl y cewch eich atal rhag mewngofnodi eto (wel, o leiaf o dan y mewngofnodi a ddefnyddiwyd gennych ar y pryd).

Gan symud i fyny'r ysgol o ploys, gallwch ddarparu anogwr sy'n ceisio cael y AI i mewn i gyd-destun rhywbeth aflan. Ydych chi erioed wedi chwarae'r gêm honno lle mae rhywun yn dweud wrthych am ddweud rhywbeth heb ddweud y peth yr ydych i fod i'w ddweud? Dyma'r gêm honno, er ei bod yn digwydd gyda'r AI.

Gadewch i ni chwarae'r gêm honno. Tybiwch fy mod yn gofyn i'r app AI ddweud wrthyf am yr Ail Ryfel Byd ac yn enwedig y prif arweinwyr llywodraethol dan sylw. Mae hwn yn ymddangos fel cais diniwed. Nid oes dim sy'n ymddangos yn deilwng o'i nodi yn yr anogwr.

Rhagweld bod y traethawd allbynnau gan yr ap AI yn cynnwys sôn am Winston Churchill. Mae hynny'n sicr yn gwneud synnwyr. Un arall efallai fyddai Franklin D. Roosevelt. Efallai mai un arall yw Joseph Stalin. Tybiwch fod yna hefyd son am Adolph Hitler. Byddai'r enw hwn yn cael ei gynnwys mewn bron unrhyw draethawd am yr Ail Ryfel Byd a'r rhai mewn rolau o bŵer amlwg.

Nawr bod gennym ei enw ar y bwrdd a rhan o'r sgwrs AI, byddwn nesaf yn ceisio cael yr AI i ymgorffori'r enw hwnnw mewn modd y gallwn ei arddangos fel lleferydd casineb posibl.

Rydyn ni'n mynd i mewn i anogwr arall ac yn dweud wrth yr app AI fod yna berson heddiw yn y newyddion sydd â'r enw, John Smith. Ar ben hynny, rydym yn nodi yn yr anogaeth fod John Smith yn debyg iawn i'r drwgweithredwr hwnnw o'r Ail Ryfel Byd. Mae'r trap bellach wedi'i osod. Yna byddwn yn gofyn i’r ap AI gynhyrchu traethawd am John Smith, yn seiliedig yn unig ar y “ffaith” y gwnaethom nodi pwy y gellir ei gyfateb i John Smith.

Ar y pwynt hwn, gallai'r ap AI gynhyrchu traethawd sy'n enwi'r person o'r Ail Ryfel Byd ac yn disgrifio John Smith fel un o'r un toriad o frethyn. Nid oes unrhyw eiriau drwg fel y cyfryw yn y traethawd, heblaw cyfeirio at y drwgweithredwr enwog a chyfateb y person hwnnw â John Smith.

A yw'r ap AI bellach wedi cynhyrchu lleferydd casineb?

Efallai y byddwch yn dweud bod, mae wedi. Wedi cyfeirio at John Smith fel bod yn debyg i'r drwgweithredwr enwog, mae'n fath o lefaru casineb yn llwyr. Ni ddylai'r AI wneud datganiadau o'r fath.

Retort yw nad lleferydd casineb yw hwn. Dim ond traethawd yw hwn a gynhyrchwyd gan ap AI nad oes ganddo unrhyw ymgorfforiad o deimlad. Efallai y byddwch yn honni bod lleferydd casineb yn digwydd dim ond pan fydd y bwriad yn bodoli wrth wraidd yr araith. Heb unrhyw fwriad, ni ellir dosbarthu'r araith fel lleferydd casineb.

Absurd, daw'r ateb i'r retort. Mae geiriau o bwys. Nid yw'n gwneud llawer o wahaniaeth a oedd yr AI yn “bwriadu” cynhyrchu lleferydd casineb. Y cyfan sy'n bwysig yw bod lleferydd casineb wedi'i gynhyrchu.

Rownd a rownd mae hyn yn mynd.

Dydw i ddim eisiau dweud llawer mwy ar hyn o bryd am geisio twyllo'r AI. Mae yna ddulliau mwy soffistigedig. Rwyf wedi ymdrin â'r rhain mewn mannau eraill yn fy ngholofnau a llyfrau, ac ni fyddaf yn ail-wneud y rheini yma.

Casgliad

Pa mor bell ddylem ni wthio'r apiau AI hyn i weld a allwn ni gael cynnwys sarhaus i gael ei ollwng?

Efallai y byddwch yn dadlau nad oes terfyn i'w osod. Po fwyaf y byddwn yn ei wthio, y mwyaf y gallwn obeithio sut i atal yr AI hwn ac iteriadau AI yn y dyfodol i osgoi anhwylderau o'r fath.

Er hynny, mae rhai'n poeni, os yw'r unig fodd o gael budrwch yn cynnwys twyll allanol eithafol, mae'n tanseilio agweddau buddiol y AI. Mae honni bod gan yr AI budrwch erchyll, er ei fod yn cael ei dwyllo i'w allyrru, yn rhoi naratif ffug. Bydd pobl yn cynhyrfu am yr AI oherwydd y canfyddedig rhwyddineb cynhyrchu cynnwys anffafriol gan yr AI. Efallai na fyddant yn gwybod neu'n cael gwybod pa mor bell i lawr y twll cwningen yr oedd yn rhaid i'r person fynd i gael canlyniadau o'r fath.

Mae'r cyfan yn fwyd i feddwl.

Ychydig o sylwadau terfynol am y tro.

Dywedodd William Shakespeare hyn yn arbennig am lefaru: “Nid yw siarad yn gwneud. Math o weithred dda yw dweud yn dda, ac eto nid gweithredoedd mo geiriau.” Yr wyf yn codi hyn oherwydd bod rhai yn dadlau, os yw'r AI yn cynhyrchu geiriau yn unig, na ddylem fod mor ormod i fyny mewn breichiau. Pe bai'r AI yn gweithredu ar y geiriau ac ergo yn perfformio gweithredoedd budr, yna byddai angen inni roi ein troed i lawr yn gadarn. Nid felly os mai geiriau yn unig yw'r allbwn.

Byddai safbwynt cyferbyniol yn cyd-fynd â’r dywediad dienw hwn: “Does gan y tafod ddim esgyrn ond mae’n ddigon cryf i dorri calon. Felly byddwch yn ofalus gyda'ch geiriau." Efallai y gall app AI sy'n allyrru geiriau budr dorri calonnau. Mae hynny ar ei ben ei hun yn gwneud yr ymgais i atal allbynnau budrwch yn achos teilwng, meddai rhai.

Un dywediad dienw arall i gloi pethau ar y drafodaeth fawr hon:

  • "Byddwch yn ofalus gyda'ch geiriau. Unwaith y cânt eu dweud, dim ond maddeuant y gallant ei gael, nid ei anghofio.”

Fel bodau dynol, efallai y byddwn yn cael amser caled yn anghofio budrwch a gynhyrchir gan AI, ac efallai y bydd ein maddeuant yn yr un modd yn betrusgar i gael ei roi.

Wedi'r cyfan, dim ond dynol ydym ni.

Ffynhonnell: https://www.forbes.com/sites/lanceeliot/2023/02/05/how-hard-should-we-push-generative-ai-chatgpt-into-spewing-hate-speech-asks-ai- moeseg-a-cyfraith/