Mae ChatGPT V4 yn arwain y bar, TASau ac yn gallu nodi campau mewn contractau ETH

Gall GPT-4, y fersiwn ddiweddaraf o'r chatbot Deallusrwydd Artiffisial (AI), ChatGPT, basio profion ysgol uwchradd ac arholiadau ysgol y gyfraith gyda sgôr yn y 90fed canradd ac mae ganddo alluoedd prosesu newydd nad oedd yn bosibl gyda'r fersiwn flaenorol.

Rhannwyd y ffigurau o sgoriau prawf GPT-4 ar Fawrth 14 gan ei greawdwr OpenAI gan ddatgelu y gall hefyd drosi mewnbynnau delwedd, sain a fideo i destun yn ogystal â thrin “cyfarwyddiadau llawer mwy cynnil” yn fwy creadigol a dibynadwy.

“Mae’n pasio arholiad bar efelychiedig gyda sgôr o tua’r 10% uchaf o’r rhai sy’n cymryd prawf,” ychwanegodd OpenAI. “Mewn cyferbyniad, roedd sgôr GPT-3.5 tua’r 10% isaf.”

Mae'r ffigurau'n dangos bod GPT-4 wedi cyflawni sgôr o 163 yn yr 88fed canradd ar yr arholiad LSAT - y prawf y mae angen i fyfyrwyr coleg ei basio yn yr Unol Daleithiau i gael eu derbyn i ysgol y gyfraith.

Canlyniadau arholiadau GPT-4 a GPT-3.5 ar ystod o arholiadau diweddar yr Unol Daleithiau. Ffynhonnell: OpenAI

Byddai sgôr GPT4 yn ei roi mewn sefyllfa dda i gael eich derbyn i un o'r 20 ysgol gyfraith uchaf ac nid yw ond ychydig o farciau'n brin o'r sgorau a adroddwyd sydd eu hangen ar gyfer derbyniad i ysgolion mawreddog fel Harvard, Stanford, Princeton neu Iâl.

Dim ond 149 a sgoriodd y fersiwn flaenorol o ChatGPT ar y LSAT gan ei roi yn y 40% isaf.

Sgoriodd GPT-4 hefyd 298 allan o 400 yn yr Arholiad Bar Unffurf - prawf a gynhaliwyd gan fyfyrwyr cyfraith sydd newydd raddio yn caniatáu iddynt ymarfer fel cyfreithiwr mewn unrhyw awdurdodaeth yn yr UD.

Roedd angen derbyn sgorau UBE i ymarfer y gyfraith ym mhob awdurdodaeth yn yr UD. Ffynhonnell: Cynhadledd Genedlaethol Arholwyr Bar

Roedd yr hen fersiwn o ChatGPT yn cael trafferth yn y prawf hwn, gan orffen yn y 10% isaf gyda sgôr o 213 allan o 400.

O ran yr arholiadau Darllen ac Ysgrifennu ar Sail Tystiolaeth SAT a SAT Math a gymerwyd gan fyfyrwyr ysgol uwchradd yr Unol Daleithiau i fesur eu parodrwydd coleg, sgoriodd GPT-4 yn y 93ain a'r 89fed canradd yn y drefn honno.

Rhagorodd GPT-4 yn y gwyddorau “caled” hefyd, gan bostio sgorau canradd uwch o lawer mewn Bioleg AP (85-100%), Cemeg (71-88%) a Ffiseg 2 (66-84%).

Canlyniadau arholiadau GPT-4 a GPT-3.5 ar ystod o Arholiadau diweddar yr UD. Ffynhonnell: OpenAI.

Fodd bynnag, roedd ei sgôr AP Calculus yn weddol gyfartalog, yn y 43fed i'r 59ain ganradd.

Maes arall lle’r oedd diffyg GPT-4 oedd arholiadau Llenyddiaeth Saesneg, gan bostio sgoriau yn yr 8fed i 44ain canradd ar draws dau brawf ar wahân.

Dywedodd OpenAI fod GPT-4 a GPT-3.5 wedi sefyll y profion hyn o arholiadau ymarfer 2022-2023, ac na chymerwyd “unrhyw hyfforddiant penodol” gan yr offer prosesu iaith:

“Ni wnaethom unrhyw hyfforddiant penodol ar gyfer yr arholiadau hyn. Gwelwyd lleiafrif o’r problemau yn yr arholiadau gan y model yn ystod yr hyfforddiant, ond credwn fod y canlyniadau’n gynrychioliadol.”

Ysgogodd y canlyniadau ofn yn y gymuned Twitter hefyd.

Cysylltiedig: Sut bydd ChatGPT yn effeithio ar y gofod Web3? Atebion diwydiant

Nick Almond, sylfaenydd FactoryDAO Dywedodd ei 14,300 o ddilynwyr Twitter ar Fawrth 14 bod GPT4 yn mynd i “ddychryn pobl” ac y bydd yn “cwympo” y system addysg fyd-eang.

Dywedodd cyn-gyfarwyddwr Coinbase, Conor Grogan, ei fod wedi mewnosod contract smart Ethereum byw yn GPT-4 a thynnodd sylw ar unwaith at nifer o “wendidau diogelwch” ac amlinellodd sut y gellir manteisio ar y cod:

Canfu archwiliadau contract clyfar cynharach ar ChatGPT fod ei fersiwn gyntaf hefyd yn gallu canfod bygiau cod i raddau rhesymol hefyd.

Rhannodd Rowan Cheung, sylfaenydd cylchlythyr AI “The Rundown” fideo o GPT yn trawsgrifio gwefan ffug wedi'i thynnu â llaw ar ddarn o bapur yn god.