Golwg ar yr Al Generative Art newydd

Al Celf Gynhyrchiol yn fath o gelf, weledol yn y rhan fwyaf o achosion, sy'n seiliedig ar gydweithrediad rhwng bod dynol a system ymreolaethol. Diffinnir “system ymreolaethol” fel a Cudd-wybodaeth Artiffisial meddalwedd, algorithm neu fodel sy'n gallu cyflawni gweithrediadau cymhleth heb fod angen ymyrraeth rhaglennydd.

O'r cyfosodiadau rhyfedd o ddelweddau a grëwyd gan Dall-E Mini i'r NFT farchnad, mae delweddau a gynhyrchir gan algorithmau AI yn mynd i mewn i'r dychymyg prif ffrwd yn gynyddol. Mewn gwirionedd, dau brosiect pwysig ar y pwnc sy'n haeddu cael eu dadansoddi yw: Canol siwrnai ac DALL-E2.

Wrth gwrs, mae'r newyddion hefyd wedi gwneud ei ffordd i Twitter. Yn sôn amdano, ymhlith eraill, mae Charles Hoskinson, a ysgrifennodd:

Celf Genhedlol Al: arbrofion a nodweddion cynnar

Ar ôl deall beth yw Celf Gynhyrchiol, mae'n bwysig pwysleisio un o'i hegwyddorion sylfaenol: hap. Sydd yn eiddo sylfaenol o Gelfyddyd Gynhyrchiol.

Mewn gwirionedd, yn dibynnu ar y math o feddalwedd, mae'r system ymreolaethol yn gallu prosesu canlyniadau sydd bob amser yn wahanol ac yn unigryw bob tro y gweithredir y gorchymyn cynhyrchu, neu gall ddychwelyd nifer amrywiol o ganlyniadau mewn ymateb i fewnbwn defnyddwyr.

Mae'r arbrofion cyntaf mewn Celf Gynhyrchiol yn dyddio'n ôl i'r 1960au gydag arbrofion o Harold Cohen ac mae ei AARON rhaglen. Defnyddiodd Cohen feddalwedd annibynnol am y tro cyntaf i gynhyrchu gweithiau celf haniaethol a ysbrydolwyd gan sgriniau sidan Pop Art. Mae gweithiau Cohen bellach yn cael eu harddangos yn Oriel y Tate yn Llundain.

Priodoledd arall Celf Gynhyrchiol, ond un sy'n llai ac yn llai uchelfraint, yw ailadrodd patrymau neu elfennau haniaethol a ddarperir gan y rhaglennydd ac a weithredir o fewn y cod meddalwedd.

Yn ogystal, mae datblygu rhwydweithiau niwral cynyddol gymhleth sy'n gweithredu ar gysylltiad testun-delwedd wedi galluogi datblygu modelau cynhyrchiol sy'n gallu creu delweddau cynyddol realistig a chywir. Yr enghraifft fwyaf adnabyddus o'r categori hwn o Gelf Gynhyrchiol yw Dal-E.

Mae Dall-E yn rhwydwaith niwral amlfodd sy'n seiliedig ar y GPT-3 model dysgu dwfn o OpenAI, yr un cwmni a ddatblygodd yn ddiweddar hefyd SgwrsGPT, lansiwyd y chatbot ym mis Tachwedd 2022 a'i optimeiddio gyda “dan oruchwyliaeth” a thechnegau dysgu atgyfnerthu.

Wrth ddychwelyd i Dall-E, gwelwn fod y system hon yn gallu cynhyrchu delweddau o ddisgrifiad testunol, a elwir yn “ysgogi,” yn seiliedig ar set ddata o barau testun-delwedd.

Roedd fersiwn gyntaf Dall-E, a gyflwynwyd i'r cyhoedd ym mis Ionawr 2021 ac a barhaodd yn uchelfraint nifer fach o weithwyr proffesiynol yn y maes, yn cynrychioli chwyldro gwirioneddol o ran y math hwn o fodel cynhyrchiol, gan ragori ar ddatblygiadau arloesol GPT- 3 ei hun.

Mae'r ffaith bod cywirdeb y canlyniadau a broseswyd gan Dall-E wedi bod yn gyfle perffaith ar gyfer datrysiad OpenAI arall hefyd o bwys: CLIP (Cyn-hyfforddiant Iaith-Delwedd Cyferbyniol).

Rhwydwaith niwral dosbarthu a graddio delweddau wedi'i hyfforddi ar sail cysylltiadau testun-delwedd, megis capsiynau a geir ar y Rhyngrwyd. Diolch i ymyrraeth CLIP, sy'n lleihau nifer y canlyniadau a gynigir i'r defnyddiwr fesul anogwr i 32, canfuwyd bod Dall-E yn dychwelyd delweddau boddhaol yn y rhan fwyaf o achosion.

Midjourney: dylunio, seilwaith dynol, a deallusrwydd artiffisial

Fel y rhagwelwyd, Canol siwrnai yn brosiect pwysig sy'n rhan o'r cysyniad Celf Al Generative sy'n dod i'r amlwg. Yn benodol, mae Midjourney yn labordy ymchwil annibynnol sy'n archwilio ffyrdd newydd o feddwl ac yn ehangu pwerau dychmygus y rhywogaeth ddynol.

Mae'n syml ei ddefnyddio: yn gyntaf rhaid creu cyfrif ymlaen Discord, llwyfan sy’n cynnal cymunedau amrywiol, lle mae Midjourney yn un ohonyn nhw. O fewn y cais mae'r ystafelloedd sgwrsio amrywiol lle gall rhywun gymryd rhan weithredol ai peidio mewn trafodaethau.

Mae'n bwysig nodi, er mwyn ceisio defnyddio Deallusrwydd Artiffisial am y tro cyntaf, rhaid mynd i'r “newyddion” sianeli, lle 25 rendrad am ddim ar gael.

Mae un rendrad yn cyfateb i'r genhedlaeth o bedwar amrywiad gwahanol a gynhyrchir o'r un mewnbwn testunol.

Felly, mae'r 25 rendrad yn cyfeirio at 25 o swyddi prosesu a gyflawnir gan y bot Midjourney. O ganlyniad, mae cynhyrchu'r ddelwedd yn gofyn am ryngweithio â'r bot Midjourney trwy neges destun o'r enw “ysgogol,” lle bydd geiriau allweddol yn disgrifio'r ddelwedd sydd gan y defnyddiwr mewn golwg.

Gallwch ychwanegu cymaint o fanylion ag y dymunwch, y peth pwysig yw rhannu'r allweddeiriau gyda choma. Unwaith y bydd y gwaith rendro wedi'i orffen, mae'r cyfrifiadur yn dychwelyd pedair delwedd wahanol yn seiliedig ar y disgrifiadau i ddewis ohonynt.

Yn ogystal, unwaith y bydd y rhaglen wedi gorffen rendro, gallwch gyfleu eich dewisiadau yn seiliedig ar y delweddau ac, os dymunwch, cynhyrchu pedair fersiwn arall eto.

DALL-E 2: y system AI newydd ar gyfer gweithiau celf

Yn ogystal â Midjourney, DALL-E 2 hefyd yw'r system AI newydd a all greu delweddau a gweithiau celf realistig o ddisgrifiad iaith naturiol. Nid yn unig hynny, gall DALL-E 2 hefyd gyfuno cysyniadau, priodoleddau ac arddulliau.

Cryfder y system AI newydd hefyd yw gallu ehangu delweddau y tu hwnt i'r hyn sydd yn y cynfas gwreiddiol, gan greu cyfansoddiadau eang newydd. Yn ogystal, gall wneud newidiadau realistig i ddelweddau presennol o gapsiwn iaith naturiol a gall ychwanegu a dileu elfennau gan ystyried cysgodion, adlewyrchiadau a gweadau.

Mae galluoedd DALL-E 2 hefyd yn cynnwys cymryd delwedd a chreu sawl amrywiad ohoni wedi'i hysbrydoli gan y gwreiddiol. Mae DALL-E 2 wedi dysgu'r berthynas rhwng delweddau a'r testun a ddefnyddir i'w disgrifio.

Mae'n defnyddio proses o'r enw “trylediad,” sy'n dechrau gyda phatrwm o ddotiau ar hap ac yn newid y patrwm hwnnw'n raddol tuag at ddelwedd pan fydd yn cydnabod agweddau penodol ar y ddelwedd honno.

Felly, ar ôl i OpenAI gyflwyno DALL-E ym mis Ionawr 2021, bellach mae'r system fwyaf newydd, DALL-E 2, yn cynhyrchu delweddau mwy realistig a chywir gyda phedair gwaith y datrysiad.

Dechreuodd DALL-E 2 fel prosiect ymchwil ac mae bellach ar gael fel a fersiwn beta. Ymhlith y mesurau lliniaru diogelwch y mae'r system wedi'u datblygu ac yn parhau i'w gwella mae: cyfyngu ar allu'r system i gynhyrchu delweddau treisgar, casineb neu oedolion, a defnyddio'n raddol yn seiliedig ar ddysgu.

Ffynhonnell: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/