Tehisintellektile pliiats kätte: kuidas lasta masinal kodulehele pilte joonistada?

Veebiarendajad saavad lisaks kodulehe tekstidele nüüd üsna hästi ka pildid tehisintellektilt (TI) tellida, kui vaid osata õigesti küsida ehk viipasid koostada. Pildigeneraatorid on praegu muutumas üha olulisemaks tööriistaks nii kujundajate kui veebisisu loojate jaoks. Kuid lahendada tuleb üks oluline küsimus: kuidas küsida nii, et pilt oleks just see, mida saada tahtsid?

Piltide genereerimine mõne vastava teenusega võib olla väga mugav viis oma veebilehe jaoks ainulaadsete ja huvitavate visuaalide loomiseks alates kujunduselementidest ja nuppudest kuni artiklite juurde käivate fotodeni välja. Tehisintellekti on võimalik kasutada nii tehniliste detailide (nupud, ikoonid, menüüosad, taustad), illustratsioonide kui ka realistlike fotode loomiseks.

Piltide genereerimiseks on palju erinevaid võimalusi ja teenuseid. Üks populaarne meetod, mida need kasutavad, on generatiivsed võistlevad võrgustikud (nn GAN ehk Generative Adversarial Network). GAN-id on mudelid, mis on treenitud piltide loomiseks võistlevate genereerivate närvivõrkude toel. Neis kasutatakse treeninguandmetena väga suurt hulka olemasolevaid pilte ja graafikat ning otsitakse küsimusele kõige paremini vastavat modifikatsiooni.

Teine populaarne meetod on kasutada sügavõppel põhinevaid pildigeneraatoreid, nagu StyleGAN või Imagen. Need mudelid on treenitud tohutu hulga piltide andmekogumiga ja suudavad genereerida väga realistlikke ja detailirohkeid pilte, mis on kohati juba päris eristamatud päris fotodest.

Siin on mõned soovitused, mis aitavad pildiloomisega veebi jaoks kohe pihta hakata.

Dall-E 2 pakkus välja mõned abstraktsed illustratsioonid reisifirma veebi jaoks.

Vali õige tehisintellekti mudel. Internetis on saadaval juba üsna palju erinevaid pildigeneraatoreid, mis võivad veebiarenduse jaoks sobida. Mõned mudelid on spetsialiseerunud konkreetset tüüpi piltide loomiseks, näiteks portreede või maastike, mõnedega saab aga hästi teha kujunduselemente, mida veebi jaoks vaja. DALL-E 2 on näiteks OpenAI poolt välja töötatud pildigeneraator, mis suudab tekitada väga realistlikke pilte tekstipõhiste ülesannete põhjal. Imagen on aga Google´i pildigeneraator, mis on treenitud tohutu hulga piltide andmekogumiga ja loob samuti realistlikke ja detailirohkeid pilte, mis võivad olla kasulikud veebilehe fotode või muude visuaalide loomiseks. Kolmas lahendus StyleGAN2 on Nvidia poolt välja töötatud pildilooja, mis spetsialiseerub erinevatele kunstistiilidele ning oskuslikult kasutades saab sellega teha oma kodulehele ühtses stiilis kujunduse. Midjourney aga sobib ilmselt kõige paremini fotode ja maastikupiltide loomiseks ülimalt fotorealistliku kvaliteediga. Sellele saab ette anda ka olemasolevaid pilte, mida soovide kohaselt töödelda.

Dall-E 2 pakkus reisifirma veebi jaoks välja mõned veebipäise ideed.

Ole oma viipadega tehisintellektile ülesandeid jagades konkreetne ja detailne. TI mudelid on head üldiste piltide genereerimiseks, kuid need on veelgi paremad, kui annad ette väga konkreetsed juhised. Kui soovid, et mudel genereeriks samas stiilis pilte, loo oma ülesannetest näidised, mis kirjeldavad alati samu põhiomadusi, mida soovid veebilehel läbivalt kasutada. Alusta iga uue pildi juures nendest põhiomadustest ja täpsusta, millist elementi tahad täpsemalt saada.

Mõned näited, mida võiks ühe reisifirma kodulehe tegemisel kasutada, on näiteks sellised:

  • Loo kollase ja sinise logoga reisifirma veebilehe kujunduselementide kollektsioon.
  • Loo kollase ja sinise logoga reisifirma veebilehe jaoks illustratsioonid, mis kujutavad erinevaid reisisihtkohti ja reisistiile.
  • Loo kollase ja sinise logoga reisifirma veebilehe jaoks fotod, mis kujutavad erinevaid reisikogemusi.
  • Loo kollase ja sinise logoga reisifirma veebilehe jaoks illustratsioon, mis kujutab perekonda, kes reisib ümber maailma.
  • Loo reisifirma logo maakera ja lennuki teemaga, kasutades sinist ja rohelist.
Selliseid vaateid pakkus välja pildigeneraator Midjourney Itaalia toidu- ja joogireiside veebilehe illustratsioonideks.

Mida tehisintellektilt pildiloomisel täpsemalt küsida?

Microsoft soovitab Dall-E käest küsida võimalikult detailselt ja pakub välja mõned soovitused OpenAI pildigeneraatori kasutamiseks (seda kasutab ka Microsofti otsingumootor Bing):

  • Lisa lausesse mõned konkreetsed üksikasjad objekti või tegelase kohta, mida või keda tahad kujutada.
  • Anna edasi nii palju andmeid pildi jaoks kasutatava seadistuse või tausta kohta kui võimalik.
  • Ütle ette stiil, milles seda kõike kujutatakse, näiteks “õlimaal”, “polaroidfoto”, “marmorkuju”, “fotorealistlik”.
  • Lisa muid vajalikke omadussõnu, mis määravad pildi meeleolu, nagu näiteks pildistamiskohas valitsev ilm, värvid, mängulisus, rõõmus meeleolu, minimalism, geomeetria, elav, dramaatiline, kunstlik, tehnitsistlik jne.

Re-thought.com soovitab veel mõnesid nippe:

  • Kirjuta minimaalselt vähemalt 3–7 sõna, et saada kätte ligilähedaseltki selline pilt, nagu soovid. Rohkem kui kolme sõnaga viip annab aga tehisintellektile veelgi selgema konteksti.
  • Kasuta mitut omadussõna. Need lisavad tulemusse emotsioone ja värvingut. Kausta näiteks sõnu ilus, realistlik, värviline, sünge.
  • Lisa stiili kirjeldamiseks seda ajalooliselt kasutanud kunstniku nimi. Selle lisamine viibale jäljendab vastavat kunstistiili, näiteks Picasso, Vincent Van Gogh, Paul Gauguin.
  • Arvutigraafika abil muutub kunst sisukamaks. Palu näiteks teha arvutigraafikaga tsükliline pilt, ebareaalne mootor, kiiri jälgiv graafika.
  • Maini kindlasti ära ka pildi kvaliteet, nagu madal, keskmine, kõrge, 4K, 8K. Parema kvaliteediga tulemus võib olla kallima tasuga või kulutada rohkem teenuse kasutamiseks ostetud krediiti.
  • Ära kasuta keelatud sõnu, mis on tulemusest tsenseeritud, kuid kasutada võib omadusi, mida peaks pildi juures välistama, nii-öelda negatiivseid märksõnu võib viipa lisada. Samas peaksid välistavad märksõnad olema toetatud sellele vastanduva positiivse märksõnaga, mida tahad saada, muidu jääb ülesanne tehisintellekti jaoks liiga ebamääraseks ja see võib genereerida mida iganes, välja arvatud sinu välistatud asju.
  • Telli pildile mitte rohkem kui kolm põhiobjekti. Liiga palju asju võivad tekitada veidraid moonutusi nagu kokku sulanud kehad, liiga palju käsi, jalgu või sõrmesid või mõne ehitise või masina ebaloogilised kujutised.
  • Kui oskad, telli pilt pigem soravas inglise keeles. Ka eesti keeles saavad enamus pildigeneraatoreid küsimusest aru, kuid võivad teha rohkem vigu, sest tõlgivad ülesande ikkagi inglise keelde.

Stable Diffusion pakub näiteks võimaluse ka otsida omale parimaid lauseid pildiloomeks. Tulemustena antakse mõned tekstinäidised ja milliseid pilte nende lausetega loodi.

Kuidas saada võimalikult fotorealistlik pilt?

Kui tahad tehisintellekti abiga teha veebi jaoks võimalikult ehtsale fotole sarnaneva pildi, tuleb kasutada märksõnana “fotorealismi”. Lisaks peaks aga kirjeldama vaadet võimalikult täpselt, andes edasi stseeni asukoha (isegi aadressi täpsusega, tulemuse ehedus võib üllatada), valgustuse, ilmaolud, kellaaja ning olemasolevad objektid. Samas peaks jääma ülesande keerukusega mõistlikkuse piiresse, sest liiga pikad ja detailsed laused ajavad tehisintellekti segadusse. Näiteks Midjourney viibad peaksid jääma alla 60 sõna sisse, samas kui DALL-E 2 saab hakkama alla 400 tähemärgiga, kuid teeb mõnikord soovitule palju täpsema pildi hoopis vähema ja lühema viibaga.

Kuidas küsida veebi nuppude ja menüüde kohta?

Veebilehe kujunduselementide kohta küsides peaks ära määrama nende stiili ja värvikombinatsiooni.

Sellised veebilehe nupud ja menüüd pakkus välja Dall-E sini-kollase logoga reisifirma veebi jaoks.

Kasuta selleks viipades erinevaid kunstistiile ning näiteks filtreid. Kui soovid oma tehisintellektiga loodud graafilistele elementidele veidi isikupära lisada, võib proovida kasutada viipade filtritena ruumilist või kahemõõtmelist disaini ja mitme kunstistiili kombinatsiooni. Seda tehes saab anda tehisintellektile konkreetsemad juhised, mida järgida ning tulemuseks on soovitud esteetika ja stiiliga paremini kooskõlas olev pilt.

Määra oma viipades ära ka värvipalett, kui veebilehe disainis on värvid juba paika pandud. Kui soovid pildiloome lõplikku tulemust rohkem kontrollida, võid proovida tehisintellekti viibas määrata värvipaletti väga täpselt toone ette andes.

Kui endal häid ideid pole, võib proovida ka mootoreid, mis koostavad sobiva tulemuse saamiseks vajaliku viiba. Midjourney vastav vidin on olemas näiteks siin lehel.

Mida vältida?

Ära küsi tehisintellektilt pilte, millel peavad olema mitme objektiga keerulised stseenid või liiga
üksikasjalikud paigutuse soovid (objekt 1 vasakul, objekt 2 paremal, väike objekt 3, mille kohal on objekt 4 jne). Samuti pole hea mõte tellida mitme näoga pilte, mis kipuvad tulema moonutatud ja segunenud.

Tekstisoovidest piltidel tuleb samuti hoiduda: sellega enamasti tehisintellektid hakkama ei saa. Konkreetset teksti ei oska nimelt pildiloomega tegelev tehisintellekt pildile panna, küll aga võib tulemustes esineda tekstisarnaseid kujutisi, mis ei tähenda mitte midagi (nagu on näha ka ülalolevatel piltidel). Generaator ei tunne õigekirja, sest pole selleks loodud ja ei saa aru, mismoodi teksti kirjutada.

Kolmeosaline viip

Kõige lihtsam on jagada oma käsuviip tehisintellektile pildi joonistamiseks kolme ossa:

  • Teema: millest räägib kujutatav pilt ja mis on seal näha?
  • Detailid ja ümbrus: millised on pildil kujutatavad detailid ja milline on taust?
  • Stiil, kunstiliik, meedia: lõpetuseks saab defineerida filtrid ja kunstistiilid, millega määratakse ära pildi välimus.

AI-ga piltide genereerimine on veebiarendajate ja veebilehe tellijate jaoks hea võimalus ainulaadse ja huvitava sisu loomiseks. Küsida saab illustratsioone asjade kohta, mida pole olemas või stiilide kohta, mida pole kunagi varem ühendatud. “Kala jalgrattal” stiilis fotod pole mingiks probleemiks. Seega saab oma kodulehe jaoks illustratsioone, mida kuskil mujal pole ning oskuslikult küsides võib just selliseid pilte saada, mis sobiksid ideaalselt veebi sisuga. Tehisintellektiga tasub katsetada ning kuigi esimene proov võib välja näha hoopis teistsugune, kui ootasid, on võimalik viipa täiustades liikuda ideaalile aina lähemale.

Selle loo avapildil on Microsofti otsingumootori Bing pildigeneraator kujutanud reisijaid, kes plaanivad veebis ümbermaailmareisi. See pilt peaks tehisintellekti arvates sobima hästi reisiteemalise veebi avapildiks, kuid viipa täpsustades saab seda oma soovidele lähedasemaks muuta.

Artikkel ilmus algselt Veebimajutus.ee blogis.

Populaarsed lood mujal Geeniuses

Kord nädalas

Ärigeeniuse uudised sinu postkastis

Ärigeeniuse uudiskiri toob sinuni valiku nädala olulisematest äriteemadest, põnevad persoonilood ja ekspertide soovitused.