Stable Diffusion – vapaus säätää

Tutustuimme ensimmäisessä osassa Midjourney-ohjelmaan (Lue artikkeli.) – nyt on aika syventyä uuteen AI-työkaluun. Toisessa osassa esittelemme Stability AI:n kehittämän Stable Diffusion -kuvageneraattorin, joka avaa uusia ulottuvuuksia kuvien luomiseen ja muokkaamiseen.

Kuvassa hyödynnetty AI:ta ja suunnittelijan ammattitaitoa

”Tehtävämme on rakentaa perusta ihmiskunnan potentiaalin aktivoimiseksi” toteaa Emad Mostaque, yksi ”maailman johtavan avoimeen koodiin perustuvan Gen AI yrityksen” Stability AI:n perustajista. Vuonna 2022 yritys julkaisi Müncheniläisessä yliopistossa Latent Diffusion nimellä kehitetyn ja ja voittoa tavoittelemattoman LAION yhdistyksen hienosäätämän sekä sadantuhannen miljoonan rahoituksen erän siivittämän Stable Diffusion kuvageneraattorin, josta on tämän jälkeen nopealla tahdilla julkaistu 9 eri päivitystä ja versiota, joista viimeisin on (tätä kirjoittaessa) nimetty versioksi 3.0.

Yllä on esimerkki siitä, miltä promptaaminen Rundiffusion-palvelimella voi näyttää.

Rundiffusion palvelimen kautta käytettävä Stable Diffusion ei vaadi kotikoneelta suuria tehoja, sillä käyttäjä ostaa tilaa ulkopuoliselta serveriltä ja muihin kuvageneraattoreihin verrattuna sen käytöstä maksetaan aikaperusteisesti ja tuoksi ajaksi ohjelma varaa suorituskykyä ulkoiselta palvelimelta.

Tämän kuvan on suunnittelijamme luonut Stable Diffusionilla.

Totuus on, että Stable Diffusion vaatii käyttäjältään enemmän vaivannäköä halutun lopputuloksen saavuttamiseksi, mutta tarjoaa ratkaisuja, joita Midjourneyllä on mahdoton saavuttaa. Midjourney on parempi nopeasti myyvän ja loogisen kuvan luomiseen, sillä sen tuotokset sisältävät vähemmän hallusinaatioita ja ovat oikeassa mittakaavassa esimerkiksi huonetiloissa. Jos kuitenkin haluaa muokata jo valmista kuvaa, ohjata tarkasti kuvassa olevien hahmojen asentoja tai saada tilan näyttämään juuri halutulta, on Stable Diffusion oikea vaihtoehto.

Stable Diffusionin avulla voi luoda realistisen materiaalimaailman käsivaraisen piirroksen tai yksioikoisen viivakuvan päälle, käyttäen samanaikaisesti sekä tekstipohjaisia että kuvallisia käskyjä ja referenssejä. Jos haluaa virkistää jo olemassa olevia renderöintejä, esimerkiksi lisäämällä ihmisiä tai säätämällä vuorokauden aikaa, tai muuttaa kuvien yksityiskohtia, tarjoaa ohjelma mahdollisuuksia, joita ei aikaisemmin ollut samassa mittakaavassa.

Yllä on esimerkki: vasemmalla on vanha kuva ja oikealla esimerkki kalusteiden päivittämisestä ja materiaalien täsmennyksestä Stable Diffusionin avulla.

Toinen mainitsemisen arvoinen ohjelman hienous on mahdollisuus opettaa sille kuvallisen materiaalin avulla, miten luoda asioita ohjelmoimasi mallin mukaisesti. Esimerkkinä käytän kuvia Hollannin Utrechtissa sijaitsevan Rietveld Schröder-talon sisältä, joiden avulla opetettu malli tuottaa kuvia. Satavuotispäiviään viettävä modernin arkkitehtuurin ja muotoilun klassikko tarjoaa hyvän esimerkin. Tarkka silmä huomaa toki pieniä epäjohdonmukaisuuksia, jotka on siloteltava pois, jos kuvat on tarkoitettu julkaisuun, mutta omaan käyttöön ne eivät haittaa.

Oikealla puolella on kuva Cadpoolin toimistosta, joka on käynyt läpi De Stilj -käsittelyn.

Mallin ohjelmointi on hyödyllistä esimerkiksi tilanteessa, jossa kiinteistön omistaja haluaa nopeasti visualisoida myytävien tai vuokrattavien kotien sisustus- tai arkkitehtuurikonseptin mukaisia ratkaisuja. Samalla logiikalla voi luoda kuvia, joissa haluttu henkilö esiintyy eri tilanteissa tai ympäristöissä.

Suunnitteluvaiheessa voidaan ideoida erilaisia sisustuksia ja valita niistä parhaiten sopivat.

Kuten monissa muihin avoimen lähdekoodin ohjelmiin liittyvissä tapauksissa, Stable Diffusionin käyttöliittymässä on usein kankeutta, mikä voisi parhaiten kuvata termillä ’nörteiltä nörteille’. Kuitenkin, jos käyttäjä on jo ehtinyt tottua CAD- ja BIM-ohjelmien vaativaan logiikkaan, Stable Diffusion mahdollistaa käyttäjän pääsemisen maaliin vähemmällä hermojen kiristyksellä kuin esimerkiksi Revit.

Stable Diffusionin ollessa tarkka ja nopea se jättää varaa myös suunnittelijan luovuudelle.

Toisaalta ilman tuhansia säätömahdollisuuksia, joita Stable Diffusion tarjoaa, se ei ansaitsisi kaikkea saamaansa kiitosta. Jos olet jo kokeillut Midjourney-ohjelmaa, josta oli maininta edellisessä artikkelissa (lue artikkeli), ja siirryt sitten Stable Diffusionin pariin, saatat ensin kokea pettymyksen verrattuna Midjourneyn nopeaan ja yksinkertaiseen käyttökokemukseen. Midjourney on tottunut tuottamaan hyviä tuloksia vähillä käyttäjän antamilla tiedoilla, kun taas Stable Diffusion vaatii enemmän hienosäätöä ja tarkkuutta.

UUSI AI-koulutus: Kuvatuotanto tekoälyllä arkkitehtuurissa, sisustussuunnittelussa ja markkinoinnissa
  • Haluatko oppia, mitä työkaluja on käytettävissä ja miten niitä hyödynnetään suunnittelussa?
  • Kiinnostaako sinua uudet tavat markkinoida yritystäsi ja erottua kilpailijoista? Haluatko olla alasi suunnannäyttäjä?
  • Tiedätkö, miten AI:lla luodusta kuvasta saadaan julkaisukelpoinen?

Sinua saattaisi kiinnostaa: Tekoäly blogi

Lisätietoja

Tatu Ahlroos, +358 50 5473338