{"id":2124,"date":"2021-11-14T12:56:35","date_gmt":"2021-11-14T10:56:35","guid":{"rendered":"https:\/\/xeon.kapsi.fi\/blog\/?p=2124"},"modified":"2025-10-08T19:26:27","modified_gmt":"2025-10-08T16:26:27","slug":"hypnogram-kuvia-tekstista","status":"publish","type":"post","link":"https:\/\/xeon.kapsi.fi\/mikko\/2021\/11\/hypnogram-kuvia-tekstista\/","title":{"rendered":"Hypnogram &#8211; Kuvia tekstist\u00e4"},"content":{"rendered":"\n<p>Hypnogram luo kuvia annettujen sanojen perusteella.<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><a href=\"https:\/\/hypnogram.xyz\/\" data-type=\"URL\" data-id=\"https:\/\/hypnogram.xyz\/\" target=\"_blank\" rel=\"noreferrer noopener\">https:\/\/hypnogram.xyz\/<\/a><\/li><li><a rel=\"noreferrer noopener\" href=\"https:\/\/github.com\/nerdyrodent\/VQGAN-CLIP\" target=\"_blank\">GitHub &#8211; nerdyrodentVQGAN-CLIP Just playing with getting VQGAN+CLIP running locally, rather than having to use colab.<\/a><\/li><li><a rel=\"noreferrer noopener\" href=\"https:\/\/imgur.com\/a\/SALxbQm\" target=\"_blank\">~200 CLIP+VQGAN keywords on 4 subjects, by @kingdomakrillic\u00a0 &#8211; Imgur<\/a><\/li><li><a rel=\"noreferrer noopener\" href=\"https:\/\/blog.roboflow.com\/openai-clip\/\" target=\"_blank\">OpenAI&#8217;s CLIP is the most important advancement in computer vision this year<\/a><\/li><li><a rel=\"noreferrer noopener\" href=\"https:\/\/softologyblog.wordpress.com\/2021\/06\/10\/text-to-image-summary\/\" target=\"_blank\">Text-to-Image Summary \u2013 Part 1 Softology&#8217;s Blog<\/a><\/li><li><a rel=\"noreferrer noopener\" href=\"https:\/\/ljvmiranda921.github.io\/notebook\/2021\/08\/08\/clip-vqgan\/\" target=\"_blank\">The Illustrated VQGAN<\/a><\/li><\/ul>\n\n\n\n<p><\/p>\n\n\n\n<p>&#8221;Ihan alkuun, t\u00e4\u00e4lt\u00e4 n\u00e4kee &#8221;modifier&#8221; sanoja, jotka pit\u00e4is toimia luotettavasti, eli tuottavat aina saman tyylist\u00e4.<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><a class=\"link link--external\" rel=\"noreferrer noopener\" href=\"https:\/\/imgur.com\/a\/SALxbQm\" target=\"_blank\">~200 CLIP+VQGAN keywords on 4 subjects, by @kingdomakrillic &#8211; Imgur<\/a><\/li><\/ul>\n\n\n\n<p>Esim. pelkk\u00e4 &#8221;mushroom&#8221; tuottaa satunnaisia normikyrveleit\u00e4, &#8221;mushroom pencil drawing&#8221; vet\u00e4\u00e4 kyrvelit yhden filtterin l\u00e4pi ja &#8221;mushroom pencil drawing anime&#8221; kahden filtterin. T\u00e4m\u00e4 ihan peruskauraa varmaankin kaikille.<\/p>\n\n\n\n<p>Tuo itse saitti on viel\u00e4 koko internetsille mysteeri, ett\u00e4 kuka siell\u00e4 on taustalla. Vahvimmat veikkaukset n\u00e4ytt\u00e4is olevan, ett\u00e4 on joku ML\/AI startup jolla ylim\u00e4\u00e4r\u00e4isi\u00e4 euroja leikki\u00e4 hetki t\u00e4mm\u00f6sell\u00e4 anonyymill\u00e4 t\u00e4ysin avoimella sivulla. Toinen veikkaus on, ett\u00e4 joku haluaa tehd\u00e4 NFT massia n\u00e4ill\u00e4 generoiduilla kuvilla.<\/p>\n\n\n\n<p>Taustalla on Googlen pilvipalvelu. Ei tee suoraan livehakuja Googlen kuvahakuun, vaan k\u00e4ytt\u00e4\u00e4 Googlen rakentamaa valmista tietokantaa jossa on miljardeja kuvia metatiedoilla. Tuohon kantaan p\u00e4\u00e4see sitten k\u00e4siksi helpoiten Googlen omalta Colab alustalta. Luultavasti se miksi tuo kest\u00e4\u00e4 ja kest\u00e4\u00e4, niin jotkut Colab limitit paukkuu ja siell\u00e4 ollaan sitten hetki aina jonossa sen oman perversionsa kanssa.<\/p>\n\n\n\n<p>T\u00e4m\u00e4nkin saitin koodi\u00a0<s>n\u00e4ytt\u00e4isi pohjautuvan<\/s>\u00a0pohjautuu (mainittiinkin jo Tips-sivulla) huhtikuussa julkaistuun\u00a0<a class=\"link link--external\" rel=\"noreferrer noopener\" href=\"https:\/\/kath.io\/\" target=\"_blank\">Katherine Crowsonin<\/a><a class=\"link link--external\" rel=\"noreferrer noopener\" href=\"https:\/\/colab.research.google.com\/drive\/1_4Jl0a7WIJeqy5LTjPJfZOwMZopG5C-W?usp=sharing#scrollTo=g7EDme5RYCrt\" target=\"_blank\"> valmiiseen softaan<\/a>\u00a0joka on rakennettu juuri tuolla Colab alustalla.\u00a0<a class=\"link link--external\" rel=\"noreferrer noopener\" href=\"https:\/\/twitter.com\/rivershavewings\" target=\"_blank\">Katherinella<\/a>\u00a0on oma\u00a0<a class=\"link link--external\" rel=\"noreferrer noopener\" href=\"https:\/\/chainbreakers.kath.io\/\" target=\"_blank\">NFT kauppa<\/a>\u00a0t\u00e4mm\u00f6sille kuville&#8230;\u00a0<\/p>\n\n\n\n<p>Koodia voi ajella omallakin koneella, ei siis ole varsinaisesti sidottu tuohon Colab himmeliin. Se on vaan valmis Python koodin ajoalusta. Paras ohje omalla koneella ajettavana lienee t\u00e4m\u00e4&nbsp;<a href=\"https:\/\/github.com\/nerdyrodent\/VQGAN-CLIP\" target=\"_blank\" class=\"link link--external\" rel=\"noreferrer noopener\">nerdyrodent\/VQGAN-CLIP: Just playing with getting VQGAN+CLIP running locally, rather than having to use colab. (github.com)<\/a>&nbsp;.<\/p>\n\n\n\n<p>Itse tekniikka, eli se koodi mik\u00e4 sitten varsinaisen magiikan suorittaa on nimelt\u00e4\u00e4n<br>VQGAN = Vector Quantized Generative Adversarial Network<br>ja<br>CLIP = Contrastive Language\u2013Image Pre-training<\/p>\n\n\n\n<p>GAN itsess\u00e4\u00e4n on jo wanha juttu. &#8221;VQ&#8221; on sitten hyvin lyhyesti k\u00e4yt\u00e4nn\u00f6ss\u00e4 sen optimointia uusien n\u00e4yttisten arkkitehtuureille, jolloin samassa vanhassa suoritusajassa voidaan tehd\u00e4 taas lis\u00e4\u00e4 uusia taikoja .<\/p>\n\n\n\n<p>N\u00e4iden lis\u00e4ksi on GANista seuraavaa modernimpaa ainakin jo VAE-GAN, VQ-VAE ja ihan tuoreimpana ilmeisesti VQ-VAE-2. En l\u00e4hde sit\u00e4 kaninkoloa t\u00e4ss\u00e4 enemp\u00e4\u00e4 avaamaan. N\u00e4iss\u00e4kin v\u00e4h\u00e4n sama kun lohkoketjuissa, ett\u00e4 ostaja\/k\u00e4ytt\u00e4j\u00e4puolella kukaan ei oikeasti ymm\u00e4rr\u00e4 kyseist\u00e4 teknologiaa ja sitten on helppo kaupitella k\u00e4rmes\u00f6ljyt. Mahtaako ymm\u00e4rt\u00e4\u00e4 edes itse tekniikkaa k\u00e4ytt\u00e4v\u00e4t propellihatut.<\/p>\n\n\n\n<p>CLIP on tuorein tulokas. Tammikuussa julkaistu ja aiheuttanut ilmeisen p\u00f6hin\u00e4n ML\/AI piireiss\u00e4.&nbsp;<a href=\"https:\/\/blog.roboflow.com\/openai-clip\/\" target=\"_blank\" class=\"link link--external\" rel=\"noreferrer noopener\">CLIP-softan taustalla on OpenAI<\/a>. CLIP on se taika jolla Googlen pilvi ymm\u00e4rt\u00e4\u00e4 meid\u00e4n h\u00f6p\u00f6ttelyt ja osaa kaivella kuvakannasta halutut kohteet, eli se on &#8221;<a href=\"https:\/\/softologyblog.wordpress.com\/2021\/06\/10\/text-to-image-summary\/\" target=\"_blank\" class=\"link link--external\" rel=\"noreferrer noopener\">text-to-image<\/a>&#8221; tulkki v\u00e4liss\u00e4. T\u00e4ll\u00e4 hetkell\u00e4 osaa vain englantia hyvin.<\/p>\n\n\n\n<p>T\u00e4ss\u00e4 on paras artikkeli joka selostaa n\u00e4it\u00e4 lis\u00e4\u00e4&nbsp;<a href=\"https:\/\/ljvmiranda921.github.io\/notebook\/2021\/08\/08\/clip-vqgan\/\" target=\"_blank\" class=\"link link--external\" rel=\"noreferrer noopener\">The Illustrated VQGAN (ljvmiranda921.github.io)<\/a>&nbsp;.<\/p>\n\n\n\n<p>CLIPist\u00e4 viel\u00e4 lis\u00e4\u00e4 lyhyesti.<\/p>\n\n\n\n<p>Se ymm\u00e4rt\u00e4\u00e4 paljon laaja-alaisemminkin hakutekstej\u00e4. Osaa itse asiassa ihan pitki\u00e4kin tekstej\u00e4 ja monimutkaisempiakin hakuja, mutta tuo hypnogram saitin front-endin koodi on luultavasti tarkoituksella rajattu tiettyyn merkkim\u00e4\u00e4r\u00e4\u00e4n ettei koko back-end tukehdu kun r\u00e4b\u00e4 l\u00e4htis kuitenkin sinne koko raamattua sy\u00f6tt\u00e4m\u00e4\u00e4n. Perus &#8221;mushroom pencil drawing anime&#8221; haku tuottaa ihan ok tulosta, mutta esim. putkimerkill\u00e4 | pystyy tekem\u00e4\u00e4n samanaikaisesti useita eri hakuja ja yhdist\u00e4m\u00e4\u00e4n niiden tulokset painoarvoilla halutun n\u00e4k\u00f6iseksi.&#8221;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Hypnogram luo kuvia annettujen sanojen perusteella. https:\/\/hypnogram.xyz\/ GitHub &#8211; nerdyrodentVQGAN-CLIP Just playing with getting VQGAN+CLIP running locally, rather than having [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":3739,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[528],"tags":[311,312,144],"class_list":["post-2124","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-nettiapaja","tag-clip","tag-openai","tag-tekoaly"],"_links":{"self":[{"href":"https:\/\/xeon.kapsi.fi\/mikko\/wp-json\/wp\/v2\/posts\/2124","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/xeon.kapsi.fi\/mikko\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/xeon.kapsi.fi\/mikko\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/xeon.kapsi.fi\/mikko\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/xeon.kapsi.fi\/mikko\/wp-json\/wp\/v2\/comments?post=2124"}],"version-history":[{"count":1,"href":"https:\/\/xeon.kapsi.fi\/mikko\/wp-json\/wp\/v2\/posts\/2124\/revisions"}],"predecessor-version":[{"id":6267,"href":"https:\/\/xeon.kapsi.fi\/mikko\/wp-json\/wp\/v2\/posts\/2124\/revisions\/6267"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/xeon.kapsi.fi\/mikko\/wp-json\/"}],"wp:attachment":[{"href":"https:\/\/xeon.kapsi.fi\/mikko\/wp-json\/wp\/v2\/media?parent=2124"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/xeon.kapsi.fi\/mikko\/wp-json\/wp\/v2\/categories?post=2124"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/xeon.kapsi.fi\/mikko\/wp-json\/wp\/v2\/tags?post=2124"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}