ジャンル不定の日記です。

AI画像生成アプリにハマってる

MicrosoftのBingがAI始めてから登録してちょっと使ったりして、Bing Image Creatorが登場して画像生成AIもやってみたが良い絵は出なかった。
広告でよく見かけたPicSoとか色々試したんだが、「AIイラスト」ってアプリが良い感じで画像生成にハマってる。

いろいろ画像生成アプリ試した中で、
Bingはすぐ規制に引っかかるし、呪文指定は効くんだが画質が低品質。
PicSo他のほとんどのアプリは金払わないと「数回/日」しか生成できないし、用意されてる素材が少ないのか呪文が全然効かない。
「japanese」とか「police」とか指定するとそれっぽいの出てくるんだが、美脚美女出そうとして「long legs」とかやっても脚が映らなかったりして全く効いてない感じ。
用意されてる素材と違う構図の絵は出てこないんじゃないかと思う。

AIイラストは2次元専用でリアル系の絵は出せないんだが、
「long legs」と「short legs」で明らかに出力が違ってくる。「thick legs」とかも効く。
あと、無料で2回に1回動画広告が表示されるだけで回数無制限で画像生成ができる。
動画広告もキャンセル可能なんだが、キャンセルすると低速鯖になるみたいだし作者に悪いから毎回見てるが気にならない。音は切ってる。

AIイラストは表示したいキャラの性別や年代、ポーズ、衣装なんかを選択する機能があるんだが、何も選択せずに呪文のみで指定して使ってる。
その方が「girl」と「girls」とか単数と複数とか切り替えやすいし、
脚長美少女出そうと思って「long legs」とか指定する時に「legs」が入ってるから無理やり脚を入れてくるんだと思うが、ポーズ指定すると脚3本とか奇形になりやすい感じがする。

Stable Diffusionってのをベースにしたアプリと思うが、呪文は文章を解釈してるとかでは無い。
たとえば「girl and boy」とか指定すると男1女1の画像になりやすいが、単に呪文中に「girl」と「boy」が入ってるからそうなりやすいだけ。
「blonde hair girl and black hair boy」とかしたら、「金髪」「黒髪」「女子」「男子」がどんな組み合わせになるかわからない。
区切ったり囲んだりいろいろ試して、グーグル先生に聞いたりしたが、残念ながら2キャラ以上で特定キャラにのみ呪文指定するようなことはできないみたい。
だから、脚長キャラと短足キャラを並べたりすることはできない。

呪文の入力の仕方はフレーズ単位でカンマ区切りする感じで入力してる。

「long legs」指定すると脚細すぎと思って「long legs,thick legs」指定したりすると長くて太くなりやすい感じ。
まとめて「long thick legs」でもそうなる感じ。
あと、「thick legs」指定すると巨乳キャラが出やすいような気もする。太ったキャラとかは出てこないんだが、脚以外にも「thick」が効いてるんかもしれない・・・
だけど「thick」が入ってると「long」が効きにくくなる感じがするんで「thick」は入れなくなった。
「(long legs:1.2)」みたいにすると1.2倍強調できるみたいなんだが、長さ調節できる感じではないんであんま意味なさげ。

「tall」指定するとたぶんポーズ指定しなければ立ち絵が多くなってる気がするんで効いてる感じがする。
あと「high waist」指定すると脚長キャラ出やすい気もするんだが、効いてるのかちょっと微妙・・・
まあ、最近は「long legs,tall,high waist」でやってる。

衣装は最初は「police」とか「nurse」とかやってたが、「primary school girl」が良い感じ。
女子小学生だと普通なら長身美脚キャラは出ないから呪文の効き具合がわかりやすい。
で、良い感じのキャラが出たら乱数固定で呪文微調整すると似たような構図になりやすい。
「primary school girl」から「nurse girl」とか「police girl」とかに変更しても乱数同じなら近い構図になりやすいんだが、
「primary school girl」と「elementary school girl」とか、「middle school」と「high school」とか近い衣装だと特に似た感じの絵になりやすい感じ。
「primary school girl」で美脚小学生が出てくる乱数なら「kindergarten girl」とかに変えても高確率で美脚幼稚園児が出てくる。

人数指定は、「two primary school girls」みたいな感じで機能するが精度は高くない。
「primary school,2girls」みたいな指定でもできる感じだが、区切らないほうが間違いにくいかと思ってくっつけてる。
4人以上にするとタイムアウトが発生することがある感じ。
元素材の関係なのか?1人よりも2人以上を指定したほうが脚長キャラ出安い感じがする・・・

例えば、乱数シード522で「long legs,tall,high waist,two primary school girls」で

こんな画像が出てきた。
「two girls」指定だが1人しかいないけど、
良さげだと思ったら乱数固定再生成で、「primary school」の部分を変更で、
elementary school

middle school

high scool

kindergarten

似たような構図の画像が出やすい。
kindergartenは2人出てきたが、保護者のようにも見える・・・
人数が変わる場合も近い体型とか近い感じにはなりやすいと思う。
今回の場合は「nurse」とかやったら大きく構図が変わったんで呪文変更で変わる場合もあるんだが、
「primary school」と「elementary school」とか、近い感じのものは特に構図が変わりにくい感じがする。


呪文末尾に「,earrings」を追加してイヤリングを装備したり、

呪文末尾に「,smoking」を追加して喫煙させたりしても近い構図の絵が出やすい。
ただ今回も失敗してるが、たばこを吸わせるのは難しい感じ。
サイズが異常だったり持ち方が変だったり。「cigarette」指定してもパイプ的ななにかに見える感じだったりする。


リアル絵出せるアプリもまともに使えるのあれば良いんだが、いまんところ無さそう。
2次元絵に限るが、AIイラストは結構良い絵出る。

複数キャラに個別に呪文使えればなお良いんだがな・・・

あと、AIの進化が話題になってるが、単に呪文をスペースやカンマで区切って、フレーズに関連付けられた素材画像を合成してるだけみたいな感じで、知能がある感じではない。