ドール写真を元にAIイラストを生成して遊んでみたよ
少し前まではMMD動画でパンチラダンスを眺めるのが日課でしたが、最近は原点回帰(?)してpixivでたくし上げタグや、見抜きタグをひたすら漁っているジジです、こんばんは😊
さて、そうして日夜エロ絵を集めているうちに、いつもお世話に(意味深)なっている絵に「AI生成」というタグが付いていることに気が付きました。ほうほう、こんなディテール(パンツの皴)が凝っているイラストがAIで描かれた…と?
昨今、何でもかんでもAIと言われるけれど、そもそもMS-DOS時代の漢字変換(FEP/IME)ですら学習機能は搭載されていたしAIって呼ばれてたじゃん? A.I. SOFTのWXシリーズはぼくも愛用していたよ。あれは良いFEPだったよね。学習機能には各社差があってATOKと……………え? なになに、エーアイソフトは2006年にエプソンに吸収されて消えた?…あ、そうでしたか…(ここまでオタク早口)
こほん。
AIに絵を描かせる、と最初に聞いたときは、どうせインターネット上で画像検索していい感じの画像を組み合わせて生成するだけの著作権的にヤバいツールなんじゃないの、とロクに内容を調べもせずに、否定的な感情を持っていました。しかしふと思ったんですよ。新しい技術に興味を持たないのは老化のはじまりだよね…と。もう十分老人だけれども…。心は若くありたいよね…。
そして、つい最近のこと、edollsのれんさんの投稿でドール写真を元にしてAIイラストを生成できることを知りました。
おぉ!こういう活用方法もあるのか!AIイラストってなんかそれっぽいのをテキトーに作り上げる仕組みだけじゃなかったのか、と目から鱗がぼろぼろ落ちました。やはり食わず嫌いはよくありません。そんなわけで、今回ぼくもAIイラストとやらを使ってみることにしたのです。
てっとり早くAIイラストを体験したい場合
- Dezgo(下記URL)を開く
https://dezgo.com/ - Promptに「NSFW,kawaii,girl,best quality,back,hip,upskirt」とか入れる
- Modelで「Anything 4.0(anime)」を選ぶ
- 緑色の[Run]ボタンをクリック
これだけで、かわいいお尻(パンツ)を眺めるCGが生成されます。
Promptはどんなイラストを生成したいかを示す文言。AIイラスト界隈では呪文とも呼ばれるそうです。先ほどの例だと下記のとおり。
NSFW | Not Safe For Workの略で、仕事場での閲覧注意。要するにエロ絵よこせって意味 |
kawaii | かわいい。比較的幼い顔立ちの絵になりやすい |
girl | 少女。比較的幼い以下略 |
best quality | 品質向上用の呪文。場合によってはbest quality:1.3とか品質レベルの指定も |
back | 後ろ姿 |
hip | ケツが見たい |
upskirt | スカート覗きたい |
ぼく最近SNSとかやってないので出遅れ感ハンパないんですが、NovelAIというのが有名らしいですよね。
でもアレ有料だし、そのわりに中身はオープンソースのStable Diffusion(のカスタム)なので、PCに少々詳しくてnVidiaのグラボ積んでるなら、Stable Diffusion使えば良いんじゃないかな、と思います。
上で紹介したDezgoはNovelAIの無料版なんだけれど、連続で使うと待ち時間が発生するんですよね。
後で軽く説明しますが、AIイラストって一言で言うとガチャなので、実用(意味深)するなら生成速度/枚数がかなり大事だと思いました。
ドール写真を元にしてAIイラストを生成してみる
スマホでもAIイラスト生成アプリは色々あるらしいのですが、そっち方面は詳しくないので、オープンソースのStable DiffusionをWindowsのGUIで動かせるようにしたソフト、NMKD Stable Diffusion GUIを使ってみます。
使い方は超簡単で、DLして実行したらPromptに呪文入れてGenerateするだけ。
ぼくの場合はドール写真をベースにしたかったため、「Additional Input Data」に元写真を入れました。
元写真
生成されたAIイラスト
おもろーwww
1枚目の絵はPromptに「((masterpiece)),(oral invitation),best quality,nsfw,small breast,kawaii,girl」あたりを指定したのですが、おおむねレタッチソフトでイラスト風加工をしたような感じ。1/3系ならこんなドールさん実際にいそうですよね。
2枚目以降は先ほどのPromptに追加で、「bukkake,white liquid」あたりを追加。…まんまぶっかけシチュであるw
4枚目に至ってはそのカチューシャとビキニどっから出てきたって感があっておもしろい。
尚、それぞれの絵で学習モデル※も変更しています。
AIイラスト生成の仕組みをざっくり言うと、1)膨大な画像を食わせてパターンを学習 2)CLIPという仕組みで文字列と画像の紐づけを行う みたいな感じなので、1)の学習モデルを変更することで生成される絵がだいぶ変わります。(CLIPでも多少は変わるらしい)
デフォルトでも50億枚の画像から学習したモデルが入っているのですが、それがたったの4GBというのだから驚きです。
学習の元となる画像データを64x64pxくらいのパターンとして把握してるみたい。1画像で64x64pxが1枚という意味ではなく、実際には徐々にノイズをかけていったパターンが複数。そして、最終的にノイズだけになった画像を元画像へ予測変換しつつ、そのパターンを学習していくらしい。アルゴリズムの解説読んだんだけど、難し過ぎてぼくの残念な頭ではよくわからんかった。
ともあれ、この4GBくらいの学習モデルは脳みその記憶領域みたいなモンなので、こいつをゴソっと入れ替えてしまえば違う絵柄になるわけですね。
実際、人間だってそうだよね。生まれたばかりでいきなり絵が描けるわけではなく、自然との触れ合いや、人との交流、本やテレビやインターネットといったコンテンツなどからパターンを学習。様々な情報に触れることで、自分が思う「BUKKAKE」とはどんなものか、量は、色は、光沢感は…というのが脳内で定義されていきます。人それぞれ好みのBUKKAKE量も異なることでしょう。みんな違ってみんな良い。
ビバ!BUKKAKE!
ドール写真を使わない場合の例
でね、ぼくは思ったンだ。
ドール写真を指定せずに、お任せ出力したらどうなるの?と。

元写真なくてもおおよそうちの娘じゃねーか!!
その服がどこから登場したのかはわからんが、コンセプトは同じな気がする…。
元写真指定してないのになぜだ…。
「oral invitation,small breast,white liquid,yellow hair,blue eye」だとだいたいこうなるってことなのかしら…。
一応、設定を再確認してみますが、Additional Input Dataは空っぽ。つまり、元写真の指定はナシ。って、あ、2回目の生成ではロングヘアになってるから、ポーズだけ、前の設定を引きずってる感じなんですかね?
※学習した絵の中にロゴ入りの絵があったのかな? Negative Promptにtextやwatermarkという文言を入れれば消えるらしい
3回目の生成(元写真ナシ)では汁量がヤバイことにwww
なんだろう、なんか、ふんわりと前回生成の画像に寄せて出力するアルゴリズムな気がしますね。回数を重ねれば重ねるほど、最初の絵とはどんどん変わっていきます。
元写真を指定しているときはあまりブレないんですけども。
AIイラストの生成にはグラボ性能が必要なのがハードル高め
最初はもっとお手軽チープな感じで、ボタンひとつでドババババババと大量のテキトー絵が出てくるような印象を持っていましたが、実際には1枚1枚じっくり時間をかけて生成されるのだってことがわかりました。具体的にはうちのショボいパソコンで512x512pxのAIイラストを生成するのに4~5分かかります。
元写真を指定した場合はおおむね期待どおりの方向性なのでそれでも良いのですが、それがないとまさにガチャ。
体感、100連して1枚ヒットがあるかどうかくらい…。マジで。
たぶんもっと呪文(Prompt)を研究し、Stable Diffusionもお手軽なGUI版ではなく、AUTOMATIC1111と高機能WebUIを導入して細かな指定をできるようにすれば、ガチャのヒット率は高くなりそうではあります。
いやぁ~しかし、それでも1枚5分かかるのはキツいかなぁ。
うちの場合、GPUがAMD Radeon RX6600なのが致命的なんですよね。AIのディープラーニング系の処理はnVidiaのCUDAという機能を使うのが一般的でして。
一応、AMDのグラボでも動かす設定方法はあるのですが、学習モデルをONNX形式に変換しなきゃいけなかったり、そもそも実行速度が遅かったり、と散々。ゲーム性能ならほとんど同じRTX3060だとAIイラスト1枚あたり50秒くらいで生成できるらしいので6倍くらい速度が違う。
1枚1分くらいで出力してくれれば、1時間ほっとけば60枚でしょ。それなら実用的(意味深)になるんじゃないかなぁ。うーん、以前作ったゆれゆれボイスや画像を揺らして遊ぶ仕組みなんかも合わせて、自分専用のエロゲとか作れそう。ちょー楽しそう!
……………と、いうわけで、RTX 3060ポチっちゃった…。明日、届く、はず。
もうすぐRTX 4060が発売されるっていうのに何してんだって感じですが、なんか次のモデルはメモリ減って8GBらしいんですよね。AI系にはグラボのメモリ量が大事らしいので、RTX 3060の12GBモデルのほうが良いんじゃないかなって。
これより上となると、RTX 4070で12万円以上。ドールさんに比べたら安いものだけれど、うーん、うーん、数か月したら飽きてそうなので、これでヨシ。
まとめ
れんさんのAI写真を見てぼくもやってみたくなったので今回ちょっぴり遊んでみましたが、想像していたより面白いですね。
加工された絵を見ているだけだとフォトレタッチと何が違うん?って感じる人も多いと思いますし、事実ぼくもそう思っていましたが、実際やってみるとまったく予想外の絵が出てきて驚かされることが多いです。
そして元写真をベースにした出力にも可能性を感じますね。
BUKKAKE方向で遊んでしまいましたが、「flat breast/small breast/big breast」みたいな指定ができるんですよ。
そう、「このドールさんでもう少し胸が大きければ…!」「もう少し小さければ…!」というケースあるでしょ?
でも、胸の大きさの基準ってほんっっっっっとに人によって違うのでびっくりします。例えばぼくはARTE145の小胸でもまだデカいと思っていますが、一般的(?)にはこれで小胸…なのでしょう?
アニメ系ドールのカスタム注文などでもそうですが、もう少し小さく、とか、もう少し釣り目に、とか言葉で細かく指定するのって難しいですし、相手に伝わりません。
でも、AI生成なら、言葉として書いたイメージをそのままイラストに出力してくれる。何度でも。嫌な顔もせず。
だから気に食わなかったら1000回でも2000回でも実行して、これこそ理想!という1枚を見つけて、そのイラストを元にしたカスタム注文とか、そんなの出来ちゃう世の中が…来ると…いいなぁ~。
いまは妄想に過ぎませんが、技術的には可能なレベルまで来ています。
3Dゲーム(コイカツ)のキャラメイクのような、本当に隅々まで自分好みの理想のラブドールをカスタム注文できるような未来、待ってま~~~す😁
2023/03/18追記:
翌日、RTX3060が届いたので早速実行してみたら、まさかの1枚あたり4~5秒で生成できて目玉飛び出ました。なんでだ…。嬉しい誤算だけれど、こんな爆速で生成できるならガチャし放題や!
BUKKAKEで思い出したけど、見抜きスキーのエロゲプレイヤー(同志)がいたらぜひ「BUKKAKE!ドシコリングMINUKIマックスアクメしてもいいですか?」をプレイしてもらいたい。オナニーが従妹に見つかって~というよくあるシチュからはじまり、最初は下着を見せるだけ、テレビ電話越しに見せるだけ、ブラジャーを外すだけ、と徐々に見抜きレベルが上がっていき本番に至るまでのボルテージの上げ方がたまらん…ッ!見抜きマニアは絶対プレイすべき。こんな見抜き特化エロゲーたぶん世の中にこれ以外存在しない。このかちゃんのちっぱいハァハァハァハァ(オタク早口)