画像生成AI

ChatGPT×DALL-E3(+Stable Diffusionのimg2img(LoRA))でブログ用のアイキャッチ画像を作ってみた!

どうも?最近ピアノの発表会を控えていて、音楽漬けになってしまっているエルティアナです…!

そんな中で、先日『ピアノのあがり症について』という下記の記事をブログにアップしたのですが、その時にChatGPT×DALL-E3でアイキャッチ画像を作ってみたところ、とても便利で感動したので、思わず記事を書いています!

ピアノのあがり症について…!①どうも?エルティアナです! 私は音大の1年生の時に出演した発表会で大失敗してしまったことが大きな要因で、人前で演奏することが怖くな...

ChatGPT×DALL-E3で出力した画像を元に、キャラクターだけ、Stable Diffusionのimg2img、inpaintで自作のLoRAを適用させることで、ブログ記事の内容に沿ったイメージの画像を、自分のオリジナリティを出す形で容易に生成できるようになりました!

※私のNoteでも人気のLoRA作成記事はこちら…!

これまでも、Stable Diffusionだけで同様のことはやっていたのですが、例えば今回作ったピアノを弾いているイラストなんかは、今使っているモデルのせいなのか、Stable Diffuison 1.5の現状の限界なのか、ピアノそのものの形状が安定しなくて、とても苦労していました…そのために先日、以下の記事のような試みをやっていたり…

【Stable Diffusion】ControlNetとクリスタでピアノイラストの質を上げる実験!どうも?youtube動画を再開するする!と言っておきながら、依然としてブロガーなエルティアナです…! ということで今回もStab...

でも、DALL-E3だと、鍵盤の並びや、細かいところでピアノの構造がおかしく見えるところはあるものの、ぱっと見ほとんど気にならない精度で、『ピアノを弾いている女の子のイラストを描いて』と日本語で簡単にお願いするだけで生成してくれるので、これはほんとに革命だと思っています…!

今回は、ChatGPTのDALL-E3を使ってイラストを出力して、それをStable Diffusionで自分のキャラクターに差し替える(近づける)工程を体験レポートとしてご紹介します!

ChatGPTのPlusに課金しようか迷っている人、DALL-E3の活用方法を探している方はぜひ参考にしてみてください(*・ω・)!

①ChatGPT×DALL-E3で画像生成

まず、ChatGPTで以下のお願いを日本語で打ってみました。

茶髪でツインテールのロングヘアの女の子が、ピアノの発表会の舞台で緊張している様子が描かれたアニメ調のイラストを描いてください

すると以下の2枚が生成されました。

うんうん。この時点でだいぶイメージはいい感じです!
それで、正方形で出てきたので、横長の画像にしたくて、以下のお願いをしてみました。

ありがとうございます。方向性はいいので、画像サイズを16:9のものにしていただけますか?

すると続けて以下の2枚が生成されました。

サイズがしっかり変更されて満足です!
この二枚のどちらかを採用してもいいのですが、せっかくなので何回か生成してもらって、以下の左側のイラストが気に入ったので、これを採用!としました!

ただ、ピアノを演奏している姿を客席から見た場合、生成されたイラストは向きが反対なので、これを水平方向に反転させてくれないかChatGPTにお願いしたのですが、これはお願いの仕方が悪いのかやってくれませんでした…

画像の向きを水平方向に反転した構図に変更できますか?

これは仕方がない…のでPhotoshopでこんな感じで反転しました。

②Stable Diffusionで女の子を自キャラに差し替え

ChatGPT×DALL-E3で生成して、Photoshopで水平方向に反転だけした画像をStable Diffusionのimg2img(inpaint)に読み込ませて、女の子の部分だけ、私のLoRAを使って変更してみました。

画像

inpaintでこんな感じに女の子部分を塗って、自作LoRAと、簡易的なプロンプト、ネガティブプロンプトだけを設定、あとはCFG/Denosing/ステップ数等、生成結果を見ながら塩梅を調整して、何回か生成していって、上記くらいの感じがバランスがよかったので、これを採用!としました!

画像

■プロンプト
1 girl, <lora:eruthianaver2:0.5>,close eyes
■ネガティブプロンプト
EasyNegative
■その他設定
Steps: 85, Sampler: DPM++ 2M Karras, CFG scale: 5, Model: SakuraMix-v2.1, Denoising strength: 0.55, Clip skip: 2

まとめ

ChatGPT×DALL-E3の登場で、いろんなシーンの自キャラのイラストを簡単に生成することができるようになりました…いやほんとにとんでもない進化です…

数年前はそもそも、例えばパソコンをさわっている私とか、何かを食べている私とか、いろんな私を描きたいからイラストを下手なりに頑張ってたけど、クオリティもいまいち…しかも一枚にすごく時間がかかる…となかなか大変で出来ていなかったことが、1時間以下で一枚作れてしまいます。

しかもChatGPTならPlusでも月額20ドル(今なら3,000円くらいですが…)、Stable DiffusionはスペックがそこそこのPC(グラボ内蔵)があれば電気代しかかからない!

…と、ほんとに夢の世界ですので、あらゆるイラストだったりロゴだったりチラシだったりの制作をしたい人は、一度ChatGPT Plusに登録して、ぜひDALL-E3の世界を体験してみてください?

もっと自キャラに変えたい!といった要望が出てきたら、ぜひ当NoteのこちらのLoRA記事も読んでいただけると嬉しいです(*・v・)!