ChatGPT×DALL-E3(＋Stable Diffusionのimg2img(LoRA))でブログ用のアイキャッチ画像を作ってみた！｜エルティアナのアトリエ | バ美肉Vtuber・AIとブロックチェーン、WEB3.0の錬金術師・ブロックチェーン・AI・ゲーム音楽・ピアノ・DTM

どうも?最近ピアノの発表会を控えていて、音楽漬けになってしまっているエルティアナです…！

そんな中で、先日『ピアノのあがり症について』という下記の記事をブログにアップしたのですが、その時にChatGPT×DALL-E3でアイキャッチ画像を作ってみたところ、とても便利で感動したので、思わず記事を書いています！

ピアノのあがり症について…！①どうも?エルティアナです！私は音大の1年生の時に出演した発表会で大失敗してしまったことが大きな要因で、人前で演奏することが怖くな...

ChatGPT×DALL-E3で出力した画像を元に、キャラクターだけ、Stable Diffusionのimg2img、inpaintで自作のLoRAを適用させることで、ブログ記事の内容に沿ったイメージの画像を、自分のオリジナリティを出す形で容易に生成できるようになりました！

※私のNoteでも人気のLoRA作成記事はこちら…！

note（ノート）

外部リンク

【Stable Diffusion】Kohya LoRA GUIでLoRA追加学習再チャレンジ！★10,000文字超え...

https://note.com/eruthiana/n/nf42666ff9b3b

Noteでは初めまして！ブログやYoutubeで、AIやブロックチェーン、WEB制作について研究したり、バ美肉(おじさんが美少女のアバターを授かった)Vtuberとして、ピアノやシンセ演奏、作曲活動をしているエルティアナと申します！普段、Stable Diffusionなどの画像生成AIを試してみたレポートをブログで書いているのですが、今回初めて、Noteに投稿してみよう！と思い立って筆を執っています。※初投稿のくせに有料部分を作ってすみません…でも今回、出来るだけ分かりやすいように(自分も絶対あとで見返して参考にするので)渾身の力を込め...

これまでも、Stable Diffusionだけで同様のことはやっていたのですが、例えば今回作ったピアノを弾いているイラストなんかは、今使っているモデルのせいなのか、Stable Diffuison 1.5の現状の限界なのか、ピアノそのものの形状が安定しなくて、とても苦労していました…そのために先日、以下の記事のような試みをやっていたり…

【Stable Diffusion】ControlNetとクリスタでピアノイラストの質を上げる実験！どうも?youtube動画を再開するする！と言っておきながら、依然としてブロガーなエルティアナです…！ということで今回もStab...

でも、DALL-E3だと、鍵盤の並びや、細かいところでピアノの構造がおかしく見えるところはあるものの、ぱっと見ほとんど気にならない精度で、『ピアノを弾いている女の子のイラストを描いて』と日本語で簡単にお願いするだけで生成してくれるので、これはほんとに革命だと思っています…！

今回は、ChatGPTのDALL-E3を使ってイラストを出力して、それをStable Diffusionで自分のキャラクターに差し替える(近づける)工程を体験レポートとしてご紹介します！

ChatGPTのPlusに課金しようか迷っている人、DALL-E3の活用方法を探している方はぜひ参考にしてみてください(*・ω・)！

①ChatGPT×DALL-E3で画像生成

まず、ChatGPTで以下のお願いを日本語で打ってみました。

茶髪でツインテールのロングヘアの女の子が、ピアノの発表会の舞台で緊張している様子が描かれたアニメ調のイラストを描いてください

すると以下の2枚が生成されました。

うんうん。この時点でだいぶイメージはいい感じです！
それで、正方形で出てきたので、横長の画像にしたくて、以下のお願いをしてみました。

ありがとうございます。方向性はいいので、画像サイズを16:9のものにしていただけますか？

すると続けて以下の2枚が生成されました。

サイズがしっかり変更されて満足です！
この二枚のどちらかを採用してもいいのですが、せっかくなので何回か生成してもらって、以下の左側のイラストが気に入ったので、これを採用！としました！

ただ、ピアノを演奏している姿を客席から見た場合、生成されたイラストは向きが反対なので、これを水平方向に反転させてくれないかChatGPTにお願いしたのですが、これはお願いの仕方が悪いのかやってくれませんでした…

画像の向きを水平方向に反転した構図に変更できますか？

これは仕方がない…のでPhotoshopでこんな感じで反転しました。

②Stable Diffusionで女の子を自キャラに差し替え

ChatGPT×DALL-E3で生成して、Photoshopで水平方向に反転だけした画像をStable Diffusionのimg2img(inpaint)に読み込ませて、女の子の部分だけ、私のLoRAを使って変更してみました。

inpaintでこんな感じに女の子部分を塗って、自作LoRAと、簡易的なプロンプト、ネガティブプロンプトだけを設定、あとはCFG/Denosing/ステップ数等、生成結果を見ながら塩梅を調整して、何回か生成していって、上記くらいの感じがバランスがよかったので、これを採用！としました！

■プロンプト
1 girl, <lora:eruthianaver2:0.5>,close eyes
■ネガティブプロンプト
EasyNegative
■その他設定
Steps: 85, Sampler: DPM++ 2M Karras, CFG scale: 5, Model: SakuraMix-v2.1, Denoising strength: 0.55, Clip skip: 2