AI最高!

【Waifu Diffusion】Google Colaboratoryで使えるようにしてみた!

「Waifu Diffusion」という、AIが文字列からイラストを描いてくれるサービスがあることを知り、ぜひ私もやってみたい!ということで挑戦してみました!

Googleが提供している『Google Colaboratory』というサービスの中で「Waifu Diffusion」を使えるように設定する流れになります。

Google Colaboratoryとは?

Google Colaboratoryは、Googleが機械学習の教育及び研究用に提供しているインストール不要ですぐにPythonや機械学習・深層学習の環境を整えることが出来る無料サービス。Colabとも呼ばれます。Googleアカウントが必要ですが、無料で利用出来ます!なお、CPU及びGPU(1回12時間)の環境を利用可能。

Google Colaboratoryを使う理由

AIがプロンプトという文字列(呪文)でイラストを描いてくれる「Stable Diffusion」をベースにした「Dream Stdio」について、以前以下の記事でご紹介しましたが、Dream studioを利用するには、最初にもらったクレジットを消化してしまうと、それ以降はクレジットを購入しなくてはいけません(:_;)

【Dream studio】Stable Diffusion系の画像作成AIサービスを使って可愛い女の子を出力してみた

もともと、Dream Studioの母体になっている「Stable Diffusion」は、オープンソースで誰でも無料で使えるものですが、自分で自由に使うためには、自分のPCに「Stable Diffusion」をダウンロードしてインストールする必要があります…

さらに、普通のソフトと違って「python」というプログラム言語が動作するように、まずは環境を作って、そこに「Stable Diffusion」が動くように追加設定する…という…(私的には)頭が痛くなる努力が必要になります…(だからこそ、手軽に利用できるDream Studioなどの有料サービスがあるわけですね…

そこで!今回利用しようとしている『Google Colaboratory』は、Googleが提供する、WEB上の、pythonなどのプログラムが利用できる状態になっている開発環境を利用できるサービスになっていて、つまり、自分のPCにpythonやStable DiffusionをインストールしなくてもやりたかったことがWEB上で出来る!(はず)ということで使ってみたい!となっています(・v・)ノ

Waifu Diffusionとは?

Stable Diffusionをもとにしているようですが、2次元のイラストに特化したイラスト生成をしてくれるシステムということで、まさに自分がやりたいことにうってつけだなぁと思いました!

導入手順

①Google Colaboratoryにアクセス

Colaboratoryを使うにはまず、Googleアカウントでログイン後、下記リンクにアクセス。

②Waifu DiffusionをGoogle Colaboratoryで実行

1.「ノートブックを新規作成」をクリック

2.編集→ノートブックの設定をクリック

3.「GPU」を選択

4.パッケージのインストール

↓打ち込むテキスト
!pip install diffusers==0.3.0 transformers scipy ftfy

③StableDiffusionパイプラインの準備

↓打ち込むテキスト
import torch
from torch import autocast
from diffusers import StableDiffusionPipeline, DDIMScheduler

# StableDiffusionパイプラインの準備
pipe = StableDiffusionPipeline.from_pretrained(
“hakurei/waifu-diffusion”,
torch_dtype=torch.float16,
revision=”fp16″,
scheduler=DDIMScheduler(
beta_start=0.00085,
beta_end=0.012,
beta_schedule=”scaled_linear”,
clip_sample=False,
set_alpha_to_one=False,
),
).to(“cuda”)

④画像を描きだす

ここまできたら、後は下記のコードを打ち込んで、これまでと同じように再生ボタンを押すと、画像が出力されます。

prompt = “cute girl blond hair twin tail”
with autocast(“cuda”):
images = pipe(prompt, guidance_scale=7.5).images
images[0].save(“output.png”)

出力が完了したら、画面左側のフォルダアイコンをクリックして、出力された画像をクリック。

手順は以上です!お疲れさまでした!
出力した画像は自分の保存することも可能です。これで心置きなくイラスト生成が楽しめそうです!

ちなみに何度も何度もプロンプトを変えて書き出して、なかなか可愛いイラストがでたかなぁ…というのが下記でした!

ちなみに、いったん動くようになって、また時間をおいてもう一回やろうとしたらエラーが出たりするんですが、原因がわからないものの、多分Google Colaboratoryの利用時間制限とか何かで動かなくなっているっぽくて、その場合、打ち込んだ命令を上記のパッケージインストールから実行しなおすと動いたりしました。

最後に

かなり長文になってしまいましたが、手順自体は、自分のPCローカル環境に構築することに比べればとても簡単!な印象でした。

まだ、画像を描きだすときの、プロンプトと画像名以外の指定についてよくわかっていないのですが、ここも細かい設定が出来るようです。

私みたいに、自分のPCに入れてまで試すのは厳しい…という方も、この手法であれば、Googleさんが提供してくれている環境の中でいろいろ試すことが出来ますので、ぜひ挑戦してみてください(*・ω・)ノ

ちなみに下記の動画に、プロンプト以外の細かい指定や、一度に複数枚書き出す命令のナレッジがあるみたいです!私もこちらを参照して、もっとWaifu Diffusionを楽しんでみたいと思います!