【Waifu Diffusion】Google Colaboratoryで使えるようにしてみた！｜エルティアナのアトリエ | バ美肉Vtuber・AIとブロックチェーン、WEB3.0の錬金術師・ブロックチェーン・AI・ゲーム音楽・ピアノ・DTM

「Waifu Diffusion」という、AIが文字列からイラストを描いてくれるサービスがあることを知り、ぜひ私もやってみたい！ということで挑戦してみました！

Googleが提供している『Google Colaboratory』というサービスの中で「Waifu Diffusion」を使えるように設定する流れになります。

ぱっとよめる目次！

Google Colaboratoryとは？
Google Colaboratoryを使う理由
Waifu Diffusionとは？
導入手順
最後に

Google Colaboratoryとは？

Google Colaboratoryは、Googleが機械学習の教育及び研究用に提供しているインストール不要ですぐにPythonや機械学習・深層学習の環境を整えることが出来る無料サービス。Colabとも呼ばれます。Googleアカウントが必要ですが、無料で利用出来ます！なお、CPU及びGPU(1回12時間)の環境を利用可能。

Google Colaboratoryを使う理由

AIがプロンプトという文字列(呪文)でイラストを描いてくれる「Stable Diffusion」をベースにした「Dream Stdio」について、以前以下の記事でご紹介しましたが、Dream studioを利用するには、最初にもらったクレジットを消化してしまうと、それ以降はクレジットを購入しなくてはいけません(：_；)

【Dream studio】Stable Diffusion系の画像作成AIサービスを使って可愛い女の子を出力してみた

もともと、Dream Studioの母体になっている「Stable Diffusion」は、オープンソースで誰でも無料で使えるものですが、自分で自由に使うためには、自分のPCに「Stable Diffusion」をダウンロードしてインストールする必要があります…

さらに、普通のソフトと違って「python」というプログラム言語が動作するように、まずは環境を作って、そこに「Stable Diffusion」が動くように追加設定する…という…(私的には)頭が痛くなる努力が必要になります…(だからこそ、手軽に利用できるDream Studioなどの有料サービスがあるわけですね…

そこで！今回利用しようとしている『Google Colaboratory』は、Googleが提供する、WEB上の、pythonなどのプログラムが利用できる状態になっている開発環境を利用できるサービスになっていて、つまり、自分のPCにpythonやStable DiffusionをインストールしなくてもやりたかったことがWEB上で出来る！(はず)ということで使ってみたい！となっています(・v・)ﾉ

Waifu Diffusionとは？

Stable Diffusionをもとにしているようですが、2次元のイラストに特化したイラスト生成をしてくれるシステムということで、まさに自分がやりたいことにうってつけだなぁと思いました！

導入手順

①Google Colaboratoryにアクセス

Colaboratoryを使うにはまず、Googleアカウントでログイン後、下記リンクにアクセス。

colab.research.google.com

外部リンク

Google Colaboratory

https://colab.research.google.com

②Waifu DiffusionをGoogle Colaboratoryで実行

1.「ノートブックを新規作成」をクリック

2.編集→ノートブックの設定をクリック

3.「GPU」を選択

4.パッケージのインストール

↓打ち込むテキスト
!pip install diffusers==0.3.0 transformers scipy ftfy

③StableDiffusionパイプラインの準備

↓打ち込むテキスト
import torch
from torch import autocast
from diffusers import StableDiffusionPipeline, DDIMScheduler

# StableDiffusionパイプラインの準備
pipe = StableDiffusionPipeline.from_pretrained(
“hakurei/waifu-diffusion”,
torch_dtype=torch.float16,
revision=”fp16″,
scheduler=DDIMScheduler(
beta_start=0.00085,
beta_end=0.012,
beta_schedule=”scaled_linear”,
clip_sample=False,
set_alpha_to_one=False,
),
).to(“cuda”)

④画像を描きだす

ここまできたら、後は下記のコードを打ち込んで、これまでと同じように再生ボタンを押すと、画像が出力されます。

prompt = “cute girl blond hair twin tail”
with autocast(“cuda”):
images = pipe(prompt, guidance_scale=7.5).images
images[0].save(“output.png”)

出力が完了したら、画面左側のフォルダアイコンをクリックして、出力された画像をクリック。

手順は以上です！お疲れさまでした！
出力した画像は自分の保存することも可能です。これで心置きなくイラスト生成が楽しめそうです！

ちなみに何度も何度もプロンプトを変えて書き出して、なかなか可愛いイラストがでたかなぁ…というのが下記でした！

ちなみに、いったん動くようになって、また時間をおいてもう一回やろうとしたらエラーが出たりするんですが、原因がわからないものの、多分Google Colaboratoryの利用時間制限とか何かで動かなくなっているっぽくて、その場合、打ち込んだ命令を上記のパッケージインストールから実行しなおすと動いたりしました。