【Stable Diffusion Web UI超入門】使い方〜応用例まで解説

Stable Diffusion Web UIの使い方について入門者向けに徹底解説します。

Stable Diffusion web UIとは

本ページの内容は以下動画(再生リスト)でも解説しています。

Stable Diffusion web UIは、ブラウザで画像生成AI「Stable Diffusion」を簡単に使用できるソフトです。
Stable Diffusion web UIの主な特徴は以下のとおりです。

  • オープンソースで開発されており、誰でも無料で利用できる。GithubはAUTOMATIC1111/stable-diffusion-webui
  • ローカル環境にインストールし、オフラインで使用可能
  • 画像生成AIの機能は「PyTorch(Pythonモジュール)」で実装されており、かなり高機能。
  • 実行環境(OS)はWindows、Mac、Linuxに対応。
  • 実用的な範囲で利用できる実行環境(ハードウェア)は、「NVIDIA製GPU(RTX3060以上が望ましい)を搭載したWindowsPC」もしくは「Mac(M系CPU搭載)」。
    本ページでは、「Stable Diffusion」の仕組みについては触れませんが、気になる方は以下の記事で別途解説していますので、よろしければご一読ください。
Stable Diffusionの仕組みとは?拡散モデルとは?
Stable Diffusionの仕組みとは?拡散モデルとは?について紹介します。

【ブラウザで画像生成している様子】

実行環境

Stable Diffusion Web UIは「ローカルのPCにインストールして使用する」もしくは「クラウドサーバー」にインストールして使用します。OSはWindows、Mac、Linuxに対応しています。

  • ローカルPCにインストールして使用する場合
    • 実用的な範囲で使用するには「高性能なGPU(CUDAを搭載しているNvidia製)を搭載したPC」もしくは「Mac(M系のCPU搭載)」を用意する必要があります。
    • 画像生成AIは、膨大な計算を行います。高性能なGPUで計算させた場合、512×512[px]の画像を1枚生成するのに数秒程度掛かります。Mac(M1〜M3系のCPU搭載)だと10〜30秒程度です。Mac(M系)以外のローカルPCでGPUを使用せずにCPUで計算させた場合は1枚生成するのに10分程度掛かってしまい、実用的ではありません。
    • 大きなサイズの画像生成を行うには、「メモリ容量が大きいNvidia製のGPU」を使用する必要があります。8GBメモリのMac Mini(M2)だと1024×1024[px]を超えるサイズの画像はメモリ不足で生成できませんでした。
    • まとめると、コスパ重視でとりあえず始めるならMac(M系CPU搭載)、ガンガン大きい画像を生成したいなら「RTX 3060(16GBメモリ版)以上のNvidia製GPUを搭載したWindowsPCがおすすめです。
  • クラウドサーバーにインストールして使用する場合
    • 高性能なGPUを搭載したPCの購入にハードルを感じる場合、Google Colab、GPUSOROBAN、Azure、GCP等のクラウドサーバーにインストールして使用する方法があります。
    • クラウドサーバーであれば、使用時間に応じた課金で済むため、途中で飽きても初期費用が無駄にならず、とりあえず始める場合にもおすすめです。

導入および基本操作

応用例

  1. 「EasyNegative」のインストールと使い方
  2. ラフ画、線画、落書きからイラストを生成
  3. 「Hires.fix」で構図の破綻を防ぎながら画像サイズの大きい(高解像度)イラストを生成
  4. ControlNetで複雑な構図・ポーズを入力画像から作成

関連ページ

画像生成AIとは?初心者向け解説
画像生成AIとは?イラストや実写真の作り方など、基本的な使い方から応用例についてに初心者向けにまとめました。