Stable Diffusion Web UIの使い方について入門者向けに徹底解説します。
Stable Diffusion web UIとは
本ページの内容は以下動画(再生リスト)でも解説しています。
Stable Diffusion web UIは、ブラウザで画像生成AI「Stable Diffusion」を簡単に使用できるソフトです。
Stable Diffusion web UIの主な特徴は以下のとおりです。
- オープンソースで開発されており、誰でも無料で利用できる。GithubはAUTOMATIC1111/stable-diffusion-webui。
- ローカル環境にインストールし、オフラインで使用可能。
- 画像生成AIの機能は「PyTorch(Pythonモジュール)」で実装されており、かなり高機能。
- 実行環境(OS)はWindows、Mac、Linuxに対応。
- 実用的な範囲で利用できる実行環境(ハードウェア)は、「NVIDIA製GPU(RTX3060以上が望ましい)を搭載したWindowsPC」もしくは「Mac(M系CPU搭載)」。
本ページでは、「Stable Diffusion」の仕組みについては触れませんが、気になる方は以下の記事で別途解説していますので、よろしければご一読ください。
Stable Diffusionの仕組みとは?拡散モデルとは?
Stable Diffusionの仕組みとは?拡散モデルとは?について紹介します。
【ブラウザで画像生成している様子】
実行環境
Stable Diffusion Web UIは「ローカルのPCにインストールして使用する」もしくは「クラウドサーバー」にインストールして使用します。OSはWindows、Mac、Linuxに対応しています。
- ローカルPCにインストールして使用する場合
- 実用的な範囲で使用するには「高性能なGPU(CUDAを搭載しているNvidia製)を搭載したPC」もしくは「Mac(M系のCPU搭載)」を用意する必要があります。
- 画像生成AIは、膨大な計算を行います。高性能なGPUで計算させた場合、512×512[px]の画像を1枚生成するのに数秒程度掛かります。Mac(M1〜M3系のCPU搭載)だと10〜30秒程度です。Mac(M系)以外のローカルPCでGPUを使用せずにCPUで計算させた場合は1枚生成するのに10分程度掛かってしまい、実用的ではありません。
- 大きなサイズの画像生成を行うには、「メモリ容量が大きいNvidia製のGPU」を使用する必要があります。8GBメモリのMac Mini(M2)だと1024×1024[px]を超えるサイズの画像はメモリ不足で生成できませんでした。
- まとめると、コスパ重視でとりあえず始めるならMac(M系CPU搭載)、ガンガン大きい画像を生成したいなら「RTX 3060(16GBメモリ版)以上のNvidia製GPUを搭載したWindowsPCがおすすめです。
- クラウドサーバーにインストールして使用する場合
- 高性能なGPUを搭載したPCの購入にハードルを感じる場合、Google Colab、GPUSOROBAN、Azure、GCP等のクラウドサーバーにインストールして使用する方法があります。
- クラウドサーバーであれば、使用時間に応じた課金で済むため、途中で飽きても初期費用が無駄にならず、とりあえず始める場合にもおすすめです。
導入および基本操作
- 導入方法
- 基本操作
- 呪文・プロンプト
応用例
- 「EasyNegative」のインストールと使い方
- ラフ画、線画、落書きからイラストを生成
- 「Hires.fix」で構図の破綻を防ぎながら画像サイズの大きい(高解像度)イラストを生成
- ControlNetで複雑な構図・ポーズを入力画像から作成
関連ページ
画像生成AIとは?初心者向け解説
画像生成AIとは?イラストや実写真の作り方など、基本的な使い方から応用例についてに初心者向けにまとめました。