この記事では、各種Stable Diffusionのスコアを実際に計測した時間をまとめてみました。
僕は最近Stable Diffusionにハマっていて、いろいろなiPadやMac、IntelやAMDのCPUなどいろいろなもので試しています。
各種データは色々なものがあるのですが、それを統一して比較するためにこの記事を作成しました。
比較のために統一した条件・設定・注意書きなど
比較のために統一した条件についてです。
モデルは某美少女系のものとする
モデルについては、使用者もその手の需要も多そうな気がする美少女系のものとさせていただきます。
2023/04/18追記、モデルによっても生成速度が変わりそうなので記載すると、人気が高そうなことと、情報が多いこと、多くの環境でも使いやすそうなことからそのようにします。
モデル名については
プロンプトは3語、ネガティブプロンプトは基本的なもので統一
プロンプトは3語とさせていただきます。どんなプロンプトかと言うと、イラストの属性のプロンプト2つ「m(以下略)」「t(以下略)」と、イラストの完成度を上げる「masterpiece」です。
ネガティブプロンプトは「bad_prompt_version2,flat color, flat shading,retro style,poor quality,bad anatomy,」をつっこんでいます。
サイズは512×512
サイズは一般的なものである512×512とさせていただきます。
ステップ数は25
一番悩んだ設定項目がこれです。
ステップ数は基本的にあげればあげるほど綺麗な画像ができますが、処理に時間がかかるようになります。
特に今回のような生成時間を計測する場合は、処理に時間がかかるのは端的にめんどくさいです。
なので、そこそこ綺麗な画像ができ、作業時間も比較的短いステップ数25としました。
5の倍数としているのは、NMKDが5の倍数じゃないと設定できないっぽいからです。(詳しく調べてないのでできるかもしれませんが。)
2023/04/18追記、サンプラーはDDIMで統一
Stable Diffusionをいじりまくって気づいたのですが、サンプラーによっても計測時間が変化するみたいですね。
ここら辺ノーマークでした。
そのため、サンプラーも統一することにしました。
人気なサンプラーはDPM++ SDE KarrasやDPM ++ 2M Karrasですし、そのどちらかに統一したかったのですが、NMKDではいまのところ使えないので、DDIMで統一することにしました。
こんごデータを取り直すことがあれば追加します。
生成したイラストは基本モザイクをかけるか非公開とします
非公開とする理由は2つです。
まず、TPOにそぐわない画像などになってしまう可能性があるからです。
続いて、著作権上の問題に遭うリスクを軽減したいからです。
実現するのが簡単な環境を中心に行います。
Draw ThingsとかNMKDとか、簡単なもののみ使用しています。
難易度が高いものはうまくいかなかったりするので
計測スコアの代表的な数値まとめ
SOC/CPU | メモリ | 環境 | 時間 | |
M1 iPad Pro 11(2021) | M1 | 8GB | Draw Things | 35秒 |
iPad Pro 12.9(2018) | A12X | 4GB | Draw Things | 132秒 |
M1 MacBook Air | M1 | 16GB | Draw Things | 38秒 |
Macbook Pro 2018 | i5-8279U | 16GB | Draw Things | 604秒 |
GMK Nucbox9 | Ryzen5-5600U | 16GB | NMKD | 455秒 |
Razer Blade | i7-8550U | 16GB | NMKD | 626秒 |
Beelink S12 Pro | Intel N100 | 16GB | NMKD | 575秒 |
おすすめマシンについて
現状一番高速で高画質の画像を大量に出力できるマシンは、やっぱりNVIDIAのグラボを積んだPCになると思われます。
他サイト様のベンチマークなどを参考にした結果、M1よりもNVIDIAグラボ搭載のPCの方が高速と考えられます。
ただ、M1搭載のMacやiPadの方を持っている人もいると思いますし、そちらの方が初期費用やランニングコストも少ないと思われますので人によってはM1の方がいいかもしれません。M1チップでもNVIDIAのものには大きく劣るものの、他の方法に比べたら爆速な印象なので。
僕自身IntelやAMDのCPUだけを積んだWinのPCも試しましたが、あまり処理が速くなかった印象です。
また、Android端末でも
iPadとStable Diffusionについて
iPadとStable Diffusionのスコアなどの詳細についてです
結構早い
今の所M1 iPad Pro 11(2021)が非常に爆速です。
ただ、とにかく早いのですがNVIDIAのグラボと比較してどれくらいのスコアなのかがわかりづらい印象です。
とりあえず代表的なグラボとしてはAmazonで一番売れているのがRTX3060を仮定させていただきます。
代表的なRTX3060の消費電力は170W程度らしいです。170W!
それをもとにいろいろとざっと計算した結果、NVIDIAのグラボよりも電気効率は良さそうらしいです。
ただ、生成速度を考えるとNVIDIAのグラボを購入したもののほうが良さそうです。
おすすめ機種
おすすめ機種を考えると、M1チップ以上のものを搭載している機種となります。
個人的にはM2よりもM1の方が割安感があります。処理性能だけを考えると、Air5のほうがM1 Proよりも割安感はありますね
MacとStable Diffusionについて
M1とDrawthingsとの相性が最強
設定を弄ることで16GBメモリモデルの場合は1枚21秒の速度で生成が可能です。
おすすめもでるはM1 Mac mini
NVIDIAグラボ搭載のPCについて
とにかく高速に出力が可能
NIVIDIAグラボのPCがスタンダード的ではあります。
とはいえ人によっては難易度が高い
PCとして内蔵グラボではないグラボで、さらにRadeonではなくNVIDIAのグラボとなるため、結構難易度たが回かもしれません。
ミニPCにはNVIDIAのグラボを搭載したものは低価格帯ではないので、かなり難しいです。
ノートPCにはトータルの消費電力が少ないグラボが搭載されていますが、日本で販売されているノートPCのほとんど全てはJISキーボードだったりするのでUS配列ユーザーにとっては選びにくいです。すごく選びにくいです。
また、しっかりしたグラボを搭載したPCだと高速な生成が可能ですが、その分だけ電気代もかかります。
いい感じの画像を作るコツ
画像サイズはデカめにすると顔が綺麗に表示される
メガネをかけた人物を生成することが多いのですが、特に顔がうまく出力されないことが多いです。
上手い画像と下手な画像を見比べると、上手い画像は顔がアップになっていることが多い=顔の画素数が多い?と感じたので、画素数を増やしたところ、うまく表示されることが増えました
しかし、メガネをかけさせると顔が一気に崩れやすくなりますね。
互換性のDDIM、精度のSDE Karras、速度と精度の2M Karras
NMKDやDrawthingsなど、多くの環境で共通して使いやすく、そこそこ高速なサンプラーはDDIMです。
時間がかかるものの、ステップ数の割には精度が出るのがSDE Karrasです。
速度と精度を両立するなら、2M Karrasがおすすめです。
プロンプトは英語の語彙の勉強にもなる?
プロンプトについては有志の方が出していますが、どうしてもその中に自分の欲しいプロンプトがない場合は英訳してみるのもお勧めです。