最初は軽量のAIイラストNGUIをローカルパソコンで出力していましたが、現在はstable diffusionをメインにAIイラストを使っています。
そこで重要になってくるのが画質をよくするためのファイル「VAE」です。
最初はVAEなんか使わなくても十分質のいいイラストが出力できるので無視していましたが、実際VAEを適用してみると、もう使わずにいられないくらいの重要な要素であることがわかりました。
まず、VAEを使っていないAIイラストでは、モデルに関わらず、全体的に暗いというか、もやがかかったような独特な絵になってしまいます。
これではAIイラストだと丸わかりですし、うまい人が書いた絵よりあきらかに劣ったイラストとなっていまいます。
そのAIイラストの弱点を補ってさらに独自性を出す効果があるのがVAEなのです。
そのVAEにはいくつか種類があります。
スポンサーリンク
一つが各モデル用のVAEともう一つが汎用性VAEです。
モデル用のVAEは各モデル、たとえば「anything v4」モデルだと「anything-v4.0.vae.pt」というように、各モデルごとに推奨しているVAEがあります。
といっても「anything v4」以外で「anything-v4.0.vae.pt」を使うとエラーになるという事はなく、vae未適用よりはよっぽどいいイラストが出力されます。
実際どのVAEがいいかは各個人の好みもあると思うので、いろいろ試した方がいいと思います。
あと、各モデル推奨のVAEと違い汎用性VAEはどのモデルでも質を向上させられるVAEなので、これも試してみた方がいいと思います。
どの汎用性VAEを使えばいいか、は一応の指標があって、「vae-ft-mse-840000-ema」はリアル系、例えば「realdosmix」などのモデルに推奨されていて、VAE未適用のイラストと比べるとかなり画面が明るくなり、アニメ調の絵柄にしてくれます。
「vae-ft-mse-840000-ema」はかなり汎用性が高く、すべてのモデルをこれで出力させる人もいるそうですが、「waifu diffusion」や「anything」などのアニメ調イラストでは「kl-f8-anime2.vae.pt」の方がいいという意見もあります。
スポンサーリンク
実際、両方のVAEを使ってみた自分としては、あまり違いがないようにも思ったのですが、細かい部分、例えば口のパーツや手のパーツなどで「kl-f8-anime2.vae.pt」を使った方がanythingモデルなどは質のいいイラストが出力されやすい印象でした。
逆に「realdosmix」などのリアル系モデルではanime2のVAEは明るすぎてリアル感を損なうため、「vae-ft-mse-840000-ema」の方がいいのかな、と思いました。
どちらにしても、手の細かい部分など、おかしな絵が出力されずらくなるという点からもvaeは使わないよりも使った方がはるかにいいという結論となりました。
ちなみにAUTOMATIC1111でVAEを適用するには、上部のタブメニューから「Setting」を選択し、左側のメニューから「stable diffusion」をクリックして、表示されたメニューに「SD VAE」という項目があるので、そこのプルダウンから各種読み込んだVAEを選択し、最後に上部のAPPLY Settingというボタンをおして更新します。
ボタンを押してしばらく待ち、「6 settings changed: ldsr_steps, ldsr_cached, SWIN_tile, SWIN_tile_overlap, sd_vae, sd_lora.」のように表示されたら更新ができたという事なので実際にAI絵を出力して適用されているかみてみましょう。
その後いろいろ使ってみましたが、civitaiで公開しているモデルだと結構VAEなしでもいい感じに出力できるものが多いようですね。
最近のおすすめは「koji_v21.safetensors」です。
軽量で流行の絵柄が出力されるうえ、VAEなしなので楽です。
google colabでのstable diffusion利用は無料版だとすぐ接続が切れるようになってしまったので、なるべく軽量かつVAEなし方が一回の接続で出力できる絵柄が多くなります。
スポンサーリンク
コメント