📖
安定した拡散でより良い顔を作成するにはどうすればよいですか?
-
ブラウザを開いて、
この Web サイト
にアクセスします。
-
「接続」ボタンを押して「NVIDIA GPU」をクリックします。これは Google サーバーの GPU なので、心配する必要はありません。NVIDIA グラフィック カードは必要ありません。
-
Web サイトがコンピュータを使用できるようにシステム権限を付与します。
-
GPU カードの下のセクション (「モデルと出力パス」) を押します。
-
Google Colab を Google Drive に接続し、「モデルと出力パス」の横にチェックマークが表示されるまで待ちます。
-
「環境のセットアップ」を選択し、システムにアカウントを接続させます。 「Python 定義」についても同じことを行います。
-
「モデルの選択とロード」に進みます。このセクションでは、Google ドライブにアップロードするモデルが必要です。これを行うには、「ウェイトのダウンロード」セクションの「sd-v1.4.ckpt」を押して、
この Web サイト
から .ckpt ファイルをダウンロードします。このファイルを、改善したいモデルが含まれている Google Drive AI フォルダーにアップロードします。
-
「モデルの選択とロード」セクションの横にある「再生」ボタンを押します。緑色のチェック マークが表示されるまで待つと、Google Colab が起動して実行されます。
-
改善したい顔を切り抜き、別画像として保存します。
-
顔を Google Colab の一時ドライブ (左側のパネル) にドラッグしてアップロードします。
-
画像を右クリックし、「パスをコピー」ボタンをクリックします。
-
画像を右側のメニューの「init_image」フィールドに貼り付けます。
-
「プロンプト」ウィンドウに移動し、顔に必要なプロンプトを入力します。最良の結果を得るには、必ず引用符の中にプロンプトを入力してください。
-
「実行」セクションに進み、「画像設定」メニューを見つけます。
-
ピクセル解像度を変更して、顔の鮮明さを高めます。たとえば、ほとんどの場合、800×800 で適切に機能します。
-
「実行」ウィンドウの下にある赤い「再生」ボタンを押して、イメージをレンダリングします。
- 画像は別の解像度でレンダリングされます。希望の効果が得られるまで手順を試してください。
-
ドライブからイメージをダウンロードし、元のイメージにオーバーレイします。
より良い顔を作成するには、安定した拡散を伴うバリエーションをどのように使用しますか?
-
上記の手順に従って、Google ドライブを Google Deforum Stable Diffusion 0.5 Colab に接続します。
-
顔の画像を Colab の左側のパネルにアップロードします。
-
「アニメーション」メニューに移動し、「animation_mode」設定を「なし」に変更します。
-
「アニメーション」セクションの横にある「再生」ボタンをクリックして、変更を保存します。
-
元のプロンプトを開始点として使用します。
-
AI の顔に特徴を追加するか削除するかに応じて、線を変更して必要なバリエーションを作成します。 「アニメーション プロンプト」ウィンドウではなく、「プロンプト」セクションで作業します。
-
プロンプトの最初と最後に引用符を置きます。
-
プロンプトの最後 (引用符の後) にカンマを入力します。
-
「プロンプト」ウィンドウの左上隅にある「再生」ボタンをクリックして、画像をレンダリングし、進行状況を保存します。
-
「サンプリング設定」に移動し、「シード」設定を「-1」に設定します。
-
希望の効果が得られるまで「サンプラー」設定を試してください。
-
「ステップ」は好きなだけ設定してください。 「スケール」の値もあなた次第です。
-
「Sampler」ウィンドウで「ddim」レンダーを使用した場合は、「ddim_eta」を「1」に設定します。
-
「バッチ設定」が見つかるまで下にスクロールし、「n_batch」行に進みます。テキストボックスに必要なバリエーションの数を入力します。
-
「初期化設定」に移動し、「use_init」オプションの横にあるボックスを押します。設定の横にチェックマークが表示されます。
-
元の画像の 50% を再利用する場合は、「強度」フィールドに「0.5」と入力します。ソースマテリアルをどの程度再利用したいかに応じて、より高い値またはより低い値を入力できます。
-
左側のパネルにある「ファイル」アイコンをクリックします。最適化したい顔の画像が含まれているフォルダーに移動し、それを左側のセクションにドラッグします。システムが画像をロードするのを待ち、画像を右クリックして「パスのコピー」ボタンを押します。
-
パスを「init_image」フィールドに貼り付け、「イメージ設定」メニューの左上隅にある赤い「再生」ボタンをクリックします。
- プログラムに画像をレンダリングさせ、バリエーションを追加させます。画面の下部に、バリエーションを含む新しい顔が表示されるはずです。
安定した拡散で画像生成を改善する方法
- 具体的にする – フレーズの始まりは終わりよりも重要であるため、テキスト プロンプトは非常に詳細に記述する必要があります。特に最初はそうです。重要な情報を省略すると、期待どおりの外観が得られない可能性があります。
- 英語にこだわる – Stable Diffusion の開発者は、20 億以上の英語のテキストと画像のペアを使用しました。他の 100 以上の言語ではペアの数が少なく、個々の言語の割合が英語よりもはるかに小さいことを意味します。その結果、英語以外でプロンプトを作成すると、正しい結果が得られない可能性があります。
- アートのジャンルとタイプを含める – Stable Diffusion では、アクリル絵や油絵、ファッション写真、漫画、版画など、あらゆる種類の画像を生成できます。したがって、必要な画像の形式を指定すると、アルゴリズムがより正確になります。
- トレンディに – 芸術的な画像を探している場合は、「ArtStation のトレンド」またはその他の名前を追加して、安定した拡散を目的の画像にできるだけ近づけることができます。
- さまざまな言葉を使って遊ぶ – プロンプトを作成するときは、説明をやりすぎてはなりません。したがって、「シャープなフォーカス」や「ドラマチックな照明」などのさまざまな技術的特性や、「素晴らしい」、「ゴージャス」、「見事な」などの形容詞を試してみましょう。
- アーティスト名を追加 – 安定した拡散を使用すると、有名なアーティストのスタイルで画像を作成できます。この効果を実現するには、アンドリー ウォーホル、カスパー ダヴィッド フリードリッヒ、オーギュスト ルノワールなどのアーティストの名前をプロンプトに追加します。
- 否定的なメッセージを使用する – インターフェースの一部のバージョンは否定的なプロンプトに反応します。これらにより、イメージを生成するときにシステムが何を避けるべきかを示すことができます。
