ホーム PC-モバイル安定した拡散でより良い顔を作成する方法

安定した拡散でより良い顔を作成する方法

4月 5, 2024

—

📖

安定した拡散を使用すると、テキストに基づいて実質的にあらゆる画像を作成できます。たとえば、プロジェクトでは AI の顔を改善する必要があるが、元の顔を改善するのに苦労しているとします。その場合は、安定拡散面の作成プロセスを改善するためのヒントをいくつか活用してください。さらに詳しく知りたい方は読み続けてください。

安定した拡散でより良い顔を作成するにはどうすればよいですか?

Stable Diffusion でより良い顔を作成するには、Deforum Stable Diffusion v0.5 と呼ばれる Google Colab をセットアップする必要があります。その方法は次のとおりです。

ブラウザを開いて、この Web サイトにアクセスします。
「接続」ボタンを押して「NVIDIA GPU」をクリックします。これは Google サーバーの GPU なので、心配する必要はありません。NVIDIA グラフィックカードは必要ありません。
Web サイトがコンピュータを使用できるようにシステム権限を付与します。
GPU カードの下のセクション (「モデルと出力パス」) を押します。
Google Colab を Google Drive に接続し、「モデルと出力パス」の横にチェックマークが表示されるまで待ちます。
「環境のセットアップ」を選択し、システムにアカウントを接続させます。「Python 定義」についても同じことを行います。
「モデルの選択とロード」に進みます。このセクションでは、Google ドライブにアップロードするモデルが必要です。これを行うには、「ウェイトのダウンロード」セクションの「sd-v1.4.ckpt」を押して、この Web サイトから .ckpt ファイルをダウンロードします。このファイルを、改善したいモデルが含まれている Google Drive AI フォルダーにアップロードします。
「モデルの選択とロード」セクションの横にある「再生」ボタンを押します。緑色のチェックマークが表示されるまで待つと、Google Colab が起動して実行されます。

Google Colab がセットアップされたので、安定した拡散を使用して AI の顔を改善できます。このプロセスは古いレンダリングの改善とも呼ばれ、画像の解像度を変更することになります。

改善したい顔を切り抜き、別画像として保存します。
顔を Google Colab の一時ドライブ (左側のパネル) にドラッグしてアップロードします。
画像を右クリックし、「パスをコピー」ボタンをクリックします。
画像を右側のメニューの「init_image」フィールドに貼り付けます。
「プロンプト」ウィンドウに移動し、顔に必要なプロンプトを入力します。最良の結果を得るには、必ず引用符の中にプロンプトを入力してください。
「実行」セクションに進み、「画像設定」メニューを見つけます。
ピクセル解像度を変更して、顔の鮮明さを高めます。たとえば、ほとんどの場合、800×800 で適切に機能します。
「実行」ウィンドウの下にある赤い「再生」ボタンを押して、イメージをレンダリングします。
画像は別の解像度でレンダリングされます。希望の効果が得られるまで手順を試してください。
ドライブからイメージをダウンロードし、元のイメージにオーバーレイします。

より良い顔を作成するには、安定した拡散を伴うバリエーションをどのように使用しますか?

解像度を変更して顔を直接改善するだけでなく、バリエーションを導入してより鮮明な画像を生成することもできます。最初のステップは、「アニメーション」設定を「なし」に設定することです。行う必要があるのは次のとおりです。

上記の手順に従って、Google ドライブを Google Deforum Stable Diffusion 0.5 Colab に接続します。
顔の画像を Colab の左側のパネルにアップロードします。
「アニメーション」メニューに移動し、「animation_mode」設定を「なし」に変更します。
「アニメーション」セクションの横にある「再生」ボタンをクリックして、変更を保存します。

「アニメーション」設定を変更したら、アニメーションを作成したくないので、他の設定のほとんどは無視できます。ただし、「プロンプト」セクションにいくつかの調整を加える必要があります。次の手順を実行します：

元のプロンプトを開始点として使用します。
AI の顔に特徴を追加するか削除するかに応じて、線を変更して必要なバリエーションを作成します。「アニメーションプロンプト」ウィンドウではなく、「プロンプト」セクションで作業します。
プロンプトの最初と最後に引用符を置きます。
プロンプトの最後 (引用符の後) にカンマを入力します。
「プロンプト」ウィンドウの左上隅にある「再生」ボタンをクリックして、画像をレンダリングし、進行状況を保存します。

次に調整したいメニューは「実行」メニューです。具体的には、「画像設定」ウィンドウに移動して次の変更を加える必要があります。

「サンプリング設定」に移動し、「シード」設定を「-1」に設定します。
希望の効果が得られるまで「サンプラー」設定を試してください。
「ステップ」は好きなだけ設定してください。「スケール」の値もあなた次第です。
「Sampler」ウィンドウで「ddim」レンダーを使用した場合は、「ddim_eta」を「1」に設定します。
「バッチ設定」が見つかるまで下にスクロールし、「n_batch」行に進みます。テキストボックスに必要なバリエーションの数を入力します。
「初期化設定」に移動し、「use_init」オプションの横にあるボックスを押します。設定の横にチェックマークが表示されます。
元の画像の 50% を再利用する場合は、「強度」フィールドに「0.5」と入力します。ソースマテリアルをどの程度再利用したいかに応じて、より高い値またはより低い値を入力できます。
左側のパネルにある「ファイル」アイコンをクリックします。最適化したい顔の画像が含まれているフォルダーに移動し、それを左側のセクションにドラッグします。システムが画像をロードするのを待ち、画像を右クリックして「パスのコピー」ボタンを押します。
パスを「init_image」フィールドに貼り付け、「イメージ設定」メニューの左上隅にある赤い「再生」ボタンをクリックします。
プログラムに画像をレンダリングさせ、バリエーションを追加させます。画面の下部に、バリエーションを含む新しい顔が表示されるはずです。

安定した拡散で画像生成を改善する方法

安定拡散を使用して顔を改善する場合、作業の大部分は適切なプロンプトを作成することになります。システムはこの機能を利用して、「txt2img」テクノロジーを使用して画像を生成します。テキストプロンプトとその他のパラメーターを使用して、入力に基づいて画像を生成します。

前述したように、望ましい結果を作成するには、ある時点で「シード」値を入力する必要があります。バリエーションを組み込む際の「ステップ数」も変更できます。

ただし、これらの機能は、結果の顔を改善するという点ではあまり役に立たない可能性があります。代わりに、高品質の画像を確実に生成するには、「プロンプト」ゲームを強化する必要があります。これを行うのに役立つヒントをいくつか紹介します。

具体的にする – フレーズの始まりは終わりよりも重要であるため、テキストプロンプトは非常に詳細に記述する必要があります。特に最初はそうです。重要な情報を省略すると、期待どおりの外観が得られない可能性があります。
英語にこだわる – Stable Diffusion の開発者は、20 億以上の英語のテキストと画像のペアを使用しました。他の 100 以上の言語ではペアの数が少なく、個々の言語の割合が英語よりもはるかに小さいことを意味します。その結果、英語以外でプロンプトを作成すると、正しい結果が得られない可能性があります。
アートのジャンルとタイプを含める – Stable Diffusion では、アクリル絵や油絵、ファッション写真、漫画、版画など、あらゆる種類の画像を生成できます。したがって、必要な画像の形式を指定すると、アルゴリズムがより正確になります。
トレンディに – 芸術的な画像を探している場合は、「ArtStation のトレンド」またはその他の名前を追加して、安定した拡散を目的の画像にできるだけ近づけることができます。
さまざまな言葉を使って遊ぶ – プロンプトを作成するときは、説明をやりすぎてはなりません。したがって、「シャープなフォーカス」や「ドラマチックな照明」などのさまざまな技術的特性や、「素晴らしい」、「ゴージャス」、「見事な」などの形容詞を試してみましょう。
アーティスト名を追加 – 安定した拡散を使用すると、有名なアーティストのスタイルで画像を作成できます。この効果を実現するには、アンドリーウォーホル、カスパーダヴィッドフリードリッヒ、オーギュストルノワールなどのアーティストの名前をプロンプトに追加します。
否定的なメッセージを使用する – インターフェースの一部のバージョンは否定的なプロンプトに反応します。これらにより、イメージを生成するときにシステムが何を避けるべきかを示すことができます。

安定した拡散で想像力と創造力を発揮しましょう

特に AI の顔やその他の画像を強化したい場合は、安定した拡散をマスターするのに時間がかかることがあります。 1 行または 2 行間違っていると、プロジェクトの品質が簡単に低下する可能性があるため、プロンプトを作成したり生成パラメータを入力したりするときは、細心の注意を払う必要があります。いくつかの調整を行うだけで、写真の顔やその他の部分を簡単に美しくできるはずです。

安定拡散はどのくらいの頻度で使用しますか?画像にバリエーションを加えたことがありますか?もしそうなら、それらはどのような影響をもたらしましたか?以下のコメントセクションであなたの経験を共有してください。