ホーム AI TikTok の作成者は、数秒でビデオを生成する驚くべき AI を開発しました。これがその仕組みです

TikTok の作成者は、数秒でビデオを生成する驚くべき AI を開発しました。これがその仕組みです

2022 年の大半から 2023 年にかけて、人工知能はテクノロジー業界の中心的な役割を果たしました。 ChatGPT 、 Copilot 、 Bard 、および言語モデルに基づくその他のチャットボットなどの破壊的なツールは、多くの見出しを飾りました。 DALL-E 、 Stable Diffusion 、 Midjourneyなど、本当に驚くべき結果を残した AI 画像生成ツールも忘れないでください。

こうした中、しばらく前から、 ビデオの断片を数秒で生成できる AI ベースのツールも登場し始めています。これは最近まで考えられませんでしたが、すでにこの種のプロジェクトに夢中になっている企業があります。そのうちの 1 つは、有名なアプリ TikTok の作成者である ByteDance です。

テキストから印象的な動画を生成するAI

彼らは、ウェブサイトとツールの動作に関する詳細なレポートを通じて、人工知能によるビデオ生成ツール「MagicVideo-V2」を紹介しました。そのアイデアは、ビデオに表示したい内容をテキストで説明すると、ツールがそれを数秒の断片で表現できるようになるということです。

ビデオ

ウェブ上には、簡単な説明を通じて、あらゆる種類の印象的なクリップを生成できることがわかる、高品質のサンプルが多数掲載されています。これに加えて、ByteDance のテクノロジーと、Stable Diffusion の開発者によって作成された「SVD-XT」や Pika Labs の Pika 1.0 Gen-2 など、ネットワーク上に存在する他のテクノロジーとの比較も見られます。

この AI によって生成されたビデオの詳細は別として、画像内に目に見えるエラーがそれほど多くないため、結果の一貫性という事実は驚くべきことです。確かに、注意して立ち止まると、時折失敗することがあります。ただし、作成者にとっては良い出発点です。

MagicVideo-V2 は 4 つの動作モジュールで構成されるモデルです。画像からビデオへ (I2V)。ビデオツービデオ (V2V) およびフレーム補間モデル。作成者が主張しているように、T2I モジュールは入力されたプロンプトに応じて 1,024 x 1,024 ピクセルの画像を生成します。 I2V モジュールは画像をアニメーション化し、600 x 600 ピクセルの 32 フレームを生成します。 3 番目に、V2V モジュールは解像度を 1,048 x 1,048 ピクセルに増加し、最後に補間モジュールはレートを 94 フレームに増加することで画像の動きをさらに滑らかにします。

AI説のあるtiktokerの真相 #tiktok #tiktoker #ai

これは完璧なテクノロジーではありませんが、わずか数か月の間にこの種の例が確認されたことは驚くべきことであり、このテクノロジーが将来どれほど私たちを驚かせるかについてのヒントを与えてくれます。

現時点ではこのビデオ生成モデルをテストすることはできないため、すべてがどのようになるのか、そしてこの AI が最終的にどのように実現するのかを知るまで待たなければなりません。これは多くのコンピューティング能力を必要とするプロジェクトですが、将来的にそれを TikTok ビデオに使用できるかどうかは誰にもわかりません。

2022 年の大半から 2023 年にかけて、人工知能はテクノロジー業界の中心的な役割を果たしました。 ChatGPT 、 Copilot 、 Bard 、および言語モデルに基づくその他のチャットボットなどの破壊的なツールは、多くの見出しを飾りました。 DALL-E 、 Stable Diffusion 、 Midjourneyなど、本当に驚くべき結果を残した AI 画像生成ツールも忘れないでください。

こうした中、しばらく前から、 ビデオの断片を数秒で生成できる AI ベースのツールも登場し始めています。これは最近まで考えられませんでしたが、すでにこの種のプロジェクトに夢中になっている企業があります。そのうちの 1 つは、有名なアプリ TikTok の作成者である ByteDance です。

テキストから印象的な動画を生成するAI

彼らは、ウェブサイトとツールの動作に関する詳細なレポートを通じて、人工知能によるビデオ生成ツール「MagicVideo-V2」を紹介しました。そのアイデアは、ビデオに表示したい内容をテキストで説明すると、ツールがそれを数秒の断片で表現できるようになるということです。

ビデオ

ウェブ上には、簡単な説明を通じて、あらゆる種類の印象的なクリップを生成できることがわかる、高品質のサンプルが多数掲載されています。これに加えて、ByteDance のテクノロジーと、Stable Diffusion の開発者によって作成された「SVD-XT」や Pika Labs の Pika 1.0 Gen-2 など、ネットワーク上に存在する他のテクノロジーとの比較も見られます。

この AI によって生成されたビデオの詳細は別として、画像内に目に見えるエラーがそれほど多くないため、結果の一貫性という事実は驚くべきことです。確かに、注意して立ち止まると、時折失敗することがあります。ただし、作成者にとっては良い出発点です。

MagicVideo-V2 は 4 つの動作モジュールで構成されるモデルです。画像からビデオへ (I2V)。ビデオツービデオ (V2V) およびフレーム補間モデル。作成者が主張しているように、T2I モジュールは入力されたプロンプトに応じて 1,024 x 1,024 ピクセルの画像を生成します。 I2V モジュールは画像をアニメーション化し、600 x 600 ピクセルの 32 フレームを生成します。 3 番目に、V2V モジュールは解像度を 1,048 x 1,048 ピクセルに増加し、最後に補間モジュールはレートを 94 フレームに増加することで画像の動きをさらに滑らかにします。

AI説のあるtiktokerの真相 #tiktok #tiktoker #ai

これは完璧なテクノロジーではありませんが、わずか数か月の間にこの種の例が確認されたことは驚くべきことであり、このテクノロジーが将来どれほど私たちを驚かせるかについてのヒントを与えてくれます。

現時点ではこのビデオ生成モデルをテストすることはできないため、すべてがどのようになるのか、そしてこの AI が最終的にどのように実現するのかを知るまで待たなければなりません。これは多くのコンピューティング能力を必要とするプロジェクトですが、将来的にそれを TikTok ビデオに使用できるかどうかは誰にもわかりません。

最新記事一覧