ホームツールこの Microsoft AI は、3 秒間の音声から人の声と感情を模倣できます: これが VALL-E の仕組みです

この Microsoft AI は、3 秒間の音声から人の声と感情を模倣できます: これが VALL-E の仕組みです

1月 5, 2023

—

近年、多くの分野で人工知能に基づく素晴らしいツールが登場しています。 Microsoft のような企業も、この点に関して無限の提案を行っており、その最新のものの 1 つが VALL-E です。

VALL-E ( DALL-Eと混同しないでください) は、対話者と同じ声とイントネーションの音声を生成できる言語モデルです。ツールが処理を開始できるようにするために必要なのは、少なくとも 3 秒の音声だけです。

人のイントネーションや感情まで真似できるAI

この言語モデルの機能については、研究者が発行したレポートで詳しく説明されています。 VALL-E は、60,000 時間以上の英語音声でトレーニングを受けています。このテクノロジーにより、ユーザーは別の人の声からパーソナライズされた音声を合成できます。実際、研究では、実施されたテストの成功が反映されています。

「実験結果は、音声の自然さと話者の類似性の点で、VALL-E が最先端のゼロショット TTS システムよりも大幅に優れていることを示しています。」さらに、VALL-E が話者の感情と音響環境を保存できることもわかりました。合成における音響メッセージの。」

GitHubページには、このツールがどのように機能するかを示す例が多数あります。ここでは、数秒の音声で、システムがまったく異なるメッセージの音声とイントネーションを確立できることがわかります。印象的ではありますが、その結果には依然としてオーディオに「ロボットの」抜け穴があり、このタイプの提案ではよくあることです。

自分の声が3秒あればText-to-Speechできる「VALL-E X」を試してみた

しかし、おそらく最も驚くべきことは、メッセージに含まれる感情を模倣するツールの機能です。つまり、誰かが怒りや悲しみを示した場合、AIはそのイントネーションを拾い上げて、まったく異なるメッセージに適用することができるということです。

このツールのパフォーマンスは非常に優れていますが、Microsoft は変化が知覚できなくなるまで改良を続ける可能性があります。もちろん、テクノロジーは大きな利点をもたらしますが、特に誰かになりすます場合には、非常に危険な場合もあります。

人のイントネーションや感情まで真似できるAI

「実験結果は、音声の自然さと話者の類似性の点で、VALL-E が最先端のゼロショット TTS システムよりも大幅に優れていることを示しています。」さらに、VALL-E が話者の感情と音響環境を保存できることもわかりました。合成における音響メッセージの。」

自分の声が3秒あればText-to-Speechできる「VALL-E X」を試してみた

最新記事一覧

開発者向けの最高の「アドベントカレンダー」: プログラミングの課題を受け入れて 1 年に別れを告げる

12月 7, 2024

—

in 開発

今年の 12 月は、グローバルな開発者コミュニティに参加し、プログラミングの課題を学習したり練習したりして、ク…
この地図を使用すると、スペインの一部の都市のバス、電車、地下鉄の行き先をリアルタイムで確認できます。

12月 7, 2024

—

in ウェブ

私たちの町の公共交通機関がどのように機能するかを学び、バスに乗り遅れないようにする方法
この地図を使用すると、スペインの一部の都市のバス、電車、地下鉄の行き先をリアルタイムで確認できます。

12月 7, 2024

—

in ツール

私たちの町の公共交通機関がどのように運行しているかを調べ、バスに乗り遅れないようにする方法
この Linux パッチには、パフォーマンスを 39 倍にするために 1 行のコードが必要です

12月 6, 2024

—

in リナックス

しかし、技術効率が重要な今、わずか 2.6% の改善 (Linux の作成者自身による 2 番目のパッチのよう…
PC 上で音声付き ChatGPT を常にアクティブにします。これは、Windows と Mac でバックグラウンドでアクティブに保つことができた方法です。

12月 6, 2024

—

in ツール

このオプションはまだ標準ではありませんが、プロンプトを使用してアシスタントに常にアクティブでサイレントを維持す…
ホテルは到着前に身分証明書をスキャンするように求めました。安全のためにこれらすべてを編集して共有しました。

12月 5, 2024

—

in 安全

彼らが私たちにスキャンされた DNI を要求するたびに、私たちは何かを覚えておかなければなりません。それは、行…
CNMC は重大なハッキングを受け、240 GB の電話回線データと 20 億件の記録が流出しました

12月 5, 2024

—

in 安全

モバイル回線ユーザーに関してどのような正確なデータを保有しているかは公表されていないが、漏洩したデータの量は非…
OpenAI から欧州連合への新たな打撃: 今年最高の人工知能がスペインに到着しない

12月 5, 2024

—

in AI

Sora は世界的な発売時には欧州連合には到着しないため、スペインにまだ導入されていない Apple Inte…
OpenAI が Sora を発表: 今年最も期待されていた AI は予想通り残忍なものでしたが、悪いニュース (そして良いニュース) もあります

12月 5, 2024

—

in AI

Sora は期待どおりですが、スペインや他の EU 諸国には届きません
Googleの共同創設者は、人類を救うために全財産をイーロン・マスクに捧げるとさえ述べた。今日、彼らはお互いに話すことさえありません、この理由で

12月 5, 2024

—

in AI

AIは、ペイジからアルトマンに至るまで、イーロンと他のテクノロジーリーダーとの関係に多くの亀裂を引き起こした
Microsoft は Windows 10 に時限爆弾を抱えています。Windows 10 には依然として多くのユーザーがおり、Windows 11 の制限は役に立ちません。

12月 4, 2024

—

in ウィンドウズ

Windows 10 の市場シェアは、発売から約 10 年が経過した現在でも Windows 11 よりもはる…
AirbnbのCEOの言う通りに、安く宿泊施設を提供したいと思いました。スペインでは法律と費用の関係で不可能です

12月 4, 2024

—

in ウェブ

私たちは、観光客向けの賃貸用の小さな不動産を所有している 2 人に話を聞きました。彼らの事例は、法律、保険、さ…
彼らはBBVAになりすまし、この弁護士から7万ユーロをだまし取ることに成功した。不可能に思えますが、彼には彼らを取り戻す計画があります。

12月 4, 2024

—

in 安全

同氏は、銀行に対する請求と「並行して」司法手続きを開始することが「より効果的」であると述べている。
ペドロ・サンチェスの携帯電話に感染したソフトウェアは、もはや政治家だけを攻撃しているわけではない。彼らは普通の人々の中にペガサスを発見した

12月 4, 2024

—

in 安全

モバイルセキュリティ会社による調査は、個人でのペガサスの使用についてあらゆる警鐘を鳴らしています
Microsoft は Windows 12 について何も語っていませんが、Windows と macOS が握手するこのコンセプトデザインが気に入りました。

12月 3, 2024

—

in ウィンドウズ

コンセプトデザイナーの「Nepnus」が、Windows 12 のビジョンの詳細を説明するビデオを公開しまし…
高速化するために PC マウスを動かしたとしても、それは間違いではありません。このトリックが Windows で機能するのには理由があります。

12月 2, 2024

—

in ウィンドウズ

鍵は I/O 操作と例外処理にあります (すべてをもっと明確に理解しているのではないでしょうか?)
彼らは、あなたのすべての法的質問に無料で、あなたが理解できる言葉で答える ChatGPT を作成しました。

12月 2, 2024

—

in AI

「専門用語」機能を使用すると、回答を大人が読むか法律専門家が読むかを選択して、回答を適応させることができます
Sunshine は、あらゆるデバイスからストリーミング経由で PC にアクセスするための決定的な方法です。無料、最高品質、遅延なしです。

12月 2, 2024

—

in ツール

Nvidia GameStream の消滅後、Sunshine は他のデバイスから PC にアクセスしてプレイ…
MIT は、Python をゼロから学ぶためのこの有名なコースをリリースしました。無料でダウンロードできます。

12月 2, 2024

—

in 開発

基本的な知識や料金は必要ありません。コンピューターから自分のペースで受講できます。
PC キーボードの Windows キーは、何年にもわたって信じられないほどの働きをしてきました。これは、Windows キーで許可されるすべての機能のリストです。

12月 2, 2024

—

in ウィンドウズ

Windows のスタートメニューを開くだけでなく、他のキーと組み合わせると「魔法」が実行できます。
Rust とは何か、そしてなぜイーロン・マスクはそれが「汎用 AI」を作成するための言語になると考えているのか

12月 2, 2024

—

in 開発

Rust は、AGI の目標に向かって進むために、Python に比べて一連の利点を提供します。
Microsoft はすべての人に Windows 11 を使用してもらいたい: スープや時代遅れになる PC にもサイクル終了のメッセージを表示

12月 1, 2024

—

in ウィンドウズ

同社は、Windows 10 アップデートの終了が近づいている今、全員が Windows 11 に移行するよう…
スペースバーを押し続けることは YouTube の最高のテクニックの 1 つです: このショートカットの活用方法

12月 1, 2024

—

in ウェブ

YouTube プレーヤーには非常に便利なちょっとしたトリックがあり、この記事で紹介するトリックは無駄ではあり…
Google Chrome に uBlock をインストールできなくなる日が来ました。でも使い続ける方法はある

12月 1, 2024

—

in ブラウザ

新しい標準を採用していない拡張機能の漸進的な排除は避けられないようです…Chrome ブラウザに賭け続ける…
スペースバーを押し続けることは YouTube の最高のテクニックの 1 つです: このショートカットの活用方法

12月 1, 2024

—

in ウェブ

YouTube プレーヤーには非常に便利なちょっとしたトリックがあり、この記事で紹介するトリックは無駄ではあり…
PC キーボードの Windows キーは、何年にもわたって信じられないほどの働きをしてきました。これは、Windows キーで許可されるすべての機能のリストです。

12月 1, 2024

—

in ウィンドウズ

Windows のスタートメニューを開くだけでなく、他のキーと組み合わせると「魔法」が実行できます。
安価な AI の時代に別れを告げる: OpenAI は、最高のチャットボットを使用するのにかかる費用を発表しましたが、すべての予算で使えるわけではありません

11月 30, 2024

—

in AI

ChatGPT Pro は、複雑なタスクに取り組む AI の能力が大幅に進歩したことを示しています…しかし…
「彼らはTikTokで私がレオノール王女であると書いてきました」：これが多くの人に借金を残すこの詐欺の手口です

11月 30, 2024

—

in 安全

偽の王女は、被害者が最初に「料金」を支払うことに同意する限り、お金をあげると申し出ます。
「Indeed の人事部から電話しています。仕事について相談したいことがあります。」この大規模な詐欺に対処できるロビンソンリストは存在しません。

11月 30, 2024

—

in 安全

彼らは繰り返し電話をかけ、電話番号を変更し、私たちが餌を取ると、会話を WhatsApp などのアプリケーショ…
Telefónica に対するハッキングにより、最大 140 万人のユーザーの WiFi キーを抽出することに成功しました。 AEPDは彼に130万ユーロの罰金を科した

11月 30, 2024

—

in 安全

AEPD は、データ処理における重大な過失により侵害が発生したと考えています。