ホームツール OpenAI は Whisper を使用して音声からテキストへの文字起こしに革命を起こしていますが、私たちは引き続き ChatGPT と DALL-E に注目しています。

OpenAI は Whisper を使用して音声からテキストへの文字起こしに革命を起こしていますが、私たちは引き続き ChatGPT と DALL-E に注目しています。

11月 19, 2024

—

1 年前、OpenAI の DevDay イベントの主役は、GPT-4 Turbo とカスタム GPT (およびそれらに対応する「ストア」) の発表でした。これらはメディアの関心とユーザーの注目を集めた目新しさでした…しかし「カバー」、つまり当時受けていたよりもはるかに注目に値することが時間の経過とともに示された新しいAIがありました。

ここで話しているのは、オープンソース AI (ChatGPT や DALL·E とは異なる) である Whisper V3 音声からテキストへの文字起こし AI です。そのため、 Hugging FaceやReplicateなどのプラットフォームやさまざまなデスクトップクライアントを通じて無料でオンラインで使用できます。 (無料のBuzzや有料の WhisperScript クライアントなど)。

前後

つい最近まで、音声をテキストに書き写すことは、ほとんどのユーザーにとって常に課題でした。ユーザーが利用できる無料ツールでは多くのエラーが発生する傾向があったからです。 Whisper V2 は、多くのユーザーを納得させた最初の無料ツールでした…

…しかし、Whisper V3 に関しては、その分野では、100% 無料であるという部分を除いて、ChatGPT と同等であるという感覚を私たちはすでに持っています。ChatGPT は、ソフトウェア開発者がまもなく独自のアプリケーションに実装し始める予定の AI です。

さらに、その多用途性により、単純な文字起こしタスクと音声支援の分野でのより複雑なアプリケーションの両方に最適です。

Whisper V3 は何を提供してくれるのでしょうか?

Whisper V3 は、100 万時間以上のラベル付きオーディオと 400 万時間以上の疑似ラベル付きオーディオを使用してトレーニングされています。以前のバージョンと比較すると、Whisper V3 はエラーを 10 ～ 20% 削減することができました。スペイン語の場合、その誤り率は 5% 未満であり、このモデルで最もよく理解される言語の 1 つとなります。

Whisper V3 の最も注目すべき機能の 1 つは、マルチタスク機能です。複数の言語の認識と翻訳に使用できます。さらに、このモデルは、同じ会話内である言語から別の言語に切り替わったときを自動的に識別できるため、非常に多用途なツールになります。

さらに、OpenAI は、VRAM が 1 GB 未満の小さなバージョンから、15 億 5,000 万のパラメーターと要件でトレーニングされた大規模なモデルまで、さまざまなサイズ (したがってさまざまなパフォーマンスレベル) の Whisper V3 モデルをユーザーが利用できるようにしました。約10GBのVRAM。これにより、Whisper V3 はさまざまなアプリケーションやニーズに適応し、ユーザーに柔軟性を提供できます。

前後

さらに、その多用途性により、単純な文字起こしタスクと音声支援の分野でのより複雑なアプリケーションの両方に最適です。

Whisper V3 は何を提供してくれるのでしょうか?

最新記事一覧

Google が登場する前に私たちはどのようにしてウェブサイトを見つけたのか: インターネットの起源をたどります

11月 29, 2024

—

in ウェブ

私たちは、目的のコンテンツにアクセスするために常に検索ボックスに 2、3 単語を入力することに頼っていたわけで…
ブラックフライデーのセールを見逃した場合は、サイバーマンデーのソフトウェアとオンラインコースの最高のセールをご覧ください。

11月 29, 2024

—

in ツール

ブラックフライデーの後には、ウイルス対策、パスワードマネージャー、VPN、エディターなどが大幅に割引される…
Trinity とは何ですか。財務省をハッキングしてデータを盗んだとされるランサムウェアです。

11月 29, 2024

—

in 安全

Trinity を使用すると、暗号化する前にターゲットファイルをスキャンできます。
Spotify Wrapped 2024 が利用可能になりましたが、他の年のお気に入りの曲をチェックすることもできます。これが必要なものです

11月 29, 2024

—

in ツール

Spotify から、過去数年に最もよく聴いた曲のリストにアクセスすることもできます
PC キーボードの Windows キーは、何年にもわたって信じられないほどの働きをしてきました。これは、Windows キーで許可されるすべての機能のリストです。

11月 29, 2024

—

in ウィンドウズ

Windows のスタートメニューを開くだけでなく、他のキーと組み合わせると「魔法」が実行できます。
Twitch と Kick の間の戦争のさなか、新規ユーザーにお金を与える別のプラットフォームが誕生しましたが、数日後にそのウェブサイトはクラッシュしました

11月 29, 2024

—

in ウェブ

Parti は、ユーザーに「ふさわしいもの」を獲得することを約束する新しいストリーミングプラットフォームです…
財務省からの大規模なデータ漏洩は、私たちを欺く「すべての漏洩の母」となる可能性があります。これが私たちにどのような影響を与えるのか

11月 28, 2024

—

in 安全

何年も熱心に安全に保管しようとしていたすべての情報が、すでに犯罪者の手に渡っている可能性があります。
今年のブラックフライデーにオンラインで購入した後にゴミ箱に捨てる荷物には注意してください。ゴミ箱ダイビングは問題を引き起こす可能性があります

11月 28, 2024

—

in 安全

廃棄された荷物のラベルを破るなどの簡単な措置を講じるだけで、潜在的な詐欺師が私たちの周りを移動したときに大きな…
AI のおかげで、YouTube で動画を「見る」方法があります。動画を視聴するのではありません。

11月 27, 2024

—

in AI

生成 AI によって作成された要約は、プラットフォームのネイティブ機能として著者によって書かれた要約を補完しま…
世界は COBOL 言語に依存しており、COBOL 言語を知っている開発者はほとんどいません。 IBMは解決策があると主張したが、そうではなかった

11月 27, 2024

—

in 開発

IBMは2023年に、COBOLをJavaなどの他の一般的に使用されている言語に変換できる人工知能ツールを発表…
Windows + D は何年も時間を節約してきました。そして、あなたが私と同じなら、それはあなたにも同じことができるでしょう

11月 27, 2024

—

in ウィンドウズ

このキーボードショートカットは、特定の状況、特に操作が面倒な場合に役立ちます。
Windows 11 は改善を続けていますが、Windows 10 を放棄するには十分ではありません。これが最後の飛躍のために私が求めるものです

11月 26, 2024

—

in ウィンドウズ

私も Windows 10 を長年使用しており、変更するのが難しいことは認めますが、Microsoft も W…
世界は COBOL 言語に依存しており、COBOL 言語を知っている開発者はほとんどいません。 IBMは解決策があると主張したが、そうではなかった

11月 26, 2024

—

in 開発

IBMは2023年に、COBOLをJavaなどの他の一般的に使用されている言語に変換できる人工知能ツールを発表…
政府もこのブラックフライデーに向けてアドバイスを提供しています。サイバー詐欺に対処するための 10 のヒントは次のとおりです。

11月 26, 2024

—

in 安全

「何かが真実であるには良すぎるなら、それは真実ではないかもしれない」とはゲンベタでよく言われることですが、この…
AIロボットが他人に「仕事を辞めて」「家に帰れ」と説得する瞬間を監視カメラが捉えた

11月 26, 2024

—

in AI

これらのロボットは上海のショールームに所属しており、そのやりとりは中国のソーシャルネットワークで急速に広まり、…
AI が職場の全員に取って代わる可能性は低いです。ソフトウェア開発者は影響を受ける

11月 26, 2024

—

in 開発

「ソフトウェア開発に必要なスキルの技術的で反復的な性質が、AI の強みに影響を及ぼします。」
毎日 Windows で「コンピューター」を検索して時間を無駄にしています。この直接ショートカットの存在をいつも忘れてしまう

11月 26, 2024

—

in ウィンドウズ

これはシステムの非常に便利なコーナーなので、できるだけ早くアクセスできるようにしておくことをお勧めします。
デビッド・ブレイ氏、テレワーク専門家: そうならないためのテクノロジーがあるのに、なぜ親と同じ時間働く必要があるのか

11月 26, 2024

—

in ツール

「労働者がさらなる柔軟性を求める一方で、中間職や管理職がその逆を選んでいることは明らかです。それが労使関係の崩…
私は何年もの間、偽のブラックフライデーのオファーを騙してきました。今年はなんとか状況を変えることができました

11月 26, 2024

—

in ウェブ

当社では、価格履歴を表示し、価格変更の通知を受け取るために自由に使える複数のツール、Web サイト、拡張機能を…
ブラックフライデー中のソフトウェアとコースの最高のオファー

11月 25, 2024

—

in ツール

ブラックフライデーには、ウイルス対策、パスワードマネージャー、VPN、エディターなどが大幅に割引されます。…
NordVPN はブラックフライデーに向けて VPN とパスワードマネージャーを再び魅力的な価格で値下げします: これが計画の様子です

11月 25, 2024

—

in ウェブ

同社はすべてのプランを大幅に割引し、VPN サービス、パスワードマネージャー、マルウェア保護などを入手する良…
このような Netflix SMS があなたのアカウントが今日停止されることを知らせる場合は信用しないでください。彼らはあなたのクレジットカードを狙っています。

11月 25, 2024

—

in 安全

リンクをクリックする前に、公式 Web サイト/アプリにアクセスし、アクセス権があることを確認してください (…
Microsoft は Windows 98 を USB デバイスに適合させるために「USB カートオブデス」を使用しました。これは数秒で PC を「焼き付ける」ことができました

11月 25, 2024

—

in ウィンドウズ

死のカートは Windows エンジニアにとってジョークの源だった
大学はオフィスに戻る上司と矛盾している: 労働者は一緒にいなくても非常にうまく共同作業できる

11月 24, 2024

—

in ツール

この調査にはリモートワークの経験を持つ 500 人以上のテレワーカーが参加しており、主な結論の 1 つは心理的…
今年のブラックフライデーはサイバー詐欺に注意してください (そして、被害を避けるために次のヒントに従ってください)

11月 24, 2024

—

in 安全

そして、「サイバーマンデー」は 12 月 2 日月曜日に到来することに注意してください。
彼らはあなたの不注意につけ込みます。このユーザーは、知らないうちに 4 年間オンラインサブスクリプションの料金を支払っていました。数百ユーロを失った

11月 24, 2024

—

in 安全

「私は過去を振り返ってみると、彼らが毎月初めにそれを宗教的に私に与えていたことが4年間続いていたことがわかりま…
彼らは人工知能で作られた手紙で彼を解雇した。裁判官にとって、それは「提示不可能」であり、容認できないと宣言した

11月 24, 2024

—

in AI

同社はアクティビティを変更するのを忘れ、インターネットからコピーして貼り付けたモデルをそのまま残しました。
彼はパスワードがわからなかったため、数百万ユーロのビットコインをUSBに閉じ込めたまま何年も過ごした。それを取り出すには3つの選択肢がありました

11月 23, 2024

—

in 安全

この男性は、提示されたあらゆる選択肢を理由に、解決策を提供する専門会社の援助さえ拒否しました。
Windows 10 および 11 では、PC 内に別の PC があり、最も安全な方法でアプリケーションを実行します: Windows サンドボックスの使用方法

11月 22, 2024

—

in ウィンドウズ

「サンドボックス」とは文字通り「砂場」を意味します。そして実際、Windows インストールの何かを壊すことを…
JavaScript は AI アプリケーションの開発に役立ちます。例を次に示します。すべてが Python であるわけではありません

11月 22, 2024

—

in 開発

JavaScript を使用して人工知能を開発する際の用途、制限、利用可能なツールを確認します。