ホーム インターネット マイクロソフトの AI は人間と同じように音声を認識できるようになりました

マイクロソフトの AI は人間と同じように音声を認識できるようになりました

Microsoftの音声認識エンジンは人間と同じくらい音声を認識できるようになったと同社は主張している。
マイクロソフトの AI は人間と同じように音声を認識できるようになりました
テクノロジー大手は、デジタルアシスタント Cortana などの製品で使用される音声転写システムの開発に取り組んでおり、「人間同等性」、つまり AI が本物の人間と同じ誤り率で音声を解釈できる点を達成することを目標としています。 。
「本日、当社の研究チームが当社の音声認識システムでエラー率 5.1% を達成したことを発表できてうれしく思います。これは業界の新たなマイルストーンであり、昨年達成した精度を大幅に上回っています」と Microsoft テクニカルフェローの Xuedong Huang 氏はブログ投稿で書いています。 。
「人間と同等の精度で人間と同等の精度を達成することが、過去 25 年間の研究目標でした。 Microsoft の長期的な研究への投資意欲は、現在、Cortana、Presentation Translator、Microsoft Cognitive Services などの製品やサービスでお客様に利益をもたらしています。私たちの研究チームが毎日何百万人もの人々に私たちの研究を利用してもらえることを大変うれしく思っています。」
関連項目を参照
同社は以前、ヒューマンエラー率を 5.9% と測定していましたが、その後の IBM のライバル研究者による調査では、ヒューマンエラー率が 5.1% とさらに高く、自社システムでは 5.5% を達成しました。
どちらのシステムも、音声研究技術者が文字起こしシステムの能力を測定するために 20 年以上にわたって使用してきた、録音された電話会話のデータセットである Switchboard corpus に対してベンチマークされています。Huang 氏によると、Microsoft は 12% の増加に相当するこのマイルストーンをなんとか達成することができましたこれは、システムが使用するニューラル ネット ベースの言語モデルと音響モデルを変更することによって、また会話の履歴全体を使用して、システムがコンテキストを使用して次の単語が何である可能性が高いかを予測できるようにすることによって、昨年のシステムのパフォーマンスを上回るものでした。
Microsoft の音声認識研究の次の焦点は、騒がしい環境でのアクセントのある音声、方言、会話を認識するシステムの能力を向上させることです。同社はまた、音声の背後にある意味や意図を理解する能力の向上にも取り組む予定で、「音声の認識から理解への移行は、音声技術の次の主要なフロンティアである」と述べている。
画像: S_Keller/Pixabay

「マイクロソフトの AI は人間と同じように音声を認識できるようになりました」に関するベスト動画選定!

一時的なチャットモード登場!ChatGPTの新機能
AI で変わる Microsoft 365、Dynamics 365、Bing の未来【アーカイブ配信】
Microsoftの音声認識エンジンは人間と同じくらい音声を認識できるようになったと同社は主張している。
マイクロソフトの AI は人間と同じように音声を認識できるようになりました
テクノロジー大手は、デジタルアシスタント Cortana などの製品で使用される音声転写システムの開発に取り組んでおり、「人間同等性」、つまり AI が本物の人間と同じ誤り率で音声を解釈できる点を達成することを目標としています。 。
「本日、当社の研究チームが当社の音声認識システムでエラー率 5.1% を達成したことを発表できてうれしく思います。これは業界の新たなマイルストーンであり、昨年達成した精度を大幅に上回っています」と Microsoft テクニカルフェローの Xuedong Huang 氏はブログ投稿で書いています。 。
「人間と同等の精度で人間と同等の精度を達成することが、過去 25 年間の研究目標でした。 Microsoft の長期的な研究への投資意欲は、現在、Cortana、Presentation Translator、Microsoft Cognitive Services などの製品やサービスでお客様に利益をもたらしています。私たちの研究チームが毎日何百万人もの人々に私たちの研究を利用してもらえることを大変うれしく思っています。」
関連項目を参照
同社は以前、ヒューマンエラー率を 5.9% と測定していましたが、その後の IBM のライバル研究者による調査では、ヒューマンエラー率が 5.1% とさらに高く、自社システムでは 5.5% を達成しました。
どちらのシステムも、音声研究技術者が文字起こしシステムの能力を測定するために 20 年以上にわたって使用してきた、録音された電話会話のデータセットである Switchboard corpus に対してベンチマークされています。Huang 氏によると、Microsoft は 12% の増加に相当するこのマイルストーンをなんとか達成することができましたこれは、システムが使用するニューラル ネット ベースの言語モデルと音響モデルを変更することによって、また会話の履歴全体を使用して、システムがコンテキストを使用して次の単語が何である可能性が高いかを予測できるようにすることによって、昨年のシステムのパフォーマンスを上回るものでした。
Microsoft の音声認識研究の次の焦点は、騒がしい環境でのアクセントのある音声、方言、会話を認識するシステムの能力を向上させることです。同社はまた、音声の背後にある意味や意図を理解する能力の向上にも取り組む予定で、「音声の認識から理解への移行は、音声技術の次の主要なフロンティアである」と述べている。
画像: S_Keller/Pixabay

「マイクロソフトの AI は人間と同じように音声を認識できるようになりました」に関するベスト動画選定!

一時的なチャットモード登場!ChatGPTの新機能
AI で変わる Microsoft 365、Dynamics 365、Bing の未来【アーカイブ配信】

最新記事一覧