生成人工知能が私たちにもたらした大きな利点の 1 つは、あらゆる種類のテキストを処理および合成する能力であり、電子メール、インターネットで見た記事、さらには科学文書全体の要約を人工知能に依頼できることです。何百ページにも及ぶ。
Ruilei Ma は中国人ジャーナリストで、仕事の中で生成 AI に関連するあらゆる種類のプロジェクトやアプリケーションをカバーする必要があります。 AITechTalk での取材の一環として、特に科学論文の詳細な分析や、なじみのないトピックに関する詳細な調査に関しては、大量の情報を消化する必要があります。
AI にはテキストの要約という非常に優れた機能があります。
彼は約 6 か月前に、HOW2.WORK からすでに数か月前にテストできていた Moonshot AI チャットボットであるKim AI を使い始めました。この人工知能により、このジャーナリストはこの種の文書で提供されるすべての情報を統合することができました。そして、Kimi AI の専門分野の 1 つは、数十万語を含む広範な文書を要約することです。
このジャーナリストが記事のために作成したスクリーンショットでは、彼女が 11,830,000 ワード以上の文書を Kim AI で合成したことが示されています。ただし、このチャットボットには画像を処理する機能がまだありません。これは、 ChatGPT 、 Gemini 、 Copilotなどの多くのアプリケーションで実行できます。
通常、ジャーナリストは次のプロンプトを使用して、数十万語を含む大規模な科学文書を要約します。
文書の内容、研究の背景は何か、実証にはどのような手法が使用されているのか、どのような前向きな進歩があったのか、同様の研究と比較してどのような利点があるのかがまとめられています。一般の人々の生活にどのような影響を与えるのでしょうか?技術的な手法が複雑な場合は、理解を助けるために例え話や比喩を使用してください。
グラフと画像は、研究で議論されているトピックのグラフィックおよび視覚的な証拠であるため、科学文書の重要な部分です。このため、馬如来氏は、画像処理能力を備えたいくつかの中国の人工知能のテストを独自に実施することにしました。画像処理は彼の仕事の基本的な部分だからです。
テストには、Alibaba のTongyi Qianwen 、Baidu のErniebot 、ByteDance のDoubao 、Tencent の Yuanbao の言語モデルが使用されました。これらに加えて、彼女は Anthropic の Claude 3.5 も時々テストしていますが、中国企業のチャットボットを使用するほうが快適であると感じています。そうすることで、いつでもチャットボットを使用できることが保証されます。

画像処理能力をチェックするために彼がこれらすべての言語モデルに与えた最初のテストの 1 つは、成績に応じて平手打ちやキスを受ける子供の漫画を見せることでした。すべての人工知能がこのテストに合格したわけではありませんが、市場に出回っている大多数の人工知能にとってこの演習は非常に簡単であるはずです。
テストでは、Erniebot と Doubao は画像の解釈に失敗しましたが、 Tencent の Yuanbao は最終的に効果的に応答しました。 「テンセント元宝氏は、漫画の中心的な考え方を理解している。平手打ちはその人物が成績に関して期待に応えなかったことを意味し、キスはその人物が期待を上回ったことを意味するというものだ」とジャーナリストは説明した。
人工知能はグラフを含む非常に広範な文書を処理して合成する必要があったため、彼の次のテストはすでにより複雑でした。彼が選んだ文書は、ネイチャー誌に掲載された「大規模な言語モデルを使用した協力行動に関連する性格特性の進化モデル」に関する論文でした。

この記事は、言語モデルを使用して、1,000 世代にわたる社会の発展をシミュレーションすることについてです。ジャーナリストは、使用された言語モデルが記事の核心を見つけられるかどうか、つまり 900 世代あたりでの協力の急速な低下を知りたかったのです。
Tencent の Yuanbao は、回答の正確さだけでなく、AI が文書に含まれる画像やグラフィックを識別して処理できることも考慮して、Rulei Ma 氏の期待に応えることができました。 「ユーザーインターフェイス全体のビジュアルデザインは、読書習慣と非常に一致しています。左側に文書の概要があり、本文と画像を組み合わせて文書を読みます。理解できない場合は、リアルタイムで内容について質問することもできます」と記者は断言した。
Rulei Ma に関しては、 Claude 3.5 は重要なポイントを含めて非常に簡潔な要約を作成しましたが、「特に体系的」ではありませんでした。 「主に文書のいくつかの重要なポイントを要約しています。特に体系的ではありませんが、文字数が少ないので読んだことはあると言わざるを得ません。しかし、それは簡潔すぎます。読み終わったら、もう何もすることがありません。初心者なので理想的ではありません。」
彼はまた、言語モデルを使用してオリンピックを要約しました。ジャーナリストによると、ドウインは他の選手よりも国家問題に焦点を当てていたため、元宝は再び他の選手より際立っていたという。このジャーナリストの経験によると、長い文書を要約するという点では、元宝氏は他の人よりもはるかに優れているようです。彼女にとって、限られた時間内でこれらすべての情報を分析すると精神衛生上の問題が発生する可能性があるため、仕事でこれらのモデルを使用することは不可欠です。
経由 | 中国
