ChatGPTが私たちに浸透して以来、私たちは人工知能と大規模な言語モデルに基づくテクノロジーが包含できる機能をますます認識しています。 GPT-4 は、現存するものの中で最も人気があり完全なものとしての地位を確立しています。しかし、私たちはしばらくの間、他の企業が独自のモデルでこの問題に果敢に立ち向かう様子を見てきました。
Anthropic は、言語モデルで OpenAI に立ち向かうという点で最も近い企業の 1 つです。 OpenAI のベテランによって設立されたこの会社は、 Claude チャットボットに全力を注ぎ、コンテキストの長さ、パフォーマンスなどを改善してしばらくの間拡張を続けてきました。 Claude 2.1 が登場しました。新機能には、最大 200K トークンのコンテキスト ウィンドウが含まれます。
クロードは最高のチャットボットとしての地位を確立したいと考えています
少し前まで、彼らは最大 100K のコンテキスト ウィンドウで私たちを驚かせました。これにより、チャットボットは競合他社よりもはるかに多くの情報を分析して生成できるようになりました。 GPT-4 は解読するのが困難な問題であり、現在は最大 128K のコンテキスト ウィンドウをサポートしていますが、 Anthropic は Claude 2.1 でそれらを再び追い越しています。
コンテキスト ウィンドウが大きいからといって、必ずしもチャットボットがすべてにおいて優れているというわけではないことに注意してください。コンテキスト ウィンドウに関係なく、あるチャットボットが別のチャットボットよりも優れたパフォーマンスを発揮する特定の側面があります。それはすべて、提供する情報、トレーニングに使用されるパラメーターの数、およびそれぞれの言語モデルに存在するアルゴリズムによって異なります。

Claude 2.1 では、200K のコンテキスト ウィンドウに加えて、チャットボットの幻覚が以前のバージョンよりもはるかに少なくなり、最終的には現在のモデルよりもはるかに高い精度を提供するアップデートになることを同社は保証しています。
ただし、Claude 2.1 の新機能はこれだけではありません。また、チャットボットは実験的なツールの使用にも対応します。これにより、ユーザーがモデルの外部に情報を提供できるようになり、クロードがデータを蓄積して処理し、その情報に基づいてアクションを実行したり関数を呼び出したりできるようになります。
この新しい機能は、クロードに、要求された目的を達成するためにチャットボットが適切と判断したツールを使用できる特定のタスクを与えることができるため、新しい可能性を提供し、ユーザーに大きな柔軟性を与えます。
このツールは、早期にアクセスした数名によってすでにテストされており、最大 200K のコンテキスト ウィンドウの互換性は際立っていますが、精度は大幅に低下します。起業家であり AI 専門家である Greg Kamradt 氏によると、 90K のコンテキストを超えると精度が大幅に低下します。
大まかな計算式として、 200K コンテキスト ウィンドウはほぼ 470 ドキュメント ページを意味します。カムラット氏によると、文書の最初と最後に置かれた事実は 100% の精度で記憶され、処理されましたが、彼のテストによると、クロードは文書の最後に置かれた事実の方が、文書の最後に置かれた事実の方が優れたパフォーマンスを示しました。冒頭のもの。
結論を急ぐにはまだ時期尚早ですが、クロードの能力は信じられないほど広範囲に及ぶものの、特定のコンテキスト ウィンドウからは精度が大幅に低下することがすべてを示しています。ただし、ほんの数か月前までは 19 個と 32 個のコンテキスト ウィンドウについて話していたため、これはこの種のテクノロジーにおける大きな進化の進歩を表しています。
詳細情報 | 人間的
