過去数時間で、lmsys.org ( AI モデルを評価および比較するための有名なプラットフォーム) は、人工知能の専門家や愛好家の注目を集めている予期せぬ新しさを発表しました。それは、「gpt2-chatbot」と呼ばれるモデルです。
GPT-2 のバージョン(ChatGPT が現在すでに GPT-4 を使用していることを考えると、かなり時代遅れ) を思わせる名前にもかかわらず、証拠は実際には、それがはるかに高度な実験版、おそらく GPT である可能性があることを示唆しています。 -4.5またはGPT-5 。
そして、想定されている「gpt2-chatbot」は、 GPT-2 の反復で期待されていたものをはるかに超える機能を実証しました。 LMSYS ユーザーによると、このモデルは推論と言語理解のレベルが示されており、 GPT-4 よりも向上している可能性さえあります。
さらに、すでに確立されている他のモデルにとっては「頭痛の種」となる驚くべき成功の質問にも対応します。
秘密実験の疑い
LMSYS やその他の情報源にはこのモデルに関する公式情報がなく、OpenAI による秘密テストである可能性があるという理論が高まっています。
同社は、この個別のリリースを次の目的で使用している可能性があります。最新世代のモデルをその存在を明らかにすることなく、公平な環境で評価し、より自然な応答を取得し、以前の期待や競争の影響を回避します。
さらに、問題のモデルは OpenAI の「tiktoken」トークナイザーを使用しており、Claude、Llama、Gemini などの他の競合モデルで使用される特別なトークンに対して耐性を示しています…これは、OpenAI 標準に高度に適合した特定の設計を示唆しています。
さらに、AI モデル自体についてよく尋ねると、それは「OpenAI の ChatGPT」であると主張します。ただし、これは OpenAI からの合成データの使用と、実際に調べているという事実の両方が原因である可能性があります。新しいAIモデル。
さらに、ユーザーあたりの 1 日のインタラクション制限 (具体的には 8) があり、GPT-4 などの他のモデルよりも著しく低く、これは優れた計算能力と、より制御されたインタラクション モードでの評価の好みの両方を示している可能性があります。
テスト方法は?
- LMSYS に接続し、 「ダイレクト チャット」にアクセスして、問題のモデルを選択します。

- プロンプトを書き始めます。私たちは「リンゴテスト」を試してみたかったのです。完全な成功:

