OpenAI は、単に「o1」という洗礼名を付けられた待望の新モデルを発表しましたが、口語的には「ストロベリー モデル」としてもすでに知られていました。そして彼は、高度な推論能力を示し、前任者よりも複雑な問題に取り組むことを約束して到着しました。
実際、このモデルは、人間のような思考プロセスをシミュレートするように訓練された新しい人工知能モデル シリーズの最初のものであり、大規模言語モデル (LLM) の進化における重要なマイルストーンを構成します。
o1 モデルは何を提供しますか?
GPT-4oなどの前任者とは異なり、o1 は強化学習に基づく革新的なアプローチを使用してトレーニングされています。強化学習とは、システムがそのアクションに対する報酬とペナルティを受け取ることによって問題を解決する方法を学習する手法です。
OpenAI 研究者の Noam Brown 氏によると、o1 が他のモデルと異なるのは、応答する前に「考える」能力であるとのことです。 「思考チェーン」と呼ばれるこの推論プロセスを使用すると、解決策に到達するための中間ステップをシミュレートしながら、複雑なクエリをより効果的に処理できます。
このおかげで、プログラミングや高度な数学タスクなど、より複雑な問題を、以前のものよりもかなり高い精度で解決する能力を備えています…
…OpenAI が実施したテストでは、o1 は国際数学オリンピックの予選試験で出題された問題の 83% を解決できる能力を実証しましたが、GPT-4o は 13% を達成しました。
さらに、Codeforces などのプログラミング コンテストでは、o1 は参加者の 89 パーセンタイルにランクされ、技術的なタスクにおける熟練度が再確認されました。

OpenAI のリサーチ ディレクターである Bob McGrew 氏は、「o1」は高度な物理学や化学の試験など、深い推論を必要とするクエリを処理するために特別に設計されていることを強調しました。マクグルー氏(覚えておいてください、彼は訓練を受けた数学者です)によれば、
「このモデルは私が AP の数学試験を解くよりも優れています。」
制限と課題
o1 モデルが提供する大幅な進歩にもかかわらず、制限がないわけではありません。まず、GPT-4o と比較すると、o1 は高価で遅いです…したがって、深い推論を必要としないタスクでは、GPT-4o は依然として高速でコスト効率の高いオプションです。
開発者にとってのコストはかなりのものです。「o1-preview」の費用は入力トークン 100 万あたり 15 ドル、出力トークン 100 万あたり 60 ドルですが、「GPT-4o」の価格はそれぞれ 5 ドルと 15 ドルです。
ChatGPT は初期のモデルであるため、インターネット上の情報を検索したり、ファイルや画像をアップロードしたりするなど、ChatGPT を便利にする機能の多くはまだ備えていません。また、ツールの使用、関数呼び出し、ストリーミング、カスタム システム メッセージのサポートなど、 API の重要な機能も欠如しています。
ノーム・ブラウン氏はまた、「o1」モデルは完璧ではなく、「三目並べ」ゲームを解くときなど、一見単純なタスクで依然としてエラーが発生することを指摘しました。
さらに、このモデルにより、いわゆる「幻覚」(言語モデルによって生成される誤った応答)の発生率は減少しましたが、OpenAI はこの問題を完全に排除したわけではないことを認めています。
OpenAI の最終目標は、質問に答えるだけでなく、ユーザーに代わって独立したアクションを実行する自律エージェントを作成することです。 「o1」はまだ完全なエージェントとして機能する準備ができていませんが、それが示す推論能力は、その目標に向けた重要なステップとなります。
経由 | OpenAI
