昨日、OpenAI は予期せず、私たちが GPT シリーズで使用していたものよりもはるかに高度な新しい言語モデル シリーズを発表しました。 「o1」と名付けられたこのプログラムは、より優れた「推論能力」を獲得しながら、より困難で高度な問題に取り組むことが約束されています。
同社のアイデアは人間の思考プロセスをシミュレートすることであり、他の言語モデルと比較して大きな進歩をもたらします。 Google、Meta、およびその企業は、言語モデルに関して危険なほど接近しており、OpenAI は、生成人工知能技術の最前線にあり続けることを実証するために再び後押しを与えました。
10 分でアプリから 1 分以内で 3D ゲームまで
この新しい言語モデルの「プレビュー」バージョンはすでに一部のユーザーによってテストされており、インターネット上でこの言語モデルがどのような機能を備えているかを示す例がいくつか見られました。イレブンラボ ( 非常にリアルな方法で自分の声を複製できるツール) のデザイン責任者であるアンマール・レシのような人々が私たちに示してくれたように、o1 は真のプログラミングの天才です。
Reshi が共有した例では、彼がわずか 10 分で iOS 用の完全なアプリケーションを開発した様子がわかります。これを行うために必要なのは、o1 と、生成 AI と連携して動作するように設計された IDE である Cursor Composer だけです。
彼がデザインしたアプリは天気情報を取得するアプリで、シンプルですがアニメーションがありとてもきれいです。彼は当初 o1-mini を使用してプロジェクトを開始しましたが、その後、すべてのコードを完成させるためにより大きなバージョンに移行しました。
彼が o1 で数分で開発できたのはこれだけではありませんでした。そして Reshi は、ゲーム Snake の代替バージョンを 3D で開発することも決定しました。ゲームをコンパイルする準備が整うまでに 1 分しかかからなかったので、これはさらにクレイジーです。これを行うにはプロンプトのみが必要で、o1 はすべてのコードとそれを機能させるために必要な手順を示す責任がありました。この場合、彼はReplitオンライン IDE を使用してゲームをコンパイルしました。
これらは、「より深い推論」を必要とするタスクを実行する際に、o1 が大幅に高速かつ効率的であることを示すほんの数例です。プログラミングでは、このツールはさらに多くの可能性を示しており、この瞬間から多くの開発者が考慮するツールになることは明らかです。
新しい o1 モデルは、システムがそのアクションに対する報酬とペナルティを受け取ることで問題を解決する方法を学習する「強化学習」手法を使用してトレーニングされています。 OpenAI 研究者の Noam Brown 氏によると、o1 が他のモデルと異なるのは、応答する前に「考える」能力であるとのことです。 OpenAI が実施したテストでは、o1 は国際数学オリンピックの予選試験で出題された問題の 83% を解決できる能力を実証しましたが、GPT-4o は 13% を達成しました。
タスクに深い推論が必要ない場合、o1 は GPT-4o よりも遅くなることに注意してください。さらに、100 万トークンあたりの開発者のコストは大幅に高くなります。「o1-preview」のコストは入力トークン 100 万あたり 15 ドル、出力トークン 100 万あたり 60 ドルですが、「GPT-4o」の価格はそれぞれ 5 ドルと 15 ドルです。
o1-preview および o1-mini モデルは、ChatGPT Plus および Team ユーザーが利用できるようになりました。このモデルが最終的に残りのユーザーに提供されるかどうかについてはまだ情報がないため、詳細が判明するまで待つ必要があります。


