OpenAIが新たなAIモデル「o3」を発表
2024年12月20日、OpenAIは新たなAIモデル「o3」と「o3-mini」を発表しました。o1の推論能力の高さに未だに驚かされる日々の中、正直この発表は非常に興奮しています。以下では、この発表内容を分かる範囲でまとめてみました。
発表の背景
- OpenAIのモデルは、その機能向上がメインポイントです。
- o3は、それまでのモデルから大きく進化しており、GoogleのGemini 2.0などの他社モデルにも対抗しています。
- 「熟考的整合性」と呼ばれる技術を新たに導入し、モデルの安全性や適切な調和性を向上させました。この技術は、AIが複雑な問題に対して熟慮的かつ整合的に応答する能力を強化します。具体的には、不適切な動作を低減しつつ、倫理的ガイドラインやユーザーの意図に沿った応答を提供することを可能にします。
o3の特徴
優れた問題解決能力
このモデルは、主に次の分野で優れた性能を発揮します。
- 科学研究
- コーディングとソフトウェア開発
- 数学に関わる解法能力
パフォーマンスデータ
以下の図表は、o3の性能を具体的に示したものです。ソフトウェア開発および競技プログラミング分野における主な指標を視覚的に確認できます。このデータは、OpenAIの公式発表に基づいています。
※公式youtubeより抜粋
- ソフトウェア開発(SWE-bench Verified)
o3は正確性が71.7%と、前バージョンの48.9%(o1正式版)を大きく上回り、ソフトウェアタスクにおける正確な判断を可能にします。 - 競技プログラミング(Codeforces)
Eloスコアが2727に達し、前バージョンの1891(o1正式版)をはるかに凌駕しています。この結果は、複雑なコード問題を効率的かつ正確に解決できる能力を示しています。
Eloスコアとは?
Eloスコアは、プレイヤーやAIの能力を数値化する評価方法で、特に競技プログラミングやチェスなどで使用されます。スコアが高いほど、競技相手に対する相対的な強さを示します。o3が記録した2727というスコアは、非常に高度なパフォーマンスを意味しています。
o3の公開スケジュール
外部研究者の参加申請
- 申請期限: 2025年1月10日
- 必要情報:
- 研究者としてのプロフィール: 氏名、専門分野、これまでの研究実績を含む詳細な経歴。
- 研究目的: o3モデルを使用して取り組みたい研究テーマや目的を具体的に記載。
- 所属機関: 所属する大学、研究所、または企業の名称と連絡先。
- 利用計画: モデルをどのように活用するか、具体的なアプローチや期待される成果。
申請はOpenAIの公式ウェブサイトを通じて行われます。専用の申請フォームに必要情報を記入し、提出してください。審査には数週間かかる場合があるようなので、早めの申請を推奨します。
予定公開日
- 簡易版「o3-mini」: 2025年1月末
- フルバージョン「o3」: その後
おわりに
OpenAIの新たな言語モデル「o3」は、世界のイノベーションを制する成果を広げ、コンテンツ作りの路線を大きく変えていくことが期待されます。モデルの使用は、科学、研究、ビジネスにおけるブレークスルーとなることを目指しているとのことです。私は研究者ではないので今触れることは出来なさそうですが、今後のリリースを楽しみに待ちつつ、まずはo1を使い倒しておこうと思います。