OpenAI o3
開発元 | OpenAI |
---|---|
初版 | 2024年12月20日 |
前身 | OpenAI o1 |
種別 | GPT (言語モデル) |
公式サイト | https://openai.com/12-days/ |
OpenAI o3は、OpenAIによってOpenAI o1モデルの後継として開発されたGPTモデルである[1][2]。段階的な論理的推論を必要とする質問に対処する際に、追加の熟考時間を割くように設計されている[1]。
歴史
[編集]OpenAI o3モデルは、2024年12月20日に発表された[1]。「o3」という名称は、O2という既存のイギリスの携帯電話会社との商標上の問題を回避するために採用された[1]。このモデルは、o3とo3-miniの2つのバージョンで提供されている[1]。2025年1月10日までは、招待ベースのテストプログラムを通じて、安全性とセキュリティの研究者にアクセスが提供される[1]。OpenAIは、2025年1月にo1-miniを一般公開する予定である[3]。
機能
[編集]o3は、コーディング、数学、科学などの複雑なタスクにおいて、o1モデルよりも優れたパフォーマンスを示す[1]。難解な数学的および論理的問題を処理するAIの能力を評価するARC-AGIベンチマークでは、o3はo1の3倍の精度を達成している[1]。
New Scientistの報道によると、o3はGoogleのソフトウェアエンジニアであるFrançois Cholletによって開発された権威あるAI推論テストである抽象化と推論コーパス(ARC)で、過去最高の75.7%のスコアを獲得したが[4]、85%の精度を必要とする「グランドプライズ」(人間レベルの成績とされる)の要件はまだ満たしていない[4]。テストによって課せられる計算コストの要件がなければ、モデルは87.5%の新記録を達成し[4]、人間の平均スコア84%を超えた[4]。
TechCrunchによると、強化学習を用いて、OpenAIがプライベートCoTと呼ぶものを使用して、応答する前に時間をかけて考えることをo3に教え込んだ[5]。伝えられるところによると、o3は事前に計画を立て、タスクを通して推論し、問題解決を支援するために長期間にわたって一連のアクションを実行できるが[5]、TechCrunchは、これにより応答のレイテンシが増加すると報告している[5]。
脚注
[編集]- ^ a b c d e f g h Knight, Will. “OpenAI Upgrades Its Smartest AI Model With Improved Reasoning Skills”. 2024年12月22日閲覧。
- ^ https://www.nytimes.com/2024/12/20/technology/openai-new-ai-math-science.html
- ^ https://arstechnica.com/information-technology/2024/12/openai-announces-o3-and-o3-mini-its-next-simulated-reasoning-models/
- ^ a b c d Hsu, Jeremy. “OpenAI's o3 model aced a test of AI reasoning – but it's still not AGI” (英語). New Scientist. 2024年12月22日閲覧。
- ^ a b c Wiggers, Maxwell Zeff, Kyle (2024年12月20日). “OpenAI announces new o3 models” (英語). TechCrunch. 2024年12月22日閲覧。