9🈷️13日

飞书用户2749

2024年9月13日修改

•
《​「草莓」实测：可能只是工程 Trick，且有扣费陷阱！》OpenAI 新发布的「草莓」模型(o1 系列)在 STEM(理工科)领域进行了特别优化，在回答之前会进行思考，在物理、生物和化学问题(GPOA)的基准测试中超越了人类博士水平的准确性，但是存在多个问题和高额的计费陷阱。虽然在某些领域超越了 GPT-40，但整体效果和特性远低于预期，且支持多种功能，输出限制明显。模型的推理过程消耗大量 tokens，可能导致用户费用飙升。​

common.docs_name - LarkCCM_Docs_Menu_Image

《OPENAI新模型9.12发布：OpenAI o1-Jake整理》

模型亮点：

1.
更聪明的思考方式：这些模型像人一样，会花更多时间思考问题，尝试不同的策略，甚至能意识到自己的错误。​

2.
在复杂任务上表现出色：在物理、化学、生物、数学和编程等领域的挑战性任务上，新模型表现得像博士生一样好，甚至在 IMO 和 Codeforces 竞赛中取得了高分。​

3.
暂时缺少一些功能：虽然目前还没有 ChatGPT 那样的网络浏览和文件上传功能，但在复杂推理任务上，OpenAI O1 已经非常强大了。​

4.
AI 能力的新高度：这个新系列代表了 AI 能力的一个新水平，所以我们把它命名为 OpenAI O1。​

•
《​刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理极限》大模型领域的技术发展，今天起再次「从 1 开始」了。北京时间 9 月 13 日午夜，OpenAI 正式公开一系列全新 AI 大模型，旨在专门解决难题。这是一个重大突破，新模型可以实现复杂推理，一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。​

参考内容：

https://openai.com/index/introducing-openai-o1-preview/

https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/

https://openai.com/index/learning-to-reason-with-llms/

https://x.com/sama/status/1834283100639297910

9🈷️13日​

9🈷️13日