分享
9🈷️13日
输入“/”快速插入内容
9🈷️13日
飞书用户2749
2024年9月13日修改
•
《
「草莓」实测:可能只是工程 Trick,且有扣费陷阱!
》OpenAI 新发布的「草莓」模型(o1 系列)在 STEM(理工科)领域进行了特别优化,在回答之前会进行思考,在物理、生物和化学问题(GPOA)的基准测试中超越了人类博士水平的准确性,但是存在多个问题和高额的计费陷阱。虽然在某些领域超越了 GPT-40,但整体效果和特性远低于预期,且支持多种功能,输出限制明显。模型的推理过程消耗大量 tokens,可能导致用户费用飙升。
《
OPENAI新模型9.12发布:OpenAI o1-Jake整理
》
模型亮点:
1.
更聪明的思考方式:这些模型像人一样,会花更多时间思考问题,尝试不同的策略,甚至能意识到自己的错误。
2.
在复杂任务上表现出色:在物理、化学、生物、数学和编程等领域的挑战性任务上,新模型表现得像博士生一样好,甚至在 IMO 和 Codeforces 竞赛中取得了高分。
3.
暂时缺少一些功能:虽然目前还没有 ChatGPT 那样的网络浏览和文件上传功能,但在复杂推理任务上,OpenAI O1 已经非常强大了。
4.
AI 能力的新高度:这个新系列代表了 AI 能力的一个新水平,所以我们把它命名为 OpenAI O1。
•
《
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
》大模型领域的技术发展,今天起再次「从 1 开始」了。北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。
参考内容:
https://openai.com/index/introducing-openai-o1-preview/
https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/
https://openai.com/index/learning-to-reason-with-llms/
https://x.com/sama/status/1834283100639297910