果然是o1和ChatGPT Pro。
OpenAI仅花了15分钟就结束了圣诞季发布会的首秀。昨天他们发推表示要连续12天的集中新品发布,看似“大的来了”。
但在15分钟首秀过后,有人调侃奥特曼将短剧模式玩明白了,把两小时发布会切成了12段。
这次发布的o1正式版但并没有超出行业预期——此前接近OpenAI人员就向The Verge透露,发布会新品包括文生视频期货Sora和新的推理模型。
然而,o1对行业的意义也已经逐渐凸显——成为在传统Scaling Law遇到瓶颈后一种新的scale技术路径,国内玩家也在这条路径上积极投入。
而从售价翻倍、高达200 美元一月的ChatGPT Pro,不难看出OpenAI的商业化野心——OpenAI首席商务官Lionetti表示,OpenAI今年的目标是实现近 40 亿美元的收入,其中绝大部分销售额来自为 ChatGPT 的高级功能付费的个人消费者。
或许可以说,奥特曼也没有太多其他选择。据此前未披露的内部财务数据估算和相关人士的分析,OpenAI今年可能亏损高达50亿美元。
01新的里程碑?
Lionetti表示,OpenAI 将o1视为一个“里程碑”,它已经打开了新的市场。
o1使用强化学习技术训练模型自行解决问题,该技术通过奖励和惩罚来教导系统。然后,它使用“思路链”来处理查询,类似于人类通过逐步思考来处理问题的方式。
相较于之前的o1-preview,新模型在速度、性能和准确性上均有显著提升。据奥特曼介绍,o1模型在编码、数学和科学写作等方面表现更为出色,特别是在处理复杂问题时,其响应速度提高了约50%,错误率减少了34%。
OpenAI 推出 o1-preview 后,谷歌也加大了推理力度。谷歌已将其推理模型团队规模从 o1-preview 发布前的几十人扩大到 200 人左右。据一位知情人士透露,谷歌还为该团队提供了更多计算资源。
在国内,Kimi、昆仑万维、deepseek也上线了o1路线的推理模型。
11 月 16 日,月之暗面发布了数学模型K0-math,根据其公布的基准测试:K0-math可对标OpenAI o1中可公开使用的两个模型:o1-mini和o1-preview。
11 月 20 日,Deepseek的DeepSeek-R1-Lite正式上线。与OpenAI的o1模型相比,R1-Lite模型将完全公开其复杂的思考路径。根据Deepseek官方的说法,R1-Lite能够处理的思维链长度可达到数万字之多。
11月27日,昆仑万维正式推出具有复杂思考推理能力的系列模型——「天工大模型4.0」 o1版。
“o1路线所代表的深度推理模型,其实之前国内各家AI公司都有尝试,但并没有做得很深,”某互联网大厂产品经理表示:“而OpenAI的o1发布后,大家才坚信这个事情是值得做的,投入会比前期要更坚决一些。”
大家押注o1另一重要原因也在于,此前Scaling Law的路线已经走到了瓶颈,GPT5也迟迟未发。
智谱CEO张鹏认为,虽然“Scaling Law确实不再涨了”,但仍在Agent、多模态、强化学习、扩散模型等不同方向上存在新场景、算法的scale可能。
o1所代表的强化学习路线,就是这些可能性中的一条重要路线。
02如何落地?
但o1落地场景仍然还需要更多探索尝试,并且局限依然存在。比如,模型也会因为过度思考,而在简单问题上花费多余的步骤。
然而,在数学、生物、物理等科研领域,o1的潜力正在逐步显现。相较于陪聊、普通问答等场景,让AI去攻克哥德巴赫猜想等人类难题,或许才是不断提升AI上限的正确打开方式。
据The Information报道,劳伦斯利弗莫尔国家实验室的研究人员,已经使用o1模型来解决博士级的问题。
该实验室位于加利福尼亚州利弗莫尔,其研究重点是使用高功率激光照射小型燃料胶囊,以在核聚变反应中产生能量。据参与实验的一位人士称,在一个案例中,研究人员使用 OpenAI 的o1-preview,来计算在一定强度的激光作用下胶囊的温度和压力,并询问需要多强的激光才能达到一定的温度和压力。
OpenAI 推理模型通常需要 10 到 60 秒来回答这些问题。该人士表示,这可以为研究人员节省 30 分钟到几个小时或几天的时间。
而在这次的发布会上,Jason Wei也演示了o1在生物科学领域的应用,让o1找出符合标准的蛋白质。对于这个o1-preview无法回答的问题,o1正式版在53秒后便给出了正确答案。
OpenAI首席商务官Lionetti也强调了o1模型在法律、编程、医疗保健和制造业的应用场景。例如,在法律领域,它有助于对条款清单、文档分析、多步骤审批流程进行法律或数学计算。他表示,该公司还向医疗保健公司出售 o1,这些公司使用它来为医疗索赔定价、分析临床指南和分析复杂数据集。它关注的另一个市场是制造业,OpenAI 表示,o1 可以分析和加速工业流程。
这些场景也让OpenAI看到了商业化的更多可能性。
因此,OpenAI推出了价格更高的ChatGPT Pro订阅服务,这是一个每月收费200美元的新套餐,用户可以无限制地使用OpenAI的o1、GPT-4o以及高级语音模式。此外,Pro订阅还特别提供了一个仅供Pro用户使用的o1版本,这个版本被称为o1 Pro模式,它通过增加计算资源来优化对复杂问题的处理,以提供更优质的答案。
虽然相较此前每月 20 美元的 Plus 套餐,Pro定价更为高昂,但这对于刚刚宣布周活用户高达3亿的OpenAI,仍然存在很大的付费转化空间。
更为重要的是,ChatGPT目前付费版本的可能增长速度,不足以弥补运营该服务的高昂成本——据此前未披露的内部财务数据和参与该业务的人士的分析,OpenAI今年可能亏损高达50亿美元。
这种情况下,要达到40亿美元年收入的小目标,OpenAI似乎没有太多选择。
Hi,IamStephanieLi.ThankyouforjoiningthisepisodeofCBNspecial. The2024U
新近发布的《中国城市运营指数报告(2024)》指出,2024年,中国土地财政风险城市增加,城市运营路径转换遇挑战;金融活水如何正确浇灌实体经
随着年末购车旺季的到来,新能源汽车市场再次迎来销售高峰。近年来,新能源汽车行业飞速发展,特别是在30万元左右的价格区间内,竞争尤为激烈。其中
统计显示,深证100指数ETF今日合计成交额3.28亿元,环比上一交易日增加1.75亿元,环比增幅为114.66%。 具体来看,易方达深证
12月3日为“国际残疾人日”,淘宝携手中国残联就业服务平台、阿里巴巴公益共同发起淘宝「见宝行动」。通过社媒平台传播、整合商家资源、提供专属工
2024年11月30日,在北京方恒时尚中心B座B1报告厅,成功举办了1024ShowMe扣子智能挑战赛·大消费行业专场活动。此次活动由扣子携
随着科技的飞速发展,人工智能(AI)正以前所未有的速度改变着我们的生活和工作方式。从智能家居到自动驾驶,从医疗诊断到金融分析,AI的身影无处
随着冬季到来,近期从北向南各地雪场陆续“开板”,标志着冰雪旅游旺季的正式开启。在大型赛事的推动、政策的有力支持以及基础设施的不断完善下,冰雪
近日,中国半导体行业协会及其他行业协会对美国新一轮对华出口限制措施表示严重关切和坚决反对。2024年12月2日,美国政府宣布将140余家中国
乳制品作为典型的药食同源代表,出现在诸多中医典籍中。唐代孙思邈在《千金药方》第26卷食治中记载:“乳、酪、酥等常食之,令人有筋力、胆干,肌体
先驱网--综合性的生活资讯平台
邮箱:hchchc0324@163.com