Category: 随记

47 Posts

新加坡五日:City in Nature
一月中旬,我们一行二十余人来到新加坡,开始一段为期五天的交流学习。时间虽短,但在双方长达数月的事前安排下,全程相当顺利。本想着一月份就应该把这篇文章敲出来,但过节的气氛实在过于诱人,一恍惚就拖到了三月。
借GPT-4o mini 发布,谈谈大模型与「降本增效」的故事
北京时间 2024 年 7 月 19 日凌晨,大洋彼岸的大语言模型领头羊 OpenAI 经过了数日的沉寂,终于拿出了一点更新——GPT-4o mini 发布,GPT-3.5 退役,ChatGPT 正式进入「4」时代。 OpenAI 称 GPT-4o mini 为「我们最具成本效益(most cost-efficient)的小模型」 作为 OpenAI 新的小型旗舰模型,GPT-4o mini 同样拥有 GPT-4o 家族的多模态、长上下文等优势。而作为上一代大模型 GPT-3.5 的继任者,GPT-4o mini 在成本上显著进步。每百万输入 token 仅需 15 美分,输出 token 60 美分,比 GPT-3.5 Turbo 便宜 60% 以上。已经和国内大模型「性价比之王」DeepSeek 打到了同一个数量级的水平。 近来,国内大模型厂商纷纷降价甚至免费,不禁让人猜想,「百模大战」的时代,终究还是要价格战先行吗?「大模型们」参数量越卷越大、性能越卷越强的同时,为何还有不断降价的空间? GPT-4o mini:旗舰小模型,可惜不开源 近期,LMSYS Chatbot Arena 大模型竞技场上相继出现多个神秘模型。在 GPT-4o 开创了竞技场抢先上新大模型的先河以后,各大厂商纷纷选择提前将自己的新模型投放在 LMSYS Chatbot Arena 大模型竞技场,以便正式发布时立刻可以公布大模型的评测结果。截至成稿,LMSYS Chatbot Arena 大模型竞技场上仍然有「column-u」「column-r」「eureka-chatbot」「gemini-test」和「im-a-little-birdie」等尚未发布的大语言模型随机掉落。 这些匿名的神秘模型目前仅在竞技场的「对战」环节随机出现,而本次 OpenAI 发布的 GPT-4o mini,就曾以「upcoming-gpt-mini」的身份上线竞技场。 竞技场上的「upcoming-gpt-mini」,在 GPT-4o mini 发布约 5 日前就被网友发现 图/Reddit 「upcoming-gpt-mini」被网友注意到上线竞技场以后不久,模型创建者就已经不言自明,因为这个模型不仅自称为 ChatGPT,并会明确表示其创建者为 OpenAI。这种坚定不移地认主人的表现,自然是 OpenAI…
【特别更新】OpenAI春季更新:大戏到来前的半代升级
GPT-4o 到底更新了什么?OpenAI 是否保住了自己在大模型领域的绝对话语权?为什么网友看完演示后纷纷感叹「你大爷还是你大爷」? 一个小站在一天的时间里密集阅读了各路媒体、博主、机构以及来自 OpenAI 官方的宣传视频、解读分析和实测体验,本文就来一文讲清堪称「科技界小春晚」的这次OpenAI Spring Update。