
2AGI.NET | 探索 AI 无限潜力,2AGI 为您带来最前沿资讯。
人工智能领域迎来了众多激动人心的动态。从OpenAI前CTO成立新公司到Grok 3的发布,再到政务云的智能化转型,AI技术正在快速演变并影响着各个行业。本文将深入解析近期AI领域的重大事件,探讨这些技术如何改变我们的生活和工作方式。
官宣!OpenAI前CTO新公司:北大校友翁荔加盟,创始29人2/3来自OpenAI
前OpenAI首席技术官Mira Murati宣布成立新公司——Thinking Machines Lab。该团队由29名成员组成,其中三分之二来自OpenAI,包括前研究副总裁Barret Zoph和联合创始人John Schulman。Mira Murati担任CEO,团队的目标是帮助人们调整AI系统以满足特定需求,开发强大的基础模型,并培养开放的科学文化。Thinking Machines Lab旨在构建一个人人都能获得知识和工具的未来,让AI能够为人类的独特需求服务。该团队强调科学共享的重要性,计划定期发布技术博客和论文,以促进研究文化的改善。
来源
ChatGPT后训练方法被OpenAI离职联创公开,PPT全网转~
离开OpenAI的John Schulman和Barret Zoph公开了ChatGPT后训练方法的PPT,分享了他们在斯坦福的演讲内容。后训练阶段是模型开发的最后一步,旨在让模型更像助手,确保其适合实际生产环境。PPT中详细介绍了后训练的三个主要组成部分:监督微调、奖励模型训练和强化学习。两位前高管回顾了ChatGPT的早期发展历程,强调了在功能扩展和公司规模增长背景下,如何通过主线模型设置来整合变化并降低风险。这一分享为AI开发者提供了宝贵的经验和见解。
来源
全球首测!OpenAI开源SWELancer,大模型冲击100万年薪
OpenAI推出了新的评估大模型代码能力的基准——SWE-Lancer,包含1488个真实开发任务,价值高达100万美元。SWE-Lancer采用端到端测试方法,模拟真实用户的工作流程,验证应用程序的完整行为。与传统的单元测试不同,SWE-Lancer能够更全面地评估模型的解决方案。测试结果显示,当前主流模型在面对这些复杂任务时表现不佳,尤其是在高价值任务中,模型的通过率普遍低于30%。这一基准测试为AI模型的实际应用提供了重要参考。
来源
清华、中南开源3D交互实体AI Agent LEGENT
清华大学和中南大学的研究团队联合开源了一款可视化3D交互实体AI Agent模型——LEGENT。该模型允许用户在3D虚拟空间中与实体AI代理进行互动,具有高度的交互性和灵活性。LEGENT的场景模块通过实时物理模拟,为智能体的学习和决策提供了逼真的环境。该模型不仅支持用户与AI的直接交互,还允许开发人员导入自定义的3D对象,适用于多种业务场景。LEGENT的推出标志着AI Agent技术向更高层次的进化。
来源
生成式AI营销平台Tofu,获1200万美元A轮融资
生成式AI平台Tofu宣布获得1200万美元的A轮融资,由SignalFire领投,HubSpot Ventures等多家投资机构参与。Tofu致力于为营销团队提供个性化的AI工具,能够根据特定的人物角色或行业定制营销内容。该平台在过去一年实现了爆发式增长,收入增长了12倍,用户涵盖各种规模的营销团队。Tofu的成功反映了生成式AI在营销领域的巨大潜力。
来源
从黑盒到透明:AI Agent 运行监控实战!
为了提高AI Agent的透明度,监控其运行过程变得至关重要。传统的对话系统难以追踪决策过程,而AI Agent则需要实时监控其性能指标、决策链路和输入输出。通过使用OpenTelemetry等工具,可以实现对AI Agent的全面监控,帮助开发者快速定位问题并优化性能。监控的关键在于保持适当的粒度,确保能够及时发现问题,同时不增加系统负担。
来源
雷军:决心把AI用到手机汽车和智能家居上
小米科技董事长雷军表示,小米将致力于将AI技术应用于手机、汽车和智能家居等多个领域,以提升消费者的生活质量。雷军强调,AI技术的落地将为用户带来更好的体验,并提升中国产品在全球市场的影响力。
来源
20万卡吞金兽Grok 3炸裂登场,卡帕西大神亲测:性能超过DeepSeek R1!马斯克:短期不开源
xAI发布了新一代AI模型Grok 3,声称其性能超过DeepSeek R1。Grok 3的训练依赖于20万张GPU,结合了推理能力,能够在数学、科学和编码任务中表现优异。马斯克表示,Grok 3将用于SpaceX的火星任务计算,并预测其将实现诺贝尔级别的突破。尽管Grok 3在性能上表现出色,但其开源计划尚未确定。
来源
重估中国科技股:“十姐妹”呼之欲出
进入2025年,全球科技公司的境遇发生了显著变化。中国科技股在DeepSeek的推动下表现出色,阿里巴巴、比亚迪、小米、拼多多、网易、京东、腾讯等公司股价大幅上涨。DeepSeek-R1推理模型的发布进一步助推了恒生科技指数的上涨,引发了华尔街投资者对美国科技股的恐慌情绪。美国科技股市值蒸发1万亿美元,而中国科技股则迎来了重估。德意志银行和美国银行的报告指出,DeepSeek的推出是中国经济的“斯普特尼克时刻”,将推动中国科技股的价值重估。
来源
短期高估、长期低估——微信接入DeepSeek的冷思考
微信接入DeepSeek引发了广泛关注,但其产品层面的准备显得仓促。微信搜索接入DeepSeek后,用户体验增量被夸大,许多功能尚未完善,如历史记录、上下文联动、文件上传等。微信团队的初衷可能是低调练兵,快速获得用户反馈。微信选择搜索作为切入点,是因为搜索在心智上属于“短平快”,用户更倾向于搜完即走,从而节省Token成本。
来源
DeepSeek行情,后续怎么看?
DeepSeek宣布推出NSA(Native Sparse Attention)技术,这是一种硬件对齐且原生可训练的稀疏注意力机制,用于超快速长上下文训练与推理。NSA技术显著优化了AI模型的训练和推理过程,提升了长上下文的推理能力,并有效降低了预训练成本。DeepSeek的NSA技术使AI模型训练更加降本增效,推动了AI应用的普及。
来源
🔥 热门文章推荐(2AGI.NET)
扫码加入社群,参与讨论

AGI (102) AI Agent (3) AI App (1) AI Celebrity (9) AIGC (157) AI 名人堂 (9) AI 搜索 (1) AI 教程 (2) AI教程 (12) AI生产力平台 (1) AI电影制作 (2) Claude (1) claude 3.5 sonnet (1) Coze (2) DeepSeek (5) GAN (1) kimi.ai (2) kimi ai (4) kimi app (4) Kimi app AI (6) LLM (1) LoRA (1) Michael I. Jordan (1) NotebookLM (1) OTA AI (1) RAG (2) trae (2) Transformer (1) 一站式解决方案 (1) 人工智能 (2) 优化算法 (1) 内容创作 (1) 天天 AI (74) 天天AI (2) 技术原理 (32) 机器学习 (2) 李飞飞 (2) 梯度下降 (1) 模型微调 (2) 热点资讯 (78) 百度 (1) 秒刷 (1) 行业资讯 (1) 贝叶斯网络 (1) 酒旅AI产品对比 (1) 领域热词 (43)