2AGI.NET | 2AGI 前沿资讯,探索 AI 无限潜力!

2AGI.NET | 探索 AI 无限潜力,2AGI 为您带来最前沿资讯。

AI正在深刻改变各个行业的面貌。从物理建模到多模态大模型的优化,从药物研发到智能硬件的创新,AI的应用场景不断拓展。本文将为您带来最新的AI技术动态和行业洞察,揭示技术背后的创新与挑战。

何恺明带队驯服AI更懂物理!去噪方法+哈密顿网络,清华校友一作
何恺明团队提出了一种结合去噪方法和哈密顿神经网络的新框架,旨在让AI更懂物理。该研究通过推广哈密顿力学运算符为通用神经运算符,既遵循物理约束,又利用神经网络的灵活性。新框架在钟摆等物理推理任务中表现出色,解决了现有机器学习模型在处理物理问题时的局限性,如局部时间关系和正向模拟的单一性。研究中提出的Block-wise哈密顿量设计和掩码建模策略,使模型能够处理不同时间尺度的行为,并在推理时优化系统状态。论文一作是清华校友Congyue Deng,她目前是斯坦福大学的博士生,师从Leonidas Guibas。来源

谷歌版“DeepSeek”发布!27B模型单个GPU即可运行,击败满血DeepSeek V3/o3-mini
谷歌最新发布的Gemma 3模型以其高效性能和开源特性引起了广泛关注。27B参数的Gemma 3在单个GPU上即可运行,性能却超越了671B参数的DeepSeek V3和o3-mini等模型。Gemma 3不仅支持多模态和多语言,还具备128k token的上下文窗口和函数调用能力,能够显著降低部署成本。该模型在ChatBot Arena竞技场中跻身Top 10,成为开源模型中的佼佼者。Gemma 3的训练结合了蒸馏、强化学习和模型合并等技术,优化了多语言支持和长上下文处理能力。来源

谷歌开源Gemma-3:媲美DeepSeek,算力暴降10倍
谷歌开源的Gemma-3模型主打高性能和低成本,提供10亿到270亿参数的多种版本,适合不同硬件条件的设备。Gemma-3在架构上进行了多项优化,如局部和全局自注意力层交错设计,以应对长上下文带来的内存挑战。此外,该模型支持超过140种语言,并通过定制版SigLIP视觉编码器实现了多模态处理能力。Gemma-3还引入了图像嵌入压缩技术和Pan&Scan方法,优化了图像处理效率。其训练过程结合了知识蒸馏和多种强化学习技术,显著提升了模型的性能和效率。来源

多智能体协作,DrugAgent重塑药物研发新范式
南加州大学、卡内基梅隆大学和伦斯勒理工学院的研究人员联合开发了DrugAgent,这是一个专用于医药领域的AI Agent。DrugAgent通过多智能体协作,将复杂的药物发现任务分解为可管理的子任务,并自动化执行相关操作。该系统由LLM Instructor和LLM Planner组成,前者负责任务分解和工具准备,后者管理想法空间并优化解决方案。DrugAgent在ADMET预测、药物-靶点相互作用预测和分子优化等任务中表现出色,展现了其在药物研发领域的广泛应用潜力。来源

谷歌曝两款「机器人 AI 模型」;英特尔任命新 CEO,股价大涨11%;253 亿!《宝可梦 Go》出售 | 极客早知道
谷歌DeepMind推出了两款新型AI模型——Gemini Robotics和Gemini Robotics-ER,旨在帮助机器人更好地完成现实世界中的任务。Gemini Robotics基于谷歌的Gemini 2.0模型,能够使机器人在未经过专门训练的情况下理解新情境。另一款模型Gemini Robotics-ER则专注于复杂环境下的视觉语言理解。此外,英特尔宣布任命陈立武为新CEO,自3月18日起生效,其股价在消息公布后大涨11%。与此同时,《宝可梦 Go》开发商Niantic以35亿美元的价格将游戏业务出售给Scopely。来源

刚刚,谷歌用更少参数打败 Qwen 2.5-32B!新模型 Gemma 3 号称“单 GPU 模型王”,团队紧急招兵买马!
谷歌推出的Gemma 3模型在性能和效率上取得了显著突破。尽管参数量仅为27B,但其性能却超越了Qwen 2.5-32B等大型模型。Gemma 3通过优化架构和训练策略,实现了高效的单GPU运行能力,并在多项测试中表现出色。该模型支持多模态和多语言处理,具备128k token的上下文窗口和函数调用能力,能够满足复杂的任务需求。谷歌还发布了详细的技术报告,展示了Gemma 3在不同场景下的应用潜力。来源

小红书基于 PPO 的多模态大模型 RLHF 系统的设计与优化
小红书团队在多模态大模型的强化学习(RLHF)系统设计中取得了重要进展。通过采用PPO(近端策略优化)算法,团队实现了高效的模型训练和推理优化。该系统通过奖励模型和演员-评论家模型的协同训练,显著提升了模型的性能和人类偏好对齐能力。小红书的RLHF框架不仅优化了训练流程,还通过异构组网和流水线并行等技术,大幅降低了推理成本。此外,团队还引入了Medusa算法,进一步提升了采样效率。来源

HuggingFace上的热门开源模型,一半都来自中国了
HuggingFace上的热门模型榜单中,中国模型的占比已超过50%。这些模型不仅在数量上占据优势,更在性能和实用性上取得了显著突破。中国模型采用Apache 2.0或MIT等宽松的开源协议,允许开发者自由进行二次开发和商用,有效规避了法律风险。此外,中国模型提供了从轻量级到重量级的多种规格,并开放了完整的训练数据集和微调模板。这种全面的开源策略吸引了大量国际开发者,推动了中国开源模型的广泛应用。来源

在深圳做「AI 耳机」这一年,我看到的 10 个行业真相
Penny从北京的自动驾驶公司离职后,回到深圳投身AI耳机行业。她见证了AI耳机从概念到市场的快速崛起,并总结了十个行业真相。深圳的制造业以快速迭代和灵活应变著称,AI耳机的生产也不例外。尽管市场对AI耳机的需求旺盛,但消费者更倾向于低价尝鲜,而非高端产品。此外,华强北的供应链迭代速度极快,甚至领先于一些大品牌。Penny认为,AI耳机市场需要一个领头羊来推动发展,而深圳的制造业正在通过快速迭代和成本控制,为行业的未来奠定基础。来源

🔥 热门文章推荐(2AGI.NET)

扫码加入社群,参与讨论

2AGI 技术社区,欢迎扫码加入

AGI (102) AI Agent (3) AI App (1) AI Celebrity (9) AIGC (157) AI 名人堂 (9) AI 搜索 (1) AI 教程 (2) AI教程 (12) AI生产力平台 (1) AI电影制作 (2) Claude (1) claude 3.5 sonnet (1) Coze (2) DeepSeek (5) GAN (1) kimi.ai (2) kimi ai (4) kimi app (4) Kimi app AI (6) LLM (1) LoRA (1) Michael I. Jordan (1) NotebookLM (1) OTA AI (1) RAG (2) trae (2) Transformer (1) 一站式解决方案 (1) 人工智能 (2) 优化算法 (1) 内容创作 (1) 天天 AI (74) 天天AI (2) 技术原理 (32) 机器学习 (2) 李飞飞 (2) 梯度下降 (1) 模型微调 (2) 热点资讯 (78) 百度 (1) 秒刷 (1) 行业资讯 (1) 贝叶斯网络 (1) 酒旅AI产品对比 (1) 领域热词 (43)

By 2AGI

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注