2AGI.NET | 2AGI 前沿资讯,探索 AI 无限潜力!

2AGI.NET | 探索 AI 无限潜力,2AGI 为您带来最前沿资讯。

随着人工智能技术的飞速发展,AI正在以前所未有的速度渗透到各个领域。从智能穿戴设备到语音交互,从云端算力到端侧应用,AI技术的每一次突破都为我们的生活和工作带来新的可能性。本文将为您盘点近期AI领域的技术热点,带您领略前沿科技的魅力。

DeepSeek上脸实测:AR眼镜实时翻译老黄GTC演讲,完了还帮我划重点

星纪魅族的StarV Air2 AR眼镜与DeepSeek等大模型结合,为用户带来了全新的体验。这款眼镜重量仅44克,续航可达8小时,支持13种语言的实时翻译,准确率高达99%。它还具备会议助手、备忘录、提词器、AR导航和语音转写等功能。通过语音、物理按键和手机App操作,用户可以轻松使用这些功能。该产品还支持与智能指环搭配,监控健康数据。未来,星纪魅族计划推出带摄像头的AR眼镜,进一步拓展其应用场景。来源

Manus 用不了?OpenManus 来当你的“超级工具人”!

在科技的浪潮中,Manus 的出现宛如一场喧嚣的闹剧,乍看之下,似乎只是在舞台上制造了一些无意义的喧哗。然而,当喧嚣散去,我们却意外地发现,它为我们揭示了人机交互的全新形态。当赋予 AI 系统、工具以及执行权限时,它真的有可能替代人类完成一些繁杂的事务,Agent 的优势也在这个过程中被不断放大。来源

一张图,快速生成可拆分3D角色!腾讯清华新SOTA | CVPR 2025

腾讯AI Lab与清华大学联合提出了StdGEN,这是一款能够在3分钟内生成具有精细细节的3D角色的模型,且可以分离出语义组件,如身体、衣服和头发。该模型基于Transformer架构,通过多视角图像重建几何、颜色和语义信息,并采用可微分的多层语义表面提取方案。它在3D动漫角色生成方面达到了最先进的性能,显著超越了现有基线,并具有泛化性。来源

刚刚,OpenAI首发语音Agent,智能体实现重大突破

OpenAI发布了三款全新语音模型:GPT-40 Transcribe、GPT-4 Mini Transcribe和GPT-40 Mini TTS。这些模型分别用于语音转文本和文本转语音,其中GPT-40 Mini TTS能够控制语音的情绪和风格,适用于多种业务场景。OpenAI还更新了语音转文本API,增加了streaming模式,支持实时输入和响应,并集成了噪声消除和语义语音活动检测器。新的Agents SDK采用模块化设计,方便开发者构建语音Agent。来源

英伟达发布世界最小AI工作站DGX Spark

英伟达在GTC 2025大会上发布了DGX Spark和DGX Station。DGX Spark是世界上最小的人工智能超级计算机,功耗仅为170瓦,搭载GB10芯片,可处理2000亿参数的AI模型推理和700亿参数的微调。DGX Station则配备GB300芯片,拥有784GB统一内存,可训练和推理超过2000亿参数的大型模型。这两款系统预装了NVIDIA的AI软件套件,支持与DeepSeek等AI模型的兼容。来源

64张图,看懂AI Agent的核心技术与未来

本文通过60多张可视化图,详细介绍了LLM Agents的核心技术和未来发展方向。LLM Agents通过外部工具、记忆和检索系统弥补了传统LLM的不足,能够与环境交互并执行任务。文章探讨了LLM Agents的三个主要组成部分:记忆、工具和规划,并介绍了多Agent框架和人类行为的交互模拟。这些技术的发展将使AI Agents在未来更具自主性和智能性。来源

放弃微调!阿里团队用新方法实现 Text-to-SQL 准确率飙升,传统方法彻底过时了?

阿里团队提出了一种新的Text-to-SQL方法OpenSearch-SQL,通过动态小样本和一致性对齐机制,显著提高了SQL生成的准确率。该方法无需对LLM进行微调,而是通过预处理、信息抽取、SQL生成和优化四个阶段,结合自学习的少样本增强机制和一致性对齐模块,解决了传统方法中的幻觉累积和指令漂移问题。在BIRD和Spider数据集上,OpenSearch-SQL均取得了优异的成绩。来源

史上最贵 API!比 DeepSeek-R1 贵千倍,OpenAI 高价劝退一批用户!

OpenAI推出了o1-pro API,其输入和输出token的收费分别是150美元/百万和600美元/百万,远高于常规o1模型和DeepSeek-R1。尽管o1-pro使用了更多计算资源以提供更优回答,但其高昂的价格让许多开发者望而却步。OpenAI希望通过改进性能说服开发者支付高价,但目前用户反馈并不十分积极。来源

如何为预训练 LLM 添加新 token?

为了使预训练LLM更好地适应专业领域需求,需要在分词器中添加新token。这些token可以帮助模型理解和生成特定领域的文本,处理词汇表之外的单词,适应多语言扩展,以及引入自定义格式标记。添加新token的步骤包括修改分词器、初始化新token的嵌入权重、保存并重新加载模型,以及在相关数据集上进行微调。在云原生场景下,这些操作需要根据不同的微调框架和集群级别进行集成。来源

算法+云端双驱动,吉利无界空间破局车机硬件依赖

吉利推出了无界空间,这是一种云车机技术,通过云端算力和灵活生态打破了传统车机的硬件依赖。无界空间依托吉利星睿智算中心2.0的强大算力,实现了低延迟和流畅体验,支持车主下载100+个应用,并通过微信小程序“云空间管家”安装私有APK。该技术不仅提升了吉利的全球竞争力,还为智能汽车的未来发展提供了新的范式。来源

端侧AI,即将迎来密集催化!

端侧AI领域即将迎来密集催化期。近期的重要事件包括阿里云的AI火花大会、字节的AIOT大会、Meta财报和llama大会等。市场对小米AI眼镜的发布充满期待,预计其将带动AI眼镜市场的发展。此外,苹果AI中文版的上线也将为AI手机市场带来新的机遇。机构预测,2025年全球AI智能眼镜销量将增长230%至350万台。来源

🔥 热门文章推荐(2AGI.NET)

扫码加入社群,参与讨论

2AGI 技术社区,欢迎扫码加入

AGI (102) AI Agent (3) AI App (1) AI Celebrity (9) AIGC (157) AI 名人堂 (9) AI 搜索 (1) AI 教程 (2) AI教程 (12) AI生产力平台 (1) AI电影制作 (2) Claude (1) claude 3.5 sonnet (1) Coze (2) DeepSeek (5) GAN (1) kimi.ai (2) kimi ai (4) kimi app (4) Kimi app AI (6) LLM (1) LoRA (1) Michael I. Jordan (1) NotebookLM (1) OTA AI (1) RAG (2) trae (2) Transformer (1) 一站式解决方案 (1) 人工智能 (2) 优化算法 (1) 内容创作 (1) 天天 AI (74) 天天AI (2) 技术原理 (32) 机器学习 (2) 李飞飞 (2) 梯度下降 (1) 模型微调 (2) 热点资讯 (78) 百度 (1) 秒刷 (1) 行业资讯 (1) 贝叶斯网络 (1) 酒旅AI产品对比 (1) 领域热词 (43)

By 2AGI

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注