2025 年 6 月 AI 大事总结回顾

6 月 26 日,小米正式发布小米首款AI眼镜。该产品定位为“下一代个人智能设备与随身 AI 入口”,主打轻量化设计(仅40g)与多功能集成,核心功能包括:1)沉浸式拍摄 – 1,200 万像素高清镜头,支持拍照、视频录制;2)实时通讯与分享 – 兼容第三方 APP 视频通话、直播推流;3)开放式耳机 – 兼具音频播放与通话功能;4)长续航 – 搭载小米金沙江电池,续航达8.6小时。售价 1,999 元起,目前已开启销售。

6 月 23 日,字节跳动旗下用户增长团队推出AI美食助手产品“探饭”,目前以抖音小程序形式小范围测试。该产品搭载豆包大模型,主打美食智能推荐与向导服务。

6 月 21 日,苹果公司高管已就收购 AI 初创公司 Perplexity AI 展开内部讨论,以增强其人工智能技术布局。潜在整合方向包括:1)吸纳 Perplexity AI 团队,加速苹果大模型研发(如Apple GPT);2)将 Perplexity 的 AI 搜索引擎直接嵌入 Safari 浏览器和 Siri 语音助手,提供更精准的实时答案生成能力。

6 月 20 日,华为云正式发布 CloudRobo 具身智能平台,并同步推出盘古大模型5.5。该平台基于华为云盘古大模型的多模态与认知能力,提供从数据合成到安全监管的端到端具身智能解决方案,包含三大核心模型: 具身多模态生成大模型(环境感知与交互);具身规划大模型(任务分解与决策);具身执行大模型(动作控制与优化)。华为云明确不做机器人硬件,而是通过 CloudRobo 平台赋能合作伙伴,目标让所有联网设备升级为具身智能体。

6 月 19 日,亚马逊云科技大中华区总裁储瑞松指出 Agentic AI(智能体AI)正处于爆发前夜,并阐述了五大核心驱动因素: 大模型认知能力跃升:当前大模型已具备类人的思考能力,为智能体提供“大脑”;模型上下文协议(MCP)成熟:实现智能体与环境的无缝交互(如自动调用API、处理多模态输入);推理成本骤降280倍(斯坦福2025 AI报告):使规模化部署成为可能;开发工具革新:如 Strands Agents SDK 等高抽象度工具降低开发门槛;企业数字化基础完善:现有 API 与数据生态为智能体提供“行动抓手”。 储瑞松预测,2025 – 2027年将迎来企业级 Agentic AI 的规模化落地,覆盖金融、制造、医疗等领域。

6 月 17 日,“大模型六小虎” 之一的 MiniMax 发布全新大模型 MiniMax-M1,并宣称其为“全球首个开源的大规模混合架构推理模型”。该模型的核心亮点包括:100 万 Token 上下文窗口(与 Google Gemini 2.5 Pro 相当,是 DeepSeek R1 的 8倍);8 万 Token 推理输出(当前开源模型中最长);强化学习训练成本仅 53 万美元(512 块 H800 GPU,3 周完成);混合架构( MoE + 闪电注意力机制),显著提升计算效率。在标准基准测试中,M1 在软件工程、工具使用、长上下文理解等任务上超越 DeepSeek-R1、Qwen3-235B 等开源模型,并在部分测试中接近或超越 OpenAI o3、Claude 4 Opus 等闭源模型。

6 月 17 日,豆包电脑版正式全量上线 AI 播客功能,用户可通过上传 PDF 文件或网页链接,一键生成双人对话式播客。该功能基于豆包大模型团队自主研发的语音播客模型,能够模拟真人对话的语音效果,包括自然的停顿、附和等细节。目前,该功能已在豆包电脑版和扣子空间上线,豆包 APP 也已开启小流量测试,预计近期全量开放。

6 月 17 日,AI 陪伴硬件初创公司 Robopoet 珞博智能宣布完成数千万元人民币天使轮融资。同日,珞博智能首款产品“芙崽Fuzozo”在京东自营渠道开启预售。该公司成立于 2024 年 1 月,专注于 AI 情感陪伴硬件的研发,旨在通过智能交互设备满足用户的陪伴需求。

6 月 17 日,AR 智能眼镜企业 Rokid 宣布与支付宝联合推出全球首个智能眼镜支付功能 – “看一下支付”,并正式发布新款 Rokid Glasses。该产品为全天候佩戴设计的全功能智能眼镜,用户通过语音指令即可唤醒支付宝支付界面,眼镜屏幕直接显示付款信息,无需操作手机即可完成支付。Rokid Glasses 计划于 2025 年 6 月正式上市,出货目标 100 万台。

6 月 16 日,美国麻省理工学院(MIT)研究团队在《科学进展》(Science Advances)杂志发表研究成果,宣布开发出全球首款专用于无线信号处理的光学 AI 处理器。该硬件加速器利用光子计算技术,可在数十纳秒(1纳秒=10亿分之一秒)内完成机器学习运算,实现 95% 的无线信号分类准确率,性能远超传统电子AI加速器(如GPU、TPU)。

6 月 16 日,AI 独角兽企业九章云极 DataCanvas 在“九章云极智能计算论坛”上正式发布新一代全栈智能计算云平台 – 九章智算云 Alaya NeW Cloud 2.0,并同步启动全球首个强化学习智算服务。该平台基于 Serverless 架构与强化学习(RL)技术的深度融合,成功突破“秒级生成百万token级”的性能瓶颈,旨在为全球 AI 企业及研发机构提供高性能、低成本的智能计算基础设施。

6 月 12 日,在火山引擎 FORCE 原动力大会上,字节跳动正式发布豆包大模型1.6,并宣布采用统一定价模式,最低价格降至 2.6元/百万tokens,较上一代(豆包1.5与DeepSeek-R1的7元/百万tokens)下降 63%。此外,豆包还发布了 Seedance 1.0 pro(视频生成模型),定价 0.015元/千tokens,生成一条 5 秒的 1080P 视频仅需约 3.67 元。豆包的实时语音模型也全量上线。

6 月 11 日,Meta 宣布在 Meta AI 应用程序、Meta.AI 网站及 Edits 应用中推出生成式 AI 视频编辑功能。该功能允许用户通过预设的 AI 提示词(如”改变服装””替换背景”等)快速编辑短视频,实现动态内容修改。目前,该功能已在美国、加拿大、英国、日本等十多个国家和地区上线,支持多语言操作。

6 月 11 日,OpenAI 首席执行官山姆·奥特曼(Sam Altman)宣布,公司计划于今年夏末推出开放权重模型(open-weights model)。意味着 OpenAI 开始从封闭走向部分开放。此外,奥特曼对未来 AI 发展做出预测: 2025 年能进行真正认知工作的 AI 代理将出现(如自主编程、复杂决策);2026 年能提出新见解的 AI 代理可能出现(如科学发现、原创理论);2027 年能在现实世界执行任务的机器人可能问世(如自动化物流、家庭服务)。

6 月 10 日,深圳市众擎机器人科技有限公司公布了一项名为”一种人形机器人直膝行走的控制方法、装置和存储介质”的专利。该专利提出了一套完整的直膝行走控制方案,对解决了人形机器人行走时的”膝关节过屈”行业难题有重大意义。

6 月 10 日,中文在线正式推出面向国际创作者的 AI 写作平台——逍遥海外作者平台(XIAOYAO)。该平台基于中文在线自主研发的“逍遥大模型”,专注于英文小说创作,提供从构思生成、语言润色、逻辑修复、角色管理到情节续写的全流程AI辅助功能,旨在提升创作者的效率和质量。

6 月 7 日,数据监测平台点点数据发布报告显示,5 月全球(含中国大陆)AI 应用在苹果 App Store 和谷歌 Google Play 双端的预估下载总量达 2.8 亿次(不含重复下载),较 4 月环比下降 16.4%。市场从“爆发期”进入“调整期”。在 5 月全球 AI 应用下载量 TOP 5 中,ChatGPT、Google Gemini、DeepSeek、豆包(字节跳动)和 PixVerse(爱诗科技)占据总下载量的 51%。

6 月 6 日,爱诗科技旗下全球知名 AI 视频生成平台 PixVerse 正式推出国内版产品“拍我AI”,同步上线网页端和移动端应用,并开放最新的 V4.5 模型供用户使用。PixVerse 自 2024 年 1 月海外上线以来,已累计吸引全球超 6,000 万用户,月活跃用户(MAU)突破 1,600 万,稳居 AI 视频生成领域第一梯队。

6 月 6 日,字节跳动 Seed 团队正式发布新一代图像编辑模型 SeedEdit 3.0。该模型支持 4K 高清图像的生成与编辑,能够在精细修改目标区域的同时,保持其他部分的高保真度,实现更自然的编辑效果。未来,团队计划进一步优化模型性能,并拓展连续多图生成、多图合成、故事性内容生成等高级功能,以增强其创作能力。

6 月 3 日,著名AI专家、图灵奖得主约书亚·本吉奥(Yoshua Bengio)宣布成立非营利组织 LawZero,并计划开发名为“科学家AI”(Scientist AI)的新型人工智能系统。该系统的目标是解决当前AI发展中可能出现的失控风险,如欺骗、自我保护、拒绝关机等行为,确保AI的安全性、可控性和伦理合规性。 LawZero 目前获得约 3,000 万美元的初始资金支持。

6 月 3 日,台积电(TSMC)在股东常会上证实,公司已开始承接人型机器人(Humanoid Robot)相关的高端芯片订单,并对营收产生初步贡献。董事长魏哲家表示,该业务预计将在 2026-2027 年显著增长,但未透露具体客户或订单规模。

6 月 2 日,Meta 宣布计划于 2026 年底前实现广告业务全面 AI 自动化。品牌方仅需提供产品图片和预算,系统即可自动生成多模态广告(图文/视频)、精准定位受众,并优化投放策略。Meta 旗下平台(Facebook、Instagram等)覆盖 34.3 亿月活用户,此举如成功,将彻底颠覆数字广告的模式。

6 月 1 日,银河通用(GalaxyAI)发布全球首个产品级端到端具身 FSD 大模型 “TrackVLA”,其核心特点包括:纯视觉感知,无需激光雷达,仅凭摄像头实现环境理解;语言指令驱动,能理解如 “跟着妈妈”“换成孩子” 等自然语言指令;自主推理与零样本泛化,可处理未训练过的指令和场景;目标持续追踪,即使目标短暂走出视野,也能通过轨迹预测重新定位。