2025 年 6 月 AI 大事总结回顾

6 月 26 日，小米正式发布小米首款AI眼镜。该产品定位为“下一代个人智能设备与随身 AI 入口”，主打轻量化设计（仅40g）与多功能集成，核心功能包括：1）沉浸式拍摄 – 1,200 万像素高清镜头，支持拍照、视频录制；2）实时通讯与分享 – 兼容第三方 APP 视频通话、直播推流；3）开放式耳机 – 兼具音频播放与通话功能；4）长续航 – 搭载小米金沙江电池，续航达8.6小时。售价 1,999 元起，目前已开启销售。

6 月 23 日，字节跳动旗下用户增长团队推出AI美食助手产品“探饭”，目前以抖音小程序形式小范围测试。该产品搭载豆包大模型，主打美食智能推荐与向导服务。

6 月 21 日，苹果公司高管已就收购 AI 初创公司 Perplexity AI 展开内部讨论，以增强其人工智能技术布局。潜在整合方向包括：1）吸纳 Perplexity AI 团队，加速苹果大模型研发（如Apple GPT）；2）将 Perplexity 的 AI 搜索引擎直接嵌入 Safari 浏览器和 Siri 语音助手，提供更精准的实时答案生成能力。

6 月 20 日，华为云正式发布 CloudRobo 具身智能平台，并同步推出盘古大模型5.5。该平台基于华为云盘古大模型的多模态与认知能力，提供从数据合成到安全监管的端到端具身智能解决方案，包含三大核心模型：具身多模态生成大模型（环境感知与交互）；具身规划大模型（任务分解与决策）；具身执行大模型（动作控制与优化）。华为云明确不做机器人硬件，而是通过 CloudRobo 平台赋能合作伙伴，目标让所有联网设备升级为具身智能体。

6 月 19 日，亚马逊云科技大中华区总裁储瑞松指出 Agentic AI（智能体AI）正处于爆发前夜，并阐述了五大核心驱动因素：大模型认知能力跃升：当前大模型已具备类人的思考能力，为智能体提供“大脑”；模型上下文协议（MCP）成熟：实现智能体与环境的无缝交互（如自动调用API、处理多模态输入）；推理成本骤降280倍（斯坦福2025 AI报告）：使规模化部署成为可能；开发工具革新：如 Strands Agents SDK 等高抽象度工具降低开发门槛；企业数字化基础完善：现有 API 与数据生态为智能体提供“行动抓手”。储瑞松预测，2025 – 2027年将迎来企业级 Agentic AI 的规模化落地，覆盖金融、制造、医疗等领域。

6 月 17 日，“大模型六小虎” 之一的 MiniMax 发布全新大模型 MiniMax-M1，并宣称其为“全球首个开源的大规模混合架构推理模型”。该模型的核心亮点包括：100 万 Token 上下文窗口（与 Google Gemini 2.5 Pro 相当，是 DeepSeek R1 的 8倍）；8 万 Token 推理输出（当前开源模型中最长）；强化学习训练成本仅 53 万美元（512 块 H800 GPU，3 周完成）;混合架构（ MoE + 闪电注意力机制），显著提升计算效率。在标准基准测试中，M1 在软件工程、工具使用、长上下文理解等任务上超越 DeepSeek-R1、Qwen3-235B 等开源模型，并在部分测试中接近或超越 OpenAI o3、Claude 4 Opus 等闭源模型。

6 月 17 日，豆包电脑版正式全量上线 AI 播客功能，用户可通过上传 PDF 文件或网页链接，一键生成双人对话式播客。该功能基于豆包大模型团队自主研发的语音播客模型，能够模拟真人对话的语音效果，包括自然的停顿、附和等细节。目前，该功能已在豆包电脑版和扣子空间上线，豆包 APP 也已开启小流量测试，预计近期全量开放。

6 月 17 日，AI 陪伴硬件初创公司 Robopoet 珞博智能宣布完成数千万元人民币天使轮融资。同日，珞博智能首款产品“芙崽Fuzozo”在京东自营渠道开启预售。该公司成立于 2024 年 1 月，专注于 AI 情感陪伴硬件的研发，旨在通过智能交互设备满足用户的陪伴需求。

6 月 17 日，AR 智能眼镜企业 Rokid 宣布与支付宝联合推出全球首个智能眼镜支付功能 – “看一下支付”，并正式发布新款 Rokid Glasses。该产品为全天候佩戴设计的全功能智能眼镜，用户通过语音指令即可唤醒支付宝支付界面，眼镜屏幕直接显示付款信息，无需操作手机即可完成支付。Rokid Glasses 计划于 2025 年 6 月正式上市，出货目标 100 万台。

6 月 16 日，美国麻省理工学院（MIT）研究团队在《科学进展》（Science Advances）杂志发表研究成果，宣布开发出全球首款专用于无线信号处理的光学 AI 处理器。该硬件加速器利用光子计算技术，可在数十纳秒（1纳秒=10亿分之一秒）内完成机器学习运算，实现 95% 的无线信号分类准确率，性能远超传统电子AI加速器（如GPU、TPU）。

6 月 16 日，AI 独角兽企业九章云极 DataCanvas 在“九章云极智能计算论坛”上正式发布新一代全栈智能计算云平台 – 九章智算云 Alaya NeW Cloud 2.0，并同步启动全球首个强化学习智算服务。该平台基于 Serverless 架构与强化学习（RL）技术的深度融合，成功突破“秒级生成百万token级”的性能瓶颈，旨在为全球 AI 企业及研发机构提供高性能、低成本的智能计算基础设施。

6 月 12 日，在火山引擎 FORCE 原动力大会上，字节跳动正式发布豆包大模型1.6，并宣布采用统一定价模式，最低价格降至 2.6元/百万tokens，较上一代（豆包1.5与DeepSeek-R1的7元/百万tokens）下降 63%。此外，豆包还发布了 Seedance 1.0 pro（视频生成模型），定价 0.015元/千tokens，生成一条 5 秒的 1080P 视频仅需约 3.67 元。豆包的实时语音模型也全量上线。

6 月 11 日，Meta 宣布在 Meta AI 应用程序、Meta.AI 网站及 Edits 应用中推出生成式 AI 视频编辑功能。该功能允许用户通过预设的 AI 提示词（如”改变服装””替换背景”等）快速编辑短视频，实现动态内容修改。目前，该功能已在美国、加拿大、英国、日本等十多个国家和地区上线，支持多语言操作。

6 月 11 日，OpenAI 首席执行官山姆·奥特曼（Sam Altman）宣布，公司计划于今年夏末推出开放权重模型（open-weights model）。意味着 OpenAI 开始从封闭走向部分开放。此外，奥特曼对未来 AI 发展做出预测： 2025 年能进行真正认知工作的 AI 代理将出现（如自主编程、复杂决策）；2026 年能提出新见解的 AI 代理可能出现（如科学发现、原创理论）；2027 年能在现实世界执行任务的机器人可能问世（如自动化物流、家庭服务）。

6 月 10 日，深圳市众擎机器人科技有限公司公布了一项名为”一种人形机器人直膝行走的控制方法、装置和存储介质”的专利。该专利提出了一套完整的直膝行走控制方案，对解决了人形机器人行走时的”膝关节过屈”行业难题有重大意义。

6 月 10 日，中文在线正式推出面向国际创作者的 AI 写作平台——逍遥海外作者平台（XIAOYAO）。该平台基于中文在线自主研发的“逍遥大模型”，专注于英文小说创作，提供从构思生成、语言润色、逻辑修复、角色管理到情节续写的全流程AI辅助功能，旨在提升创作者的效率和质量。

6 月 7 日，数据监测平台点点数据发布报告显示，5 月全球（含中国大陆）AI 应用在苹果 App Store 和谷歌 Google Play 双端的预估下载总量达 2.8 亿次（不含重复下载），较 4 月环比下降 16.4%。市场从“爆发期”进入“调整期”。在 5 月全球 AI 应用下载量 TOP 5 中，ChatGPT、Google Gemini、DeepSeek、豆包（字节跳动）和 PixVerse（爱诗科技）占据总下载量的 51%。

6 月 6 日，爱诗科技旗下全球知名 AI 视频生成平台 PixVerse 正式推出国内版产品“拍我AI”，同步上线网页端和移动端应用，并开放最新的 V4.5 模型供用户使用。PixVerse 自 2024 年 1 月海外上线以来，已累计吸引全球超 6,000 万用户，月活跃用户（MAU）突破 1,600 万，稳居 AI 视频生成领域第一梯队。

6 月 6 日，字节跳动 Seed 团队正式发布新一代图像编辑模型 SeedEdit 3.0。该模型支持 4K 高清图像的生成与编辑，能够在精细修改目标区域的同时，保持其他部分的高保真度，实现更自然的编辑效果。未来，团队计划进一步优化模型性能，并拓展连续多图生成、多图合成、故事性内容生成等高级功能，以增强其创作能力。

6 月 3 日，著名AI专家、图灵奖得主约书亚·本吉奥（Yoshua Bengio）宣布成立非营利组织 LawZero，并计划开发名为“科学家AI”（Scientist AI）的新型人工智能系统。该系统的目标是解决当前AI发展中可能出现的失控风险，如欺骗、自我保护、拒绝关机等行为，确保AI的安全性、可控性和伦理合规性。 LawZero 目前获得约 3,000 万美元的初始资金支持。

6 月 3 日，台积电（TSMC）在股东常会上证实，公司已开始承接人型机器人（Humanoid Robot）相关的高端芯片订单，并对营收产生初步贡献。董事长魏哲家表示，该业务预计将在 2026-2027 年显著增长，但未透露具体客户或订单规模。

6 月 2 日，Meta 宣布计划于 2026 年底前实现广告业务全面 AI 自动化。品牌方仅需提供产品图片和预算，系统即可自动生成多模态广告（图文/视频）、精准定位受众，并优化投放策略。Meta 旗下平台（Facebook、Instagram等）覆盖 34.3 亿月活用户，此举如成功，将彻底颠覆数字广告的模式。

6 月 1 日，银河通用（GalaxyAI）发布全球首个产品级端到端具身 FSD 大模型 “TrackVLA”，其核心特点包括：纯视觉感知，无需激光雷达，仅凭摄像头实现环境理解；语言指令驱动，能理解如 “跟着妈妈”“换成孩子” 等自然语言指令；自主推理与零样本泛化，可处理未训练过的指令和场景；目标持续追踪，即使目标短暂走出视野，也能通过轨迹预测重新定位。