2025 年 7 月 AI 大事总结回顾

7 月 30 日，微软宣布在 Edge 浏览器中推出全新 Copilot 模式。开启该模式后，Edge 将激活其内置的 AI 智能体，该 AI 智能体不再被动响应，而是能主动预测并协助用户浏览行为，例如自动预测用户操作路径、智能整理标签页，减少信息负担、主动理解和梳理搜索内容等。

7 月 28 日，全球首个设计类 AI Agent – Lovart 正式上线。该产品由腾讯混元大模型提供技术支持，特别是在 3D 内容生成方面，Lovart 将优先调用混元 3D 模型 API 接口，为用户带来高清、细节丰富的建模体验。 Lovart 聚焦于设计领域，借助 AI 能力帮助用户自动生成、优化和呈现各种创意设计，涵盖视觉、3D建模、空间构图等多个方向。

7 月 28 日，据《科创板日报》报道，特斯拉方面透露，其第三代人形机器人 Optimus Gen 3 已在美国工厂完成实测，并计划于 2025 年进入中国 C 端市场，正式向家庭等消费场景开放应用。还表示，预计到 2026 年实现量产，并制定了 5 年内年产 100 万台的宏大目标。

7 月 26 日，阿里巴巴自研 AI 眼镜 – 夸克 AI 眼镜模型亮相 2025 世界人工智能大会。此前，该款 AI 眼镜一直处于严格保密阶段，这是其首次以完整产品形态亮相。该眼镜将具备常见的 AI 可穿戴设备基础功能，包括语音助手、音乐播放、电话通话、实时翻译等；同时还将深度整合阿里生态系统的关键服务，如高德地图、支付宝支付与淘宝购物；技术开发由高德、支付宝、淘宝等核心团队共同参与；AI 模型方面，将调用阿里大模型“通义千问”，并由夸克团队训练学习与健康等垂直模型。

7 月 26 日，OpenAI 准备在 8 月初正式推出 GPT-5 。

7 月 23 日，美图公司近期发布的 AI Agent「RoboNeo」 在上线仅一周后便登顶国内 App Store 分类榜。该产品于 7 月 14 日正式上线，支持多种图像生成与编辑场景，如商业精修、品牌设计、电商物料制作等。它主要面向 P 图用户、内容创作者、设计师、电商卖家与新媒体运营人员，并迅速在社交平台上引发热议，用户大量分享使用 RoboNeo 生成的 chibi（Q版）、emoji 表情包、卡通人物等作品。

7 月 23 日，智元机器人在其官网正式上架旗下四足机器人 D1 ULTRA。该机器人被定位为“行业级小型四足机器人”，最高奔跑速度达 3.7 米/秒，主要应用于特种任务、安防巡检、科研教育等多个场景。

7 月 23 日，Amazon 确认其计划收购位于旧金山的 AI 可穿戴设备初创公司 Bee，但交易的具体条款尚未披露。 Bee 公司主打产品是一款售价 49.99 美元的 AI 腕带，内置麦克风和人工智能系统，能够实时监听和分析对话内容，进而生成摘要、待办事项、提醒等信息辅助。其定位类似于“随身 AI 助手”，强调隐私控制与轻量级设计。

7 月 22 日，字节跳动旗下 Seed 团队正式发布通用机器人模型 GR-3，并同步推出其配套硬件平台 – 双臂移动机器人 ByteMini。与此前依赖大量机器人轨迹训练的 VLA 模型不同，GR-3 强调低样本学习能力，可通过极少的人类示范数据进行微调，从而快速适应新任务和新物体识别，具备出色的泛化能力和实际部署潜力。此外，GR-3 在长程任务处理能力和高灵巧度操作方面表现优异。作为载体的 ByteMini 是一款通用型双臂机器人，设计用于在现实环境中高效执行复杂任务。

7 月 22 日，国产 AI 算力基础设施服务商基流科技宣布完成近亿元 A+ 轮融资。基流科技成立于 2023 年，专注于大规模 AI 算力集群的通信网络建设，提供高性能互联软硬件解决方案，已参与多个百卡、千卡至万卡级算力集群项目，并实现跨远距离训推算力集群的商业化落地。公司累计融资达数亿元，投资方涵盖一线基金、产业资本和地方国资。

7 月 21 日，京东在机器人领域密集出手，一日内连续投资三家具身智能企业： 1）千寻智能 – 完成 6 亿元 Pre-A+ 轮融资，由京东领投，聚焦VLA（视觉-语言-动作）模型研发，其人形机器人 Moz1 可执行办公场景任务。2）逐际动力 – 获京东战略领投，其双足机器人TRON 1已在巡检、配送等领域应用，计划下半年量产全尺寸人形机器人。3）众擎机器人 – 完成两轮融资（含 A1 轮京东领投），累计融资近 10 亿元，产品覆盖教育、商业服务等场景，并计划拓展中东市场。

7 月 20 日，埃隆·马斯克在社交平台宣布，其人工智能公司 xAI 将推出专为儿童设计的 AI 应用 – “Baby Grok”。马斯克表示，该应用将提供“友好型内容”，但未透露具体功能细节。这是继 Grok-1.5 大模型发布后，xAI 首次涉足儿童 AI 领域。

7 月 19 日，Manus（通用 AI 智能体公司）联合创始人季逸超发布了一篇技术长文，首次系统性复盘公司在 AI Agent 研发中的经验教训。指出自研大模型给公司带来了太多的羁绊，后续会专注“上下文设计”（Context Engineering）。而对最近闹的沸沸扬扬的裁员67%（国内仅留40人）、总部迁至新加坡、清空中国社交账号等行为未做任何解释。

7 月 18 日，国内全栈自研人工智能算力芯片企业曦望（Sunrise）宣布完成近 10 亿元人民币的新一轮融资，投资方包括三一集团旗下华胥基金、第四范式、游族网络、北京利尔、松禾资本、海通开元等知名产业资本和投资机构。曦望表示，本轮资金将主要用于产品研发、市场拓展和团队建设，进一步巩固其在国产高端 GPU 领域的技术领先地位。

7 月 17 日，OpenAI 正式发布了 ChatGPT Agent，标志着 AI 从“对话助手”向“自主执行者”的跨越式升级。该智能体整合了 Operator（网页交互）、Deep Research（深度信息整合）和 ChatGPT（自然语言处理）三大核心技术，具备自主思考、工具选择和任务执行能力，可独立完成复杂任务，如数据分析、PPT生成、行程规划等等。

7 月 17 日，德国马克斯・普朗克人类发展研究所发布的一项新研究表明，以 ChatGPT 为代表的 AI 聊天机器人正在反向影响人类语言习惯，导致人们在日常交流中更频繁地使用“GPT词汇”，如“深入研究” delve、“细致” meticulous 等。研究团队通过分析数百万篇人类文本经 AI “润色”后的变化，并追踪 36 万段 YouTube 视频和 77.1万个播客节目的语言使用趋势，发现这些 AI 偏好的词汇在英语口语中的出现频率显著上升。

7 月 17 日，在第三届链博会先进制造链主题活动上，英伟达 CEO 黄仁勋提出，人工智能的下一个浪潮将是“物理AI”（Physic AI）。物理AI 是指基于物理规律（如力学、电磁学、热力学）构建的 AI 模型，能够模拟、预测并优化现实世界的物理过程。这种基于物理规律与 AI 融合的技术方向，有望在工业、制造、科研等领域带来革命性突破。

7 月 15 日，OpenAI 前首席技术官 Mira Murati 创立的 AI 初创公司 Thinking Machines Lab 宣布完成 20 亿美元巨额融资，由顶级风投机构 Andreessen Horowitz（a16z）领投，英伟达、AMD、Accel、ServiceNow、思科、Jane Street等科技巨头和投资机构参投。Murati 透露，公司首款产品“将在未来数月推出”，但未公开具体细节。

7 月 15 日，格力申请的“空调机器人控制方法、装置、设备及介质”专利正式公布。根据专利说明，该空调机器人能够通过多模态感知和 AI 动态调控，实现自主跟随用户移动，并提供精准的个性化送风服务。

7 月 14 日，人工智能初创公司 Cognition AI（因做出全球首个 AI 软件工程师 Devin 而闻名）宣布签署最终协议，收购 AI 编程初创公司 Windsurf，交易涵盖 Windsurf 的知识产权、产品、商标及现有业务。就在 3 天前，Google 以 24 亿美元挖走 Windsurf 前 CEO Varun Mohan、联合创始人 Douglas Chen 及部分核心团队。

7 月 14 日，据媒体报道，苹果公司正认真考虑收购欧洲最大 AI 初创公司 Mistral AI 。若交易达成，可能成为苹果历史上规模最大的并购案，远超 2014 年收购 Beats 的 30 亿美元纪录。 Mistral AI 是一家法国 AI 公司，专注于高效开源大模型如 Mistral 7B、Mixtral 8x22B，在性能与成本平衡上表现突出。目前该公司已通过 7 轮融资筹集 11 亿欧元，并正寻求新一轮 10 亿美元融资。苹果若成功收购，将大幅增强其在生成式 AI 领域的竞争力，弥补目前落后于微软、谷歌等对手的 AI 格局。

7 月 13 日，美国 AI 搜索初创公司 Perplexity 的 CEO 阿拉温德（Aravind Srinivas）在社交媒体透露，公司可能会基于月之暗面（Moonshot AI）最新发布的 Kimi K2 模型进行后训练（post-training）。 Kimi K2 是月之暗面近期发布的一款万亿参数开源模型，采用MoE（混合专家）架构，激活参数为 32B，在代码能力、Agent 任务和数学推理方面表现优异。 Perplexity 此前曾使用 DeepSeek R1 进行模型训练。

7 月 11 日，高盛（Goldman Sachs）宣布将试点全球首个 AI 程序员，该 AI 程序员由初创公司 Cognition 开发，具备自主编写、调试和优化代码的能力。高盛技术主管 Marco Argenti 透露，这位“ AI 同事”将加入公司现有的 12,000 名人类开发者团队，共同参与金融系统开发。此前，华尔街其他机构（如摩根大通、摩根士丹利）已部署基于 OpenAI 模型的认知助手，但高盛此次试点是首次引入全自主 AI 程序员，而非仅辅助工具。

7 月 10 日，欧盟委员会正式发布《通用人工智能行为准则》（General-Purpose AI Code of Practice）。该准则整合了来自 AI 开发者、学术界、民间组织、版权方及安全专家等 1,000 多位利益相关者的意见。

其主要监管对象是通用人工智能（AGI）模型，即能执行广泛任务并集成至下游应用的AI系统（如ChatGPT、Gemini、Llama等）。有三大监管重点：1）透明度 – 要求企业披露模型训练数据、决策逻辑，并提供可解释性文档；2）版权保护 – 规范数据爬取行为，确保训练数据合法，并设立侵权投诉机制；3）安全与保障 – 要求企业识别系统性风险，建立安全防护措施。该准则将于 2025 年 8 月 2 日起正式实施。

7 月 10 日，AI 搜索领域迎来重磅竞争： Perplexity AI（英伟达投资）推出 AI 浏览器 Comet，主打自然语言搜索和答案直出功能，剑指谷歌搜索。OpenAI 同日被曝也计划推出 AI 浏览器，或整合 ChatGPT 的交互式搜索能力。当前，谷歌 Chrome 占据全球浏览器市场 68% 的份额（StatCounter数据），但 AI 驱动的“无链接搜索”模式正挑战传统搜索引擎的商业模式。

7 月 8 日，麻省理工学院（MIT）研究人员宣布开发出一项名为 mmNorm 的新型“透视眼”技术，该技术利用毫米波信号（与Wi-Fi同频段）结合 AI 算法，通过分析物体表面反射的毫米波信号方向（“表面法线”），结合多天线数据融合，生成高分辨率 3D 图像。在不拆封、不接触的情况下，高精度重构隐藏物体的 3D 形状，如箱子内的物品、墙壁后的结构等。该技术在60多种物体上的重建准确率达 96%，比传统雷达技术（78%）提升 18%。

7 月 9 日，Meta 宣布在英国剑桥投资 1,200万英镑设立音频研究实验室，重点提升其 AR/AI 眼镜（如Ray-Ban Meta、Oakley Meta）的音频技术。该实验室将专注于环境感知音频、智能降噪和空间音频交互，旨在打造能动态适应用户周围声场的下一代可穿戴设备。Meta 的 AR 眼镜此前被诟病 “视觉强、音频弱”，此次投资直指苹果Vision Pro的竞争优势（空间音频+耳罩级音质）。

7 月 7 日，智元机器人（Agile Robots）发布新款人形机器人 “灵犀X2-N”，该产品可在轮式与足式之间自由切换，以适应不同地形需求。足式模式下可盲走上台阶（无需视觉辅助），最大负载 12 斤。具备六自由度腿部调节，可应对推搡、跌落等突发情况。轮式模式移动速度显著提升，可 360°灵活转向，支持边走边滑，适应单边桥、斜坡等复杂地形。

7 月 7 日，美国亿万富翁投资人 Mark Cuban 在 High Performance 播客中发表观点，认为 AI 的影响力将超越互联网和云计算，并将催生全球首位万亿美元富翁，且这位富豪可能并非来自传统行业（如科技巨头或金融大亨），而是一位 “默默无闻的开发者”，通过让 AI 成为大众生活的基础工具而实现财富爆发。

7 月 7 日，Isomorphic Labs 总裁 Colin Murdoch 宣布，该公司首款由 AI 设计的癌症治疗药物即将进入首次人体临床试验，标志着 AI 制药从理论研发迈向临床验证的关键一步。

Isomorphic Labs 是由 Google DeepMind 拆分成立的公司，源自其最具代表性的突破性研究成果——AlphaFold。 AlphaFold 是 DeepMind 开发的首个用于预测蛋白质三维结构的 AI 工具。2024 年，DeepMind 推出了第三代 AlphaFold 模型（AlphaFold 3），并称其为一款“革命性模型”，能够“以前所未有的准确度预测所有生命分子的结构及其相互作用”。

7 月 6 日，雷鸟创新（RayNeo）通过官方微博宣布，旗下雷鸟V3 AI 拍摄眼镜夏季重大更新： AI 备忘录功能上线 – 支持语音或手势触发实时记录，并自动生成结构化摘要（如会议纪要、待办清单）、拍摄能力提升和苹果生态接入。

7 月 5 日，科技媒体在 ChatGPT 网页版及安卓应用的测试代码中发现 “计算机工具操作” 相关字符串，包括： “点击”、“双击”、“拖拽”、“输入”、“终端反馈” 等等，推测其将引入类似 Operator 的 AI 智能体。Operator 是 OpenAI 此前推出的首款自主操作浏览器的 AI 智能体，可像人类一样执行在线任务（如订餐、购票）。

7 月 5 日，微软（Microsoft）确认将启动新一轮裁员，计划削减约 9,000 名员工，这是继今年 5 月裁员 7,000 人后的又一次大规模人员调整。微软 CEO 萨蒂亚·纳德拉（Satya Nadella）曾在4 月透露，公司 20%~30% 的代码由 AI 生成，且比例仍在增长。

7 月 4 日，马斯克旗下 xAI 公司的 Grok 4 大模型意外通过源代码泄露而提前曝光：有开发者在 xAI 控制台发现了 Grok 4 和 Grok 4 Code 两个新模型的引用，而原计划 5 月发布的 Grok 3.5 被直接跳过。与此同时，xAI 宣布完成 100 亿美元（约 716 亿人民币）融资，资金将用于加速 Grok 4 的研发和部署。

官方宣称 Grok 4 在自然语言、数学和逻辑推理方面的能力“无与伦比”。Grok 4 目前支持文本模态，视觉、图像生成和其他功能即将推出，将包含函数调用、结构化输出和深度思考功能。

马斯克还提出一个颠覆性目标： “用 Grok 4 重写人类知识库” – 即利用 AI 的推理能力，修正错误知识、填补空白，并基于这个“纯净版”知识库重新训练下一代AI。

7 月 4 日，Meta 宣布研发 “Project Omni”，旨在开发一款能够主动与用户互动的 AI 聊天机器人。该机器人基于用户历史聊天记录，可在未被直接触发时发起对话（如：“晚上好，最近有发现新音乐吗？”）。通过提供个性化互动体验，提升用户黏性。该 AI 机器人还可接入第三方应用如信息提醒服务等。训练数据由数据标注公司 Alignerr 提供。项目目前仍处于开发阶段，正式上线尚需较长时间。

7 月 3 日，Similarweb 发布报告指出，新闻网站正面临 AI 搜索的严重冲击。新闻网站自然流量从 2024 年中期的 23 亿次/月暴跌至 2025 年的不足 17 亿次/月。而 ChatGPT 新闻相关提示词激增：从 2024 年 1 月至 2025 年 5 月，增长 212%，显示用户越来越依赖 AI 获取新闻摘要。未转化为点击的新闻搜索比例从 2024 年 5 月的 56% 上升至 2025 年 5 月的 69%，这是因为 Google AI Overview 等工具直接提供答案，用户无需访问源网站。

7 月 1 日，微软正式发布 AI 诊断协调器（MAI-DxO），这款新型 AI 工具在复杂病例诊断测试中，表现超越 21 位来自美英的资深医生。该工具能像人类医生一样分析症状、提出追问问题并推荐检查项目。预计该工具可减少 20-30% 无效医疗支出，如避免重复 CT 检查。但微软也特别强调，虽然 MAI-DxO 在独立诊断中表现优异，但现实中医生们并并不会让其独立工作，他们会咨询其他同事，并会整合线上和线下的资源。