7 月 30 日,微软宣布在 Edge 浏览器中推出全新 Copilot 模式。开启该模式后,Edge 将激活其内置的 AI 智能体,该 AI 智能体不再被动响应,而是能主动预测并协助用户浏览行为,例如自动预测用户操作路径、智能整理标签页,减少信息负担、主动理解和梳理搜索内容等。
7 月 28 日,全球首个设计类 AI Agent – Lovart 正式上线。该产品由腾讯混元大模型提供技术支持,特别是在 3D 内容生成方面,Lovart 将优先调用混元 3D 模型 API 接口,为用户带来高清、细节丰富的建模体验。 Lovart 聚焦于设计领域,借助 AI 能力帮助用户自动生成、优化和呈现各种创意设计,涵盖视觉、3D建模、空间构图等多个方向。
7 月 28 日,据《科创板日报》报道,特斯拉方面透露,其第三代人形机器人 Optimus Gen 3 已在美国工厂完成实测,并计划于 2025 年进入中国 C 端市场,正式向家庭等消费场景开放应用。还表示,预计到 2026 年实现量产,并制定了 5 年内年产 100 万台的宏大目标。
7 月 26 日,阿里巴巴自研 AI 眼镜 – 夸克 AI 眼镜模型亮相 2025 世界人工智能大会。此前,该款 AI 眼镜一直处于严格保密阶段,这是其首次以完整产品形态亮相。该眼镜将具备常见的 AI 可穿戴设备基础功能,包括语音助手、音乐播放、电话通话、实时翻译等; 同时还将深度整合阿里生态系统的关键服务,如高德地图、支付宝支付与淘宝购物; 技术开发由高德、支付宝、淘宝等核心团队共同参与;AI 模型方面,将调用阿里大模型“通义千问”,并由夸克团队训练学习与健康等垂直模型。
7 月 26 日,OpenAI 准备在 8 月初正式推出 GPT-5 。
7 月 23 日,美图公司近期发布的 AI Agent「RoboNeo」 在上线仅一周后便登顶国内 App Store 分类榜。 该产品于 7 月 14 日正式上线,支持多种图像生成与编辑场景,如商业精修、品牌设计、电商物料制作等。它主要面向 P 图用户、内容创作者、设计师、电商卖家与新媒体运营人员,并迅速在社交平台上引发热议,用户大量分享使用 RoboNeo 生成的 chibi(Q版)、emoji 表情包、卡通人物等作品。
7 月 23 日,智元机器人在其官网正式上架旗下四足机器人 D1 ULTRA。该机器人被定位为“行业级小型四足机器人”,最高奔跑速度达 3.7 米/秒,主要应用于特种任务、安防巡检、科研教育等多个场景。
7 月 23 日,Amazon 确认其计划收购位于旧金山的 AI 可穿戴设备初创公司 Bee,但交易的具体条款尚未披露。 Bee 公司主打产品是一款售价 49.99 美元的 AI 腕带,内置麦克风和人工智能系统,能够实时监听和分析对话内容,进而生成摘要、待办事项、提醒等信息辅助。其定位类似于“随身 AI 助手”,强调隐私控制与轻量级设计。
7 月 22 日,字节跳动旗下 Seed 团队正式发布通用机器人模型 GR-3,并同步推出其配套硬件平台 – 双臂移动机器人 ByteMini。 与此前依赖大量机器人轨迹训练的 VLA 模型不同,GR-3 强调 低样本学习能力,可通过极少的人类示范数据进行微调,从而快速适应新任务和新物体识别,具备出色的泛化能力和实际部署潜力。 此外,GR-3 在长程任务处理能力和高灵巧度操作方面表现优异。作为载体的 ByteMini 是一款通用型双臂机器人,设计用于在现实环境中高效执行复杂任务。
7 月 22 日,国产 AI 算力基础设施服务商基流科技宣布完成近亿元 A+ 轮融资。基流科技成立于 2023 年,专注于大规模 AI 算力集群的通信网络建设,提供高性能互联软硬件解决方案,已参与多个百卡、千卡至万卡级算力集群项目,并实现跨远距离训推算力集群的商业化落地。公司累计融资达数亿元,投资方涵盖一线基金、产业资本和地方国资。
7 月 21 日,京东在机器人领域密集出手,一日内连续投资三家具身智能企业: 1)千寻智能 – 完成 6 亿元 Pre-A+ 轮融资,由京东领投,聚焦VLA(视觉-语言-动作)模型研发,其人形机器人 Moz1 可执行办公场景任务。2)逐际动力 – 获京东战略领投,其双足机器人TRON 1已在巡检、配送等领域应用,计划下半年量产全尺寸人形机器人。3)众擎机器人 – 完成两轮融资(含 A1 轮京东领投),累计融资近 10 亿元,产品覆盖教育、商业服务等场景,并计划拓展中东市场。
7 月 20 日,埃隆·马斯克在社交平台宣布,其人工智能公司 xAI 将推出专为儿童设计的 AI 应用 – “Baby Grok”。马斯克表示,该应用将提供“友好型内容”,但未透露具体功能细节。这是继 Grok-1.5 大模型发布后,xAI 首次涉足儿童 AI 领域。
7 月 19 日,Manus(通用 AI 智能体公司)联合创始人季逸超发布了一篇技术长文,首次系统性复盘公司在 AI Agent 研发中的经验教训。指出自研大模型给公司带来了太多的羁绊,后续会专注“上下文设计”(Context Engineering)。而对最近闹的沸沸扬扬的裁员67%(国内仅留40人)、总部迁至新加坡、清空中国社交账号等行为未做任何解释。
7 月 18 日,国内全栈自研人工智能算力芯片企业曦望(Sunrise)宣布完成近 10 亿元人民币的新一轮融资,投资方包括三一集团旗下华胥基金、第四范式、游族网络、北京利尔、松禾资本、海通开元等知名产业资本和投资机构。曦望表示,本轮资金将主要用于产品研发、市场拓展和团队建设,进一步巩固其在国产高端 GPU 领域的技术领先地位。
7 月 17 日,OpenAI 正式发布了 ChatGPT Agent,标志着 AI 从“对话助手”向“自主执行者”的跨越式升级。该智能体整合了 Operator(网页交互)、Deep Research(深度信息整合)和 ChatGPT(自然语言处理) 三大核心技术,具备自主思考、工具选择和任务执行能力,可独立完成复杂任务,如数据分析、PPT生成、行程规划等等。
7 月 17 日,德国马克斯・普朗克人类发展研究所发布的一项新研究表明,以 ChatGPT 为代表的 AI 聊天机器人正在反向影响人类语言习惯,导致人们在日常交流中更频繁地使用“GPT词汇”,如“深入研究” delve、“细致” meticulous 等。研究团队通过分析数百万篇人类文本经 AI “润色”后的变化,并追踪 36 万段 YouTube 视频和 77.1万 个播客节目的语言使用趋势,发现这些 AI 偏好的词汇在英语口语中的出现频率显著上升。
7 月 17 日,在第三届链博会先进制造链主题活动上,英伟达 CEO 黄仁勋提出,人工智能的下一个浪潮将是“物理AI”(Physic AI)。物理AI 是指基于物理规律(如力学、电磁学、热力学)构建的 AI 模型,能够模拟、预测并优化现实世界的物理过程。这种基于物理规律与 AI 融合的技术方向,有望在工业、制造、科研等领域带来革命性突破。
7 月 15 日,OpenAI 前首席技术官 Mira Murati 创立的 AI 初创公司 Thinking Machines Lab 宣布完成 20 亿美元巨额融资,由顶级风投机构 Andreessen Horowitz(a16z)领投,英伟达、AMD、Accel、ServiceNow、思科、Jane Street等科技巨头和投资机构参投。Murati 透露,公司首款产品“将在未来数月推出”,但未公开具体细节。
7 月 15 日,格力申请的“空调机器人控制方法、装置、设备及介质”专利正式公布。根据专利说明,该空调机器人能够通过多模态感知和 AI 动态调控,实现自主跟随用户移动,并提供精准的个性化送风服务。
7 月 14 日,人工智能初创公司 Cognition AI(因做出全球首个 AI 软件工程师 Devin 而闻名)宣布签署最终协议,收购 AI 编程初创公司 Windsurf,交易涵盖 Windsurf 的知识产权、产品、商标及现有业务。就在 3 天前,Google 以 24 亿美元挖走 Windsurf 前 CEO Varun Mohan、联合创始人 Douglas Chen 及部分核心团队。
7 月 14 日,据媒体报道,苹果公司正认真考虑收购欧洲最大 AI 初创公司 Mistral AI 。若交易达成,可能成为苹果历史上规模最大的并购案,远超 2014 年收购 Beats 的 30 亿美元纪录。 Mistral AI 是一家法国 AI 公司,专注于高效开源大模型如 Mistral 7B、Mixtral 8x22B,在性能与成本平衡上表现突出。目前该公司已通过 7 轮融资筹集 11 亿欧元,并正寻求新一轮 10 亿美元融资。 苹果若成功收购,将大幅增强其在生成式 AI 领域的竞争力,弥补目前落后于微软、谷歌等对手的 AI 格局。
7 月 13 日,美国 AI 搜索初创公司 Perplexity 的 CEO 阿拉温德(Aravind Srinivas)在社交媒体透露,公司可能会基于月之暗面(Moonshot AI)最新发布的 Kimi K2 模型进行后训练(post-training)。 Kimi K2 是月之暗面近期发布的一款万亿参数开源模型,采用MoE(混合专家)架构,激活参数为 32B,在代码能力、Agent 任务和数学推理方面表现优异。 Perplexity 此前曾使用 DeepSeek R1 进行模型训练。
7 月 11 日,高盛(Goldman Sachs)宣布将试点全球首个 AI 程序员,该 AI 程序员由初创公司 Cognition 开发,具备自主编写、调试和优化代码的能力。高盛技术主管 Marco Argenti 透露,这位“ AI 同事”将加入公司现有的 12,000 名人类开发者团队,共同参与金融系统开发。 此前,华尔街其他机构(如摩根大通、摩根士丹利)已部署基于 OpenAI 模型的认知助手,但高盛此次试点是首次引入全自主 AI 程序员,而非仅辅助工具。
7 月 10 日,欧盟委员会正式发布《通用人工智能行为准则》(General-Purpose AI Code of Practice)。该准则整合了来自 AI 开发者、学术界、民间组织、版权方及安全专家等 1,000 多位利益相关者的意见。
其主要监管对象是通用人工智能(AGI)模型,即能执行广泛任务并集成至下游应用的AI系统(如ChatGPT、Gemini、Llama等)。 有三大监管重点:1)透明度 – 要求企业披露模型训练数据、决策逻辑,并提供可解释性文档;2)版权保护 – 规范数据爬取行为,确保训练数据合法,并设立侵权投诉机制;3)安全与保障 – 要求企业识别系统性风险,建立安全防护措施。 该准则将于 2025 年 8 月 2 日起正式实施。
7 月 10 日,AI 搜索领域迎来重磅竞争: Perplexity AI(英伟达投资)推出 AI 浏览器 Comet,主打自然语言搜索和答案直出功能,剑指谷歌搜索。OpenAI 同日被曝也计划推出 AI 浏览器,或整合 ChatGPT 的交互式搜索能力。 当前,谷歌 Chrome 占据全球浏览器市场 68% 的份额(StatCounter数据),但 AI 驱动的“无链接搜索”模式正挑战传统搜索引擎的商业模式。
7 月 8 日,麻省理工学院(MIT)研究人员宣布开发出一项名为 mmNorm 的新型“透视眼”技术,该技术利用毫米波信号(与Wi-Fi同频段)结合 AI 算法,通过分析物体表面反射的毫米波信号方向(“表面法线”),结合多天线数据融合,生成高分辨率 3D 图像。在不拆封、不接触的情况下,高精度重构隐藏物体的 3D 形状,如箱子内的物品、墙壁后的结构等。 该技术在60多种物体上的重建准确率达 96%,比传统雷达技术(78%)提升 18%。
7 月 9 日,Meta 宣布在英国剑桥投资 1,200万英镑设立音频研究实验室,重点提升其 AR/AI 眼镜(如Ray-Ban Meta、Oakley Meta)的音频技术。该实验室将专注于环境感知音频、智能降噪和空间音频交互,旨在打造能动态适应用户周围声场的下一代可穿戴设备。Meta 的 AR 眼镜此前被诟病 “视觉强、音频弱”,此次投资直指苹果Vision Pro的竞争优势(空间音频+耳罩级音质)。
7 月 7 日,智元机器人(Agile Robots)发布新款人形机器人 “灵犀X2-N”,该产品可在轮式与足式之间自由切换,以适应不同地形需求。足式模式下可盲走上台阶(无需视觉辅助),最大负载 12 斤。 具备六自由度腿部调节,可应对推搡、跌落等突发情况。 轮式模式移动速度显著提升,可 360°灵活转向,支持边走边滑,适应单边桥、斜坡等复杂地形。
7 月 7 日,美国亿万富翁投资人 Mark Cuban 在 High Performance 播客中发表观点,认为 AI 的影响力将超越互联网和云计算,并将催生全球首位万亿美元富翁,且这位富豪可能并非来自传统行业(如科技巨头或金融大亨),而是一位 “默默无闻的开发者”,通过让 AI 成为大众生活的基础工具而实现财富爆发。
7 月 7 日,Isomorphic Labs 总裁 Colin Murdoch 宣布,该公司首款由 AI 设计的癌症治疗药物即将进入首次人体临床试验,标志着 AI 制药从理论研发迈向临床验证的关键一步。
Isomorphic Labs 是由 Google DeepMind 拆分成立的公司,源自其最具代表性的突破性研究成果——AlphaFold。 AlphaFold 是 DeepMind 开发的首个用于预测蛋白质三维结构的 AI 工具。2024 年,DeepMind 推出了第三代 AlphaFold 模型(AlphaFold 3),并称其为一款“革命性模型”,能够“以前所未有的准确度预测所有生命分子的结构及其相互作用”。
7 月 6 日,雷鸟创新(RayNeo)通过官方微博宣布,旗下雷鸟V3 AI 拍摄眼镜夏季重大更新: AI 备忘录功能上线 – 支持语音或手势触发实时记录,并自动生成结构化摘要(如会议纪要、待办清单)、拍摄能力提升和苹果生态接入。
7 月 5 日,科技媒体在 ChatGPT 网页版及安卓应用的测试代码中发现 “计算机工具操作” 相关字符串,包括: “点击”、“双击”、“拖拽”、“输入”、“终端反馈” 等等,推测其将引入类似 Operator 的 AI 智能体。Operator 是 OpenAI 此前推出的首款自主操作浏览器的 AI 智能体,可像人类一样执行在线任务(如订餐、购票)。
7 月 5 日,微软(Microsoft) 确认将启动新一轮裁员,计划削减约 9,000 名员工,这是继今年 5 月裁员 7,000 人后的又一次大规模人员调整。微软 CEO 萨蒂亚·纳德拉(Satya Nadella)曾在4 月透露,公司 20%~30% 的代码由 AI 生成,且比例仍在增长。
7 月 4 日,马斯克旗下 xAI 公司的 Grok 4 大模型意外通过源代码泄露而提前曝光:有开发者在 xAI 控制台发现了 Grok 4 和 Grok 4 Code 两个新模型的引用,而原计划 5 月发布的 Grok 3.5 被直接跳过。与此同时,xAI 宣布完成 100 亿美元(约 716 亿人民币)融资,资金将用于加速 Grok 4 的研发和部署。
官方宣称 Grok 4 在自然语言、数学和逻辑推理方面的能力“无与伦比”。Grok 4 目前支持文本模态,视觉、图像生成和其他功能即将推出,将包含函数调用、结构化输出和深度思考功能。
马斯克还提出一个颠覆性目标: “用 Grok 4 重写人类知识库” – 即利用 AI 的推理能力,修正错误知识、填补空白,并基于这个“纯净版”知识库重新训练下一代AI。
7 月 4 日,Meta 宣布研发 “Project Omni”,旨在开发一款能够主动与用户互动的 AI 聊天机器人。该机器人基于用户历史聊天记录,可在未被直接触发时发起对话(如:“晚上好,最近有发现新音乐吗?”)。通过提供个性化互动体验,提升用户黏性。该 AI 机器人还可接入第三方应用如信息提醒服务等。 训练数据由数据标注公司 Alignerr 提供。项目目前仍处于开发阶段,正式上线尚需较长时间。
7 月 3 日,Similarweb 发布报告指出,新闻网站正面临 AI 搜索的严重冲击。新闻网站自然流量从 2024 年中期的 23 亿次/月暴跌至 2025 年的不足 17 亿次/月。而 ChatGPT 新闻相关提示词激增:从 2024 年 1 月至 2025 年 5 月,增长 212%,显示用户越来越依赖 AI 获取新闻摘要。未转化为点击的新闻搜索比例从 2024 年 5 月的 56% 上升至 2025 年 5 月的 69%,这是因为 Google AI Overview 等工具直接提供答案,用户无需访问源网站。
7 月 1 日,微软正式发布 AI 诊断协调器(MAI-DxO),这款新型 AI 工具在复杂病例诊断测试中,表现超越 21 位来自美英的资深医生。该工具能像人类医生一样分析症状、提出追问问题并推荐检查项目。预计该工具可减少 20-30% 无效医疗支出,如避免重复 CT 检查。 但微软也特别强调,虽然 MAI-DxO 在独立诊断中表现优异,但现实中医生们并并不会让其独立工作,他们会咨询其他同事,并会整合线上和线下的资源。