【新智元导读】刚刚,由上海交通大学人工智能学院Agents团队提出的AI专家智能体,在OpenAI权威基准测试MLE-bench中击败了业界AI顶流微软,夺冠登顶! MLE-bench是衡量AI在机器学习工程(MLE)中表现的权威基准。它精选Kaggle上的75个相关竞赛,构建多样任务,测试AI在模型训练、数据准备、实验运行等机器学习工程中的能力 类似于AlphaGo向AlphaZero的演进路径,该过程经历了从人类辅助训练到完全自主优化的阶段,体现出AI系统在自我演进上的潜力和可行性。 与先前方法相比,ML-Master在所有评价维度上均全面领先,尤其在中等难度任务上奖牌率提升2.2倍(20.2% vs 9.0%),计算效率翻倍(仅需12小时 vs 基线24小时)。 尽管大型语言模型(LLM)和自主智能体在AI4AI领域取得显著进展,但现有方法仍面临核心挑战:探索与推理的割裂限制了性能提升。 因此,如何有效整合探索与推理,让AI系统能够像人类专家一样在解决复杂问题时既能广泛探索又能深度思考,成为AI4AI领域的核心挑战。 动态优先级调整:根据潜在价值分配计算资源,实时评估不同分支的潜力,将更多计算资源投入到更有希望的方向,避免无效探索。 自适应记忆机制:精准提取关键洞察,避免信息过载,智能筛选历史探索中的有效信息,既保留宝贵经验又避免冗余干扰,让每次推理都建立在更相关的知识基础上。 情境化决策:基于历史经验进行有根据的分析,不再是「拍脑袋」决策,而是结合具体执行反馈和成功案例,让AI的每个决定都有据可依。 闭环学习系统:持续从执行反馈中学习优化,探索结果实时反哺推理过程,形成「探索→推理→优化→再探索」的良性循环,实现持续自我提升。 智能记忆构建:探索模块自动收集执行结果、代码片段和性能指标,同时选择性整合来自父节点和并行兄弟节点的关键信息,避免信息过载。 嵌入推理决策:记忆信息直接嵌入到推理模型的「think」部分中,让每次推理都基于具体的历史执行反馈和多样化探索的经验进行精准决策。 协同进化机制:推理结果指导后续探索方向,探索经验持续丰富推理过程,真正实现了探索驱动推理进化,推理反哺探索路径的良性循环。 该基准由75个来自Kaggle的真实机器学习任务组成,涵盖从代码编写、模型调参到结果提交的完整流程,是目前最权威、最贴近实际工程场景的AI测试之一。其中不少任务取材自CVPR等国际顶级学术会议。 除了推出面向机器学习的专家智能体ML-Master,上海交通大学人工智能学院Agents团队后续将依托上海交通大学AI-X研究院,陆续推出覆盖各领域的专家智能体,构建有影响力的智能体生态体系,为人工智能技术的创新发展与广泛应用注入新动能。 上海交通大学人工智能学院是上海交通大学顺应发展趋势、对接国家战略、服务城市先导产业而成立的实体学院,是举全校之力组建的特区学院。 学院通过高层次定位和全新体制机制,致力于培养中国自主的人工智能卓越人才,为国家高水平科技自立自强提供有力支撑。学院基础雄厚、生源拔尖、设施完备、条件优越,为上海交通大学百年徐汇校区注入了全新的活力。 学院秉承「用人工智能变革世界,用人才变革人工智能」的愿景,以「引育顶尖人才、产出顶尖成果、孵化顶尖企业」为目标,致力于构建全链条创新体系,打造中国人工智能领域的「黄埔军校」,引领中国人工智能发展。
抖阳加拉塔萨雷将为恰尔汗奥卢送出一份年薪1000万欧元、到2028年到期的合同,目前国米还没有收到正式报价,他们要求3000万欧元-4000万欧元转会费直播吧6月21日讯 世俱杯小组赛C组第2轮,本菲卡对阵奥克兰城,比赛在埃克斯普洛里亚球场进行。上半场,迪马利亚补时点射。比赛因天气原因中断仅2个半小时。易边再战,帕夫利季斯传射,桑谢斯破门,巴雷罗双响,迪玛利亚补时造点再点射。最终本菲卡6-0奥克兰城。积分榜方面,本菲卡4分暂升第一,奥克兰城0分丢16球垫底。抖阳8x8x.gov.cn以色列国防部发言人还表示,巴黎航展主办方的决定除了政治背景以外,也包含了商业动机,因为以色列受到影响的这些军工企业“与法国的军工产品形成竞争态势”。vivo X Fold5 还首发支持了安卓直通 iCloud 云盘,用户可以直接在 X Fold5 文件管理中访问 Mac 电脑文件的功能,虽然实际的传输速度与便捷性无法与本地文件相提并论,但同样是一招关键的「破壁」招式,面对 iCloud 文件分享链接,在大屏幕上可以处理的更加游刃有余。
20251207 🍌 抖阳随着特朗普重返白宫以来首次前往加拿大、首次亮相国际舞台,美国的小伙伴们焦急地注视着他是想挑起战斗,还是表现得像个政治家,以赢得国内选民的支持。WWW.17CAO.GOV.CN在生娃这件事情上,马斯克一方面大力鼓吹受过教育的人应该多生娃,一边又拒绝承认自己和孩子的亲子关系,甚至经常用钱封口。这是否一众充满矛盾(疯感)的言行?
📸 张丰奇记者 岳萌阳 摄
20251207 😈 抖阳弗拉纳根表示:“我会把勒布朗-詹姆斯比作篮球界的汤姆-布雷迪。我认为,勒布朗对媒体的兴趣从他职业生涯早期就展现得比布雷迪更为浓厚。天啊,试想一下——如果未来NBA转播席上同时出现迈克尔-乔丹和勒布朗-詹姆斯,那会是怎样的历史时刻!”www.zjzjzjzjzjy.gov.cnA组的焦点大战,波尔图1-2遭到迈阿密国际的逆转,梅西的任意球破门,将波尔图逼入绝境。3战1分的波尔图,很可能小组赛踢完就打道回府。
📸 李刚记者 梁延华 摄
🌸 在整个第三节,二人没再闪耀。但第四节刚开始,亚历山大行进中就分球给三分线外的维金斯,后者张手命中。9分54秒,维金斯造刚进攻得手的西亚卡姆犯规,2罚全中。8分06秒,杰威刚命中3分,将被迫近到2分的分差再度拉开,华莱士紧接着又是命中,直接打停对手。从那之后,步行者再难组织起有效的反攻。www.7788.gov.cm






