【新智元导读】最近,来自NUS、UT Austin等机构的研究人员创新性地提出了一种「拖拽式大语言模型」(DnD),它可以基于提示词快速生成模型参数,无需微调就能适应任务。不仅效率最高提升12000倍,而且具备出色的零样本泛化能力。 刚刚,包括尤洋教授在内的来自新加坡国立大学、得克萨斯大学奥斯汀分校等机构的研究人员,提出了一种全新的「拖拽式大语言模型」——Drag-and-Drop LLMs! 通过一个轻量级文本编码器与一个级联超卷积解码器的组合,DnD能在数秒内,仅根据无标签的任务提示词,生成针对该任务的LoRA权重矩阵。 通过观察,研究人员发现,LoRA适配器无非是其训练数据的一个函数:梯度下降会将基础权重「拖拽」至一个特定任务的最优状态。 为了赋予模型「拖拽」的能力,团队将这些数据集的提示词与收集到的LoRA权重进行随机配对,构成DnD模型的训练数据——即「提示词-参数」对。 在推理阶段,团队只需将来自全新数据集(训练中未见过)的提示词输入DnD,仅需一次前向传播,即可获得为该任务量身定制的参数。 实验结果表明,在零样本测试集上,团队的方法相较于训练所用的LoRA模型的平均性能,取得了惊人的提升,并且能够很好地泛化到多种真实世界任务和不同尺寸的LLM。 此前,他在中国科学技术大学获得人工智能学士学位。并曾在北卡罗来纳大学教堂山分校Huaxiu Yao教授的指导下进行实习,以及在中国科学技术大学数据科学实验室跟着导师Xiang Wang度过了两年的时光。 Zhangyang Wang目前是德克萨斯大学奥斯汀分校钱德拉家族电气与计算机工程系的终身副教授,并荣膺坦普尔顿基金会第7号捐赠教席。 他于2016年获伊利诺伊大学厄巴纳-香槟分校电气与计算机工程博士学位,师从计算机视觉泰斗黄煦涛(Thomas S.Huang)教授;并于2012年获中国科学技术大学电子工程与信息科学学士学位。 核心目标是创建结构化、模块化的模型表示:1)在过参数化模型空间中实现高效、鲁棒的学习;2)与符号知识及推理进行无缝连接。 此前,他在新加坡国立大学获得数据科学与机器学习博士学位,在中国科学院深圳先进技术研究院获得计算机技术硕士学位,在北京师范大学珠海校区获得学士学位。
成色18k.8.35mb菠萝此前有报道称托马斯-弗兰克有意带姆贝乌莫加盟热刺,但曼联似乎在争夺布伦特福德上赛季最佳射手的竞争中占据领先位置。近日,久未露面的陈学冬在社交平台晒出一张病床自拍照,他写道:“希望这是最后一次手术了。”照片中,他身穿浅蓝色病号服躺在手术室里,脸上带着明显的疲惫感。成色18k.8.35mb菠萝17cao.gov.cn英超收视下降的原因之一,是“眼球争夺战”的加剧——例如欧冠比赛数量的增加,以及天空体育播放了更多英格兰足球联赛(EFL)比赛,使得球迷的观赛时间被进一步分散。拜仁替补:18-佩雷茨、40-乌尔比希、4-塔、30-基亚拉、49-阿兹努、6-基米希、8-格雷茨卡、27-莱默尔、42-穆西亚拉、46-伦纳特-卡尔、47-桑托斯-戴伯尔、9-凯恩、11-科曼、17-奥利塞、41-阿萨雷
20251207 💫 成色18k.8.35mb菠萝此外,埃基蒂克需要提高自己的终结能力——他在单赛季从未打入超过15个联赛进球,这方面还有提升空间,目前,球员和法兰克福对所有选项持开放态度,他甚至有可能再在法兰克福待一年。www.xjxjxj55.gov.cn20日下午,该公司一工作人员向极目新闻记者表示,公司确实承接了清华大学校园内的树木养护工作,也听说了前几天工作中砸到人的事情,但具体处理情况是另一个部门负责,目前相关负责人不在,他也不了解后续的情况。
📸 张党政记者 张伟 摄
20251207 🔞 成色18k.8.35mb菠萝北京时间6月15日,根据意大利名记罗马诺的报道,目前在莱斯特城担任技术教练的巴里-墨菲将会在下周一与卡迪夫城签约,正式成为这家威尔士俱乐部的新主帅。8x8x.gov.cn自5月20日起,乌军使用西方制造的无人机和火箭弹对俄境内民用设施发动大量袭击。本月1日,就在俄乌在土耳其伊斯坦布尔举行第二轮直接谈判前一天,乌克兰发动代号为“蛛网”的特种作战行动,袭击俄方多个机场,摧毁一批俄军战机。3日,乌方还对克里米亚大桥进行了乌克兰危机升级以来的第三次袭击。乌克兰武装部队总参谋部5日称,当天上午,乌军对俄罗斯布良斯克州的导弹部队聚集区发动了导弹袭击。
📸 高占龙记者 孙怀茹 摄
🌶 这并不是一句过谦的话,如果仔细看,零跑的压力还是很大的。尤其,是现金压力。产品卖得好,就意味着需要更多配套的人力、物力去跟上,专业点说,零跑处于扩张期。扩张,就需要花钱。www.8x8x.gov.cn






