继今年5月发布首款拥有1000亿参数的大型机型OPT—175B之后,Meta又推出了升级版OPT—IML这次有什么改进
今年5月,MetaAI正式宣布发布基于1750亿个参数的超大型模型OPT—175B,同样对所有社区免费。
日前,该模型的更新版本OPT—IML正式上市Meta表示,它已经微调了2000项语言任务,包括1750亿个参数,并将免费用于非商业研究目的
这款更新的OPT—IML性能如何我们来看看最后两张图
这款OPT—IML创造了两种型号,分别为30B和175B。
与旧的OPT模型相比,OPT—IML在14个标准NLP评测任务中的平均性能优于OPT。
这两个模型的规模在零时间学习任务中分别优于7%,在32发任务中分别优于4%和0.4%。
在这项研究中,研究人员描述了增加模型和基准大小如何影响指令调整决策对下游任务性能的影响。
为此,他们开发了OPT—IML Bench,这是一个相当大的指令学习基准,包含2000个NLP任务,根据现有的八个基准划分任务类别。
为了训练OPT—IML 30B和175B,研究人员首先从该框架的角度提出了他们对OPT—30B的指令调优决策的意见。
OPT—IML在四个具有不同目标和输入格式的评估基准的两个尺度上展示了所有三种归纳技能。
它不仅在所有基准测试中显著优于OPT,而且以极具竞争力的方式优于针对该特定基准优化的现有模型。
另外OPT—IML已经开源,Github链接边肖也放在下面~
接下来,让我们通过报纸了解一下IML期权。
大语言模型的指令微调已经成为零样本,少样本情况下增强其泛化能力的有效方法在这项研究中,Meta研究人员对指令微调进行了三项重要的补充
首先,他们编制了一个大规模指令微调基准,其中包含来自八个数据集的2000个NLP任务,按任务类型分类。
研究人员在该基准上选择性地构建评估拆分,以测试三种不同类型模型的泛化能力:
包括来自完整预订类别的任务,来自已见类型的搁置任务和来自已见任务的搁置实例。
指令微调
对模型进行微调,使其与指令一致,是目前机器学习的研究方向之一。
有两种方法可以微调指令一种侧重于通过使用人工注释指令和反馈来微调各种任务的模型,另一种侧重于通过注释或自动地向可公开访问的基准和数据集添加指令
在这项研究中,Meta AI成员专注于第二种技术,并汇编了许多公共可访问的数据集,包括改善OPT的方法。
在研究过程中,Meta成员使用了来自四个基准的1836个任务,并提出了一个类似的扩展方法最后,在调整整个测试以突破具有挑战性的外部基准性能限制的同时,研究人员描述了可能影响下游性能的各种指令调整策略的权重
多任务学习
多任务学习是基于教学的微调的一种表现。
MTL是一种流行的范式,当与共享可比参数或表示的相似函数相结合时,它可以提高任务的泛化性能。
最近几年来,MTL已被应用于许多NLP场景,主要集中在通过使用来自相关活动的信号来提高训练任务或新领域的性能。
相比之下,基于指令的微调有助于我们提高前所未有的问题的泛化性能它是通过指示所有任务组合成一个概念,并通过将模型的权重分配给所有任务来一起训练它们来实现的
什么是OPT。
大规模语言模型,即超过1000亿个参数的自然语言处理系统,在过去几年里改变了NLP和AI研究。
这些模型经过了大量不同文本的训练,显示出令人惊讶的新能力他们可以生成创造性的文本,解决基本的数学问题,回答阅读理解问题等等
虽然在某些情况下,公众可以通过付费的API与这些模型进行交互,但对研究的完全访问仍然局限于少数资源丰富的实验室。
这种受限的访问限制了研究人员理解这些大型语言模型如何以及为什么工作的能力,并阻碍了已知问题的进展,如提高它们的鲁棒性和减少偏见。
出于对开放科学的承诺,Meta AI在今年5月发布了Open Pretrained Transformer,这是一个拥有1750亿个参数的模型,并在公共数据集上进行训练Meta AI之所以分享这个模型,是希望有更多的社区参与了解关于大模型的基础技术
简单来说,Meta向公众开放人工智能研究中使用的大规模语言模型的访问权限,从而实现人工智能在大规模模型研究中的民主化。
与旧版本相比
根据Meta发布的IML版本,它经过了微调,在自然语言任务上的表现优于旧的OPT版本。
典型的语言任务包括回答问题,总结课文和翻译。
为了进行微调,研究人员使用了大约2000项自然语言任务这些任务分为八个NLP基准,也是由研究人员提供的
平均来说,以模型30B和175B为例,OPT—IML提高了OPT的零阶学习精度约6—7%在32项研究中,有300亿个参数的模型精度显著提高,有1750亿个参数的模型精度略有提高
经过比较,Meta团队发现OPT—IML在所有基准测试中的性能都优于OPT,在零样本和少样本的学习精度方面,也比其他基于指令微调的模型更具竞争力。
参考资料:
2022年第四季度,浙商银行向全国银行间债券市场成功发行100亿元小微金融债,100亿元绿色金融债和50亿元三农专项金融债募集资金用于加大对
自12月7日十个新在多地全面实施和放松疫情控制后,疫情似乎已经绑住了大家的心。 根据截图,如果是晴天,扔垃圾的时候最好把垃圾弄死,因为很多
日前,近期一直走低的光伏板块迎来报复性反弹中证光伏行业指数大涨6.17%,收于4095点其中,胶膜,储能,变频器,HJT,元器件等概念涨幅居
最近抗新冠肺炎药热度极高,很多中成药备受关注,包括华清文和华清科这对姐妹花根据消息显示,在国家中医药管理局发布的《新冠肺炎居家感染者中医药干
,拼多多正式启动2023年货节期间,平台将联合全国各省市数千家地标产区,优选百万优质商家,从货源上为众多好年货保驾护航拼多多将全力刺激和匹配
《关于实施知识价值导向分配政策的若干意见》对实施知识增值导向分配政策作出了全面部署科技部副部长托米在此前举行的国新办新闻发布会上解释说,意见
中国经营网消息:古人云:“百善孝为先”,孔子说过,“夫孝,德之本也”。孝敬父母是中华民族的传统美德。从古至今,从伟大到平民百姓再到我们身边得
总装机容量百万千瓦的漂浮式海上风电项目二十六日在海南省万宁市开工这是中国第一个大型海上风电项目,也是世界上最大的商业浮动海上风电项目 同日
本期投资小贴士: AHP得分——信邦智能为1.71,占总分的30.4%在考虑流动性溢价因素后,我们计算出信邦智能AHP得分为1.71,为非
浙江建投今日上涨2.95%,全天换手率15.11%,成交额24.96亿元,振幅15.37%龙榜数据显示,机构净买入2337.24万元,营业部
先驱网--综合性的生活资讯平台
邮箱:hchchc0324@163.com