,AI 创业公司 MosaicML 近日发布了其语言模型 MPT-30B,该模型具有 300 亿参数,训练成本“仅有其他同类竞品模型的零头”,有望促进行业逐步降低此类模型训练成本,扩大 AI 模型在更广泛领域的运用。
MosaicML 公司的首席执行官兼联合创始人 Naveen Rao 表示,MPT-30B 的训练成本为 70 万美元,远低于 GPT-3 等同类产品所需的数千万美元训练成本。此外,由于 MPT-30B 的成本较低,体积较小,它也可以更快速地被训练,并且更适合部署在本地硬件上。
据悉,MosaicML 使用了 Alibi 和 FlashAttention 技术来优化模型,可以实现更长的文本长度和对 GPU 计算的更高利用率。MosaicML 也是少数几个能够使用 Nvidia H100 GPU 的实验室,相比以往成果,当下每块 GPU 的吞吐量增加了 2.4 倍以上,可带来更快的完成时间。
除了让 AI 技术更容易获得之外,MosaicML 还专注于提高数据质量并提高模型性能。他们目前正在开发一款工具,可以帮助用户在预训练过程中分层加入特定领域的数据,以确保训练中开业实现多样化和高质量的数据组合。
MosaicML 公司表示,将模型扩展到 300 亿参数只是第一步,接下来他们将以降低成本为前提,推出体积更大、质量更高的模型。
IT之家注意到,目前开发者可以从 Hugging Face 下载并使用开源的 MPT-30B 基础模型,开发者还可以在本地硬件上使用自己的数据,对模型进行微调。
感谢IT之家网友独立摄影师的线索投递! ,铭匠光学推出新款28mmL39口镜头,造型小巧,高度不到2cm。 这款镜头采用银色机身设计,复
,全新一代丰田C-HR的官图和官方宣传视频日前正式发布。新车采用全新的设计语言,展现出更具运动风格的跨界姿态。 据悉,新车定位小型SUV,
受中国特色估值体系构建的影响,央国企估值中枢预期持续提升,成为市场关注的重点。此前,国务院国资委党委发表《国企改革三年行动的经验总结与未来展
中国网middot;美丽江苏讯一直以来,工行淮安洪泽人民路支行坚持以客户为中心的服务理念,面对客户的急难愁盼问题做到有求必应事出有效。为了进
最新工资价位表来了。 人社部6月25日发布2022年企业薪酬调查信息,公布了不同职业企业从业人员工资价位、不同岗位等级企业从业人员工资价位
,据小米商城官方微博消息,米家动感单车自发电版将于6月27日正式开售。这款动感单车曾于5月31日在小米商城开启众筹,众筹价1799元,而上市
感谢IT之家网友软媒用户1942143、Manx的线索投递! 6月26日晚间消息,在B站14周年庆直播中,B站董事长兼CEO陈睿发表题为《
感谢IT之家网友华南吴彦祖的线索投递! ,山灵音响发布微博称,旗下将在7月初推出新款SONO入耳式耳机,主打高音质。 据山灵音响官方介绍
,据CNA通讯社报道,鸿海集团于近日成立了富士康新事业发展集团,业务涵盖电动车整车销售和换电设施销售、AI软件研发等。 报道称,富士康新事
京东物流换帅。 6月26日早间,该公司发布公告称,京东物流CEO余睿因个人身体原因辞任执行董事、首席执行官及授权代表,原京东产发CEO胡伟
先驱网--综合性的生活资讯平台
邮箱:hchchc0324@163.com