微软开源 Deep Speed Chat
4月12日,微软宣布开源了 Deep Speed Chat,帮助用户轻松训练类 ChatGPT 等大语言模型。Deep Speed Chat是基于微软Deep Speed深度学习优化库开发而成,具备训练、强化推理等功能,还使用了RLHF(人工反馈机制的强化学习)技术,可将训练速度提升15倍以上,成本却大幅度降低。例如,一个130亿参数的类ChatGPT模型,只需1.25小时就能完成训练。☞大裁员之
·
4月12日,微软宣布开源了 Deep Speed Chat,帮助用户轻松训练类 ChatGPT 等大语言模型。
Deep Speed Chat是基于微软Deep Speed深度学习优化库开发而成,具备训练、强化推理等功能,还使用了RLHF(人工反馈机制的强化学习)技术,可将训练速度提升15倍以上,成本却大幅度降低。例如,一个130亿参数的类ChatGPT模型,只需1.25小时就能完成训练。
☞大裁员之后,Meta 为 VR 程序员开出百万美元年薪!
☞商汤加入 ChatGPT 战局,发布“商量”语言大模型!
☞上海 00 后小伙 AI “复活”奶奶,却引发巨大争议
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
已为社区贡献26条内容
所有评论(0)