这位威斯康星大学麦迪逊分校的终身教授塞巴斯蒂安撰写的从零开始构建大模型的入门书。

虽然要在今年的8月份才正式出版,但在github上的星标已经达到了离谱的20.6k了! 非常受欢迎。

而且这本书的作者不仅仅是终身教授,还拥有其它众多的荣誉。

像之前非常受欢迎的这两本书也是他撰写的,甚至还登顶过github热门开发者榜单榜首!也经常活跃在大模型的各种前沿工作和讲座中,GitHub和推特上也有不少粉丝,绝对是大模型领域一位公认的大牛!

这本书虽然还没出版,但是我已经购买了电子版本,如果你需要这本书的PDF和配套代码可以直接扫码添加我的助手让她无偿及时发送给大家。

这本书的目的在于从理论和代码层面动手带你从零一步步构建属于自己的大语言模型,从内到外的学习和理解大型语言模型的工作原理。构建起你对大语言模型的框架性认知。

整本书的每个阶段都充斥着清晰的文本、图表和示例解释,涵盖了从初始设计和创建到在通用语料库上的预训练,再到针对特定任务的微调。

第一章是带你通透的理解大语言模型,像大语言模型背后的基本概念、类似chatgpt类的大模型的transformer结构,然后开始规划如何从零构建大语言模型。

后面的章节就是使用文本数据、编码注意力机制、从头开始实现gpt模型以生成文本、未标记数据的预训练、文本分类的微调、按照指令进行微调。

确实是一本非常不错的大模型教程书,难怪还未发布就已经这么受欢迎了。

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐