cover

GitHub星标21.8k！作者登顶github热门开发者榜单榜首！LLM大模型神仙入门教程分享！

也经常活跃在大模型的各种前沿工作和讲座中，GitHub和推特上也有不少粉丝，绝对是大模型领域一位公认的大牛！第一章是带你通透的理解大语言模型，像大语言模型背后的基本概念、类似chatgpt类的大模型的transformer结构，然后开始规划如何从零构建大语言模型。这本书的目的在于从理论和代码层面动手带你从零一步步构建属于自己的大语言模型，从内到外的学习和理解大型语言模型的工作原理。整本书的每个阶段

编程小饴

342人浏览 · 2024-07-16 22:24:38

编程小饴 · 2024-07-16 22:24:38 发布

这位威斯康星大学麦迪逊分校的终身教授塞巴斯蒂安撰写的从零开始构建大模型的入门书。

虽然要在今年的8月份才正式出版，但在github上的星标已经达到了离谱的20.6k了！ 非常受欢迎。

而且这本书的作者不仅仅是终身教授，还拥有其它众多的荣誉。

像之前非常受欢迎的这两本书也是他撰写的，甚至还登顶过github热门开发者榜单榜首！也经常活跃在大模型的各种前沿工作和讲座中，GitHub和推特上也有不少粉丝，绝对是大模型领域一位公认的大牛！

这本书虽然还没出版，但是我已经购买了电子版本，如果你需要这本书的PDF和配套代码可以直接扫码添加我的助手让她无偿及时发送给大家。

这本书的目的在于从理论和代码层面动手带你从零一步步构建属于自己的大语言模型，从内到外的学习和理解大型语言模型的工作原理。构建起你对大语言模型的框架性认知。

整本书的每个阶段都充斥着清晰的文本、图表和示例解释，涵盖了从初始设计和创建到在通用语料库上的预训练，再到针对特定任务的微调。

第一章是带你通透的理解大语言模型，像大语言模型背后的基本概念、类似chatgpt类的大模型的transformer结构，然后开始规划如何从零构建大语言模型。

后面的章节就是使用文本数据、编码注意力机制、从头开始实现gpt模型以生成文本、未标记数据的预训练、文本分类的微调、按照指令进行微调。

确实是一本非常不错的大模型教程书，难怪还未发布就已经这么受欢迎了。

开放原子开发者工作坊

开放原子开发者工作坊旨在鼓励更多人参与开源活动，与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动，如meetup、训练营等，主打技术交流，干货满满，真诚地邀请各位开发者共同参与！

更多推荐

开源成为金融领域创新发展的新动力引擎

开源成为金融领域创新发展的新动力引擎

开放原子开发者工作坊

开源成为推动城市数字化转型的核心动力

城市，不仅是人们工作与生活的基本载体，更是承载着亿万人民的希望与梦想。近年来，我国智慧城市建设如火如荼，开源技术的深度融合为其发展注入了新的活力。在民生、环保、公共安全、城市服务等多个领域，开源技术的应用不仅为民众带来了切实的便捷，而且促进了政府决策的科学化，显著提升了城市综合治理能力。

开放原子开发者工作坊

OpenLoong项目通过技术监督委员会（TOC）评审

OpenLoong项目通过技术监督委员会（TOC）评审

开放原子开发者工作坊

所有评论(0)

查看更多评论

编程小饴

已为社区贡献17条内容