前言

说实话,过去这一年人工智能的发展真是太疯狂了! 尤其是大型语言模型这块,简直就是颠覆性的突破

你看国际巨头们推出的chatgpt、copilot,Gemini、claude等等,不论是在对话、问答,还是写作、分析判断方面,那些模型展现出的语言理解和生成能力都超强。

但是很可惜啊,因为网络环境原因,国内用户大多使用不了。不过大家也不用担心,国内的AI企业和科研机构们也紧跟不放,大家也都纷纷推出了一大批参数高达数十亿乃至数百亿的大语言模型。

和国外的那些"重量级"不同,咱们国产模型各有各的长处和特点。比如某些侧重通用对话能力,某些则专注于特定行业领域;有的追求开放领域任务的全能型,有的则瞄准特定的专业应用场景等等。

总之,国内大模型阵营可谓是百花齐放、样样精彩。那么它们到底各自有啥独门绝技?咱们今天就来盘点盘点,给有兴趣的你掌个全景。

国内顶尖大模型盘点

其实,掌握并善用这些国产大模型的强大能力,对我们每个人的工作学习效率来说,都是一个事半功倍的机会。

想象一下,只需简单提出需求,这些语言大模型就能帮你快速生成高质量的文案创作、智能摘要、程序代码,甚至是决策分析报告等等,随叫随到。再也不用为写作困难、脑力缺乏而头疼了。更关键的是都是都能免费使用

更进一步说,掌握了先进大模型的使用方法,你将快人一步,把这个AI产品作为自己的工具和武器,在工作学习的效率和质量上,将远远拉开与他人的差距。

排名不分先后,仅从个人使用体验出发

kimi chat

Kimi Chat是由一家名为"月之暗面"的公司开发。它对中文语言有着出色的处理能力,超长上下文一次性阅读50份文档,支持20万字上下文输入。现在内测200万字的超长上下文,可谓长文本领域的佼佼者

据传现在估值已经是达到了30亿美金,妥妥的AI独角兽了。

目前使用下来也是最常用的一款AI工具了,长文本能力几乎没有对手。速度也是相当快,生成文本质量也还行中规中矩。

手机端app和网页端都可以使用也是比较方便,目前除了生成文本以外不支持生成图片

coze(扣子)

Coze(扣子)是由字节跳动推出的AI机器人创建平台,直接对标chatgpt。

它是一个一站式AI Bot开发平台,允许用户无论是否有编程基础,都能快速搭建各类AI应用,并一键发布到飞书、微信公众号等渠道。

Coze提供了丰富的功能,包括插件系统、知识库、数据库记忆能力、定时任务、工作流等。

个人感觉coze目前来讲最强大最良心的平台,适合比较喜欢折腾的朋友,平台基本涵盖了目前主流大模型,基本是可以实现各种复杂的工作流。

国内版目前还推出了图像流功能,可以实现很精准的图像控制生成。字节感觉在下一盘大棋,通过Coze,旨在降低AI应用开发的门槛,让更多人能够享受到AI技术带来的便利和创新可能性

目前只有网页版,手机端可以通过创建的机器人部署到微信,豆包,飞书来使用这样。之后我们公众号也会部署一个机器人来供大家使用体验。

豆包

在2024年第一季度iOS实力AI产品排行榜中,「豆包」强势占据榜首。作为字节旗下的首款类GPT应用,「豆包」自2023年8月上线后便受到了广泛关注。

「豆包」以“全能助手”为主要定位,能够提供聊天对话、问答解答、写作辅助、文案生成、翻译服务等多种功能,满足用户多方需求。

除此之外,与其他同类产品相比,「豆包」更加聚焦“**能够提供情感陪伴的AI聊天机器人”**的产品属性。无论在产品功能还是在交互体验设计上,其都更加侧重“拟人化”和“真实感”。

想必刷抖音的都有刷到各大博主推荐的这款豆包AI工具吧,也是字节旗下。

电脑端网页端手机app都可以使用,也都有生成图片功能,图片质量还是可以的。

手机端AI对话功能和chatgpt也是差不多一样的体验,而且可以克隆自己的声音来创建机器人,自己和自己对话哈。

在这里插入图片描述

通义千问

通义千问是阿里云推出的一款先进的大语言模型,专为理解和生成自然语言设计。

它能够处理长文档,支持高达1000万字的文本分析,使其在金融、法律、科研、医疗等多个领域都有广泛的应用前景。

用户可以通过简单的指令与通义千问进行互动,获取信息摘要、文档分析、文本创作等服务。这款AI工具不仅提高了工作效率,还为专业人士提供了深入洞察和决策支持。

阿里出品,这款AI工具也是非常强大,生成文本质量稍微比kimi的要好点,但是长文本能力还是不如kimi。

但是功能强大很多,也是支持生成图片,而且图片质量还不错,而且还可以生成中文字体的图片,这一点其他AI工具都做不到。

聊天对话里面已经预设了很多角色,使用起来也是非常方便。也可以在百宝箱里面挑选适合自己任务的角色来使用。

在效率里面也是有很多很实用的功能,实时记录,音频转文字,博客链接转写等等这些实用功能。

特别是通义听悟这个功能,非常实用,是通义千问大模型的音视频工作学习AI助手。而且有网页版插件,安装即可实时使用。

主要应用于会议、学习、访谈、培训等多种场景。以下是通义听悟的核心功能和特点详细介绍:

  1. 实时记录与翻译:在会议或学习过程中,通义听悟可以实时记录交流内容并同步翻译成所需语言,有助于跨语言沟通和国际交流,确保信息的即时性和准确性。

  2. 音视频转写与整理:它可以批量转写音视频文件为文字,不仅准确快速生成记录,还能区分不同的发言人,使得后续查阅和整理更加方便。

  3. 智能摘要与概览:通过强大的自然语言处理能力,通义听悟能够智能提炼出全文概要、章节速览以及发言总结,帮助用户快速把握关键信息,提高内容消化效率。

  4. 关键词提取与管理:自动识别并提取音视频中的关键词、问题点和待办事项,方便用户快速聚焦重点,同时也便于后续的行动安排和任务管理。

  5. 笔记编辑与导出:支持用户对记录的内容进行编辑整理,并能导出记录,形成结构化的知识文档或笔记,方便个人存档或团队共享。

  6. 高效检索:允许用户自主检索关键词,精准定位到音视频中的核心信息点,使得回顾和复习变得轻松高效。

  7. 音字对应播放:在文字记录的同时,保持与音频的同步对应,点击文字即可播放对应音频片段,增强互动性和准确性。

  8. 音视频问答助手“小悟”:最新升级的功能之一,能够对长篇幅、跨记录甚至是多语言的音视频内容进行自由问答,大大提升了信息查询和整理的便利性。

  9. 多场景适应性:无论是企业办公环境中的会议、面试、培训,还是个人学习、研究等场景,通义听悟都能提供定制化支持,集成至OA、IM、CRM等办公系统中,提升工作效率。

通义听悟通过这些全面且强大的功能,展现了AI技术在提升音视频内容处理效率方面的巨大潜力,是推动工作与学习智能化的重要工具。

你以为这就完了吗?不仅可以生成文本,图片,音频转录翻译,还能生成视频

抖音上很火的萌娃说话视频就是通过通义千问实现的。

还有输入一张照片即可实现一段跳舞视频也是。

这个功能目前只能在手机app中实现,打开手机通义千问app,**在聊天框中输入“EMO”**即可解锁这个隐藏功能。

不得不说阿里出的这个通义千问大模型,确实功能相当强大,使用起来也是非常方便网页端手机端也都可以使用。

智谱清言

智谱清言是由北京智谱华章科技有限公司推出的一款生成式AI助手。

它于2023年8月31日正式上线,具备多种功能,包括通用问答、多轮对话、创意写作、代码生成以及虚拟对话等。

该公司是由清华大学计算机系技术成果转化而来的。智谱AI致力于开发新一代认知智能通用模型,并与清华大学有着紧密的联系,其创始团队也来自清华大学。

智谱清言的特点包括:

  1. 通用问答:能够回答用户的各类问题,涵盖众多领域,为用户提供实时、准确的信息和解决方案。

  2. 多轮对话:具备出色的对话能力,可以与用户进行自然、流畅的多轮对话,提供高效的沟通体验。

  3. 虚拟对话:能够根据用户的需求扮演不同角色,如专业人士、故事角色等,增强互动性和用户体验。

  4. 创意写作:可以为用户的各类创作需求提供脑暴灵感、内容框架以及高质量的文案等,提升写作效率和质量。

  5. 代码生成:能够使用多种编程语言进行开发和调试,帮助解释代码、解答编程问题或提供编程建议。

此外,智谱清言还具有“智能体”设计,允许用户在平台上创建多个智能体,例如教师智能体、画师智能体,以完成丰富多样的专业任务。智谱清言的易用性也是其受到好评的原因之一,它能够完美融入日常生活,随手可用。同样也是支持AI绘图功能,不过图片质量一般般。

智谱AI在大模型开源方面也表现突出,是国内大模型开源的先锋。早在2022年,智谱就将其开发的高精度双语千亿模型GLM-130B进行了开源,并在ChatGPT爆火后开源了60亿参数的ChatGLM-6B,领先于国内同行。

智谱AI的开源策略旨在普及大模型知识,并通过社区的力量推动大模型的发展。智谱AI的估值在短时间内从10亿人民币飙升到140亿,成为中国第一家估值超过百亿的大模型创业公司。

这款AI工具就相对来讲没有那么热门,使用起来中规中矩没有特别的亮点,生成文本图片的质量也都比较一般。

零一万物(万知)

零一万物是由李开复博士创办的人工智能公司,致力于开发AI 2.0平台和应用。公司成立于2023年3月下旬,总部注册在北京,但面向全球招募顶尖人才。

零一万物的命名寓意“零一智能,万物赋能”,代表着从数字世界到赋能宇宙万物的雄心。

万知是由李开复创办的AI公司零一万物推出的一站式AI工作平台。这个平台主要提供以下功能:

  • 文档解析:万知能够高效地解析文档内容,并提供快速摘要和要点提炼。

  • AI创作:利用精选模板,辅助用户创作PPT和其他演示文档。

  • 长文速读:能够在极短时间内总结长文本的关键信息。

  • 公司报告解读:快速洞察企业价值和核心内容。

  • 行业研究报告:迅速掌握行业精髓,为投资决策提供支持。

  • 论文辅读:加速提炼研究目标、方法和结果,提高研究效率。

万知平台支持中英双语,旨在通过智能化工具提升用户在教育、企业、投资分析等领域的工作效率和创作质量。零一万物团队利用自研的大模型基础平台与RAG(Retrieval-Augmented Generation)检索增强生成技术,针对AI问答、读文档、PPT等场景进行了专门的加速和优化,能够在10秒内完成数万字的解析和总结。

比较有亮点的就是自动生成ppt大纲,然后自动生成ppt这个功能。此外,李开复博士亲自出任万知的“首席体验官”,体现了对这一平台的重视和对产品体验的承诺。

万知平台可通过网页版和微信小程序免费使用,为中国人量身定制,以满足国内用户的需求。

讯飞星火

讯飞星火是由科大讯飞推出的一款AI助手产品。科大讯飞是中国领先的智能语音和人工智能技术公司,专注于语音识别、语音合成、自然语言处理等技术的研发和应用。

讯飞星火的特点可能包括以下几个方面:

  1. 语音识别:利用科大讯飞在语音识别领域的先进技术,讯飞星火能够准确识别用户的语音指令和问题。

  2. 自然语言处理:通过自然语言处理技术,讯飞星火可以理解和回应用户的自然语言输入,提供更加人性化的交互体验。

  3. 智能助手功能:作为智能助手,讯飞星火可能具备日程管理、信息查询、任务提醒等日常辅助功能。

  4. 多场景应用:讯飞星火可能适用于多种场景,包括个人助理、企业服务、教育辅助等,满足不同用户的需求。

比较有特色的是这个有声绘本创作助手,哄小孩再也不用担心没有故事可讲了。

百度文心一言

百度文心一言(ERNIE)应该是国内最早推出的大模型了,和chatgpt一样有3.5免费版和4.0付费版。收费到是和国际同步了,但是使用起来也是一言难尽。

以上平台都是免费使用,其实,不论是哪一款国产大模型,它们的目标用户都是我们这些个人用户。

因此,我们完全可以不用过多关注它们在学术测评或商业应用上的排名和指标,而是从自己的实际使用体验出发,去挑选最适合自己需求的那一款

毕竟,每个模型在不同的场景下都有自己的长处和特点。有的大模型擅长开放域对话,能带给你智能而人性化的交互体验;有的则精于特定领域的专业写作和分析,能高效解决你工作中的痛点;还有一些大模型善于生成代码,给码农们提供了得力助手…总之,你只需要关注自己的实际需求是什么,哪一款模型在满足这个需求上表现最优秀,就选择使用哪一款。

用户体验至上,对每个个人来说才是最重要的。所以现在就赶快动手试试不同的国产大模型吧,亲自感受它们各自的风格和能力,找到最贴合自己的那一款,让AI助力拓展你的个人能力边界!

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐