本文分享了目前国内最新的、完整的AI大模型清单及介绍!


1 AI大模型117家名单

117家已备案的AI大模型名称、所属公司、主要应用领域。大家赶紧收藏好了!这应该是目前最全面的一个AI大模型清单:

2 TOP20家大模型介绍

  1. 百度-文心一言

- 作为科技领域的领军者,百度于2023年3月16日率先推出了其生成式AI产品“文心一言”,正式开启邀测。仅仅数月后的10月,百度又推出了文心一言的最新迭代版本——文心一言4.0。紧接着,11月1日,百度上线了文心一言专业版,其定价策略也相当亲民,单月购买仅需59.9元/月,连续包月更享优惠价49.9元/月。此前广受欢迎的文心一言基础版,则依然保持免费使用的策略。百度CEO李彦宏对文心大模型4.0赞不绝口,他表示这是百度迄今为止最强大的文心大模型,不仅实现了基础模型的全面升级,其综合能力更是“与GPT-4相比毫不逊色”。

2. 智谱AI-智谱清言

- 智谱AI,自2019年成立以来,便深耕于大模型研发领域,作为国内最早一批研发大模型的企业,其背后有着清华大学知识工程实验室(KEG)的强大技术支撑。智谱已经成功发布了多款令人瞩目的大模型产品,如双语千亿级超大规模预训练模型GLM-130B、中英双语对话模型ChatGLM、认知大模型平台Bigmodel.ai等,其中还包括CodeGeeX和CogView等创新产品。基于ChatGLM的卓越性能,智谱于2023年推出了面向C端用户的聊天对话应用“智谱清言”。而在B端市场,智谱也凭借卓越的技术实力,与多家国内互联网巨头、政企达成了深度合作。

3. 抖音-云雀

- 抖音集团(前字节跳动)于2023年8月17日宣布推出AI对话产品“豆包”,这是基于云雀模型开发的全新AI工具。豆包集成了聊天机器人、写作助手以及英语学习助手等多种功能,它能够回答各种问题并与用户进行流畅的对话,帮助人们快速获取信息。该产品支持网页Web平台、iOS以及安卓平台,不过iOS用户需要通过TestFlight进行安装。

4. 百川智能-百川

- 百川智能,这家由搜狗创始人王小川创立的创新型企业,自2023年成立以来便以惊人的速度发展。短短半年多时间,百川智能便接连发布了Baichuan-7B/13B、Baichuan2-7B/13B四款开源可免费商用大模型,以及Baichuan-53B、Baichuan2-53B两款闭源大模型,平均每28天就会有一款新的大模型问世。百川智能透露,Baichuan-7B/13B两款开源大模型在多个权威评测榜单上均名列前茅,累计下载量已超过六百万次。而Baichuan2-13B更是在MMLU、CMMLU、MedQA、USMLE等几大权威评估基准中领先LLaMA2。

5. 中科院自动化研究所-紫东太初

- 成立于1956年10月的中科院自动化研究所,是中国自动化研究领域的摇篮。该研究所推出的“紫东太初”跨模态通用人工智能平台于2021年正式发布。目前,“紫东太初”的参数已达到千亿级别,支持视觉、文本、语音等多种模态,并基于全栈国产化基础软硬件平台建立。今年6月,紫东太初发布了更加先进的2.0版本,新增了视频、传感信号、3D点云等模态数据。如今,“紫东太初”已在文本创作、医疗、物流、政务等多个行业实现了广泛的应用落地。

6. Minimax-ABAB

- Minimax凭借自研实力,推出了包含文本到视觉(text-to-visual)、文本到语音(text-to-audio)、文本到文本(text-to-text)三个模态的基础模型架构,并成功推出了自研通用大模型“ABAB”。

7. 商汤科技-日日新

- 2023年4月,商汤科技推出了名为“日日新SenseNova”的大模型。这款大模型集成了自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种强大功能。其中,商量SenseChat、秒画SenseMirage、如影SenseAvatar、琼宇SenseSpace、格物SenseThings、明眸等功能强大且易用的内容生成平台产品也备受用户喜爱。目前,商汤已发布了最新版大模型“商量SenseChat 2.0版本”,其参数规模高达千亿级。

8. 上海人工智能实验室-书生

- 上海人工智能实验室,作为该领域的佼佼者,其推出的“书生”项目展现了其在人工智能领域的深厚实力和创新精神。具体细节和产品优势因文本中未提及,故在此保持留白,以待未来更多精彩内容的揭晓。自2021年问世以来,“书生”(INTERN)大模型历经数次蜕变,从国内首个横跨多种视觉任务的通用大模型,逐步蜕变为一个融合视觉、语言和三维等多维元素的大模型体系。除了书生·天际的璀璨亮相,书生还精心打造了书生·多模态、书生·浦语等,更为业界呈现了一个完整的、面向大模型研发与应用的开源生态链。

9. 科大讯飞-星火认知大模型

科大讯飞倾力打造的星火认知大模型,作为新一代的认知智能典范,展现了跨领域的知识和语言理解能力。它能够以自然对话的方式理解并执行任务,集语言理解、知识问答、逻辑推理、数学解答、代码理解与编写等多重能力于一身。

10. 三六零-360智脑大模型

360智脑大模型,作为360集团研发的认知型通用大模型,最新版本“360智脑4.0”已全面融入集团各类产品。它不仅提供卓越的文本生成和创作服务,支持文本或图片输入生成高质量、多风格的图像,更拥有强大的智能编辑功能,无损放大、智能消除、智能抠图等操作一应具备,助您轻松创作精彩图像。

11. 阿里巴巴-通义千问大模型

通义千问,作为阿里云精心研发的底层通用大模型,旨在成为人们生活和工作中的得力智能助手。自4月正式亮相以来,已迭代至2.0版本,参数规模达到千亿级别,显著提升了其在多领域的应用能力。在云栖大会上,阿里云正式发布通义千问2.0,并在各大手机应用市场同步推出通义千问APP,进一步拓宽了其应用边界。

12. 腾讯-腾讯混元助手大模型

腾讯混元大模型(Tencent Hunyuan),由腾讯团队倾力打造,展现了强大的中文创作能力、复杂语境下的逻辑推理能力以及可靠的任务执行能力。

13. 华为-华为云盘古NLP大模型

华为云盘古NLP大模型,作为业界首个超千亿参数的中文预训练模型,傲然立足于华为云盘古系列超大规模预训练模型中。该模型汇聚海量图像、视频数据与盘古独特技术,孕育出视觉基础模型、多模态大模型及预测大模型,实现图像生成、理解、视频生成等多重功能。其融合语言和视觉的跨模态信息,极大提升了多任务处理能力,使得不同任务间具备强大的迁移能力。在4月25日,华为云更是发布了包含30亿参数的全球最大视觉预训练模型和与循环智能、鹏城实验室联合研发的千亿参数、40TB训练数据的全球最大中文语言预训练模型。

14. 华为-智慧助手(小艺)大模型

华为智慧助手小艺升级版,根植于华为盘古L0基座大模型,针对终端消费者场景进行了深度优化。在华为开发者大会上,这款全新版本的小艺以其更加聪明、能干和贴心的特性赢得了广泛赞誉。如今的小艺能够提供更智能的交互体验,如根据用户需求自动生成文案等内容。

15. 出门问问-序列猴子

出门问问近期发布的自研大型语言模型「序列猴子」,在“AGI·降临”2023 AIGC战略发布会上闪亮登场。这款大模型专注于服务B端企业,为企业提供专属的模型服务。序列猴子以其支持智能多轮对话的特质,帮助提高对话管理和调度能力,快速响应用户反馈和需求,实现对话的高效率和精准度。作为一款超大规模语言模型,序列猴子凭借其长序列、多模态、单模型、大数据等特点,在问答系统、自然语言处理、机器翻译、文本摘要等领域展现出广泛的应用潜力。基于其强大的表示与推理能力,序列猴子支持多轮交互,显著提高了生产效率和数据处理能力。月之暗面 (Moonshot AI) 诞生于2023年3月,它矢志不渝地探寻能源与智能的交融之道,力求达到转化的极致。仅仅在短短数月后,它就携带着其全球首创、支持输入高达20万汉字的智能助手产品Kimi,于2023年10月惊艳亮相。其创始团队由众多科技巨擘的核心成员组成,他们曾深度参与Google Gemini、Google Bard、盘古NLP、悟道等卓越大模型的研发,多项技术精髓亦被Google PaLM、Meta LLaMa、Stable Diffusion等业界翘楚采纳。

16.昆仑万维的“天工”大模型

作为国内首个与ChatGPT相媲美的双千亿级大语言模型,以对话式AI助手的形象出现。天工以自然语言为媒介,与用户展开深入的问答交流,其AI生成能力堪称全面,不仅涵盖文案创作、知识问答,更在逻辑推演、数理推算、代码编程等方面展现出卓越的能力。支持万字以上的文本对话,能够实现超过20轮次的用户交互,无论是学习、职场还是生活场景,天工都能为用户提供出色的问答体验。

17.WPS AI

北京金山软件有限公司倾力打造的WPS AI,是一款集成在WPS Office套件中的人工智能应用。它以其卓越的大语言模型能力,为用户提供更智能、高效的文档处理解决方案。智能文档写作、阅读理解和问答、智能人机交互等功能一应俱全,全方位提升用户在办公、写作、文档处理等方面的体验。WPS AI与WPS其他产品无缝对接,为用户带来一个统一的AI增强型办公平台。不仅如此,WPS AI更是内容创作的得力助手,让用户轻松节省时间与精力。通过WPS AI,用户可以轻松改进、调整内容,尽情享受AI带来的种种便利。

18.360科技

北京奇虎360科技有限公司近日发布了自研的奇元大模型,这一大型模型的成功推出,再次彰显了360在科技领域的深厚实力。奇元大模型已于11月4日通过备案,360公司也因此成为国内首家拥有两个大模型(包括先前的360智脑大模型)均通过备案的科技企业。奇元大模型主要面向B端用户,商业化应用前景广阔。其技术优势源于360在人工智能领域的长期耕耘,而数据优势则得益于搜索所拥有的大规模、多样性和高质量训练语料。这些优势使得奇元大模型在生成创作、多轮对话、逻辑推理等核心能力方面表现出色,能够覆盖大模型的全部应用场景。

19.面壁智能

面壁智能精心打造的面壁露卡LUCA,是一款千亿级别的多模态大模型,于2023年8月28日在“通用人工智能算力论坛”(AGICF)上正式发布。这款大模型以CPM-Bee为基础,对标ChatGPT的多模态智能对话助手。早在5月27日的2023数博会上,面壁露卡LUCA 1.0版本就以其卓越的语言模型能力首次亮相。LUCA凭借先进的自然语言处理技术,能够轻松实现智能多轮对话,极大地提高了对话管理和调度的效率和精准度。它在问答系统、自然语言处理、机器翻译、文本摘要等领域都有着广泛的应用。

20. 月之暗面 kimi

月之暗面的Kimi大模型是一款由北京月之暗面科技有限公司推出的智能助手,旨在提供全面的信息处理和知识支持。Kimi能迅速理解用户问题,给予精准回应。也是首个支持20万汉字输入,现提升至200万字,提供丰富上下文处理。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓

👉1.大模型入门学习思维导图👈

要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。

对于从来没有接触过AI大模型的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。(全套教程文末领取哈)
在这里插入图片描述

👉2.AGI大模型配套视频👈

很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,每个章节都是当前板块的精华浓缩。

在这里插入图片描述
在这里插入图片描述

👉3.大模型实际应用报告合集👈

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(全套教程文末领取哈)

在这里插入图片描述

👉4.大模型落地应用案例PPT👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。(全套教程文末领取哈)

在这里插入图片描述

👉5.大模型经典学习电子书👈

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

在这里插入图片描述

👉6.大模型面试题&答案👈

截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道,我总结了大模型常考的面试题。

在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐