面向电信的大型生成式人工智能模型
本文从感知和通信两个角度,展示了大型 GenAI 模型在无线网络的设计、配置和操作中的潜在应用;概述了无线网络在使机器利用大型 GenAI 模型进行通信方面的作用。此外,本文为通过大型 GenAI 模型开发 AGI 驱动的无线网络奠定了基础,为实现自进化网络铺平了道路。
GenAINet通信大模型
生成式人工智能(GenAI)的发展为不同领域技术的重构提供了新的方向。特别是在无线网络领域,可以利用GenAI获得很多好处,从根本上改变当今无线网络的设计和运营方式。为了揭示GenAI在电信领域的潜力,Merouane Debbah教授团队发表了一篇综述文章,目前已经发表在IEEE Communications Magazine上。作者首先强调了大型GenAI模型在未来无线网络中的应用,定义了潜在的用例,并指出了相关理论和实际中的挑战;此外还揭示了6G如何通过连接多个设备上的大型GenAI模型来获得新的机会,并对大型GenAI模型如何成为实现自进化网络的关键提供了前瞻性的看法。
Large Generative AI Models for Telecom: The Next Big Thing?
Lina Bariah1, Qiyang Zhao1, Hang Zou1, Yu Tian1, Faouzi Bader1 , and Merouane Debbah2
1Technology Innovation Institute, UAE
2Khalifa University, UAE
原文链接:
https://ieeexplore.ieee.org/abstract/document/10384630
论文版权归属IEEE Communications Magazine期刊及IEEE版权方,本文分享仅用于技术交流,未经许可禁止用于商业用途。
本文首先介绍了大型GenAI模型的应用示例,包括面向无线感知和面向通信,如图1所示。
图1. 用于无线感知和通信的大型 GenAI 模型的示例应用
1. 面向无线的大型GenAI模型
1.1 面向感知的大型GenAI模型
1)3D无线成像:深度学习(DL)模型从根本上促进了无线感知方案的发展,其中射频数据可以被获取并映射到二维图像,用于感知应用,包括定位、遥感和资源分配。视觉GenAI模型的最新发展为感知能力的新时代开阔了视野,机器现在有可能生成高质量的图像并理解视觉内容,即从文本描述或用相应文本映射图像生成2D和3D图像。
2)超分辨率定位:大型GenAI模型可以实现高效的多模态定位方案。这些大型模型的通用性和自注意力性质,可以成为检测网络用户和节点的上下文和情境信息的关键,捕获多个图像之间的相互位移,并将这些图像及其变化与无线信号的相应电磁行为相互关联。
1.2 面向传输的大型GenAI模型
1)多模态波束成形:通常,波束选择是通过预定义的波束码本来执行的,但是这样的波束训练过程具有很大的开销。而大型 GenAI 模型经过大量波束成形场景数据集的预训练,能够预测可最大化信号强度并最小化干扰的最佳波束。这可以通过利用多模态来提供有关阻塞概率以及用户状态和活动的附加信息来实现。
2)频分双工(FDD)传输:大型 GenAI 模型可用于上行链路和下行链路传输之间的信道状态信息 (CSI) 估计目的。通过自注意力机制和大型GenAI 模型的生成能力,设想大型GenAI 模型将能够捕捉上行链路和下行链路传输之间的固有关系,并利用 3D 多模态环境数据(包括摄像头、雷达、激光雷达和 GPS)以选择最佳的上行链路和下行链路波束对,在特定用户位置处,使到达角和离开角完美对齐,如图2所示。
图2. FDD 系统中用于波束成形的大型 GenAI 模型
3)信源信道联合编码(JSCC):目前已经研究将信道和信源编码集成到语义感知的JSCC中,大型GenAI模型有助于实现高效的JSCC方案,以改善无线通信性能。大型GenAI模型可以理解源数据的统计行为,提取所需信息,从而实现高效的数据压缩。通过有效的纠错机制,提高了对信道错误的鲁棒性。此外,通过了解信源数据和信道编码之间的长期相互依赖关系,可以设计自适应机制,根据当前信道条件实时调整码率、调制和码选择,从而在信源编码和信道编码性能之间取得平衡。
2. 面向大型GenAI模型的无线网络
2.1 6G与集体智能
本节总结了实现多智能体GenAI无线网络的三个关键研究方向:
1)语义通信:大型 GenAI 模型可以从表示为知识的原始数据的语义压缩和抽象中学习,信息应该具有最小结构的特征,这种结构对分布、领域和上下文的变化具有鲁棒性。这不仅减少了设备内存中数据和模型的大小,而且可以用一个共同的潜在(概念)空间表示不同的数据模式。
2)新兴的协议学习:在面向目标的基础上,一个新兴的、可适应的和自主的通信协议对于允许多个无线GenAI智能体有效地交互是必不可少的。多智能体强化学习(MARL)具有通过协作学习智能体之间的语义语言的潜力。
3)分布式大型 GenAI 模型驱动的AI智能体:通过自主智能体,无线设备不仅可以使用大型 GenAI 模型进行推理,还可以感知环境、计划任务、记忆经验和评估动作。这可能导致在没有人为干预的情况下对网络和设备进行完全自主控制。
2.2 集体智能用例
GenAI具有在意图驱动网络中实现自动化的潜力。利用电信大型 GenAI 模型授权的自主代理,网络可以在没有人为干预的情况下以分布式方式自我进化。此外,网络设备中多个GenAI智能体之间的有效通信可以消除对集中控制的需要,并减少控制面上的信令负荷。无线GenAI网络还可以为自动驾驶汽车带来集体智能。
3. AGI驱动的无线网络:未来愿景
几个人工智能范例的演变正在接近AGI (artificial general intelligence) 的概念。在AGI中,机器将享有相当于或超过人类智能的智能水平。具有泛化和生成能力的大型 GenAI 模型将成为无线网络中成功部署AGI的基石。
3.1 任务不可知的大型电信模型
将大型 GenAI 模型应用到电信领域的主要目的是开发使用多模态数据训练的基础模型,以执行一般的电信任务。这些基础模型将充当网络的通用骨干,可以部署在边缘设备上。之后使用相关数据对基础模型进行微调,使其适应特定的下游任务,包括调制、编码、功率分配、波束形成等。
3.2 自进化网络
自进化网络的概念是指能够随着网络中的变化经验和周围环境的变化而适应、改变和进化的网络。大型 GenAI 模型的泛化能力、多模态和规划推理能力可以实现超越自适应和自优化原则的自进化网络的愿景,如图3所示。预计大型 GenAI 模型将被用于设计、规划、部署、配置和操作无线网络的初始步骤。使用来自标准和研究报告的文本文档将允许预训练的大型 GenAI 模型生成所需的软件代码和硬件设计规范,然后进入部署阶段。根据特定的网络条件,可以进一步利用它来构建不一定与特定标准兼容的新通信方案。
图3. AGI驱动的无线网络
4. 总结
本文从感知和通信两个角度,展示了大型 GenAI 模型在无线网络的设计、配置和操作中的潜在应用;概述了无线网络在使机器利用大型 GenAI 模型进行通信方面的作用。此外,本文为通过大型 GenAI 模型开发 AGI 驱动的无线网络奠定了基础,为实现自进化网络铺平了道路。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)