ed9bcca26e21d391e00f8888fe12bee5.gif

近日,在开放原子开源基金会主办的第二届开放原子大赛上,由百度飞桨共建的两项飞桨赛题顺利完成决赛路演与评审。本次大赛聚焦飞桨多模态大模型套件开发与飞桨科学计算工具组件开发,吸引了众多技术精英团队踊跃参与,呈现出一场精彩纷呈的技术创新盛宴,为行业发展注入了强大动力。



4408c8d722a72bc3bc40ff40570d38d8.png

赛事一:飞桨多模态大模型套件PaddleMIX开发大赛

6f3969d8d50aa22c0302ead6ee653fab.png

赛题核心与挑战剖析

本次大赛赛题之一为“飞桨多模态大模型套件PaddleMIX开发大赛”。PaddleMIX整合前沿技术,集高性能算法、便捷开发、高效训练、完备部署于一身。其模型库丰富,覆盖多模态与LLaVA系列,具备视频生成能力,广泛应用于金融、医疗等多领域。性能上,预训练领先同类8%,精调吞吐量提升68%,推理性能优于同类34%。

但在实际开发中,用户会用专有数据微调模型,这需要大量数据处理。用户期望借助工具在PaddleMIX实现端到端开发,以扩大其应用。

为此,本次赛题聚焦多模态数据工具组件建设,完善PaddleMIX数据处理能力,降低开发成本。现在,让我们走进决赛路演现场,看看选手们的表现以及他们带来全新的解题思路和技术实践。

4aaf0c0b3d5216476aa86788e7cc7704.png

决赛选手方案亮点纷呈

fastfail团队关注增强PaddleMIX在数据处理与分析方面的能力,具体涵盖:提供细粒度数据分析功能,支持自定义配置的数据处理流程,以此提升整体数据处理能力;开发图像质量评估、文本质量分析及图文匹配度计算等算子,并借助GPU加速技术提升处理效率,实现对数据的质量分析与精准过滤;通过实现样本重复检测与去重、模态均衡性分析、数据分布可视化以及生成处理效果评估报告,打造全面的数据增强与分析工具。

冲冲冲团队基于 PaddleMIX打造了一套完备的数据处理闭环体系,覆盖数据转换、过滤、分析、生成、可视化五大核心环节,精心设计超 30 个细粒度算子。这一体系显著提升多模态数据质量与处理效率,有效解决多模态数据高效清洗难题,例如运用文本 hash 过滤、prompt 得分过滤、CLIP - Score 过滤等算子进行数据净化。同时,结合大模型实现多维质量评估与结构化属性精准提取,生成可供后续环节直接使用的结构化数据。此外,借助视觉语言模型生成高质量问答对,极大地扩展了数据多样性,为多模态模型训练筑牢优质数据根基。

企鹅队团队另辟蹊径,基于前沿论文创新改进数据处理方法。巧妙引入多模型协同处理机制应对微调数据噪声,精心设计复杂流程区分数据噪声、筛选优质数据,拓展至多模态场景,为数据清洗提供全新思路,激发多模态数据处理创新思维。

megemini团队的方案《利用 IQA 方法过滤低质量图片 -- ARNIQA、BRISQUE 算子过滤器》探索为 PaddleMIX 的 datacopilot 组件添加一系列基于图像质量评估 (IQA) 的过滤器算子与数据标注器。这些工具将帮助过滤掉训练数据中的低质量图片,从而提高数据质量,减少训练所需的数据量,缩短训练和验证模型的时间,提高模型的整体性能。这一方案有助于优化 PaddleMIX 在多模态数据处理中的效率和效果。

一根腿毛团队着眼文本重复问题,运用词向量技术结合阈值筛选策略,精准过滤重复文本,有效规避过拟合风险,虽遇时间与算力挑战,但提出聚类算法优化方向,为文本数据净化提供可行方案。

c6abdbfcd3df1296a61e12d8cd50e327.jpeg

fastfail团队

e5c9085cdfe85745fd6b256fb9e63991.jpeg

冲冲冲团队

2ce33999e46de87aba76c5d28ee343e9.jpeg

企鹅队团队

19b148092f341b6bbce88bed1fec87fe.jpeg

megemini团队

32febf4c8703ed4602df3196d1cb5fdd.jpeg

一根腿毛团队

左右滑动查看更多

经激烈角逐与严格评审,冲冲冲团队脱颖而出斩获一等奖,企鹅队、megemini团队等凭借出色表现分获二、三等奖,各团队以创新思维与扎实技术在多模态数据处理领域留下深刻印记,引领技术发展潮流。

58ed37d83bf07a78218a629f89e4d0f6.jpeg获奖团队合照

79ebad5fd5bde1cd71bf6416296543ef.png

赛事二:飞桨科学计算工具组件开发大赛

0b4c066f9d1343078c381c34bd4c6468.png

赛题背景与关键任务

PaddleScience是基于深度学习框架PaddlePaddle开发的科学计算套件。它借助深度神经网络的学习能力与PaddlePaddle的自动(高阶)微分机制,致力于解决物理、化学、气象等领域的问题。该套件支持物理机理驱动、数据驱动、数理融合三种求解方式,并提供基础API与详尽文档,方便用户使用及二次开发。

在实际项目开发中,各领域用户不仅运用深度学习框架自身 API 实现基础代码功能,还会使用三维图形处理库Open3D、稀疏计算库torch_scatter、神经算子库NeuralOp、图神经网络库torch - geometric等工具组件。这些工具库由深度学习框架官方研发人员或具备领域背景的社区开发者维护,能极大降低用户开发成本,助力用户高效、精准实现算法。

本次比赛中,参赛选手将投身三维几何、稀疏计算、神经算子、图神经网络等高影响力的开源项目工具组件建设工作,并将成果合并至组件官方仓库或PaddleScience仓库。这将有效提升飞桨用户开发科学计算模型的效率与灵活性,为基于飞桨深度学习框架的技术创新与发展注入强大动力。

接下来,让我们一同走进科学计算决赛现场,聆听决赛选手们的精彩方案。 

1104c53788fb3573817226fa0b4d37d5.png选手成果各有千秋

在路演活动中,各团队精彩呈现了飞桨适配项目的阶段性成果与重要进展,为推动深度学习框架的多元化应用添砖加瓦:

d1079f5e2daed1f1cb89a40a1d5b83a8.jpeg

飞桨适配torch-harmonics赛题宣讲

b0233d3b09dcef2f5b8a0268786a5728.jpeg

PaddleScience获奖团队

左右滑动查看更多

SecretXV 团队聚焦于开源 3D 数据处理库 Open3D,该团队成功为其融入飞桨框架后端支持,完成了 20 个 C++ 算子的迁移工作,并逐一进行了正确性验证。不仅如此,Open3D 的飞桨上层接口的实现与生态兼容,极大降低了现有代码迁移的难度,为计算机视觉、机器人等领域的开发者提供了更便捷的选择。

BeingGod 团队针对在物理学、计算机图形学中广泛应用的球谐函数,在本次飞桨适配赛题中取得重大突破。团队完成了大部分核心 API 的迁移与单测验证,并且对官方案例进行了全面适配,进一步丰富了 PaddleScience 社区的生态系统,助力相关领域的研究与开发工作。

lixiaoming233 团队全力投入将 torch_harmonics 适配到飞桨框架的工作中,成功实现了球面谐波变换、球面傅里叶算子以及分布式计算工具的功能对接。该团队完成了对 torch_harmonics 所有 API 的适配,同时对示例和单测文件进行了细致调整,59 项单测中有 53 项顺利通过,且保持了文件结构、内容及注释的一致性,为飞桨在多领域的应用拓展了广阔空间,显著提升了开发效率。

qikai123 团队围绕 NeuralOperator 工具库的飞桨适配展开攻坚,旨在打通深度学习框架间的壁垒。团队精心整理 NeuralOperator 的所有 API,并利用飞桨框架的等效功能实现了完美适配,同时完成了单测开发与功能验证。团队创新性地提出复数分解处理和张量分解功能扩展(tlpaddle)等解决方案。其他模块在各项性能指标上表现优异,为飞桨进军复杂物理场景应用筑牢了根基。

此外,更多团队的分享内容,也为线上线下的开发者提供了极具价值的开发思路与借鉴 。

5f3fb2c36a36ba398464ada804fa4fd4.jpeg获奖团队合照

激烈竞争后,SecretXV团队和NKNaN团队分别在飞桨适配 open3D 和飞桨适配 torch-scatter 赛题中荣获一等奖的殊荣。BeingGod、co63co、lixiaoming233、重在参与、FlyingBird_等团队获得二三等奖。各团队于科学计算工具组件适配优化领域各展神通,为飞桨在专业科学计算领域应用拓展注入强劲动力,推动行业迈向新高度。本次大赛决赛汇聚多元创新方案与前沿技术实践,有力推动飞桨多模态与科学计算技术深度发展,为开源生态繁荣注入蓬勃动力。

未来,飞桨将持续引领技术创新浪潮,携手开发者共创智能科技辉煌未来,助力各行业数字化转型与智能化升级,在全球科技舞台绽放耀眼光芒。

附1:本次大赛的决赛获奖名单

c8f658902d81f52ebfc93978b535c803.png

c0be2d17a326aa5a7491b7216ebbe5a7.png

附2:第二届开放原子大赛飞桨赛题官网

https://competition.atomgit.com/competitionInfo

https://competition.atomgit.com/competitionInfo

7039448c64441fc748c94aaf62ea1fce.png

94f4fbd54914fa0d2d2659e940095d1c.jpeg

74a740408de2c408ce9cbe5e9ac5218e.jpeg

4dd973b5d3bafee18ae2fa65dfce6ee2.gif

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐