点击左上方蓝字关注我们

AI学习与实训社区AI Studio经过一年多的建设,现已积累了数以万计的优质项目和丰富的数据集,在这里感谢大家一直以来的支持!


为了方便大家学习,小编特意整理了精选项目冬季特刊并分三期分享给大家。上一期中我们总结了与趣味项目、计算机视觉相关的内容给大家学习,本期我们就自然语言处理、比赛分享相关的内容继续给大家分享,小伙伴们抓紧时间学起来吧~

开始之前还是要先打个小广告,跟我们一起建设AI Studio内容和生态,不光能赢取积分、机械键盘等豪礼,还能荣登项目达人榜,成为AI Studio红人~

“AI Studio优质项目征集”:

https://ai.baidu.com/forum/topic/show/959188

“AI Studio优质数据集征集”:

https://ai.baidu.com/forum/topic/show/959190

话不多说,下面进入正题,看到喜欢的项目大胆的fork起来~

自然语言处理


项目一:“没有对象就自己造”系列之带你认识百度对话系统Plato

简介:Plato是百度推出的一个开放域对话系统,经过打磨,如今已经放出了Plato-2版本。相较于其他开放域对话系统,Plato的优势在于一问多答情景下的处理,即一个问题对应多个不同的答复,找出合理的答复进行对话。本项目简单介绍了百度Plato的用法,让我们站在巨人的肩膀上,迈出开放域对话的第一步!

链接:

https://aistudio.baidu.com/aistudio/projectdetail/1088195


项目二:“没有对象就自己造”系列之让你的对象理解中文

简介:上个项目我们了解了英文Plato-2模型的用法,但是仅有英文岂能让人满足!?在这个项目中,我们来了解一下Plato-2模型的训练步骤,知道了怎么训练,谁都可以训练出自己想要的对象了哈哈哈!

链接:

https://aistudio.baidu.com/aistudio/projectdetail/1109114


项目三:“没有对象就自己造”系列之细谈文本的预处理和输入

简介:Plato-2模型的输入采用了token,role,turn,position相融合的表示方式。通过本项目我们详细探讨一下Plato-2模型中用到的文本预处理方法以及Plato-2支持的输入。

链接:

https://aistudio.baidu.com/aistudio/projectdetail/1172895


项目四:“没有对象就自己造”系列之外国对象宁不喜欢吗?

简介:本项目进行一步秘制操作,让我们的AI对象说话带上港台翻译腔

链接:

https://aistudio.baidu.com/aistudio/projectdetail/1183965


项目五:“没有对象就自己造”系列之用paddlehub实现多轮对话

简介:在之前的几个项目中,我们从模型介绍,数据准备,以及中文模型训练等几个方面探索了如何训练出一个Plato对话模型。当我们自己训练出了对话模型之后,就可以用来进行对话啦!但是怎么开始对话呢?这个模型,我们一起来尝试用paddlehub来进行多轮对话!

链接:

https://aistudio.baidu.com/aistudio/projectdetail/1197592


项目六:PaddleHub:文本相似度判断(千言数据集)

简介:0基础也能做?基于PaddleHub实现的文本相似度判断

链接:

https://aistudio.baidu.com/aistudio/projectdetail/755962


项目七:Paddle-ERNIE:文本相似度判断(千言数据集)

简介:本项目利用Paddle-ERNIE开发文本相似度判断模型

链接:

https://aistudio.baidu.com/aistudio/projectdetail/954957


项目八:情感分析之文本分类

简介:使用PaddleHub中ERNIE语义模型完成文本分类模型的微调实现文本情感分析

链接:

https://aistudio.baidu.com/aistudio/projectdetail/1083848


项目九:一文带你读懂社交媒体假新闻检测

简介:假新闻已经存在了很长时间,可以追溯到纸媒诞生之初。结合文献和研究,狭义上的假新闻是指那些故意且可查证为虚假的、可能误导读者的新闻文章。这个定义有两个关键特征:真实性和意图。基于文本特征的假新闻检测技术 ,分享一些该领域的检测技术。

链接:

https://aistudio.baidu.com/aistudio/projectdetail/1159701


项目十:Paddle2.0:基于Seq2Seq的文本加法

简介:基于Paddle2.0版本实现基于Seq2Seq的文本加法。我们将会使用飞桨提供的LSTM的API,组建一个序列到序列模型。并在随机生成的数据集上完成数字加法任务的模型训练与预测。

链接:

https://aistudio.baidu.com/aistudio/projectdetail/1087885


项目十一:‍ERNIE——请假理由生成

简介:

对所有的烦恼“嗦”bye bye,对所有的快乐 say 嗨嗨

链接:

https://aistudio.baidu.com/aistudio/projectdetail/1049443


项目十二:Parakeet:飞桨,你是个成熟的框架了,要学会自己读论文

简介:通过本项目你可以学习到如何利用Fastspeech进行文字转换语音、PaddleOCR进行文字识别、HTML和PDF进行解析

链接:

https://aistudio.baidu.com/aistudio/projectdetail/676162


项目十三:ERNIE-GEN:汽车大师问答摘要与推理

简介:文本摘要一直是自然语言生成领域中一个重要的研究方向,ERNIE-GEN具有强大的自然语言生成能力,本次将使用ERNIE-GEN完成汽车大师问答摘要与推理任务。

链接:

https://aistudio.baidu.com/aistudio/projectdetail/986520

比赛分享



赛事一:中石油 · 第二届梦想云创新大赛‍‍‍‍‍‍‍‍

比赛介绍:中国石油梦想云平台与百度飞桨平台深度合作,共同推动油气行业智能化发展。本届梦想云创新大赛,选取油气行业典型场景和数据,设置数字化创新赛和AI技术赛,总奖金高达30万元。旨在营造开放的油气创新环境,鼓励优秀人员积极参与油气业务的数字化转型、智能化发展。

项目名称:中石油 · 第二届梦想云创新大赛基线方案

简介:中石油 · 第二届梦想云创新大赛基线方案,使用PaddleClas和最基础的数据处理方式带领选手们快速上手比赛。

链接:

https://aistudio.baidu.com/aistudio/projectdetail/1160086


赛事二:常规赛:MarTech Challenge 用户购买预测

比赛介绍:智能营销工具可以帮助商家预测用户购买的行为,本次比赛提供了一份品牌商家的历史订单数据,参赛选手需构建一个预测模型,预估用户人群在规定时间内产生购买行为的概率。该模型可应用于各种电商数据分析,以及百度电商开放平台, 不仅可以帮助商家基于平台流量,进行商品售卖、支付,还可以通过MarTech技术更精准地锁定核心用户,对用户的购买行为进行预测。

项目名称:用户购买预测深度学习模型实现baseline

简介:用户购买预测比赛的深度学习模型基线,没有思路的小伙伴,赶快学起来~

链接:

https://aistudio.baidu.com/aistudio/projectdetail/735599


赛事三:常规赛:MarTech Challenge 点击反欺诈预测

比赛介绍:广告欺诈是数字营销需要面临的重要挑战之一,点击会欺诈浪费广告主大量金钱,同时对点击数据会产生误导作用。本次比赛提供了约50万次点击数据。特别注意:我们对数据进行了模拟生成,对某些特征含义进行了隐藏,并进行了脱敏处理。MarTech技术已经被广泛应用于商业广告分析与挖掘中,在搜索广告,信息流广告,营销预测,反欺诈发现,商品购买预测,智能创意生成中有广泛的应用。请预测用户的点击行为是否为正常点击,还是作弊行为。点击欺诈预测适用于各种信息流广告投放,banner广告投放,以及 百度网盟平台,帮助商家鉴别点击欺诈,锁定精准真实用户。

项目名称:点击反欺诈预测Baseline

简介:感觉赛题比较难?或许你应该这样想:点击反欺诈 = 二分类任务(波士顿房价降价预测),有木有感觉到简单呢?目前常规赛事基线撰写模板已经对外开放,欢迎开发者贡献更好的基线作品~

链接:

https://aistudio.baidu.com/aistudio/projectdetail/701621


赛事四:2020 CCF BDCI 千言:多技能对话

比赛介绍:CCF大数据与计算智能大赛(以下简称CCF BDCI)由中国计算机学会2013年创办。大赛由教育部教学指导委员会、国家自然科学基金委员会指导,是大数据与人工智能领域的算法、应用、系统、创业大型挑战赛事。

项目名称:2020 CCF BDCI: 千言对话baseline

简介:本项目介绍使用基于paddlepaddle的大规模对话预训练框架Knover,及其提供的预训练模型,在"千言:多技能对话"比赛数据集上训练和测试。

链接:

https://aistudio.baidu.com/aistudio/projectdetail/1101252


赛事五:睿聚杯2020全国高校法律科技创新大赛

比赛介绍:为加强法律科技领域沟通与协作,搭建法律科技领域思想、技术、应用的交流实践平台,助力高校推动法律科技相关学科的深化发展,助推法律科技产业人才培养,由北京华宇软件股份有限公司、清华大学智能法治研究院联合发起"'睿聚杯’2020全国高校法律科技创新大赛"。

项目名称:睿聚杯:第五名参赛队伍比赛经验分享

简介:睿聚杯第五名参赛队伍比赛代码和思路分享,基于Paddle-Ernie开发的法律要素与被告人匹配模型

链接:

https://aistudio.baidu.com/aistudio/projectdetail/895793


赛事六:飞桨轻量级目标检测挑战赛

比赛介绍:飞桨新增挑战赛系列,选手基于官方提供的baseline,使用飞桨设计并优化一个新模型,成绩必须高于官方baseline在测试集/评测模型中的成绩,最终排名靠前的选手将获得现金、京东卡奖励,以及飞桨定制奖杯、证书。

项目名称:飞桨轻量级目标检测挑战赛TOP4方案分享

链接:

https://aistudio.baidu.com/aistudio/projectdetail/245811

项目名称:飞桨轻量级目标检测挑战赛TOP2方案分享

链接:

https://aistudio.baidu.com/aistudio/projectdetail/217496


赛事七:城市区域功能分类

比赛介绍:9月飞桨新增基线挑战赛,选手基于官方提供的飞桨基线模型,使用飞桨设计并优化一个新模型,成绩必须高于官方基线在测试集/评测模型中的成绩,最终排名靠前的选手将获得现金、京东卡奖励,以及由百度飞桨颁发的获奖证书。

项目名称:飞桨基线挑战赛-城市区域功能分类赛top4方案

链接:

https://aistudio.baidu.com/aistudio/projectdetail/202976

项目名称:飞桨基线挑战赛-城市区域功能分类赛Top3方案

链接:

https://aistudio.baidu.com/aistudio/projectdetail/198563


赛事方案:天池蛋白质结构预测大赛第5名方案-ProteinContest2020

简介:参与天池没有算力,只能眼急的份?不存在的!AI Studio祝你乘风破浪~

链接:

https://aistudio.baidu.com/aistudio/projectdetail/316664

好啦,本次的AI Studio冬季特刊(二)到这里就结束啦,对项目感兴趣的小伙伴快快fork学起来吧~

精彩预告!!!

为了让大家能够持续高效的学习,后续小编将推出AI Studio精选项目半月刊,大家想了解哪方面的内容可以在帖子下留言,小编整理项目时会重点寻找滴,请大家持续关注哦~


另外,欢迎各位读者投稿参与我们的精选项目建设,我们有丰厚的奖励机制哦,赶快加入我们吧~ 精选项目征集贴:

https://ai.baidu.com/forum/topic/show/959188

福利来喽~ 认真学习还有奖品拿(社区活动)

每次的项目推荐我们总会想着给认真学习的同学送点啥,这次当然也不例外啦!

本次依然是fork学习项目写心得,就有机会获得膳魔师保温杯、蝴蝶不倒杯、Paddle联名短袖、Paddle联名移动电源、为期1个月的百度网盘超级会员以及100小时的Tesla V100算力等精美礼物~

活动时间:2020.12.15-2021.01.15(每周抽一次奖)

活动参与方式:

https://ai.baidu.com/forum/topic/show/977948

飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,是中国首个开源开放、技术领先、功能完备的产业级深度学习平台,包括飞桨开源平台和飞桨企业版。飞桨开源平台包含核心框架、基础模型库、端到端开发套件与工具组件,持续开源核心能力,为产业、学术、科研创新提供基础底座。飞桨企业版基于飞桨开源平台,针对企业级需求增强了相应特性,包含零门槛AI开发平台EasyDL和全功能AI开发平台BML。EasyDL主要面向中小企业,提供零门槛、预置丰富网络和模型、便捷高效的开发平台;BML是为大型企业提供的功能全面、可灵活定制和被深度集成的开发平台。


扫描二维码 | 关注我们

微信号 : PaddleOpenSourc

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐