公众号内容拓展学习笔记（2022.5.9）

公众号内容拓展学习笔记（2022.5.9）📎今日要点CVPR 2022 | 北大、腾讯提出文字logo生成模型，脑洞大开⭐️⭐️Abstract: 北大、腾讯提出文字logo生成模型Paper: Aesthetic Text Logo Synthesis via Content-aware Layout InferringCode: https://github.com/yizhiwang96/

CV_七少

209人浏览 · 2022-05-09 10:27:32

CV_七少 · 2022-05-09 10:27:32 发布

公众号内容拓展学习笔记（2022.5.9）

📎 今日要点

CVPR 2022 | 北大、腾讯提出文字logo生成模型，脑洞大开 ⭐️⭐️
- Abstract: 北大、腾讯提出文字logo生成模型
- Paper: Aesthetic Text Logo Synthesis via Content-aware Layout Inferring
- Code: https://github.com/yizhiwang96/TextLogoLayout
- Tips: 本模型基于 Conditional GAN 来生成文字 logo，创新性地使用双判别器结构（序列判别器和图像判别器），对字形的轨迹序列和整体 logo 图像分别做判别；同时借助可微分拼接(Differentiable Composition)，构建位置坐标到 logo 图像的可微分渲染过程。
CVPR2022 Oral：GAN监督的密集视觉对齐，代码开源 ⭐️⭐️
- Abstract: GAN监督的密集视觉对齐，代码开源
- Paper: GAN-Supervised Dense Visual Alignment
- Code: https://www.github.com/wpeebles/gangealing
- Tips: 在该论文中作者提出了一种用于端到端联合学习的GAN生成数据的框架。受到经典方法的启发，论文中作者联合训练一个空间变换器，将随机样本从基于未对齐数据训练的GAN映射到共同的、联合学习的目标模式。
ACL’22 | 陈丹琦提出CoFi模型剪枝，加速10倍，精度几乎无损 ⭐️⭐️
- Abstract: 陈丹琦提出CoFi模型剪枝，加速10倍，精度几乎无损
- Paper: Structured Pruning Learns Compact and Accurate Models
- Code: https://github.com/princeton-nlp/CoFiPruning
- Tips: 作者提出的结构化剪枝方法 CoFi 在几乎没有太多精度损失的情况下，达到了 10 倍以上的加速比，同时，和常规的蒸馏做法相比，避免了因使用大量无标签数据预训练模型而带来的训练成本过高的问题，按作者的话来说，该方法可以是蒸馏的一个有效替代品。
MAGIC: 一个即插即用、无需训练的图像-文本生成框架 ⭐️⭐️
- Abstract: MAGIC: 一个即插即用、无需训练的图像-文本生成框架
- Paper: LanguageModels Can See: Plugging Visual Controls in Text Generation
- Code: https://github.com/yxuansu/MAGIC
- Tips: 本文提出了一个全新的MAGIC框架。该框架可以使用图片模态的信息指导预训练语言模型完成一系列跨模态生成任务与其他方法不同的是，MAGIC框架无需多模态的训练数据，只需利用现成的语言模型和图文匹配模型就能够以zero-shot的方式高质量地完成多模态生成任务。
多模态理解与生成，西南交大&MSRA提出统一的"视频和语言预训练"模型：UniVL！ ⭐️⭐️⭐️⭐️
- Abstract: 西南交大&MSRA提出统一的"视频和语言预训练"模型：UniVL
- Paper: UniVL: A Uniﬁed Video and Language Pre-Training Model for Multimodal Understanding and Generation
- Code: https://github.com/microsoft/UniVL
- Tips: 本文提出了一种基于自监督学习的大规模视频语言表示方法UniVL。UniVL设计有四个模块和五个目标，用于视频语言理解和生成任务。它是一个灵活的模型，适用于大多数多模态下游任务，同时考虑效率和有效性。
小样本学习只是一场学术界自嗨吗？ ⭐️⭐️
- Abstract: 小样本学习只是一场学术界自嗨吗？
- Tips: 这两年看见很多人，都在批评few-shot learning，觉得是学术界在自high，思考良久，感觉有必要给这个领域正个名～（注意，本文仅关注few-shot image classification）