【今日CV 计算机视觉论文速览第125期】Wed, 5 Jun 2019

时间：2023-01-04 14:30:01 mc7815ct集成电路to ad1814jp集成电路 0931s3nc接近传感器

今日CS.CV 计算机视觉论文速读
Wed, 5 Jun 2019
Totally 57 papers
?更精彩的是移动主页

在这里插入图片描述

Interesting:

?基于ROI正切变形人脸分析，人脸分析是给人脸不同区域的像素级语义map，传统的基于剪切调的传统方法忽略了ROI区域外的特征不适合不可预测的区域。本文结合中心视觉和外围视觉，提出了一种基于正切变形的操作员ROI研究人员提出了一种用于面部区域特征和外围区域周边信息的层次化局域方法。(from 厦门大学微软)
Tanh-warping operator 操作，将图像(±1为ROI基于区域)映射SCS坐标系到WCS空间（±1全图区域)中，通过引导任何大小的图像*roi映射到有限的区域。该方法有效地保留了外围信息：

网络架构如下：首先改变，然后将改变后的图像特征用于局部面部分析和全局周围区域分析，最后重新改变以获得人脸分析结果：

手工修正了HELEN数据集2972张：

输出结果：

dataset：HELEN dataset，LFW-PL
ref:https://github.com/zhfe99/helen http://www.ifp.illinois.edu/~vuongle2/helen/
脸内：a Mask R-CNN-fashion [9]
脸外：a FCN-fashion [19] branch

?***WUTON:虚拟试衣基于几何形变特征图，基于孪生U-Net生成器包含一系列调节层，实现变形和卷积几何匹配。它可以通过多任务损失进行训练，并可以通过真实的空间变化生成高质量的合成服装图像。(from Criteo AI Lab Paris, France)

一些结果：

消融测试：

dataset:dataset from [7], CP-VTON 2[6], Image-based Multi-pose Virtual try-on dataset3 from MG-VTON [7], parse pose
lab：https://ailab.criteo.com/

?从无标签图像中学习三维目标的照片自动编码，简单的基于重建来构建对称的形状和反射率，输入任意视角的单张图像模型可预测出对称的正视视角和对应的3D外形。(from VGG 牛津)

一些结果如下图所示：

dataset：3DFAW， Soumyadip Sengupta code to generate synthetic face datasets
ref：
sfsNet: https://github.com/senguptaumd/SfSNet
nature render：https://github.com/daniilidis-group/neural_renderer

?****GANs总结综述，针对GAN三个问题，高质量图像生成、多样性图像生成和稳定训练，研究如何从架构和损失中处理上述问题。总结了7个架构和9个损失变体。(from 都柏林城市大学)

link:https://github.com/sheqi/GAN_Review

?***针对特定区域的字符选择性风格化，探图像风格迁移在字符上的应用进行了探索，包括路标、印刷体和手写体，并提出了两种架构来选择区域迁移。(from Centre Tecnologic de Catalunya，Unitat de Tecnologies Audiovisuals巴塞罗那)
迁移显示效果：

两种不同的结构，两阶段和单阶段，两阶段TextFCN计算文本区域的热力图，并利用热力图的权重整合原始图和风格图：

单阶段的方法使用实现计算的掩膜来训练模型，只计算特定区域，集成字符检测和风格化方法。

基于手写分割和标签风格的文本效果迁移：

code:https://github.com/furkanbiten/SelectiveTextStyleTransfer
ref：文字区域检测TextFCN

TL;DwR
??DIPNet 深度图像先验的图像盲去噪，包含了全局（学习不同噪声水平的域不变特征）和局部（去噪图像向真实图像流型靠近）特征的融合，H-divergence theory
基于步态检测健康状况，code
KarNet布尔表达式用于简化数字电路，ref method：Quine-McCluskey algorithm,
Karnaugh map solving, Petrick’s method and McBoole’s method
实现图像压缩，基于内容表示，保持模型不变，dataset:Netflix-4K, xiphdataset
动力学神经网络架构的解耦方法从每个输入中发送网络动态激活的分层path
Triangulation Learning Network从单目到立体3D 目标检测，3Dbbox
?基于生成的重要性，适应场景中心目标的风格迁移方法map来进行不同强度的风格化，生成map的方法：patch-based, segmentation-based and superpixel-based
?实时任意风格的迁移，保留内容图像的深度图，生成图片更加和谐， ref:AdaIN method of Huang et al
数据集来自透射电镜下的纳米粒子，基于高斯过程和凸度分析解决(剪影图像中)重叠凸物体
Mining YouTube基于监督学习和烹饪视频的细粒度动作概念数据集来自于foodnetwork, allrecipes
PhotoBook Dataset基于视觉的对话数据集，dataset:https://dmg-photobook.github.io/, ref NLTK， gensim 人类话题模型
解释深度学习成功和不稳定的原因：学会了模型false structures
太阳动力学观测数据集，ref Solar Dynamics Observatory dataset, code2
ReColorAdv,基于函数对抗的攻击样本生成，单个函数生成对抗样本