IEEE Conference on Computer Vision and Pattern Recognition, CVPR 2021, virtual, June 19-25, 2021 - researchr publication

researchr

You are not signed in
Sign in
Sign up

IEEE Conference on Computer Vision and Pattern Recognition, CVPR 2021, virtual, June 19-25, 2021. Computer Vision Foundation / IEEE, 2021. [doi]

Conference: cvpr2021

Abstract is missing.

Single-Stage Instance Shadow Detection With Bidirectional Relation LearningTianyu Wang 0003, Xiaowei Hu, Chi-Wing Fu, Pheng-Ann Heng. 1-11 [doi]

DeepMetaHandles: Learning Deformation Meta-Handles of 3D Meshes With Biharmonic CoordinatesMinghua Liu, Minhyuk Sung, Radomír Mech, Hao Su 0001. 12-21 [doi]

Learning Delaunay Surface Elements for Mesh ReconstructionMarie-Julie Rakotosaona, Paul Guerrero, Noam Aigerman, Niloy J. Mitra, Maks Ovsjanikov. 22-31 [doi]

Fusing the Old with the New: Learning Relative Camera Pose with Geometry-Guided UncertaintyBingbing Zhuang, Manmohan Chandraker. 32-42 [doi]

Skeleton Merger: An Unsupervised Aligned Keypoint DetectorRuoxi Shi, Zhengrong Xue, Yang You, Cewu Lu. 43-52 [doi]

Uncertainty Guided Collaborative Training for Weakly Supervised Temporal Action DetectionWenfei Yang, Tianzhu Zhang, Xiaoyuan Yu, Qi Tian 0001, Yongdong Zhang 0001, Feng Wu 0001. 53-63 [doi]

Pixel Codec AvatarsShugao Ma, Tomas Simon, Jason M. Saragih, Dawei Wang, Yuecheng Li, Fernando De la Torre, Yaser Sheikh. 64-73 [doi]

HOTR: End-to-End Human-Object Interaction Detection With TransformersBumsoo Kim, Junhyun Lee, Jaewoo Kang, Eun-Sol Kim, Hyunwoo J. Kim. 74-83 [doi]

Tuning IR-Cut Filter for Illumination-Aware Spectral Reconstruction From RGBBo Sun, Junchi Yan, Xiao Zhou, Yinqiang Zheng. 84-93 [doi]

DeFlow: Learning Complex Image Degradations From Unpaired Data With Conditional FlowsValentin Wolf, Andreas Lugmayr, Martin Danelljan, Luc Van Gool, Radu Timofte. 94-103 [doi]

AQD: Towards Accurate Quantized Object DetectionPeng Chen, Jing Liu, Bohan Zhuang, Mingkui Tan, Chunhua Shen. 104-113 [doi]

Privacy-Preserving Collaborative Learning With Automatic Transformation SearchWei Gao, Shangwei Guo, Tianwei Zhang 0004, Han Qiu 0001, Yonggang Wen 0001, Yang Liu 0003. 114-123 [doi]

Rethinking and Improving the Robustness of Image Style TransferPei Wang, Yijun Li, Nuno Vasconcelos. 124-133 [doi]

Style-Aware Normalized Loss for Improving Arbitrary Style TransferJiaxin Cheng, Ayush Jaiswal, Yue Wu 0001, Pradeep Natarajan, Prem Natarajan. 134-143 [doi]

Faster Meta Update Strategy for Noise-Robust Deep LearningYoujiang Xu, Linchao Zhu, Lu Jiang 0004, Yi Yang 0001. 144-153 [doi]

A Hyperbolic-to-Hyperbolic Graph Convolutional NetworkJindou Dai, Yuwei Wu, Zhi Gao, Yunde Jia. 154-163 [doi]

Quasi-Dense Similarity Learning for Multiple Object TrackingJiangmiao Pang, Linlu Qiu, Xia Li, Haofeng Chen, Qi Li, Trevor Darrell, Fisher Yu. 164-173 [doi]

MetricOpt: Learning To Optimize Black-Box Evaluation MetricsChen Huang, Shuangfei Zhai, Pengsheng Guo, Josh M. Susskind. 174-183 [doi]

Training Networks in Null Space of Feature Covariance for Continual LearningShipeng Wang, Xiaorong Li, Jian Sun 0009, ZongBen Xu. 184-193 [doi]

Exponential Moving Average Normalization for Self-Supervised and Semi-Supervised LearningZhaowei Cai, Avinash Ravichandran, Subhransu Maji, Charless C. Fowlkes, Zhuowen Tu, Stefano Soatto. 194-203 [doi]

Learning To Recover 3D Scene Shape From a Single ImageWei Yin 0006, Jianming Zhang 0001, Oliver Wang, Simon Niklaus, Long Mai, Simon Chen, Chunhua Shen. 204-213 [doi]

Fully Convolutional Networks for Panoptic SegmentationYanwei Li, Hengshuang Zhao, Xiaojuan Qi, Liwei Wang, Zeming Li, Jian Sun, Jiaya Jia. 214-223 [doi]

Progressive Domain Expansion Network for Single Domain GeneralizationLei Li, Ke Gao, Juan Cao, Ziyao Huang, Yepeng Weng, Xiaoyue Mi, Zhengze Yu, Xiaoya Li, Boyang Xia. 224-233 [doi]

Sketch, Ground, and Refine: Top-Down Dense Video CaptioningChaorui Deng, Shizhe Chen, Da Chen, Yuan He, Qi Wu 0001. 234-243 [doi]

Shared Cross-Modal Trajectory Prediction for Autonomous DrivingChiho Choi, Joon Hee Choi, Jiachen Li, Srikanth Malla. 244-253 [doi]

Glancing at the Patch: Anomaly Localization With Global and Local Feature ComparisonShenzhi Wang, Liwei Wu, Lei Cui, Yujun Shen. 254-263 [doi]

RankDetNet: Delving Into Ranking Constraints for Object DetectionJi Liu, Dong Li, Rongzhang Zheng, Lu Tian, Yi Shan. 264-273 [doi]

GAIA: A Transfer Learning System of Object Detection That Fits Your NeedsXingyuan Bu, Junran Peng, Junjie Yan, Tieniu Tan, Zhaoxiang Zhang. 274-283 [doi]

Primitive Representation Learning for Scene Text RecognitionRuijie Yan, Liangrui Peng, Shanyu Xiao, Gang Yao. 284-293 [doi]

Keep Your Eyes on the Lane: Real-Time Attention-Guided Lane DetectionLucas Tabelini Torres, Rodrigo Ferreira Berriel, Thiago M. Paixão, Claudine Badue, Alberto F. De Souza, Thiago Oliveira-Santos. 294-302 [doi]

OTA: Optimal Transport Assignment for Object DetectionZheng Ge, Songtao Liu, Zeming Li, Osamu Yoshie, Jian Sun. 303-312 [doi]

StickyPillars: Robust and Efficient Feature Matching on Point Clouds Using Graph Neural NetworksKai Fischer, Martin Simon, Florian Ölsner, Stefan Milz, Horst-Michael Gross, Patrick Mäder. 313-323 [doi]

Semantic Scene Completion via Integrating Instances and Scene In-the-LoopYingjie Cai, Xuesong Chen, Chao Zhang, Kwan-Yee Lin, Xiaogang Wang 0001, Hongsheng Li 0001. 324-333 [doi]

Holistic 3D Human and Scene Mesh Estimation From Single View ImagesZhenzhen Weng, Serena Yeung. 334-343 [doi]

Point Cloud Upsampling via Disentangled RefinementRuihui Li, Xianzhi Li, Pheng-Ann Heng, Chi-Wing Fu. 344-353 [doi]

DyCo3D: Robust Instance Segmentation of 3D Point Clouds Through Dynamic ConvolutionTong He, Chunhua Shen, Anton van den Hengel. 354-363 [doi]

HCRF-Flow: Scene Flow From Point Clouds With Continuous High-Order CRFs and Position-Aware Flow EmbeddingRuibo Li, Guosheng Lin, Tong He, Fayao Liu, Chunhua Shen. 364-373 [doi]

Iso-Points: Optimizing Neural Implicit Surfaces With Hybrid RepresentationsYifan Wang, Shihao Wu, Cengiz Öztireli, Olga Sorkine-Hornung. 374-383 [doi]

Fast Sinkhorn Filters: Using Matrix Scaling for Non-Rigid Shape Correspondence With Functional MapsGautam Pai, Jing Ren, Simone Melzi, Peter Wonka, Maks Ovsjanikov. 384-393 [doi]

Globally Optimal Relative Pose Estimation With Gravity PriorYaqing Ding, Daniel Barath, Jian Yang 0003, Hui Kong, Zuzana Kukelova. 394-403 [doi]

Discovering Relationships Between Object Categories via Universal Canonical MapsNatalia Neverova, Artsiom Sanakoyeu, Patrick Labatut, David Novotný, Andrea Vedaldi. 404-413 [doi]

Neural Reprojection Error: Merging Feature Learning and Camera Pose EstimationHugo Germain, Vincent Lepetit, Guillaume Bourmaud. 414-423 [doi]

Rotation-Only Bundle AdjustmentSeong-Hun Lee, Javier Civera. 424-433 [doi]

PAUL: Procrustean Autoencoder for Unsupervised LiftingChaoyang Wang, Simon Lucey. 434-443 [doi]

Robust Multimodal Vehicle Detection in Foggy Weather Using Complementary Lidar and Radar SignalsKun Qian, Shilin Zhu, Xinyu Zhang, Li Erran Li. 444-453 [doi]

Depth-Conditioned Dynamic Message Propagation for Monocular 3D Object DetectionLi Wang, Liang Du, Xiaoqing Ye, Yanwei Fu, Guodong Guo, Xiangyang Xue, Jianfeng Feng, Li Zhang. 454-463 [doi]

Actor-Context-Actor Relation Network for Spatio-Temporal Action LocalizationJunting Pan, Siyu Chen, Mike Zheng Shou, Yu Liu, Jing Shao, Hongsheng Li 0001. 464-474 [doi]

Temporal-Relational CrossTransformers for Few-Shot Action RecognitionToby Perrett, Alessandro Masullo, Tilo Burghardt, Majid Mirmehdi, Dima Damen. 475-484 [doi]

Temporal Context Aggregation Network for Temporal Action Proposal RefinementZhiwu Qing, Haisheng Su, Weihao Gan, Dongliang Wang, Wei Wu 0021, Xiang Wang, Yu Qiao 0001, Junjie Yan, Changxin Gao, Nong Sang. 485-494 [doi]

Affordance Transfer Learning for Human-Object Interaction DetectionZhi Hou, Baosheng Yu, Yu Qiao 0001, Xiaojiang Peng, Dacheng Tao. 495-504 [doi]

Achieving Robustness in Classification Using Optimal Transport With Hinge RegularizationMathieu Serrurier, Franck Mamalet, Alberto González-Sanz, Thibaut Boissin, Jean-Michel Loubes, Eustasio del Barrio. 505-514 [doi]

Over-the-Air Adversarial Flickering Attacks Against Video Recognition NetworksRoi Pony, Itay Naeh, Shie Mannor. 515-524 [doi]

Deep Dual Consecutive Network for Human Pose EstimationZhenguang Liu, Haoming Chen, Runyang Feng, Shuang Wu, Shouling Ji, Bailin Yang, Xun Wang. 525-534 [doi]

StereoPIFu: Depth Aware Clothed Human Digitization via Stereo VisionYang Hong 0003, Juyong Zhang, Boyi Jiang, Yudong Guo, Ligang Liu, Hujun Bao. 535-545 [doi]

Body Meshes as PointsJianfeng Zhang, Dongdong Yu, Jun Hao Liew, Xuecheng Nie, Jiashi Feng. 546-556 [doi]

Cross-View Cross-Scene Multi-View Crowd CountingQi Zhang, Wei Lin, Antoni B. Chan. 557-567 [doi]

GANmut: Learning Interpretable Conditional Space for Gamut of EmotionsStefano d'Apolito, Danda Pani Paudel, Zhiwu Huang, Andrés Romero, Luc Van Gool. 568-577 [doi]

Consistent Instance False Positive Improves Fairness in Face RecognitionXingkun Xu, Yuge Huang, Pengcheng Shen, Shaoxin Li, Jilin Li, Feiyue Huang, Yong Li, Zhen Cui 0001. 578-586 [doi]

Neural Feature Search for RGB-Infrared Person Re-IdentificationYehansen Chen, Lin Wan, Zhihang Li, Qianyan Jing, Zongyuan Sun. 587-597 [doi]

Coarse-To-Fine Person Re-Identification With Auxiliary-Domain Classification and Second-Order Information BottleneckAnguo Zhang, Yueming Gao, Yuzhen Niu, Wenxi Liu, Yongcheng Zhou. 598-607 [doi]

EvDistill: Asynchronous Events To End-Task Learning via Bidirectional Reconstruction-Guided Cross-Modal Knowledge DistillationLin Wang, Yujeong Chae, Sung Hoon Yoon, Tae-Kyun Kim, Kuk-Jin Yoon. 608-619 [doi]

iVPF: Numerical Invertible Volume Preserving Flow for Efficient Lossless CompressionShifeng Zhang, Chen Zhang, Ning Kang 0001, Zhenguo Li. 620-629 [doi]

Deep Convolutional Dictionary Learning for Image DenoisingHongyi Zheng, Hongwei Yong, Lei Zhang 0006. 630-641 [doi]

Semi-Supervised Video Deraining With Dynamical Rain GeneratorZongsheng Yue, Jianwen Xie, Qian Zhao 0002, Deyu Meng. 642-652 [doi]

PPR10K: A Large-Scale Portrait Photo Retouching Dataset With Human-Region Mask and Group-Level ConsistencyJie Liang, Hui Zeng, Miaomiao Cui, Xuansong Xie, Lei Zhang 0006. 653-661 [doi]

Removing Diffraction Image Artifacts in Under-Display Camera via Dynamic Skip Connection NetworkRuicheng Feng, Chongyi Li, Huaijin Chen, Shuai Li, Chen Change Loy, Jinwei Gu. 662-671 [doi]

GAN Prior Embedded Network for Blind Face Restoration in the WildTao Yang, Peiran Ren, Xuansong Xie, Lei Zhang 0006. 672-681 [doi]

Polarimetric Normal StereoYoshiki Fukao, Ryo Kawahara, Shohei Nobuhara, Ko Nishino. 682-690 [doi]

Practical Single-Image Super-Resolution Using Look-Up TableYounghyun Jo, Seon Joo Kim. 691-700 [doi]

Deep Learning in Latent Space for Video Prediction and CompressionBowen Liu, Yu Chen, Shiyu Liu, Hun-Seok Kim. 701-710 [doi]

Debiased Subjective Assessment of Real-World Image EnhancementPeibei Cao, Zhangyang Wang, Kede Ma. 711-721 [doi]

BABEL: Bodies, Action and Behavior With English LabelsAbhinanda R. Punnakkal, Arjun Chandrasekaran, Nikos Athanasiou, Alejandra Quiros-Ramirez, Michael J. Black. 722-731 [doi]

Rethinking Channel Dimensions for Efficient Model DesignDongyoon Han, Sangdoo Yun, Byeongho Heo, Youngjoon Yoo. 732-741 [doi]

Automated Log-Scale Quantization for Low-Cost Deep Neural NetworksSangyun Oh, Hyeonuk Sim, Sugil Lee, Jongeun Lee. 742-751 [doi]

ProSelfLC: Progressive Self Label Correction for Training Robust Deep Neural NetworksXinshao Wang, Yang Hua, Elyor Kodirov, David A. Clifton, Neil M. Robertson. 752-761 [doi]

The Lottery Ticket Hypothesis for Object RecognitionSharath Girish, Shishira R. Maiya, Kamal Gupta, Hao Chen, Larry S. Davis, Abhinav Shrivastava. 762-771 [doi]

Spatial-Phase Shallow Learning: Rethinking Face Forgery Detection in Frequency DomainHonggu Liu, Xiaodan Li, Wenbo Zhou, Yuefeng Chen, Yuan He, Hui Xue 0001, Weiming Zhang, Nenghai Yu. 772-781 [doi]

Transformer Interpretability Beyond Attention VisualizationHila Chefer, Shir Gur, Lior Wolf. 782-791 [doi]

Mixed-Privacy Forgetting in Deep NetworksAditya Golatkar, Alessandro Achille, Avinash Ravichandran, Marzia Polito, Stefano Soatto. 792-801 [doi]

CoSMo: Content-Style Modulation for Image Retrieval With Text FeedbackSeungmin Lee, Dongwan Kim, Bohyung Han. 802-812 [doi]

Discrimination-Aware Mechanism for Fine-Grained Representation LearningFurong Xu, Meng Wang, Wei Zhang, Yuan Cheng, Wei Chu. 813-822 [doi]

Dual Contradistinctive Generative AutoencoderGaurav Parmar, Dacheng Li, Kwonjoon Lee, Zhuowen Tu. 823-832 [doi]

Cross-Modal Contrastive Learning for Text-to-Image GenerationHan Zhang 0010, Jing Yu Koh, Jason Baldridge, Honglak Lee, Yinfei Yang. 833-842 [doi]

Bridging the Visual Gap: Wide-Range Image BlendingChia-Ni Lu, Ya-chu Chang, Wei-chen Chiu. 843-851 [doi]

Exploiting Spatial Dimensions of Latent in GAN for Real-Time Image EditingHyunsu Kim, Yunjey Choi, Junho Kim, Sungjoo Yoo, Youngjung Uh. 852-861 [doi]

ArtFlow: Unbiased Image Style Transfer via Reversible Neural FlowsJie An, Siyu Huang, Yibing Song, Dejing Dou, Wei Liu 0005, Jiebo Luo. 862-871 [doi]

DualAST: Dual Style-Learning Networks for Artistic Style TransferHaibo Chen, Lei Zhao, Zhizhong Wang, Huiming Zhang, Zhiwen Zuo, Ailin Li, Wei Xing, Dongming Lu. 872-881 [doi]

Single-Shot Freestyle Dance ReenactmentOran Gafni, Oron Ashual, Lior Wolf. 882-891 [doi]

SceneGen: Learning To Generate Realistic Traffic ScenesShuhan Tan, Kelvin Wong, Shenlong Wang, Sivabalan Manivasagam, Mengye Ren, Raquel Urtasun. 892-901 [doi]

Learning Semantic-Aware Dynamics for Video PredictionXinzhu Bei, Yanchao Yang 0001, Stefano Soatto. 902-912 [doi]

Reinforced Attention for Few-Shot Learning and BeyondJie Hong, Pengfei Fang, Weihao Li, Tong Zhang 0023, Christian Simon, Mehrtash Harandi, Lars Petersson. 913-923 [doi]

Fast and Accurate Model ScalingPiotr Dollár, Mannat Singh, Ross B. Girshick. 924-932 [doi]

Multi-Label Learning From Single Positive LabelsElijah Cole, Oisin Mac Aodha, Titouan Lorieul, Pietro Perona, Dan Morris, Nebojsa Jojic. 933-942 [doi]

Contrastive Learning Based Hybrid Networks for Long-Tailed Image ClassificationPeng Wang 0023, Kai Han 0001, Xiu-Shen Wei, Lei Zhang 0054, Lei Wang. 943-952 [doi]

Learning Graph Embeddings for Compositional Zero-Shot LearningMuhammad Ferjad Naeem, Yongqin Xian, Federico Tombari, Zeynep Akata. 953-962 [doi]

Multispectral Photometric Stereo for Spatially-Varying Spectral Reflectances: A Well Posed Problem?Heng Guo, Fumio Okura, Boxin Shi, Takuya Funatomi, Yasuhiro Mukaigawa, Yasuyuki Matsushita. 963-971 [doi]

LiBRe: A Practical Bayesian Approach to Adversarial DetectionZhijie Deng, Xiao Yang, Shizhen Xu, Hang Su 0006, Jun Zhu 0001. 972-982 [doi]

Searching by Generating: Flexible and Efficient One-Shot NAS With Architecture GeneratorSian-Yao Huang, Wei-Ta Chu. 983-992 [doi]

Densely Connected Multi-Dilated Convolutional Networks for Dense Prediction TasksNaoya Takahashi, Yuki Mitsufuji. 993-1002 [doi]

DARCNN: Domain Adaptive Region-Based Convolutional Neural Network for Unsupervised Instance Segmentation in Biomedical ImagesJoy Hsu, Wah Chiu, Serena Yeung. 1003-1012 [doi]

FedDG: Federated Domain Generalization on Medical Image Segmentation via Episodic Learning in Continuous Frequency SpaceQuande Liu, Cheng Chen 0013, Jing Qin 0001, Qi Dou, Pheng-Ann Heng. 1013-1023 [doi]

Distractor-Aware Fast Tracking via Dynamic Convolutions and MOT PhilosophyZikai Zhang, Bineng Zhong, Shengping Zhang, Zhenjun Tang, Xin Liu 0011, Zhaoxiang Zhang. 1024-1033 [doi]

Mining Better Samples for Contrastive Learning of Temporal CorrespondenceSangryul Jeon, Dongbo Min, Seungryong Kim, Kwanghoon Sohn. 1034-1044 [doi]

UPFlow: Upsampling Pyramid for Unsupervised Optical Flow LearningKunming Luo, Chuan Wang 0001, Shuaicheng Liu, Haoqiang Fan, Jue Wang 0001, Jian Sun. 1045-1054 [doi]

KeepAugment: A Simple Information-Preserving Data Augmentation ApproachChengYue Gong, Dilin Wang, Meng Li 0004, Vikas Chandra, Qiang Liu. 1055-1064 [doi]

Keypoint-Graph-Driven Learning Framework for Object Pose EstimationShaobo Zhang, Wanqing Zhao, Ziyu Guan, Xianlin Peng, Jinye Peng. 1065-1073 [doi]

AdCo: Adversarial Contrast for Efficient Learning of Unsupervised Representations From Self-Trained Negative AdversariesQianjiang Hu, Xiao Wang 0004, Wei Hu 0003, Guo-Jun Qi. 1074-1083 [doi]

Generalized Domain AdaptationYu Mitsuzumi, Go Irie, Daiki Ikami, Takashi Shibata 0001. 1084-1093 [doi]

FixBi: Bridging Domain Spaces for Unsupervised Domain AdaptationJaemin Na, Heechul Jung, Hyung Jin Chang, Wonjun Hwang. 1094-1103 [doi]

Learning Invariant Representations and Risks for Semi-Supervised Domain AdaptationBo Li 0080, Yezhen Wang, Shanghang Zhang, Dongsheng Li, Kurt Keutzer, Trevor Darrell, Han Zhao 0002. 1104-1113 [doi]

Continual Semantic Segmentation via Repulsion-Attraction of Sparse and Disentangled Latent RepresentationsUmberto Michieli, Pietro Zanuttigh. 1114-1124 [doi]

Incremental Learning via Rate ReductionZiyang Wu, Christina Baek, Chong You, Yi Ma 0001. 1125-1133 [doi]

Partially View-Aligned Representation Learning With Noise-Robust Contrastive LossMouxing Yang, Yunfan Li, Zhenyu Huang 0005, Zitao Liu, Peng Hu 0002, Xi Peng 0001. 1134-1143 [doi]

Spatially Consistent Representation LearningByungseok Roh, Wuhyun Shin, Ildoo Kim, Sungwoong Kim. 1144-1153 [doi]

Mask Guided Matting via Progressive Refinement NetworkQihang Yu, Jianming Zhang 0001, He Zhang, Yilin Wang, Zhe Lin 0001, Ning Xu, Yutong Bai, Alan L. Yuille. 1154-1163 [doi]

The Temporal Opportunist: Self-Supervised Multi-Frame Monocular DepthJamie Watson, Oisin Mac Aodha, Victor Prisacariu, Gabriel J. Brostow, Michael Firman. 1164-1174 [doi]

Exemplar-Based Open-Set Panoptic Segmentation NetworkJaedong Hwang, Seoung Wug Oh, Joon-Young Lee, Bohyung Han. 1175-1184 [doi]

Incremental Few-Shot Instance SegmentationDan Andrei Ganea, Bas Boom, Ronald Poppe. 1185-1194 [doi]

DoDNet: Learning To Segment Multi-Organ and Tumors From Multiple Partially Labeled DatasetsJianpeng Zhang, Yutong Xie, Yong Xia, Chunhua Shen. 1195-1204 [doi]

Semi-Supervised Semantic Segmentation With Directional Context-Aware ConsistencyXin Lai, Zhuotao Tian, Li Jiang, Shu Liu 0005, Hengshuang Zhao, Liwei Wang, Jiaya Jia. 1205-1214 [doi]

Source-Free Domain Adaptation for Semantic SegmentationYuang Liu, Wei Zhang, Jun Wang. 1215-1224 [doi]

Learning the Superpixel in a Non-Iterative and Lifelong MannerLei Zhu, Qi She, Bin Zhang, Yanye Lu, Zhilin Lu, Duo Li, Jie Hu 0019. 1225-1234 [doi]

ATSO: Asynchronous Teacher-Student Optimization for Semi-Supervised Image SegmentationXinyue Huo, Lingxi Xie, Jianzhong He, Zijie Yang, Wengang Zhou, Houqiang Li, Qi Tian 0001. 1235-1244 [doi]

Can We Characterize Tasks Without Labels or Features?Bram Wallace, Ziyang Wu, Bharath Hariharan. 1245-1254 [doi]

Reconsidering Representation Alignment for Multi-View ClusteringDaniel J. Trosten, Sigurd Løkse, Robert Jenssen, Michael Kampffmeyer. 1255-1265 [doi]

Learning To Segment Rigid Motions From Two FramesGengshan Yang, Deva Ramanan. 1266-1275 [doi]

Self-Supervised Motion Learning From Static ImagesZiyuan Huang, Shiwei Zhang, Jianwen Jiang, Mingqian Tang, Rong Jin, Marcelo H. Ang. 1276-1285 [doi]

Efficient Regional Memory Network for Video Object SegmentationHaozhe Xie, Hongxun Yao, Shangchen Zhou, Shengping Zhang, Wenxiu Sun. 1286-1295 [doi]

SwiftNet: Real-Time Video Object SegmentationHaochen Wang, Xiaolong Jiang, Haibing Ren, Yao Hu, Song Bai. 1296-1305 [doi]

Improving OCR-Based Image Captioning by Incorporating Geometrical RelationshipJing Wang, Jinhui Tang, Mingkun Yang, Xiang Bai, Jiebo Luo. 1306-1315 [doi]

Improving Sign Language Translation With Monolingual Data by Sign Back-TranslationHao Zhou, Wengang Zhou, Weizhen Qi, Junfu Pu, Houqiang Li. 1316-1325 [doi]

Exploring Heterogeneous Clues for Weakly-Supervised Audio-Visual Video ParsingYu Wu, Yi Yang 0001. 1326-1335 [doi]

Looking Into Your Speech: Learning Cross-Modal Affinity for Audio-Visual Speech SeparationJiyoung Lee, Soo-Whan Chung, Sunok Kim, Hong-Goo Kang, Kwanghoon Sohn. 1336-1345 [doi]

Co-Grounding Networks With Semantic Attention for Referring Expression Comprehension in VideosSijie Song, Xudong Lin 0003, Jiaying Liu 0001, Zongming Guo, Shih-Fu Chang. 1346-1355 [doi]

Explicit Knowledge Incorporation for Visual ReasoningYifeng Zhang, Ming Jiang, Qi Zhao. 1356-1365 [doi]

Deep Gradient Projection Networks for Pan-sharpeningShuang Xu, Jiangshe Zhang 0001, Zixiang Zhao, Kai Sun, Junmin Liu, Chunxia Zhang 0002. 1366-1375 [doi]

Capturing Omni-Range Context for Omnidirectional SegmentationKailun Yang 0001, Jiaming Zhang, Simon Reiß, Xinxin Hu, Rainer Stiefelhagen. 1376-1386 [doi]

Gradient-Based Algorithms for Machine TeachingPei Wang, Kabir Nagrecha, Nuno Vasconcelos. 1387-1396 [doi]

Depth From Camera Motion and Object DetectionBrent A. Griffin, Jason J. Corso. 1397-1406 [doi]

Deep RGB-D Saliency Detection With Depth-Sensitive Attention and Automatic Multi-Modal FusionPeng Sun, Wenhu Zhang, Huanyu Wang, Songyuan Li, Xi Li. 1407-1417 [doi]

SAIL-VOS 3D: A Synthetic Dataset and Baselines for Object Detection and 3D Mesh Reconstruction From Video DataYuan-Ting Hu, Jiahong Wang, Raymond A. Yeh, Alexander G. Schwing. 1418-1428 [doi]

Deep Implicit Templates for 3D Shape RepresentationZerong Zheng, Tao Yu 0007, Qionghai Dai, Yebin Liu. 1429-1439 [doi]

Pulsar: Efficient Sphere-Based Neural RenderingChristoph Lassner, Michael Zollhöfer. 1440-1449 [doi]

Neural Deformation Graphs for Globally-Consistent Non-Rigid ReconstructionAljaz Bozic, Pablo R. Palafox, Michael Zollhöfer, Justus Thies, Angela Dai, Matthias Nießner. 1450-1459 [doi]

Modeling Multi-Label Action Dependencies for Temporal Action LocalizationPraveen Tirupattur, Kevin Duarte, Yogesh Singh Rawat, Mubarak Shah. 1460-1470 [doi]

ContactOpt: Optimizing Contact To Improve GraspsPatrick Grady, Chengcheng Tang, Christopher D. Twigg, Minh Vo, Samarth Brahmbhatt, Charles C. Kemp. 1471-1481 [doi]

From Synthetic to Real: Unsupervised Domain Adaptation for Animal Pose EstimationChen Li, Gim Hee Lee. 1482-1491 [doi]

Deep Homography for Efficient Stereo Image CompressionXin Deng 0002, Wenzhe Yang, Ren Yang, Mai Xu, Enpeng Liu, Qianhan Feng, Radu Timofte. 1492-1501 [doi]

FVC: A New Framework Towards Deep Video Compression in Feature SpaceZhihao Hu, Guo Lu, Dong Xu 0001. 1502-1511 [doi]

Zero-Shot Adversarial QuantizationYuang Liu, Wei Zhang, Jun Wang. 1512-1521 [doi]

Farewell to Mutual Information: Variational Distillation for Cross-Modal Person Re-IdentificationXudong Tian, Zhizhong Zhang, Shaohui Lin, Yanyun Qu, Yuan Xie 0006, Lizhuang Ma. 1522-1531 [doi]

Closed-Form Factorization of Latent Semantics in GANsYujun Shen, Bolei Zhou. 1532-1540 [doi]

High-Fidelity Neural Human Motion Transfer From Monocular VideoMoritz Kappel, Vladislav Golyanik, Mohamed Elgharib, Jann-Ole Henningson, Hans-Peter Seidel, Susana Castillo, Christian Theobalt, Marcus A. Magnor. 1541-1550 [doi]

Correlated Input-Dependent Label Noise in Large-Scale Image ClassificationMark Collier, Basil Mustafa, Efi Kokiopoulou, Rodolphe Jenatton, Jesse Berent. 1551-1560 [doi]

Bi-GCN: Binary Graph Convolutional NetworkJunfu Wang, Yunhong Wang, Zhen Yang, Liang Yang 0002, Yuanfang Guo. 1561-1570 [doi]

Transformer Meets Tracker: Exploiting Temporal Context for Robust Visual TrackingNing Wang 0020, Wengang Zhou, Jie Wang, Houqiang Li. 1571-1580 [doi]

FS-Net: Fast Shape-Based Network for Category-Level 6D Object Pose Estimation With Decoupled Rotation MechanismWei Chen, Xi Jia, Hyung Jin Chang, Jinming Duan 0001, LinLin Shen, Ales Leonardis. 1581-1590 [doi]

On Learning the Geodesic Path for Incremental LearningChristian Simon, Piotr Koniusz, Mehrtash Harandi. 1591-1600 [doi]

UP-DETR: Unsupervised Pre-Training for Object Detection With TransformersZhigang Dai, Bolun Cai, Yugeng Lin, Junying Chen. 1601-1610 [doi]

Robust Consistent Video Depth EstimationJohannes Kopf, Xuejian Rong, Jia-Bin Huang. 1611-1621 [doi]

Differentiable Multi-Granularity Human Representation Learning for Instance-Aware Human Semantic ParsingTianfei Zhou, Wenguan Wang, Si Liu, Yi Yang 0001, Luc Van Gool. 1622-1631 [doi]

Global Transport for Fluid Reconstruction With Learned Self-SupervisionErik Franz, Barbara Solenthaler, Nils Thuerey. 1632-1642 [doi]

VLN BERT: A Recurrent Vision-and-Language BERT for NavigationYicong Hong, Qi Wu 0001, Yuankai Qi, Cristian Rodriguez Opazo, Stephen Gould. 1643-1653 [doi]

Single-View Robot Pose and Joint Angle Estimation via Render & CompareYann Labbé, Justin Carpentier, Mathieu Aubry, Josef Sivic. 1654-1663 [doi]

Learning Deep Classifiers Consistent With Fine-Grained Novelty DetectionJiacheng Cheng, Nuno Vasconcelos. 1664-1673 [doi]

CRFace: Confidence Ranker for Model-Agnostic Face Detection RefinementNoranart Vesdapunt, Baoyuan Wang. 1674-1684 [doi]

Equalization Loss v2: A New Gradient Balance Approach for Long-Tailed Object DetectionJingru Tan, Xin Lu, Gang Zhang, Changqing Yin, Quanquan Li. 1685-1694 [doi]

Semantic-Aware Video Text DetectionWei Feng, Fei Yin, Xu-Yao Zhang, Cheng-Lin Liu. 1695-1705 [doi]

Improved Handling of Motion Blur in Online Object DetectionMohamed Sayed, Gabriel J. Brostow. 1706-1716 [doi]

IQDet: Instance-Wise Quality Distribution Sampling for Object DetectionYuchen Ma, Songtao Liu, Zeming Li, Jian Sun 0015. 1717-1725 [doi]

One Thing One Click: A Self-Training Approach for Weakly Supervised 3D Semantic SegmentationZhengzhe Liu, Xiaojuan Qi, Chi-Wing Fu. 1726-1736 [doi]

Learning Monocular 3D Reconstruction of Articulated Categories From MotionFilippos Kokkinos, Iasonas Kokkinos. 1737-1746 [doi]

SPSG: Self-Supervised Photometric Scene Generation From RGB-D ScansAngela Dai, Yawar Siddiqui, Justus Thies, Julien Valentin, Matthias Nießner. 1747-1756 [doi]

Semantic Segmentation for Real Point Cloud Scenes via Bilateral Augmentation and Adaptive FusionShi Qiu, Saeed Anwar, Nick Barnes. 1757-1767 [doi]

Unsupervised 3D Shape Completion Through GAN InversionJunzhe Zhang, Xinyi Chen, Zhongang Cai, Liang Pan, Haiyu Zhao, Shuai Yi, Chai Kiat Yeo, Bo Dai, Chen Change Loy. 1768-1777 [doi]

3D AffordanceNet: A Benchmark for Visual Object Affordance UnderstandingShengheng Deng, Xun Xu, Chaozheng Wu, Ke Chen 0004, Kui Jia. 1778-1787 [doi]

Deep Implicit Moving Least-Squares Functions for 3D ReconstructionShi-Lin Liu, Hao-Xiang Guo, Hao Pan, Peng-Shuai Wang, Xin Tong 0001, Yang Liu. 1788-1797 [doi]

Using Shape To Categorize: Low-Shot Learning With an Explicit Shape BiasStefan Stojanov, Anh Thai, James M. Rehg. 1798-1808 [doi]

Privacy Preserving Localization and Mapping From Uncalibrated CamerasMarcel Geppert, Viktor Larsson, Pablo Speciale, Johannes L. Schönberger, Marc Pollefeys. 1809-1819 [doi]

HumanGPS: Geodesic PreServing Feature for Dense Human CorrespondencesFeitong Tan, Danhang Tang, Mingsong Dou, Kaiwen Guo, Rohit Pandey, Cem Keskin, Ruofei Du, Deqing Sun, Sofien Bouaziz, Sean Ryan Fanello, Ping Tan, Yinda Zhang 0001. 1820-1830 [doi]

Learning Camera Localization via Dense Scene MatchingShitao Tang, Chengzhou Tang, Rui Huang 0001, Siyu Zhu, Ping Tan. 1831-1841 [doi]

PluckerNet: Learn To Register 3D Line ReconstructionsLiu Liu 0009, Hongdong Li, Haodong Yao, Ruyi Zha. 1842-1852 [doi]

MultiLink: Multi-Class Structure Recovery via Agglomerative Clustering and Model SelectionLuca Magri, Filippo Leveni, Giacomo Boracchi. 1853-1862 [doi]

3D-MAN: 3D Multi-Frame Attention Network for Object DetectionZetong Yang, Yin Zhou, Zhifeng Chen, Jiquan Ngiam. 1863-1872 [doi]

Exploring intermediate representation for monocular vehicle pose estimationShichao Li 0002, Zengqiang Yan, Hongyang Li, Kwang-Ting Cheng. 1873-1883 [doi]

Towards Long-Form Video UnderstandingChao-Yuan Wu, Philipp Krähenbühl. 1884-1894 [doi]

TDN: Temporal Difference Networks for Efficient Action RecognitionLimin Wang 0002, Zhan Tong, bin Ji, Gangshan Wu. 1895-1904 [doi]

Self-Supervised Learning for Semi-Supervised Temporal Action ProposalXiang Wang, Shiwei Zhang, Zhiwu Qing, Yuanjie Shao, Changxin Gao, Nong Sang. 1905-1914 [doi]

WOAD: Weakly Supervised Online Action Detection in Untrimmed VideosMingfei Gao, Yingbo Zhou, Ran Xu, Richard Socher, Caiming Xiong. 1915-1923 [doi]

Enhancing the Transferability of Adversarial Attacks Through Variance TuningXiaosen Wang, Kun He 0001. 1924-1933 [doi]

You See What I Want You To See: Exploring Targeted Black-Box Transferability Attack for Hash-Based Image Retrieval SystemsYanru Xiao, Cong Wang. 1934-1943 [doi]

Pose Recognition With Cascade TransformersKe Li 0012, Shijie Wang, Xiang Zhang, Yifan Xu, Weijian Xu, Zhuowen Tu. 1944-1953 [doi]

End-to-End Human Pose and Mesh Reconstruction with TransformersKevin Lin, Lijuan Wang, Zicheng Liu 0001. 1954-1963 [doi]

Beyond Static Features for Temporally Consistent 3D Human Pose and Shape From a VideoHongsuk Choi, Gyeongsik Moon, Ju Yong Chang, Kyoung Mu Lee. 1964-1973 [doi]

A Generalized Loss Function for Crowd Counting and LocalizationJia Wan, Ziquan Liu, Antoni B. Chan. 1974-1983 [doi]

LOHO: Latent Optimization of Hairstyles via OrthogonalizationRohit Saha, Brendan Duke, Florian Shkurti, Graham W. Taylor, Parham Aarabi. 1984-1993 [doi]

Pseudo Facial Generation With Extreme Poses for Face RecognitionGuoli Wang, Jiaqi Ma, Qian Zhang 0009, Jiwen Lu, Jie Zhou 0001. 1994-2003 [doi]

Joint Generative and Contrastive Learning for Unsupervised Person Re-IdentificationHao Chen, Yaohui Wang, Benoit Lagadec, Antitza Dantcheva, François Brémond. 2004-2013 [doi]

BiCnet-TKS: Learning Efficient Spatial-Temporal Representation for Video Person Re-IdentificationRuibing Hou, Hong Chang, Bingpeng Ma, Rui Huang 0001, Shiguang Shan. 2014-2023 [doi]

Learning To Reconstruct High Speed and High Dynamic Range Videos From EventsYunhao Zou, Yinqiang Zheng, Tsuyoshi Takatani, Ying Fu 0001. 2024-2033 [doi]

Iterative Filter Adaptive Network for Single Image Defocus DeblurringJunyong Lee, Hyeongseok Son, Jaesung Rim, Sunghyun Cho, Seungyong Lee. 2034-2042 [doi]

Recorrupted-to-Recorrupted: Unsupervised Deep Learning for Image DenoisingTongyao Pang, Huan Zheng, Yuhui Quan, Hui Ji. 2043-2052 [doi]

Closing the Loop: Joint Rain Generation and Removal via Disentangled Image TranslationYuntong Ye, Yi Chang 0002, Hanyu Zhou, Luxin Yan. 2053-2062 [doi]

Deep Denoising of Flash and No-Flash Pairs for Photography in Low-Light EnvironmentsZhihao Xia, Michael Gharbi, Federico Perazzi, Kalyan Sunkavalli, Ayan Chakrabarti. 2063-2072 [doi]

Controllable Image Restoration for Under-Display Camera in SmartphonesKinam Kwon, Eunhee Kang, Sangwon Lee, Su-Jin Lee, Hyong-Euk Lee, ByungIn Yoo, Jae-Joon Han. 2073-2082 [doi]

MetaSCI: Scalable and Adaptive Reconstruction for Video Compressive SensingZhengjue Wang, Hao Zhang 0050, Ziheng Cheng, Bo Chen, Xin Yuan. 2083-2092 [doi]

Learning the Non-Differentiable Optimization for Blind Super-ResolutionZheng Hui, Jie Li, Xiumei Wang, Xinbo Gao 0001. 2093-2102 [doi]

Robust Reference-Based Super-Resolution via C2-MatchingYuming Jiang 0003, Kelvin C. K. Chan, Xintao Wang, Chen Change Loy, Ziwei Liu 0002. 2103-2112 [doi]

Space-Time Distillation for Video Super-ResolutionZeyu Xiao, Xueyang Fu, Jie Huang, Zhen Cheng, Zhiwei Xiong. 2113-2122 [doi]

Person30K: A Dual-Meta Generalization Network for Person Re-IdentificationYan Bai, Jile Jiao, Ce Wang, Jun Liu 0036, Yihang Lou, Xuetao Feng, Ling-Yu Duan. 2123-2132 [doi]

Zillow Indoor Dataset: Annotated Floor Plans With 360deg Panoramas and 3D Room LayoutsSteve Cruz, Will Hutchcroft, Yuguang Li, Naji Khosravan, Ivaylo Boyadzhiev, Sing Bing Kang. 2133-2143 [doi]

The Heterogeneity Hypothesis: Finding Layer-Wise Differentiated Network ArchitecturesYawei Li, Wen Li 0001, Martin Danelljan, Kai Zhang 0008, Shuhang Gu, Luc Van Gool, Radu Timofte. 2144-2153 [doi]

Distilling Object Detectors via Decoupled FeaturesJianyuan Guo, Kai Han 0002, Yunhe Wang 0001, Han Wu, Xinghao Chen 0001, Chunjing Xu, Chang Xu 0002. 2154-2164 [doi]

S2-BNN: Bridging the Gap Between Self-Supervised Real and 1-Bit Neural Networks via Guided Distribution CalibrationZhiqiang Shen, Zechun Liu, Jie Qin, Lei Huang 0015, Kwang-Ting Cheng, Marios Savvides. 2165-2174 [doi]

BCNet: Searching for Network Width With Bilaterally Coupled NetworkXiu Su, Shan You, Fei Wang 0032, Chen Qian 0006, Changshui Zhang, Chang Xu 0002. 2175-2184 [doi]

Multi-Attentional Deepfake DetectionHanqing Zhao, Wenbo Zhou, Dongdong Chen 0001, Tianyi Wei, Weiming Zhang, Nenghai Yu. 2185-2194 [doi]

A Peek Into the Reasoning of Neural Networks: Interpreting With Structural Visual ConceptsYunhao Ge, Yao Xiao, Zhi Xu, Meng Zheng, Srikrishna Karanam, Terrence Chen, Laurent Itti, Ziyan Wu. 2195-2204 [doi]

Probabilistic Selective Encryption of Convolutional Neural Networks for Hierarchical ServicesJinyu Tian, Jiantao Zhou 0001, Jia Duan. 2205-2214 [doi]

Multi-Modal Relational Graph for Cross-Modal Video Moment RetrievalYawen Zeng, Da Cao, Xiaochi Wei, Meng Liu 0006, Zhou Zhao, Zheng Qin. 2215-2224 [doi]

PhD Learning: Learning With Pompeiu-Hausdorff Distances for Video-Based Vehicle Re-IdentificationJianan Zhao, Fengliang Qi, Guangyu Ren, Lin Xu. 2225-2235 [doi]

Pareidolia Face ReenactmentLinsen Song, Wayne Wu, Chaoyou Fu, Chen Qian 0006, Chen Change Loy, Ran He. 2236-2245 [doi]

Hyper-LifelongGAN: Scalable Lifelong Learning for Image Conditioned GenerationMengyao Zhai, Lei Chen 0023, Greg Mori. 2246-2255 [doi]

TediGAN: Text-Guided Diverse Face Image Generation and ManipulationWeihao Xia, Yujiu Yang, Jing-Hao Xue, Baoyuan Wu. 2256-2265 [doi]

TransFill: Reference-Guided Image Inpainting by Merging Multiple Color and Spatial TransformationsYuQian Zhou, Connelly Barnes, Eli Shechtman, Sohrab Amirghodsi. 2266-2276 [doi]

ArtCoder: An End-to-End Method for Generating Scanning-Robust Stylized QR CodesHao Su, Jianwei Niu 0002, Xuefeng Liu 0001, Qingfeng Li, Ji Wan, Mingliang Xu, Tao Ren. 2277-2286 [doi]

Encoding in Style: A StyleGAN Encoder for Image-to-Image TranslationElad Richardson, Yuval Alaluf, Or Patashnik, Yotam Nitzan, Yaniv Azar, Stav Shapiro, Daniel Cohen-Or. 2287-2296 [doi]

Few-Shot Human Motion Transfer by Personalized Geometry and Texture ModelingZhichao Huang, Xintong Han, Jia Xu, Tong Zhang. 2297-2306 [doi]

OCONet: Image Extrapolation by Object CompletionRichard Strong Bowen, Huiwen Chang, Charles Herrmann, Piotr Teterwak, Ce Liu, Ramin Zabih. 2307-2317 [doi]

Greedy Hierarchical Variational Autoencoders for Large-Scale Video PredictionBohan Wu, Suraj Nair, Roberto Martín-Martín, Li Fei-Fei 0001, Chelsea Finn. 2318-2328 [doi]

Mutual CRF-GNN for Few-Shot LearningShixiang Tang, Dapeng Chen, Lei Bai 0001, Kaijian Liu, Yixiao Ge, Wanli Ouyang. 2329-2339 [doi]

Re-Labeling ImageNet: From Single to Multi-Labels, From Global to Localized LabelsSangdoo Yun, Seong Joon Oh, Byeongho Heo, Dongyoon Han, Junsuk Choe, Sanghyuk Chun. 2340-2350 [doi]

Differentiable Patch Selection for Image RecognitionJean-Baptiste Cordonnier, Aravindh Mahendran, Alexey Dosovitskiy, Dirk Weissenborn, Jakob Uszkoreit, Thomas Unterthiner. 2351-2360 [doi]

Distribution Alignment: A Unified Framework for Long-Tail Visual RecognitionSongyang Zhang, Zeming Li, Shipeng Yan, Xuming He 0001, Jian Sun. 2361-2370 [doi]

Contrastive Embedding for Generalized Zero-Shot LearningZongyan Han, Zhenyong Fu, Shuo Chen 0003, Jian Yang 0003. 2371-2381 [doi]

Normal Integration via Inverse Plane Fitting With Minimum Point-to-Plane DistanceXu Cao, Boxin Shi, Fumio Okura, Yasuyuki Matsushita. 2382-2391 [doi]

Bayesian Nested Neural Networks for Uncertainty Calibration and Adaptive CompressionYufei Cui, Ziquan Liu, Qiao Li 0001, Antoni B. Chan, Chun Jason Xue. 2392-2401 [doi]

NetAdaptV2: Efficient Neural Architecture Search With Fast Super-Network Training and Architecture OptimizationTien-Ju Yang, Yi-Lun Liao, Vivienne Sze. 2402-2411 [doi]

MIST: Multiple Instance Spatial TransformerBaptiste Angles, Yuhe Jin, Simon Kornblith, Andrea Tagliasacchi, Kwang Moo Yi. 2412-2422 [doi]

Multi-Institutional Collaborations for Improving Deep Learning-Based Magnetic Resonance Image Reconstruction Using Federated LearningPengfei Guo, Puyang Wang, Jinyuan Zhou, Shanshan Jiang, Vishal M. Patel. 2423-2432 [doi]

A Self-Boosting Framework for Automated Radiographic Report GenerationZhanyu Wang, Luping Zhou, Lei Wang 0001, Xiu Li. 2433-2442 [doi]

Learning a Proposal Classifier for Multiple Object TrackingPeng Dai, Renliang Weng, Wongun Choi, Changshui Zhang, Zhangping He, Wei Ding. 2443-2452 [doi]

Improving Multiple Object Tracking With Single Object TrackingLinyu Zheng, Ming Tang 0001, Yingying Chen, Guibo Zhu, Jinqiao Wang, Hanqing Lu. 2453-2462 [doi]

Feature-Level Collaboration: Joint Unsupervised Learning of Optical Flow, Stereo Depth and Camera MotionCheng Chi, Qingjie Wang, Tianyu Hao, Peng Guo, Xin Yang. 2463-2473 [doi]

MaxUp: Lightweight Adversarial Training With Data Augmentation Improves Neural Network TrainingChengYue Gong, Tongzheng Ren, Mao Ye, Qiang Liu 0001. 2474-2483 [doi]

Unsupervised Human Pose Estimation Through Transforming Shape TemplatesLuca Schmidtke, Athanasios Vlontzos, Simon Ellershaw, Anna Lukens, Tomoki Arichi, Bernhard Kainz. 2484-2494 [doi]

Understanding the Behaviour of Contrastive LossFeng Wang, Huaping Liu. 2495-2504 [doi]

Cross-Domain Adaptive Clustering for Semi-Supervised Domain AdaptationJichang Li, Guanbin Li, Yemin Shi 0001, Yizhou Yu. 2505-2514 [doi]

Divergence Optimization for Noisy Universal Domain AdaptationQing Yu, Atsushi Hashimoto, Yoshitaka Ushiku. 2515-2524 [doi]

Limitations of Post-Hoc Feature Alignment for RobustnessCollin Burns, Jacob Steinhardt. 2525-2533 [doi]

Semantic-Aware Knowledge Distillation for Few-Shot Class-Incremental LearningAli Cheraghian, Shafin Rahman, Pengfei Fang, Soumava Kumar Roy, Lars Petersson, Mehrtash Harandi. 2534-2543 [doi]

Adaptive Aggregation Networks for Class-Incremental LearningYaoyao Liu, Bernt Schiele, Qianru Sun. 2544-2553 [doi]

Progressive Modality Reinforcement for Human Multimodal Emotion Recognition From Unaligned Multimodal SequencesFengmao Lv, Xiang Chen, Yanyong Huang, Lixin Duan, Guosheng Lin. 2554-2562 [doi]

Unsupervised Visual Representation Learning by Tracking Patches in VideoGuangting Wang, Yizhou Zhou, Chong Luo, Wenxuan Xie, Wenjun Zeng, Zhiwei Xiong. 2563-2572 [doi]

HoHoNet: 360 Indoor Holistic Understanding With Latent Horizontal FeaturesCheng Sun 0004, Min Sun, Hwann-Tzong Chen. 2573-2582 [doi]

Depth Completion With Twin Surface Extrapolation at Occlusion BoundariesSaif Imran, Xiaoming Liu 0002, Daniel Morris 0002. 2583-2592 [doi]

Zero-Shot Instance SegmentationYe Zheng, Jiahong Wu, Yongqiang Qin, Faen Zhang, Li Cui. 2593-2602 [doi]

Unsupervised Discovery of the Long-Tail in Instance Segmentation Using Hierarchical Self-SupervisionZhenzhen Weng, Mehmet Giray Ogut, Shai Limonchik, Serena Yeung. 2603-2612 [doi]

Semi-Supervised Semantic Segmentation With Cross Pseudo SupervisionXiaokang Chen, Yuhui Yuan, Gang Zeng, Jingdong Wang 0001. 2613-2622 [doi]

Non-Salient Region Object Mining for Weakly Supervised Semantic SegmentationYazhou Yao, Tao Chen 0012, Guo-Sen Xie, Chuanyi Zhang, Fumin Shen, Qi Wu 0001, Zhenmin Tang, Jian Zhang 0002. 2623-2632 [doi]

ABMDRNet: Adaptive-Weighted Bi-Directional Modality Difference Reduction Network for RGB-T Semantic SegmentationQiang Zhang 0020, Shenlu Zhao, Yongjiang Luo, Dingwen Zhang, Nianchang Huang, Jungong Han. 2633-2642 [doi]

BBAM: Bounding Box Attribution Map for Weakly Supervised Semantic and Instance SegmentationJungbeom Lee, Jihun Yi, Chaehun Shin, Sungroh Yoon. 2643-2652 [doi]

Positive-Unlabeled Data Purification in the Wild for Object DetectionJianyuan Guo, Kai Han 0002, Han Wu, Chao Zhang 0001, Xinghao Chen, Chunjing Xu, Chang Xu 0002, Yunhe Wang. 2653-2662 [doi]

Ranking Neural CheckpointsYandong Li, Xuhui Jia, Ruoxin Sang, Yukun Zhu, Bradley Green, Liqiang Wang, Boqing Gong. 2663-2673 [doi]

SelfAugment: Automatic Augmentation Policies for Self-Supervised LearningColorado J. Reed, Sean Metzger, Aravind Srinivas, Trevor Darrell, Kurt Keutzer. 2674-2683 [doi]

Self-Supervised Multi-Frame Monocular Scene FlowJunhwa Hur, Stefan Roth 0001. 2684-2694 [doi]

Skip-Convolutions for Efficient Video ProcessingAmirHossein Habibian, Davide Abati, Taco S. Cohen, Babak Ehteshami Bejnordi. 2695-2704 [doi]

Learning To Associate Every Segment for Video Panoptic SegmentationSanghyun Woo, Dahun Kim, Joon-Young Lee, In-So Kweon. 2705-2714 [doi]

Triple-Cooperative Video Shadow DetectionZhihao Chen, Liang Wan, Lei Zhu 0003, Jia Shen, Huazhu Fu, Wennan Liu, Jing Qin 0001. 2715-2724 [doi]

Image Change Captioning by Learning From an Auxiliary TaskMehrdad Hosseinzadeh, Yang Wang 0003. 2725-2734 [doi]

How2Sign: A Large-Scale Multimodal Dataset for Continuous American Sign LanguageAmanda Cardoso Duarte, Shruti Palaskar, Lucas Ventura, Deepti Ghadiyaram, Kenneth DeHaan, Florian Metze, Jordi Torres, Xavier Giró i Nieto. 2735-2744 [doi]

Cyclic Co-Learning of Sounding Object Visual Grounding and Sound SeparationYapeng Tian, Di Hu, Chenliang Xu. 2745-2754 [doi]

LipSync3D: Data-Efficient Learning of Personalized 3D Talking Faces From Video Using Pose and Lighting NormalizationAvisek Lahiri, Vivek Kwatra, Christian Früh, John Lewis, Chris Bregler. 2755-2764 [doi]

Interventional Video Grounding With Dual Contrastive LearningGuoshun Nan, Rui Qiao, Yao Xiao, Jun Liu, Sicong Leng, Hao Zhang, Wei Lu. 2765-2775 [doi]

Roses Are Red, Violets Are Blue... but Should VQA Expect Them To?Corentin Kervadec, Grigory Antipov, Moez Baccouche, Christian Wolf 0001. 2776-2785 [doi]

ReDet: A Rotation-Equivariant Detector for Aerial Object DetectionJiaming Han, Jian Ding, Nan Xue 0001, Gui-Song Xia. 2786-2795 [doi]

Roof-GAN: Learning To Generate Roof Geometry and Relations for Residential HousesYiming Qian, Hao Zhang 0002, Yasutaka Furukawa. 2796-2805 [doi]

PANDA: Adapting Pretrained Features for Anomaly Detection and SegmentationTal Reiss, Niv Cohen, Liron Bergman, Yedid Hoshen. 2806-2814 [doi]

Differentiable SLAM-Net: Learning Particle SLAM for Visual NavigationPéter Karkus, Shaojun Cai, David Hsu. 2815-2825 [doi]

DyStaB: Unsupervised Object Segmentation via Dynamic-Static BootstrappingYanchao Yang 0001, Brian Lai, Stefano Soatto. 2826-2836 [doi]

Diffusion Probabilistic Models for 3D Point Cloud GenerationShitong Luo, Wei Hu. 2837-2845 [doi]

Learned Initializations for Optimizing Coordinate-Based Neural RepresentationsMatthew Tancik, Ben Mildenhall, Terrance Wang, Divi Schmidt, Pratul P. Srinivasan, Jonathan T. Barron, Ren Ng. 2846-2855 [doi]

Neural Scene Graphs for Dynamic ScenesJulian Ost, Fahim Mannan, Nils Thuerey, Julian Knodt, Felix Heide. 2856-2865 [doi]

Consensus Maximisation Using Influences of Monotone Boolean FunctionsRuwan B. Tennakoon, David Suter, Erchuan Zhang, Tat-Jun Chin, Alireza Bab-Hadiashar. 2866-2875 [doi]

Task Programming: Learning Data Efficient Behavior RepresentationsJennifer J. Sun, Ann Kennedy, Eric Zhan, David J. Anderson, Yisong Yue, Pietro Perona. 2876-2885 [doi]

SCANimate: Weakly Supervised Learning of Skinned Clothed Avatar NetworksShunsuke Saito, Jinlong Yang, Qianli Ma, Michael J. Black. 2886-2897 [doi]

Diverse Part Discovery: Occluded Person Re-Identification With Part-Aware TransformerYulin Li, Jianfeng He, Tianzhu Zhang, Xiang Liu, Yongdong Zhang 0001, Feng Wu 0001. 2898-2907 [doi]

What's in the Image? Explorable Decoding of Compressed ImagesYuval Bahat, Tomer Michaeli. 2908-2917 [doi]

Simple Copy-Paste Is a Strong Data Augmentation Method for Instance SegmentationGolnaz Ghiasi, Yin Cui, Aravind Srinivas, Rui Qian, Tsung-Yi Lin, Ekin D. Cubuk, Quoc V. Le, Barret Zoph. 2918-2928 [doi]

Face Forgery Detection by 3D DecompositionXiangyu Zhu, Hao Wang 0074, Hongyan Fei, Zhen Lei, Stan Z. Li. 2929-2939 [doi]

Convolutional Hough Matching NetworksJuhong Min, Minsu Cho. 2940-2950 [doi]

L2M-GAN: Learning To Manipulate Latent Space Semantics for Facial Attribute EditingGuoxing Yang, Nanyi Fei, Mingyu Ding, Guangzhen Liu, Zhiwu Lu, Tao Xiang. 2951-2960 [doi]

Patchwise Generative ConvNet: Training Energy-Based Models From a Single Natural Image for Internal LearningZilong Zheng, Jianwen Xie, Ping Li. 2961-2970 [doi]

Generative Classifiers as a Basis for Trustworthy Image ClassificationRadek Mackowiak, Lynton Ardizzone, Ullrich Köthe, Carsten Rother. 2971-2981 [doi]

HR-NAS: Searching Efficient High-Resolution Neural Architectures With Lightweight TransformersMingyu Ding, Xiaochen Lian, Linjie Yang, Peng Wang, Xiaojie Jin, Zhiwu Lu, Ping Luo 0002. 2982-2992 [doi]

Progressive Unsupervised Learning for Visual Object TrackingQiangqiang Wu, Jia Wan, Antoni B. Chan. 2993-3002 [doi]

FFB6D: A Full Flow Bidirectional Fusion Network for 6D Pose EstimationYisheng He, Haibin Huang, Haoqiang Fan, Qifeng Chen, Jian Sun. 3003-3013 [doi]

DER: Dynamically Expandable Representation for Class Incremental LearningShipeng Yan, Jiangwei Xie, Xuming He 0001. 3014-3023 [doi]

Dense Contrastive Learning for Self-Supervised Visual Pre-TrainingXinlong Wang, Rufeng Zhang, Chunhua Shen, Tao Kong, Lei Li. 3024-3033 [doi]

S2R-DepthNet: Learning a Generalizable Depth-Specific Structural RepresentationXiaotian Chen, Yuwang Wang, Xuejin Chen, Wenjun Zeng. 3034-3043 [doi]

Depth-Aware Mirror SegmentationHaiyang Mei, Bo Dong, Wen Dong, Pieter Peers, Xin Yang 0011, Qiang Zhang, Xiaopeng Wei. 3044-3053 [doi]

Video Prediction Recalling Long-Term Motion Context via Memory Alignment LearningSangmin Lee, Hak Gu Kim, Dae Hwi Choi, Hyung-il Kim, Yong Man Ro. 3054-3063 [doi]

Room-and-Object Aware Knowledge Reasoning for Remote Embodied Referring ExpressionChen Gao, Jinyu Chen, Si Liu 0001, Luting Wang, Qiong Zhang, Qi Wu. 3064-3073 [doi]

GATSBI: Generative Agent-Centric Spatio-Temporal Object InteractionCheol-Hui Min, Jinseok Bae, Junho Lee, Young-Min Kim. 3074-3083 [doi]

Crossing Cuts Polygonal Puzzles: Models and SolversPeleg Harel, Ohad Ben-Shahar. 3084-3093 [doi]

Transformation Invariant Few-Shot Object DetectionAoxue Li, Zhenguo Li. 3094-3102 [doi]

Adaptive Class Suppression Loss for Long-Tail Object DetectionTong Wang, Yousong Zhu, Chaoyang Zhao, Wei Zeng, Jinqiao Wang, Ming Tang 0001. 3103-3112 [doi]

What if We Only Use Real Datasets for Scene Text Recognition? Toward Scene Text Recognition With Fewer LabelsJeonghun Baek, Yusuke Matsui, Kiyoharu Aizawa. 3113-3122 [doi]

Fourier Contour Embedding for Arbitrary-Shaped Text DetectionYiqin Zhu, Jianyong Chen, Lingyu Liang, Zhanghui Kuang, Lianwen Jin, Wayne Zhang. 3123-3131 [doi]

Humble Teachers Teach Better Students for Semi-Supervised Object DetectionYihe Tang, Weifeng Chen, Yijun Luo, Yuting Zhang. 3132-3141 [doi]

Cross-Modal Center Loss for 3D Cross-Modal RetrievalLonglong Jing, Elahe Vahdani, Jiaxing Tan, Yingli Tian. 3142-3151 [doi]

Single-View 3D Object Reconstruction From Shape Priors in MemoryShuo Yang, Min Xu 0001, Haozhe Xie, Stuart W. Perry, Jiahao Xia. 3152-3161 [doi]

NeuralFusion: Online Depth Fusion in Latent SpaceSilvan Weder, Johannes L. Schönberger, Marc Pollefeys, Martin R. Oswald. 3162-3172 [doi]

PAConv: Position Adaptive Convolution With Dynamic Kernel Assembling on Point CloudsMutian Xu, Runyu Ding, Hengshuang Zhao, Xiaojuan Qi. 3173-3182 [doi]

Self-Supervised Pillar Motion Learning for Autonomous DrivingChenxu Luo, Xiaodong Yang, Alan L. Yuille. 3183-3192 [doi]

Scan2Cap: Context-Aware Dense Captioning in RGB-D ScansDave Zhenyu Chen, Ali Gholami, Matthias Nießner, Angel X. Chang. 3193-3203 [doi]

Neural Parts: Learning Expressive 3D Shape Abstractions With Invertible Neural NetworksDespoina Paschalidou, Angelos Katharopoulos, Andreas Geiger 0001, Sanja Fidler. 3204-3215 [doi]

Universal Spectral Adversarial Attacks for Deformable ShapesArianna Rampini, Franco Pestarini, Luca Cosmo, Simone Melzi, Emanuele Rodolà. 3216-3226 [doi]

Large-Scale Localization Datasets in Crowded Indoor SpacesDonghwan Lee, Soo-Hyun Ryu, Suyong Yeon, Yonghan Lee, Deokhwa Kim, Cheolho Han, Yohann Cabon, Philippe Weinzaepfel, Nicolas Guérin, Gabriela Csurka, Martin Humenberger. 3227-3236 [doi]

Learnable Motion Coherence for Correspondence PruningYuan Liu, Lingjie Liu, Cheng Lin, Zhen Dong, Wenping Wang. 3237-3246 [doi]

Back to the Feature: Learning Robust Camera Localization From Pixels To PosePaul-Edouard Sarlin, Ajaykumar Unagar, Måns Larsson, Hugo Germain, Carl Toft, Viktor Larsson, Marc Pollefeys, Vincent Lepetit, Lars Hammarstrand, Fredrik Kahl, Torsten Sattler. 3247-3257 [doi]

Wide-Baseline Relative Camera Pose Estimation With Directional LearningKefan Chen, Noah Snavely, Ameesh Makadia. 3258-3268 [doi]

Deep Optimized Priors for 3D Shape Modeling and ReconstructionMingyue Yang, Yuxin Wen, Weikai Chen 0001, Yongwei Chen, Kui Jia. 3269-3278 [doi]

PVGNet: A Bottom-Up One-Stage 3D Object Detector With Integrated Multi-Level FeaturesZhenwei Miao, Jikai Chen, Hongyu Pan, Ruiwen Zhang, Kaixuan Liu, Peihan Hao, Jun Zhu, Yang Wang, Xin Zhan. 3279-3288 [doi]

Objects Are Different: Flexible Monocular 3D Object DetectionYunpeng Zhang, Jiwen Lu, Jie Zhou 0001. 3289-3298 [doi]

A Large-Scale Study on Unsupervised Spatiotemporal Representation LearningChristoph Feichtenhofer, Haoqi Fan 0001, Bo Xiong, Ross B. Girshick, Kaiming He. 3299-3309 [doi]

Representing Videos As Discriminative Sub-Graphs for Action RecognitionDong Li 0019, Zhaofan Qiu, Yingwei Pan, Ting Yao, Houqiang Li, Tao Mei 0001. 3310-3319 [doi]

Learning Salient Boundary Feature for Anchor-free Temporal Action LocalizationChuming Lin, Chengming Xu 0001, Donghao Luo, Yabiao Wang, Ying Tai, Chengjie Wang, Jilin Li, Feiyue Huang, Yanwei Fu. 3320-3329 [doi]

QAIR: Practical Query-Efficient Black-Box Attacks for Image RetrievalXiaodan Li, Jinfeng Li, Yuefeng Chen, Shaokai Ye, Yuan He, Shuhui Wang, Hang Su, Hui Xue 0001. 3330-3339 [doi]

Defending Multimodal Fusion Models Against Single-Source AdversariesKarren Yang, Wan-Yi Lin, Manash Barman, Filipe Condessa, J. Zico Kolter. 3340-3349 [doi]

Training Generative Adversarial Networks in One StageChengchao Shen, Youtan Yin, Xinchao Wang, Xubin Li, Jie Song, Mingli Song. 3350-3360 [doi]

Learning Complete 3D Morphable Face Models From Images and VideosMallikarjun B. R. 0001, Ayush Tewari, Hans-Peter Seidel, Mohamed Elgharib, Christian Theobalt. 3361-3371 [doi]

We Are More Than Our Joints: Predicting How 3D Bodies MoveYan Zhang, Michael J. Black, Siyu Tang. 3372-3382 [doi]

HybrIK: A Hybrid Analytical-Neural Inverse Kinematics Solution for 3D Human Pose and Shape EstimationJiefeng Li, Chao Xu, Zhicun Chen, Siyuan Bian, Lixin Yang, Cewu Lu. 3383-3393 [doi]

Learning To Count EverythingViresh Ranjan, Udbhav Sharma, Thu Nguyen, Minh Hoai. 3394-3403 [doi]

Information Bottleneck Disentanglement for Identity SwappingGege Gao, Huaibo Huang, Chaoyou Fu, Zhaoyang Li, Ran He. 3404-3413 [doi]

Mitigating Face Recognition Bias via Group Adaptive ClassifierSixue Gong, Xiaoming Liu 0002, Anil K. Jain 0001. 3414-3424 [doi]

Meta Batch-Instance Normalization for Generalizable Person Re-IdentificationSeokeon Choi, Taekyung Kim, Minki Jeong, Hyoungseob Park, Changick Kim. 3425-3435 [doi]

Refining Pseudo Labels With Clustering Consensus Over Generations for Unsupervised Object Re-IdentificationXiao Zhang, Yixiao Ge, Yu Qiao 0001, Hongsheng Li 0001. 3436-3445 [doi]

Back to Event Basics: Self-Supervised Learning of Image Reconstruction for Event Cameras via Photometric ConstancyFederico Paredes-Vallés, Guido C. H. E. de Croon. 3446-3455 [doi]

DeFMO: Deblurring and Shape Recovery of Fast Moving ObjectsDenys Rozumnyi, Martin R. Oswald, Vittorio Ferrari, Jiri Matas, Marc Pollefeys. 3456-3465 [doi]

Efficient Multi-Stage Video Denoising With Recurrent Spatio-Temporal FusionMatteo Maggioni, Yibin Huang, Cheng Li, Shuai Xiao, Zhongqian Fu, Fenglong Song. 3466-3475 [doi]

ZeroScatter: Domain Transfer for Long Distance Imaging and Vision Through Scattering MediaZheng Shi, Ethan Tseng, Mario Bijelic, Werner Ritter, Felix Heide. 3476-3486 [doi]

Restoring Extremely Dark Images in Real TimeMohit Lamba, Kaushik Mitra. 3487-3497 [doi]

Practical Wide-Angle Portraits Correction With Deep Structured ModelsJing Tan, Shan Zhao, Pengfei Xiong, Jiangyu Liu, Haoqiang Fan, Shuaicheng Liu. 3498-3506 [doi]

End-to-End Learning for Joint Image Demosaicing, Denoising and Super-ResolutionWenzhu Xing, Karen O. Egiazarian. 3507-3516 [doi]

Image Super-Resolution With Non-Local Sparse AttentionYiqun Mei, Yuchen Fan, YuQian Zhou. 3517-3526 [doi]

Video Rescaling Networks With Joint Optimization Strategies for Downscaling and UpscalingYan-Cheng Huang, Yi-Hsin Chen, Cheng-You Lu, Hui-Po Wang, Wen-Hsiao Peng, Ching-Chun Huang. 3527-3536 [doi]

Restore From Restored: Video Restoration With Pseudo Clean VideoSeunghwan Lee, Donghyeon Cho, Jiwon Kim, Tae-Hyun Kim. 3537-3546 [doi]

Enriching ImageNet With Human Similarity Judgments and Psychological EmbeddingsBrett D. Roads, Bradley C. Love. 3547-3557 [doi]

Conceptual 12M: Pushing Web-Scale Image-Text Pre-Training To Recognize Long-Tail Visual ConceptsSoravit Changpinyo, Piyush Sharma, Nan Ding, Radu Soricut. 3558-3568 [doi]

CondenseNet V2: Sparse Feature Reactivation for Deep NetworksLe Yang, Haojun Jiang, Ruojin Cai, Yulin Wang, Shiji Song, Gao Huang, Qi Tian. 3569-3578 [doi]

Revisiting Knowledge Distillation: An Inheritance and Exploration FrameworkZhen Huang, Xu Shen, Jun Xing, Tongliang Liu, Xinmei Tian 0001, Houqiang Li, Bing Deng, Jianqiang Huang, Xian-Sheng Hua 0001. 3579-3588 [doi]

Minimally Invasive Surgery for Sparse Neural Networks in Contrastive MannerChong Yu. 3589-3598 [doi]

Effective Sparsification of Neural Networks With Global Sparsity ConstraintXiao Zhou, Weizhong Zhang, Hang Xu, Tong Zhang. 3599-3608 [doi]

Improving the Efficiency and Robustness of Deepfakes Detection Through Precise Geometric FeaturesZekun Sun, Yujie Han, Zeyu Hua, Na Ruan, Weijia Jia 0001. 3609-3618 [doi]

Right for the Right Concept: Revising Neuro-Symbolic Concepts by Interacting With Their ExplanationsWolfgang Stammer, Patrick Schramowski, Kristian Kersting. 3619-3629 [doi]

Protecting Intellectual Property of Generative Adversarial Networks From Ambiguity AttacksDing Sheng Ong, Chee Seng Chan, KamWoh Ng, Lixin Fan, Qiang Yang. 3630-3639 [doi]

VIGOR: Cross-View Image Geo-Localization Beyond One-to-One RetrievalSijie Zhu, Taojiannan Yang, Chen Chen 0001. 3640-3649 [doi]

On Semantic Similarity in Video RetrievalMichael Wray, Hazel Doughty, Dima Damen. 3650-3660 [doi]

Flow-Guided One-Shot Talking Face Generation With a High-Resolution Audio-Visual DatasetZhimeng Zhang, Lincheng Li, Yu Ding 0001, Changjie Fan. 3661-3670 [doi]

Navigating the GAN Parameter Space for Semantic Image EditingAnton Cherepkov, Andrey Voynov, Artem Babenko. 3671-3680 [doi]

IMAGINE: Image Synthesis by Image-Guided Model InversionPei Wang, Yijun Li, Krishna Kumar Singh, Jingwan Lu, Nuno Vasconcelos. 3681-3690 [doi]

Human De-Occlusion: Invisible Perception and Recovery for HumansQiang Zhou, Shiyin Wang, Yitong Wang, Zilong Huang, Xinggang Wang. 3691-3701 [doi]

Learning To Warp for Style TransferXiao-Chang Liu, Yong-Liang Yang, Peter Hall. 3702-3711 [doi]

StEP: Style-Based Encoder Pre-Training for Multi-Modal Image SynthesisMoustafa Meshry, Yixuan Ren, Larry S. Davis, Abhinav Shrivastava. 3712-3721 [doi]

ANR: Articulated Neural Rendering for Virtual AvatarsAmit Raj, Julian Tanke, James Hays, Minh Vo, Carsten Stoll, Christoph Lassner. 3722-3731 [doi]

LayoutTransformer: Scene Layout Generation With Conceptual and Spatial DiversityCheng-Fu Yang, Wan-Cyuan Fan, Fu-En Yang, Yu-Chiang Frank Wang. 3732-3741 [doi]

Stochastic Image-to-Video Synthesis Using cINNsMichael Dorkenwald, Timo Milbich, Andreas Blattmann, Robin Rombach, Konstantinos G. Derpanis, Björn Ommer. 3742-3753 [doi]

Prototype Completion With Primitive Knowledge for Few-Shot LearningBaoquan Zhang, Xutao Li, Yunming Ye, Zhichao Huang, Lisai Zhang. 3754-3762 [doi]

Dynamic Class Queue for Large Scale Face Recognition in the WildBi Li 0005, Teng Xi, Gang Zhang, Haocheng Feng, Junyu Han, Jingtuo Liu, Errui Ding, Wenyu Liu. 3763-3772 [doi]

Truly Shift-Invariant Convolutional Neural NetworksAnadi Chaman, Ivan Dokmanic. 3773-3783 [doi]

RSG: A Simple but Effective Module for Learning Imbalanced DatasetsJianfeng Wang, Thomas Lukasiewicz, Xiaolin Hu, Jianfei Cai 0001, Zhenghua Xu. 3784-3793 [doi]

Goal-Oriented Gaze Estimation for Zero-Shot LearningYang Liu, Lei Zhou 0008, Xiao Bai 0001, Yifei Huang, Lin Gu 0003, Jun Zhou 0001, Tatsuya Harada. 3794-3803 [doi]

Uncalibrated Neural Inverse Rendering for Photometric Stereo of General SurfacesBerk Kaya, Suryansh Kumar, Carlos E. P. de Oliveira, Vittorio Ferrari, Luc Van Gool. 3804-3814 [doi]

Robust Bayesian Neural Networks by Spectral Expectation Bound RegularizationJiaru Zhang, Yang Hua, Zhengui Xue, Tao Song, Chengyu Zheng, Ruhui Ma, Haibing Guan. 3815-3824 [doi]

MobileDets: Searching for Object Detection Architectures for Mobile AcceleratorsYunyang Xiong, Hanxiao Liu, Suyog Gupta, Berkin Akin, Gabriel Bender, Yongzhe Wang, Pieter-Jan Kindermans, Mingxing Tan, Vikas Singh, Bo Chen 0019. 3825-3834 [doi]

Hilbert Sinkhorn Divergence for Optimal TransportQian Li 0006, Zhichao Wang, Gang Li 0009, Jun Pang 0001, Guandong Xu. 3835-3844 [doi]

Object Classification From Randomized EEG TrialsHamad Ahmed, Ronnie B. Wilbur, Hari M. Bharadwaj, Jeffrey Mark Siskind. 3845-3854 [doi]

Leveraging Large-Scale Weakly Labeled Data for Semi-Supervised Mass Detection in MammogramsYuXing Tang, Zhenjie Cao, Yanbo Zhang, Zhicheng Yang, Zongcheng Ji, Yiwei Wang, Mei Han, Jie Ma, Jing Xiao 0006, Peng Chang. 3855-3864 [doi]

Tracking Pedestrian Heads in Dense CrowdRamana Sundararaman, Cedric De Almeida Braga, Éric Marchand, Julien Pettré. 3865-3875 [doi]

Multiple Object Tracking With Correlation LearningQiang Wang, Yun Zheng, Pan Pan, Yinghui Xu. 3876-3886 [doi]

SMURF: Self-Teaching Multi-Frame Unsupervised RAFT With Full-Image WarpingAustin Stone, Daniel Maurer 0003, Alper Ayvaci, Anelia Angelova, Rico Jonschkowski. 3887-3896 [doi]

Bilinear Parameterization for Non-Separable Singular Value PenaltiesMarcus Valtonen Örnhag, José Pedro Iglesias, Carl Olsson. 3897-3906 [doi]

DSC-PoseNet: Learning 6DoF Object Pose Estimation via Dual-Scale ConsistencyZongxin Yang, Xin Yu, Yi Yang 0001. 3907-3916 [doi]

Unsupervised Disentanglement of Linear-Encoded Facial SemanticsYutong Zheng, Yu-Kai Huang, Ran Tao, Zhiqiang Shen, Marios Savvides. 3917-3926 [doi]

MetaCorrection: Domain-Aware Meta Loss Correction for Unsupervised Domain Adaptation in Semantic SegmentationXiaoqing Guo, Chen Yang, Baopu Li, Yixuan Yuan. 3927-3936 [doi]

Cross-Domain Gradient Discrepancy Minimization for Unsupervised Domain AdaptationZhekai Du, Jingjing Li 0001, Hongzu Su, Lei Zhu 0002, Ke Lu 0001. 3937-3946 [doi]

Generative Interventions for Causal LearningChengzhi Mao, Augustine Cha, Amogh Gupta, Hao Wang, Junfeng Yang, Carl Vondrick. 3947-3956 [doi]

Distilling Causal Effect of Data in Class-Incremental LearningXinting Hu, Kaihua Tang, Chunyan Miao, Xian-Sheng Hua 0001, Hanwang Zhang. 3957-3966 [doi]

Embedding Transfer With Label Relaxation for Improved Metric LearningSungyeon Kim, Dongwon Kim, Minsu Cho, Suha Kwak. 3967-3976 [doi]

M3P: Learning Universal Representations via Multitask Multilingual Multimodal Pre-TrainingMinheng Ni, Haoyang Huang, Lin Su, Edward Cui, Taroon Bharti, Lijuan Wang, Dongdong Zhang 0001, Nan Duan. 3977-3986 [doi]

Instance Localization for Self-Supervised Detection PretrainingCeyuan Yang, Zhirong Wu, Bolei Zhou, Stephen Lin. 3987-3996 [doi]

VIP-DeepLab: Learning Visual Perception With Depth-Aware Video Panoptic SegmentationSiyuan Qiao, Yukun Zhu, Hartwig Adam, Alan L. Yuille, Liang-Chieh Chen. 3997-4008 [doi]

AdaBins: Depth Estimation Using Adaptive BinsShariq Farooq Bhat, Ibraheem Alhashim, Peter Wonka. 4009-4018 [doi]

Deep Occlusion-Aware Instance Segmentation With Overlapping BiLayersLei Ke, Yu-Wing Tai, Chi-Keung Tang. 4019-4028 [doi]

Information-Theoretic Segmentation by Inpainting Error MaximizationPedro Savarese, Sunnie S. Y. Kim, Michael Maire, Greg Shakhnarovich, David McAllester. 4029-4039 [doi]

PLOP: Learning Without Forgetting for Continual Semantic SegmentationArthur Douillard, Yifu Chen, Arnaud Dapogny, Matthieu Cord. 4040-4050 [doi]

Coarse-To-Fine Domain Adaptive Semantic Segmentation With Photometric Alignment and Category-Center RegularizationHaoyu Ma, Xiangru Lin, Zifeng Wu, Yizhou Yu. 4051-4060 [doi]

HyperSeg: Patch-Wise Hypernetwork for Real-Time Semantic SegmentationYuval Nirkin, Lior Wolf, Tal Hassner. 4061-4070 [doi]

Anti-Adversarially Manipulated Attributions for Weakly and Semi-Supervised Semantic SegmentationJungbeom Lee, Eunji Kim, Sungroh Yoon. 4071-4080 [doi]

Instant-Teaching: An End-to-End Semi-Supervised Object Detection FrameworkQiang Zhou 0001, Chaohui Yu, Zhibin Wang, Qi Qian, Hao Li. 4081-4090 [doi]

Unbiased Mean Teacher for Cross-Domain Object DetectionJinhong Deng, Wen Li 0001, Yuhua Chen, Lixin Duan. 4091-4101 [doi]

MeanShift++: Extremely Fast Mode-Seeking With Applications to Segmentation and Object TrackingJennifer Jang, Heinrich Jiang. 4102-4113 [doi]

FlowStep3D: Model Unrolling for Self-Supervised Scene Flow EstimationYair Kittenplon, Yonina C. Eldar, Dan Raviv. 4114-4123 [doi]

Recognizing Actions in Videos From Unseen ViewpointsA. J. Piergiovanni, Michael S. Ryoo. 4124-4132 [doi]

VSPW: A Large-scale Dataset for Video Scene Parsing in the WildJiaxu Miao, Yunchao Wei, Yu Wu, Chen Liang, Guangrui Li, Yi Yang 0001. 4133-4143 [doi]

Learning Position and Target Consistency for Memory-Based Video Object SegmentationLi Hu, Peng Zhang, Bang Zhang, Pan Pan, Yinghui Xu, Rong Jin. 4144-4154 [doi]

UC2: Universal Cross-Lingual Cross-Modal Vision-and-Language Pre-TrainingMingyang Zhou, Luowei Zhou, Shuohang Wang, Yu Cheng 0001, Linjie Li, Zhou Yu, Jingjing Liu. 4155-4165 [doi]

Fingerspelling Detection in American Sign LanguageBowen Shi, Diane Brentari, Greg Shakhnarovich, Karen Livescu. 4166-4175 [doi]

Pose-Controllable Talking Face Generation by Implicitly Modularized Audio-Visual RepresentationHang Zhou, Yasheng Sun, Wayne Wu, Chen Change Loy, Xiaogang Wang 0001, Ziwei Liu 0002. 4176-4186 [doi]

Collaborative Spatial-Temporal Modeling for Language-Queried Video Actor SegmentationTianrui Hui, Shaofei Huang, Si Liu 0001, Zihan Ding, Guanbin Li, Wenguan Wang, Jizhong Han, Fei Wang 0032. 4187-4196 [doi]

Cascaded Prediction Network via Segment Tree for Temporal Video GroundingYang Zhao, Zhou Zhao, Zhu Zhang, Zhijie Lin. 4197-4206 [doi]

How Transferable Are Reasoning Patterns in VQA?Corentin Kervadec, Theo Jaunet, Grigory Antipov, Moez Baccouche, Romain Vuillemot, Christian Wolf 0001. 4207-4216 [doi]

PointFlow: Flowing Semantics Through Points for Aerial Image SegmentationXiangtai Li, Hao He, Xia Li, Duo Li, Guangliang Cheng, Jianping Shi, Lubin Weng, Yunhai Tong, Zhouchen Lin. 4217-4226 [doi]

HDMapGen: A Hierarchical Graph Generative Model of High Definition MapsLu Mi, Hang Zhao, Charlie Nash, Xiaohan Jin, Jiyang Gao, Chen Sun 0002, Cordelia Schmid, Nir Shavit, Yuning Chai, Dragomir Anguelov. 4227-4236 [doi]

A Circular-Structured Representation for Visual Emotion Distribution LearningJingyuan Yang, Jie Li, Leida Li, Xiumei Wang, Xinbo Gao 0001. 4237-4246 [doi]

More Photos Are All You Need: Semi-Supervised Learning for Fine-Grained Sketch Based Image RetrievalAyan Kumar Bhunia, Pinaki Nath Chowdhury, Aneeshan Sain, Yongxin Yang, Tao Xiang, Yi-Zhe Song. 4247-4256 [doi]

Line Segment Detection Using Transformers Without EdgesYifan Xu, Weijian Xu, David Cheung, Zhuowen Tu. 4257-4266 [doi]

Predator: Registration of 3D Point Clouds With Low OverlapShengyu Huang, Zan Gojcic, Mikhail Usvyatsov, Andreas Wieser, Konrad Schindler. 4267-4276 [doi]

Point2Skeleton: Learning Skeletal Representations from Point CloudsCheng Lin, Changjian Li, Yuan Liu, Nenglun Chen, Yi-King Choi, Wenping Wang. 4277-4286 [doi]

Neural Lumigraph RenderingPetr Kellnhofer, Lars Jebe, Andrew Jones, Ryan Spicer, Kari Pulli, Gordon Wetzstein. 4287-4297 [doi]

Rotation Coordinate Descent for Fast Globally Optimal Rotation AveragingÁlvaro Parra 0001, Shin-Fang Ch'ng, Tat-Jun Chin, Anders P. Eriksson, Ian Reid 0001. 4298-4307 [doi]

Towards Evaluating and Training Verifiably Robust Neural NetworksZhaoyang Lyu, Minghao Guo, Tong Wu, Guodong Xu, Kehuan Zhang, Dahua Lin. 4308-4317 [doi]

Human POSEitioning System (HPS): 3D Human Pose Estimation and Self-Localization in Large Scenes From Body-Mounted SensorsVladimir Guzov, Aymen Mir, Torsten Sattler, Gerard Pons-Moll. 4318-4329 [doi]

Discover Cross-Modality Nuances for Visible-Infrared Person Re-IdentificationQiong Wu, Pingyang Dai, Jie Chen 0001, Chia-Wen Lin, Yongjian Wu, Feiyue Huang, Bineng Zhong, Rongrong Ji. 4330-4339 [doi]

Dual Pixel Exploration: Simultaneous Depth Estimation and Image RestorationLiyuan Pan, Shah Chowdhury, Richard Hartley 0001, Miaomiao Liu, Hongguang Zhang, Hongdong Li. 4340-4349 [doi]

Towards Good Practices for Efficiently Annotating Large-Scale Image Classification DatasetsYuan-Hong Liao, Amlan Kar, Sanja Fidler. 4350-4359 [doi]

ForgeryNet: A Versatile Benchmark for Comprehensive Forgery AnalysisYinan He, Bei Gan, Siyu Chen, Yichun Zhou, Guojun Yin, Luchuan Song, Lu Sheng, Jing Shao, Ziwei Liu 0002. 4360-4369 [doi]

Spatial-Temporal Correlation and Topology Learning for Person Re-Identification in VideosJiawei Liu, Zheng-Jun Zha, Wei Wu, Kecheng Zheng, Qibin Sun. 4370-4379 [doi]

SSN: Soft Shadow Network for Image CompositingYichen Sheng, Jianming Zhang 0001, Bedrich Benes. 4380-4390 [doi]

Soft-IntroVAE: Analyzing and Improving the Introspective Variational AutoencoderTal Daniel, Aviv Tamar. 4391-4400 [doi]

Learning Placeholders for Open-Set RecognitionDa-Wei Zhou, Han-Jia Ye, De-Chuan Zhan. 4401-4410 [doi]

ReNAS: Relativistic Evaluation of Neural Architecture SearchYixing Xu, Yunhe Wang 0001, Kai Han 0002, Yehui Tang, Shangling Jui, Chunjing Xu, Chang Xu 0002. 4411-4420 [doi]

Learning To Filter: Siamese Relation Network for Robust TrackingSiyuan Cheng 0003, Bineng Zhong, Guorong Li, Xin Liu 0011, Zhenjun Tang, Xianxian Li, Jing Wang. 4421-4431 [doi]

Generative Hierarchical Features From Synthesizing ImagesYinghao Xu, Yujun Shen, Jiapeng Zhu, Ceyuan Yang, Bolei Zhou. 4432-4442 [doi]

Continual Adaptation of Visual Representations via Domain Randomization and Meta-LearningRiccardo Volpi, Diane Larlus, Grégory Rogez. 4443-4453 [doi]

NewtonianVAE: Proportional Control and Goal Identification From Pixels via Physical Latent SpacesMiguel Jaques, Michael Burke, Timothy M. Hospedales. 4454-4463 [doi]

3D-to-2D Distillation for Indoor Scene ParsingZhengzhe Liu, Xiaojuan Qi, Chi-Wing Fu. 4464-4474 [doi]

Repurposing GANs for One-Shot Semantic Part SegmentationNontawat Tritrong, Pitchaporn Rewatbowornwong, Supasorn Suwajanakorn. 4475-4485 [doi]

Temporal Query Networks for Fine-Grained Video UnderstandingChuhan Zhang, Ankush Gupta 0001, Andrew Zisserman. 4486-4496 [doi]

ManipulaTHOR: A Framework for Visual Object ManipulationKiana Ehsani, Winson Han, Alvaro Herrasti, Eli VanderBilt, Luca Weihs, Eric Kolve, Aniruddha Kembhavi, Roozbeh Mottaghi. 4497-4506 [doi]

Omnimatte: Associating Objects and Their Effects in VideoErika Lu, Forrester Cole, Tali Dekel, Andrew Zisserman, William T. Freeman, Michael Rubinstein. 4507-4515 [doi]

MeGA-CDA: Memory Guided Attention for Category-Aware Unsupervised Domain Adaptive Object DetectionVibashan VS, Vikram Gupta, Poojan Oza, Vishwanath A. Sindagi, Vishal M. Patel. 4516-4526 [doi]

Generalized Few-Shot Object Detection Without ForgettingZhibo Fan, Yuchen Ma, Zeming Li, Jian Sun. 4527-4536 [doi]

DAP: Detection-Aware Pre-Training With Weak SupervisionYuanyi Zhong, Jianfeng Wang, Lijuan Wang, Jian Peng, Yu-Xiong Wang, Lei Zhang 0001. 4537-4546 [doi]

A Multiplexed Network for End-to-End, Multilingual OCRJing Huang 0020, Guan Pang, Rama Kovvuri, Mandy Toh, Kevin J. Liang, Praveen Krishnan, Xi Yin 0008, Tal Hassner. 4547-4557 [doi]

Scene Text Retrieval via Joint Text Detection and Similarity LearningHao Wang, Xiang Bai, Mingkun Yang, Shenggao Zhu, Jing Wang, Wenyu Liu 0001. 4558-4567 [doi]

Data-Uncertainty Guided Multi-Phase Learning for Semi-Supervised Object DetectionZhenyu Wang, Yali Li 0001, Ye Guo, Lu Fang, Shengjin Wang. 4568-4577 [doi]

pixelNeRF: Neural Radiance Fields From One or Few ImagesAlex Yu, Vickie Ye, Matthew Tancik, Angjoo Kanazawa. 4578-4587 [doi]

From Points to Multi-Object 3D ReconstructionFrancis Engelmann, Konstantinos Rematas, Bastian Leibe, Vittorio Ferrari. 4588-4597 [doi]

4D Hyperspectral Photoacoustic Data Restoration With Reliability AnalysisWeihang Liao, Art Subpa-asa, Yinqiang Zheng, Imari Sato. 4598-4607 [doi]

RfD-Net: Point Scene Understanding by Semantic Instance ReconstructionYinyu Nie, Ji Hou, Xiaoguang Han, Matthias Nießner. 4608-4618 [doi]

Style-Based Point Generator With Adversarial Rendering for Point Cloud CompletionChulin Xie, Chuxin Wang, Bo Zhang 0025, Hao Yang, Dong Chen, Fang Wen. 4619-4628 [doi]

Denoise and Contrast for Category Agnostic Shape CompletionAntonio Alliegro, Diego Valsesia, Giulia Fracastoro, Enrico Magli, Tatiana Tommasi. 4629-4638 [doi]

Neural Surface MapsLuca Morreale, Noam Aigerman, Vladimir G. Kim, Niloy J. Mitra. 4639-4648 [doi]

RGB-D Local Implicit Function for Depth Completion of Transparent ObjectsLuyang Zhu, Arsalan Mousavian, Yu Xiang, Hammad Mazhar, Jozef van Eenbergen, Shoubhik Debnath, Dieter Fox. 4649-4658 [doi]

Uncertainty-Aware Camera Pose Estimation From Points and LinesAlexander Vakhitov, Luis Ferraz, Antonio Agudo, Francesc Moreno-Noguer. 4659-4668 [doi]

Patch2Pix: Epipolar-Guided Pixel-Level CorrespondencesQunjie Zhou, Torsten Sattler, Laura Leal-Taixé. 4669-4678 [doi]

Deep Multi-Task Learning for Joint Localization, Perception, and PredictionJohn Phillips, Julieta Martinez, Ioan Andrei Barsan, Sergio Casas 0002, Abbas Sadat, Raquel Urtasun. 4679-4689 [doi]

IBRNet: Learning Multi-View Image-Based RenderingQianqian Wang, Zhicheng Wang, Kyle Genova, Pratul P. Srinivasan, Howard Zhou, Jonathan T. Barron, Ricardo Martin-Brualla, Noah Snavely, Thomas A. Funkhouser. 4690-4699 [doi]

Unsupervised Learning of 3D Object Categories From Videos in the WildPhilipp Henzler, Jeremy Reizenstein, Patrick Labatut, Roman Shapovalov, Tobias Ritschel 0001, Andrea Vedaldi, David Novotný. 4700-4709 [doi]

LiDAR-Aug: A General Rendering-Based Augmentation Framework for 3D Object DetectionJin Fang, Xinxin Zuo, Dingfu Zhou, Shengze Jin, Sen Wang, Liangjun Zhang. 4710-4720 [doi]

Delving Into Localization Errors for Monocular 3D Object DetectionXinzhu Ma, Yinmin Zhang, Dan Xu 0002, Dongzhan Zhou, Shuai Yi, Haojie Li, Wanli Ouyang. 4721-4730 [doi]

3D CNNs With Adaptive Temporal Feature ResolutionsMohsen Fayyaz, Emad Bahrami Rad, Ali Diba, Mehdi Noroozi, Ehsan Adeli 0001, Luc Van Gool, Jürgen Gall. 4731-4740 [doi]

3D Human Action Representation Learning via Cross-View Consistency PursuitLinguo Li, Minsi Wang, Bingbing Ni, Hang Wang, Jiancheng Yang, Wenjun Zhang 0001. 4741-4750 [doi]

Three Birds with One Stone: Multi-Task Temporal Action Detection via Recycling Temporal AnnotationsZhihui Li 0001, Lina Yao. 4751-4760 [doi]

Delving into Data: Effectively Substitute Training for Black-box AttackWenxuan Wang, Bangjie Yin, Taiping Yao, Li Zhang 0040, Yanwei Fu, Shouhong Ding, Jilin Li, Feiyue Huang, Xiangyang Xue. 4761-4770 [doi]

Data-Free Model ExtractionJean-Baptiste Truong, Pratyush Maini, Robert J. Walls, Nicolas Papernot. 4771-4780 [doi]

Adaptive Weighted Discriminator for Training Generative Adversarial NetworksVasily Zadorozhnyy, Qiang Cheng, Qiang Ye. 4781-4790 [doi]

Monocular Reconstruction of Neural Face Reflectance FieldsMallikarjun B. R. 0001, Ayush Tewari, Tae Hyun Oh, Tim Weyrich, Bernd Bickel, Hans-Peter Seidel, Hanspeter Pfister, Wojciech Matusik, Mohamed Elgharib, Christian Theobalt. 4791-4800 [doi]

Towards Accurate 3D Human Motion Prediction From Incomplete ObservationsQiongjie Cui, HuaiJiang Sun. 4801-4810 [doi]

Monocular Real-Time Full Body Capture With Inter-Part CorrelationsYuxiao Zhou, Marc Habermann, Ikhsanul Habibie, Ayush Tewari, Christian Theobalt, Feng Xu 0005. 4811-4822 [doi]

Cross-Modal Collaborative Representation Learning and a Large-Scale RGBT Benchmark for Crowd CountingLingbo Liu, Jiaqi Chen, Hefeng Wu, Guanbin Li, Chenglong Li, Liang Lin. 4823-4833 [doi]

One Shot Face Swapping on MegapixelsYuhao Zhu 0003, Qi Li, Jian Wang, Cheng-Zhong Xu 0001, Zhenan Sun. 4834-4844 [doi]

Dynamic Probabilistic Graph Convolution for Facial Action Unit Intensity EstimationTengfei Song, Zijun Cui, Yuru Wang, Wenming Zheng, Qiang Ji. 4845-4854 [doi]

Joint Noise-Tolerant Learning and Meta Camera Shift Adaptation for Unsupervised Person Re-IdentificationFengxiang Yang, Zhun Zhong, Zhiming Luo, Yuanzheng Cai, Yaojin Lin, Shaozi Li, Nicu Sebe. 4855-4864 [doi]

Prototype-Guided Saliency Feature Learning for Person SearchHanjae Kim, Sunghun Joung, Ig-Jae Kim, Kwanghoon Sohn. 4865-4874 [doi]

Labeled From Unlabeled: Exploiting Unlabeled Data for Few-Shot Deep HDR DeghostingK. Ram Prabhakar, Gowtham Senthil, Susmit Agrawal, R. Venkatesh Babu, Rama Krishna Sai S. Gorthi. 4875-4885 [doi]

Learning Spatially-Variant MAP Models for Non-Blind Image DeblurringJiangxin Dong, Stefan Roth 0001, Bernt Schiele. 4886-4895 [doi]

NBNet: Noise Basis Learning for Image Denoising With Subspace ProjectionShen Cheng, Yuzhi Wang, Haibin Huang, Donghao Liu, Haoqiang Fan, Shuaicheng Liu. 4896-4906 [doi]

Image De-Raining via Continual LearningMan Zhou, Jie Xiao, Yifan Chang, Xueyang Fu, Aiping Liu, Jinshan Pan, Zheng-Jun Zha. 4907-4916 [doi]

Exploring Sparsity in Image Super-Resolution for Efficient InferenceLongguang Wang, Xiaoyu Dong, Yingqian Wang, Xinyi Ying, Zaiping Lin, Wei An, Yulan Guo. 4917-4926 [doi]

From Shadow Generation To Shadow RemovalZhihao Liu, Hui Yin, Xinyi Wu, Zhenyao Wu, Yang Mi, Song Wang 0002. 4927-4936 [doi]

Spatiotemporal Registration for Event-Based Visual OdometryDaqi Liu, Álvaro Parra 0001, Tat-Jun Chin. 4937-4946 [doi]

BasicVSR: The Search for Essential Components in Video Super-Resolution and BeyondKelvin C. K. Chan, Xintao Wang, Ke Yu, Chao Dong, Chen Change Loy. 4947-4956 [doi]

Fast Bayesian Uncertainty Estimation and Reduction of Batch Normalized Single Image Super-Resolution NetworkAupendu Kar, Prabir Kumar Biswas. 4957-4966 [doi]

Learning Temporal Consistency for Low Light Video Enhancement From Single ImagesFan Zhang, Yu Li, Shaodi You, Ying Fu. 4967-4976 [doi]

Towards Semantic Segmentation of Urban-Scale 3D Point Clouds: A Dataset, Benchmarks and ChallengesQingyong Hu, Bo Yang 0027, Sheikh Khalid, Wen Xiao, Niki Trigoni, Andrew Markham. 4977-4987 [doi]

Neural Side-by-Side: Predicting Human Preferences for No-Reference Super-Resolution EvaluationValentin Khrulkov, Artem Babenko. 4988-4997 [doi]

Slimmable Compressive Autoencoders for Practical Neural Image CompressionFei Yang 0004, Luis Herranz, Yongmei Cheng, Mikhail G. Mozerov. 4998-5007 [doi]

Distilling Knowledge via Knowledge ReviewPengguang Chen, Shu Liu 0005, Hengshuang Zhao, Jiaya Jia. 5008-5017 [doi]

Manifold Regularized Dynamic Network PruningYehui Tang, Yunhe Wang 0001, Yixing Xu, Yiping Deng, Chao Xu 0006, Dacheng Tao, Chang Xu 0002. 5018-5028 [doi]

Learnable Companding Quantization for Accurate Low-Bit Neural NetworksKohei Yamamoto. 5029-5038 [doi]

Lips Don't Lie: A Generalisable and Robust Approach To Face Forgery DetectionAlexandros Haliassos, Konstantinos Vougioukas, Stavros Petridis, Maja Pantic. 5039-5049 [doi]

Guided Integrated Gradients: An Adaptive Path Method for Removing NoiseAndrei Kapishnikov, Subhashini Venugopalan, Besim Avci, Ben Wedin, Michael Terry, Tolga Bolukbasi. 5050-5058 [doi]

Scalable Differential Privacy With Sparse Network FinetuningZelun Luo, Daniel J. Wu, Ehsan Adeli 0001, Li Fei-Fei 0001. 5059-5068 [doi]

Deep Graph Matching Under Quadratic ConstraintQuankai Gao, Fudong Wang, Nan Xue, Jin-Gang Yu, Gui-Song Xia. 5069-5078 [doi]

T2VLAD: Global-Local Sequence Alignment for Text-Video RetrievalXiaohan Wang, Linchao Zhu, Yi Yang 0001. 5079-5088 [doi]

FaceInpainter: High Fidelity Face Adaptation to Heterogeneous DomainsJia Li, Zhaoyang Li, Jie Cao 0002, Xingguang Song, Ran He. 5089-5098 [doi]

Partition-Guided GANsMohammadreza Armandpour, Ali Sadeghian, Chunyuan Li, Mingyuan Zhou. 5099-5109 [doi]

Repopulating Street ScenesYifan Wang, Andrew Liu, Richard Tucker 0001, Jiajun Wu 0001, Brian L. Curless, Steven M. Seitz, Noah Snavely. 5110-5119 [doi]

Image Inpainting With External-Internal Learning and Monochromic BottleneckTengfei Wang 0002, Hao Ouyang, Qifeng Chen. 5120-5129 [doi]

DG-Font: Deformable Generative Networks for Unsupervised Font GenerationYangchen Xie, Xinyuan Chen, Li Sun, Yue Lu. 5130-5140 [doi]

Drafting and Revision: Laplacian Pyramid Network for Fast High-Quality Artistic Style TransferTianwei Lin, Zhuoqi Ma, Fu Li, Dongliang He, Xin Li, Errui Ding, Nannan Wang, Jie Li 0001, Xinbo Gao 0001. 5141-5150 [doi]

StylePeople: A Generative Model of Fullbody Human AvatarsArtur Grigorev, Karim Iskakov, Anastasia Ianina, Renat Bashirov, Ilya Zakharkin, Alexander Vakhitov, Victor Lempitsky. 5151-5160 [doi]

Synthesize-It-Classifier: Learning a Generative Classifier Through Recurrent Self-AnalysisArghya Pal, Raphael C.-W. Phan, KokSheik Wong. 5161-5170 [doi]

Understanding Object Dynamics for Interactive Image-to-Video SynthesisAndreas Blattmann, Timo Milbich, Michael Dorkenwald, Björn Ommer. 5171-5181 [doi]

Learning Dynamic Alignment via Meta-Filter for Few-Shot LearningChengming Xu 0001, Yanwei Fu, Chen Liu, Chengjie Wang, Jilin Li, Feiyue Huang, Li Zhang 0040, Xiangyang Xue. 5182-5191 [doi]

Jo-SRC: A Contrastive Approach for Combating Noisy LabelsYazhou Yao, Zeren Sun, Chuanyi Zhang, Fumin Shen, Qi Wu 0001, Jian Zhang 0002, Zhenmin Tang. 5192-5201 [doi]

On Focal Loss for Class-Posterior Probability Estimation: A Theoretical PerspectiveNontawat Charoenphakdee, Jayakorn Vongkulbhisal, Nuttapong Chairatanakul, Masashi Sugiyama. 5202-5211 [doi]

MetaSAug: Meta Semantic Augmentation for Long-Tailed Visual RecognitionShuang Li, Kaixiong Gong, Chi Harold Liu, Yulin Wang, Feng Qiao, Xinjing Cheng. 5212-5221 [doi]

Open World Compositional Zero-Shot LearningMassimiliano Mancini, Muhammad Ferjad Naeem, Yongqin Xian, Zeynep Akata. 5222-5230 [doi]

Deep Texture Recognition via Exploiting Cross-Layer Statistical Self-SimilarityZhile Chen, Feng Li, Yuhui Quan, Yong Xu 0007, Hui Ji. 5231-5240 [doi]

Combinatorial Learning of Graph Edit Distance via Dynamic EmbeddingRunzhong Wang, Tianqi Zhang, Tianshu Yu, Junchi Yan, Xiaokang Yang. 5241-5250 [doi]

TransNAS-Bench-101: Improving Transferability and Generalizability of Cross-Task Neural Architecture SearchYawen Duan, Xin Chen, Hang Xu, Zewei Chen, Xiaodan Liang, Tong Zhang, Zhenguo Li. 5251-5260 [doi]

An Alternative Probabilistic Interpretation of the Huber LossGregory P. Meyer. 5261-5269 [doi]

Joint Deep Model-Based MR Image and Coil Sensitivity Reconstruction Network (Joint-ICNet) for Fast MRIYohan Jun, Hyungseob Shin, Taejoon Eo, Dosik Hwang. 5270-5279 [doi]

Automatic Vertebra Localization and Identification in CT by Spine Rectification and Anatomically-Constrained OptimizationFakai Wang, Kang Zheng, Le Lu 0001, Jing Xiao 0006, Min Wu, Shun Miao. 5280-5288 [doi]

Alpha-Refine: Boosting Tracking Performance by Precise Bounding Box EstimationBin Yan, Xinyu Zhang, Dong Wang, Huchuan Lu, Xiaoyun Yang. 5289-5298 [doi]

Learnable Graph Matching: Incorporating Graph Partitioning With Deep Feature Learning for Multiple Object TrackingJiawei He, Zehao Huang, Naiyan Wang, Zhaoxiang Zhang. 5299-5309 [doi]

Group-aware Label Transfer for Domain Adaptive Person Re-identificationKecheng Zheng, Wu Liu, Lingxiao He, Tao Mei 0001, Jiebo Luo, Zheng-Jun Zha. 5310-5319 [doi]

Double Low-Rank Representation With Projection Distance Penalty for ClusteringZhiqiang Fu, Yao Zhao 0001, Dongxia Chang, Xingxing Zhang, Yiming Wang. 5320-5329 [doi]

Multiple Instance Active Learning for Object DetectionTianning Yuan, Fang Wan, Mengying Fu, Jianzhuang Liu, Songcen Xu, Xiangyang Ji, Qixiang Ye. 5330-5339 [doi]

Learning Compositional Representation for 4D Captures With Neural ODEBoyan Jiang, Yinda Zhang 0001, Xingkui Wei, Xiangyang Xue, Yanwei Fu. 5340-5350 [doi]

Curriculum Graph Co-Teaching for Multi-Target Domain AdaptationSubhankar Roy, Evgeny Krivosheev, Zhun Zhong, Nicu Sebe, Elisa Ricci 0001. 5351-5360 [doi]

Instance Level Affinity-Based Transfer for Unsupervised Domain AdaptationAstuti Sharma, Tarun Kalluri, Manmohan Chandraker. 5361-5371 [doi]

Deep Stable Learning for Out-of-Distribution GeneralizationXingxuan Zhang, Peng Cui 0001, Renzhe Xu, Linjun Zhou, Yue He 0001, Zheyan Shen. 5372-5382 [doi]

ORDisCo: Effective and Efficient Usage of Incremental Unlabeled Data for Semi-Supervised Continual LearningLiyuan Wang, Kuo Yang, Chongxuan Li, Lanqing Hong, Zhenguo Li, Jun Zhu 0001. 5383-5392 [doi]

Dynamic Metric Learning: Towards a Scalable Metric Space To Accommodate Multiple Semantic ScalesYifan Sun, Yuke Zhu, Yuhan Zhang, Pengkun Zheng, Xi Qiu, Chi Zhang, Yichen Wei. 5393-5402 [doi]

Learning Cross-Modal Retrieval With Noisy LabelsPeng Hu 0002, Xi Peng 0001, Hongyuan Zhu, Liangli Zhen, Jie Lin 0001. 5403-5413 [doi]

How Well Do Self-Supervised Models Transfer?Linus Ericsson, Henry Gouk, Timothy M. Hospedales. 5414-5423 [doi]

Generic Perceptual Loss for Modeling Structured Output DependenciesYifan Liu, Hao Chen, Yu Chen, Wei Yin 0006, Chunhua Shen. 5424-5432 [doi]

EDNet: Efficient Disparity Estimation With Cost Volume Combination and Attention-Based Spatial ResidualSongyan Zhang, Zhicheng Wang, Qiang Wang, Jinshuo Zhang, Gang Wei, Xiaowen Chu. 5433-5442 [doi]

BoxInst: High-Performance Instance Segmentation With Box AnnotationsZhi Tian, Chunhua Shen, Xinlong Wang, Hao Chen 0041. 5443-5452 [doi]

PhySG: Inverse Rendering With Spherical Gaussians for Physics-Based Material Editing and RelightingKai Zhang, Fujun Luan, Qianqian Wang, Kavita Bala, Noah Snavely. 5453-5462 [doi]

MaX-DeepLab: End-to-End Panoptic Segmentation With Mask TransformersHuiyu Wang, Yukun Zhu, Hartwig Adam, Alan L. Yuille, Liang-Chieh Chen. 5463-5474 [doi]

Scale-Aware Graph Neural Network for Few-Shot Semantic SegmentationGuo-Sen Xie, Jie Liu, Huan Xiong, Ling Shao 0001. 5475-5484 [doi]

Part-Aware Panoptic SegmentationDaan de Geus, Panagiotis Meletis, Chenyang Lu 0002, Xiaoxiao Wen, Gijs Dubbelman. 5485-5494 [doi]

Railroad Is Not a Train: Saliency As Pseudo-Pixel Supervision for Weakly Supervised Semantic SegmentationSeungho Lee, Minhyun Lee, Jongwuk Lee, Hyunjung Shim. 5495-5505 [doi]

Mask-Embedded Discriminator With Region-Based Semantic Regularization for Semi-Supervised Class-Conditional Image SynthesisYi Liu, Xiaoyang Huo, Tianyi Chen, Xiangping Zeng, Si Wu 0002, Zhiwen Yu 0002, Hau-San Wong. 5506-5515 [doi]

Unsupervised Hyperbolic Representation Learning via Message Passing Auto-EncodersJiwoong Park, Junho Cho, Hyung Jin Chang, Jin Young Choi 0002. 5516-5526 [doi]

4D Panoptic LiDAR SegmentationMehmet Aygun, Aljosa Osep, Mark Weber, Maxim Maximov, Cyrill Stachniss, Jens Behley, Laura Leal-Taixé. 5527-5537 [doi]

EffiScene: Efficient Per-Pixel Rigidity Inference for Unsupervised Joint Learning of Optical Flow, Depth, Camera Pose and Motion SegmentationYang Jiao, Trac D. Tran, Guangming Shi. 5538-5547 [doi]

Learning by Aligning Videos in TimeSanjay Haresh, Sateesh Kumar, Huseyin Coskun, Shahram Najam Syed, Andrey Konin, M. Zeeshan Zia, Quoc Huy Tran. 5548-5558 [doi]

Modular Interactive Video Object Segmentation: Interaction-to-Mask, Propagation and Difference-Aware FusionHo Kei Cheng, Yu-Wing Tai, Chi-Keung Tang. 5559-5568 [doi]

Polygonal Point Set TrackingGunhee Nam, Miran Heo, Seoung Wug Oh, Joon-Young Lee, Seon Joo Kim. 5569-5578 [doi]

VinVL: Revisiting Visual Representations in Vision-Language ModelsPengchuan Zhang, Xiujun Li, Xiaowei Hu, Jianwei Yang, Lei Zhang 0001, Lijuan Wang, Yejin Choi, Jianfeng Gao. 5579-5588 [doi]

Visual Semantic Role Labeling for Video UnderstandingArka Sadhu, Tanmay Gupta, Mark Yatskar, Ram Nevatia, Aniruddha Kembhavi. 5589-5600 [doi]

Can Audio-Visual Integration Strengthen Robustness Under Multimodal Attacks?Yapeng Tian, Chenliang Xu. 5601-5611 [doi]

Relation-aware Instance Refinement for Weakly Supervised Visual GroundingYongfei Liu, Bo Wan, Lin Ma, Xuming He 0001. 5612-5621 [doi]

Learning Better Visual Dialog Agents With Pretrained Visual-Linguistic RepresentationTao Tu, Qing-ping, Govindarajan Thattai, Gökhan Tür, Prem Natarajan. 5622-5631 [doi]

Separating Skills and Concepts for Novel Visual Question AnsweringSpencer Whitehead, Hui Wu, Heng Ji, Rogério Feris, Kate Saenko. 5632-5641 [doi]

Generating Manga From Illustrations via Mimicking Manga Creation WorkflowLvmin Zhang, Xinrui Wang, Qingnan Fan, Yi Ji 0001, Chunping Liu. 5642-5651 [doi]

SelfDoc: Self-Supervised Document Representation LearningPeizhao Li, Jiuxiang Gu, Jason Kuen, Vlad I. Morariu, Handong Zhao, Rajiv Jain, Varun Manjunatha, Hongfu Liu. 5652-5660 [doi]

Affect2MM: Affective Analysis of Multimedia Content Using Emotion CausalityTrisha Mittal, Puneet Mathur, Aniket Bera, Dinesh Manocha. 5661-5671 [doi]

Vectorization and Rasterization: Self-Supervised Learning for Sketch and HandwritingAyan Kumar Bhunia, Pinaki Nath Chowdhury, Yongxin Yang, Timothy M. Hospedales, Tao Xiang, Yi-Zhe Song. 5672-5681 [doi]

Layer-Wise Searching for 1-Bit DetectorsSheng Xu, Junhe Zhao, Jinhu Lu, Baochang Zhang 0001, Shumin Han, David S. Doermann. 5682-5691 [doi]

Weakly Supervised Learning of Rigid 3D Scene FlowZan Gojcic, Or Litany, Andreas Wieser, Leonidas J. Guibas, Tolga Birdal. 5692-5703 [doi]

Learning Compositional Radiance Fields of Dynamic Human HeadsZiyan Wang, Timur M. Bagautdinov, Stephen Lombardi, Tomas Simon, Jason M. Saragih, Jessica Hodgins, Michael Zollhöfer. 5704-5713 [doi]

Learning Accurate Dense Correspondences and When To Trust ThemPrune Truong, Martin Danelljan, Luc Van Gool, Radu Timofte. 5714-5724 [doi]

RSN: Range Sparse Net for Efficient, Accurate LiDAR 3D Object DetectionPei Sun, Weiyue Wang, Yuning Chai, Gamaleldin Elsayed, Alex Bewley, Xiao Zhang, Cristian Sminchisescu, Dragomir Anguelov. 5725-5734 [doi]

LAFEAT: Piercing Through Adversarial Defenses With Latent FeaturesYunrui Yu, Xitong Gao, Cheng-Zhong Xu 0001. 5735-5745 [doi]

Function4D: Real-Time Human Volumetric Capture From Very Sparse Consumer RGBD SensorsTao Yu 0007, Zerong Zheng, Kaiwen Guo, Pengpeng Liu, Qionghai Dai, Yebin Liu. 5746-5756 [doi]

Polka Lines: Learning Structured Illumination and Reconstruction for Active StereoSeung-Hwan Baek, Felix Heide. 5757-5767 [doi]

FBI-Denoiser: Fast Blind Image Denoiser for Poisson-Gaussian NoiseJaeseok Byun, Sungmin Cha, Taesup Moon. 5768-5777 [doi]

Face Forensics in the WildTianfei Zhou, Wenguan Wang, Zhiyuan Liang, Jianbing Shen. 5778-5788 [doi]

Exploring Adversarial Fake Images on Face ManifoldDongze Li, Wei Wang 0115, Hongxing Fan, Jing Dong 0003. 5789-5798 [doi]

Pi-GAN: Periodic Implicit Generative Adversarial Networks for 3D-Aware Image SynthesisEric R. Chan, Marco Monteiro, Petr Kellnhofer, Jiajun Wu 0001, Gordon Wetzstein. 5799-5809 [doi]

Animating Pictures With Eulerian Motion FieldsAleksander Holynski, Brian L. Curless, Steven M. Seitz, Richard Szeliski. 5810-5819 [doi]

DriveGAN: Towards a Controllable High-Quality Neural SimulationSeung Wook Kim, Jonah Philion, Antonio Torralba 0001, Sanja Fidler. 5820-5829 [doi]

Towards Open World Object DetectionK. J. Joseph, Salman H. Khan 0001, Fahad Shahbaz Khan, Vineeth N. Balasubramanian. 5830-5840 [doi]

DiNTS: Differentiable Neural Network Topology Search for 3D Medical Image SegmentationYufan He, Dong Yang 0005, Holger Roth, Can Zhao, Daguang Xu. 5841-5850 [doi]

Siamese Natural Language Tracker: Tracking by Natural Language Descriptions With Siamese TrackersQi Feng, Vitaly Ablavsky, Qinxun Bai, Stan Sclaroff. 5851-5860 [doi]

Where and What? Examining Interpretable Disentangled RepresentationsXinqi Zhu, Chang Xu 0002, Dacheng Tao. 5861-5870 [doi]

Prototype Augmentation and Self-Supervision for Incremental LearningFei Zhu, Xu-Yao Zhang, Chuang Wang, Fei Yin, Cheng-Lin Liu. 5871-5880 [doi]

Brain Image Synthesis With Unsupervised Multivariate Canonical CSCl4NetYawen Huang, Feng Zheng, Danyang Wang, Weilin Huang, Matthew R. Scott, Ling Shao 0001. 5881-5890 [doi]

Polygonal Building Extraction by Frame Field LearningNicolas Girard, Dmitriy Smirnov 0001, Justin Solomon 0001, Yuliya Tarabalka. 5891-5900 [doi]

InverseForm: A Loss Function for Structured Boundary-Aware SegmentationShubhankar Borse, Ying Wang, Yizhe Zhang, Fatih Porikli. 5901-5911 [doi]

SSTVOS: Sparse Spatiotemporal Transformers for Video Object SegmentationBrendan Duke, Abdalla Ahmed, Christian Wolf 0001, Parham Aarabi, Graham W. Taylor. 5912-5921 [doi]

Visual Room RearrangementLuca Weihs, Matt Deitke, Aniruddha Kembhavi, Roozbeh Mottaghi. 5922-5931 [doi]

A Deep Emulator for Secondary Motion of 3D CharactersMianlun Zheng, Yi Zhou, Duygu Ceylan, Jernej Barbic. 5932-5940 [doi]

Interactive Self-Training With Mean Teachers for Semi-Supervised Object DetectionQize Yang, Xihan Wei, Biao Wang, Xian-Sheng Hua 0001, Lei Zhang 0006. 5941-5950 [doi]

UniT: Unified Knowledge Transfer for Any-Shot Object Detection and SegmentationSiddhesh Khandelwal, Raghav Goyal, Leonid Sigal. 5951-5961 [doi]

Unsupervised Object Detection With LIDAR CluesHao Tian, YunTao Chen, Jifeng Dai, Zhaoxiang Zhang, Xizhou Zhu. 5962-5972 [doi]

Implicit Feature Alignment: Learn To Convert Text Recognizer to Text SpotterTianwei Wang, Yuanzhi Zhu, Lianwen Jin, Dezhi Peng, Zhe Li, Mengchao He, Yongpan Wang, Canjie Luo. 5973-5982 [doi]

Self-Attention Based Text Knowledge Mining for Text DetectionQi Wan, Haoqin Ji, LinLin Shen. 5983-5992 [doi]

Shallow Feature Matters for Weakly Supervised Object LocalizationJun Wei, Qin Wang, Zhen Li, Sheng Wang, S. Kevin Zhou, Shuguang Cui. 5993-6001 [doi]

Self-Supervised 3D Mesh Reconstruction From Single ImagesTao Hu, Liwei Wang, Xiaogang Xu, Shu Liu 0005, Jiaya Jia. 6002-6011 [doi]

Sketch2Model: View-Aware 3D Modeling From Single Free-Hand SketchesSong-Hai Zhang, Yuanchen Guo, Qing-Wen Gu. 6012-6021 [doi]

Learning Parallel Dense Correspondence From Spatio-Temporal Descriptors for Efficient and Robust 4D ReconstructionJiapeng Tang, Dan Xu, Kui Jia, Lei Zhang 0006. 6022-6031 [doi]

Refer-It-in-RGBD: A Bottom-Up Approach for 3D Visual Grounding in RGBD ImagesHaolin Liu, Anran Lin, Xiaoguang Han, Lei Yang, Yizhou Yu, Shuguang Cui. 6032-6041 [doi]

VoxelContext-Net: An Octree Based Framework for Point Cloud CompressionZizheng Que, Guo Lu, Dong Xu 0001. 6042-6051 [doi]

CorrNet3D: Unsupervised End-to-End Learning of Dense Correspondence for 3D Point CloudsYiming Zeng, Yue Qian, Zhiyu Zhu, Junhui Hou, Hui Yuan, Ying He 0001. 6052-6061 [doi]

Inferring CAD Modeling Sequences Using Zone GraphsXianghao Xu, Wenzhe Peng, Chin-Yi Cheng, Karl D. D. Willis, Daniel Ritchie. 6062-6070 [doi]

Seeing Behind Objects for 3D Multi-Object Tracking in RGB-D SequencesNorman Müller, Yu-Shiang Wong, Niloy J. Mitra, Angela Dai, Matthias Nießner. 6071-6080 [doi]

View Generalization for Single Image Textured 3D ModelsAnand Bhattad, Aysegul Dundar, Guilin Liu, Andrew Tao, Bryan Catanzaro. 6081-6090 [doi]

A Decomposition Model for Stereo MatchingChengtang Yao, Yunde Jia, Huijun Di, Pengxiang Li, Yuwei Wu. 6091-6100 [doi]

VS-Net: Voting With Segmentation for Visual LocalizationZhaoyang Huang, Han Zhou, Yijin Li, Bangbang Yang, Yan Xu, Xiaowei Zhou, Hujun Bao, Guofeng Zhang 0001, Hongsheng Li 0001. 6101-6111 [doi]

MonoRec: Semi-Supervised Dense Reconstruction in Dynamic Environments From a Single Moving CameraFelix Wimbauer, Nan Yang 0007, Lukas von Stumberg, Niclas Zeller, Daniel Cremers. 6112-6122 [doi]

Shape and Material Capture at HomeDaniel Lichy, Jiaye Wu, Soumyadip Sengupta, David W. Jacobs. 6123-6133 [doi]

Offboard 3D Object Detection From Point Cloud SequencesCharles R. Qi, Yin Zhou, Mahyar Najibi, Pei Sun, Khoa Vo, Boyang Deng, Dragomir Anguelov. 6134-6144 [doi]

M3DSSD: Monocular 3D Single Stage Object DetectorShujie Luo, Hang Dai, Ling Shao 0001, Yong Ding 0003. 6145-6154 [doi]

2D or not 2D? Adaptive 3D Convolution Selection for Efficient Video RecognitionHengduo Li, Zuxuan Wu, Abhinav Shrivastava, Larry S. Davis. 6155-6164 [doi]

Deep Analysis of CNN-Based Spatio-Temporal Representations for Action RecognitionChun-Fu (Richard) Chen, Rameswar Panda, Kandan Ramakrishnan, Rogério Feris, John Cohn, Aude Oliva, Quanfu Fan. 6165-6175 [doi]

The Blessings of Unlabeled Background in Untrimmed VideosYuan Liu, Jingyuan Chen, Zhenfang Chen, Bing Deng, Jianqiang Huang, Hanwang Zhang. 6176-6185 [doi]

PointGuard: Provably Robust 3D Point Cloud ClassificationHongbin Liu, Jinyuan Jia, Neil Zhenqiang Gong. 6186-6195 [doi]

DSRNA: Differentiable Search of Robust Neural ArchitecturesRamtin Hosseini, Xingyi Yang, Pengtao Xie. 6196-6205 [doi]

Backdoor Attacks Against Deep Learning Systems in the Physical WorldEmily Wenger, Josephine Passananti, Arjun Nitin Bhagoji, Yuanshun Yao, Haitao Zheng 0001, Ben Y. Zhao. 6206-6215 [doi]

Riggable 3D Face Reconstruction via In-Network OptimizationZiqian Bai, Zhaopeng Cui, Xiaoming Liu 0002, Ping Tan. 6216-6225 [doi]

NeuralHumanFVV: Real-Time Neural Volumetric Human Performance Rendering Using RGB CamerasXin Suo, Yuheng Jiang, Pei Lin, Yingliang Zhang, Minye Wu, Kaiwen Guo, Lan Xu. 6226-6237 [doi]

Context Modeling in 3D Human Pose Estimation: A Unified PerspectiveXiaoxuan Ma, Jiajun Su, Chunyu Wang, Hai Ci, Yizhou Wang 0001. 6238-6247 [doi]

Dive Into Ambiguity: Latent Distribution Mining and Pairwise Uncertainty Estimation for Facial Expression RecognitionJiahui She, Yibo Hu, Hailin Shi, Jun Wang, Qiu Shen, Tao Mei 0001. 6248-6257 [doi]

Lifting 2D StyleGAN for 3D-Aware Face GenerationYichun Shi, Divyansh Aggarwal, Anil K. Jain 0001. 6258-6266 [doi]

Hybrid Message Passing With Performance-Driven Structures for Facial Action Unit DetectionTengfei Song, Zijun Cui, Wenming Zheng, Qiang Ji. 6267-6276 [doi]

Learning to Generalize Unseen Domains via Memory-based Multi-Source Meta-Learning for Person Re-IdentificationYuyang Zhao, Zhun Zhong, Fengxiang Yang, Zhiming Luo, Yaojin Lin, Shaozi Li, Nicu Sebe. 6277-6286 [doi]

Invertible Image Signal ProcessingYazhou Xing, Zian Qian, Qifeng Chen. 6287-6296 [doi]

End-to-End High Dynamic Range Camera Pipeline OptimizationNicolas Robidoux, Luis E. Garcia Capel, Dongeun Seo, Avinash Sharma, Federico Ariza, Felix Heide. 6297-6307 [doi]

Blind Deblurring for Saturated ImagesLiang Chen, Jiawei Zhang 0002, Songnan Lin, Faming Fang, Jimmy S. Ren. 6308-6316 [doi]

Extreme Low-Light Environment-Driven Image Denoising Over Permanently Shadowed Lunar Regions With a Physical Noise ModelBen Moseley, Valentin Bickel, Ignacio G. Lopez Francos, Loveneesh Rana. 6317-6327 [doi]

Controlling the Rain: From Removal to RenderingSiqi Ni, Xueyun Cao, Tao Yue, Xuemei Hu. 6328-6337 [doi]

De-Rendering the World's Revolutionary ArtefactsShangzhe Wu, Ameesh Makadia, Jiajun Wu 0001, Noah Snavely, Richard Tucker 0001, Angjoo Kanazawa. 6338-6347 [doi]

Progressively Complementary Network for Fisheye Image Rectification Using Appearance FlowShangrong Yang, Chunyu Lin, Kang Liao, Chunjie Zhang, Yao Zhao 0001. 6348-6357 [doi]

High-Speed Image Reconstruction Through Short-Term Plasticity for Spiking CamerasYajing Zheng, Lingxiao Zheng, Zhaofei Yu, Boxin Shi, Yonghong Tian 0001, Tiejun Huang. 6358-6367 [doi]

MASA-SR: Matching Acceleration and Spatial Adaptation for Reference-Based Image Super-ResolutionLiying Lu, Wenbo Li, Xin Tao, Jiangbo Lu, Jiaya Jia. 6368-6377 [doi]

Single Pair Cross-Modality Super ResolutionGuy Shacht, Dov Danon, Sharon Fogel, Daniel Cohen-Or. 6378-6387 [doi]

Temporal Modulation Network for Controllable Space-Time Video Super-ResolutionGang Xu, Jun Xu 0019, Zhen Li 0031, Liang Wang, Xing Sun, Ming-Ming Cheng. 6388-6397 [doi]

The Multi-Temporal Urban Development SpaceNet DatasetAdam Van Etten, Daniel Hogan, Jesus Martinez-Manso, Jacob Shermeyer, Nicholas Weir, Ryan Lewis. 6398-6407 [doi]

Euro-PVI: Pedestrian Vehicle Interactions in Dense Urban CentersApratim Bhattacharyya, Daniel Olmeda Reino, Mario Fritz, Bernt Schiele. 6408-6417 [doi]

AttentiveNAS: Improving Neural Architecture Search via Attentive SamplingDilin Wang, Meng Li 0004, ChengYue Gong, Vikas Chandra. 6418-6427 [doi]

Learning Student Networks in the WildHanting Chen, Tianyu Guo 0001, Chang Xu 0002, Wenshuo Li, Chunjing Xu, Chao Xu 0006, Yunhe Wang 0001. 6428-6437 [doi]

Towards Compact CNNs via Collaborative CompressionYuchao Li, Shaohui Lin, Jianzhuang Liu, Qixiang Ye, Mengdi Wang, Fei Chao, Fan Yang 0016, Jincheng Ma, Qi Tian 0001, Rongrong Ji. 6438-6447 [doi]

Network Quantization With Element-Wise Gradient ScalingJunghyup Lee, Dohyung Kim 0004, Bumsub Ham. 6448-6457 [doi]

Frequency-Aware Discriminative Feature Learning Supervised by Single-Center Loss for Face Forgery DetectionJiaming Li, Hongtao Xie, Jiahong Li, Zhongyuan Wang, Yongdong Zhang 0001. 6458-6467 [doi]

Building Reliable Explanations of Unreliable Neural Networks: Locally Smoothing Perspective of Model InterpretationDohun Lim, Hyeonseok Lee, Sungchan Kim. 6468-6477 [doi]

Perceptual Indistinguishability-Net (PI-Net): Facial Image Obfuscation With Manipulable SemanticsJia-Wei Chen, Li-Ju Chen, Chia-Mu Yu, Chun-Shien Lu. 6478-6487 [doi]

Coming Down to Earth: Satellite-to-Street View Synthesis for Geo-LocalizationAysim Toker, Qunjie Zhou, Maxim Maximov, Laura Leal-Taixé. 6488-6497 [doi]

Neural Scene Flow Fields for Space-Time View Synthesis of Dynamic ScenesZhengqi Li, Simon Niklaus, Noah Snavely, Oliver Wang. 6498-6508 [doi]

Not Just Compete, but Collaborate: Local Image-to-Image Translation via Cooperative Mask PredictionDaejin Kim, Mohammad Azam Khan, Jaegul Choo. 6509-6518 [doi]

Posterior Promoted GAN With Distribution Discriminator for Unsupervised Image SynthesisXianchao Zhang, Ziyang Cheng, Xiaotong Zhang 0003, Han Liu 0008. 6519-6528 [doi]

Surrogate Gradient Field for Latent Space ManipulationMinjun Li, Yanghua Jin, Huachun Zhu. 6529-6538 [doi]

Image Inpainting Guided by Coherence Priors of Semantics and TexturesLiang Liao, Jing Xiao 0004, Zheng Wang 0007, Chia-Wen Lin, Shin'ichi Satoh 0001. 6539-6548 [doi]

Spatially-Invariant Style-Codes Controlled Makeup TransferHan Deng, Chu Han, Hongmin Cai, Guoqiang Han, Shengfeng He. 6549-6557 [doi]

Memory-Guided Unsupervised Image-to-Image TranslationSomi Jeong, Youngjung Kim, Eungbean Lee, Kwanghoon Sohn. 6558-6567 [doi]

Hierarchical Motion Understanding via Motion ProgramsSumith Kulal, Jiayuan Mao, Alex Aiken, Jiajun Wu 0001. 6568-6576 [doi]

Adaptive Rank Estimate in Robust Principal Component AnalysisZhengqin Xu, Rui He, Shoulie Xie, Shiqian Wu. 6577-6586 [doi]

Deep Animation Video Interpolation in the WildSiyao Li, Shiyu Zhao, Weijiang Yu, Wenxiu Sun, Dimitris N. Metaxas, Chen Change Loy, Ziwei Liu 0002. 6587-6595 [doi]

ECKPN: Explicit Class Knowledge Propagation Network for Transductive Few-Shot LearningChaofan Chen, Xiaoshan Yang, Changsheng Xu, Xuhui Huang, Zhe Ma. 6596-6605 [doi]

Multi-Objective Interpolation Training for Robustness To Label NoiseDiego Ortego, Eric Arazo, Paul Albert, Noel E. O'Connor, Kevin McGuinness. 6606-6615 [doi]

T-vMF Similarity for Regularizing Intra-Class Feature DistributionTakumi Kobayashi 0001. 6616-6625 [doi]

Disentangling Label Distribution for Long-Tailed Visual RecognitionYoungkyu Hong, Seungju Han, KwangHee Choi, Seokjun Seo, Beomsu Kim, Buru Chang. 6626-6636 [doi]

Leveraging the Availability of Two Cameras for Illuminant EstimationAbdelrahman Abdelhamed, Abhijith Punnappurath, Michael S. Brown. 6637-6646 [doi]

Decoupled Dynamic Filter NetworksJingkai Zhou, Varun Jampani, Zhixiong Pi, Qiong Liu, Ming-Hsuan Yang 0001. 6647-6656 [doi]

Rethinking Graph Neural Architecture Search From Message-PassingShaofei Cai, Liang Li 0003, Jincan Deng, Beichen Zhang, Zheng-Jun Zha, Li Su 0003, Qingming Huang. 6657-6666 [doi]

Towards Improving the Consistency, Efficiency, and Flexibility of Differentiable Neural Architecture SearchYibo Yang, Shan You, Hongyang Li, Fei Wang 0032, Chen Qian 0006, Zhouchen Lin. 6667-6676 [doi]

Unsupervised Visual Attention and Invariance for Reinforcement LearningXudong Wang, Long Lian, Stella X. Yu. 6677-6687 [doi]

Mol2Image: Improved Conditional Flow Models for Molecule to Image SynthesisKarren D. Yang, Samuel Goldman, Wengong Jin, Alex X. Lu, Regina Barzilay, Tommi S. Jaakkola, Caroline Uhler. 6688-6698 [doi]

TSGCNet: Discriminative Geometric Feature Learning With Two-Stream Graph Convolutional Network for 3D Dental Model SegmentationLingming Zhang, Yue Zhao 0012, Deyu Meng, Zhiming Cui, Chenqiang Gao, Xinbo Gao 0001, Chunfeng Lian, Dinggang Shen. 6699-6708 [doi]

IoU Attack: Towards Temporally Coherent Black-Box Adversarial Attack for Visual Object TrackingShuai Jia, Yibing Song, Chao Ma 0004, Xiaokang Yang. 6709-6718 [doi]

GMOT-40: A Benchmark for Generic Multiple Object TrackingHexin Bai, Wensheng Cheng, Peng Chu, Juehuan Liu, Kai Zhang, Haibin Ling. 6719-6728 [doi]

Combined Depth Space Based Architecture Search for Person Re-IdentificationHanjun Li, Gaojie Wu, Wei-Shi Zheng. 6729-6738 [doi]

Learning an Explicit Weighting Scheme for Adapting Complex HSI NoiseXiangyu Rui, Xiangyong Cao, Qi Xie, Zongsheng Yue, Qian Zhao 0002, Deyu Meng. 6739-6748 [doi]

VaB-AL: Incorporating Class Imbalance and Difficulty With Variational Bayes for Active LearningJongwon Choi, Kwang Moo Yi, Jihoon Kim, Jinho Choo, Byoungjip Kim, Jin-Yeop Chang, Youngjune Gwon, Hyung Jin Chang. 6749-6758 [doi]

Learning a Facial Expression Embedding Disentangled From IdentityWei Zhang, Xianpeng Ji, Keyu Chen, Yu Ding 0001, Changjie Fan. 6759-6768 [doi]

SRDAN: Scale-Aware and Range-Aware Domain Adaptation Network for Cross-Dataset 3D Object DetectionWeichen Zhang, Wen Li 0001, Dong Xu 0001. 6769-6779 [doi]

Regressive Domain Adaptation for Unsupervised Keypoint DetectionJunguang Jiang, Yifei Ji, Ximei Wang, Yufeng Liu, Jianmin Wang 0001, Mingsheng Long. 6780-6789 [doi]

Uncertainty-Guided Model Generalization to Unseen DomainsFengchun Qiao, Xi Peng 0005. 6790-6800 [doi]

Self-Promoted Prototype Refinement for Few-Shot Class-Incremental LearningKai Zhu 0004, Yang Cao 0010, Wei Zhai, Jie Cheng, Zheng-Jun Zha. 6801-6810 [doi]

Noise-Resistant Deep Metric Learning With Ranking-Based Instance SelectionChang Liu 0040, Han Yu 0001, Boyang Li 0001, Zhiqi Shen 0001, Zhanning Gao, Peiran Ren, Xuansong Xie, LiZhen Cui, Chunyan Miao. 6811-6820 [doi]

DAT: Training Deep Networks Robust To Label-Noise by Matching the Feature DistributionsYuntao Qu, Shasha Mo, Jianwei Niu 0002. 6821-6829 [doi]

OBoW: Online Bag-of-Visual-Words Generation for Self-Supervised LearningSpyros Gidaris, Andrei Bursuc, Gilles Puy, Nikos Komodakis, Matthieu Cord, Patrick Pérez. 6830-6840 [doi]

Learning Affinity-Aware Upsampling for Deep Image MattingYutong Dai, Hao Lu 0003, Chunhua Shen. 6841-6850 [doi]

PLADE-Net: Towards Pixel-Level Accuracy for Self-Supervised Single-View Depth Estimation With Neural Positional Encoding and Distilled Matting LossJuan Luis Gonzalez, Munchurl Kim. 6851-6860 [doi]

RefineMask: Towards High-Quality Instance Segmentation With Fine-Grained FeaturesGang Zhang, Xin Lu, Jingru Tan, Jianmin Li 0001, Zhaoxiang Zhang, Quanquan Li, Xiaolin Hu. 6861-6869 [doi]

CompositeTasking: Understanding Images by Spatial Composition of TasksNikola Popovic, Danda Pani Paudel, Thomas Probst, Guolei Sun, Luc Van Gool. 6870-6880 [doi]

Rethinking Semantic Segmentation From a Sequence-to-Sequence Perspective With TransformersSixiao Zheng, Jiachen Lu, Hengshuang Zhao, Xiatian Zhu, Zekun Luo, Yabiao Wang, Yanwei Fu, Jianfeng Feng, Tao Xiang, Philip H. S. Torr, Li Zhang 0040. 6881-6890 [doi]

FSDR: Frequency Space Domain Randomization for Domain GeneralizationJiaxing Huang 0001, Dayan Guan, Aoran Xiao, Shijian Lu. 6891-6902 [doi]

Transformation Driven Visual ReasoningXin Hong, Yanyan Lan, Liang Pang, Jiafeng Guo, Xueqi Cheng. 6903-6912 [doi]

Background-Aware Pooling and Noise-Aware Loss for Weakly-Supervised Semantic SegmentationYoungmin Oh, Beomjun Kim, Bumsub Ham. 6913-6922 [doi]

Adaptive Consistency Regularization for Semi-Supervised Transfer LearningAbulikemu Abuduweili, Xingjian Li 0002, Humphrey Shi, Cheng-Zhong Xu 0001, Dejing Dou. 6923-6932 [doi]

Self-Generated Defocus Blur Detection via Dual Adversarial DiscriminatorsWenda Zhao, Cai Shang, Huchuan Lu. 6933-6942 [doi]

Ego-Exo: Transferring Visual Representations From Third-Person to First-Person VideosYanghao Li, Tushar Nagarajan, Bo Xiong, Kristen Grauman. 6943-6953 [doi]

PV-RAFT: Point-Voxel Correlation Fields for Scene Flow Estimation of Point CloudsYi Wei, Ziyi Wang, Yongming Rao, Jiwen Lu, Jie Zhou 0001. 6954-6963 [doi]

Spatiotemporal Contrastive Video Representation LearningRui Qian, Tianjian Meng, Boqing Gong, Ming-Hsuan Yang 0001, Huisheng Wang, Serge J. Belongie, Yin Cui. 6964-6974 [doi]

Deep Video Matting via Spatio-Temporal Alignment and AggregationYanan Sun, Guanzhi Wang, Qiao Gu, Chi-Keung Tang, Yu-Wing Tai. 6975-6984 [doi]

Target-Aware Object Discovery and Association for Unsupervised Video Multi-Object SegmentationTianfei Zhou, Jianwu Li, Xueyi Li, Ling Shao 0001. 6985-6994 [doi]

Multimodal Contrastive Training for Visual Representation LearningXin Yuan, Zhe Lin 0001, Jason Kuen, Jianming Zhang 0001, Yilin Wang, Michael Maire, Ajinkya Kale, Baldo Faieta. 6995-7004 [doi]

Vx2Text: End-to-End Learning of Video-Based Text Generation From Multimodal InputsXudong Lin 0003, Gedas Bertasius, Jue Wang, Shih-Fu Chang, Devi Parikh, Lorenzo Torresani. 7005-7015 [doi]

Distilling Audio-Visual Knowledge by Compositional Contrastive LearningYanbei Chen, Yongqin Xian, A. Sophia Koepke, Ying Shan, Zeynep Akata. 7016-7025 [doi]

Structured Multi-Level Interaction Network for Video Moment Localization via Language QueryHao Wang, Zheng-Jun Zha, Liang Li, Dong Liu 0002, Jiebo Luo. 7026-7035 [doi]

Scene-Intuitive Agent for Remote Embodied Visual GroundingXiangru Lin, Guanbin Li, Yizhou Yu. 7036-7045 [doi]

Domain-Robust VQA With Diverse Datasets and Methods but No Target LabelsMingda Zhang, Tristan Maidment, Ahmad Diab, Adriana Kovashka, Rebecca Hwa. 7046-7056 [doi]

Composing Photos Like a PhotographerChaoyi Hong, Shuaiyuan Du, Ke Xian, Hao Lu 0003, Zhiguo Cao 0001, Weicai Zhong. 7057-7066 [doi]

Dogfight: Detecting Drones From Drones VideosMuhammad Waseem Ashraf, Waqas Sultani, Mubarak Shah. 7067-7076 [doi]

Multi-Modal Fusion Transformer for End-to-End Autonomous DrivingAditya Prakash, Kashyap Chitta, Andreas Geiger 0001. 7077-7087 [doi]

Cloud2Curve: Generation and Vectorization of Parametric SketchesAyan Das 0003, Yongxin Yang, Timothy M. Hospedales, Tao Xiang, Yi-Zhe Song. 7088-7097 [doi]

Read Like Humans: Autonomous, Bidirectional and Iterative Language Modeling for Scene Text RecognitionShancheng Fang, Hongtao Xie, Yuxin Wang, Zhendong Mao, Yongdong Zhang 0001. 7098-7107 [doi]

MultiBodySync: Multi-Body Segmentation and Motion Estimation via 3D Scan SynchronizationJiahui Huang, He Wang 0010, Tolga Birdal, Minhyuk Sung, Federica Arrigoni, Shi-Min Hu 0001, Leonidas J. Guibas. 7108-7118 [doi]

NeuTex: Neural Texture Mapping for Volumetric Neural RenderingFanbo Xiang, Zexiang Xu, Milos Hasan, Yannick Hold-Geoffroy, Kalyan Sunkavalli, Hao Su 0001. 7119-7128 [doi]

UnsupervisedR&R: Unsupervised Point Cloud Registration via Differentiable RenderingMohamed El Banani, Luya Gao, Justin Johnson 0001. 7129-7139 [doi]

RangeIoUDet: Range Image Based Real-Time 3D Object Detector Optimized by Intersection Over UnionZhidong Liang, Zehan Zhang, Ming Zhang, Xian Zhao, Shiliang Pu. 7140-7149 [doi]

Architectural Adversarial Robustness: The Case for Deep PursuitGeorge Cazenavette, Calvin Murdock, Simon Lucey. 7150-7158 [doi]

SimPoE: Simulated Character Control for 3D Human Pose EstimationYe Yuan 0007, Shih-En Wei, Tomas Simon, Kris Kitani, Jason M. Saragih. 7159-7169 [doi]

CodedStereo: Learned Phase Masks for Large Depth-of-Field StereoShiyu Tan, Yicheng Wu, Shoou-I Yu, Ashok Veeraraghavan. 7170-7179 [doi]

PSD: Principled Synthetic-to-Real Dehazing Guided by Physical PriorsZeyuan Chen, Yangchao Wang, Yang Yang 0002, Dong Liu 0002. 7180-7189 [doi]

OpenRooms: An Open Framework for Photorealistic Indoor Scene DatasetsZhengqin Li, Ting-Wei Yu, Shen Sang, Sarah Wang, Meng Song, Yuhan Liu, Yu-Ying Yeh, Rui Zhu, Nitesh B. Gundavarapu, Jia Shi, Sai Bi, Hong-Xing Yu, Zexiang Xu, Kalyan Sunkavalli, Milos Hasan, Ravi Ramamoorthi, Manmohan Chandraker. 7190-7199 [doi]

A Closer Look at Fourier Spectrum Discrepancies for CNN-Generated Images DetectionKeshigeyan Chandrasegaran, Ngoc-Trung Tran, Ngai-Man Cheung. 7200-7209 [doi]

NeRF in the Wild: Neural Radiance Fields for Unconstrained Photo CollectionsRicardo Martin-Brualla, Noha Radwan, Mehdi S. M. Sajjadi, Jonathan T. Barron, Alexey Dosovitskiy, Daniel Duckworth. 7210-7219 [doi]

ID-Unet: Iterative Soft and Hard Deformation for View SynthesisMingyu Yin, Li Sun, Qingli Li. 7220-7229 [doi]

GeoSim: Realistic Video Simulation via Geometry-Aware Composition for Self-DrivingYun Chen 0014, Frieda Rong, Shivam Duggal, Shenlong Wang, Xinchen Yan, Sivabalan Manivasagam, Shangjie Xue, Ersin Yumer, Raquel Urtasun. 7230-7240 [doi]

All Labels Are Not Created Equal: Enhancing Semi-Supervision via Label Grouping and Co-TrainingIslam Nassar, Samitha Herath, Ehsan Abbasnejad, Wray L. Buntine, Gholamreza Haffari. 7241-7250 [doi]

Orthogonal Over-Parameterized TrainingWeiyang Liu, Rongmei Lin, Zhen Liu 0019, James M. Rehg, Liam Paull, Li Xiong 0001, Le Song, Adrian Weller. 7251-7260 [doi]

DeepTag: An Unsupervised Deep Learning Method for Motion Tracking on Cardiac Tagging Magnetic Resonance ImagesMeng Ye, Mikael Kanski, Dong Yang 0005, Qi Chang, Zhennan Yan, Qiaoying Huang, Leon Axel, Dimitris N. Metaxas. 7261-7271 [doi]

Transferable Query Selection for Active Domain AdaptationBo Fu, Zhangjie Cao, Jianmin Wang 0001, Mingsheng Long. 7272-7281 [doi]

When Age-Invariant Face Recognition Meets Face Age Synthesis: A Multi-Task Learning FrameworkZhizhong Huang, Junping Zhang, Hongming Shan. 7282-7291 [doi]

Simpler Certified Radius Maximization by Propagating CovariancesXingjian Zhen, Rudrasis Chakraborty, Vikas Singh. 7292-7301 [doi]

Improving Panoptic Segmentation at All ScalesLorenzo Porzi, Samuel Rota Bulò, Peter Kontschieder. 7302-7311 [doi]

Learning Triadic Belief Dynamics in Nonverbal Communication From VideosLifeng Fan, Shuwen Qiu, Zilong Zheng, Tao Gao, Song Chun Zhu, Yixin Zhu. 7312-7321 [doi]

Guided Interactive Video Object Segmentation Using Reliability-Based Attention MapsYuk Heo, Yeong Jun Koh, Chang-Su Kim. 7322-7330 [doi]

Less Is More: ClipBERT for Video-and-Language Learning via Sparse SamplingJie Lei, Linjie Li, Luowei Zhou, Zhe Gan, Tamara L. Berg, Mohit Bansal, Jingjing Liu 0001. 7331-7341 [doi]

Im2Vec: Synthesizing Vector Graphics Without Vector SupervisionPradyumna Reddy, Michaël Gharbi, Michal Lukác, Niloy J. Mitra. 7342-7351 [doi]

FSCE: Few-Shot Object Detection via Contrastive Proposal EncodingBo Sun, Banghuai Li, Shengcai Cai, Ye Yuan, Chi Zhang. 7352-7362 [doi]

Beyond Max-Margin: Class Margin Equilibrium for Few-Shot Object DetectionBoHao Li, Boyu Yang, Chang Liu, Feng Liu, Rongrong Ji, Qixiang Ye. 7363-7372 [doi]

Dynamic Head: Unifying Object Detection Heads With AttentionsXiyang Dai, Yinpeng Chen, Bin Xiao, Dongdong Chen 0001, Mengchen Liu, Lu Yuan, Lei Zhang 0001. 7373-7382 [doi]

Dictionary-Guided Scene Text RecognitionNguyen Nguyen, Thu Nguyen, Vinh Tran 0005, Minh-Triet Tran, Thanh Duc Ngo, Thien Huu Nguyen, Minh Hoai. 7383-7392 [doi]

Progressive Contour Regression for Arbitrary-Shape Scene Text DetectionPengwen Dai, Sanyi Zhang, Hua Zhang 0008, Xiaochun Cao. 7393-7402 [doi]

Strengthen Learning Tolerance for Weakly Supervised Object LocalizationGuangyu Guo, Junwei Han, Fang Wan, Dingwen Zhang. 7403-7412 [doi]

StruMonoNet: Structure-Aware Monocular 3D PredictionZhenpei Yang, Li Erran Li, Qixing Huang. 7413-7422 [doi]

Fully Understanding Generic Objects: Modeling, Segmentation, and ReconstructionFeng Liu 0037, Luan Tran, Xiaoming Liu 0002. 7423-7433 [doi]

Exploiting & Refining Depth Distributions With Triangulation Light CurtainsYaadhav Raaj, Siddharth Ancha, Robert Tamburo, David Held, Srinivasa G. Narasimhan. 7434-7442 [doi]

PMP-Net: Point Cloud Completion by Learning Multi-Step Point Moving PathsXin Wen, Peng Xiang, Zhizhong Han, Yan-Pei Cao, Pengfei Wan, Wen Zheng, Yu-Shen Liu. 7443-7452 [doi]

TearingNet: Point Cloud Autoencoder To Learn Topology-Friendly RepresentationsJiahao Pang, Duanshun Li, Dong Tian. 7453-7462 [doi]

3D Object Detection With PointformerXuran Pan, Zhuofan Xia, Shiji Song, Li Erran Li, Gao Huang. 7463-7472 [doi]

NeuroMorph: Unsupervised Shape Interpolation and Correspondence in One GoMarvin Eisenberger, David Novotný, Gael Kerchenbaum, Patrick Labatut, Natalia Neverova, Daniel Cremers, Andrea Vedaldi. 7473-7483 [doi]

Towards Part-Based Understanding of RGB-D ScansAlexey Bokhovkin, Vladislav Ishimtsev, Emil Bogomolov, Denis Zorin, Alexey Artemov, Evgeny Burnaev, Angela Dai. 7484-7494 [doi]

NeRV: Neural Reflectance and Visibility Fields for Relighting and View SynthesisPratul P. Srinivasan, Boyang Deng, Xiuming Zhang, Matthew Tancik, Ben Mildenhall, Jonathan T. Barron. 7495-7504 [doi]

Probabilistic Model Distillation for Semantic CorrespondenceXin Li, Deng-Ping Fan, Fan Yang 0054, Ao Luo, Hong Cheng 0002, Zicheng Liu 0001. 7505-7514 [doi]

SceneGraphFusion: Incremental 3D Scene Graph Prediction From RGB-D SequencesShuncheng Wu, Johanna Wald, Keisuke Tateno, Nassir Navab, Federico Tombari. 7515-7525 [doi]

Self-Supervised Learning of Depth Inference for Multi-View StereoJiayu Yang, Jose M. Alvarez, Miaomiao Liu. 7526-7534 [doi]

Mesoscopic Photogrammetry With an Unstabilized Phone CameraKevin C. Zhou, Colin L. V. Cooke, Jaehee Park, Ruobing Qian, Roarke Horstmeyer, Joseph A. Izatt, Sina Farsiu. 7535-7545 [doi]

LiDAR R-CNN: An Efficient and Universal 3D Object DetectorZhichao Li, Feng Wang, Naiyan Wang. 7546-7555 [doi]

Monocular 3D Object Detection: An Extrinsic Parameter Free ApproachYunsong Zhou, Yuan He, Hongzi Zhu, Cheng Wang, Hongyang Li, Qinhong Jiang. 7556-7566 [doi]

Beyond Short Clips: End-to-End Video-Level Learning With Collaborative MemoriesXitong Yang, Haoqi Fan 0001, Lorenzo Torresani, Larry S. Davis, Heng Wang. 7567-7576 [doi]

Multimodal Motion Prediction With Stacked TransformersYicheng Liu, Jinghuai Zhang, Liangji Fang, Qinhong Jiang, Bolei Zhou. 7577-7586 [doi]

Weakly Supervised Action Selection Learning in VideoJunwei Ma, Satya Krishna Gorti, Maksims Volkovs, Guang Wei Yu. 7587-7596 [doi]

BASAR: Black-Box Attack on Skeletal Action RecognitionYunfeng Diao, Tianjia Shao, Yongliang Yang, Kun Zhou 0001, He Wang 0002. 7597-7607 [doi]

Adversarial Robustness Across Representation SpacesPranjal Awasthi, George Yu, Chun-Sung Ferng, Andrew Tomkins, Da-Cheng Juan. 7608-7616 [doi]

img2pose: Face Alignment and Detection via 6DoF, Face Pose EstimationVitor Albiero, Xingyu Chen, Xi Yin 0008, Guan Pang, Tal Hassner. 7617-7627 [doi]

OSTeC: One-Shot Texture CompletionBaris Gecer, Jiankang deng, Stefanos Zafeiriou. 7628-7638 [doi]

Locally Aware Piecewise Transformation Fields for 3D Human Mesh RegistrationShaofei Wang, Andreas Geiger 0001, Siyu Tang. 7639-7648 [doi]

Monocular 3D Multi-Person Pose Estimation by Integrating Top-Down and Bottom-Up NetworksYu Cheng, Bo Wang, Bo Yang, Robby T. Tan. 7649-7659 [doi]

Feature Decomposition and Reconstruction Learning for Effective Facial Expression RecognitionDelian Ruan, Yan Yan 0001, Shenqi Lai, Zhenhua Chai, Chunhua Shen, Hanzi Wang. 7660-7669 [doi]

SDD-FIQA: Unsupervised Face Image Quality Assessment With Similarity Distribution DistanceFu-Zhao Ou, Xingyu Chen, Ruixin Zhang, Yuge Huang, Shaoxin Li, Jilin Li, Yong Li, Liujuan Cao, Yuan-Gen Wang. 7670-7679 [doi]

Facial Action Unit Detection With TransformersGeethu Miriam Jacob, Björn Stenger. 7680-7689 [doi]

Anchor-Free Person SearchYichao Yan, Jinpeng Li, Jie Qin, Song Bai, ShengCai Liao, Li Liu 0004, Fan Zhu 0001, Ling Shao 0001. 7690-7699 [doi]

Neural Camera SimulatorsHao Ouyang, Zifan Shi, Chenyang Lei, Ka Lung Law, Qifeng Chen. 7700-7709 [doi]

Neural Auto-Exposure for High-Dynamic Range Object DetectionEmmanuel Onzon, Fahim Mannan, Felix Heide. 7710-7720 [doi]

ARVo: Learning All-Range Volumetric Correspondence for Video DeblurringDongxu Li, Chenchen Xu, Kaihao Zhang, Xin Yu 0002, Yiran Zhong, Wenqi Ren, Hanna Suominen, Hongdong Li. 7721-7731 [doi]

Memory Oriented Transfer Learning for Semi-Supervised Image DerainingHuaibo Huang, Aijing Yu, Ran He. 7732-7741 [doi]

Robust Representation Learning With Feedback for Single Image DerainingChenghao Chen, Hao Li. 7742-7751 [doi]

A Multi-Task Network for Joint Specular Highlight Detection and RemovalGang Fu, Qing Zhang, Lei Zhu, Ping Li, Chunxia Xiao. 7752-7761 [doi]

Panoramic Image Reflection RemovalYuchen Hong, Qian Zheng, Lingran Zhao, Xudong Jiang, Alex C. Kot, Boxin Shi. 7762-7771 [doi]

Turning Frequency to Resolution: Video Super-Resolution via Event CamerasYongcheng Jing, Yiding Yang, Xinchao Wang, Mingli Song, Dacheng Tao. 7772-7781 [doi]

SRWarp: Generalized Image Super-Resolution under Arbitrary TransformationSanghyun Son, Kyoung Mu Lee. 7782-7791 [doi]

Learning Scene Structure Guidance via Cross-Task Knowledge Transfer for Single Depth Super-ResolutionBaoli Sun, Xinchen Ye, Baopu Li, Haojie Li, Zhihui Wang, Rui Xu 0002. 7792-7801 [doi]

Gated Spatio-Temporal Attention-Guided Video DeblurringMaitreya Suin, A. N. Rajagopalan 0001. 7802-7811 [doi]

Detection, Tracking, and Counting Meets Drones in Crowds: A BenchmarkLongyin Wen, Dawei Du, Pengfei Zhu, Qinghua Hu, Qilong Wang, Liefeng Bo, Siwei Lyu. 7812-7821 [doi]

Objectron: A Large Scale Dataset of Object-Centric Videos in the Wild With Pose AnnotationsAdel Ahmadyan, Liangkai Zhang, Artsiom Ablavatski, Jianing Wei, Matthias Grundmann. 7822-7831 [doi]

Dynamic Domain Adaptation for Efficient InferenceShuang Li, Jinming Zhang, Wenxuan Ma, Chi Harold Liu, Wei Li. 7832-7841 [doi]

General Instance Distillation for Object DetectionXing Dai, Zeren Jiang, Zhao Wu, Yiping Bao, Zhicheng Wang, Si Liu 0001, Erjin Zhou. 7842-7851 [doi]

Data-Free Knowledge Distillation for Image Super-ResolutionYiman Zhang, Hanting Chen, Xinghao Chen 0001, Yiping Deng, Chunjing Xu, Yunhe Wang. 7852-7861 [doi]

Improving Accuracy of Binary Neural Networks Using Unbalanced Activation DistributionHyungJun Kim, JiHoon Park, Changhun Lee, Jae-Joon Kim. 7862-7871 [doi]

Hijack-GAN: Unintended-Use of Pretrained, Black-Box GANsHui-Po Wang, Ning Yu, Mario Fritz. 7872-7881 [doi]

Cross Modal Focal Loss for RGBD Face Anti-SpoofingAnjith George, Sébastien Marcel. 7882-7891 [doi]

On the Difficulty of Membership Inference AttacksShahbaz Rezaei, Xin Liu. 7892-7900 [doi]

Lifelong Person Re-Identification via Adaptive Knowledge AccumulationNan Pu, Wei Chen 0072, Yu Liu, Erwin M. Bakker, Michael S. Lew. 7901-7910 [doi]

Stereo Radiance Fields (SRF): Learning View Synthesis for Sparse Views of Novel ScenesJulian Chibane, Aayush Bansal, Verica Lazova, Gerard Pons-Moll. 7911-7920 [doi]

Regularizing Generative Adversarial Networks Under Limited DataHung-Yu Tseng, Lu Jiang, Ce Liu, Ming-Hsuan Yang 0001, Weilong Yang. 7921-7931 [doi]

Automatic Correction of Internal Units in Generative Neural NetworksAli Tousi, Haedong Jeong, Jiyeon Han, Hwanil Choi, Jaesik Choi. 7932-7940 [doi]

HistoGAN: Controlling Colors of GAN-Generated and Real Images via Color HistogramsMahmoud Afifi, Marcus A. Brubaker, Michael S. Brown. 7941-7950 [doi]

Prior Based Human CompletionZibo Zhao, Wen Liu 0003, Yanyu Xu, Xianing Chen, Weixin Luo, Lei Jin, Bohui Zhu, Tong Liu, Binqiang Zhao, Shenghua Gao. 7951-7961 [doi]

Diverse Semantic Image Synthesis via Probability Distribution ModelingZhentao Tan, Menglei Chai, Dongdong Chen 0001, Jing Liao 0001, Qi Chu 0001, Bin Liu 0016, Gang Hua 0001, Nenghai Yu. 7962-7971 [doi]

Adaptive Convolutions for Structure-Aware Style TransferPrashanth Chandran, Gaspard Zoss, Paulo F. U. Gotardo, Markus Gross 0001, Derek Bradley. 7972-7981 [doi]

PISE: Person Image Synthesis and Editing With Decoupled GANJinsong Zhang, Kun Li 0001, Yu-Kun Lai, Jingyu Yang 0002. 7982-7990 [doi]

Semi-Supervised Synthesis of High-Resolution Editable Textures for 3D HumansBindita Chaudhuri, Nikolaos Sarafianos, Linda G. Shapiro, Tony Tung. 7991-8000 [doi]

CDFI: Compression-Driven Network Design for Frame InterpolationTianyu Ding, Luming Liang, Zhihui Zhu, Ilya Zharkov. 8001-8011 [doi]

Few-Shot Classification With Feature Map Reconstruction NetworksDavis Wertheimer, Luming Tang, Bharath Hariharan. 8012-8021 [doi]

Augmentation Strategies for Learning With Noisy LabelsKento Nishi, Yi Ding, Alex Rich, Tobias Höllerer. 8022-8031 [doi]

Activate or Not: Learning Customized ActivationNingning Ma, Xiangyu Zhang 0005, Ming Liu, Jian Sun 0015. 8032-8042 [doi]

Background Splitting: Finding Rare Classes in a Sea of BackgroundRavi Teja Mullapudi, Fait Poms, William R. Mark, Deva Ramanan, Kayvon Fatahalian. 8043-8052 [doi]

CLCC: Contrastive Learning for Color ConstancyYi-Chen Lo, Chia-Che Chang, Hsuan-Chao Chiu, Yu-Hao Huang, Chia-Ping Chen, Yu-Lin Chang, Kevin Jou. 8053-8063 [doi]

Dynamic Region-Aware ConvolutionJin Chen, Xijun Wang, Zichao Guo, Xiangyu Zhang 0005, Jian Sun 0015. 8064-8073 [doi]

Learning Dynamics via Graph Neural Networks for Human Pose Estimation and TrackingYiding Yang, Zhou Ren, Haoxiang Li, Chunluan Zhou, Xinchao Wang, Gang Hua 0001. 8074-8084 [doi]

Searching for Fast Model Families on Datacenter AcceleratorsSheng Li 0007, Mingxing Tan, Ruoming Pang, Andrew Li, Liqun Cheng, Quoc V. Le, Norman P. Jouppi. 8085-8095 [doi]

Discrete-Continuous Action Space Policy Gradient-Based Attention for Image-Text MatchingShiyang Yan, Li Yu, Yuan Xie 0006. 8096-8105 [doi]

Quantifying Explainers of Graph Neural Networks in Computational PathologyGuillaume Jaume, Pushpak Pati, Behzad Bozorgtabar, Antonio Foncubierta, Anna Maria Anniciello, Florinda Feroce, Tilman Rau, Jean-Philippe Thiran, Maria Gabrani, Orcun Goksel. 8106-8116 [doi]

Forecasting Irreversible Disease via Progression LearningBotong Wu, Sijie Ren, Jing Li, Xinwei Sun 0001, Shiming Li, Yizhou Wang 0001. 8117-8125 [doi]

Transformer TrackingXin Chen, Bin Yan, Jiawen Zhu, Dong Wang 0004, Xiaoyun Yang, Huchuan Lu. 8126-8135 [doi]

Online Multiple Object Tracking With Cross-Task SynergySong Guo, Jingya Wang, Xinchao Wang, Dacheng Tao. 8136-8145 [doi]

Learning 3D Shape Feature for Texture-Insensitive Person Re-IdentificationJiaxing Chen, Xinyang Jiang, Fudong Wang, Jun Zhang, Feng Zheng, Xing Sun, Wei-Shi Zheng. 8146-8155 [doi]

Regularizing Neural Networks via Adversarial Model PerturbationYaowei Zheng, Richong Zhang, Yongyi Mao. 8156-8165 [doi]

Task-Aware Variational Adversarial Active LearningKwanyoung Kim, Dongwon Park, Kwang In Kim, Se Young Chun. 8166-8175 [doi]

VDSM: Unsupervised Video Disentanglement With State-Space Modeling and Deep Mixtures of ExpertsMatthew J. Vowels, Necati Cihan Camgöz, Richard Bowden. 8176-8186 [doi]

Multi-Target Domain Adaptation With Collaborative Consistency LearningTakashi Isobe, Xu Jia, Shuaijun Chen, Jianzhong He, Yongjie Shi, Jianzhuang Liu, Huchuan Lu, Shengjin Wang. 8187-8196 [doi]

Learning To Relate Depth and Semantics for Unsupervised Domain AdaptationSuman Saha, Anton Obukhov, Danda Pani Paudel, Menelaos Kanakis, Yuhua Chen, Stamatios Georgoulis, Luc Van Gool. 8197-8207 [doi]

Adversarially Adaptive Normalization for Single Domain GeneralizationXinjie Fan, Qifei Wang, Junjie Ke, Feng Yang, Boqing Gong, Mingyuan Zhou. 8208-8217 [doi]

Rainbow Memory: Continual Learning With a Memory of Diverse SamplesJihwan Bang, Heesu Kim, Youngjoon Yoo, Jung-Woo Ha 0001, Jonghyun Choi. 8218-8227 [doi]

Asymmetric Metric Learning for Knowledge TransferMateusz Budnik, Yannis Avrithis. 8228-8238 [doi]

Scalability vs. Utility: Do We Have To Sacrifice One for the Other in Data Importance Quantification?Ruoxi Jia, Fan Wu 0011, Xuehui Sun, Jiacen Xu, David Dao, Bhavya Kailkhura, Ce Zhang 0001, Bo Li 0026, Dawn Song. 8239-8247 [doi]

Self-Supervised Learning on 3D Point Clouds by Learning Discrete Generative ModelsBenjamin Eckart, Wentao Yuan, Chao Liu, Jan Kautz. 8248-8257 [doi]

Multi-view Depth Estimation using Epipolar Spatio-Temporal NetworksXiaoxiao Long, Lingjie Liu, Wei Li, Christian Theobalt, Wenping Wang. 8258-8267 [doi]

Beyond Image to Depth: Improving Depth Prediction Using EchoesKranti Kumar Parida, Siddharth Srivastava 0004, Gaurav Sharma. 8268-8277 [doi]

Deeply Shape-Guided Cascade for Instance SegmentationHao Ding, Siyuan Qiao, Alan L. Yuille, Wei Shen 0002. 8278-8288 [doi]

Linguistic Structures As Weak Supervision for Visual Scene Graph GenerationKeren Ye, Adriana Kovashka. 8289-8299 [doi]

Semantic Segmentation With Generative Models: Semi-Supervised Learning and Strong Out-of-Domain GeneralizationDaiqing Li, Junlin Yang, Karsten Kreis, Antonio Torralba 0001, Sanja Fidler. 8300-8311 [doi]

Self-Guided and Cross-Guided Learning for Few-Shot SegmentationBingfeng Zhang, Jimin Xiao, Terry Qin. 8312-8321 [doi]

Scene EssenceJiayan Qiu, Yiding Yang, Xinchao Wang, Dacheng Tao. 8322-8333 [doi]

Adaptive Prototype Learning and Allocation for Few-Shot SegmentationGen Li, Varun Jampani, Laura Sevilla-Lara, Deqing Sun, Jonghyun Kim, Joongkyu Kim. 8334-8343 [doi]

Cluster, Split, Fuse, and Update: Meta-Learning for Open Compound Domain Adaptive Semantic SegmentationRui Gong, Yuhua Chen, Danda Pani Paudel, Yawei Li, Ajad Chhatkuli, Wen Li, Dengxin Dai, Luc Van Gool. 8344-8354 [doi]

Unsupervised Part Segmentation Through Disentangling Appearance and ShapeShilong Liu, Lei Zhang 0001, Xiao Yang, Hang Su 0006, Jun Zhu 0001. 8355-8364 [doi]

Temporal Action Segmentation From Timestamp SupervisionZhe Li, Yazan Abu Farha, Jürgen Gall. 8365-8374 [doi]

RAFT-3D: Scene Flow Using Rigid-Motion EmbeddingsZachary Teed, Jia Deng 0001. 8375-8384 [doi]

Coarse-Fine Networks for Temporal Activity Detection in VideosKumara Kahatapitiya, Michael S. Ryoo. 8385-8394 [doi]

Learning Discriminative Prototypes With Dynamic Time WarpingXiaobin Chang, Frederick Tung, Greg Mori. 8395-8404 [doi]

Learning Dynamic Network Using a Reuse Gate Function in Semi-Supervised Video Object SegmentationHyojin Park, Jayeon Yoo, SeoHyeong Jeong, Ganesh Venkatesh, Nojun Kwak. 8405-8414 [doi]

Probabilistic Embeddings for Cross-Modal RetrievalSanghyuk Chun, Seong Joon Oh, Rafael Sampaio de Rezende, Yannis Kalantidis, Diane Larlus. 8415-8424 [doi]

Towards Bridging Event Captioner and Sentence Localizer for Weakly Supervised Dense Event CaptioningShaoxiang Chen 0001, Yu-Gang Jiang. 8425-8435 [doi]

Positive Sample Propagation Along the Audio-Visual Event LineJinxing Zhou, Liang Zheng, Yiran Zhong, Shijie Hao, Meng Wang 0001. 8436-8444 [doi]

Embracing Uncertainty: Decoupling and De-Bias for Robust Temporal GroundingHao Zhou, Chongyang Zhang, Yan Luo, Yanjun Chen, Chuanping Hu. 8445-8454 [doi]

Structured Scene Memory for Vision-Language NavigationHanqing Wang, Wenguan Wang, Wei Liang, Caiming Xiong, Jianbing Shen. 8455-8464 [doi]

Found a Reason for me? Weakly-supervised Grounded Visual Question Answering using CapsulesAisha Urooj Khan, Hilde Kuehne, Kevin Duarte, Chuang Gan, Niels da Vitoria Lobo, Mubarak Shah. 8465-8474 [doi]

Hierarchical Layout-Aware Graph Convolutional Network for Unified Aesthetics AssessmentDongyu She, Yu-Kun Lai, Gaoxiong Yi, Kun Xu 0003. 8475-8484 [doi]

Parser-Free Virtual Try-On via Distilling Appearance FlowsYuying Ge, Yibing Song, Ruimao Zhang, Chongjian Ge, Wei Liu 0005, Ping Luo 0002. 8485-8493 [doi]

Self-Supervised Simultaneous Multi-Step Prediction of Road Dynamics and Cost MapElmira Amirloo Abolfathi, Mohsen Rohani, Ershad Banijamali, Jun Luo, Pascal Poupart. 8494-8503 [doi]

StyleMeUp: Towards Style-Agnostic Sketch-Based Image RetrievalAneeshan Sain, Ayan Kumar Bhunia, Yongxin Yang, Tao Xiang, Yi-Zhe Song. 8504-8513 [doi]

VarifocalNet: An IoU-Aware Dense Object DetectorHaoyang Zhang, Ying Wang, Feras Dayoub, Niko Sünderhauf. 8514-8523 [doi]

Variational Relational Point Completion NetworkLiang Pan, Xinyi Chen, Zhongang Cai, Junzhe Zhang, Haiyu Zhao, Shuai Yi, Ziwei Liu. 8524-8533 [doi]

NeX: Real-Time View Synthesis With Neural Basis ExpansionSuttisak Wizadwongsa, Pakkapon Phongthawee, Jiraphon Yenphraphai, Supasorn Suwajanakorn. 8534-8543 [doi]

Robust Neural Routing Through Space Partitions for Camera Relocalization in Dynamic Indoor EnvironmentsSiyan Dong, Qingnan Fan, He Wang 0010, Ji Shi, Li Yi, Thomas A. Funkhouser, Baoquan Chen, Leonidas J. Guibas. 8544-8554 [doi]

Categorical Depth Distribution Network for Monocular 3D Object DetectionCody Reading, Ali Harakeh, Julia Chae, Steven L. Waslander. 8555-8564 [doi]

Dual Attention Suppression Attack: Generate Adversarial Camouflage in Physical WorldJiakai Wang, Aishan Liu, Zixin Yin, Shunchang Liu, Shiyu Tang, Xianglong Liu. 8565-8574 [doi]

PoseAug: A Differentiable Pose Augmentation Framework for 3D Human Pose EstimationKehong Gong, Jianfeng Zhang, Jiashi Feng. 8575-8584 [doi]

Passive Inter-Photon ImagingAtul Ingle, Trevor Seets, Mauro Buttafava, Shantanu Gupta, Alberto Tosi, Mohit Gupta 0001, Andreas Velten. 8585-8595 [doi]

Adaptive Consistency Prior Based Deep Network for Image DenoisingChao Ren 0002, Xiaohai He, Chuncheng Wang, Zhibo Zhao. 8596-8606 [doi]

Dynamic Slimmable NetworkChanglin Li, Guangrun Wang, Bing Wang, Xiaodan Liang, Zhihui Li, Xiaojun Chang. 8607-8617 [doi]

The Neural Tangent Link Between CNN Denoisers and Non-Local FiltersJulián Tachella, Junqi Tang, Mike E. Davies. 8618-8627 [doi]

Learning Continuous Image Representation With Local Implicit Image FunctionYinbo Chen, Sifei Liu, Xiaolong Wang 0004. 8628-8638 [doi]

Image-to-Image Translation via Hierarchical Style DisentanglementXinyang Li, Shengchuan Zhang, Jie Hu 0018, Liujuan Cao, Xiaopeng Hong, Xudong Mao, Feiyue Huang, Yongjian Wu, Rongrong Ji. 8639-8648 [doi]

Dynamic Neural Radiance Fields for Monocular 4D Facial Avatar ReconstructionGuy Gafni, Justus Thies, Michael Zollhöfer, Matthias Nießner. 8649-8658 [doi]

Adversarial Robustness Under Long-Tailed DistributionTong Wu, Ziwei Liu 0002, Qingqiu Huang, Yu Wang 0002, Dahua Lin. 8659-8668 [doi]

Representative Batch Normalization With Feature CalibrationShang-hua Gao, Qi Han, Duo Li, Ming-Ming Cheng, Pai Peng. 8669-8679 [doi]

Learning to Track Instances without Video AnnotationsYang Fu, Sifei Liu, Umar Iqbal, Shalini De Mello, Humphrey Shi, Jan Kautz. 8680-8689 [doi]

Reducing Domain Gap by Reducing Style BiasHyeonseob Nam, Hyunjae Lee, Jongchan Park, Wonjun Yoon, Donggeun Yoo. 8690-8699 [doi]

Taskology: Utilizing Task Relations at ScaleYao Lu, Sören Pirk, Jan Dlabal, Anthony Brohan, Ankita Pasad, Zhao Chen, Vincent Casser, Anelia Angelova, Ariel Gordon. 8700-8709 [doi]

MOS: Towards Scaling Out-of-Distribution Detection for Large Semantic SpaceRui Huang, Yixuan Li. 8710-8719 [doi]

DCT-Mask: Discrete Cosine Transform Mask Representation for Instance SegmentationXing Shen, Jirui Yang, Chunbo Wei, Bing Deng, Jianqiang Huang, Xian-Sheng Hua 0001, Xiaoliang Cheng, Kewei Liang. 8720-8729 [doi]

Fine-Grained Angular Contrastive Learning With Coarse LabelsGuy Bukchin, Eli Schwartz, Kate Saenko, Ori Shahar, Rogério Feris, Raja Giryes, Leonid Karlinsky. 8730-8740 [doi]

End-to-End Video Instance Segmentation With TransformersYuqing Wang, Zhaoliang Xu, Xinlong Wang, Chunhua Shen, Baoshan Cheng, Hao Shen, Huaxia Xia. 8741-8750 [doi]

TAP: Text-Aware Pre-Training for Text-VQA and Text-CaptionZhengyuan Yang, Yijuan Lu, Jianfeng Wang, Xi Yin 0006, Dinei Florêncio, Lijuan Wang, Cha Zhang, Lei Zhang 0001, Jiebo Luo. 8751-8761 [doi]

Real-Time High-Resolution Background MattingShanchuan Lin, Andrey Ryabtsev, Soumyadip Sengupta, Brian L. Curless, Steven M. Seitz, Ira Kemelmacher-Shlizerman. 8762-8771 [doi]

Camouflaged Object Segmentation With Distraction MiningHaiyang Mei, Ge-Peng Ji, Ziqi Wei, Xin Yang 0011, Xiaopeng Wei, Deng-Ping Fan. 8772-8781 [doi]

Semantic Relation Reasoning for Shot-Stable Few-Shot Object DetectionChenchen Zhu, Fangyi Chen, Uzair Ahmed, Zhiqiang Shen, Marios Savvides. 8782-8791 [doi]

Beyond Bounding-Box: Convex-Hull Feature Adaptation for Oriented and Densely Packed Object DetectionZonghao Guo, Chang Liu 0042, Xiaosong Zhang, Jianbin Jiao, Xiangyang Ji, Qixiang Ye. 8792-8801 [doi]

TextOCR: Towards Large-Scale End-to-End Reasoning for Arbitrary-Shaped Scene TextAmanpreet Singh, Guan Pang, Mandy Toh, Jing Huang 0020, Wojciech Galuba, Tal Hassner. 8802-8812 [doi]

MOST: A Multi-Oriented Scene Text Detector With Localization RefinementMinghang He, Minghui Liao, Zhibo Yang, Humen Zhong, Jun Tang, Wenqing Cheng, Cong Yao, Yongpan Wang, Xiang Bai. 8813-8822 [doi]

Points As Queries: Weakly Semi-Supervised Object Detection by PointsLiangyu Chen 0002, Tong Yang, Xiangyu Zhang 0005, Wei Zhang, Jian Sun 0015. 8823-8832 [doi]

Holistic 3D Scene Understanding From a Single Image With Implicit RepresentationCheng Zhang, Zhaopeng Cui, Yinda Zhang 0001, Bing Zeng, Marc Pollefeys, Shuaicheng Liu. 8833-8842 [doi]

Shelf-Supervised Mesh Prediction in the WildYufei Ye, Shubham Tulsiani, Abhinav Gupta 0001. 8843-8852 [doi]

Mesh Saliency: An Independent Perceptual Measure or a Derivative of Image Saliency?Ran Song, Wei Zhang 0066, Yitian Zhao, Yonghuai Liu, Paul L. Rosin. 8853-8862 [doi]

MetaSets: Meta-Learning on Point Sets for Generalizable RepresentationsChao Huang, Zhangjie Cao, Yunbo Wang, Jianmin Wang 0001, Mingsheng Long. 8863-8872 [doi]

Few-Shot 3D Point Cloud Semantic SegmentationNa Zhao, Tat-Seng Chua, Gim Hee Lee. 8873-8882 [doi]

Point Cloud Instance Segmentation Using Probabilistic EmbeddingsBiao Zhang, Peter Wonka. 8883-8892 [doi]

Robust Point Cloud Registration Framework Based on Deep Graph MatchingKexue Fu, Shaolei Liu, Xiaoyuan Luo, Manning Wang. 8893-8902 [doi]

Nutrition5k: Towards Automatic Nutritional Understanding of Generic FoodQuin Thames, Arjun Karpur, Wade Norris, Fangting Xia, Liviu Panait, Tobias Weyand, Jack Sim. 8903-8911 [doi]

Differentiable Diffusion for Dense Depth Estimation From Multi-View ImagesNumair Khan, Min H. Kim 0001, James Tompkin. 8912-8921 [doi]

LoFTR: Detector-Free Local Feature Matching With TransformersJiaming Sun, Zehong Shen, Yuang Wang, Hujun Bao, Xiaowei Zhou. 8922-8931 [doi]

DI-Fusion: Online Implicit 3D Reconstruction With Deep PriorsJiahui Huang, Shi-Sheng Huang, Haoxuan Song, Shi-Min Hu 0001. 8932-8941 [doi]

SMD-Nets: Stereo Mixture Density NetworksFabio Tosi, Yiyi Liao, Carolin Schmitt, Andreas Geiger 0001. 8942-8952 [doi]

Deep Two-View Structure-From-Motion RevisitedJianyuan Wang, Yiran Zhong, Yuchao Dai, Stan Birchfield, Kaihao Zhang, Nikolai Smolyanskiy, Hongdong Li. 8953-8962 [doi]

Back-Tracing Representative Points for Voting-Based 3D Object Detection in Point CloudsBowen Cheng, Lu Sheng, Shaoshuai Shi, Ming Yang, Dong Xu 0001. 8963-8972 [doi]

GrooMeD-NMS: Grouped Mathematically Differentiable NMS for Monocular 3D Object DetectionAbhinav Kumar 0004, Garrick Brazil, Xiaoming Liu 0002. 8973-8983 [doi]

Graph-Based High-Order Relation Modeling for Long-Term Action RecognitionJiaming Zhou, Kun-Yu Lin, Haoxin Li, Wei-Shi Zheng. 8984-8993 [doi]

SGCN: Sparse Graph Convolution Network for Pedestrian Trajectory PredictionLiushuai Shi, Le Wang 0003, Chengjiang Long, Sanping Zhou, Mo Zhou, Zhenxing Niu, Gang Hua 0001. 8994-9003 [doi]

Reformulating HOI Detection As Adaptive Set PredictionMingfei Chen, Yue Liao, Si Liu 0001, Zhiyuan Chen, Fei Wang 0032, Chen Qian 0006. 9004-9013 [doi]

MagDR: Mask-Guided Detection and Reconstruction for Defending DeepfakesZhikai Chen, Lingxi Xie, Shanmin Pang, Yong He, Bo Zhang 0010. 9014-9023 [doi]

Improving the Transferability of Adversarial Samples With Adversarial TransformationsWeibin Wu, Yuxin Su, Michael R. Lyu, Irwin King. 9024-9033 [doi]

FCPose: Fully Convolutional Multi-Person Pose Estimation With Dynamic Instance-Aware ConvolutionsWeian Mao, Zhi Tian, Xinlong Wang, Chunhua Shen. 9034-9043 [doi]

DexYCB: A Benchmark for Capturing Hand Grasping of ObjectsYu-Wei Chao, Wei Yang, Yu Xiang, Pavlo Molchanov, Ankur Handa, Jonathan Tremblay, Yashraj S. Narang, Karl Van Wyk, Umar Iqbal, Stan Birchfield, Jan Kautz, Dieter Fox. 9044-9053 [doi]

Neural Body: Implicit Neural Representations With Structured Latent Codes for Novel View Synthesis of Dynamic HumansSida Peng, Yuanqing Zhang, Yinghao Xu, Qianqian Wang, Qing Shuai, Hujun Bao, Xiaowei Zhou. 9054-9063 [doi]

PCLs: Geometry-Aware Neural Reconstruction of 3D Pose With Perspective Crop LayersFrank Yu, Mathieu Salzmann, Pascal Fua, Helge Rhodin. 9064-9073 [doi]

Affective Processes: Stochastic Modelling of Temporal Context for Emotion and Facial Expression RecognitionEnrique Sanchez, Mani Kumar Tellamekala, Michel F. Valstar, Georgios Tzimiropoulos. 9074-9084 [doi]

Structure-Aware Face Clustering on a Large-Scale Graph With 107 NodesShuai Shen, Wanhua Li 0001, Zheng Zhu, Guan Huang, Dalong Du, Jiwen Lu, Jie Zhou 0001. 9085-9094 [doi]

Cross-View Gait Recognition With Deep Universal Linear EmbeddingsShaoxiong Zhang, Yunhong Wang, Annan Li. 9095-9104 [doi]

Partial Person Re-Identification With Part-Part Correspondence LearningTianyu He, Xu Shen, Jianqiang Huang, Zhibo Chen 0001, Xian-Sheng Hua 0001. 9105-9115 [doi]

Mask-ToF: Learning Microlens Masks for Flying Pixel Correction in Time-of-Flight ImagingIlya Chugunov, Seung-Hwan Baek, Qiang Fu 0002, Wolfgang Heidrich, Felix Heide. 9116-9126 [doi]

Effective Snapshot Compressive-Spectral Imaging via Deep Denoising and Total Variation PriorsHaiquan Qiu, Yao Wang 0003, Deyu Meng. 9127-9136 [doi]

Test-Time Fast Adaptation for Dynamic Scene Deblurring via Meta-Auxiliary LearningZhixiang Chi, Yang Wang, Yuanhao Yu, Jin Tang. 9137-9146 [doi]

Removing Raindrops and Rain Streaks in One GoRuijie Quan, Xin Yu 0002, Yuanzhi Liang, Yi Yang 0001. 9147-9156 [doi]

Learning Multi-Scale Photo Exposure CorrectionMahmoud Afifi, Konstantinos G. Derpanis, Björn Ommer, Michael S. Brown. 9157-9167 [doi]

Towards Real-World Blind Face Restoration With Generative Facial PriorXintao Wang, Yu Li, Honglun Zhang, Ying Shan. 9168-9178 [doi]

Image Restoration for Under-Display CameraYuQian Zhou, David Ren, Neil Emerton, Sehoon Lim, Timothy A. Large. 9179-9188 [doi]

LAU-Net: Latitude Adaptive Upscaling Network for Omnidirectional Image Super-ResolutionXin Deng 0002, Hao Wang, Mai Xu, Yichen Guo, Yuhang Song 0001, Li Yang. 9189-9198 [doi]

Interpreting Super-Resolution Networks With Local Attribution MapsJinjin Gu, Chao Dong. 9199-9208 [doi]

Deep Burst Super-ResolutionGoutam Bhat, Martin Danelljan, Luc Van Gool, Radu Timofte. 9209-9218 [doi]

Towards Rolling Shutter Correction and Deblurring in Dynamic ScenesZhihang Zhong, Yinqiang Zheng, Imari Sato. 9219-9228 [doi]

Towards Fast and Accurate Real-World Depth Super-Resolution: Benchmark Dataset and BaselineLingzhi He, Hongguang Zhu, Feng Li, Huihui Bai, Runmin Cong, Chunjie Zhang, Chunyu Lin, Meiqin Liu, Yao Zhao 0001. 9229-9238 [doi]

Learning To Restore Hazy Video: A New Real-World Dataset and a New MethodXinyi Zhang, Hang Dong 0001, Jinshan Pan, Chao Zhu, Ying Tai, Chengjie Wang, Jilin Li, Feiyue Huang, Fei Wang 0008. 9239-9248 [doi]

Gradient Forward-Propagation for Large-Scale Temporal Video ModellingMateusz Malinowski, Dimitrios Vytiniotis, Grzegorz Swirszcz, Viorica Patraucean, João Carreira. 9249-9259 [doi]

Complementary Relation Contrastive DistillationJinguo Zhu, Shixiang Tang, Dapeng Chen, Shijie Yu, Yakun Liu, Mingzhe Rong, Aijun Yang, Xiaohua Wang. 9260-9269 [doi]

Network Pruning via Performance MaximizationShangqian Gao, Feihu Huang, Weidong Cai 0001, Heng Huang. 9270-9280 [doi]

Distribution-Aware Adaptive Multi-Bit QuantizationSijie Zhao, Tao Yue, Xuemei Hu. 9281-9290 [doi]

The Affective Growth of Computer VisionNorman Makoto Su, David J. Crandall. 9291-9300 [doi]

Fair Attribute Classification Through Latent Space De-BiasingVikram V. Ramaswamy, Sunnie S. Y. Kim, Olga Russakovsky. 9301-9310 [doi]

Soteria: Provable Defense Against Privacy Leakage in Federated Learning From Representation PerspectiveJingwei Sun, Ang Li 0005, Binghui Wang, Huanrui Yang, Hai Li 0001, Yiran Chen. 9311-9319 [doi]

Deep Compositional Metric LearningWenzhao Zheng, Chengkun Wang, Jiwen Lu, Jie Zhou 0001. 9320-9329 [doi]

Physically-Aware Generative Network for 3D Shape ModelingMariem Mezghanni, Malika Boulkenafed, André Lieutier, Maks Ovsjanikov. 9330-9341 [doi]

Semantic Palette: Guiding Scene Generation With Class ProportionsGuillaume Le Moing, Tuan-Hung Vu, Himalaya Jain, Patrick Pérez, Matthieu Cord. 9342-9350 [doi]

Linear Semantics in Generative Adversarial NetworksJianjin Xu, Changxi Zheng. 9351-9360 [doi]

Region-Aware Adaptive Instance Normalization for Image HarmonizationJun Ling, Han Xue, Li Song 0001, Rong Xie, Xiao Gu 0001. 9361-9370 [doi]

PD-GAN: Probabilistic Diverse GAN for Image InpaintingHongyu Liu, Ziyu Wan, Wei Huang, Yibing Song, Xintong Han, Jing Liao 0001. 9371-9381 [doi]

In the Light of Feature Distributions: Moment Matching for Neural Style TransferNikolai Kalischek, Jan D. Wegner, Konrad Schindler. 9382-9391 [doi]

High-Resolution Photorealistic Image Translation in Real-Time: A Laplacian Pyramid Translation NetworkJie Liang, Hui Zeng, Lei Zhang 0006. 9392-9400 [doi]

Synthesizing Long-Term 3D Human Motion and Interaction in 3D ScenesJiashun Wang, Huazhe Xu, Jingwei Xu, Sifei Liu, Xiaolong Wang 0004. 9401-9411 [doi]

A Sliced Wasserstein Loss for Neural Texture SynthesisEric Heitz, Kenneth Vanhoey, Thomas Chambon, Laurent Belcour. 9412-9420 [doi]

Space-Time Neural Irradiance Fields for Free-Viewpoint VideoWenqi Xian, Jia-Bin Huang, Johannes Kopf, Changil Kim 0001. 9421-9431 [doi]

Rethinking Class Relations: Absolute-Relative Supervised and Unsupervised Few-Shot LearningHongguang Zhang, Piotr Koniusz, Songlei Jian, Hongdong Li, Philip H. S. Torr. 9432-9441 [doi]

Joint Negative and Positive Learning for Noisy LabelsYoungdong Kim, Juseung Yun, Hyounguk Shon, Junmo Kim. 9442-9451 [doi]

Out-of-Distribution Detection Using Union of 1-Dimensional SubspacesAlireza Zaeemzadeh, Niccoló Bisagno, Zeno Sambugaro, Nicola Conci, Nazanin Rahnavard, Mubarak Shah. 9452-9461 [doi]

OpenMix: Reviving Known Knowledge for Discovering Novel Visual Categories in an Open WorldZhun Zhong, Linchao Zhu, Zhiming Luo, Shaozi Li, Yi Yang 0001, Nicu Sebe. 9462-9470 [doi]

Calibrated RGB-D Salient Object DetectionWei Ji, Jingjing Li, Shuang Yu, Miao Zhang, Yongri Piao, Shunyu Yao, Qi Bi, Kai Ma 0002, Yefeng Zheng, Huchuan Lu, Li Cheng 0001. 9471-9481 [doi]

Permuted AdaIN: Reducing the Bias Towards Global Statistics in Image ClassificationOren Nuriel, Sagie Benaim, Lior Wolf. 9482-9491 [doi]

Binary Graph Neural NetworksMehdi Bahri, Gaétan Bahl, Stefanos Zafeiriou. 9492-9501 [doi]

Contrastive Neural Architecture Search With Neural Architecture ComparatorsYaofo Chen, Yong Guo, Qi Chen, Minli Li, Wei Zeng, Yaowei Wang, Mingkui Tan. 9502-9511 [doi]

Group Whitening: Balancing Learning Efficiency and Representational CapacityLei Huang 0015, Yi Zhou 0007, Li Liu 0004, Fan Zhu 0001, Ling Shao 0001. 9512-9521 [doi]

Towards Unified Surgical Skill AssessmentDaochang Liu, Qiyue Li, Tingting Jiang, Yizhou Wang 0001, Rulin Miao, Fei Shan, Ziyu Li. 9522-9531 [doi]

Every Annotation Counts: Multi-Label Deep Supervision for Medical Image SegmentationSimon Reiß, Constantin Seibold, Alexander Freytag, Erik Rodner, Rainer Stiefelhagen. 9532-9542 [doi]

Graph Attention TrackingDongyan Guo, Yanyan Shao, Ying Cui, Zhenhua Wang 0003, Liyan Zhang, Chunhua Shen. 9543-9552 [doi]

Discriminative Appearance Modeling With Multi-Track Pooling for Real-Time Multi-Object TrackingChanho Kim, Fuxin Li, Mazen Alotaibi, James M. Rehg. 9553-9562 [doi]

Scale-Aware Automatic Augmentation for Object DetectionYukang Chen, Yanwei Li, Tao Kong, Lu Qi, Ruihang Chu, Lei Li, Jiaya Jia. 9563-9572 [doi]

Sequential Graph Convolutional Network for Active LearningRazvan Caramalau, Binod Bhattarai, Tae-Kyun Kim. 9583-9592 [doi]

CausalVAE: Disentangled Representation Learning via Neural Structural Causal ModelsMengyue Yang, Furui Liu, Zhitang Chen, Xinwei Shen, Jianye Hao, Jun Wang. 9593-9602 [doi]

Domain-Specific Suppression for Adaptive Object DetectionYu Wang, Rui Zhang, Shuo Zhang, Miao Li, Yangyang Xia, Xishan Zhang, Shaoli Liu. 9603-9612 [doi]

Uncertainty Reduction for Model Adaptation in Semantic SegmentationPrabhu Teja Sivaprasad, François Fleuret. 9613-9623 [doi]

Open Domain Generalization with Domain-Augmented Meta-LearningYang Shu, Zhangjie Cao, Chenyu Wang, Jianmin Wang 0001, Mingsheng Long. 9624-9633 [doi]

Layerwise Optimization by Gradient Decomposition for Continual LearningShixiang Tang, Dapeng Chen, Jinguo Zhu, Shijie Yu, Wanli Ouyang. 9634-9643 [doi]

SLADE: A Self-Training Framework for Distance Metric LearningJiali Duan, Yen-Liang Lin, Son Dinh Tran, Larry S. Davis, C. C. Jay Kuo. 9644-9653 [doi]

DualGraph: A Graph-Based Method for Reasoning About Label NoiseHaiyang Zhang, XiMing Xing, Liang Liu 0001. 9654-9663 [doi]

CutPaste: Self-Supervised Learning for Anomaly Detection and LocalizationChun-Liang Li, Kihyuk Sohn, Jinsung Yoon, Tomas Pfister. 9664-9674 [doi]

Self-Supervised Visibility Learning for Novel View SynthesisYujiao Shi, Hongdong Li, Xin Yu 0002. 9675-9684 [doi]

Boosting Monocular Depth Estimation Models to High-Resolution via Content-Adaptive Multi-Resolution MergingS. Mahdi H. Miangoleh, Sebastian Dille, Long Mai, Sylvain Paris, Yagiz Aksoy. 9685-9694 [doi]

Seesaw Loss for Long-Tailed Instance SegmentationJiaqi Wang, Wenwei Zhang, Yuhang Zang, Yuhang Cao, Jiangmiao Pang, Tao Gong, Kai Chen, Ziwei Liu, Chen Change Loy, Dahua Lin. 9695-9704 [doi]

Exploiting Edge-Oriented Reasoning for 3D Point-Based Scene Graph AnalysisChaoyi Zhang, Jianhui Yu, Yang Song 0001, Weidong Cai 0001. 9705-9715 [doi]

Rethinking BiSeNet for Real-Time Semantic SegmentationMingyuan Fan, Shenqi Lai, Junshi Huang, Xiaoming Wei, Zhenhua Chai, Junfeng Luo, Xiaolin Wei. 9716-9725 [doi]

Exploit Visual Dependency Relations for Semantic SegmentationMingyuan Liu, Dan Schonfeld, Wei Tang. 9726-9735 [doi]

Abstract Spatial-Temporal Reasoning via Probabilistic Abduction and ExecutionChi Zhang 0017, Baoxiong Jia, Song Chun Zhu, Yixin Zhu. 9736-9746 [doi]

Anti-Aliasing Semantic Reconstruction for Few-Shot Semantic SegmentationBinghao Liu, Yao Ding 0006, Jianbin Jiao, Xiangyang Ji, Qixiang Ye. 9747-9756 [doi]

Domain Consensus Clustering for Universal Domain AdaptationGuangrui Li 0005, Guoliang Kang, Yi Zhu, Yunchao Wei, Yi Yang 0001. 9757-9766 [doi]

Progressive Stage-Wise Learning for Unsupervised Feature Representation EnhancementZefan Li, Chenxi Liu, Alan L. Yuille, Bingbing Ni, Wenjun Zhang 0001, Wen Gao 0001. 9767-9776 [doi]

NExT-QA: Next Phase of Question-Answering to Explaining Temporal ActionsJunbin Xiao, Xindi Shang, Angela Yao, Tat-Seng Chua. 9777-9786 [doi]

Spatio-temporal Contrastive Domain Adaptation for Action RecognitionXiaolin Song, Sicheng Zhao, Jingyu Yang 0002, Huanjing Yue, Pengfei Xu 0013, Runbo Hu, Hua Chai. 9787-9795 [doi]

Shot Contrastive Self-Supervised Learning for Scene Boundary DetectionShixing Chen, Xiaohan Nie, David Fan, DongQing Zhang, Vimal Bhat, Raffay Hamid. 9796-9805 [doi]

Anchor-Constrained Viterbi for Set-Supervised Action SegmentationJun Li, Sinisa Todorovic. 9806-9815 [doi]

SG-Net: Spatial Granularity Network for One-Stage Video Instance SegmentationDongfang Liu, Yiming Cui, Wenbo Tan, Yingjie Victor Chen. 9816-9825 [doi]

Thinking Fast and Slow: Efficient Text-to-Visual Retrieval With TransformersAntoine Miech, Jean-Baptiste Alayrac, Ivan Laptev, Josef Sivic, Andrew Zisserman. 9826-9836 [doi]

Open-Book Video Captioning With Retrieve-Copy-Generate NetworkZiqi Zhang, Zhongang Qi, Chunfeng Yuan, Ying Shan, Bing Li 0001, Ying Deng, Weiming Hu. 9837-9846 [doi]

Causal Attention for Vision-Language TasksXu Yang, Hanwang Zhang, Guojun Qi, Jianfei Cai 0001. 9847-9857 [doi]

Locate Then Segment: A Strong Pipeline for Referring Image SegmentationYa Jing, Tao Kong, Wei Wang 0115, Liang Wang 0001, Lei Li, Tieniu Tan. 9858-9867 [doi]

Pushing It Out of the Way: Interactive Visual NavigationKuo-Hao Zeng, Luca Weihs, Ali Farhadi, Roozbeh Mottaghi. 9868-9877 [doi]

SUTD-TrafficQA: A Question Answering Benchmark and an Efficient Network for Video Reasoning Over Traffic EventsLi Xu, He Huang, Jun Liu. 9878-9888 [doi]

User-Guided Line Art Flat Filling With Split Filling MechanismLvmin Zhang, Chengze Li, Edgar Simo-Serra, Yi Ji 0001, Tien-Tsin Wong, Chunping Liu. 9889-9898 [doi]

CT-Net: Complementary Transfering Network for Garment Transfer With Arbitrary Geometric ChangesFan Yang, Guosheng Lin. 9899-9908 [doi]

AdvSim: Generating Safety-Critical Scenarios for Self-Driving VehiclesJingkang Wang, Ava Pun, James Tu, Sivabalan Manivasagam, Abbas Sadat, Sergio Casas 0002, Mengye Ren, Raquel Urtasun. 9909-9918 [doi]

AIFit: Automatic 3D Human-Interpretable Feedback Models for Fitness TrainingMihai Fieraru, Mihai Zanfir, Silviu Cristian Pirlea, Vlad Olaru, Cristian Sminchisescu. 9919-9928 [doi]

Informative and Consistent Correspondence Mining for Cross-Domain Weakly Supervised Object DetectionLuwei Hou, Yu Zhang, Kui Fu, Jia Li. 9929-9938 [doi]

Cylindrical and Asymmetrical 3D Convolution Networks for LiDAR SegmentationXinge Zhu, Hui Zhou 0005, Tai Wang, Fangzhou Hong, Yuexin Ma, Wei Li 0095, Hongsheng Li 0001, Dahua Lin. 9939-9948 [doi]

Neural Splines: Fitting 3D Surfaces With Infinitely-Wide Neural NetworksFrancis Williams, Matthew Trager, Joan Bruna, Denis Zorin. 9949-9958 [doi]

Learning Neural Representation of Camera Pose with Matrix Representation of Pose Shift via View SynthesisYaxuan Zhu, RuiQi Gao, Siyuan Huang, Song Chun Zhu, Ying Nian Wu. 9959-9968 [doi]

Action Unit Memory Network for Weakly Supervised Temporal Action LocalizationWang Luo, Tianzhu Zhang, Wenfei Yang, Jingen Liu, Tao Mei 0001, Feng Wu 0001, Yongdong Zhang 0001. 9969-9979 [doi]

Weakly-Supervised Physically Unconstrained Gaze EstimationRakshit Kothari, Shalini De Mello, Umar Iqbal, Wonmin Byeon, Seonwook Park, Jan Kautz. 9980-9989 [doi]

On Self-Contact and Human PoseLea Müller, Ahmed A. A. Osman, Siyu Tang, Chun-Hao P. Huang, Michael J. Black. 9990-9999 [doi]

Seeing in Extra Darkness Using a Deep-Red FlashJinhui Xiong, Jian Wang, Wolfgang Heidrich, Shree K. Nayar. 10000-10009 [doi]

Light Field Super-Resolution With Zero-Shot LearningZhen Cheng, Zhiwei Xiong, Chang Chen, Dong Liu 0002, Zheng-Jun Zha. 10010-10019 [doi]

Neural Cellular Automata ManifoldAlejandro Hernandez Ruiz, Armand Vilalta, Francesc Moreno-Noguer. 10020-10028 [doi]

Convolutional Dynamic Alignment Networks for Interpretable ClassificationsMoritz Böhle, Mario Fritz, Bernt Schiele. 10029-10038 [doi]

One-Shot Free-View Neural Talking-Head Synthesis for Video ConferencingTing-chun Wang, Arun Mallya, Ming-Yu Liu 0001. 10039-10049 [doi]

Stay Positive: Non-Negative Image Synthesis for Augmented RealityKatie Luo, Guandao Yang, Wenqi Xian, Harald Haraldsson, Bharath Hariharan, Serge J. Belongie. 10050-10060 [doi]

Playable Video GenerationWilli Menapace, Stéphane Lathuilière, Sergey Tulyakov, Aliaksandr Siarohin, Elisa Ricci 0001. 10061-10070 [doi]

Uncertainty-Aware Joint Salient Object and Camouflaged Object DetectionAixuan Li, Jing Zhang 0052, Yunqiu Lv, Bowen Liu, Tong Zhang 0023, Yuchao Dai. 10071-10081 [doi]

Discovering Hidden Physics Behind Transport DynamicsPeirong Liu, Lin Tian, Yubo Zhang, Stephen R. Aylward, Yueh Z. Lee, Marc Niethammer. 10082-10092 [doi]

AutoFlow: Learning a Better Training Set for Optical FlowDeqing Sun, Daniel Vlasic, Charles Herrmann, Varun Jampani, Michael Krainin, Huiwen Chang, Ramin Zabih, William T. Freeman, Ce Liu. 10093-10102 [doi]

Unsupervised Multi-Source Domain Adaptation Without Access to Source DataSk Miraj Ahmed, Dripta S. Raychaudhuri, Sujoy Paul, Samet Oymak, Amit K. Roy Chowdhury. 10103-10112 [doi]

A Second-Order Approach to Learning With Instance-Dependent Label NoiseZhaowei Zhu, Tongliang Liu, Yang Liu 0018. 10113-10123 [doi]

Post-Hoc Uncertainty Calibration for Domain Drift ScenariosChristian Tomani, Sebastian Gruber, Muhammed Ebrar Erdem, Daniel Cremers, Florian Buettner. 10124-10132 [doi]

Cross-View Regularization for Domain Adaptive Panoptic SegmentationJiaxing Huang 0001, Dayan Guan, Aoran Xiao, Shijian Lu. 10133-10144 [doi]

DatasetGAN: Efficient Labeled Data Factory With Minimal Human EffortYuxuan Zhang, Huan Ling, Jun Gao, Kangxue Yin, Jean-Francois Lafleche, Adela Barriuso, Antonio Torralba 0001, Sanja Fidler. 10145-10155 [doi]

Learning To Segment Actions From Visual and Language Instructions via Differentiable Weak Sequence AlignmentYuhan Shen, Lu Wang, Ehsan Elhamifar. 10156-10165 [doi]

SIPSA-Net: Shift-Invariant Pan Sharpening With Moving Object Alignment for Satellite ImageryJaehyup Lee, Soomin Seo, Munchurl Kim. 10166-10174 [doi]

Joint-DetNAS: Upgrade Your Detector With NAS, Pruning and Dynamic DistillationLewei Yao, Renjie Pi, Hang Xu, Wei Zhang, Zhenguo Li, Tong Zhang. 10175-10184 [doi]

Dense Relation Distillation With Context-Aware Aggregation for Few-Shot Object DetectionHanzhe Hu, Shuai Bai, Aoxue Li, Jinshi Cui, Liwei Wang. 10185-10194 [doi]

OPANAS: One-Shot Path Aggregation Network Architecture Search for Object DetectionTingting Liang, Yongtao Wang, Zhi Tang, Guosheng Hu, Haibin Ling. 10195-10203 [doi]

Pedestrian and Ego-Vehicle Trajectory Prediction From Monocular CameraLukás Neumann, Andrea Vedaldi. 10204-10212 [doi]

DetectoRS: Detecting Objects With Recursive Feature Pyramid and Switchable Atrous ConvolutionSiyuan Qiao, Liang-Chieh Chen, Alan L. Yuille. 10213-10224 [doi]

Weakly-Supervised Instance Segmentation via Class-Agnostic Learning With Salient ImagesXinggang Wang, Jiapei Feng, Bin Hu, Qi Ding, Longjin Ran, Xiaoxin Chen, Wenyu Liu 0001. 10225-10235 [doi]

3DCaricShop: A Dataset and a Baseline Method for Single-View 3D Caricature Face ReconstructionYuda Qiu, Xiaojie Xu, Lingteng Qiu, Yan Pan, Yushuang Wu, Weikai Chen, Xiaoguang Han. 10236-10245 [doi]

D2IM-Net: Learning Detail Disentangled Implicit Fields From Single ImagesManyi Li, Hao Zhang 0002. 10246-10255 [doi]

Sign-Agnostic Implicit Learning of Surface Self-Similarities for Shape Modeling and Reconstruction From Raw Point CloudsWenbin Zhao, Jiabao Lei, Yuxin Wen, Jianguo Zhang, Kui Jia. 10256-10265 [doi]

Learning Progressive Point Embeddings for 3D Point Cloud GenerationCheng Wen, Baosheng Yu, Dacheng Tao. 10266-10275 [doi]

Learning Fine-Grained Segmentation of 3D Shapes Without Part LabelsXiaogang Wang 0005, Xun Sun, Xinyu Cao, Kai Xu 0004, Bin Zhou. 10276-10285 [doi]

Deformed Implicit Field: Modeling 3D Shapes With Learned Dense CorrespondenceYu Deng, Jiaolong Yang, Xin Tong 0001. 10286-10296 [doi]

Recurrent Multi-View Alignment Network for Unsupervised Surface RegistrationWanquan Feng, Juyong Zhang, Hongrui Cai, Haofei Xu, Junhui Hou, Hujun Bao. 10297-10307 [doi]

DeepLM: Large-Scale Nonlinear Least Squares on Deep Learning Frameworks Using Stochastic Domain DecompositionJingwei Huang, Shan Huang, Mingwei Sun. 10308-10317 [doi]

D-NeRF: Neural Radiance Fields for Dynamic ScenesAlbert Pumarola, Enric Corona, Gerard Pons-Moll, Francesc Moreno-Noguer. 10318-10327 [doi]

AdaStereo: A Simple and Efficient Approach for Adaptive Stereo MatchingXiao Song, Guorun Yang, Xinge Zhu, Hui Zhou 0005, Zhe Wang 0006, Jianping Shi. 10328-10337 [doi]

Tangent Space Backpropagation for 3D Transformation GroupsZachary Teed, Jia Deng 0001. 10338-10347 [doi]

Unsupervised Learning for Robust Fitting: A Reinforcement Learning ApproachGiang Truong, Huu Le, David Suter, Erchuan Zhang, Syed Zulqarnain Gilani. 10348-10357 [doi]

Hybrid Rotation Averaging: A Fast and Robust Rotation Averaging ApproachYu Chen, Ji Zhao 0001, Laurent Kneip. 10358-10367 [doi]

ST3D: Self-Training for Unsupervised Domain Adaptation on 3D Object DetectionJihan Yang, Shaoshuai Shi, Zhe Wang 0006, Hongsheng Li 0001, Xiaojuan Qi. 10368-10378 [doi]

MonoRUn: Monocular 3D Object Detection by Reconstruction and Uncertainty PropagationHansheng Chen, Yuyao Huang, Wei Tian 0001, Zhong Gao, Lu Xiong. 10379-10388 [doi]

Semi-Supervised Action Recognition With Temporal Contrastive LearningAnkit Singh, Omprakash Chakraborty, Ashutosh Varshney, Rameswar Panda, Rogério Feris, Kate Saenko, Abir Das. 10389-10399 [doi]

TrafficSim: Learning To Simulate Realistic Multi-Agent BehaviorsSimon Suo, Sebastian Regalado, Sergio Casas 0002, Raquel Urtasun. 10400-10409 [doi]

QPIC: Query-Based Pairwise Human-Object Interaction Detection With Image-Wide Contextual InformationMasato Tamura, Hiroki Ohashi, Tomoaki Yoshinaga. 10410-10419 [doi]

Class-Aware Robust Adversarial Training for Object DetectionPin-Chun Chen, Bo-Han Kung, Jun-Cheng Chen. 10420-10429 [doi]

SurFree: A Fast Surrogate-Free Black-Box AttackThibault Maho, Teddy Furon, Erwan Le Merrer. 10430-10439 [doi]

Lite-HRNet: A Lightweight High-Resolution NetworkChangqian Yu, Bin Xiao, Changxin Gao, Lu Yuan, Lei Zhang 0001, Nong Sang, Jingdong Wang 0001. 10440-10450 [doi]

Model-Based 3D Hand Reconstruction via Self-Supervised LearningYujin Chen, Zhigang Tu 0001, Di Kang, Linchao Bao, Ying Zhang, Xuefei Zhe, Ruizhi Chen, Junsong Yuan. 10451-10460 [doi]

LEAP: Learning Articulated Occupancy of PeopleMarko Mihajlovic, Yan Zhang 0054, Michael J. Black, Siyu Tang. 10461-10471 [doi]

Bilevel Online Adaptation for Out-of-Domain Human Mesh ReconstructionShanyan Guan, Jingwei Xu, Yunbo Wang, Bingbing Ni, Xiaokang Yang. 10472-10481 [doi]

Exploiting Semantic Embedding and Visual Feature for Facial Action Unit DetectionHuiyuan Yang, Lijun Yin, Yi Zhou, Jiuxiang Gu. 10482-10491 [doi]

WebFace260M: A Benchmark Unveiling the Power of Million-Scale Deep Face RecognitionZheng Zhu, Guan Huang, Jiankang deng, Yun Ye, Junjie Huang 0005, Xinze Chen, Jiagang Zhu, Tian Yang, Jiwen Lu, Dalong Du, Jie Zhou 0001. 10492-10502 [doi]

PML: Progressive Margin Loss for Long-Tailed Age ClassificationZongyong Deng, Hao Liu 0019, Yaoxing Wang, Chenyang Wang, Zekuan Yu, Xuehong Sun. 10503-10512 [doi]

Fine-Grained Shape-Appearance Mutual Learning for Cloth-Changing Person Re-IdentificationPeixian Hong, Tao Wu, Ancong Wu, Xintong Han, Wei-Shi Zheng. 10513-10522 [doi]

Physics-Based Iterative Projection Complex Neural Network for Phase Retrieval in Lensless Microscopy ImagingFeilong Zhang, Xianming Liu, Cheng Guo, Shiyi Lin, Junjun Jiang, Xiangyang Ji. 10523-10531 [doi]

Asymmetric Gained Deep Image Compression With Continuous Rate AdaptationZe Cui, Jing Wang, Shangyin Gao, Tiansheng Guo, Yihui Feng, Bo Bai. 10532-10541 [doi]

Learning a Non-Blind Deblurring Network for Night Blurry ImagesLiang Chen, Jiawei Zhang 0002, Jinshan Pan, Songnan Lin, Faming Fang, Jimmy S. Ren. 10542-10550 [doi]

Contrastive Learning for Compact Single Image DehazingHaiyan Wu, Yanyun Qu, Shaohui Lin, Jian Zhou, Ruizhi Qiao, Zhizhong Zhang, Yuan Xie 0006, Lizhuang Ma. 10551-10560 [doi]

Retinex-Inspired Unrolling With Cooperative Prior Architecture Search for Low-Light Image EnhancementRisheng Liu, Long Ma 0002, Jiaao Zhang, Xin Fan 0001, Zhongxuan Luo. 10561-10570 [doi]

Auto-Exposure Fusion for Single-Image Shadow RemovalLan Fu, Changqing Zhou, Qing Guo 0005, Felix Juefei-Xu, Hongkai Yu, Wei Feng 0005, Yang Liu 0003, Song Wang 0002. 10571-10580 [doi]

Unsupervised Degradation Representation Learning for Blind Super-ResolutionLongguang Wang, Yingqian Wang, Xiaoyu Dong, Qingyu Xu, Jungang Yang 0001, Wei An, Yulan Guo. 10581-10590 [doi]

Lighting, Reflectance and Geometry Estimation From 360deg Panoramic StereoJunxuan Li, Hongdong Li, Yasuyuki Matsushita. 10591-10600 [doi]

Flow-Based Kernel Prior With Application to Blind Super-ResolutionJingyun Liang, Kai Zhang 0008, Shuhang Gu, Luc Van Gool, Radu Timofte. 10601-10610 [doi]

KOALAnet: Blind Super-Resolution Using Kernel-Oriented Adaptive Local AdjustmentSoo Ye Kim, Hyeonjun Sim, Munchurl Kim. 10611-10620 [doi]

3D Video Stabilization With Depth Estimation by CNN-Based OptimizationYao-Chih Lee, Kuan-Wei Tseng, Yu-Ta Chen, Chien-Cheng Chen, Chu-Song Chen, Yi-Ping Hung. 10621-10630 [doi]

iMiGUE: An Identity-Free Video Dataset for Micro-Gesture Understanding and Emotion AnalysisXin Liu 0012, Henglin Shi, Haoyu Chen, Zitong Yu, Xiaobai Li, Guoying Zhao. 10631-10642 [doi]

ACRE: Abstract Causal REasoning Beyond CovariationChi Zhang 0017, Baoxiong Jia, Mark Edmonds, Song Chun Zhu, Yixin Zhu. 10643-10653 [doi]

Enhance Curvature Information by Structured Stochastic Quasi-Newton MethodsMinghan Yang, Dong Xu, Hongyu Chen, Zaiwen Wen, Mengyun Chen. 10654-10663 [doi]

Refine Myself by Teaching Myself: Feature Refinement via Self-Knowledge DistillationMingi Ji, SeungJae Shin, Seunghyun Hwang, Gibeom Park, Il-Chul Moon. 10664-10673 [doi]

Towards Efficient Tensor Decomposition-Based DNN Model Compression With Optimization FrameworkMiao Yin, Yang Sui, Siyu Liao, Bo Yuan 0001. 10674-10683 [doi]

QPP: Real-Time Quantization Parameter Prediction for Deep Neural NetworksVladimir Kryzhanovskiy, Gleb Balitskiy, Nikolay Kozyrskiy, Aleksandr Zuruev. 10684-10692 [doi]

Explaining Classifiers Using Adversarial Perturbations on the Perceptual BallAndrew Elliott, Stephen Law, Chris Russell 0001. 10693-10702 [doi]

Verifiability and Predictability: Interpreting Utilities of Network Architectures for Point Cloud ProcessingWen Shen 0002, Zhihua Wei, Shikun Huang, Binbin Zhang, Panyue Chen, Ping Zhao, Quanshi Zhang. 10703-10712 [doi]

Model-Contrastive Federated LearningQinbin Li, Bingsheng He, Dawn Song. 10713-10722 [doi]

Compatibility-Aware Heterogeneous Visual SearchRahul Duggal, Hao Zhou, Shuo Yang, Yuanjun Xiong, Wei Xia, Zhuowen Tu, Stefano Soatto. 10723-10732 [doi]

Plan2Scene: Converting Floorplans to 3D ScenesMadhawa Vidanapathirana, Qirui Wu, Yasutaka Furukawa, Angel X. Chang, Manolis Savva. 10733-10742 [doi]

Few-Shot Image Generation via Cross-Domain CorrespondenceUtkarsh Ojha, Yijun Li, Jingwan Lu, Alexei A. Efros, Yong Jae Lee, Eli Shechtman, Richard Zhang 0001. 10743-10752 [doi]

Adversarial Generation of Continuous ImagesIvan Skorokhodov, Savva Ignatyev, Mohamed Elhoseiny. 10753-10764 [doi]

DeFLOCNet: Deep Image Editing via Flexible Low-Level ControlsHongyu Liu, Ziyu Wan, Wei Huang, Yibing Song, Xintong Han, Jing Liao 0001, Bin Jiang 0006, Wei Liu 0005. 10765-10774 [doi]

Generating Diverse Structure for Image Inpainting With Hierarchical VQ-VAEJialun Peng, Dong Liu 0002, Songcen Xu, Houqiang Li. 10775-10784 [doi]

Smoothing the Disentangled Latent Style Space for Unsupervised Image-to-Image TranslationYahui Liu, Enver Sangineto, Yajing Chen, Linchao Bao, Haoxian Zhang, Nicu Sebe, Bruno Lepri, Wei Wang 0108, Marco De Nadai. 10785-10794 [doi]

Flow Guided Transformable Bottleneck Networks for Motion RetargetingJian Ren, Menglei Chai, Oliver J. Woodford, Kyle Olszewski, Sergey Tulyakov. 10795-10805 [doi]

Learning Semantic Person Image Generation by Region-Adaptive NormalizationZhengyao Lv, Xiaoming Li, Xin Li, Fu Li, Tianwei Lin, Dongliang He, Wangmeng Zuo. 10806-10815 [doi]

Large-Capacity Image Steganography Based on Invertible Neural NetworksShao-Ping Lu, Rong Wang, Tao Zhong, Paul L. Rosin. 10816-10825 [doi]

Self-Supervised Video GANs: Learning for Appearance Consistency and Motion CoherencySangeek Hyun, Jihwan Kim, Jae-Pil Heo. 10826-10835 [doi]

Exploring Complementary Strengths of Invariant and Equivariant Representations for Few-Shot LearningMamshad Nayeem Rizve, Salman H. Khan 0001, Fahad Shahbaz Khan, Mubarak Shah. 10836-10846 [doi]

Clusformer: A Transformer Based Clustering Approach to Unsupervised Large-Scale Face and Visual Landmark RecognitionXuan-Bac Nguyen, Duc Toan Bui, Chi Nhan Duong, Tien D. Bui, Khoa Luu. 10847-10856 [doi]

CReST: A Class-Rebalancing Self-Training Framework for Imbalanced Semi-Supervised LearningChen Wei, Kihyuk Sohn, Clayton Mellina, Alan L. Yuille, Fan Yang. 10857-10866 [doi]

Neighborhood Contrastive Learning for Novel Class DiscoveryZhun Zhong, Enrico Fini, Subhankar Roy, Zhiming Luo, Elisa Ricci 0001, Nicu Sebe. 10867-10875 [doi]

Predicting Human Scanpaths in Visual Question AnsweringXianyu Chen, Ming Jiang, Qi Zhao. 10876-10885 [doi]

Diverse Branch Block: Building a Convolution as an Inception-Like UnitXiaohan Ding, Xiangyu Zhang 0005, Jungong Han, Guiguang Ding. 10886-10895 [doi]

HourNAS: Extremely Fast Neural Architecture Search Through an Hourglass LensZhaohui Yang, Yunhe Wang 0001, Xinghao Chen 0001, Jianyuan Guo, Wei Zhang, Chao Xu 0006, Chunjing Xu, Dacheng Tao, Chang Xu 0002. 10896-10906 [doi]

Neural Architecture Search With Random LabelsXuanyang Zhang, Pengfei Hou, Xiangyu Zhang 0005, Jian Sun. 10907-10916 [doi]

Metadata NormalizationMandy Lu, Qingyu Zhao, Jiequan Zhang, Kilian M. Pohl, Li Fei-Fei 0001, Juan Carlos Niebles, Ehsan Adeli 0001. 10917-10927 [doi]

Learning-Based Image Registration With Meta-RegularizationEbrahim Al Safadi, Xubo Song. 10928-10937 [doi]

Lesion-Aware Transformers for Diabetic Retinopathy GradingRui Sun, Yihao Li, Tianzhu Zhang, Zhendong Mao, Feng Wu 0001, Yongdong Zhang 0001. 10938-10947 [doi]

CapsuleRRT: Relationships-Aware Regression Tracking via CapsulesDing Ma, Xiangqian Wu 0002. 10948-10957 [doi]

Improving Multiple Pedestrian Tracking by Track Management and Occlusion HandlingDaniel Stadler, Jürgen Beyerer. 10958-10967 [doi]

Prioritized Architecture Sampling With Monto-Carlo Tree SearchXiu Su, Tao Huang, Yanxi Li 0001, Shan You, Fei Wang 0032, Chen Qian 0006, Changshui Zhang, Chang Xu 0002. 10968-10977 [doi]

Stochastic Whitening Batch NormalizationShengdong Zhang, Ehsan Nezhadarya, Homa Fashandi, Jiayi Liu 0002, Darin Graham, Mohak Shah. 10978-10987 [doi]

Revisiting Superpixels for Active Learning in Semantic Segmentation With Realistic Annotation CostsLile Cai, Xun Xu, Jun Hao Liew, Chuan-Sheng Foo. 10988-10997 [doi]

Dynamic Transfer for Multi-Source Domain AdaptationYunsheng Li, Lu Yuan, Yinpeng Chen, Pei Wang, Nuno Vasconcelos. 10998-11007 [doi]

Multi-Source Domain Adaptation With Collaborative Learning for Semantic SegmentationJianzhong He, Xu Jia, Shuaijun Chen, Jianzhuang Liu. 11008-11017 [doi]

Semi-Supervised Domain Adaptation Based on Dual-Level Domain Mixing for Semantic SegmentationShuaijun Chen, Xu Jia, Jianzhong He, Yongjie Shi, Jianzhuang Liu. 11018-11027 [doi]

What Can Style Transfer and Paintings Do for Model Robustness?Hubert Lin, Mitchell van Zuijlen, Sylvia C. Pont, Maarten W. A. Wijntjes, Kavita Bala. 11028-11037 [doi]

IIRC: Incremental Implicitly-Refined ClassificationMohamed AbdElSalam, Mojtaba Faramarzi, Shagun Sodhani, Sarath Chandar. 11038-11047 [doi]

LayoutGMN: Neural Graph Matching for Structural Layout SimilarityAkshay Gadi Patil, Manyi Li, Matthew Fisher, Manolis Savva, Hao Zhang 0002. 11048-11057 [doi]

CASTing Your Model: Learning To Localize Improves Self-Supervised RepresentationsRamprasaath R. Selvaraju, Karan Desai, Justin Johnson 0001, Nikhil Naik. 11058-11067 [doi]

Representation Learning via Global Temporal Alignment and Cycle-ConsistencyIsma Hadji, Konstantinos G. Derpanis, Allan D. Jepson. 11068-11077 [doi]

Sparse Auxiliary Networks for Unified Monocular Depth Prediction and CompletionVitor Guizilini, Rares Ambrus, Wolfram Burgard, Adrien Gaidon. 11078-11088 [doi]

Single Image Depth Prediction With Wavelet DecompositionMichaël Ramamonjisoa, Michael Firman, Jamie Watson, Vincent Lepetit, Daniyar Turmukhambetov. 11089-11098 [doi]

FAPIS: A Few-Shot Anchor-Free Part-Based Instance SegmenterKhoi Nguyen, Sinisa Todorovic. 11099-11108 [doi]

Bipartite Graph Network With Adaptive Message Passing for Unbiased Scene Graph GenerationRongjie Li, Songyang Zhang, Bo Wan, Xuming He 0001. 11109-11119 [doi]

Semantic Image MattingYanan Sun, Chi-Keung Tang, Yu-Wing Tai. 11120-11129 [doi]

Three Ways To Improve Semantic Segmentation With Self-Supervised Depth EstimationLukas Hoyer, Dengxin Dai, Yuhua Chen, Adrian Köring, Suman Saha, Luc Van Gool. 11130-11140 [doi]

Robust Instance Segmentation Through Reasoning About Multi-Object OcclusionXiaoding Yuan, Adam Kortylewski, Yihong Sun, Alan L. Yuille. 11141-11150 [doi]

Learning Graphs for Knowledge Transfer With Limited LabelsPallabi Ghosh, Nirat Saini, Larry S. Davis, Abhinav Shrivastava. 11151-11161 [doi]

VirTex: Learning Visual Representations From Textual AnnotationsKaran Desai, Justin Johnson 0001. 11162-11173 [doi]

COMPLETER: Incomplete Multi-View Clustering via Contrastive PredictionYijie Lin 0001, Yuanbiao Gou, Zitao Liu, Boyun Li, Jiancheng Lv 0001, Xi Peng 0001. 11174-11183 [doi]

Home Action Genome: Cooperative Compositional Action UnderstandingNishant Rai, Haofeng Chen, Jingwei Ji, Rishi Desai, Kazuki Kozuka, Shun Ishizaka, Ehsan Adeli 0001, Juan Carlos Niebles. 11184-11193 [doi]

Learning Goals From FailureDave Epstein, Carl Vondrick. 11194-11204 [doi]

VideoMoCo: Contrastive Video Representation Learning With Temporally Adversarial ExamplesTian Pan 0003, Yibing Song, Tianyu Yang, Wenhao Jiang, Wei Liu 0005. 11205-11214 [doi]

Spatial Feature Calibration and Temporal Fusion for Effective One-Stage Video Instance SegmentationMinghan Li, Shuai Li, Lida Li, Lei Zhang 0006. 11215-11224 [doi]

Temporally-Weighted Hierarchical Clustering for Unsupervised Action SegmentationM. Saquib Sarfraz, Naila Murray, Vivek Sharma 0001, Ali Diba, Luc Van Gool, Rainer Stiefelhagen. 11225-11234 [doi]

Context-Aware Biaffine Localizing Network for Temporal Sentence GroundingDaizong Liu, Xiaoye Qu, Jianfeng Dong, Pan Zhou, Yu Cheng 0001, Wei Wei 0002, Zichuan Xu, Yulai Xie. 11235-11244 [doi]

Towards Diverse Paragraph Captioning for Untrimmed VideosYuqing Song 0003, Shizhe Chen, Qin Jin. 11245-11254 [doi]

Intelligent Carpet: Inferring 3D Human Pose From Tactile SignalsYiyue Luo, Yunzhu Li, Michael Foshey, Wan Shou, Pratyusha Sharma, Tomás Palacios, Antonio Torralba 0001, Wojciech Matusik. 11255-11265 [doi]

Bottom-Up Shift and Reasoning for Referring Image SegmentationSibei Yang, Meng Xia, Guanbin Li, Hong-Yu Zhou, Yizhou Yu. 11266-11275 [doi]

Topological Planning With Transformers for Vision-and-Language NavigationKevin Chen 0001, Junshen K. Chen, Jo Chuang, Marynel Vázquez, Silvio Savarese. 11276-11286 [doi]

AGQA: A Benchmark for Compositional Spatio-Temporal ReasoningMadeleine Grunde-McLaughlin, Ranjay Krishna, Maneesh Agrawala. 11287-11297 [doi]

HDR Environment Map Estimation for Real-Time Augmented RealityGowri Somanath, Daniel Kurz. 11298-11306 [doi]

Fashion IQ: A New Dataset Towards Retrieving Images by Natural Language FeedbackHui Wu, Yupeng Gao, Xiaoxiao Guo, Ziad Al-Halah, Steven Rennie, Kristen Grauman, Rogério Feris. 11307-11317 [doi]

TPCN: Temporal Point Cloud Networks for Motion ForecastingMaosheng Ye, Tongyi Cao, Qifeng Chen. 11318-11327 [doi]

Generalizable Pedestrian Detection: The Elephant in the RoomIrtiza Hasan, ShengCai Liao, Jinpeng Li, Saad Ullah Akram, Ling Shao 0001. 11328-11337 [doi]

Indoor Panorama Planar 3D Reconstruction via Divide and ConquerCheng Sun 0004, Chi-Wei Hsiao, Ning-Hsu Wang, Min Sun, Hwann-Tzong Chen. 11338-11347 [doi]

SOE-Net: A Self-Attention and Orientation Encoding Network for Point Cloud Based Place RecognitionYan Xia, Yusheng Xu, Shuang Li, Rui Wang 0037, Juan Du, Daniel Cremers, Uwe Stilla. 11348-11357 [doi]

Neural Geometric Level of Detail: Real-Time Rendering With Implicit 3D ShapesTowaki Takikawa, Joey Litalien, Kangxue Yin, Karsten Kreis, Charles Loop, Derek Nowrouzezahrai, Alec Jacobson, Morgan McGuire, Sanja Fidler. 11358-11367 [doi]

SOLD2: Self-Supervised Occlusion-Aware Line Description and DetectionRémi Pautrat, Juan-Ting Lin, Viktor Larsson, Martin R. Oswald, Marc Pollefeys. 11368-11378 [doi]

PGT: A Progressive Method for Training Models on Long VideosBo Pang, Gao Peng, Yizhuo Li 0001, Cewu Lu. 11379-11389 [doi]

Dual Attention Guided Gaze Target Detection in the WildYi Fang, Jiapeng Tang, Wang Shen, Wei Shen, Xiao Gu 0001, Li Song 0001, Guangtao Zhai. 11390-11399 [doi]

ChallenCap: Monocular 3D Capture of Challenging Human Performances Using Multi-Modal ReferencesYannan He, Anqi Pang, Xin Chen, Han Liang, Minye Wu, Yuexin Ma, Lan Xu. 11400-11411 [doi]

Blocks-World CamerasJongho Lee, Mohit Gupta 0001. 11412-11422 [doi]

Real-Time Sphere Sweeping Stereo From Multiview Fisheye ImagesAndreas Meuleman, Hyeonjoong Jang, Daniel S. Jeon, Min H. Kim 0001. 11423-11432 [doi]

Optimal Gradient Checkpoint Search for Arbitrary Computation GraphsJianwei Feng, Dong Huang. 11433-11442 [doi]

Black-Box Explanation of Object Detectors via Saliency MapsVitali Petsiuk, Rajiv Jain, Varun Manjunatha, Vlad I. Morariu, Ashutosh Mehra 0002, Vicente Ordonez, Kate Saenko. 11443-11452 [doi]

GIRAFFE: Representing Scenes As Compositional Generative Neural Feature FieldsMichael Niemeyer, Andreas Geiger 0001. 11453-11464 [doi]

CoCosNet v2: Full-Resolution Correspondence Learning for Image TranslationXingran Zhou, Bo Zhang 0025, Ting Zhang, Pan Zhang, Jianmin Bao, Dong Chen 0003, Zhongfei Zhang, Fang Wen. 11465-11475 [doi]

Your "Flamingo" is My "Bird": Fine-Grained, or NotDongliang Chang, Kaiyue Pang, Yixiao Zheng, Zhanyu Ma, Yi-Zhe Song, Jun Guo 0002. 11476-11485 [doi]

Inception Convolution With Efficient Dilation SearchJie Liu, Chuming Li, Feng Liang, Chen Lin 0003, Ming Sun, Junjie Yan, Wanli Ouyang, Dong Xu 0001. 11486-11495 [doi]

Geo-FARM: Geodesic Factor Regression Model for Misaligned Pre-Shape Responses in Statistical Shape AnalysisChao Huang 0005, Anuj Srivastava, Rongjie Liu. 11496-11505 [doi]

UnrealPerson: An Adaptive Pipeline Towards Costless Person Re-IdentificationTianyu Zhang, Lingxi Xie, Longhui Wei, Zijie Zhuang, Yongfei Zhang, Bo Li 0006, Qi Tian 0001. 11506-11515 [doi]

Transferable Semantic Augmentation for Domain AdaptationShuang Li, Mixue Xie, Kaixiong Gong, Chi Harold Liu, Yulin Wang, Wei Li. 11516-11525 [doi]

Jigsaw Clustering for Unsupervised Visual Representation LearningPengguang Chen, Shu Liu 0005, Jiaya Jia. 11526-11535 [doi]

SliceNet: Deep Dense Depth Estimation From a Single Indoor Panorama Using a Slice-Based RepresentationGiovanni Pintore, Marco Agus, Eva Almansa, Jens Schneider, Enrico Gobbetti. 11536-11545 [doi]

Fully Convolutional Scene Graph GenerationHengyue Liu, Ning Yan, Masood S. Mortazavi, Bir Bhanu. 11546-11556 [doi]

Meta Pseudo LabelsHieu Pham, Zihang Dai, Qizhe Xie, Quoc V. Le. 11557-11568 [doi]

ArtEmis: Affective Language for Visual ArtPanos Achlioptas, Maks Ovsjanikov, Kilichbek Haydarov, Mohamed Elhoseiny, Leonidas J. Guibas. 11569-11579 [doi]

RobustNet: Improving Domain Generalization in Urban-Scene Segmentation via Instance Selective WhiteningSungha Choi, Sanghun Jung, Huiwon Yun, Joanne Taery Kim, Seungryong Kim, Jaegul Choo. 11580-11590 [doi]

Simultaneously Localize, Segment and Rank the Camouflaged ObjectsYunqiu Lv, Jing Zhang 0052, Yuchao Dai, Aixuan Li, Bowen Liu, Nick Barnes, Deng-Ping Fan. 11591-11601 [doi]

Interpolation-Based Semi-Supervised Learning for Object DetectionJisoo Jeong, Vikas Verma, Minsung Hyun, Juho Kannala, Nojun Kwak. 11602-11611 [doi]

There Is More Than Meets the Eye: Self-Supervised Multi-Object Detection and Tracking With Sound by Distilling Multimodal KnowledgeFrancisco Rivera Valverde, Juana Valeria Hurtado, Abhinav Valada. 11612-11621 [doi]

Variational Pedestrian DetectionYuang Zhang, Huanyu He, Jianguo Li, Yuxi Li, John See, Weiyao Lin. 11622-11631 [doi]

Generalized Focal Loss V2: Learning Reliable Localization Quality Estimation for Dense Object DetectionXiang Li, Wenhai Wang, Xiaolin Hu 0001, Jun Li, Jinhui Tang, Jian Yang 0003. 11632-11641 [doi]

Unveiling the Potential of Structure Preserving for Weakly Supervised Object LocalizationXingjia Pan, Yingguo Gao, Zhiwen Lin, Fan Tang, Weiming Dong, Haolei Yuan, Feiyue Huang, Changsheng Xu. 11642-11651 [doi]

Deep Active Surface ModelsUdaranga Wickramasinghe, Pascal Fua, Graham Knott. 11652-11661 [doi]

Normalized Avatar Synthesis Using StyleGAN and Perceptual RefinementHuiwen Luo, Koki Nagano, Han Wei Kung, Qingguo Xu, Zejian Wang, Lingyu Wei, Liwen Hu, Hao Li 0015. 11662-11672 [doi]

Omni-Supervised Point Cloud Segmentation via Gradual Receptive Field Component ReasoningJingyu Gong, Jiachen Xu, Xin Tan, Haichuan Song, Yanyun Qu, Yuan Xie 0006, Lizhuang Ma. 11673-11682 [doi]

PU-GCN: Point Cloud Upsampling Using Graph Convolutional NetworksGuocheng Qian, Abdulellah Abualshour, Guohao Li, Ali K. Thabet, Bernard Ghanem. 11683-11692 [doi]

CGA-Net: Category Guided Aggregation for Point Cloud Semantic SegmentationTao Lu, Limin Wang 0002, Gangshan Wu. 11693-11702 [doi]

UV-Net: Learning From Boundary RepresentationsPradeep Kumar Jayaraman, Aditya Sanghi, Joseph G. Lambourne, Karl D. D. Willis, Thomas Davies, Hooman Shayani, Nigel Morris. 11703-11712 [doi]

Joint Learning of 3D Shape Retrieval and DeformationMikaela Angelina Uy, Vladimir G. Kim, Minhyuk Sung, Noam Aigerman, Siddhartha Chaudhuri, Leonidas J. Guibas. 11713-11722 [doi]

Square Root Bundle Adjustment for Large-Scale ReconstructionNikolaus Demmel, Christiane Sommer, Daniel Cremers, Vladyslav Usenko. 11723-11732 [doi]

Pixel-Aligned Volumetric AvatarsAmit Raj, Michael Zollhöfer, Tomas Simon, Jason M. Saragih, Shunsuke Saito, James Hays, Stephen Lombardi. 11733-11742 [doi]

Learning To Identify Correct 2D-2D Line Correspondences on SphereHaoang Li, Kai Chen, Ji Zhao 0001, Jiangliu Wang, Pyojin Kim, Zhe Liu, Yun-Hui Liu. 11743-11752 [doi]

SpinNet: Learning a General Surface Descriptor for 3D Point Cloud RegistrationSheng Ao, Qingyong Hu, Bo Yang 0027, Andrew Markham, Yulan Guo. 11753-11762 [doi]

Self-Supervised Collision Handling via Generative 3D Garment Models for Virtual Try-OnIgor Santesteban, Nils Thuerey, Miguel A. Otaduy, Dan Casas. 11763-11773 [doi]

End-to-End Rotation Averaging With Multi-Source PropagationLuwei Yang, Heng Li, Jamal Ahmed Rahim, Zhaopeng Cui, Ping Tan. 11774-11783 [doi]

Center-Based 3D Object Detection and TrackingTianwei Yin, Xingyi Zhou, Philipp Krähenbühl. 11784-11793 [doi]

PointAugmenting: Cross-Modal Augmentation for 3D Object DetectionChunwei Wang, Chao Ma 0004, Ming Zhu, Xiaokang Yang. 11794-11803 [doi]

Removing the Background by Adding the Background: Towards Background Robust Self-Supervised Video Representation LearningJinpeng Wang, Yuting Gao, Ke Li, Yiqi Lin, Andy J. Ma, Hao Cheng 0012, Pai Peng, Feiyue Huang, Rongrong Ji, Xing Sun. 11804-11813 [doi]

Trajectory Prediction With Latent Belief Energy-Based ModelBo Pang, Tianyang Zhao, Xu Xie 0001, Ying Nian Wu. 11814-11824 [doi]

End-to-End Human Object Interaction Detection With HOI TransformerCheng Zou, Bohan Wang, Yue Hu, Junqi Liu, Qian Wu, Yu Zhao, Boxun Li, Chenguang Zhang, Chi Zhang, Yichen Wei, Jian Sun 0001. 11825-11834 [doi]

Simulating Unknown Target Models for Query-Efficient Black-Box AttacksChen Ma, Li Chen, Jun-Hai Yong. 11835-11844 [doi]

Improving Transferability of Adversarial Patches on Face Recognition With Generative ModelsZihao Xiao, Xianfeng Gao, Chilin Fu, Yinpeng Dong, Wei Gao, Xiaolu Zhang, Jun Zhou 0012, Jun Zhu 0001. 11845-11854 [doi]

When Human Pose Estimation Meets Robustness: Adversarial Algorithms and BenchmarksJiahang Wang, Sheng Jin 0007, Wentao Liu 0002, Weizhong Liu, Chen Qian 0006, Ping Luo 0002. 11855-11864 [doi]

Body2Hands: Learning To Infer 3D Hands From Conversational Gesture Body DynamicsEvonne Ng, Shiry Ginosar, Trevor Darrell, Hanbyul Joo. 11865-11874 [doi]

SMPLicit: Topology-Aware Generative Model for Clothed PeopleEnric Corona, Albert Pumarola, Guillem Alenyà, Gerard Pons-Moll, Francesc Moreno-Noguer. 11875-11885 [doi]

Multi-View Multi-Person 3D Pose Estimation With Plane Sweep StereoJiahao Lin, Gim Hee Lee. 11886-11895 [doi]

Progressive Semantic-Aware Style Transformation for Blind Face RestorationChaofeng Chen, Xiaoming Li, Lingbo Yang, Xianhui Lin, Lei Zhang 0006, Kwan-Yee K. Wong. 11896-11905 [doi]

Variational Prototype Learning for Deep Face RecognitionJiankang deng, Jia Guo, Jing Yang, Alexandros Lattas, Stefanos Zafeiriou. 11906-11915 [doi]

Learning Spatial-Semantic Relationship for Facial Attribute Recognition With Limited Labeled DataYing Shu, Yan Yan 0001, Si Chen 0002, Jing-Hao Xue, Chunhua Shen, Hanzi Wang. 11916-11925 [doi]

Intra-Inter Camera Similarity for Unsupervised Person Re-IdentificationShiyu Xuan, Shiliang Zhang. 11926-11935 [doi]

Digital Gimbal: End-to-End Deep Image Stabilization With Learnable Exposure TimesOmer Dahary, Matan Jacoby, Alex M. Bronstein. 11936-11945 [doi]

Learning Scalable lY=-Constrained Near-Lossless Image Compression via Joint Lossy Image and Residual CompressionYuanchao Bai, Xianming Liu, Wangmeng Zuo, Yaowei Wang, Xiangyang Ji. 11946-11955 [doi]

Explore Image Deblurring via Encoded Blur Kernel SpacePhong Tran, Anh-Tuan Tran, Quynh Phung, Minh Hoai. 11956-11965 [doi]

Self-Aligned Video Deraining With Transmission-Depth ConsistencyWending Yan, Robby T. Tan, Wenhan Yang, Dengxin Dai. 11966-11976 [doi]

Nighttime Visibility Enhancement by Increasing the Dynamic Range and Suppression of Light EffectsAashish Sharma, Robby T. Tan. 11977-11986 [doi]

High-Quality Stereo Image Restoration From Double RefractionHakyeong Kim, Andreas Meuleman, Daniel S. Jeon, Min H. Kim 0001. 11987-11995 [doi]

Spk2ImgNet: Learning To Reconstruct Dynamic Scene From Continuous Spike StreamJing Zhao 0011, Ruiqin Xiong, Hangfan Liu, Jian Zhang, Tiejun Huang. 11996-12005 [doi]

Learning Tensor Low-Rank Prior for Hyperspectral Image ReconstructionShipeng Zhang, Lizhi Wang, Lei Zhang, Hua Huang 0001. 12006-12015 [doi]

ClassSR: A General Framework to Accelerate Super-Resolution Networks by Data CharacteristicXiangtao Kong, Hengyuan Zhao, Yu Qiao 0001, Chao Dong. 12016-12025 [doi]

Scene Text Telescope: Text-Focused Scene Image Super-ResolutionJingye Chen, Bin Li, Xiangyang Xue. 12026-12035 [doi]

Real-Time Selfie Video StabilizationJiyang Yu, Ravi Ramamoorthi, Ke-Li Cheng, Michel Sarkis, Ning Bi. 12036-12044 [doi]

Rethinking Text Segmentation: A Novel Dataset and a Text-Specific Refinement ApproachXingqian Xu, Zhifei Zhang, Zhaowen Wang, Brian Price, Zhonghao Wang, Humphrey Shi. 12045-12055 [doi]

PQA: Perceptual Question AnsweringYonggang Qi, Kai Zhang, Aneeshan Sain, Yi-Zhe Song. 12056-12064 [doi]

Communication Efficient SGD via Gradient Sampling With Bayes PriorLiuyihan Song, Kang Zhao, Pan Pan, Yu Liu, Yingya Zhang, Yinghui Xu, Rong Jin. 12065-12074 [doi]

Student-Teacher Learning From Clean Inputs to Noisy InputsGuanzhe Hong, Zhiyuan Mao, Xiaojun Lin, Stanley H. Chan. 12075-12084 [doi]

Towards Extremely Compact RNNs for Video Recognition With Fully Decomposed Hierarchical Tucker StructureMiao Yin, Siyu Liao, Xiao-Yang Liu, Xiaodong Wang, Bo Yuan 0001. 12085-12094 [doi]

Optimal Quantization Using Scaled CodebookYerlan Idelbayev, Pavlo Molchanov, Maying Shen, Hongxu Yin, Miguel Á. Carreira-Perpiñán, Jose M. Alvarez. 12095-12104 [doi]

Causal Hidden Markov Model for Time Series Disease ForecastingJing Li, Botong Wu, Xinwei Sun 0001, Yizhou Wang 0001. 12105-12114 [doi]

Fair Feature Distillation for Visual RecognitionSangwon Jung, Donggyu Lee, Taeeon Park, Taesup Moon. 12115-12124 [doi]

DISCO: Dynamic and Invariant Sensitive Channel Obfuscation for Deep Neural NetworksAbhishek Singh 0005, Ayush Chopra, Ethan Garza, Emily Zhang, Praneeth Vepakomma, Vivek Sharma 0001, Ramesh Raskar. 12125-12135 [doi]

Person Re-Identification Using Heterogeneous Local Graph Attention NetworksZhong Zhang 0001, Haijia Zhang, Shuang Liu 0001. 12136-12145 [doi]

Hierarchical Video Prediction Using Relational Layouts for Human-Object InteractionsNavaneeth Bodla, Gaurav Shrivastava, Rama Chellappa, Abhinav Shrivastava. 12146-12155 [doi]

Content-Aware GAN CompressionYuchen Liu, Zhixin Shu, Yijun Li, Zhe Lin 0001, Federico Perazzi, Sun-Yuan Kung. 12156-12166 [doi]

Efficient Conditional GAN Transfer With Knowledge Propagation Across ClassesMohamad Shahbazi, Zhiwu Huang, Danda Pani Paudel, Ajad Chhatkuli, Luc Van Gool. 12167-12176 [doi]

Discovering Interpretable Latent Space Directions of GANs Beyond Binary AttributesHuiting Yang, Liangyu Chai, Qiang Wen, Shuang Zhao, Zixun Sun, Shengfeng He. 12177-12185 [doi]

Leveraging Line-Point Consistence To Preserve Structures for Wide Parallax Image StitchingQi Jia 0001, Zhengjun Li, Xin Fan 0001, Haotian Zhao, Shiyu Teng, Xinchen Ye, Longin Jan Latecki. 12186-12195 [doi]

Rethinking Style Transfer: From Pixels to Parameterized BrushstrokesDmytro Kotovenko, Matthias Wright, Arthur Heimbrecht, Björn Ommer. 12196-12205 [doi]

Scene-Aware Generative Network for Human Motion SynthesisJingbo Wang, Sijie Yan, Bo Dai, Dahua Lin. 12206-12215 [doi]

Stable View SynthesisGernot Riegler, Vladlen Koltun. 12216-12225 [doi]

Understanding and Simplifying Perceptual DistancesDan Amir, Yair Weiss. 12226-12235 [doi]

Behavior-Driven Synthesis of Human DynamicsAndreas Blattmann, Timo Milbich, Michael Dorkenwald, Björn Ommer. 12236-12246 [doi]

Adaptive Image Transformer for One-Shot Object DetectionDing-Jie Chen, He-Yen Hsieh, Tyng-Luh Liu. 12247-12256 [doi]

Quality-Agnostic Image Recognition via Invertible DecoderInsoo Kim, Seungju Han, Ji Won Baek, Seong-Jin Park, Jae-Joon Han, Jinwoo Shin. 12257-12266 [doi]

Self-Supervised Wasserstein Pseudo-Labeling for Semi-Supervised Image ClassificationFariborz Taherkhani, Ali Dabouei, Sobhan Soleymani, Jeremy M. Dawson, Nasser M. Nasrabadi. 12267-12277 [doi]

Improving Unsupervised Image Clustering With Robust LearningSungwon Park, Sungwon Han 0001, Sundong Kim, Danu Kim, Sungkyu Park, Seunghoon Hong, Meeyoung Cha. 12278-12287 [doi]

Group Collaborative Learning for Co-Salient Object DetectionQi Fan, Deng-Ping Fan, Huazhu Fu, Chi-Keung Tang, Ling Shao 0001, Yu-Wing Tai. 12288-12298 [doi]

Pre-Trained Image Processing TransformerHanting Chen, Yunhe Wang 0001, Tianyu Guo 0001, Chang Xu 0002, Yiping Deng, Zhenhua Liu, Siwei Ma, Chunjing Xu, Chao Xu 0006, Wen Gao 0001. 12299-12310 [doi]

DOTS: Decoupling Operation and Topology in Differentiable Architecture SearchYuchao Gu, Lijuan Wang, Yun Liu 0011, Yi Yang, Yu-Huan Wu, Shao-Ping Lu, Ming-Ming Cheng. 12311-12320 [doi]

Involution: Inverting the Inherence of Convolution for Visual RecognitionDuo Li, Jie Hu 0019, Changhu Wang, Xiangtai Li, Qi She, Lei Zhu, Tong Zhang, Qifeng Chen. 12321-12330 [doi]

Cross-Iteration Batch NormalizationZhuliang Yao, Yue Cao 0001, Shuxin Zheng, Gao Huang, Stephen Lin. 12331-12340 [doi]

Learning Calibrated Medical Image Segmentation via Multi-Rater Agreement ModelingWei Ji, Shuang Yu, JunDe Wu, Kai Ma 0002, Cheng Bian, Qi Bi, Jingjing Li, Hanruo Liu, Li Cheng, Yefeng Zheng. 12341-12351 [doi]

Track To Detect and Segment: An Online Multi-Object TrackerJialian Wu, Jiale Cao, Liangchen Song, Yu Wang 0032, Ming Yang 0007, Junsong Yuan. 12352-12361 [doi]

Rotation Equivariant Siamese Networks for TrackingDeepak K. Gupta, Devanshu Arya, Efstratios Gavves. 12362-12371 [doi]

SiamMOT: Siamese Multi-Object TrackingBing Shuai, Andrew G. Berneshawi, Xinyu Li, Davide Modolo, Joseph Tighe. 12372-12382 [doi]

On Feature Normalization and Data AugmentationBoyi Li, Felix Wu, Ser-Nam Lim, Serge J. Belongie, Kilian Q. Weinberger. 12383-12392 [doi]

Learning a Self-Expressive Network for Subspace ClusteringShangzhi Zhang, Chong You, René Vidal, Chun-Guang Li. 12393-12403 [doi]

Dual-GAN: Joint BVP and Noise Modeling for Remote Physiological MeasurementHao Lu, Hu Han 0001, S. Kevin Zhou. 12404-12413 [doi]

Prototypical Pseudo Label Denoising and Target Structure Learning for Domain Adaptive Semantic SegmentationPan Zhang, Bo Zhang 0025, Ting Zhang, Dong Chen 0003, Yong Wang, Fang Wen. 12414-12424 [doi]

RPN Prototype Alignment for Domain Adaptive Object DetectorYixin Zhang, Zilei Wang, Yushi Mao. 12425-12434 [doi]

PixMatch: Unsupervised Domain Adaptation via Pixelwise Consistency TrainingLuke Melas-Kyriazi, Arjun K. Manrai. 12435-12445 [doi]

Adversarial Invariant LearningNanyang Ye, Jingxuan Tang, Huayu Deng, Xiao-Yun Zhou, Qianxiao Li, Zhenguo Li, Guang-Zhong Yang, Zhanxing Zhu. 12446-12454 [doi]

Few-Shot Incremental Learning With Continually Evolved ClassifiersChi Zhang, Nan Song, Guosheng Lin, Yun Zheng, Pan Pan, Yinghui Xu. 12455-12464 [doi]

Unsupervised Hyperbolic Metric LearningJiexi Yan, Lei Luo 0001, Cheng Deng, Heng Huang. 12465-12474 [doi]

Audio-Visual Instance Discrimination with Cross-Modal AgreementPedro Morgado 0001, Nuno Vasconcelos, Ishan Misra. 12475-12486 [doi]

CoCoNets: Continuous Contrastive 3D Scene RepresentationsShamit Lal, Mihir Prabhudesai, Ishita Mediratta, Adam W. Harley, Katerina Fragkiadaki. 12487-12496 [doi]

Bilateral Grid Learning for Stereo Matching NetworksBin Xu, Yuhua Xu 0006, Xiaoli Yang, Wei Jia, Yulan Guo. 12497-12506 [doi]

Radar-Camera Pixel Depth Association for Depth CompletionYunfei Long, Daniel Morris 0002, Xiaoming Liu 0002, Marcos Castro, Punarjay Chakravarty, Praveen Narayanan. 12507-12516 [doi]

Panoptic Segmentation ForecastingColin Graber, Grace Tsai, Michael Firman, Gabriel J. Brostow, Alexander G. Schwing. 12517-12526 [doi]

Probabilistic Modeling of Semantic Ambiguity for Scene Graph GenerationGengcong Yang, Jingyi Zhang, Yong Zhang 0034, Baoyuan Wu, Yujiu Yang. 12527-12536 [doi]

Learning Statistical Texture for Semantic SegmentationLanyun Zhu, Deyi Ji, Shiping Zhu, Weihao Gan, Wei Wu 0021, Junjie Yan. 12537-12546 [doi]

(AF)2-S3Net: Attentive Feature Fusion With Adaptive Feature Selection for Sparse Semantic Segmentation NetworkRan Cheng, Ryan Razani, Ehsan Taghavi, Enxu Li, Bingbing Liu. 12547-12556 [doi]

Scale-Localized Abstract ReasoningYaniv Benny, Niv Pekar, Lior Wolf. 12557-12565 [doi]

Few-Shot Open-Set Recognition by Transformation ConsistencyMinki Jeong, Seokeon Choi, Changick Kim. 12566-12575 [doi]

I3Net: Implicit Instance-Invariant Network for Adapting One-Stage Object DetectorsChaoqi Chen, Zebiao Zheng, Yue Huang 0001, Xinghao Ding, Yizhou Yu. 12576-12585 [doi]

Unsupervised Feature Learning by Cross-Level Instance-Group DiscriminationXudong Wang, Ziwei Liu 0002, Stella X. Yu. 12586-12595 [doi]

Multi-Shot Temporal Event Localization: A BenchmarkXiaolong Liu, Yao Hu, Song Bai, Fei Ding, Xiang Bai, Philip H. S. Torr. 12596-12606 [doi]

Learning the Predictability of the FutureDidac Suris, Ruoshi Liu, Carl Vondrick. 12607-12617 [doi]

SSAN: Separable Self-Attention Network for Video Representation LearningXudong Guo, Xun Guo, Yan Lu 0001. 12618-12627 [doi]

Action Shuffle Alternating Learning for Unsupervised Action SegmentationJun Li, Sinisa Todorovic. 12628-12636 [doi]

Towards Accurate Text-Based Image Captioning With Content Diversity ExplorationGuanghui Xu, Shuaicheng Niu, Mingkui Tan, Yucheng Luo, Qing Du, Qi Wu 0001. 12637-12646 [doi]

Kaleido-BERT: Vision-Language Pre-Training on Fashion DomainMingchen Zhuge, Dehong Gao, Deng-Ping Fan, Linbo Jin, Ben Chen, Haoming Zhou, Minghui Qiu, Ling Shao 0001. 12647-12657 [doi]

Transitional Adaptation of Pretrained Models for Visual StorytellingYoungjae Yu, Jiwan Chung, Heeseung Yun, Jongseok Kim, Gunhee Kim. 12658-12668 [doi]

Multi-Stage Aggregated Transformer Network for Temporal Language Localization in VideosMingxing Zhang, Yang Yang 0002, Xinghan Chen, Yanli Ji, Xing Xu 0001, Jingjing Li 0001, Heng Tao Shen. 12669-12678 [doi]

Connecting What To Say With Where To Look by Modeling Human Attention TracesZihang Meng, Licheng Yu, Ning Zhang, Tamara L. Berg, Babak Damavandi, Vikas Singh, Amy Bearman. 12679-12688 [doi]

SOON: Scenario Oriented Object Navigation With Graph-Based ExplorationFengda Zhu, Xiwen Liang, Yi Zhu 0004, Qizhi Yu, Xiaojun Chang, Xiaodan Liang. 12689-12699 [doi]

Counterfactual VQA: A Cause-Effect Look at Language BiasYulei Niu, Kaihua Tang, Hanwang Zhang, Zhiwu Lu, Xian-Sheng Hua 0001, Ji-Rong Wen. 12700-12710 [doi]

Learning by WatchingJimuyang Zhang, Eshed Ohn-Bar. 12711-12721 [doi]

Personalized Outfit Recommendation With Learnable AnchorsZhi Lu, Yang Hu 0006, Yan Chen 0007, Bing Zeng. 12722-12731 [doi]

Safe Local Motion Planning With Self-Supervised Freespace ForecastingPeiyun Hu, Aaron Huang, John M. Dolan, David Held, Deva Ramanan. 12732-12741 [doi]

Anomaly Detection in Video via Self-Supervised and Multi-Task LearningMariana-Iuliana Georgescu, Antonio Barbalau, Radu-Tudor Ionescu, Fahad Shahbaz Khan, Marius Popescu, Mubarak Shah. 12742-12752 [doi]

Learning High Fidelity Depths of Dressed Humans by Watching Social Media Dance VideosYasamin Jafarian, Hyun Soo Park. 12753-12762 [doi]

PointNetLK RevisitedXueqian Li, Jhony Kaesemodel Pontes, Simon Lucey. 12763-12772 [doi]

BRepNet: A Topological Message Passing System for Solid ModelsJoseph G. Lambourne, Karl D. D. Willis, Pradeep Kumar Jayaraman, Aditya Sanghi, Peter Meltzer, Hooman Shayani. 12773-12782 [doi]

KeypointDeformer: Unsupervised 3D Keypoint Discovery for Shape ControlTomas Jakab, Richard Tucker 0001, Ameesh Makadia, Jiajun Wu 0001, Noah Snavely, Angjoo Kanazawa. 12783-12792 [doi]

Learning View-Disentangled Human Pose Representation by Contrastive Cross-View Mutual Information MaximizationLong Zhao 0003, Yuxiao Wang, Jiaping Zhao, Liangzhe Yuan, Jennifer J. Sun, Florian Schroff, Hartwig Adam, Xi Peng 0005, Dimitris N. Metaxas, Ting Liu 0005. 12793-12802 [doi]

i3DMM: Deep Implicit 3D Morphable Model of Human HeadsTarun Yenamandra, Ayush Tewari, Florian Bernard, Hans-Peter Seidel, Mohamed Elgharib, Daniel Cremers, Christian Theobalt. 12803-12813 [doi]

Reconstructing 3D Human Pose by Watching Humans in the MirrorQi Fang, Qing Shuai, Junting Dong, Hujun Bao, Xiaowei Zhou. 12814-12823 [doi]

EventZoom: Learning To Denoise and Super Resolve Neuromorphic EventsPeiqi Duan, Zihao W. Wang, Xinyu Zhou, Yi Ma 0001, Boxin Shi. 12824-12833 [doi]

Spatially-Varying Outdoor Lighting Estimation From IntrinsicsYongjie Zhu, Yinda Zhang 0001, Si Li, Boxin Shi. 12834-12842 [doi]

Knowledge Evolution in Neural NetworksAhmed Taha 0001, Abhinav Shrivastava, Larry S. Davis. 12843-12852 [doi]

Understanding Failures of Deep Networks via Robust Feature ExtractionSahil Singla 0002, Besmira Nushi, Shital Shah, Ece Kamar, Eric Horvitz. 12853-12862 [doi]

StyleSpace Analysis: Disentangled Controls for StyleGAN Image GenerationZongze Wu, Dani Lischinski, Eli Shechtman. 12863-12872 [doi]

Taming Transformers for High-Resolution Image SynthesisPatrick Esser, Robin Rombach, Björn Ommer. 12873-12883 [doi]

Benchmarking Representation Learning for Natural World Image CollectionsGrant Van Horn, Elijah Cole, Sara Beery, Kimberly Wilber, Serge J. Belongie, Oisin Mac Aodha. 12884-12893 [doi]

Scaling Local Self-Attention for Parameter Efficient Visual BackbonesAshish Vaswani, Prajit Ramachandran, Aravind Srinivas, Niki Parmar, Blake A. Hechtman, Jonathon Shlens. 12894-12904 [doi]

IMODAL: Creating Learnable User-Defined Deformation ModelsLeander Lacroix, Benjamin Charlier, Alain Trouvé, Barbara Gris. 12905-12913 [doi]

Unsupervised Multi-Source Domain Adaptation for Person Re-IdentificationZechen Bai, Zhigang Wang, Jian Wang, Di Hu 0001, Errui Ding. 12914-12923 [doi]

Generalization on Unseen Domains via Inference-Time Label-Preserving Target ProjectionsPrashant Pandey, Mrigank Raman, Sumanth Varambally, Prathosh AP. 12924-12933 [doi]

Robust Audio-Visual Instance DiscriminationPedro Morgado 0001, Ishan Misra, Nuno Vasconcelos. 12934-12945 [doi]

Binary TTC: A Temporal Geofence for Autonomous NavigationAbhishek Badki, Orazio Gallo, Jan Kautz, Pradeep Sen. 12946-12955 [doi]

LED2-Net: Monocular 360deg Layout Estimation via Differentiable Depth RenderingFu-En Wang, Yu-Hsuan Yeh, Min Sun, Wei-chen Chiu, Yi-Hsuan Tsai. 12956-12965 [doi]

A Realistic Evaluation of Semi-Supervised Learning for Fine-Grained ClassificationJong-Chyi Su, Zezhou Cheng, Subhransu Maji. 12966-12975 [doi]

Seeing Out of the Box: End-to-End Pre-Training for Vision-Language Representation LearningZhicheng Huang, Zhaoyang Zeng, Yupan Huang, Bei Liu 0001, Dongmei Fu, Jianlong Fu. 12976-12985 [doi]

Intentonomy: A Dataset and Study Towards Human Intent UnderstandingMenglin Jia, Zuxuan Wu, Austin Reiter, Claire Cardie, Serge J. Belongie, Ser-Nam Lim. 12986-12996 [doi]

Mutual Graph Learning for Camouflaged Object DetectionQiang Zhai, Xin Li, Fan Yang 0054, Chenglizhao Chen, Hong Cheng 0002, Deng-Ping Fan. 12997-13007 [doi]

Hallucination Improves Few-Shot Object DetectionWeilin Zhang, Yu-Xiong Wang. 13008-13017 [doi]

Learning To Predict Visual Attributes in the WildKhoi Pham, Kushal Kafle, Zhe Lin 0001, Zhihong Ding, Scott Cohen, Quan Tran, Abhinav Shrivastava. 13018-13028 [doi]

Scaled-YOLOv4: Scaling Cross Stage Partial NetworkChien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao. 13029-13038 [doi]

You Only Look One-Level FeatureQiang Chen, Yingming Wang, Tong Yang, Xiangyu Zhang, Jian Cheng, Jian Sun 0015. 13039-13048 [doi]

Neighborhood Normalization for Robust Geometric Feature LearningXingtong Liu, Benjamin D. Killeen, Ayushi Sinha, Masaru Ishii, Gregory D. Hager, Russell H. Taylor, Mathias Unberath. 13049-13058 [doi]

High-Fidelity Face Tracking for AR/VR via Deep Lighting AdaptationLele Chen, Chen Cao, Fernando De la Torre, Jason M. Saragih, Chenliang Xu, Yaser Sheikh. 13059-13069 [doi]

Cuboids Revisited: Learning Robust 3D Shape Fitting to Single RGB ImagesFlorian Kluger, Hanno Ackermann, Eric Brachmann, Michael Ying Yang, Bodo Rosenhahn. 13070-13079 [doi]

Cycle4Completion: Unpaired Point Cloud Completion Using Cycle Transformation With Missing Region CodingXin Wen, Zhizhong Han, Yan-Pei Cao, Pengfei Wan, Wen Zheng, Yu-Shen Liu. 13080-13089 [doi]

LiDAR-Based Panoptic Segmentation via Dynamic Shifting NetworkFangzhou Hong, Hui Zhou 0005, Xinge Zhu, Hongsheng Li 0001, Ziwei Liu. 13090-13099 [doi]

RPSRNet: End-to-End Trainable Rigid Point Set Registration Network Using Barnes-Hut 2D-Tree RepresentationSk Aziz Ali, Kerem Kahraman, Gerd Reis, Didier Stricker. 13100-13110 [doi]

Online Learning of a Probabilistic and Adaptive Scene RepresentationZike Yan, Xin Wang, Hongbin Zha. 13111-13121 [doi]

Quantum Permutation SynchronizationTolga Birdal, Vladislav Golyanik, Christian Theobalt, Leonidas J. Guibas. 13122-13133 [doi]

Wide-Baseline Multi-Camera Calibration Using Person Re-IdentificationYan Xu, Yu-Jhe Li, Xinshuo Weng, Kris Kitani. 13134-13143 [doi]

STaR: Self-Supervised Tracking and Reconstruction of Rigid Objects in Motion With Neural RenderingWentao Yuan, Zhaoyang Lv, Tanner Schmidt, Steven Lovegrove. 13144-13152 [doi]

PatchMatch-Based Neighborhood Consensus for Semantic CorrespondenceJae-Yong Lee, Joseph DeGol, Victor Fragoso, Sudipta N. Sinha. 13153-13163 [doi]

Learning Feature Aggregation for Deep 3D Morphable ModelsZhixiang Chen, Tae-Kyun Kim. 13164-13173 [doi]

A Functional Approach to Rotation Equivariant Non-Linearities for Tensor Field NetworksAdrien Poulenard, Leonidas J. Guibas. 13174-13183 [doi]

Generalizing to the Open World: Deep Visual Odometry With Online AdaptationShunkai Li, Xin Wu, Yingdian Cao, Hongbin Zha. 13184-13193 [doi]

Panoptic-PolarNet: Proposal-Free LiDAR Point Cloud Panoptic SegmentationZixiang Zhou, Yang Zhang, Hassan Foroosh. 13194-13203 [doi]

3D Spatial Recognition Without Spatially Labeled 3DZhongzheng Ren, Ishan Misra, Alexander G. Schwing, Rohit Girdhar. 13204-13213 [doi]

ACTION-Net: Multipath Excitation for Action RecognitionZhengwei Wang, Qi She, Aljosa Smolic. 13214-13223 [doi]

Anticipating Human Actions by Correlating Past With the Future With Jaccard Similarity MeasuresBasura Fernando, Samitha Herath. 13224-13233 [doi]

Glance and Gaze: Inferring Action-Aware Points for One-Stage Human-Object Interaction DetectionXubin Zhong, Xian Qu, Changxing Ding, Dacheng Tao. 13234-13243 [doi]

How Robust Are Randomized Smoothing Based Defenses to Data Poisoning?Akshay Mehra, Bhavya Kailkhura, Pin-Yu Chen, Jihun Hamm. 13244-13253 [doi]

FaceSec: A Fine-Grained Robustness Evaluation Framework for Face Recognition SystemsLiang Tong, Zhengzhang Chen, Jingchao Ni, Wei Cheng 0002, Dongjin Song, Haifeng Chen, Yevgeniy Vorobeychik. 13254-13263 [doi]

Rethinking the Heatmap Regression for Bottom-Up Human Pose EstimationZhengxiong Luo, Zhicheng Wang, Yan Huang 0008, Liang Wang 0001, Tieniu Tan, Erjin Zhou. 13264-13273 [doi]

Camera-Space Hand Mesh Recovery via Semantic Aggregation and Adaptive 2D-1D RegistrationXingyu Chen, Yufeng Liu, Chongyang Ma, Jianlong Chang, Huayan Wang, Tian Chen, Xiaoyan Guo, Pengfei Wan, Wen Zheng. 13274-13283 [doi]

S3: Neural Shape, Skeleton, and Skinning Fields for 3D Human ModelingZe Yang, Shenlong Wang, Sivabalan Manivasagam, Zeng Huang, Wei-Chiu Ma, Xinchen Yan, Ersin Yumer, Raquel Urtasun. 13284-13293 [doi]

CanonPose: Self-Supervised Monocular 3D Human Pose Estimation in the WildBastian Wandt, Marco Rudolph, Petrissa Zell, Helge Rhodin, Bodo Rosenhahn. 13294-13304 [doi]

Lipstick Ain't Enough: Beyond Color Matching for In-the-Wild Makeup TransferThao Nguyen, Anh-Tuan Tran, Minh Hoai. 13305-13314 [doi]

Virtual Fully-Connected Layer: Training a Large-Scale Face Recognition Dataset With Limited Computational ResourcesPengyu Li, Biao Wang, Lei Zhang 0006. 13315-13324 [doi]

Learning From the Master: Distilling Cross-Modal Advanced Knowledge for Lip ReadingSucheng Ren, Yong Du, Jianming Lv, Guoqiang Han, Shengfeng He. 13325-13333 [doi]

Watching You: Global-Guided Reciprocal Learning for Video-Based Person Re-IdentificationXuehu Liu, Pingping Zhang, Chenyang Yu, Huchuan Lu, Xiaoyun Yang. 13334-13343 [doi]

Sparse Multi-Path Corrections in Fringe Projection ProfilometryYu Zhang, Daniel L. Lau, David Wipf. 13344-13353 [doi]

Attention-Guided Image Compression by Deep Reconstruction of Compressive Sensed Saliency SkeletonXi Zhang, Xiaolin Wu. 13354-13364 [doi]

Invertible Denoising Network: A Light Solution for Real Noise RemovalYang Liu, Zhenyue Qin, Saeed Anwar, Pan Ji, Dongwoo Kim 0002, Sabrina B. Caldwell, Tom Gedeon. 13365-13374 [doi]

Multi-Decoding Deraining Network and Quasi-Sparsity Based TrainingYinglong Wang 0002, Chao Ma 0004, Bing Zeng. 13375-13384 [doi]

Unsupervised Real-World Image Super Resolution via Domain-Distance Aware TrainingYunxuan Wei, Shuhang Gu, Yawei Li, Radu Timofte, Longcun Jin, Hengjie Song. 13385-13394 [doi]

Single Image Reflection Removal With Absorption EffectQian Zheng, Boxin Shi, Jinnan Chen, Xudong Jiang, Ling-Yu Duan, Alex C. Kot. 13395-13404 [doi]

Exploiting Aliasing for Manga RestorationMinshan Xie, Menghan Xia, Tien-Tsin Wong. 13405-13414 [doi]

Rich Context Aggregation With Reflection Prior for Glass Surface DetectionJiaying Lin, Zebang He, Rynson W. H. Lau. 13415-13424 [doi]

MR Image Super-Resolution With Squeeze and Excitation Reasoning Attention NetworkYulun Zhang, Kai Li 0012, Kunpeng Li, Yun Fu 0001. 13425-13434 [doi]

Rich Features for Perceptual Quality Assessment of UGC VideosYilin Wang, Junjie Ke, Hossein Talebi, Joong Gon Yim, Neil Birkbeck, Balu Adsumilli, Peyman Milanfar, Feng Yang. 13435-13444 [doi]

A 3D GAN for Improved Large-Pose Facial RecognitionRichard T. Marriott, Sami Romdhani, Liming Chen 0002. 13445-13455 [doi]

Sewer-ML: A Multi-Label Sewer Defect Classification Dataset and BenchmarkJoakim Bruslund Haurum, Thomas B. Moeslund. 13456-13467 [doi]

AGORA: Avatars in Geography Optimized for Regression AnalysisPriyanka Patel, Chun-Hao P. Huang, Joachim Tesch, David T. Hoffmann, Shashank Tripathi, Michael J. Black. 13468-13478 [doi]

SKFAC: Training Neural Networks With Faster Kronecker-Factored Approximate CurvatureZedong Tang, Fenlong Jiang, Maoguo Gong, Hao Li 0009, Yue Wu 0004, Fan Yu, Zidong Wang, Min Wang 0003. 13479-13487 [doi]

Tree-Like Decision DistillationJie Song, Haofei Zhang, Xinchao Wang, Mengqi Xue, Ying Chen, Li Sun, Dacheng Tao, Mingli Song. 13488-13497 [doi]

How Does Topology Influence Gradient Propagation and Model Performance of Deep Networks With DenseNet-Type Skip Connections?Kartikeya Bhardwaj, Guihong Li, Radu Marculescu. 13498-13507 [doi]

EnD: Entangling and Disentangling Deep Representations for Bias CorrectionEnzo Tartaglione, Carlo Alberto Barbano, Marco Grangetto. 13508-13517 [doi]

Learning Decision Trees Recurrently Through CommunicationStephan Alaniz, Diego Marcos, Bernt Schiele, Zeynep Akata. 13518-13527 [doi]

Neural Response Interpretation Through the Lens of Critical PathwaysAshkan Khakzar, Soroosh Baselizadeh, Saurabh Khanduja, Christian Rupprecht 0001, Seong Tae Kim 0001, Nassir Navab. 13528-13538 [doi]

Masksembles for Uncertainty EstimationNikita Durasov, Timur M. Bagautdinov, Pierre Baqué, Pascal Fua. 13539-13548 [doi]

Self-Supervised Video Hashing via Bidirectional TransformersShuyan Li, Xiu Li, Jiwen Lu, Jie Zhou 0001. 13549-13558 [doi]

3D Shape Generation With Grid-Based Implicit FunctionsMoritz Ibing, Isaak Lim, Leif Kobbelt. 13559-13568 [doi]

Positional Encoding As Spatial Inductive Bias in GANsRui Xu, Xintao Wang, Kai Chen, Bolei Zhou, Chen Change Loy. 13569-13578 [doi]

Blur, Noise, and Compression Robust Generative Adversarial NetworksTakuhiro Kaneko, Tatsuya Harada. 13579-13589 [doi]

Learning by Planning: Language-Guided Global Image EditingJing Shi 0005, Ning Xu, Yihang Xu, Trung Bui, Franck Dernoncourt, Chenliang Xu. 13590-13599 [doi]

Teachers Do More Than Teach: Compressing Image-to-Image ModelsQing Jin, Jian Ren, Oliver J. Woodford, Jiazhuo Wang, Geng Yuan, Yanzhi Wang, Sergey Tulyakov. 13600-13611 [doi]

Autoregressive Stylized Motion Synthesis With Generative FlowYu-Hui Wen, Zhipeng Yang, Hongbo Fu, Lin Gao 0004, Yanan Sun, Yong-Jin Liu. 13612-13621 [doi]

MUST-GAN: Multi-Level Statistics Transfer for Self-Driven Person Image GenerationTianxiang Ma, Bo Peng 0002, Wei Wang 0115, Jing Dong 0003. 13622-13631 [doi]

House-GAN++: Generative Adversarial Layout Refinement Network towards Intelligent Computational Agent for Professional ArchitectsNelson Nauata, Sepidehsadat Hosseini, Kai-Hung Chang, Hang Chu, Chin-Yi Cheng, Yasutaka Furukawa. 13632-13641 [doi]

Variational Transformer Networks for Layout GenerationDiego Martín Arroyo, Janis Postels, Federico Tombari. 13642-13652 [doi]

Motion Representations for Articulated AnimationAliaksandr Siarohin, Oliver J. Woodford, Jian Ren, Menglei Chai, Sergey Tulyakov. 13653-13662 [doi]

Pareto Self-Supervised Training for Few-Shot LearningZhengyu Chen, Jixie Ge, Heshen Zhan, Siteng Huang, Donglin Wang. 13663-13672 [doi]

RaScaNet: Learning Tiny Models by Raster-Scanning ImagesJaehyoung Yoo, Dongwook Lee, Changyong Son, Sangil Jung, ByungIn Yoo, Changkyu Choi, Jae-Joon Han, Bohyung Han. 13673-13682 [doi]

AlphaMatch: Improving Consistency for Semi-Supervised Learning With Alpha-DivergenceChengYue Gong, Dilin Wang, Qiang Liu 0001. 13683-13692 [doi]

Nearest Neighbor Matching for Deep ClusteringZhiyuan Dang, Cheng Deng, Xu Yang 0019, Kun Wei, Heng Huang. 13693-13702 [doi]

DeepACG: Co-Saliency Detection via Semantic-Aware Contrast Gromov-Wasserstein DistanceKaihua Zhang, Mingliang Dong, Bo Liu 0005, Xiao-Tong Yuan, Qingshan Liu 0001. 13703-13712 [doi]

Coordinate Attention for Efficient Mobile Network DesignQibin Hou, Daquan Zhou, Jiashi Feng. 13713-13722 [doi]

Landmark Regularization: Ranking Guided Super-Net Training in Neural Architecture SearchKaicheng Yu, René Ranftl, Mathieu Salzmann. 13723-13732 [doi]

RepVGG: Making VGG-Style ConvNets Great AgainXiaohan Ding, Xiangyu Zhang 0005, Ningning Ma, Jungong Han, Guiguang Ding, Jian Sun 0015. 13733-13742 [doi]

3D Graph Anatomy Geometry-Integrated Network for Pancreatic Mass Segmentation, Diagnosis, and Quantitative Patient ManagementTianyi Zhao, Kai Cao, Jiawen Yao, Isabella Nogues, Le Lu 0001, Lingyun Huang, Jing Xiao 0006, Zhaozheng Yin, Ling Zhang. 13743-13752 [doi]

Exploring and Distilling Posterior and Prior Knowledge for Radiology Report GenerationFenglin Liu, Xian Wu, Shen Ge, Wei Fan 0001, Yuexian Zou. 13753-13762 [doi]

Towards More Flexible and Accurate Object Tracking With Natural Language: Algorithms and BenchmarkXiao Wang, Xiujun Shu, Zhipeng Zhang, Bo Jiang, Yaowei Wang, Yonghong Tian 0001, Feng Wu. 13763-13773 [doi]

STMTrack: Template-Free Visual Tracking With Space-Time Memory NetworksZhihong Fu, Qingjie Liu, Zehua Fu, Yunhong Wang. 13774-13783 [doi]

DyGLIP: A Dynamic Graph Model With Link Prediction for Accurate Multi-Camera Multiple Object TrackingKha Gia Quach, Pha Nguyen, Huu Le, Thanh-Dat Truong, Chi Nhan Duong, Minh-Triet Tran, Khoa Luu. 13784-13793 [doi]

SuperMix: Supervising the Mixing Data AugmentationAli Dabouei, Sobhan Soleymani, Fariborz Taherkhani, Nasser M. Nasrabadi. 13794-13803 [doi]

Monte Carlo Scene Search for 3D Scene UnderstandingShreyas Hampali, Sinisa Stekovic, Sayan Deb Sarkar, Chetan Srinivasa Kumar, Friedrich Fraundorfer, Vincent Lepetit. 13804-13813 [doi]

MAZE: Data-Free Model Stealing Attack Using Zeroth-Order Gradient EstimationSanjay Kariyappa, Atul Prakash 0001, Moinuddin K. Qureshi. 13814-13823 [doi]

Visualizing Adapted Knowledge in Domain TransferYunzhong Hou, Liang Zheng. 13824-13833 [doi]

Prototypical Cross-Domain Self-Supervised Learning for Few-Shot Unsupervised Domain AdaptationXiangyu Yue, Zangwei Zheng, Shanghang Zhang, Yang Gao 0029, Trevor Darrell, Kurt Keutzer, Alberto L. Sangiovanni-Vincentelli. 13834-13844 [doi]

KSM: Fast Multiple Task Adaption via Kernel-Wise Soft Mask LearningLi Yang, Zhezhi He, Junshan Zhang, Deliang Fan. 13845-13853 [doi]

Picasso: A CUDA-Based Library for Deep Learning Over 3D MeshesHuan Lei, Naveed Akhtar, Ajmal Mian. 13854-13864 [doi]

Efficient Feature Transformations for Discriminative and Generative Continual LearningVinay Kumar Verma, Kevin J. Liang, Nikhil Mehta, Piyush Rai, Lawrence Carin. 13865-13875 [doi]

Spatial Assembly Networks for Image Representation LearningYang Li 0091, Shichao Kan, Jianhe Yuan, Wenming Cao 0001, Zhihai He. 13876-13885 [doi]

Self-Supervised Video Representation Learning by Context and Motion DecouplingLianghua Huang, Yu Liu, Bin Wang, Pan Pan, Yinghui Xu, Rong Jin. 13886-13895 [doi]

Learning Probabilistic Ordinal Embeddings for Uncertainty-Aware RegressionWanhua Li 0001, Xiaoke Huang, Jiwen Lu, Jianjiang Feng, Jie Zhou 0001. 13896-13905 [doi]

CFNet: Cascade and Fused Cost Volume for Robust Stereo MatchingZhelun Shen, Yuchao Dai, Zhibo Rao. 13906-13915 [doi]

Depth Completion Using Plane-Residual RepresentationByeong-uk Lee, Kyunghyun Lee 0004, In-So Kweon. 13916-13925 [doi]

Look Closer To Segment Better: Boundary Patch Refinement for Instance SegmentationChufeng Tang, Hang Chen, Xiao Li, Jianmin Li, Zhaoxiang Zhang, Xiaolin Hu. 13926-13935 [doi]

Energy-Based Learning for Scene Graph GenerationMohammed Suhail, Abhay Mittal, Behjat Siddiquie, Chris Broaddus, Jayan Eledath, Gérard G. Medioni, Leonid Sigal. 13936-13945 [doi]

Heterogeneous Grid Convolution for Adaptive, Efficient, and Controllable ComputationRyuhei Hamaguchi, Yasutaka Furukawa, Masaki Onishi, Ken Sakurada. 13946-13955 [doi]

DCNAS: Densely Connected Neural Architecture Search for Semantic Image SegmentationXiong Zhang, Hongmin Xu, Hong Mo, Jianchao Tan, Cheng Yang, Lei Wang, Wenqi Ren. 13956-13967 [doi]

Weakly Supervised Instance Segmentation for Videos With Temporal Mask ConsistencyQing Liu 0017, Vignesh Ramanathan, Dhruv Mahajan 0001, Alan L. Yuille, Zhenheng Yang. 13968-13978 [doi]

Few-Shot Segmentation Without Meta-Learning: A Good Transductive Inference Is All You Need?Malik Boudiaf, Hoel Kervadec, Imtiaz Masud Ziko, Pablo Piantanida, Ismail Ben Ayed, Jose Dolz. 13979-13988 [doi]

Conditional Bures Metric for Domain AdaptationYou-Wei Luo, Chuan-Xian Ren. 13989-13998 [doi]

Relative Order Analysis and Optimization for Unsupervised Deep Metric LearningShichao Kan, Yigang Cen, Yang Li 0091, Vladimir Mladenovic, Zhihai He. 13999-14008 [doi]

MIST: Multiple Instance Self-Training Framework for Video Anomaly DetectionJia-Chang Feng, Fa-Ting Hong, Wei-Shi Zheng. 14009-14018 [doi]

Patch-VQ: 'Patching Up' the Video Quality ProblemZhenqiang Ying, Maniratnam Mandal, Deepti Ghadiyaram, Alan C. Bovik. 14019-14029 [doi]

Boosting Video Representation Learning With Multi-Faceted IntegrationZhaofan Qiu, Ting Yao, Chong-Wah Ngo, Xiao-Ping Zhang, Dong Wu, Tao Mei 0001. 14030-14039 [doi]

Delving Deep Into Many-to-Many Attention for Few-Shot Video Object SegmentationHaoxin Chen, Hanjie Wu, Nanxuan Zhao, Sucheng Ren, Shengfeng He. 14040-14049 [doi]

FAIEr: Fidelity and Adequacy Ensured Image Caption EvaluationSijin Wang, Ziwei Yao, Ruiping Wang, Zhongqin Wu, Xilin Chen. 14050-14059 [doi]

Iterative Shrinking for Referring Expression Grounding Using Deep Reinforcement LearningMingjie Sun, Jimin Xiao, Eng Gee Lim. 14060-14069 [doi]

Repetitive Activity Counting by Sight and SoundYunhua Zhang, Ling Shao 0001, Cees G. M. Snoek. 14070-14079 [doi]

Audio-Driven Emotional Video PortraitsXinya Ji, Hang Zhou, Kaisiyuan Wang, Wayne Wu, Chen Change Loy, Xun Cao, Feng Xu. 14080-14089 [doi]

Improving Weakly Supervised Visual Grounding by Contrastive Knowledge DistillationLiwei Wang, Jing Huang, Yin Li, Kun Xu, Zhengyuan Yang, Dong Yu 0001. 14090-14100 [doi]

Hierarchical and Partially Observable Goal-Driven Policy Learning With Goals Relational GraphXin Ye, Yezhou Yang. 14101-14110 [doi]

KRISP: Integrating Implicit and Symbolic Knowledge for Open-Domain Knowledge-Based VQAKenneth Marino, Xinlei Chen, Devi Parikh, Abhinav Gupta 0001, Marcus Rohrbach. 14111-14121 [doi]

Focus on Local: Detecting Lane Marker From Bottom Up via Key PointZhan Qu, Huan Jin, Yang Zhou, Zhen Yang, Wei Zhang. 14122-14130 [doi]

VITON-HD: High-Resolution Virtual Try-On via Misalignment-Aware NormalizationSeunghwan Choi, Sunghyun Park, Minsoo Lee, Jaegul Choo. 14131-14140 [doi]

Patch-NetVLAD: Multi-Scale Fusion of Locally-Global Descriptors for Place RecognitionStephen Hausler, Sourav Garg, Ming Xu, Michael Milford, Tobias Fischer 0001. 14141-14152 [doi]

DeRF: Decomposed Radiance FieldsDaniel Rebain, Wei Jiang, Soroosh Yazdani, Ke Li, Kwang Moo Yi, Andrea Tagliasacchi. 14153-14161 [doi]

POSEFusion: Pose-Guided Selective Fusion for Single-View Human Volumetric CaptureZhe Li, Tao Yu 0007, Zerong Zheng, Kaiwen Guo, Yebin Liu. 14162-14172 [doi]

FESTA: Flow Estimation via Spatial-Temporal Attention for Scene Point CloudsHaiyan Wang, Jiahao Pang, Muhammad A. Lodhi, Yingli Tian, Dong Tian. 14173-14182 [doi]

Isometric Multi-Shape MatchingMaolin Gao, Zorah Lähner, Johan Thunberg, Daniel Cremers, Florian Bernard. 14183-14193 [doi]

PatchmatchNet: Learned Multi-View Patchmatch StereoFangjinhua Wang, Silvano Galliani, Christoph Vogel, Pablo Speciale, Marc Pollefeys. 14194-14203 [doi]

Point 4D Transformer Networks for Spatio-Temporal Modeling in Point Cloud VideosHehe Fan, Yi Yang 0001, Mohan S. Kankanhalli. 14204-14213 [doi]

Learning To Aggregate and Personalize 3D Face From In-the-Wild Photo CollectionZhenyu Zhang 0005, Yanhao Ge, Renwang Chen, Ying Tai, Yan Yan, Jian Yang 0003, Chengjie Wang, Jilin Li, Feiyue Huang. 14214-14224 [doi]

MagFace: A Universal Representation for Face Recognition and Quality AssessmentQiang Meng, Shichao Zhao, Zhida Huang, Feng Zhou 0002. 14225-14234 [doi]

Event-Based Synthetic Aperture Imaging With a Hybrid NetworkXiang Zhang, Wei Liao, Lei Yu 0006, Wen Yang 0001, Gui-Song Xia. 14235-14244 [doi]

GLEAN: Generative Latent Bank for Large-Factor Image Super-ResolutionKelvin C. K. Chan, Xintao Wang, Xiangyu Xu, Jinwei Gu, Chen Change Loy. 14245-14254 [doi]

NPAS: A Compiler-Aware Framework of Unified Network Pruning and Architecture Search for Beyond Real-Time Mobile AccelerationZhengang Li, Geng Yuan, Wei Niu, Pu Zhao, Yanyu Li, Yuxuan Cai, Xuan Shen, Zheng Zhan 0001, Zhenglun Kong, Qing Jin, ZhiYu Chen, Sijia Liu 0001, Kaiyuan Yang, Bin Ren, Yanzhi Wang, Xue Lin. 14255-14266 [doi]

Privacy-Preserving Image Features via Adversarial Affine Subspace EmbeddingsMihai Dusmanu, Johannes L. Schönberger, Sudipta N. Sinha, Marc Pollefeys. 14267-14277 [doi]

Image Generators With Conditionally-Independent Pixel SynthesisIvan Anokhin, Kirill Demochkin, Taras Khakhulin, Gleb Sterkin, Victor Lempitsky, Denis Korzhenkov. 14278-14287 [doi]

CoMoGAN: Continuous Model-Guided Image-to-Image TranslationFabio Pizzati, Pietro Cerri, Raoul de Charette. 14288-14298 [doi]

Positive-Congruent Training: Towards Regression-Free Model UpdatesSijie Yan, Yuanjun Xiong, Kaustav Kundu, Shuo Yang, Siqi Deng, Meng Wang, Wei Xia, Stefano Soatto. 14299-14308 [doi]

Capsule Network Is Not More Robust Than Convolutional NetworkJindong Gu, Volker Tresp, Han Hu 0004. 14309-14317 [doi]

Dual-Stream Multiple Instance Learning Network for Whole Slide Image Classification With Self-Supervised Contrastive LearningBin Li, Yin Li, Kevin W. Eliceiri. 14318-14328 [doi]

Probabilistic Tracklet Scoring and Inpainting for Multiple Object TrackingFatemeh Sadat Saleh, Sadegh Aliakbarian, Hamid Rezatofighi, Mathieu Salzmann, Stephen Gould. 14329-14339 [doi]

Adaptive Methods for Real-World Domain GeneralizationAbhimanyu Dubey, Vignesh Ramanathan, Alex Pentland, Dhruv Mahajan 0001. 14340-14349 [doi]

Self-Supervised Geometric PerceptionHeng Yang 0002, Wei Dong, Luca Carlone, Vladlen Koltun. 14350-14361 [doi]

HITNet: Hierarchical Iterative Tile Refinement Network for Real-time Stereo MatchingVladimir Tankovich, Christian Hane, Yinda Zhang 0001, Adarsh Kowdle, Sean Ryan Fanello, Sofien Bouaziz. 14362-14372 [doi]

Bidirectional Projection Network for Cross Dimension Scene UnderstandingWenbo Hu, Hengshuang Zhao, Li Jiang, Jiaya Jia, Tien-Tsin Wong. 14373-14382 [doi]

A Fourier-Based Framework for Domain GeneralizationQinwei Xu, Ruipeng Zhang, Ya Zhang 0002, Yanfeng Wang, Qi Tian 0001. 14383-14392 [doi]

Open-Vocabulary Object Detection Using CaptionsAlireza Zareian, Kevin Dela Rosa, Derek Hao Hu, Shih-Fu Chang. 14393-14402 [doi]

MP3: A Unified Model To Map, Perceive, Predict and PlanSergio Casas 0002, Abbas Sadat, Raquel Urtasun. 14403-14412 [doi]

Hierarchical Lovasz Embeddings for Proposal-Free Panoptic SegmentationTommi Kerola, Jie Li 0031, Atsushi Kanehira, Yasunori Kudo, Alexis Vallet, Adrien Gaidon. 14413-14423 [doi]

Accurate Few-Shot Object Detection With Support-Query Mutual Guidance and Hybrid LossLu Zhang, Shuigeng Zhou, Jihong Guan, Ji Zhang. 14424-14432 [doi]

GLAVNet: Global-Local Audio-Visual Cues for Fine-Grained Material RecognitionFengmin Shi, Jie Guo, Haonan Zhang, Shan Yang, Xiying Wang, Yanwen Guo 0001. 14433-14442 [doi]

Multi-Scale Aligned Distillation for Low-Resolution DetectionLu Qi, Jason Kuen, Jiuxiang Gu, Zhe Lin 0001, Yi Wang, Yukang Chen, Yanwei Li, Jiaya Jia. 14443-14453 [doi]

Sparse R-CNN: End-to-End Object Detection With Learnable ProposalsPeize Sun, Rufeng Zhang, Yi Jiang, Tao Kong, Chenfeng Xu, Wei Zhan, Masayoshi Tomizuka, Lei Li, Zehuan Yuan, Changhu Wang, Ping Luo 0002. 14454-14463 [doi]

Learning View Selection for 3D ScenesYifan Sun, Qixing Huang, Dun-Yu Hsiao, Li Guan, Gang Hua 0001. 14464-14473 [doi]

Multi-Person Implicit Reconstruction From a Single ImageArmin Mustafa, Akin Caliskan, Lourdes Agapito, Adrian Hilton. 14474-14483 [doi]

Neural Descent for Visual 3D Human Pose and ShapeAndrei Zanfir, Eduard Gabriel Bazavan, Mihai Zanfir, William T. Freeman, Rahul Sukthankar, Cristian Sminchisescu. 14484-14493 [doi]

SE-SSD: Self-Ensembling Single-Stage Object Detector From Point CloudWu Zheng, Weiliang Tang, Li Jiang, Chi-Wing Fu. 14494-14503 [doi]

SCF-Net: Learning Spatial Contextual Features for Large-Scale Point Cloud SegmentationSiqi Fan, Qiulei Dong, Fenghua Zhu, Yisheng Lv, Peijun Ye, Fei-Yue Wang 0001. 14504-14513 [doi]

Equivariant Point Network for 3D Point Cloud AnalysisHaiwei Chen, Shichen Liu, Weikai Chen 0001, Hao Li 0015, Randall Hill. 14514-14523 [doi]

DeepSurfels: Learning Online Appearance FusionMarko Mihajlovic, Silvan Weder, Marc Pollefeys, Martin R. Oswald. 14524-14535 [doi]

Efficient Deformable Shape Correspondence via Multiscale Spectral Manifold Wavelets PreservationLing Hu, Qinsong Li, Shengjun Liu, Xinru Liu. 14536-14545 [doi]

Efficient Initial Pose-Graph Generation for Global SfMDaniel Barath, Dmytro Mishkin, Ivan Eichhardt, Ilia Shipachev, Jiri Matas. 14546-14555 [doi]

AutoInt: Automatic Integration for Fast Neural Volume RenderingDavid B. Lindell, Julien N. P. Martel, Gordon Wetzstein. 14556-14565 [doi]

Extreme Rotation Estimation Using Dense Correlation VolumesRuojin Cai, Bharath Hariharan, Noah Snavely, Hadar Averbuch-Elor. 14566-14575 [doi]

A Quasiconvex Formulation for Radial CamerasCarl Olsson, Viktor Larsson, Fredrik Kahl. 14576-14585 [doi]

ReAgent: Point Cloud Registration Using Imitation and Reinforcement LearningDominik Bauer, Timothy Patten, Markus Vincze. 14586-14594 [doi]

Monocular Depth Estimation via Listwise Ranking Using the Plackett-Luce ModelJulian Lienen, Eyke Hüllermeier, Ralph Ewerth, Nils Nommensen. 14595-14604 [doi]

HVPR: Hybrid Voxel-Point Representation for Single-Stage 3D Object DetectionJongyoun Noh, Sanghoon Lee, Bumsub Ham. 14605-14614 [doi]

3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object DetectionHe Wang 0010, Yezhen Cong, Or Litany, Yue Gao, Leonidas J. Guibas. 14615-14624 [doi]

Multi-Label Activity Recognition Using Activity-Specific Features and Activity CorrelationsYanyi Zhang, Xinyu Li, Ivan Marsic. 14625-14635 [doi]

LaPred: Lane-Aware Prediction of Multi-Modal Future Trajectories of Dynamic AgentsByeoungdo Kim, SeongHyeon Park, Seokhwan Lee, Elbek Khoshimjonov, Dongsuk Kum, Junsoo Kim, Jeong-Soo Kim, Jun Won Choi. 14636-14645 [doi]

Detecting Human-Object Interaction via Fabricated Compositional LearningZhi Hou, Baosheng Yu, Yu Qiao 0001, Xiaojiang Peng, Dacheng Tao. 14646-14655 [doi]

Understanding the Robustness of Skeleton-Based Action Recognition Under Adversarial AttackHe Wang 0002, Feixiang He, Zhexi Peng, Tianjia Shao, Yong-Liang Yang, Kun Zhou 0001, David Hogg. 14656-14665 [doi]

Invisible Perturbations: Physical Adversarial Examples Exploiting the Rolling Shutter EffectAthena Sayles, Ashish Hooda, Mohit Gupta, Rahul Chatterjee 0001, Earlence Fernandes. 14666-14675 [doi]

Bottom-Up Human Pose Estimation via Disentangled Keypoint RegressionZigang Geng, Ke Sun 0009, Bin Xiao, Zhaoxiang Zhang, Jingdong Wang 0001. 14676-14686 [doi]

Semi-Supervised 3D Hand-Object Poses Estimation With Interactions in TimeShaowei Liu, Hanwen Jiang, Jiarui Xu, Sifei Liu, Xiaolong Wang 0004. 14687-14697 [doi]

Inverse Simulation: Reconstructing Dynamic Geometry of Clothed Humans via Optimal ControlJingfan Guo, Jie Li, Rahul Narain, Hyun Soo Park. 14698-14707 [doi]

Populating 3D Scenes by Learning Human-Scene InteractionMohamed Hassan, Partha Ghosh, Joachim Tesch, Dimitrios Tzionas, Michael J. Black. 14708-14718 [doi]

Towards High Fidelity Face Relighting With Realistic ShadowsAndrew Hou, Ze Zhang, Michel Sarkis, Ning Bi, Yiying Tong, Xiaoming Liu 0002. 14719-14728 [doi]

VirFace: Enhancing Face Recognition via Unlabeled Shallow DataWenyu Li, Tianchu Guo, Pengyu Li, Binghui Chen, Biao Wang, Wangmeng Zuo, Lei Zhang 0006. 14729-14738 [doi]

Birds of a Feather: Capturing Avian Shape Models From ImagesYufu Wang, Nikos Kolotouros, Kostas Daniilidis, Marc Badger. 14739-14749 [doi]

Unsupervised Pre-Training for Person Re-IdentificationDengpan Fu, Dongdong Chen 0001, Jianmin Bao, Hao Yang, Lu Yuan, Lei Zhang 0001, Houqiang Li, Dong Chen 0003. 14750-14759 [doi]

Indoor Lighting Estimation Using an Event CameraZehao Chen, Qian Zheng, Peisong Niu, Huajin Tang, Gang Pan 0001. 14760-14770 [doi]

Checkerboard Context Model for Efficient Learned Image CompressionDailan He, Yaoyan Zheng, Baocheng Sun, Yan Wang, Hongwei Qin. 14771-14780 [doi]

Neighbor2Neighbor: Self-Supervised Denoising From Single Noisy ImagesTao Huang, Songjiang Li, Xu Jia, Huchuan Lu, Jianzhuang Liu. 14781-14790 [doi]

From Rain Generation to Rain RemovalHong Wang, Zongsheng Yue, Qi Xie, Qian Zhao 0002, Yefeng Zheng, Deyu Meng. 14791-14801 [doi]

Rank-One Prior: Toward Real-Time Scene RecoveryJun Liu, Wen Liu, Jianing Sun, Tieyong Zeng. 14802-14810 [doi]

Robust Reflection Removal With Reflection-Free Flash-Only CuesChenyang Lei, Qifeng Chen. 14811-14820 [doi]

Multi-Stage Progressive Image RestorationSyed Waqas Zamir, Aditya Arora, Salman H. Khan 0001, Munawar Hayat, Fahad Shahbaz Khan, Ming-Hsuan Yang 0001, Ling Shao 0001. 14821-14831 [doi]

Shape From Sky: Polarimetric Normal Recovery Under the SkyTomoki Ichikawa, Matthew Purri, Ryo Kawahara, Shohei Nobuhara, Kristin J. Dana, Ko Nishino. 14832-14841 [doi]

Cross-MPI: Cross-Scale Stereo for Image Super-Resolution Using Multiplane ImagesYuemei Zhou, Gaochang Wu, Ying Fu, Kun Li, Yebin Liu. 14842-14851 [doi]

Deep Perceptual Preprocessing for Video CodingAaron Chadha, Yiannis Andreopoulos. 14852-14861 [doi]

StyleMix: Separating Content and Style for Enhanced Data AugmentationMinui Hong, Jinwoo Choi, Gunhee Kim. 14862-14870 [doi]

Spoken Moments: Learning Joint Audio-Visual Representations From Video DescriptionsMathew Monfort, SouYoung Jin, Alexander H. Liu, David Harwath, Rogério Feris, James R. Glass, Aude Oliva. 14871-14881 [doi]

Spatially-Adaptive Pixelwise Networks for Fast Image TranslationTamar Rott Shaham, Michaël Gharbi, Richard Zhang 0001, Eli Shechtman, Tomer Michaeli. 14882-14891 [doi]

No Frame Left Behind: Full Video Action RecognitionXin Liu, Silvia L. Pintea, Fatemeh Karimi Nejadasl, Olaf Booij, Jan C. van Gemert. 14892-14901 [doi]

Multiresolution Knowledge Distillation for Anomaly DetectionMohammadreza Salehi, Niousha Sadjadi, Soroosh Baselizadeh, Mohammad H. Rohban, Hamid R. Rabiee. 14902-14912 [doi]

Convolutional Neural Network Pruning With Structural Redundancy ReductionZi Wang, Chengcheng Li, Xiangyang Wang. 14913-14922 [doi]

Representative Forgery Mining for Fake Face DetectionChengrui Wang, Weihong Deng. 14923-14932 [doi]

Neural Prototype Trees for Interpretable Fine-Grained Image RecognitionMeike Nauta, Ron van Bree, Christin Seifert. 14933-14943 [doi]

Relevance-CAM: Your Model Already Knows Where To LookJeong Ryong Lee, Sewon Kim, Inyong Park, Taejoon Eo, Dosik Hwang. 14944-14953 [doi]

Adaptive Cross-Modal Prototypes for Cross-Domain Visual-Language RetrievalYang Liu 0105, Qingchao Chen, Samuel Albanie. 14954-14964 [doi]

Efficient Object Embedding for Spliced Image RetrievalBor-Chun Chen, Zuxuan Wu, Larry S. Davis, Ser-Nam Lim. 14965-14975 [doi]

Generative PointNet: Deep Energy-Based Learning on Unordered Point Sets for 3D Generation, Reconstruction and ClassificationJianwen Xie, Yifei Xu, Zilong Zheng, Song Chun Zhu, Ying Nian Wu. 14976-14985 [doi]

Anycost GANs for Interactive Image Synthesis and EditingJi Lin 0002, Richard Zhang 0001, Frieder Ganz, Song Han 0003, Jun-Yan Zhu. 14986-14996 [doi]

Ensembling With Deep Generative ViewsLucy Chai, Jun-Yan Zhu, Eli Shechtman, Phillip Isola, Richard Zhang 0001. 14997-15007 [doi]

Continuous Face Aging via Self-Estimated Residual Age EmbeddingZeqi Li, Ruowei Jiang, Parham Aarabi. 15008-15017 [doi]

ReMix: Towards Image-to-Image Translation With Limited DataJie Cao 0002, Luanxuan Hou, Ming-Hsuan Yang 0001, Ran He, Zhenan Sun. 15018-15027 [doi]

Unbalanced Feature Transport for Exemplar-Based Image TranslationFangneng Zhan, Yingchen Yu, Kaiwen Cui, Gongjie Zhang, Shijian Lu, Jianxiong Pan, Changgong Zhang, Feiying Ma, Xuansong Xie, Chunyan Miao. 15028-15038 [doi]

Pose-Guided Human Animation From a Single Image in the WildJae Shin Yoon, Lingjie Liu, Vladislav Golyanik, Kripasindhu Sarkar, Hyun Soo Park, Christian Theobalt. 15039-15048 [doi]

Context-Aware Layout to Image Generation With Enhanced Object AppearanceSen He, Wentong Liao, Michael Ying Yang, Yongxin Yang, Yi-Zhe Song, Bodo Rosenhahn, Tao Xiang. 15049-15058 [doi]

SetVAE: Learning Hierarchical Composition for Generative Modeling of Set-Structured DataJinwoo Kim, Jaehoon Yoo, Juho Lee, Seunghoon Hong. 15059-15068 [doi]

Are Labels Always Necessary for Classifier Accuracy Evaluation?Weijian Deng, Liang Zheng. 15069-15078 [doi]

Graph-Based High-Order Relation Discovery for Fine-Grained RecognitionYifan Zhao, Ke Yan, Feiyue Huang, Jia Li. 15079-15088 [doi]

Long-Tailed Multi-Label Visual Recognition by Collaborative Training on Uniform and Re-Balanced SamplingsHao Guo 0002, Song Wang 0002. 15089-15098 [doi]

SimPLE: Similar Pseudo Label Exploitation for Semi-Supervised ClassificationZijian Hu, Zhengyu Yang, Xuefeng Hu, Ram Nevatia. 15099-15108 [doi]

Cluster-Wise Hierarchical Generative Model for Deep Amortized ClusteringHuafeng Liu, Jiaqi Wang, Liping Jing. 15109-15118 [doi]

From Semantic Categories to Fixations: A Novel Weakly-Supervised Visual-Auditory Saliency Detection ApproachGuotao Wang, Chenglizhao Chen, Deng-Ping Fan, Aimin Hao, Hong Qin. 15119-15128 [doi]

Gaussian Context TransformerDongsheng Ruan, Daiyin Wang, Yuan Zheng, Nenggan Zheng, Min Zheng. 15129-15138 [doi]

FP-NAS: Fast Probabilistic Neural Architecture SearchZhicheng Yan, Xiaoliang Dai, Peizhao Zhang, Yuandong Tian, Bichen Wu, Matt Feiszli. 15139-15148 [doi]

Time Adaptive Recurrent Neural NetworkAnil Kag, Venkatesh Saligrama. 15149-15158 [doi]

Deep Lesion Tracker: Monitoring Lesions in 4D Longitudinal Imaging StudiesJinzheng Cai, Youbao Tang, Ke Yan 0006, Adam P. Harrison, Jing Xiao 0006, Gigin Lin, Le Lu 0001. 15159-15169 [doi]

Reciprocal Landmark Detection and Tracking With Extremely Few AnnotationsJianzhe Lin, Ghazal Sahebzamani, Christina Luong, Fatemeh Taheri Dezaki, Mohammad Jafari, Purang Abolmaesumi, Teresa Tsang. 15170-15179 [doi]

LightTrack: Finding Lightweight Neural Networks for Object Tracking via One-Shot Architecture SearchBin Yan, Houwen Peng, Kan Wu, Dong Wang 0004, Jianlong Fu, Huchuan Lu. 15180-15189 [doi]

TesseTrack: End-to-End Learnable Multi-Person Articulated 3D Pose TrackingN. Dinesh Reddy, Laurent Guigues, Leonid Pishchulin, Jayan Eledath, Srinivasa G. Narasimhan. 15190-15200 [doi]

Learning Optical Flow From Still ImagesFilippo Aleotti, Matteo Poggi, Stefano Mattoccia. 15201-15211 [doi]

Towards Robust Classification Model by Counterfactual and Invariant Data GenerationChun-Hao Chang, George-Alexandru Adam, Anna Goldenberg. 15212-15221 [doi]

StablePose: Learning 6D Object Poses From Geometrically Stable PatchesYifei Shi, Junwen Huang, Xin Xu 0001, Yifan Zhang, Kai Xu 0004. 15222-15231 [doi]

The Translucent Patch: A Physical and Universal Attack on Object DetectorsAlon Zolfi, Moshe Kravchik, Yuval Elovici, Asaf Shabtai. 15232-15241 [doi]

Dynamic Weighted Learning for Unsupervised Domain AdaptationNi Xiao, Lei Zhang. 15242-15251 [doi]

DRANet: Disentangling Representation and Adaptation Networks for Unsupervised Cross-Domain AdaptationSeunghun Lee, Sunghyun Cho, Sunghoon Im. 15252-15261 [doi]

Natural Adversarial ExamplesDan Hendrycks, Kevin Zhao, Steven Basart, Jacob Steinhardt, Dawn Song. 15262-15271 [doi]

Fast End-to-End Learning on Protein SurfacesFreyr Sverrisson, Jean Feydy, Bruno E. Correia, Michael M. Bronstein. 15272-15281 [doi]

Rectification-Based Knowledge Retention for Continual LearningPravendra Singh, Pratik Mazumder, Piyush Rai, Vinay P. Namboodiri. 15282-15291 [doi]

Cross-Domain Similarity Learning for Face Recognition in Unseen DomainsMasoud Faraki, Xiang Yu 0002, Yi-Hsuan Tsai, Yumin Suh, Manmohan Chandraker. 15292-15301 [doi]

Sequence-to-Sequence Contrastive Learning for Text RecognitionAviad Aberdam, Ron Litman, Shahar Tsiper, Oron Anschel, Ron Slossberg, Shai Mazor, R. Manmatha, Pietro Perona. 15302-15312 [doi]

MOOD: Multi-Level Out-of-Distribution DetectionZiqian Lin, Sreya Dutta Roy, Yixuan Li. 15313-15323 [doi]

DeepVideoMVS: Multi-View Stereo on Video With Recurrent Spatio-Temporal FusionArda Düzçeker, Silvano Galliani, Christoph Vogel, Pablo Speciale, Mihai Dusmanu, Marc Pollefeys. 15324-15333 [doi]

Boundary IoU: Improving Object-Centric Image Segmentation EvaluationBowen Cheng, Ross B. Girshick, Piotr Dollár, Alexander C. Berg, Alexander Kirillov. 15334-15342 [doi]

A2-FPN: Attention Aggregation Based Feature Pyramid Network for Instance SegmentationMiao Hu, Yali Li 0001, Lu Fang, Shengjin Wang. 15343-15352 [doi]

SSLayout360: Semi-Supervised Indoor Layout Estimation From 360deg PanoramaPhi Vu Tran. 15353-15362 [doi]

Complete & Label: A Domain Adaptation Approach to Semantic Segmentation of LiDAR Point CloudsLi Yi, Boqing Gong, Thomas A. Funkhouser. 15363-15373 [doi]

Improved Image Matting via Real-Time User Clicks and Uncertainty EstimationTianyi Wei, Dongdong Chen 0001, Wenbo Zhou, Jing Liao 0001, Hanqing Zhao, Weiming Zhang, Nenghai Yu. 15374-15383 [doi]

Self-Supervised Augmentation Consistency for Adapting Semantic SegmentationNikita Araslanov, Stefan Roth 0001. 15384-15394 [doi]

Few-Shot Object Detection via Classification Refinement and Distractor RetreatmentYiting Li, Haiyue Zhu, Yu Cheng, Wenxin Wang, Chek-Sing Teo, Cheng Xiang 0001, Prahlad Vadakkepat, Tong Heng Lee. 15395-15403 [doi]

Counterfactual Zero-Shot and Open-Set Visual RecognitionZhongqi Yue, Tan Wang, Qianru Sun, Xian-Sheng Hua 0001, Hanwang Zhang. 15404-15414 [doi]

Learning Deep Latent Variable Models by Short-Run MCMC Inference With Optimal Transport CorrectionDongsheng An, Jianwen Xie, Ping Li. 15415-15424 [doi]

Learning Normal Dynamics in Videos With Meta Prototype NetworkHui Lv, Chen Chen, Zhen Cui, Chunyan Xu, Yong Li, Jian Yang 0003. 15425-15434 [doi]

MotionRNN: A Flexible Model for Video Prediction With Spacetime-Varying MotionsHaixu Wu, Zhiyu Yao, Jianmin Wang 0001, Mingsheng Long. 15435-15444 [doi]

Learning To Recommend Frame for Interactive Video Object Segmentation in the WildZhaoyuan Yin, Jia Zheng, Weixin Luo, Shenhan Qian, Hanling Zhang, Shenghua Gao. 15445-15454 [doi]

Reciprocal Transformations for Unsupervised Video Object SegmentationSucheng Ren, Wenxi Liu, Yongtuo Liu, Haoxin Chen, Guoqiang Han, Shengfeng He. 15455-15464 [doi]

RSTNet: Captioning With Adaptive Attention on Visual and Non-Visual WordsXuying Zhang, Xiaoshuai Sun, Yunpeng Luo, Jiayi Ji, Yiyi Zhou, Yongjian Wu, Feiyue Huang, Rongrong Ji. 15465-15474 [doi]

Revamping Cross-Modal Recipe Retrieval With Hierarchical Transformers and Self-Supervised LearningAmaia Salvador, Erhan Gundogdu, Loris Bazzani, Michael Donoser. 15475-15484 [doi]

Visually Informed Binaural Audio Generation without Binaural AudiosXudong Xu, Hang Zhou, Ziwei Liu 0002, Bo Dai, Xiaogang Wang 0001, Dahua Lin. 15485-15494 [doi]

VisualVoice: Audio-Visual Speech Separation With Cross-Modal ConsistencyRuohan Gao, Kristen Grauman. 15495-15505 [doi]

Encoder Fusion Network With Co-Attention Embedding for Referring Image SegmentationGuang Feng, Zhiwei Hu, Lihe Zhang, Huchuan Lu. 15506-15515 [doi]

Semantic Audio-Visual NavigationChangan Chen, Ziad Al-Halah, Kristen Grauman. 15516-15525 [doi]

Bridge To Answer: Structure-Aware Graph Interaction Network for Video Question AnsweringJungin Park, Jiyoung Lee, Kwanghoon Sohn. 15526-15535 [doi]

Projecting Your View Attentively: Monocular Road Scene Layout Estimation via Cross-View TransformationWeixiang Yang, Qi Li, Wenxi Liu, Yuanlong Yu, Yuexin Ma, Shengfeng He, Jia Pan. 15536-15545 [doi]

Toward Accurate and Realistic Outfits Visualization With Attention to DetailsKedan Li, Min Jin Chong, Jeffrey Zhang, Jingen Liu. 15546-15555 [doi]

Interpretable Social Anchors for Human Trajectory Forecasting in CrowdsParth Kothari, Brian Sifringer, Alexandre Alahi. 15556-15566 [doi]

Deep Polarization Imaging for 3D Shape and SVBRDF AcquisitionValentin Deschaintre, Yiming Lin, Abhijeet Ghosh. 15567-15576 [doi]

Self-Point-Flow: Self-Supervised Scene Flow Estimation From Point Clouds With Optimal Transport and Random WalkRuibo Li, Guosheng Lin, Lihua Xie. 15577-15586 [doi]

Exploring Data-Efficient 3D Scene Understanding With Contrastive Scene ContextsJi Hou, Benjamin Graham, Matthias Nießner, Saining Xie. 15587-15597 [doi]

NeuralRecon: Real-Time Coherent 3D Reconstruction From Monocular VideoJiaming Sun, Yiming Xie, Linghao Chen, Xiaowei Zhou, Hujun Bao. 15598-15607 [doi]

FrameExit: Conditional Early Exiting for Efficient Video RecognitionAmir Ghodrati, Babak Ehteshami Bejnordi, AmirHossein Habibian. 15608-15618 [doi]

Inverting Generative Adversarial Renderer for Face ReconstructionJingtan Piao, Keqiang Sun, Quan Wang, Kwan-Yee Lin, Hongsheng Li 0001. 15619-15628 [doi]

Spherical Confidence Learning for Face RecognitionShen Li, Jianqing Xu, Xiaqing Xu, Pengcheng Shen, Shaoxin Li, Bryan Hooi. 15629-15637 [doi]

Event-Based Bispectral Photometry Using Temporally Modulated IlluminationTsuyoshi Takatani, Yuzuha Ito, Ayaka Ebisu, Yinqiang Zheng, Takahito Aoto 0002. 15638-15647 [doi]

AdderSR: Towards Energy Efficient Image Super-ResolutionDehua Song, Yunhe Wang 0001, Hanting Chen, Chang Xu 0002, Chunjing Xu, Dacheng Tao. 15648-15657 [doi]

Diversifying Sample Generation for Accurate Data-Free QuantizationXiangguo Zhang, Haotong Qin, Yifu Ding, Ruihao Gong, Qinghua Yan, Renshuai Tao, Yuhang Li, Fengwei Yu, Xianglong Liu. 15658-15667 [doi]

How Privacy-Preserving Are Line Clouds? Recovering Scene Details From 3D LinesKunal Chelani, Fredrik Kahl, Torsten Sattler. 15668-15678 [doi]

Unsupervised Learning of Depth and Depth-of-Field Effect From Natural Images With Aperture Rendering Generative Adversarial NetworksTakuhiro Kaneko. 15679-15688 [doi]

Stylized Neural PaintingZhengxia Zou, Tianyang Shi, Shuang Qiu, Yi Yuan 0002, Zhenwei Shi. 15689-15698 [doi]

Permute, Quantize, and Fine-Tune: Efficient Compression of Neural NetworksJulieta Martinez, Jashan Shewakramani, Ting-Wei Liu, Ioan Andrei Barsan, Wenyuan Zeng, Raquel Urtasun. 15699-15708 [doi]

Amalgamating Knowledge From Heterogeneous Graph Neural NetworksYongcheng Jing, Yiding Yang, Xinchao Wang, Mingli Song, Dacheng Tao. 15709-15718 [doi]

XProtoNet: Diagnosis in Chest Radiography With Global and Local ExplanationsEunji Kim, Siwon Kim, Minji Seo, Sungroh Yoon. 15719-15728 [doi]

LQF: Linear Quadratic Fine-TuningAlessandro Achille, Aditya Golatkar, Avinash Ravichandran, Marzia Polito, Stefano Soatto. 15729-15739 [doi]

DECOR-GAN: 3D Shape Detailization by Conditional RefinementZhiqin Chen, Vladimir G. Kim, Matthew Fisher, Noam Aigerman, Hao Zhang 0002, Siddhartha Chaudhuri. 15740-15749 [doi]

Exploring Simple Siamese Representation LearningXinlei Chen, Kaiming He. 15750-15758 [doi]

Camera Pose Matters: Improving Depth Prediction by Mitigating Pose Distribution BiasYunhan Zhao, Shu Kong, Charless C. Fowlkes. 15759-15768 [doi]

DANNet: A One-Stage Domain Adaptation Network for Unsupervised Nighttime Semantic SegmentationXinyi Wu, Zhenyao Wu, Hao Guo 0002, Lili Ju, Song Wang 0002. 15769-15778 [doi]

OTCE: A Transferability Metric for Cross-Domain Cross-Task RepresentationsYang Tan, Yang Li, Shao-Lun Huang. 15779-15788 [doi]

Learning the Best Pooling Strategy for Visual Semantic EmbeddingJiacheng Chen, Hexiang Hu, Hao Wu 0011, Yuning Jiang, Changhu Wang. 15789-15798 [doi]

Divide-and-Conquer for Lane-Aware Diverse Trajectory PredictionSriram Narayanan, Ramin Moslemi, Francesco Pittaluga, Buyu Liu, Manmohan Chandraker. 15799-15808 [doi]

Magic Layouts: Structural Prior for Component Detection in User Interface DesignsDipu Manandhar, Hailin Jin, John P. Collomosse. 15809-15818 [doi]

Dense Label Encoding for Boundary Discontinuity Free Rotation DetectionXue Yang 0005, Liping Hou, Yue Zhou 0005, Wentao Wang, Junchi Yan. 15819-15829 [doi]

MetaHTR: Towards Writer-Adaptive Handwritten Text RecognitionAyan Kumar Bhunia, Shuvozit Ghose, Amandeep Kumar, Pinaki Nath Chowdhury, Aneeshan Sain, Yi-Zhe Song. 15830-15839 [doi]

PSRR-MaxpoolNMS: Pyramid Shifted MaxpoolNMS With Relationship RecoveryTianyi Zhang, Jie Lin 0001, Peng Hu 0002, Bin Zhao, Mohamed M. Sabry Aly. 15840-15848 [doi]

End-to-End Object Detection With Fully Convolutional NetworkJianfeng Wang, Lin Song, Zeming Li, Hongbin Sun 0001, Jian Sun 0015, Nanning Zheng 0001. 15849-15858 [doi]

PointDSC: Robust Point Cloud Registration Using Deep Spatial ConsistencyXuyang Bai, Zixin Luo, Lei Zhou, hongkai Chen, Lei Li 0038, Zeyu Hu, Hongbo Fu, Chiew-Lan Tai. 15859-15869 [doi]

Wide-Depth-Range 6D Object Pose Estimation in SpaceYinlin Hu, Sébastien Speierer, Wenzel Jakob, Pascal Fua, Mathieu Salzmann. 15870-15879 [doi]

Fostering Generalization in Single-View 3D Reconstruction by Learning a Hierarchy of Local and Global Shape PriorsJan Bechtold, Maxim Tatarchenko, Volker Fischer 0003, Thomas Brox. 15880-15889 [doi]

View-Guided Point Cloud CompletionXuancheng Zhang, Yutong Feng, Siqi Li, Changqing Zou, Hai Wan, Xibin Zhao, Yandong Guo, Yue Gao 0002. 15890-15899 [doi]

Regularization Strategy for Point Cloud via Rigidly Mixed SampleDogyoon Lee, Jaeha Lee, Junhyeop Lee, Hyeongmin Lee, Minhyeok Lee, Sungmin Woo, Sangyoun Lee. 15900-15909 [doi]

PWCLO-Net: Deep LiDAR Odometry in 3D Point Clouds Using Hierarchical Embedding Mask OptimizationGuangming Wang, Xinrui Wu, Zhe Liu, Hesheng Wang. 15910-15919 [doi]

Co-Attention for Conditioned Image MatchingOlivia Wiles, Sébastien Ehrhardt, Andrew Zisserman. 15920-15929 [doi]

A Dual Iterative Refinement Method for Non-Rigid Shape MatchingRui Xiang, Rongjie Lai, HongKai Zhao. 15930-15939 [doi]

NeRD: Neural 3D Reflection Symmetry DetectorYichao Zhou, Shichen Liu, Yi Ma 0001. 15940-15949 [doi]

Deep Lucas-Kanade Homography for Multimodal Image AlignmentYiming Zhao, Xinming Huang 0001, Ziming Zhang. 15950-15959 [doi]

DeepI2P: Image-to-Point Cloud Registration via Deep ClassificationJiaxin Li, Gim Hee Lee. 15960-15969 [doi]

NormalFusion: Real-Time Acquisition of Surface Normals for High-Resolution RGB-D ScanningHyunho Ha, Joo-Ho Lee, Andreas Meuleman, Min H. Kim 0001. 15970-15979 [doi]

LASR: Learning Articulated Shape Reconstruction From a Monocular VideoGengshan Yang, Deqing Sun, Varun Jampani, Daniel Vlasic, Forrester Cole, Huiwen Chang, Deva Ramanan, William T. Freeman, Ce Liu. 15980-15989 [doi]

Mirror3D: Depth Refinement for Mirror SurfacesJiaqi Tan, Weijie Lin, Angel X. Chang, Manolis Savva. 15990-15999 [doi]

To the Point: Efficient 3D Object Detection in the Range Image With Graph Convolution KernelsYuning Chai, Pei Sun, Jiquan Ngiam, Weiyue Wang, Benjamin Caine, Vijay Vasudevan, Xiao Zhang, Dragomir Anguelov. 16000-16009 [doi]

CoLA: Weakly-Supervised Temporal Action Localization With Snippet Contrastive LearningCan Zhang, Meng Cao, Dongming Yang, Jie Chen, Yuexian Zou. 16010-16019 [doi]

MoViNets: Mobile Video Networks for Efficient Video RecognitionDan Kondratyuk, Liangzhe Yuan, Yandong Li, Li Zhang, Mingxing Tan, Matthew Brown, Boqing Gong. 16020-16030 [doi]

Few-Shot Transformation of Common Actions Into Time and SpacePengwan Yang, Pascal Mettes, Cees G. M. Snoek. 16031-16040 [doi]

Learning Asynchronous and Sparse Human-Object Interaction in VideosRomero Morais, Vuong Le, Svetha Venkatesh, Truyen Tran 0001. 16041-16050 [doi]

Adversarial Imaging PipelinesBuu Phan, Fahim Mannan, Felix Heide. 16051-16061 [doi]

Adversarial Laser Beam: Effective Physical-World Attack to DNNs in a BlinkRanjie Duan, Xiaofeng Mao, A. Kai Qin, Yuefeng Chen, Shaokai Ye, Yuan He, Yun Yang. 16062-16071 [doi]

ViPNAS: Efficient Video Pose Estimation via Neural Architecture SearchLumin Xu, Yingda Guan, Sheng Jin 0007, Wentao Liu 0002, Chen Qian 0006, Ping Luo 0002, Wanli Ouyang, Xiaogang Wang 0001. 16072-16081 [doi]

SCALE: Modeling Clothed Humans with a Surface Codec of Articulated Local ElementsQianli Ma, Shunsuke Saito, Jinlong Yang, Siyu Tang, Michael J. Black. 16082-16093 [doi]

Probabilistic 3D Human Shape and Pose Estimation From Multiple Unconstrained Images in the WildAkash Sengupta, Ignas Budvytis, Roberto Cipolla. 16094-16104 [doi]

Graph Stacked Hourglass Networks for 3D Human Pose EstimationTianhan Xu, Wataru Takano. 16105-16114 [doi]

High-Fidelity and Arbitrary Face EditingYue Gao, Fangyun Wei, Jianmin Bao, Shuyang Gu, Dong Chen 0003, Fang Wen, Zhouhui Lian. 16115-16124 [doi]

IronMask: Modular Architecture for Protecting Deep Face TemplateSunpill Kim, Yunseong Jeong, Jinsu Kim, Jungkon Kim, Hyung Tae Lee, Jae Hong Seo. 16125-16134 [doi]

Meta-Mining Discriminative Samples for Kinship VerificationWanhua Li 0001, Shiwei Wang, Jiwen Lu, Jianjiang Feng, Jie Zhou 0001. 16135-16144 [doi]

Generalizable Person Re-Identification With Relevance-Aware Mixture of ExpertsYongxing Dai, Xiaotong Li, Jun Liu, Zekun Tong, Ling-Yu Duan. 16145-16154 [doi]

Time Lens: Event-Based Video Frame InterpolationStepan Tulyakov, Daniel Gehrig, Stamatios Georgoulis, Julius Erbach, Mathias Gehrig, Yuanyou Li, Davide Scaramuzza 0001. 16155-16164 [doi]

How To Exploit the Transferability of Learned Image Compression to Conventional CodecsJan P. Klopp, Keng-Chi Liu, Liang-Gee Chen, Shao-Yi Chien. 16165-16174 [doi]

Pseudo 3D Auto-Correlation Network for Real Image DenoisingXiaowan Hu, Ruijun Ma, Zhihong Liu, Yuanhao Cai, Xiaole Zhao, Yulun Zhang, Haoqian Wang. 16175-16184 [doi]

Ultra-High-Definition Image Dehazing via Multi-Guided Bilateral LearningZhuoran Zheng, Wenqi Ren, Xiaochun Cao, Xiaobin Hu, Tao Wang, Fenglong Song, Xiuyi Jia. 16185-16194 [doi]

HLA-Face: Joint High-Low Adaptation for Low Light Face DetectionWenjing Wang, Wenhan Yang, Jiaying Liu 0001. 16195-16204 [doi]

Zero-Shot Single Image Restoration Through Controlled Perturbation of Koschmieder's ModelAupendu Kar, Sobhan Kanti Dhara, Debashis Sen, Prabir Kumar Biswas. 16205-16215 [doi]

Deep Gaussian Scale Mixture Prior for Spectral Compressive ImagingTao Huang, Weisheng Dong, Xin Yuan, Jinjian Wu, Guangming Shi. 16216-16225 [doi]

Multi-View 3D Reconstruction of a Texture-Less Smooth Surface of Unknown Generic ReflectanceZiang Cheng, Hongdong Li, Yuta Asano, Yinqiang Zheng, Imari Sato. 16226-16235 [doi]

Tackling the Ill-Posedness of Super-Resolution Through Adaptive Target GenerationYounghyun Jo, Seoung Wug Oh, Peter Vajda, Seon Joo Kim. 16236-16245 [doi]

Memory-Efficient Network for Large-Scale Video Compressive SensingZiheng Cheng, Bo Chen, Guanliang Liu, Hao Zhang 0050, Ruiying Lu, Zhengjue Wang, Xin Yuan. 16246-16255 [doi]

Troubleshooting Blind Image Quality Models in the WildZhihua Wang, Haotao Wang, Tianlong Chen, Zhangyang Wang, Kede Ma. 16256-16265 [doi]

UAV-Human: A Large Benchmark for Human Behavior Understanding With Unmanned Aerial VehiclesTianjiao Li, Jun Liu, Wei Zhang, Yun Ni, Wenqian Wang, Zhiheng Li. 16266-16275 [doi]

FBNetV3: Joint Architecture-Recipe Search Using Predictor PretrainingXiaoliang Dai, Alvin Wan, Peizhao Zhang, Bichen Wu, Zijian He, Zhen Wei, Kan Chen, Yuandong Tian, Matthew Yu, Peter Vajda, Joseph E. Gonzalez. 16276-16285 [doi]

Domain-Independent Dominance of Adaptive MethodsPedro Savarese, David McAllester, Sudarshan Babu, Michael Maire. 16286-16295 [doi]

Wasserstein Contrastive Representation DistillationLiqun Chen 0001, Dong Wang 0037, Zhe Gan, Jingjing Liu 0001, Ricardo Henao, Lawrence Carin. 16296-16305 [doi]

The Lottery Tickets Hypothesis for Supervised and Self-Supervised Pre-Training in Computer Vision ModelsTianlong Chen, Jonathan Frankle, Shiyu Chang, Sijia Liu 0001, Yang Zhang, Michael Carbin, Zhangyang Wang. 16306-16316 [doi]

Generalizing Face Forgery Detection With High-Frequency FeaturesYuChen Luo, Yong Zhang, Junchi Yan, Wei Liu 0005. 16317-16326 [doi]

CAMERAS: Enhanced Resolution and Sanity Preserving Class Activation Mapping for Image SaliencyMohammad A. A. K. Jalwana, Naveed Akhtar, Mohammed Bennamoun, Ajmal Mian. 16327-16336 [doi]

See Through Gradients: Image Batch Recovery via GradInversionHongxu Yin, Arun Mallya, Arash Vahdat, Jose M. Alvarez, Jan Kautz, Pavlo Molchanov. 16337-16346 [doi]

Seeking the Shape of Sound: An Adaptive Framework for Learning Voice-Face AssociationPeisong Wen, Qianqian Xu, Yangbangyan Jiang, Zhiyong Yang 0001, Yuan He, Qingming Huang. 16347-16356 [doi]

Prototype-Supervised Adversarial Network for Targeted Attack of Deep HashingXunguang Wang, Zheng Zhang 0006, Baoyuan Wu, Fumin Shen, Guangming Lu. 16357-16366 [doi]

Intrinsic Image HarmonizationZonghui Guo, Haiyong Zheng, Yufeng Jiang, Zhaorui Gu, Bing Zheng. 16367-16376 [doi]

DivCo: Diverse Conditional Image Synthesis via Contrastive Generative Adversarial NetworkRui Liu 0019, Yixiao Ge, Ching Lam Choi, Xiaogang Wang 0001, Hongsheng Li 0001. 16377-16386 [doi]

Combining Semantic Guidance and Deep Reinforcement Learning for Generating Human Level PaintingsJaskirat Singh, Liang Zheng 0001. 16387-16396 [doi]

No Shadow Left Behind: Removing Objects and Their Shadows Using Approximate Lighting and GeometryEdward Zhang, Ricardo Martin-Brualla, Janne Kontkanen, Brian L. Curless. 16397-16406 [doi]

The Spatially-Correlative Loss for Various Image Translation TasksChuanxia Zheng, Tat-Jen Cham, Jianfei Cai 0001. 16407-16417 [doi]

Unpaired Image-to-Image Translation via Latent Energy TransportYang Zhao, Changyou Chen. 16418-16427 [doi]

Model-Aware Gesture-to-Gesture TranslationHezhen Hu, Weilun Wang, Wengang Zhou, Weichao Zhao, Houqiang Li. 16428-16437 [doi]

Layout-Guided Novel View Synthesis From a Single Indoor PanoramaJiale Xu, Jia Zheng, Yanyu Xu, Rui Tang, Shenghua Gao. 16438-16447 [doi]

Progressive Temporal Feature Alignment Network for Video InpaintingXueyan Zou, Linjie Yang, Ding Liu, Yong Jae Lee. 16448-16457 [doi]

On Robustness and Transferability of Convolutional Neural NetworksJosip Djolonga, Jessica Yung, Michael Tschannen, Rob Romijnders, Lucas Beyer, Alexander Kolesnikov 0003, Joan Puigcerver, Matthias Minderer, Alexander D'Amour, Dan Moldovan, Sylvain Gelly, Neil Houlsby, Xiaohua Zhai, Mario Lucic. 16458-16468 [doi]

Boosting Ensemble Accuracy by Revisiting Ensemble Diversity MetricsYanzhao Wu, Ling Liu 0001, Zhongwei Xie, Ka Ho Chow, Wenqi Wei. 16469-16477 [doi]

General Multi-Label Image Classification With TransformersJack Lanchantin, Tianlu Wang, Vicente Ordonez, Yanjun Qi. 16478-16488 [doi]

Improving Calibration for Long-Tailed RecognitionZhisheng Zhong, Jiequan Cui, Shu Liu 0005, Jiaya Jia. 16489-16498 [doi]

Hardness Sampling for Self-Training Based Transductive Zero-Shot LearningBo Liu 0035, Qiulei Dong, Zhanyi Hu. 16499-16508 [doi]

Saliency-Guided Image TranslationLai Jiang, Mai Xu, Xiaofei Wang, Leonid Sigal. 16509-16518 [doi]

Bottleneck Transformers for Visual RecognitionAravind Srinivas, Tsung-Yi Lin, Niki Parmar, Jonathon Shlens, Pieter Abbeel, Ashish Vaswani. 16519-16529 [doi]

One-Shot Neural Ensemble Architecture Search by Diversity-Guided Search Space ShrinkingMinghao Chen, Jianlong Fu, Haibin Ling. 16530-16539 [doi]

Multi-Perspective LSTM for Joint Visual Representation LearningAlireza Sepas-Moghaddam, Fernando Pereira 0001, Paulo Lobato Correia, Ali Etemad. 16540-16548 [doi]

Multiple Instance Captioning: Learning Representations From Histopathology Textbooks and ArticlesJevgenij Gamper, Nasir M. Rajpoot. 16549-16559 [doi]

clDice - A Novel Topology-Preserving Loss Function for Tubular Structure SegmentationSuprosanna Shit, Johannes C. Paetzold, Anjany Sekuboyina, Ivan Ezhov, Alexander Unger, Andrey Zhylka, Josien P. W. Pluim, Ulrich Bauer, Bjoern H. Menze. 16560-16569 [doi]

Learning To Fuse Asymmetric Feature Maps in Siamese TrackersWencheng Han, Xingping Dong, Fahad Shahbaz Khan, Ling Shao 0001, Jianbing Shen. 16570-16580 [doi]

Track, Check, Repeat: An EM Approach to Unsupervised TrackingAdam W. Harley, Yiming Zuo, Jing Wen, Ayush Mangal, Shubhankar Potdar, Ritwick Chaudhry, Katerina Fragkiadaki. 16581-16591 [doi]

Learning Optical Flow From a Few MatchesShihao Jiang, Yao Lu, Hongdong Li, Richard Hartley 0001. 16592-16600 [doi]

AutoDO: Robust AutoAugment for Biased Data With Label Noise via Scalable Probabilistic Implicit DifferentiationDenis A. Gudovskiy, Luca Rigazio, Shun Ishizaka, Kazuki Kozuka, Sotaro Tsukizawa. 16601-16610 [doi]

GDR-Net: Geometry-Guided Direct Regression Network for Monocular 6D Object Pose EstimationGu Wang 0001, Fabian Manhardt, Federico Tombari, Xiangyang Ji. 16611-16621 [doi]

Robust and Accurate Object Detection via Adversarial LearningXiangning Chen, Cihang Xie, Mingxing Tan, Li Zhang, Cho-Jui Hsieh, Boqing Gong. 16622-16631 [doi]

Domain Adaptation With Auxiliary Target Domain-Oriented ClassifierJian Liang, Dapeng Hu, Jiashi Feng. 16632-16642 [doi]

MetaAlign: Coordinating Domain Alignment and Classification for Unsupervised Domain AdaptationGuoqiang Wei, Cuiling Lan, Wenjun Zeng, Zhibo Chen 0001. 16643-16653 [doi]

Partial Feature Selection and Alignment for Multi-Source Domain AdaptationYangye Fu, Ming Zhang, Xing Xu 0001, Zuo Cao, Chao Ma, Yanli Ji, Kai Zuo, Huimin Lu. 16654-16663 [doi]

MongeNet: Efficient Sampler for Geometric Deep LearningLéo Lebrat, Rodrigo Santa Cruz, Clinton Fookes, Olivier Salvado. 16664-16673 [doi]

Continual Learning via Bit-Level Information PreservingYujun Shi, Li Yuan 0007, Yunpeng Chen, Jiashi Feng. 16674-16683 [doi]

Propagate Yourself: Exploring Pixel-Level Consistency for Unsupervised Visual Representation LearningZhenda Xie, Yutong Lin, Zheng Zhang 0022, Yue Cao 0001, Stephen Lin, Han Hu 0004. 16684-16693 [doi]

Toward Joint Thing-and-Stuff Mining for Weakly Supervised Panoptic SegmentationYunhang Shen, Liujuan Cao, Zhiwei Chen, Feihong Lian, Baochang Zhang 0001, Chi Su, Yongjian Wu, Feiyue Huang, Rongrong Ji. 16694-16705 [doi]

S3: Learnable Sparse Signal Superdensity for Guided Depth EstimationYu-Kai Huang, Yueh-Cheng Liu, Tsung-Han Wu, Hung-Ting Su, Yu-Cheng Chang, Tsung-Lin Tsou, Yu-An Wang, Winston H. Hsu. 16706-16716 [doi]

Residential Floor Plan Recognition and ReconstructionXiaolei Lv, Shengchu Zhao, XinYang Yu, Binqiang Zhao. 16717-16726 [doi]

ColorRL: Reinforced Coloring for End-to-End Instance SegmentationTuan Tran Anh, Khoa Nguyen-Tuan, Tran Minh Quan, Won-Ki Jeong. 16727-16736 [doi]

Harmonious Semantic Line Detection via Maximal Weight Clique SelectionDongkwon Jin, Wonhui Park, Seong-Gyun Jeong, Chang-Su Kim. 16737-16745 [doi]

LPSNet: A Lightweight Solution for Fast Panoptic SegmentationWeixiang Hong, Qingpei Guo, Wei Zhang, Jingdong Chen, Wei Chu. 16746-16754 [doi]

Progressive Semantic SegmentationChuong Huynh, Anh-Tuan Tran, Khoa Luu, Minh Hoai. 16755-16764 [doi]

Embedded Discriminative Attention Mechanism for Weakly Supervised Semantic SegmentationTong Wu, Junshi Huang, Guangyu Gao, Xiaoming Wei, Xiaolin Wei, Xuan Luo, Chi Harold Liu. 16765-16774 [doi]

SelfSAGCN: Self-Supervised Semantic Alignment for Graph Convolution NetworkXu Yang 0019, Cheng Deng, Zhiyuan Dang, Kun Wei, Junchi Yan. 16775-16784 [doi]

Wasserstein Barycenter for Multi-Source Domain AdaptationEduardo Fernandes Montesuma, Fred Maurice Ngolè Mboula. 16785-16793 [doi]

PiCIE: Unsupervised Semantic Segmentation Using Invariance and Equivariance in ClusteringJang Hyun Cho, Utkarsh Mall, Kavita Bala, Bharath Hariharan. 16794-16804 [doi]

Global2Local: Efficient Structure Search for Video Action SegmentationShang-hua Gao, Qi Han, Zhong-Yu Li, Pai Peng, Liang Wang, Ming-Ming Cheng. 16805-16814 [doi]

Introvert: Human Trajectory Prediction via Conditional 3D AttentionNasim Shafiee, Taskin Padir, Ehsan Elhamifar. 16815-16825 [doi]

Weakly Supervised Video Salient Object DetectionWangbo Zhao, Jing Zhang 0052, Long Li, Nick Barnes, Nian Liu, Junwei Han. 16826-16835 [doi]

Video Object Segmentation Using Global and Instance Embedding LearningWenbin Ge, Xiankai Lu, Jianbing Shen. 16836-16845 [doi]

Human-Like Controllable Image Captioning With Verb-Specific Semantic RolesLong Chen 0016, Zhihong Jiang, Jun Xiao 0001, Wei Liu 0005. 16846-16856 [doi]

Read and Attend: Temporal Localisation in Sign Language VideosGül Varol, Liliane Momeni, Samuel Albanie, Triantafyllos Afouras, Andrew Zisserman. 16857-16866 [doi]

Localizing Visual Sounds the Hard WayHonglie Chen, Weidi Xie, Triantafyllos Afouras, Arsha Nagrani, Andrea Vedaldi, Andrew Zisserman. 16867-16876 [doi]

Look Before You Speak: Visually Contextualized UtterancesPaul Hongsuck Seo, Arsha Nagrani, Cordelia Schmid. 16877-16887 [doi]

Look Before You Leap: Learning Landmark Features for One-Stage Visual GroundingBinbin Huang, Dongze Lian, Weixin Luo, Shenghua Gao. 16888-16897 [doi]

Visual Navigation With Spatial AttentionBar Mayo, Tamir Hazan, Ayellet Tal. 16898-16907 [doi]

Perception Matters: Detecting Perception Failures of VQA Models Using Metamorphic TestingYuanyuan Yuan, Shuai Wang, Mingyue Jiang, Tsong Yueh Chen. 16908-16917 [doi]

Pixel-Wise Anomaly Detection in Complex Driving ScenesGiancarlo Di Biase, Hermann Blum, Roland Siegwart, César Cadena 0001. 16918-16927 [doi]

Disentangled Cycle Consistency for Highly-Realistic Virtual Try-OnChongjian Ge, Yibing Song, Yuying Ge, Han Yang, Wei Liu 0005, Ping Luo 0002. 16928-16937 [doi]

Hyperdimensional Computing as a Framework for Systematic Aggregation of Image DescriptorsPeer Neubert, Stefan Schubert. 16938-16947 [doi]

runs on WebDSL