2021 IEEE/CVF International Conference on Computer Vision, ICCV 2021, Montreal, QC, Canada, October 10-17, 2021 - researchr publication

researchr

You are not signed in
Sign in
Sign up

2021 IEEE/CVF International Conference on Computer Vision, ICCV 2021, Montreal, QC, Canada, October 10-17, 2021. IEEE, 2021. [doi]

Conference: iccv2021

Abstract is missing.

MVTN: Multi-View Transformation Network for 3D Shape RecognitionAbdullah Hamdi, Silvio Giancola, Bernard Ghanem. 1-11 [doi]

GLiT: Neural Architecture Search for Global and Local Image TransformerBoyu Chen, Peixia Li, Chuming Li, Baopu Li, Lei Bai 0001, Chen Lin 0003, Ming Sun 0008, Junjie Yan, Wanli Ouyang. 12-21 [doi]

CvT: Introducing Convolutions to Vision TransformersHaiping Wu, Bin Xiao, Noel Codella, Mengchen Liu, Xiyang Dai, Lu Yuan, Lei Zhang 0001. 22-31 [doi]

Going deeper with Image TransformersHugo Touvron, Matthieu Cord, Alexandre Sablayrolles, Gabriel Synnaeve, Hervé Jégou. 32-42 [doi]

DTMNet: A Discrete Tchebichef Moments-based Deep Neural Network for Multi-focus Image FusionBin Xiao 0002, Haifeng Wu, Xiuli Bi. 43-51 [doi]

CrossNorm and SelfNorm for Generalization under Distribution ShiftsZhiqiang Tang 0001, Yunhe Gao, Yi Zhu, Zhi Zhang, Mu Li 0003, Dimitris N. Metaxas. 52-61 [doi]

NGC: A Unified Framework for Learning with Open-World Noisy DataZhi-Fan Wu, Tong Wei 0001, Jianwen Jiang, Chaojie Mao, Mingqian Tang, Yu-Feng Li. 62-71 [doi]

Learning with Noisy Labels via Sparse RegularizationXiong Zhou, Xianming Liu, Chenyang Wang, Deming Zhai, Junjun Jiang, Xiangyang Ji. 72-81 [doi]

Asymmetric Loss For Multi-Label ClassificationTal Ridnik, Emanuel Ben Baruch, Nadav Zamir, Asaf Noy, Itamar Friedman, Matan Protter, Lihi Zelnik-Manor. 82-91 [doi]

Procrustean Training for Imbalanced Deep LearningHan-Jia Ye, De-Chuan Zhan, Wei-Lun Chao. 92-102 [doi]

Conditional Variational Capsule Network for Open Set RecognitionYunrui Guo, Guglielmo Camporese, Wenjing Yang 0002, Alessandro Sperduti, Lamberto Ballan. 103-111 [doi]

ACE: Ally Complementary Experts for Solving Long-Tailed Recognition in One-ShotJiarui Cai, Yizhou Wang 0005, Jenq-Neng Hwang. 112-121 [doi]

FREE: Feature Refinement for Generalized Zero-Shot LearningShiming Chen 0002, Wenjie Wang, Beihao Xia, Qinmu Peng, Xinge You, Feng Zheng, Ling Shao 0001. 122-131 [doi]

Online Refinement of Low-level Feature Based Activation Map for Weakly Supervised Object LocalizationJinheng Xie, Cheng Luo, Xiangping Zhu, Ziqi Jin, Weizeng Lu, LinLin Shen. 132-141 [doi]

Z-Score Normalization, Hubness, and Few-Shot LearningNanyi Fei, Yizhao Gao, Zhiwu Lu 0001, Tao Xiang. 142-151 [doi]

Spatio-Temporal Representation Factorization for Video-based Person Re-IdentificationAbhishek Aich, Meng Zheng, Srikrishna Karanam, Terrence Chen, Amit K. Roy Chowdhury, Ziyan Wu. 152-162 [doi]

Transformer-based Dual Relation Graph for Multi-label Image RecognitionJiawei Zhao, Ke Yan, Yifan Zhao, Xiaowei Guo, Feiyue Huang, Jia Li 0003. 163-172 [doi]

Dance with Self-Attention: A New Look of Conditional Random Fields on Anomaly Detection in VideosDidik Purwanto, Yie-Tarng Chen, Wen-Hsien Fang. 173-183 [doi]

Residual Attention: A Simple but Effective Method for Multi-Label RecognitionKe Zhu, Jianxin Wu. 184-193 [doi]

Self-supervised Geometric Features Discovery via Interpretable Attention for Vehicle Re-Identification and BeyondMing Li, Xinming Huang 0001, Ziming Zhang. 194-204 [doi]

Heterogeneous Relational Complement for Vehicle Re-identificationJiajian Zhao, Yifan Zhao, Jia Li 0003, Ke Yan, Yonghong Tian 0001. 205-214 [doi]

Attack-Guided Perceptual Data Generation for Real-world Re-IdentificationYukun Huang, Xueyang Fu, Zheng-Jun Zha. 215-224 [doi]

Syncretic Modality Collaborative Learning for Visible Infrared Person Re-IdentificationZiyu Wei, Xi Yang 0011, Nannan Wang 0001, Xinbo Gao 0001. 225-234 [doi]

Distilling Virtual Examples for Long-tailed RecognitionYin-Yin He, Jianxin Wu, Xiu-Shen Wei. 235-244 [doi]

Neural Photofit: Gaze-based Mental Image ReconstructionFlorian Strohm, Ekta Sood, Sven Mayer, Philipp Müller 0001, Mihai Bâce, Andreas Bulling. 245-254 [doi]

When Pigs Fly: Contextual Reasoning in Synthetic and Natural ScenesPhilipp Bomatter, Mengmi Zhang, Dimitar Karev, Spandan Madan, Claire Tseng, Gabriel Kreiman. 255-264 [doi]

MAAS: Multi-modal Assignation for Active Speaker DetectionJuan León Alcázar, Fabian Caba Heilbron, Ali K. Thabet, Bernard Ghanem. 265-274 [doi]

Move2Hear: Active Audio-Visual Source SeparationSagnik Majumder, Ziad Al-Halah, Kristen Grauman. 275-285 [doi]

Image2Reverb: Cross-Modal Reverb Impulse Response SynthesisNikhil Singh 0003, Jeff Mentch, Jerry Ng, Matthew Beveridge, Iddo Drori. 286-295 [doi]

Multi-modality Associative Bridging through Memory: Speech Sound Recollected from Face VideoMinsu Kim, Joanna Hong, Se Jin Park, Yong Man Ro. 296-306 [doi]

BN-NAS: Neural Architecture Search with Batch NormalizationBoyu Chen, Peixia Li, Baopu Li, Chen Lin 0003, Chuming Li, Ming Sun 0008, Junjie Yan, Wanli Ouyang. 307-316 [doi]

Differentiable Dynamic Wirings for Neural NetworksKun Yuan, Quanquan Li, Shaopeng Guo, Dapeng Chen, Aojun Zhou, Fengwei Yu, Ziwei Liu 0002. 317-326 [doi]

AutoSpace: Neural Architecture Search with Less Human InterferenceDaquan Zhou, Xiaojie Jin, Xiaochen Lian, Linjie Yang, Yujing Xue, Qibin Hou, Jiashi Feng. 327-336 [doi]

Zen-NAS: A Zero-Shot NAS for High-Performance Image RecognitionMing Lin, Pichao Wang, Zhenhong Sun, Hesen Chen, Xiuyu Sun, Qi Qian 0001, Hao Li 0030, Rong Jin 0001. 337-346 [doi]

CrossViT: Cross-Attention Multi-Scale Vision Transformer for Image ClassificationChun-Fu (Richard) Chen, Quanfu Fan, Rameswar Panda. 347-356 [doi]

Conformer: Local Features Coupling Global Representations for Visual RecognitionZhiliang Peng, Wei Huang, Shanzhi Gu, Lingxi Xie, Yaowei Wang, Jianbin Jiao, Qixiang Ye. 357-366 [doi]

Scalable Vision Transformers with Hierarchical PoolingZizheng Pan, Bohan Zhuang, Jing Liu, Haoyu He, Jianfei Cai 0001. 367-376 [doi]

Vision Transformer with Progressive SamplingXiaoyu Yue, Shuyang Sun, Zhanghui Kuang, Meng Wei, Philip H. S. Torr, Wayne Zhang, Dahua Lin. 377-386 [doi]

Generic Attention-model Explainability for Interpreting Bi-Modal and Encoder-Decoder TransformersHila Chefer, Shir Gur, Lior Wolf. 387-396 [doi]

Learning Canonical View Representation for 3D Shape Recognition with Arbitrary ViewsXin Wei, Yifei Gong, Fudong Wang, Xing Sun, Jian Sun. 397-406 [doi]

MosaicOS: A Simple and Effective Use of Object-Centric Images for Long-Tailed Object DetectionCheng Zhang, Tai-Yu Pan, Yandong Li, Hexiang Hu, Dong Xuan, Soravit Changpinyo, Boqing Gong, Wei-Lun Chao. 407-417 [doi]

Towers of Babel: Combining Images, Language, and 3D Geometry for Learning Multimodal VisionXiaoshi Wu, Hadar Averbuch-Elor, Jin Sun, Noah Snavely. 418-427 [doi]

Virtual Multi-Modality Self-Supervised Foreground Matting for Human-Object InteractionBo Xu, Han Huang, Cheng Lu, Ziwen Li, Yandong Guo. 428-437 [doi]

An Asynchronous Kalman Filter for Hybrid Event CamerasZiwei Wang, Yonhon Ng, Cedric Scheerlinck, Robert E. Mahony. 438-447 [doi]

Amplitude-Phase Recombination: Rethinking Robustness of Convolutional Neural Networks in Frequency DomainGuangyao Chen, Peixi Peng, Li Ma, Jia Li 0003, Lin Du, Yonghong Tian 0001. 448-457 [doi]

MicroNet: Improving Image Recognition with Extremely Low FLOPsYunsheng Li, Yinpeng Chen, Xiyang Dai, Dongdong Chen 0001, Mengchen Liu, Lu Yuan, Zicheng Liu 0001, Lei Zhang 0001, Nuno Vasconcelos. 458-467 [doi]

Group-wise Inhibition based Feature Regularization for Robust ClassificationHaozhe Liu, Haoqian Wu, Weicheng Xie 0001, Feng Liu 0013, LinLin Shen. 468-476 [doi]

Exploration and Estimation for Model CompressionYanfu Zhang, Shangqian Gao, Heng Huang. 477-486 [doi]

Learning to Resize Images for Computer Vision TasksHossein Talebi, Peyman Milanfar. 487-496 [doi]

Learning Meta-class Memory for Few-Shot Semantic SegmentationZhonghua Wu, Xiangxi Shi, Guosheng Lin, Jianfei Cai 0001. 497-506 [doi]

Aggregation with Feature DetectionShuyang Sun, Xiaoyu Yue, Xiaojuan Qi, Wanli Ouyang, Victor Prisacariu, Philip H. S. Torr. 507-516 [doi]

Continual Learning on Noisy Data Streams via Self-Purified ReplayChris Dongjoo Kim, Jinseo Jeong, Sangwoo Moon, Gunhee Kim. 517-527 [doi]

Point Cloud Augmentation with Weighted Local TransformationsSihyeon Kim, Sanghyeok Lee, Dasol Hwang, Jaewon Lee, Seong Jae Hwang, Hyunwoo J. Kim. 528-537 [doi]

Tokens-to-Token ViT: Training Vision Transformers from Scratch on ImageNetLi Yuan 0007, Yunpeng Chen, Tao Wang, Weihao Yu, Yujun Shi, Zihang Jiang, Francis E. H. Tay, Jiashi Feng, Shuicheng Yan. 538-547 [doi]

Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without ConvolutionsWenhai Wang, Enze Xie, Xiang Li 0028, Deng-Ping Fan, Kaitao Song, Ding Liang, Tong Lu, Ping Luo 0002, Ling Shao 0001. 548-558 [doi]

Incorporating Convolution Designs into Visual TransformersKun Yuan, Shaopeng Guo, Ziwei Liu 0002, Aojun Zhou, Fengwei Yu, Wei Wu. 559-568 [doi]

Visformer: The Vision-friendly TransformerZhengsu Chen, Lingxi Xie, Jianwei Niu 0002, Xuefeng Liu 0001, Longhui Wei, Qi Tian 0001. 569-578 [doi]

Visual Transformers: Where Do Transformers Really Belong in Vision Models?Bichen Wu, Chenfeng Xu, Xiaoliang Dai, Alvin Wan, Peizhao Zhang, Zhicheng Yan, Masayoshi Tomizuka, Joseph Gonzalez 0001, Kurt Keutzer, Peter Vajda. 579-589 [doi]

Joint Representation Learning and Novel Category Discovery on Single- and Multi-modal DataXuhui Jia, Kai Han, Yukun Zhu, Bradley Green. 590-599 [doi]

Stochastic Partial Swap: Enhanced Model Generalization and Interpretability for Fine-grained RecognitionShaoli Huang, Xinchao Wang, Dacheng Tao. 600-609 [doi]

Self Supervision to Distillation for Long-Tailed Visual RecognitionTianhao Li, Limin Wang 0002, Gangshan Wu. 610-619 [doi]

Semantic Diversity Learning for Zero-Shot Multi-label ClassificationAvi Ben-Cohen, Nadav Zamir, Emanuel Ben Baruch, Itamar Friedman, Lihi Zelnik-Manor. 620-630 [doi]

Shallow Bayesian Meta Learning for Real-World Few-Shot RecognitionXueting Zhang, Debin Meng, Henry Gouk, Timothy M. Hospedales. 631-640 [doi]

Adversarial Attacks are Reversible with Natural SupervisionChengzhi Mao, Mia Chiquier, Hao Wang 0014, Junfeng Yang, Carl Vondrick. 641-651 [doi]

Architecture Disentanglement for Deep Neural NetworksJie Hu 0018, Liujuan Cao, Tong Tong, Qixiang Ye, Shengchuan Zhang, Ke Li, Feiyue Huang, Ling Shao 0001, Rongrong Ji. 652-661 [doi]

Exploiting Explanations for Model Inversion AttacksXuejun Zhao, Wencan Zhang, Xiaokui Xiao, Brian Y. Lim. 662-672 [doi]

Explaining in Style: Training a GAN to explain a classifier in StyleSpaceOran Lang, Yossi Gandelsman, Michal Yarom, Yoav Wald, Gal Elidan, Avinatan Hassidim, William T. Freeman, Phillip Isola, Amir Globerson, Michal Irani, Inbar Mosseri. 673-682 [doi]

Ground-truth or DAER: Selective Re-query of Secondary InformationStephan J. Lemmer, Jason J. Corso. 683-694 [doi]

Parametric Contrastive LearningJiequan Cui, Zhisheng Zhong, Shu Liu 0005, Bei Yu 0001, Jiaya Jia. 695-704 [doi]

Learning Fast Sample Re-weighting Without Reward DataZizhao Zhang, Tomas Pfister. 705-714 [doi]

Influence-Balanced Loss for Imbalanced Visual ClassificationSeulki Park, Jongin Lim, Younghan Jeon, Jin Young Choi 0002. 715-724 [doi]

Statistically Consistent Saliency EstimationShunyan Luo, Emre Barut, Fang Jin. 725-733 [doi]

Contrastive Multimodal Fusion with TupleInfoNCEYunze Liu, Qingnan Fan, Shanghang Zhang, Hao Dong 0003, Thomas A. Funkhouser, Li Yi. 734-743 [doi]

Recursively Conditional Gaussian for Ordinal Unsupervised Domain AdaptationXiaofeng Liu 0001, Site Li, Yubin Ge, Pengyi Ye, Jane You, Jun Lu. 744-753 [doi]

TrivialAugment: Tuning-free Yet State-of-the-Art Data AugmentationSamuel G. Müller, Frank Hutter. 754-762 [doi]

FcaNet: Frequency Channel Attention NetworksZequn Qin, Pengyi Zhang, Fei Wu, Xi Li 0001. 763-772 [doi]

Global Pooling, More than Meets the Eye: Position Information is Encoded Channel-Wise in CNNsMd. Amirul Islam, Matthew Kowal, Sen Jia, Konstantinos G. Derpanis, Neil D. B. Bruce. 773-781 [doi]

Neural Video Portrait Relighting in Real-time via Consistency ModelingLongwen Zhang, Qixuan Zhang, Minye Wu, Jingyi Yu, Lan Xu. 782-792 [doi]

OpenGAN: Open-Set Recognition via Open Data GenerationShu Kong, Deva Ramanan. 793-802 [doi]

MixMo: Mixing Multiple Inputs for Multiple Outputs via Deep SubnetworksAlexandre Ramé, Rémy Sun, Matthieu Cord. 803-813 [doi]

Learning to Diversify for Single Domain GeneralizationZijian Wang, Yadan Luo, Ruihong Qiu, Zi Huang, Mahsa Baktashmotlagh. 814-823 [doi]

SS-IL: Separated Softmax for Incremental LearningHongjoon Ahn, Jihwan Kwak, Subin Lim, Hyeonsu Bang, Hyojun Kim, Taesup Moon. 824-833 [doi]

Multimodal Knowledge ExpansionZihui Xue, Sucheng Ren, Zhengqi Gao, Hang Zhao. 834-843 [doi]

FaPN: Feature-aligned Pyramid Network for Dense Image PredictionShihua Huang, Zhichao Lu, Ran Cheng, Cheng He 0001. 844-853 [doi]

Grafit: Learning fine-grained image representations with coarse labelsHugo Touvron, Alexandre Sablayrolles, Matthijs Douze, Matthieu Cord, Hervé Jégou. 854-864 [doi]

Attentional Pyramid Pooling of Salient Visual Residuals for Place RecognitionGuohao Peng, Jun Zhang 0042, Heshan Li, Danwei Wang. 865-874 [doi]

Interpretable Image Recognition by Constructing Transparent Embedding SpaceJiaqi Wang, Huafeng Liu 0001, Xinyue Wang, Liping Jing. 875-884 [doi]

Generating Attribution Maps with Disentangled Masked BackpropagationAdria Ruiz, Antonio Agudo, Francesc Moreno-Noguer. 885-894 [doi]

Walk in the Cloud: Learning Curves for Point Clouds Shape AnalysisTiange Xiang, Chaoyi Zhang, Yang Song 0001, Jianhui Yu, Weidong Cai 0001. 895-904 [doi]

End-to-End Trainable Trident Person Search Network Using Adaptive Gradient PropagationByeong-Ju Han, Kuhyeun Ko, Jae-Young Sim. 905-913 [doi]

Graph-based Asynchronous Event Processing for Rapid Object RecognitionYijin Li, Han Zhou, Bangbang Yang, Ye Zhang, Zhaopeng Cui, Hujun Bao, Guofeng Zhang 0001. 914-923 [doi]

Parsing Table Structures in the WildRujiao Long, Wen Wang, Nan Xue 0001, Feiyu Gao, Zhibo Yang, Yongpan Wang, Gui-Song Xia. 924-932 [doi]

SketchLattice: Latticed Representation for Sketch ManipulationYonggang Qi, Guoyao Su, Pinaki Nath Chowdhury, Mingkang Li, Yi-Zhe Song. 933-941 [doi]

Spatial and Semantic Consistency Regularizations for Pedestrian Attribute RecognitionJian Jia, Xiaotang Chen, Kaiqi Huang. 942-951 [doi]

Detecting Persuasive Atypicality by Modeling Contextual CompatibilityMeiqi Guo, Rebecca Hwa, Adriana Kovashka. 952-962 [doi]

Text is Text, No Matter What: Unifying Text Recognition using Knowledge DistillationAyan Kumar Bhunia, Aneeshan Sain, Pinaki Nath Chowdhury, Yi-Zhe Song. 963-972 [doi]

DocFormer: End-to-End Transformer for Document UnderstandingSrikar Appalaraju, Bhavan Jasani, Bhargava Urala Kota, Yusheng Xie, R. Manmatha. 973-983 [doi]

LayoutTransformer: Layout Generation and Completion with Self-attentionKamal Gupta, Justin Lazarow, Alessandro Achille, Larry Davis 0001, Vijay Mahadevan, Abhinav Shrivastava. 984-994 [doi]

Effectively Leveraging Attributes for Visual SimilaritySamarth Mishra, Zhongping Zhang, Yuan Shen, Ranjitha Kumar, Venkatesh Saligrama, Bryan A. Plummer. 995-1004 [doi]

Counterfactual Attention Learning for Fine-Grained Visual Categorization and Re-identificationYongming Rao, Guangyi Chen 0002, Jiwen Lu, Jie Zhou 0001. 1005-1014 [doi]

Learning Canonical 3D Object Representation for Fine-Grained RecognitionSunghun Joung, Seungryong Kim, Minsu Kim, Ig-Jae Kim, Kwanghoon Sohn. 1015-1025 [doi]

SCOUTER: Slot Attention-based Classifier for Explainable Image RecognitionLiangZhi Li, Bowen Wang, Manisha Verma, Yuta Nakashima, Ryo Kawasaki, Hajime Nagahara. 1026-1035 [doi]

Beyond Trivial Counterfactual Explanations with Diverse Valuable ExplanationsPau Rodríguez, Massimo Caccia, Alexandre Lacoste, Lee Zamparo, Issam H. Laradji, Laurent Charlin, David Vázquez 0001. 1036-1045 [doi]

From Culture to Clothing: Discovering the World Events Behind A Century of Fashion ImagesWei-Lin Hsiao, Kristen Grauman. 1046-1055 [doi]

De-rendering Stylized TextsWataru Shimoda, Daichi Haraguchi, Seiichi Uchida, Kota Yamaguchi. 1056-1065 [doi]

Handwriting TransformersAnkan Kumar Bhunia, Salman H. Khan 0001, Hisham Cholakkal, Rao Muhammad Anwer, Fahad Shahbaz Khan, Mubarak Shah. 1066-1074 [doi]

Interpreting Attributions and Interactions of Adversarial AttacksXin Wang 0108, Shuyun Lin, Hao Zhang, Yufei Zhu, Quanshi Zhang. 1075-1084 [doi]

The Right to Talk: An Audio-Visual Transformer ApproachThanh-Dat Truong, Chi Nhan Duong, The De Vu, Hoang-Anh Pham, Bhiksha Raj, Ngan Le, Khoa Luu. 1085-1094 [doi]

Why Approximate Matrix Square Root Outperforms Accurate SVD in Global Covariance Pooling?Yue Song, Nicu Sebe, Wei Wang 0108. 1095-1103 [doi]

Striking a Balance between Stability and Plasticity for Class-Incremental LearningGuile Wu, Shaogang Gong, Pan Li Queen. 1104-1113 [doi]

Predicting with Confidence on Unseen DistributionsDevin Guillory, Vaishaal Shankar, Sayna Ebrahimi, Trevor Darrell, Ludwig Schmidt. 1114-1124 [doi]

Transforms based Tensor Robust PCA: Corrupted Low-Rank Tensors Recovery via Convex OptimizationCanyi Lu. 1125-1132 [doi]

CODEs: Chamfer Out-of-Distribution Examples against Overconfidence IssueKeke Tang, Dingruibo Miao, Weilong Peng, Jianpeng Wu, Yawen Shi, Zhaoquan Gu, Zhihong Tian, Wenping Wang. 1133-1142 [doi]

IDARTS: Interactive Differentiable Architecture SearchSong Xue, Runqi Wang, Baochang Zhang 0001, Tian Wang, Guodong Guo, David S. Doermann. 1143-1152 [doi]

MeshTalk: 3D Face Animation from Speech using Cross-Modality DisentanglementAlexander Richard, Michael Zollhöfer, YanDong Wen, Fernando De la Torre, Yaser Sheikh. 1153-1162 [doi]

Audio-Visual Floorplan ReconstructionSenthil Purushwalkam, Sebastia Vicenc Amengual Gari, Vamsi Krishna Ithapu, Carl Schissler, Philip Robinson, Abhinav Gupta 0001, Kristen Grauman. 1163-1172 [doi]

How to Design a Three-Stage Architecture for Audio-Visual Active Speaker Detection in the WildOkan Köpüklü, Maja Taseska, Gerhard Rigoll. 1173-1183 [doi]

Visual Scene Graphs for Audio Source SeparationMoitreya Chatterjee, Jonathan Le Roux, Narendra Ahuja, Anoop Cherian. 1184-1193 [doi]

Better Aggregation in Test-Time AugmentationDivya Shanmugam, Davis W. Blalock, Guha Balakrishnan, John V. Guttag. 1194-1203 [doi]

Explaining Local, Global, And Higher-Order Interactions In Deep LearningSamuel Lerman, Charles Venuto, Henry A. Kautz, Chenliang Xu. 1204-1213 [doi]

Explanations for Occluded ImagesHana Chockler, Daniel Kroening, Youcheng Sun. 1214-1223 [doi]

e-ViL: A Dataset and Benchmark for Natural Language Explanations in Vision-Language TasksMaxime Kayser, Oana-Maria Camburu, Leonard Salewski, Cornelius Emde, Virginie Do, Zeynep Akata, Thomas Lukasiewicz. 1224-1234 [doi]

Broaden Your Views for Self-Supervised Video LearningAdrià Recasens, Pauline Luc, Jean-Baptiste Alayrac, Luyu Wang, Florian Strub, Corentin Tallec, Mateusz Malinowski, Viorica Patraaucean, Florent Altché, Michal Valko, Jean-Bastien grill, Aäron Van Den Oord, Andrew Zisserman. 1235-1245 [doi]

Hypergraph Neural Networks for Hypergraph MatchingXiaowei Liao, Yong Xu, Haibin Ling. 1246-1255 [doi]

Embed Me If You Can: A Geometric PerceptronPavlo Melnyk, Michael Felsberg, Mårten Wadenbäck. 1256-1264 [doi]

Learning to Discover Reflection Symmetry via Polar Matching ConvolutionAhyun Seo, Woohyeon Shim, Minsu Cho. 1265-1274 [doi]

TGRNet: A Table Graph Reconstruction Network for Table Structure RecognitionWenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao, Qingyong Li. 1275-1284 [doi]

Adaptive Boundary Proposal Network for Arbitrary Shape Text DetectionShi-Xue Zhang, Xiaobin Zhu 0001, Chun Yang, Hongfa Wang, Xu-Cheng Yin. 1285-1294 [doi]

Shape-Biased Domain Generalization via Shock Graph EmbeddingsMaruthi Narayanan, Vickram Rajendran, Benjamin B. Kimia. 1295-1305 [doi]

Towards Learning Spatially Discriminative Feature RepresentationsChaofei Wang, Jiayu Xiao, Yizeng Han, Qisen Yang, Shiji Song, Gao Huang. 1306-1315 [doi]

Towards Better Explanations of Class Activation MappingHyungsik Jung, Youngrock Oh. 1316-1324 [doi]

Finding Representative Interpretations on Convolutional Neural NetworksPeter Cho-Ho Lam, Lingyang Chu, Maxim Torgonskiy, Jian Pei, Yong Zhang, Lanjun Wang. 1325-1334 [doi]

LFI-CAM: Learning Feature Importance for Better Visual ExplanationKwang Hee Lee, Chaewon Park, Junghyun Oh, Nojun Kwak. 1335-1343 [doi]

Panoptic Narrative GroundingCristina González, Nicolás Ayobi, Isabela Hernández, José Hernández, Jordi Pont-Tuset, Pablo Arbeláez. 1344-1353 [doi]

Who's Waldo? Linking People Across Text and ImagesClaire Yuqing Cui, Apoorv Khandelwal 0001, Yoav Artzi, Noah Snavely, Hadar Averbuch-Elor. 1354-1364 [doi]

YouRefIt: Embodied Reference Understanding with Language and GestureYixin Chen, Qing Li 0003, Deqian Kong, Yik Lun Kei, Song Chun Zhu, Tao Gao, Yixin Zhu, Siyuan Huang. 1365-1375 [doi]

Synthesis of Compositional Animations from Textual DescriptionsAnindita Ghosh, Noshaba Cheema, Cennet Oguz, Christian Theobalt, Philipp Slusallek. 1376-1386 [doi]

In Defense of Scene Graphs for Image CaptioningKien Nguyen, Subarna Tripathi, Bang Du, Tanaya Guha, Truong Q. Nguyen. 1387-1396 [doi]

Unshuffling Data for Improved Generalization in Visual Question AnsweringDamien Teney, Ehsan Abbasnejad, Anton van den Hengel. 1397-1407 [doi]

Compressing Visual-linguistic Model via Knowledge DistillationZhiyuan Fang, Jianfeng Wang, Xiaowei Hu 0006, Lijuan Wang, Yezhou Yang, Zicheng Liu 0001. 1408-1418 [doi]

UniT: Multimodal Multitask Learning with a Unified TransformerRonghang Hu, Amanpreet Singh. 1419-1429 [doi]

CrossCLR: Cross-modal Contrastive Learning For Multi-modal Video RepresentationsMohammadreza Zolfaghari, Yi Zhu, Peter V. Gehler, Thomas Brox. 1430-1439 [doi]

Graph Constrained Data Representation Learning for Human Motion SegmentationMariella Dimiccoli, Lluís Garrido, Guillem Rodríguez Corominas, Herwig Wendt. 1440-1449 [doi]

Zero-shot Natural Language Video LocalizationJinwoo Nam, Daechul Ahn, Dongyeop Kang, Seong Jong Ha, Jonghyun Choi. 1450-1459 [doi]

Learning Temporal Dynamics from Cycles in Narrated VideoDave Epstein, Jiajun Wu 0001, Cordelia Schmid, Chen Sun 0002. 1460-1469 [doi]

Dense Interaction Learning for Video-based Person Re-identificationTianyu He, Xin Jin, Xu Shen, Jianqiang Huang, Zhibo Chen 0001, Xian-Sheng Hua 0001. 1470-1481 [doi]

2CLR: Video and Image for Visual Contrastive Learning of RepresentationAli Diba, Vivek Sharma 0001, Reza Safdari, Dariush Lotfi, M. Saquib Sarfraz, Rainer Stiefelhagen, Luc Van Gool. 1482-1492 [doi]

MGSampler: An Explainable Sampling Strategy for Video Action RecognitionYuan-zhi, Zhan Tong, Limin Wang 0002, Gangshan Wu. 1493-1502 [doi]

Fast Video Moment RetrievalJunyu Gao, Changsheng Xu. 1503-1512 [doi]

STVGBert: A Visual-linguistic Transformer based Framework for Spatio-temporal Video GroundingRui Su, Qian Yu, Dong Xu 0001. 1513-1522 [doi]

Motion Guided Region Message Passing for Video CaptioningShaoxiang Chen 0001, Yu-Gang Jiang. 1523-1532 [doi]

Dynamic Context-Sensitive Filtering Network for Video Salient Object DetectionMiao Zhang, Jie Liu, Yifei Wang, Yongri Piao, Shunyu Yao, Wei Ji, Jingjing Li, Huchuan Lu, Zhongxuan Luo. 1533-1543 [doi]

Learning Motion-Appearance Co-Attention for Zero-Shot Video Object SegmentationShu Yang, Lu Zhang 0053, Jinqing Qi, Huchuan Lu, Shuo Wang, Xiaoxing Zhang. 1544-1553 [doi]

Beyond Question-Based Biases: Assessing Multimodal Shortcut Learning in Visual Question AnsweringCorentin Dancette, Rémi Cadène, Damien Teney, Matthieu Cord. 1554-1563 [doi]

Greedy Gradient Ensemble for Robust Visual Question AnsweringXinzhe Han, Shuhui Wang, Chi Su, Qingming Huang, Qi Tian 0001. 1564-1573 [doi]

Self-Motivated Communication Agent for Real-World Vision-Dialog NavigationYi Zhu 0004, Yue Weng, Fengda Zhu, Xiaodan Liang, Qixiang Ye, Yutong Lu, Jianbin Jiao. 1574-1583 [doi]

Contrast and Classify: Training Robust VQA ModelsYash Kant, Abhinav Moudgil, Dhruv Batra, Devi Parikh, Harsh Agrawal. 1584-1593 [doi]

Linguistically Routing Capsule Network for Out-of-distribution Visual Question AnsweringQingxing Cao, Wentao Wan, Keze Wang, Xiaodan Liang, Liang Lin. 1594-1603 [doi]

LapsCore: Language-guided Person Search via Color ReasoningYushuang Wu, Zizheng Yan, Xiaoguang Han, Guanbin Li, Changqing Zou, Shuguang Cui. 1604-1613 [doi]

Airbert: In-domain Pretraining for Vision-and-Language NavigationPierre-Louis Guhur, Makarand Tapaswi, Shizhe Chen, Ivan Laptev, Cordelia Schmid. 1614-1623 [doi]

Vision-Language Navigation with Random Environmental MixupChong Liu 0002, Fengda Zhu, Xiaojun Chang, Xiaodan Liang, ZongYuan Ge, Yi-Dong Shen. 1624-1634 [doi]

The Road to Know-Where: An Object-and-Room Informed Sequential BERT for Indoor Vision-Language NavigationYuankai Qi, Zizheng Pan, Yicong Hong, Ming-Hsuan Yang 0001, Anton van den Hengel, Qi Wu 0001. 1635-1644 [doi]

VLGrammar: Grounded Grammar Induction of Vision and LanguageYining Hong, Qing Li 0003, Song Chun Zhu, Siyuan Huang. 1645-1654 [doi]

Env-QA: A Video Question Answering Benchmark for Comprehensive Understanding of Dynamic EnvironmentsDifei Gao, Ruiping Wang 0001, Ziyi Bai, Xilin Chen 0001. 1655-1665 [doi]

Just Ask: Learning to Answer Questions from Millions of Narrated VideosAntoine Yang, Antoine Miech, Josef Sivic, Ivan Laptev, Cordelia Schmid. 1666-1677 [doi]

HAIR: Hierarchical Visual-Semantic Relational Reasoning for Video Question AnsweringFei Liu, Jing Liu 0001, Weining Wang, Hanqing Lu. 1678-1687 [doi]

Video Question Answering Using Language-Guided Deep Compressed-Domain Video FeatureNayoung Kim, Seong Jong Ha, Je-Won Kang. 1688-1697 [doi]

Multiple Pairwise Ranking Networks for Personalized Video SummarizationYassir Saquil, Da Chen, Yuan He, Chuan Li, Yong-Liang Yang. 1698-1707 [doi]

Frozen in Time: A Joint Video and Image Encoder for End-to-End RetrievalMax Bain, Arsha Nagrani, Gül Varol, Andrew Zisserman. 1708-1718 [doi]

Video Instance Segmentation with a Propose-Reduce ParadigmHuaijia Lin, Ruizheng Wu, Shu Liu 0005, Jiangbo Lu, Jiaya Jia. 1719-1728 [doi]

Deep 3D Mask Volume for View Synthesis of Dynamic ScenesKai-En Lin, Lei Xiao, Feng Liu 0015, Guowei Yang, Ravi Ramamoorthi. 1729-1738 [doi]

Unsupervised Deep Video DenoisingDev Yashpal Sheth, Sreyas Mohan, Joshua L. Vincent, Ramon Manzorro, Peter A. Crozier, Mitesh M. Khapra, Eero P. Simoncelli, Carlos Fernandez-Granda. 1739-1748 [doi]

TransVG: End-to-End Visual Grounding with TransformersJiajun Deng, Zhengyuan Yang, Tianlang Chen, Wengang Zhou, Houqiang Li. 1749-1759 [doi]

MDETR - Modulated Detection for End-to-End Multi-Modal UnderstandingAishwarya Kamath, Mannat Singh, Yann LeCun, Gabriel Synnaeve, Ishan Misra, Nicolas Carion. 1760-1770 [doi]

InstanceRefer: Cooperative Holistic Understanding for Visual Grounding on Point Clouds through Instance Multi-level Contextual ReferringZhihao Yuan, Xu Yan 0014, Yinghong Liao, Ruimao Zhang, Sheng Wang 0001, Zhen Li 0026, Shuguang Cui. 1771-1780 [doi]

Detector-Free Weakly Supervised Grounding by SeparationAssaf Arbelle, Sivan Doveh, Amit Alfassy, Joseph Shtok, Guy Lev, Eli Schwartz, Hilde Kuehne, Hila Barak Levi, Prasanna Sattigeri, Rameswar Panda, Chun-Fu Chen 0001, Alex M. Bronstein, Kate Saenko, Shimon Ullman, Raja Giryes, Rogério Feris, Leonid Karlinsky. 1781-1792 [doi]

Wasserstein Coupled Graph Learning for Cross-Modal RetrievalYun Wang, Tong Zhang 0021, Xueya Zhang, Zhen Cui 0001, Yuge Huang, Pengcheng Shen, Shaoxin Li, Jian Yang 0003. 1793-1802 [doi]

Learning to Generate Scene Graph from Natural Language SupervisionYiwu Zhong, Jing Shi 0005, Jianwei Yang, Chenliang Xu, Yin Li 0003. 1803-1814 [doi]

Ask&Confirm: Active Detail Enriching for Cross-Modal Retrieval with Partial QueryGuanyu Cai, Jun Zhang, Xinyang Jiang, Yifei Gong, Lianghua He, Fufu Yu, Pai Peng, Xiaowei Guo, Feiyue Huang, Xing Sun. 1815-1824 [doi]

Weakly Supervised Human-Object Interaction Detection in Video via Contrastive Spatiotemporal RegionsShuang Li, Yilun Du, Antonio Torralba 0001, Josef Sivic, Bryan C. Russell. 1825-1835 [doi]

SAT: 2D Semantics Assisted Training for 3D Visual GroundingZhengyuan Yang, Songyang Zhang, Liwei Wang 0009, Jiebo Luo. 1836-1846 [doi]

Adaptive Hierarchical Graph Reasoning with Semantic Coherence for Video-and-Language InferenceJuncheng Li 0006, Siliang Tang, Linchao Zhu, Haochen Shi, Xuanwen Huang, Fei Wu 0001, Yi Yang 0001, Yueting Zhuang. 1847-1857 [doi]

Interpretable Visual Reasoning via Induced Symbolic SpaceZhonghao Wang, Kai Wang, Mo Yu, Jinjun Xiong, Wen-mei Hwu, Mark Hasegawa-Johnson, Humphrey Shi. 1858-1867 [doi]

Factorizing Perception and Policy for Interactive Instruction FollowingKunal Pratap Singh, Suvaansh Bhambri, Byeonghwi Kim, Roozbeh Mottaghi, Jonghyun Choi. 1868-1877 [doi]

Unified Questioner Transformer for Descriptive Question Generation in Goal-Oriented Visual DialogueShoya Matsumori, Kosuke Shingyouchi, Yuki Abe 0002, Yosuke Fukuchi, Komei Sugiura, Michita Imai. 1878-1887 [doi]

Weakly Supervised Relative Spatial Reasoning for Visual Question AnsweringPratyay Banerjee, Tejas Gokhale, Yezhou Yang, Chitta Baral. 1888-1898 [doi]

Mixed SIGNals: Sign Language Production via a Mixture of Motion PrimitivesBen Saunders, Necati Cihan Camgöz, Richard Bowden. 1899-1909 [doi]

Localize to Binauralize: Audio Spatialization from Visual Sound Source LocalizationKranthi Kumar Rachavarapu, Aakanksha, Vignesh Sundaresha, A. N. Rajagopalan 0001. 1910-1919 [doi]

Spatial-Temporal Consistency Network for Low-Latency Trajectory ForecastingShijie Li, Yanying Zhou, Jinhui Yi, Juergen Gall. 1920-1929 [doi]

T-Net: Effective Permutation-Equivariant Network for Two-View Correspondence LearningZhen Zhong, Guobao Xiao, Linxin Zheng, Yan Lu, Jiayi Ma 0001. 1930-1939 [doi]

IntraTomo: Self-supervised Learning-based Tomography via Sinogram Synthesis and PredictionGuangming Zang, Ramzi Idoughi, Rui Li 0054, Peter Wonka, Wolfgang Heidrich. 1940-1950 [doi]

Describing and Localizing Multiple Changes with TransformersYue Qiu, Shintaro Yamamoto, Kodai Nakashima, Ryota Suzuki 0006, Kenji Iwata, Hirokatsu Kataoka, Yutaka Satoh. 1951-1960 [doi]

Cross-Camera Convolutional Color ConstancyMahmoud Afifi, Jonathan T. Barron, Chloe LeGendre, Yun-Ta Tsai, Francois Bleibel. 1961-1970 [doi]

IICNet: A Generic Framework for Reversible Image ConversionKa Leong Cheng, Yueqi Xie, Qifeng Chen. 1971-1980 [doi]

Dual-Camera Super-Resolution with Aligned Attention ModulesTengfei Wang 0002, Jiaxin Xie, Wenxiu Sun, Qiong Yan, Qifeng Chen. 1981-1990 [doi]

Let's See Clearly: Contaminant Artifact Removal for Moving CamerasXiaoyu Li, Bo Zhang 0025, Jing Liao 0001, Pedro V. Sander. 1991-2000 [doi]

Explainable Video Entailment with Grounded Visual EvidenceJunwen Chen, Yu Kong Golisano. 2001-2010 [doi]

Pano-AVQA: Grounded Audio-Visual Question Answering on 360° VideosHeeseung Yun, Youngjae Yu, Wonsuk Yang, Kangil Lee, Gunhee Kim. 2011-2021 [doi]

Adversarial VQA: A New Benchmark for Evaluating the Robustness of VQA ModelsLinjie Li, Jie Lei, Zhe Gan, Jingjing Liu 0001. 2022-2031 [doi]

AESOP: Abstract Encoding of Stories, Objects, and PicturesHareesh Ravi, Kushal Kafle, Scott Cohen, Jonathan Brandt, Mubbasir Kapadia. 2032-2043 [doi]

On the hidden treasure of dialog in video question answeringDeniz Engin, François Schnitzler, Ngoc Q. K. Duong, Yannis Avrithis. 2044-2053 [doi]

TRAR: Routing the Attention Spans in Transformer for Visual Question AnsweringYiyi Zhou, Tianhe Ren, Chaoyang Zhu, Xiaoshuai Sun, Jianzhuang Liu, Xinghao Ding, Mingliang Xu, Rongrong Ji. 2054-2064 [doi]

StyleCLIP: Text-Driven Manipulation of StyleGAN ImageryOr Patashnik, Zongze Wu, Eli Shechtman, Daniel Cohen-Or, Dani Lischinski. 2065-2074 [doi]

Viewpoint-Agnostic Change Captioning with Cycle ConsistencyHoeseong Kim, Jongseok Kim, Hyungseok Lee, Hyunsung Park, Gunhee Kim. 2075-2084 [doi]

*Rui Li, Yiheng Zhang, Zhaofan Qiu, Ting Yao, Dong Liu 0002, Tao Mei 0001. 2085-2094 [doi]

Language-Guided Global Image Editing via Cross-Modal Cyclic MechanismWentao Jiang, Ning Xu, Jiayun Wang, Chen Gao, Jing Shi, Zhe Lin 0002, Si Liu 0001. 2095-2104 [doi]

Image Retrieval on Real-life Images with Pre-trained Vision-and-Language ModelsZheyuan Liu 0002, Cristian Rodriguez Opazo, Damien Teney, Stephen Gould. 2105-2114 [doi]

Dual Transfer Learning for Event-based End-task Prediction via Pluggable Event to Image TranslationLin Wang 0025, Yujeong Chae, Kuk-Jin Yoon. 2115-2125 [doi]

N-ImageNet: Towards Robust, Fine-Grained Object Recognition with Event CamerasJunho Kim, Jaehyeok Bae, Gangin Park, Dongsu Zhang, Young Min Kim 0001. 2126-2136 [doi]

Patch Craft: Video Denoising by Deep Modeling and Patch MatchingGregory Vaksman, Michael Elad, Peyman Milanfar. 2137-2146 [doi]

LocTex: Learning Data-Efficient Visual Representations from Localized Textual SupervisionZhijian Liu, Simon Stent, Jie Li, John Gideon, Song Han 0003. 2147-2156 [doi]

Hierarchical Graph Attention Network for Few-shot Visual-Semantic LearningChengxiang Yin 0001, Kun Wu, Zhengping Che, Bo Jiang, Zhiyuan Xu, Jian Tang 0008. 2157-2166 [doi]

Partial Off-policy Learning: Balance Accuracy and Diversity for Human-Oriented Image CaptioningJiahe Shi, Yali Li, Shengjin Wang. 2167-2176 [doi]

Auto-Parsing Network for Image Captioning and Visual Question AnsweringXu Yang, Chongyang Gao, Hanwang Zhang, Jianfei Cai 0001. 2177-2187 [doi]

COOKIE: Contrastive Cross-Modal Knowledge Sharing Pre-training for Vision-Language RepresentationKeyu Wen, Jin Xia, Yuanyuan Huang, Linyang Li, Jiayan Xu, Jie Shao. 2188-2197 [doi]

Adversarial Attack on Deep Cross-Modal Hamming RetrievalChao Li, Shangqian Gao, Cheng Deng, Wei Liu 0005, Heng Huang. 2198-2207 [doi]

Defocus Map Estimation and Deblurring from a Single Dual-Pixel ImageShumian Xin, Neal Wadhwa, Tianfan Xue, Jonathan T. Barron, Pratul P. Srinivasan, Jiawen Chen, Ioannis Gkioulekas, Rahul Garg. 2208-2218 [doi]

How to Train Neural Networks for Flare RemovalYicheng Wu, Qiurui He 0001, Tianfan Xue, Rahul Garg, Jiawen Chen, Ashok Veeraraghavan, Jonathan T. Barron. 2219-2227 [doi]

Hyperspectral Image Denoising with Realistic DataTao Zhang, Ying Fu 0001, Cheng Li. 2228-2237 [doi]

Dynamic CT Reconstruction from Limited Views with Implicit Neural Representations and Parametric Motion FieldsAlbert W. Reed, HyoJin Kim, Rushil Anirudh, K. Aditya Mohan, Kyle Champley, Jingu Kang, Suren Jayasuriya. 2238-2248 [doi]

High Quality Disparity Remapping with Two-Stage WarpingBing Li 0024, Chia-Wen Lin, Cheng Zheng 0003, Shan Liu 0001, Junsong Yuan, Bernard Ghanem, C. C. Jay Kuo. 2249-2258 [doi]

Semantic-embedded Unsupervised Spectral Reconstruction from Single RGB Images in the WildZhiyu Zhu, Hui Liu 0032, Junhui Hou, Huanqiang Zeng, Qingfu Zhang 0001. 2259-2268 [doi]

Learning to Reduce Defocus Blur by Realistically Modeling Dual-Pixel DataAbdullah Abuolaim, Mauricio Delbracio, Damien Kelly, Michael S. Brown, Peyman Milanfar. 2269-2278 [doi]

Hybrid Neural Fusion for Full-frame Video StabilizationYu-Lun Liu, Wei-Sheng Lai, Ming-Hsuan Yang 0001, Yung-Yu Chuang, Jia-Bin Huang. 2279-2288 [doi]

Spatially-Adaptive Image Restoration using Distortion-Guided NetworksKuldeep Purohit, Maitreya Suin, A. N. Rajagopalan 0001, Vishnu Naresh Boddeti. 2289-2299 [doi]

Anonymizing Egocentric VideosDaksh Thapar, Aditya Nigam, Chetan Arora 0001. 2300-2309 [doi]

What You Can Learn by Staring at a Blank WallPrafull Sharma, Miika Aittala, Yoav Y. Schechner, Antonio Torralba 0001, Gregory W. Wornell, William T. Freeman, Frédo Durand. 2310-2319 [doi]

Inference of Black Hole Fluid-Dynamics from Sparse Interferometric MeasurementsAviad Levis, Daeyoung Lee, Joel A. Tropp, Charles F. Gammie, Katherine L. Bouman. 2320-2329 [doi]

C2N: Practical Generative Noise Modeling for Real-World DenoisingGeonwoon Jang, Wooseok Lee, Sanghyun Son, Kyoung Mu Lee. 2330-2339 [doi]

Fourier Space Losses for Efficient Perceptual Image Super-ResolutionDario Fuoli, Luc Van Gool, Radu Timofte. 2340-2349 [doi]

Lucas-Kanade Reloaded: End-to-End Super-Resolution from Raw Image BurstsBruno Lecouat, Jean Ponce, Julien Mairal. 2350-2359 [doi]

Variable-Rate Deep Image Compression through Spatially-Adaptive Feature TransformMyungseo Song, Jinyoung Choi, Bohyung Han. 2360-2369 [doi]

V-DESIRR: Very Fast Deep Embedded Single Image Reflection RemovalB. H. Pawan Prasad, Green Rosh K. S, R. B. Lokesh, Kaushik Mitra, Sanjoy Chowdhury. 2370-2379 [doi]

NeuSpike-Net: High Speed Video Reconstruction via Bio-inspired Neuromorphic CamerasLin Zhu 0012, Jianing Li, Xiao Wang, Tiejun Huang 0001, Yonghong Tian 0001. 2380-2389 [doi]

Large Scale Multi-Illuminant (LSMI) Dataset for Developing White Balance Algorithm under Mixed IlluminationDongyoung Kim, Jinwoo Kim, Seonghyeon Nam, Dongwoo Lee, Yeonkyung Lee, Nahyup Kang, Hyong-Euk Lee, ByungIn Yoo, Jae-Joon Han, Seon Joo Kim. 2390-2399 [doi]

A Light Stage on Every DeskSoumyadip Sengupta, Brian Curless, Ira Kemelmacher-Shlizerman, Steven M. Seitz. 2400-2409 [doi]

A Dark Flash Normal CameraZhihao Xia, Jason Lawrence, Supreeth Achar. 2410-2419 [doi]

Virtual light transport matrices for non-line-of-sight imagingJulio Marco, Adrián Jarabo, Ji Hyun Nam, Xiaochun Liu, Miguel Ángel Cosculluela, Andreas Velten, Diego Gutierrez. 2420-2429 [doi]

Learning Dynamic Interpolation for Extremely Sparse Light Fields with Wide BaselinesMantang Guo, Jing Jin 0006, Hui Liu 0032, Junhui Hou. 2430-2439 [doi]

Deep Reparametrization of Multi-Frame Super-Resolution and DenoisingGoutam Bhat, Martin Danelljan, Fisher Yu, Luc Van Gool, Radu Timofte. 2440-2450 [doi]

Real-time Image Enhancer via Learnable Spatial-aware 3D Lookup TablesTao Wang, Yong Li 0008, Jingyang Peng, Yipeng Ma, Xian Wang, Fenglong Song, Youliang Yan. 2451-2460 [doi]

Distillation-guided Image InpaintingMaitreya Suin, Kuldeep Purohit, A. N. Rajagopalan 0001. 2461-2470 [doi]

SeLFVi: Self-supervised Light-Field Video Reconstruction from Stereo VideoPrasan Shedligeri, Florian Schiffers, Sushobhan Ghosh, Oliver Cossairt, Kaushik Mitra. 2471-2481 [doi]

HDR Video Reconstruction: A Coarse-to-fine Network and A Real-world Benchmark DatasetGuanying Chen, Chaofeng Chen, Shi Guo, Zhetong Liang, Kwan-Yee K. Wong, Lei Zhang 0006. 2482-2491 [doi]

Photon-Starved Scene Inference using Single Photon CamerasBhavya Goyal, Mohit Gupta. 2492-2501 [doi]

Unsupervised Non-Rigid Image Distortion Removal via Grid DeformationNianyi Li, Simron Thapa, Cameron Whyte, Albert Reed, Suren Jayasuriya, Jinwei Ye. 2502-2512 [doi]

Super Resolve Dynamic Scene from Continuous Spike StreamsJing Zhao 0011, Jiyu Xie, Ruiqin Xiong, Jian Zhang, Zhaofei Yu, Tiejun Huang 0001. 2513-2522 [doi]

COMISR: Compression-Informed Video Super-ResolutionYinxiao Li, Pengchong Jin, Feng Yang, Ce Liu, Ming-Hsuan Yang 0001, Peyman Milanfar. 2523-2532 [doi]

Multitask AET with Orthogonal Tangent Regularity for Dark Object DetectionZiteng Cui, Guo-Jun Qi, Lin Gu, Shaodi You, Zenghui Zhang, Tatsuya Harada. 2533-2542 [doi]

Event-based Video Reconstruction Using TransformerWenming Weng, Yueyi Zhang, Zhiwei Xiong. 2543-2552 [doi]

Learning Privacy-preserving Optics for Human Pose EstimationCarlos Hinojosa, Juan Carlos Niebles, Henry Arguello. 2553-2562 [doi]

Motion Deblurring with Real EventsFang Xu, Lei Yu 0006, Bishan Wang, Wen Yang 0001, Gui-Song Xia, Xu Jia, Zhendong Qiao, Jianzhuang Liu. 2563-2572 [doi]

Objects as Cameras: Estimating High-Frequency Illumination from ShadowsTristan Swedish, Connor Henley, Ramesh Raskar. 2573-2582 [doi]

A Simple Framework for 3D Lensless Imaging with Programmable MasksYucheng Zheng, Yi-Hua, Aswin C. Sankaranarayanan, M. Salman Asif. 2583-2592 [doi]

Universal and Flexible Optical Aberration Correction Using Deep-Prior Based DeconvolutionXiu Li, Jinli Suo, Weihang Zhang, Xin Yuan 0002, Qionghai Dai. 2593-2601 [doi]

Self-supervised Neural Networks for Spectral Snapshot Compressive ImagingZiyi Meng, Zhenming Yu, Kun Xu, Xin Yuan 0002. 2602-2611 [doi]

Extreme-Quality Computational Imaging via Degradation FrameworkShiqi Chen, Huajun Feng, Keming Gao, Zhihai Xu, Yueting Chen. 2612-2621 [doi]

Single Image Defocus Deblurring Using Kernel-Sharing Parallel Atrous ConvolutionsHyeongseok Son, Junyong Lee, Sunghyun Cho, Seungyong Lee 0001. 2622-2630 [doi]

Single-shot Hyperspectral-Depth Imaging with Learned Diffractive OpticsSeung-Hwan Baek, Hayato Ikoma, Daniel S. Jeon, Yuqi Li, Wolfgang Heidrich, Gordon Wetzstein, Min H. Kim 0001. 2631-2640 [doi]

Incorporating Learnable Membrane Time Constant to Enhance Learning of Spiking Neural NetworksWei Fang, Zhaofei Yu, Yanqi Chen, Timothée Masquelier, Tiejun Huang 0001, Yonghong Tian 0001. 2641-2651 [doi]

Multispectral illumination estimation using deep unrolling networkYuqi Li, Qiang Fu 0002, Wolfgang Heidrich. 2652-2661 [doi]

A Hybrid Frequency-Spatial Domain Model for Sparse Image Reconstruction in Scanning Transmission Electron MicroscopyBintao He, Fa Zhang, Huanshui Zhang, Renmin Han. 2662-2671 [doi]

Time-Multiplexed Coded Aperture Imaging: Learned Coded Aperture and Pixel Exposures for Compressive Imaging SystemsEdwin Vargas, Julien N. P. Martel, Gordon Wetzstein, Henry Arguello. 2672-2682 [doi]

Dual Bipartite Graph Learning: A General Approach for Domain Adaptive Object DetectionChaoqi Chen, JiongCheng Li, Zebiao Zheng, Yue Huang 0001, Xinghao Ding, Yizhou Yu. 2683-2692 [doi]

The Devil is in the Task: Exploiting Reciprocal Appearance-Localization Features for Monocular 3D Object DetectionZhikang Zou, Xiaoqing Ye, Liang Du, Xianhui Cheng, Xiao Tan 0001, Li Zhang 0040, Jianfeng Feng, Xiangyang Xue, Errui Ding. 2693-2702 [doi]

Pyramid R-CNN: Towards Better Performance and Adaptability for 3D Object DetectionJiageng Mao, Minzhe Niu, Haoyue Bai, Xiaodan Liang, Hang Xu, Chunjing Xu. 2703-2712 [doi]

Learning Multi-Scene Absolute Pose Regression with TransformersYoli Shavit, Ron Ferens, Yosi Keller. 2713-2722 [doi]

Improving 3D Object Detection with Channel-wise TransformerHualian Sheng, Sijia Cai, Yuan Liu, Bing Deng, Jianqiang Huang, Xian-Sheng Hua 0001, Min-Jian Zhao 0001. 2723-2732 [doi]

HPNet: Deep Primitive Segmentation Using Hybrid RepresentationsSiming Yan, Zhenpei Yang, Chongyang Ma, Haibin Huang, Etienne Vouga, Qixing Huang. 2733-2742 [doi]

GraphFPN: Graph Feature Pyramid Network for Object DetectionGangming Zhao, Weifeng Ge, Yizhou Yu. 2743-2752 [doi]

SGPA: Structure-Guided Prior Adaptation for Category-Level 6D Object Pose EstimationKai Chen, Qi Dou. 2753-2762 [doi]

Instance Segmentation in 3D Scenes using Semantic Superpoint Tree NetworksZhihao Liang, Zhihao Li, Songcen Xu, Mingkui Tan, Kui Jia. 2763-2772 [doi]

PR-GCN: A Deep Graph Convolutional Network with Point Refinement for 6D Pose EstimationGuangyuan Zhou, Huiqun Wang, Jiaxin Chen, Di Huang 0001. 2773-2782 [doi]

Contrastive Attention Maps for Self-supervised Co-localizationMinsong Ki, Youngjung Uh, Junsuk Choe, Hyeran Byun. 2783-2792 [doi]

Sparse-shot Learning with Exclusive Cross-Entropy for Extremely Many LocalisationsAndreas Panteli, Jonas Teuwen, Hugo M. Horlings, Efstratios Gavves. 2793-2803 [doi]

Prior to Segment: Foreground Cues for Weakly Annotated Classes in Partially Supervised Instance SegmentationDavid Biertimpel, Sindi Shkodrani, Anil S. Baslamisli, Nóra Baka. 2804-2813 [doi]

Weakly Supervised 3D Semantic Segmentation Using Cross-Image Consensus and Inter-Voxel Affinity RelationsXiaoyu Zhu, Jeffrey Chen, Xiangrui Zeng, Junwei Liang 0001, Chengqi Li, Sinuo Liu, Sima Behpour, Min Xu 0009. 2814-2824 [doi]

Self-Supervised Image Prior Learning with GMM from a Single Noisy ImageHaosen Liu, Xuan Liu, Jiangbo Lu, Shan Tan. 2825-2834 [doi]

Human Detection and Segmentation via Multi-view ConsensusIsinsu Katircioglu, Helge Rhodin, Jörg Spörri, Mathieu Salzmann, Pascal Fua. 2835-2844 [doi]

PreDet: Large-scale weakly supervised pre-training for detectionVignesh Ramanathan, Rui Wang 0067, Dhruv Mahajan 0001. 2845-2855 [doi]

Boosting Weakly Supervised Object Detection via Learning Bounding Box AdjustersBowen Dong, Zitong Huang, Yuelin Guo, Qilong Wang, Zhenxing Niu, Wangmeng Zuo. 2856-2865 [doi]

TS-CAM: Token Semantic Coupled Attention Map for Weakly Supervised Object LocalizationWei Gao, Fang Wan, Xingjia Pan, Zhiliang Peng, Qi Tian 0001, Zhenjun Han, Bolei Zhou, Qixiang Ye. 2866-2875 [doi]

Semi-supervised Active Learning for Semi-supervised Models: Exploit Adversarial Examples with Graph-based Virtual LabelsJiannan Guo 0003, Haochen Shi, Yangyang Kang, Kun Kuang, Siliang Tang, Zhuoren Jiang, Changlong Sun, Fei Wu 0001, Yueting Zhuang. 2876-2885 [doi]

An End-to-End Transformer Model for 3D Object DetectionIshan Misra, Rohit Girdhar, Armand Joulin. 2886-2897 [doi]

RangeDet: In Defense of Range View for LiDAR-based 3D Object DetectionLue Fan, Xuan Xiong, Feng Wang, Naiyan Wang, Zhaoxiang Zhang. 2898-2907 [doi]

3DVG-Transformer: Relation Modeling for Visual Grounding on Point CloudsLichen Zhao, Daigang Cai, Lu Sheng, Dong Xu 0001. 2908-2917 [doi]

Gated3D: Monocular 3D Object Detection From Temporal Illumination CuesFrank D. Julca-Aguilar, Jason Taylor, Mario Bijelic, Fahim Mannan, Ethan Tseng, Felix Heide. 2918-2928 [doi]

Group-Free 3D Object Detection via TransformersZe Liu, Zheng Zhang 0022, Yue Cao 0001, Han Hu 0004, Xin Tong 0001. 2929-2938 [doi]

Body-Face Joint Detection via Embedding and Head HookJunfeng Wan, Jiangfan Deng, Xiaosong Qiu, Feng Zhou 0002. 2939-2948 [doi]

ELSD: Efficient Line Segment Detector and DescriptorHaotian Zhang, Yicheng Luo, Fangbo Qin, Yijia He, Xiao Liu. 2949-2958 [doi]

WB-DETR: Transformer-Based Detector without BackboneFanfan Liu, Haoran Wei, Wenzhe Zhao, Guozhen Li, Jingquan Peng, Zihao Li. 2959-2967 [doi]

Dynamic DETR: End-to-End Object Detection with Dynamic AttentionXiyang Dai, Yinpeng Chen, Jianwei Yang, Pengchuan Zhang, Lu Yuan, Lei Zhang 0001. 2968-2977 [doi]

Multi-Scale Vision Longformer: A New Vision Transformer for High-Resolution Image EncodingPengchuan Zhang, Xiyang Dai, Jianwei Yang, Bin Xiao, Lu Yuan, Lei Zhang 0001, Jianfeng Gao. 2978-2988 [doi]

Rank & Sort Loss for Object Detection and Instance SegmentationKemal Oksuz, Baris Can Cam, Emre Akbas, Sinan Kalkan. 2989-2998 [doi]

Switchable K-class Hyperplanes for Noise-Robust Representation LearningBoxiao Liu, Guanglu Song, Manyuan Zhang, Haihang You, Yu Liu. 2999-3008 [doi]

DecentLaM: Decentralized Momentum SGD for Large-batch Deep TrainingKun Yuan, Yiming Chen 0003, Xinmeng Huang, Yingya Zhang, Pan Pan, Yinghui Xu, Wotao Yin. 3009-3019 [doi]

Large-scale Robust Deep AUC Maximization: A New Surrogate Loss and Empirical Studies on Medical Image ClassificationZhuoning Yuan, Yan Yan 0006, Milan Sonka, Tianbao Yang. 3020-3029 [doi]

Robust Small-scale Pedestrian Detection with Cued Recall via Memory LearningJung-Uk Kim, Sungjune Park, Yong Man Ro. 3030-3039 [doi]

End-to-End Semi-Supervised Object Detection with Soft TeacherMengde Xu, Zheng Zhang 0022, Han Hu 0004, Jianfeng Wang, Lijuan Wang, Fangyun Wei, Xiang Bai, Zicheng Liu 0001. 3040-3049 [doi]

CaT: Weakly Supervised Object Detection with Category TransferTianyue Cao, Lianyu Du, Xiaoyun Zhang, Siheng Chen, Ya Zhang 0002, Yan-Feng Wang. 3050-3059 [doi]

ADNet: Leveraging Error-Bias Towards Normal Direction in Face AlignmentYangyu Huang, Hao Yang, Chong Li, Jongyoo Kim, Fangyun Wei. 3060-3070 [doi]

Causal Attention for Unbiased Visual RecognitionTan Wang, Chang Zhou, Qianru Sun, Hanwang Zhang. 3071-3080 [doi]

MLVSNet: Multi-level Voting Siamese Network for 3D Visual TrackingZhoutao Wang, Qian Xie, Yu-Kun Lai, Jing Wu, Kun Long, Jun Wang 0039. 3081-3090 [doi]

Geometry Uncertainty Projection Network for Monocular 3D Object DetectionYan Lu, Xinzhu Ma, Lei Yang, Tianzhu Zhang, Yating Liu, Qi Chu 0001, Junjie Yan, Wanli Ouyang. 3091-3101 [doi]

Multi-Instance Pose Networks: Rethinking Top-Down Pose EstimationRawal Khirodkar, Visesh Chari, Amit Agrawal 0002, Ambrish Tyagi. 3102-3111 [doi]

OMNet: Learning Overlapping Mask for Partial-to-Partial Point Cloud RegistrationHao Xu, Shuaicheng Liu, Guangfu Wang, Guanghui Liu, Bing Zeng. 3112-3121 [doi]

Is Pseudo-Lidar needed for Monocular 3D Object detection?Dennis Park, Rares Ambrus, Vitor Guizilini, Jie Li 0031, Adrien Gaidon. 3122-3132 [doi]

LIGA-Stereo: Learning LiDAR Geometry Aware Representations for Stereo-based 3D DetectorXiaoyang Guo, Shaoshuai Shi, Xiaogang Wang 0001, Hongsheng Li 0001. 3133-3143 [doi]

Voxel Transformer for 3D Object DetectionJiageng Mao, Yujing Xue, Minzhe Niu, Haoyue Bai, Jiashi Feng, Xiaodan Liang, Hang Xu, Chunjing Xu. 3144-3153 [doi]

Detecting Invisible PeopleTarasha Khurana, Achal Dave, Deva Ramanan. 3154-3164 [doi]

CrossDet: Crossline Representation for Object DetectionHeqian Qiu, Hongliang Li 0001, Qingbo Wu 0001, Jianhua Cui, Zichen Song, Lanxiao Wang, Minjian Zhang. 3175-3184 [doi]

Towards A Universal Model for Cross-Dataset Crowd CountingZhiheng Ma, Xiaopeng Hong, Xing Wei, Yunfeng Qiu, Yihong Gong. 3185-3194 [doi]

Exploiting sample correlation for crowd counting with multi-expert networkXinyan Liu, Guorong Li, Zhenjun Han, Weigang Zhang, Yifan Yang, Qingming Huang, Nicu Sebe. 3195-3204 [doi]

Are we Missing Confidence in Pseudo-LiDAR Methods for Monocular 3D Object Detection?Andrea Simonelli, Samuel Rota Bulò, Lorenzo Porzi, Peter Kontschieder, Elisa Ricci 0001. 3205-3213 [doi]

Uniformity in Heterogeneity: Diving Deep into Count Interval Partition for Crowd CountingChangan Wang, Qingyu Song, Boshen Zhang, Yabiao Wang, Ying Tai, Xuyi Hu, Chengjie Wang, Jilin Li, Jiayi Ma 0001, Yang Wu. 3214-3222 [doi]

Efficient Large Scale Inlier Voting for Geometric Vision ProblemsDror Aiger, Simon Lynen, Jan Hosang, Bernhard Zeisl. 3223-3231 [doi]

Continual Learning for Image-Based Camera LocalizationShuzhe Wang, Zakaria Laskar, Iaroslav Melekhov, Xiaotian Li, Juho Kannala. 3232-3242 [doi]

Query Adaptive Few-Shot Object Detection with Heterogeneous Graph Convolutional NetworksGuangxing Han, Yicheng He, Shiyuan Huang, Jiawei Ma, Shih-Fu Chang. 3243-3252 [doi]

Multi-Source Domain Adaptation for Object DetectionXingxu Yao, Sicheng Zhao, Pengfei Xu 0013, Jufeng Yang. 3253-3262 [doi]

RandomRooms: Unsupervised Pre-training from Synthetic Shapes and Randomized Layouts for 3D Object DetectionYongming Rao, Benlin Liu, Yi Wei, Jiwen Lu, Cho-Jui Hsieh, Jie Zhou 0001. 3263-3272 [doi]

You Don't Only Look Once: Constructing Spatial-Temporal Memory for Integrated 3D Object Detection and TrackingJiaming Sun, Yiming Xie, Siyu Zhang, Linghao Chen, Guofeng Zhang 0001, Hujun Bao, Xiaowei Zhou. 3265-3174 [doi]

Exploring Geometry-aware Contrast and Clustering Harmonization for Self-supervised 3D Object DetectionHanxue Liang, Chenhan Jiang, Dapeng Feng, Xin Chen, Hang Xu, Xiaodan Liang, Wei Zhang 0196, Zhenguo Li, Luc Van Gool. 3273-3282 [doi]

RePOSE: Fast 6D Object Pose Refinement via Deep Texture RenderingShun Iwase, Xingyu Liu, Rawal Khirodkar, Rio Yokota, Kris M. Kitani. 3283-3292 [doi]

PICCOLO: Point Cloud-Centric Omnidirectional LocalizationJunho Kim, Changwoon Choi, Hojun Jang, Young Min Kim 0001. 3293-3303 [doi]

GarmentNets: Category-Level Pose Estimation for Garments via Canonical Space Shape CompletionCheng Chi, Shuran Song. 3304-3313 [doi]

Personalized and Invertible Face De-identification by Disentangled Identity Information ManipulationJingyi Cao, Bo Liu 0001, Yunqian Wen, Rong Xie, Li Song 0001. 3314-3322 [doi]

Long-Term Temporally Consistent Unpaired Video Translation from Simulated Surgical 3D DataDominik Rivoir, Micha Pfeiffer, Reuben Docea, Fiona Kolbinger, Carina Riediger, Jürgen Weitz, Stefanie Speidel. 3323-3333 [doi]

Multi-scale Matching Networks for Semantic CorrespondenceDongyang Zhao, Ziyang Song, Zhenghao Ji, Gangming Zhao, Weifeng Ge, Yizhou Yu. 3334-3344 [doi]

Rethinking Counting and Localization in Crowds: A Purely Point-Based FrameworkQingyu Song, Changan Wang, Zhengkai Jiang, Yabiao Wang, Ying Tai, Chengjie Wang, Jilin Li, Feiyue Huang, Yang Wu. 3345-3354 [doi]

Learning to Better Segment Objects from Unseen Classes with Unlabeled VideosYuming Du, Yang Xiao 0007, Vincent Lepetit. 3355-3364 [doi]

Foreground Activation Maps for Weakly Supervised Object LocalizationMeng Meng, Tianzhu Zhang, Qi Tian 0001, Yongdong Zhang 0001, Feng Wu 0001. 3365-3375 [doi]

ICON: Learning Regular Maps Through Inverse ConsistencyHastings Greer, Roland Kwitt, François-Xavier Vialard, Marc Niethammer. 3376-3385 [doi]

DiscoBox: Weakly Supervised Instance Segmentation and Semantic Correspondence from Box SupervisionShiyi Lan, Zhiding Yu, Christopher B. Choy, Subhashree Radhakrishnan, Guilin Liu, Yuke Zhu, Larry S. Davis, Anima Anandkumar. 3386-3396 [doi]

Exploring Classification Equilibrium in Long-Tailed Object DetectionChengjian Feng, Yujie Zhong, Weilin Huang. 3397-3406 [doi]

Normalization Matters in Weakly Supervised Object LocalizationJeesoo Kim, Junsuk Choe, Sangdoo Yun, Nojun Kwak. 3407-3416 [doi]

Training Multi-Object Detector by Estimating Bounding Box Distribution for Input ImageJaeyoung Yoo, Hojun Lee, Inseop Chung, Geonseok Seo, Nojun Kwak. 3417-3426 [doi]

Semi-Supervised Active Learning with Temporal Output DiscrepancySiyu Huang, Tianyang Wang, Haoyi Xiong, Jun Huan, Dejing Dou. 3427-3436 [doi]

FASA: Feature Augmentation and Sampling Adaptation for Long-Tailed Instance SegmentationYuhang Zang, Chen Huang, Chen Change Loy. 3437-3446 [doi]

Learning Hierarchical Graph Neural Networks for Image ClusteringYifan Xing, Tong He, Tianjun Xiao, Yongxin Wang, Yuanjun Xiong, Wei Xia, David Wipf, Zheng Zhang, Stefano Soatto. 3447-3457 [doi]

Big Self-Supervised Models Advance Medical Image ClassificationShekoofeh Azizi, Basil Mustafa, Fiona Ryan, Zachary Beaver, Jan Freyberg, Jonathan Deaton, Aaron Loh, Alan Karthikesalingam, Simon Kornblith, Ting Chen, Vivek Natarajan, Mohammad Norouzi 0002. 3458-3468 [doi]

Collaborative and Adversarial Learning of Focused and Dispersive Representations for Semi-supervised Polyp SegmentationHuisi Wu, Guilian Chen, Zhenkun Wen, Jing Qin 0001. 3469-3478 [doi]

Preservational Learning Improves Self-supervised Medical Image Models by Reconstructing Diverse ContextsHong-Yu Zhou, Chixiang Lu, Sibei Yang, Xiaoguang Han, Yizhou Yu. 3479-3489 [doi]

TOOD: Task-aligned One-stage Object DetectionChengjian Feng, Yujie Zhong, Yu Gao, Matthew R. Scott, Weilin Huang. 3490-3499 [doi]

Oriented R-CNN for Object DetectionXingxing Xie, Gong Cheng 0003, Jiabao Wang, Xiwen Yao, Junwei Han. 3500-3509 [doi]

Towards Rotation Invariance in Object DetectionAgastya Kalra, Guy Stoppi, Bradley Brown, Rishav Agarwal, Achuta Kadambi. 3510-3520 [doi]

FMODetect: Robust Detection of Fast Moving ObjectsDenys Rozumnyi, Jirí Matas, Filip Sroubek, Marc Pollefeys, Martin R. Oswald. 3521-3529 [doi]

Visual Relationship Detection Using Part-and-Sum Transformers with Composite QueriesQi Dong, Zhuowen Tu, Haofu Liao, Yuting Zhang, Vijay Mahadevan, Stefano Soatto. 3530-3539 [doi]

DualPoseNet: Category-level 6D Object Pose and Size Estimation Using Dual Pose Network with Refined Learning of Pose ConsistencyJiehong Lin, Zewei Wei, Zhihao Li, Songcen Xu, Kui Jia, Yuanqing Li. 3540-3549 [doi]

SimROD: A Simple Adaptation Method for Robust Object DetectionRindra Ramamonjison, Amin Banitalebi-Dehkordi, Xinyu Kang, Xiaolong Bai, Yong Zhang. 3550-3559 [doi]

Disentangled High Quality Salient Object DetectionLv Tang, Bo Li, Yijie Zhong, Shouhong Ding, Mofei Song. 3560-3570 [doi]

G-DetKD: Towards General Distillation Framework for Object Detectors via Contrastive and Semantic-guided Feature ImitationLewei Yao, Renjie Pi, Hang Xu, Wei Zhang 0196, Zhenguo Li, Tong Zhang. 3571-3580 [doi]

TransFER: Learning Relation-aware Facial Expression Representations with TransformersFanglei Xue, Qiangchang Wang, Guodong Guo. 3581-3590 [doi]

Rethinking Transformer-based Set Prediction for Object DetectionZhiqing Sun, Shengcao Cao, Yiming Yang, Kris Kitani. 3591-3600 [doi]

Fast Convergence of DETR with Spatially Modulated Co-AttentionPeng Gao 0007, Minghang Zheng, Xiaogang Wang 0001, Jifeng Dai, Hongsheng Li 0001. 3601-3610 [doi]

Reconcile Prediction Consistency for Balanced Object DetectionKeyang Wang, Lei Zhang. 3611-3620 [doi]

Mutual Supervision for Dense Object DetectionZiteng Gao, Limin Wang 0002, Gangshan Wu. 3621-3630 [doi]

Conditional DETR for Fast Training ConvergenceDepu Meng, Xiaokang Chen, Zejia Fan, Gang Zeng, Houqiang Li, Yuhui Yuan, Lei Sun, Jingdong Wang 0001. 3631-3640 [doi]

Meta Pairwise Relationship Distillation for Unsupervised Person Re-identificationHaoxuanye Ji, Le Wang 0003, Sanping Zhou, Wei Tang, Nanning Zheng 0001, Gang Hua 0001. 3641-3650 [doi]

Teacher-Student Adversarial Depth Hallucination to Improve Face RecognitionHardik Uppal, Alireza Sepas-Moghaddam, Michael A. Greenspan, Ali Etemad. 3651-3660 [doi]

Fake it till you make it: face analysis in the wild using synthetic data aloneErroll Wood, Tadas Baltrusaitis, Charlie Hewitt, Sebastian Dziadzio, Thomas J. Cashman 0001, Jamie Shotton. 3661-3671 [doi]

Disentangled Representation for Age-Invariant Face Recognition: A Mutual Information Minimization PerspectiveXuege Hou, Yali Li, Shengjin Wang. 3672-3681 [doi]

Cross-Encoder for Unsupervised Gaze Representation LearningYunjia Sun, Jiabei Zeng, Shiguang Shan, Xilin Chen 0001. 3682-3691 [doi]

VENet: Voting Enhancement Network for 3D Object DetectionQian Xie, Yu-Kun Lai, Jing Wu, Zhoutao Wang, Dening Lu, Mingqiang Wei, Jun Wang 0039. 3692-3701 [doi]

Free-form Description Guided 3D Visual Graph Network for Object Grounding in Point CloudMingtao Feng, Zhen Li, Qi Li, Liang Zhang 0010, Xiangdong Zhang, Guangming Zhu 0001, Hui Zhang 0023, Yaonan Wang, Ajmal Mian. 3702-3711 [doi]

Real-time Vanishing Point Detector Integrating Under-parameterized RANSAC and Hough TransformJianping Wu, Liang Zhang, Ye Liu, Ke Chen 0014. 3712-3721 [doi]

Looking here or there? Gaze Following in 360-Degree ImagesYunhao Li, Wei Shen, Zhongpai Gao, Yucheng Zhu, Guangtao Zhai, Guodong Guo. 3722-3731 [doi]

Towards Efficient Graph Convolutional Networks for Point Cloud HandlingYawei Li, He Chen, Zhaopeng Cui, Radu Timofte, Marc Pollefeys, Gregory S. Chirikjian, Luc Van Gool. 3732-3742 [doi]

Multi-Echo LiDAR for 3D Object DetectionYunze Man, Xinshuo Weng, Prasanna Kumar Sivakumar, Matthew O'Toole, Kris Kitani. 3743-3752 [doi]

CondLaneNet: a Top-to-down Lane Detection Framework Based on Conditional ConvolutionLizhe Liu, Xiaohao Chen, Siyu Zhu, Ping Tan. 3753-3762 [doi]

CrackFormer: Transformer Network for Fine-Grained Crack DetectionHuajun Liu, Xiangyu Miao, Christoph Mertz, Chengzhong Xu 0001, Hui Kong. 3763-3772 [doi]

DWKS : A Local Descriptor of Deformations Between Meshes and Point CloudsRobin Magnet, Maks Ovsjanikov. 3773-3782 [doi]

Physics-Enhanced Machine Learning for Virtual Fluorescence MicroscopyColin L. V. Cooke, Fanjie Kong, Amey Chaware, Kevin C. Zhou, Kanghyun Kim, Rong Xu, D. Michael Ando, Samuel J. Yang, Pavan Chandra Konda, Roarke Horstmeyer. 3783-3793 [doi]

DAM: Discrepancy Alignment Metric for Face RecognitionJiaheng Liu, Yudong Wu, Yichao Wu, Chuming Li, Xiaolin Hu, Ding Liang, Mengyu Wang. 3794-3803 [doi]

Topologically Consistent Multi-View Face Inference Using Volumetric SamplingTianye Li, Shichen Liu, Timo Bolkart, Jiayi Liu, Hao Li 0015, Yajie Zhao. 3804-3814 [doi]

Generalizing Gaze Estimation with Outlier-guided Collaborative AdaptationYunfei Liu, Ruicong Liu, Haofei Wang, Feng Lu. 3815-3824 [doi]

Learn to Cluster Faces via Pairwise ClassificationJunfu Liu, Di Qiu, Pengfei Yan, Xiaolin Wei. 3825-3833 [doi]

End-to-end robust joint unsupervised image alignment and clusteringXiangrui Zeng, Gregory Howe, Min Xu 0009. 3834-3846 [doi]

FACIAL: Synthesizing Dynamic Talking Face with Implicit Attribute LearningChenxu Zhang, Yifan Zhao, Yifei Huang, Ming Zeng, Saifeng Ni, Madhukar Budagavi, Xiaohu Guo. 3847-3856 [doi]

Disentangled Lifespan Face SynthesisSen He, Wentong Liao, Michael Ying Yang, Yi-Zhe Song, Bodo Rosenhahn, Tao Xiang. 3857-3866 [doi]

Retrieve in Style: Unsupervised Facial Feature Transfer and RetrievalMin Jin Chong, Wen-Sheng Chu, Abhishek Kumar, David A. Forsyth. 3867-3876 [doi]

Towards Face Encryption by Generating Adversarial Identity MasksXiao Yang, Yinpeng Dong, Tianyu Pang, Hang Su 0006, Jun Zhu 0001, Yuefeng Chen, Hui Xue 0001. 3877-3887 [doi]

Re-Aging GAN: Toward Personalized Face Age TransformationFarkhod Makhmudkhujaev, Sungeun Hong, In Kyu Park. 3888-3897 [doi]

Recurrent Mask Refinement for Few-Shot Medical Image SegmentationHao Tang, Xingwei Liu, Shanlin Sun, Xiangyi Yan, Xiaohui Xie. 3898-3908 [doi]

Generative Adversarial Registration for Improved Conditional Deformable TemplatesNeel Dey, Mengwei Ren, Adrian V. Dalca, Guido Gerig. 3909-3921 [doi]

GLoRIA: A Multimodal Global-Local Representation Learning Framework for Label-efficient Medical Image RecognitionShih-Cheng Huang, Liyue Shen, Matthew P. Lungren, Serena Yeung. 3922-3931 [doi]

Semantic Aware Data Augmentation for Cell Nuclei Microscopical Images with Artificial Neural NetworksAlireza Naghizadeh, Hongye Xu, Mohab Mohamed, Dimitris N. Metaxas, Dongfang Liu. 3932-3941 [doi]

T-AutoML: Automated Machine Learning for Lesion Segmentation using Transformers in 3D Medical ImagingDong Yang 0005, Andriy Myronenko, Xiaosong Wang, Ziyue Xu, Holger R. Roth, Daguang Xu. 3942-3954 [doi]

RFNet: Region-aware Fusion Network for Incomplete Multi-modal Brain Tumor SegmentationYuhang Ding, Xin Yu, Yi Yang 0001. 3955-3964 [doi]

Visual-Textual Attentive Semantic Consistency for Medical Report GenerationYi Zhou 0007, Lei Huang 0015, Tao Zhou 0002, Huazhu Fu, Ling Shao 0001. 3965-3974 [doi]

The Way to my Heart is through Contrastive Learning: Remote Photoplethysmography from Unlabelled VideoJohn Gideon, Simon Stent. 3975-3984 [doi]

Multi-Class Cell Detection Using Spatial Context RepresentationShahira Abousamra, David Belinsky, John S. Van Arnam, Felicia Allard, Eric Yee, Rajarsi Gupta, Tahsin M. Kurç, Dimitris Samaras, Joel H. Saltz, Chao Chen 0012. 3985-3994 [doi]

Multimodal Co-Attention Transformer for Survival Prediction in Gigapixel Whole Slide ImagesRichard J. Chen, Ming Y. Lu, Wei-Hung Weng, Tiffany Y. Chen, Drew F. K. Williamson, Trevor Manz, Maha Shady, Faisal Mahmood. 3995-4005 [doi]

CDNet: Centripetal Direction Network for Nuclear Instance SegmentationHongliang He, Zhongyi Huang, Yao Ding 0006, Guoli Song, Lin Wang, Qian Ren, Pengxu Wei, Zhiqiang Gao, Jie Chen 0001. 4006-4015 [doi]

Mutual-Complementing Framework for Nuclei Detection and Segmentation in Pathology ImageZunlei Feng, Zhonghua Wang, Xinchao Wang, Yining Mao, Thomas Li, Jie Lei, Yuexuan Wang, Mingli Song. 4016-4025 [doi]

Deep survival analysis with longitudinal X-rays for COVID-19Michelle Shu, Richard Strong Bowen, Charles Herrmann, Gengmo Qi, Michele Santacatterina, Ramin Zabih. 4026-4035 [doi]

Self-Supervised Cryo-Electron Tomography Volumetric Image Restoration from Single Noisy Volume with Sparsity ConstraintZhidong Yang, Fa Zhang 0001, Renmin Han. 4036-4045 [doi]

CryoDRGN2: Ab initio neural reconstruction of 3D protein structures from real cryo-EM imagesEllen D. Zhong, Adam Lerer, Joseph H. Davis, Bonnie Berger. 4046-4055 [doi]

Hierarchical Conditional Flow: A Unified Framework for Image Super-Resolution and Image RescalingJingyun Liang, Andreas Lugmayr, Kai Zhang 0008, Martin Danelljan, Luc Van Gool, Radu Timofte. 4056-4065 [doi]

Learning Dual Priors for JPEG Compression Artifacts RemovalXueyang Fu, Xi Wang, Aiping Liu, Junwei Han, Zheng-Jun Zha. 4066-4075 [doi]

Mutual Affine Network for Spatially Variant Kernel Estimation in Blind Image Super-ResolutionJingyun Liang, Guolei Sun, Kai Zhang 0008, Luc Van Gool, Radu Timofte. 4076-4085 [doi]

STAR: A Structure-aware Lightweight Transformer for Real-time Image EnhancementZhaoyang Zhang, Yitong Jiang, Jun Jiang, Xiaogang Wang 0001, Ping Luo 0002, Jinwei Gu. 4086-4095 [doi]

Perceptual Variousness Motion Deblurring with Light Global Context RefinementJichun Li, Weimin Tan, Bo Yan. 4096-4105 [doi]

StarEnhancer: Learning Real-Time and Style-Aware Image EnhancementYuda Song, Hui Qian 0001, Xin Du. 4106-4115 [doi]

MFNet: Multi-filter Directive Network for Weakly Supervised Salient Object DetectionYongri Piao, Jian Wang, Miao Zhang, Huchuan Lu. 4116-4125 [doi]

Uncertainty-Guided Transformer Reasoning for Camouflaged Object DetectionFan Yang 0054, Qiang Zhai, Xin Li 0079, Rui Huang 0008, Ao Luo, Hong Cheng 0002, Deng-Ping Fan. 4126-4135 [doi]

Scene Context-Aware Salient Object DetectionAvishek Siris, Jianbo Jiao, Gary K. L. Tam, Xianghua Xie, Rynson W. H. Lau. 4136-4146 [doi]

Summarize and Search: Learning Consensus-aware Dynamic Convolution for Co-Saliency DetectionNi Zhang, Junwei Han, Nian Liu, Ling Shao 0001. 4147-4156 [doi]

Light Source Guided Single-Image Flare Removal from Unpaired DataXiaotian Qiao, Gerhard P. Hancke 0002, Rynson W. H. Lau. 4157-4165 [doi]

PlaneTR: Structure-Guided Transformers for 3D Plane RecoveryBin Tan, Nan Xue 0001, Song Bai, Tianfu Wu 0001, Gui-Song Xia. 4166-4175 [doi]

ALL Snow Removed: Single Image Desnowing Algorithm Using Hierarchical Dual-tree Complex Wavelet Representation and Contradict Channel LossWei-Ting Chen, Hao-Yu Fang, Cheng-Lin Hsieh, Cheng-Che Tsai, I-Hsiang Chen, Jian-Jiun Ding, Sy-Yen Kuo. 4176-4185 [doi]

Exploring Visual Engagement Signals for Representation LearningMenglin Jia, Zuxuan Wu, Austin Reiter, Claire Cardie, Serge J. Belongie, Ser-Nam Lim. 4186-4197 [doi]

TransView: Inside, Outside, and Across the Cropping View BoundariesZhiyu Pan, Zhiguo Cao 0001, Kewei Wang, Hao Lu 0003, Weicai Zhong. 4198-4207 [doi]

Inverting a Rolling Shutter Camera: Bring Rolling Shutter Images to High Framerate Global Shutter VideoBin Fan, Yuchao Dai. 4208-4217 [doi]

Structure-Preserving Deraining with Residue Channel Prior GuidanceQiaosi Yi, Juncheng Li 0003, Qinyan Dai, Faming Fang, Guixu Zhang, Tieyong Zeng. 4218-4227 [doi]

ReconfigISP: Reconfigurable Camera Image Processing PipelineKe Yu, Zexian Li, Yue Peng, Chen Change Loy, Jinwei Gu. 4228-4237 [doi]

Event-Intensity Stereo: Estimating Depth by the Best of Both WorldsS. Mohammad Mostafavi I., Kuk-Jin Yoon, Jonghyun Choi. 4238-4247 [doi]

End-to-end Piece-wise Unwarping of Document ImagesSagnik Das, Kunwar Yashraj Singh, Jon Wu, Erhan Bas, Vijay Mahadevan, Rahul Bhotika, Dimitris Samaras. 4248-4257 [doi]

Context Reasoning Attention Network for Image Super-ResolutionYulun Zhang, Donglai Wei, Can Qin, Huan Wang 0014, Hanspeter Pfister, Yun Fu 0001. 4258-4267 [doi]

Dynamic High-Pass Filtering and Multi-Spectral Attention for Image Super-ResolutionSalma Abdel Magid, Yulun Zhang, Donglai Wei, Won-Dong Jang, Zudi Lin, Yun Fu 0001, Hanspeter Pfister. 4268-4277 [doi]

Pyramid Architecture Search for Real-Time Image DeblurringXiaobin Hu, Wenqi Ren, Kaicheng Yu, Kaihao Zhang, Xiaochun Cao, Wei Liu 0005, Bjoern H. Menze. 4278-4287 [doi]

Learning Frequency-aware Dynamic Network for Efficient Super-ResolutionWenbin Xie, Dehua Song, Chang Xu 0002, Chunjing Xu, Hui Zhang, Yunhe Wang 0001. 4288-4297 [doi]

Unsupervised Real-World Super-Resolution: A Domain Adaptation PerspectiveWei Wang, Haochen Zhang, Zehuan Yuan, Changhu Wang. 4298-4307 [doi]

Dynamic Attentive Graph Learning for Image RestorationChong Mou, Jian Zhang, Zhuoyuan Wu. 4308-4317 [doi]

RGB-D Saliency Detection via Cascaded Mutual Information MinimizationJing Zhang 0052, Deng-Ping Fan, Yuchao Dai, Xin Yu 0002, Yiran Zhong, Nick Barnes, Ling Shao 0001. 4318-4327 [doi]

Learning RAW-to-sRGB Mappings with Inaccurately Aligned SupervisionZhilu Zhang, Haolin Wang, Ming Liu 0018, Ruohao Wang, Jiawei Zhang 0002, Wangmeng Zuo. 4328-4338 [doi]

Deep Structured Instance Graph for Distilling Object DetectorsYixin Chen, Pengguang Chen, Shu Liu 0005, Liwei Wang, Jiaya Jia. 4339-4348 [doi]

Learning Unsupervised Metaformer for Anomaly DetectionJhih-Ciang Wu, Ding-Jie Chen, Chiou-Shann Fuh, Tyng-Luh Liu. 4349-4358 [doi]

Equivariant Imaging: Learning Beyond the Range SpaceDongdong Chen 0004, Julián Tachella, Mike E. Davies. 4359-4368 [doi]

Multi-Level Curriculum for Training A Distortion-Aware Barrel Distortion Rectification ModelKang Liao, Chunyu Lin, Lixin Liao, Yao Zhao 0001, Weiyao Lin. 4369-4378 [doi]

Zero-Shot Day-Night Domain Adaptation with a Physics PriorAttila Lengyel, Sourav Garg, Michael Milford, Jan C. van Gemert. 4379-4389 [doi]

MixMix: All You Need for Data-Free Compression Are Feature and Data MixingYuhang Li, Feng Zhu, Ruihao Gong, Mingzhu Shen, Xin Dong 0009, Fengwei Yu, Shaoqing Lu, Shi Gu. 4390-4399 [doi]

Federated Learning for Non-IID Data via Unified Feature Learning and Optimization Objective AlignmentLin Zhang, Yong Luo 0002, Yan Bai, Bo Du, Ling-Yu Duan. 4400-4408 [doi]

Omniscient Video Super-ResolutionPeng Yi 0002, Zhongyuan Wang 0001, Kui Jiang, Junjun Jiang, Tao Lu 0001, Xin Tian 0006, Jiayi Ma 0001. 4409-4418 [doi]

Adaptive Unfolding Total Variation Network for Low-Light Image EnhancementChuanjun Zheng, Daming Shi 0001, Wentian Shi. 4419-4428 [doi]

Ultra-High-Definition Image HDR Reconstruction via Collaborative Bilateral LearningZhuoran Zheng, Wenqi Ren, Xiaochun Cao, Tao Wang, Xiuyi Jia. 4429-4438 [doi]

Representative Color Transform for Image EnhancementHanul Kim, Su-Min Choi, Chang-Su Kim 0001, Yeong Jun Koh. 4439-4448 [doi]

Super-Resolving Cross-Domain Face Miniatures by Peeking at One-Shot ExemplarPeike Li, Xin Yu, Yi Yang 0001. 4449-4459 [doi]

Event Stream Super-Resolution via Spatiotemporal Constraint LearningSiqi Li, Yutong Feng, Yipeng Li, Yu Jiang, Changqing Zou, Yue Gao 0002. 4460-4469 [doi]

Self-Conditioned Probabilistic Learning of Video RescalingYuan Tian, Guo Lu, Xiongkuo Min, Zhaohui Che, Guangtao Zhai, Guodong Guo, Zhiyong Gao. 4470-4479 [doi]

A New Journey from SDRTV to HDRTVXiangyu Chen, Zhengwen Zhang, Jimmy S. Ren, Lynhoo Tian, Yu Qiao 0001, Chao Dong. 4480-4489 [doi]

ResRep: Lossless CNN Pruning via Decoupling Remembering and ForgettingXiaohan Ding, Tianxiang Hao, Jianchao Tan, Ji Liu 0002, Jungong Han, Yuchen Guo, Guiguang Ding. 4490-4500 [doi]

Efficient Video Compression via Content-Adaptive Super-ResolutionMehrdad Khani Shirkoohi, Vibhaalakshmi Sivaraman, Mohammad Alizadeh. 4501-4510 [doi]

Bringing Events into Video Deblurring with Non-consecutively Blurry FramesWei Shang, Dongwei Ren, Dongqing Zou, Jimmy S. Ren, Ping Luo 0002, Wangmeng Zuo. 4511-4520 [doi]

SUNet: Symmetric Undistortion Network for Rolling Shutter CorrectionBin Fan, Yuchao Dai, Mingyi He. 4521-4530 [doi]

Robust Automatic Monocular Vehicle Speed Estimation for Traffic SurveillanceJérôme Revaud, Martin Humenberger. 4531-4541 [doi]

Augmenting Depth Estimation with Geospatial ContextScott Workman, Hunter Blanton. 4542-4551 [doi]

Real-Time Video Inference on Edge Devices via Adaptive Model StreamingMehrdad Khani Shirkoohi, Pouya Hamadanian, Arash Nasr-Esfahany, Mohammad Alizadeh. 4552-4562 [doi]

Score-Based Point Cloud DenoisingShitong Luo, Wei Hu. 4563-4572 [doi]

Rethinking Noise Synthesis and Modeling in Raw DenoisingYi Zhang, Hongwei Qin, Xiaogang Wang, Hongsheng Li. 4573-4581 [doi]

Extensions of Karger's Algorithm: Why They Fail in Theory and How They Are Useful in PracticeErik Jenner, Enrique Fita Sanmartín, Fred A. Hamprecht. 4582-4591 [doi]

Low-Rank Tensor Completion by Approximating the Tensor Average RankZhanliang Wang, Junyu Dong, Xinguo Liu, Xueying Zeng. 4592-4600 [doi]

RDI-Net: Relational Dynamic Inference NetworksHuanyu Wang, Songyuan Li, Shihao Su, Zequn Qin, Xi Li 0001. 4601-4610 [doi]

Overfitting the Data: Compact Neural Video Delivery via Content-aware Feature ModulationJiaming Liu, Ming Lu, Kaixin Chen, Xiaoqi Li 0009, Shizun Wang, Zhaoqing Wang, Enhua Wu, Yurong Chen 0001, Chuang Zhang, Ming Wu 0001. 4611-4620 [doi]

Rethinking Coarse-to-Fine Approach in Single Image DeblurringSung-Jin Cho 0002, Seo-Won Ji, Jun-Pyo Hong, Seung-Won Jung, Sung Jea Ko. 4621-4630 [doi]

Cross-Patch Graph Convolutional Network for Image DenoisingYao Li, Xueyang Fu, Zheng-Jun Zha. 4631-4640 [doi]

PnP-DETR: Towards Efficient Visual Analysis with TransformersTao Wang 0053, Li Yuan 0007, Yunpeng Chen, Jiashi Feng, Shuicheng Yan. 4641-4650 [doi]

DCT-SNN: Using DCT to Distribute Spatial Information over Time for Low-Latency Spiking Neural NetworksIsha Garg, Sayeed Shafayet Chowdhury, Kaushik Roy 0001. 4651-4660 [doi]

Specificity-preserving RGB-D Saliency DetectionTao Zhou 0002, Huazhu Fu, Geng Chen 0001, Yi Zhou 0007, Deng-Ping Fan, Ling Shao 0001. 4661-4671 [doi]

High-Fidelity Pluralistic Image Completion with TransformersZiyu Wan, Jingbo Zhang, Dongdong Chen 0001, Jing Liao 0001. 4672-4681 [doi]

Mitigating Intensity Bias in Shadow Detection via Feature Decomposition and ReweightingLei Zhu, Ke Xu 0010, Zhanghan Ke, Rynson W. H. Lau. 4682-4691 [doi]

Light Field Saliency Detection with Dual Local Graph Learning and Reciprocative GuidanceNian Liu, Wangbo Zhao, Dingwen Zhang, Junwei Han, Ling Shao 0001. 4692-4701 [doi]

Visual Saliency TransformerNian Liu, Ni Zhang, Kaiyuan Wan, Ling Shao 0001, Junwei Han. 4702-4712 [doi]

HiNet: Deep Image Hiding by Invertible NetworkJunpeng Jing, Xin Deng 0002, Mai Xu, Jianyi Wang, Zhenyu Guan. 4713-4722 [doi]

CANet: A Context-Aware Network for Shadow RemovalZipei Chen, Chengjiang Long, Ling Zhang, Chunxia Xiao. 4723-4732 [doi]

Unpaired Learning for Deep Image Deraining with Rain Direction RegularizerYang Liu 0119, Ziyu Yue, Jinshan Pan, Zhixun Su. 4733-4741 [doi]

DivAug: Plug-in Automated Data Augmentation with Explicit Diversity MaximizationZirui Liu, Haifeng Jin, Ting-Hsiang Wang, Kaixiong Zhou, Xia Hu. 4742-4750 [doi]

Morphable Detector for Object Detection on DemandXiangyun Zhao, Xu Zou, Ying Wu. 4751-4760 [doi]

Real-world Video Super-resolution: A Benchmark Dataset and A Decomposition based Learning SchemeXi Yang, Wangmeng Xiang, Hui Zeng, Lei Zhang 0006. 4761-4770 [doi]

Designing a Practical Degradation Model for Deep Blind Image Super-ResolutionKai Zhang 0008, Jingyun Liang, Luc Van Gool, Radu Timofte. 4771-4780 [doi]

Learning A Single Network for Scale-Arbitrary Super-ResolutionLongguang Wang, Yingqian Wang 0002, Zaiping Lin, Jungang Yang 0001, Wei An, Yulan Guo. 4781-4790 [doi]

Deep Blind Video Super-resolutionJinshan Pan, Haoran Bai, Jiangxin Dong, Jiawei Zhang 0002, Jinhui Tang. 4791-4800 [doi]

Achieving on-Mobile Real-Time Super-Resolution with Neural Architecture and Pruning SearchZheng Zhan 0001, Yifan Gong 0004, Pu Zhao, Geng Yuan, Wei Niu, Yushu Wu, Tianyun Zhang, Malith Jayaweera, David R. Kaeli, Bin Ren, Xue Lin, Yanzhi Wang. 4801-4811 [doi]

SSH: A Self-Supervised Framework for Image HarmonizationYifan Jiang, He Zhang, Jianming Zhang 0001, Yilin Wang, Zhe L. Lin, Kalyan Sunkavalli, Simon Chen, Sohrab Amirghodsi, Sarah Kong, Zhangyang Wang. 4812-4821 [doi]

Out-of-boundary View Synthesis Towards Full-Frame Video StabilizationYufei Xu, Jing Zhang, Dacheng Tao. 4822-4831 [doi]

R-SLAM: Optimizing Eye Tracking from Rolling Shutter Video of the RetinaJay Shenoy, James Fong, Jeffrey Tan, Austin Roorda, Ren Ng. 4832-4841 [doi]

Attentive and Contrastive Learning for Joint Depth and Motion Field EstimationSeokJu Lee, François Rameau, Fei Pan, In-So Kweon. 4842-4851 [doi]

Panoptic Segmentation of Satellite Image Time Series with Convolutional Temporal Attention NetworksVivien Sainte Fare Garnot, Loïc Landrieu. 4852-4861 [doi]

EvIntSR-Net: Event Guided Multiple Latent Frames Reconstruction and Super-resolutionJin Han, Yixin Yang, Chu Zhou, Chao Xu 0006, Boxin Shi. 4862-4871 [doi]

Dense Deep Unfolding Network with 3D-CNN Prior for Snapshot Compressive ImagingZhuoyuan Wt, Jian Zhangt, Chong Mou. 4872-4881 [doi]

Video Matting via Consistency-Regularized Graph Neural NetworksTiantian Wang, Sifei Liu, Yapeng Tian, Kai Li, Ming-Hsuan Yang 0001. 4882-4891 [doi]

Collaborative Unsupervised Visual Representation Learning from Decentralized DataWeiming Zhuang, Xin Gan, Yonggang Wen 0001, Shuai Zhang, Shuai Yi. 4892-4901 [doi]

Full-Duplex Strategy for Video Object SegmentationGe-Peng Ji, Keren Fu, Zhe Wu, Deng-Ping Fan, Jianbing Shen, Ling Shao 0001. 4902-4913 [doi]

iNAS: Integral NAS for Device-Aware Salient Object DetectionYuchao Gu, Shang-hua Gao, Xu-Sheng Cao, Peng Du, Shao-Ping Lu, Ming-Ming Cheng. 4914-4924 [doi]

A Machine Teaching Framework for Scalable RecognitionPei Wang, Nuno Vasconcelos. 4925-4934 [doi]

The Benefit of Distraction: Denoising Camera-Based Physiological Measurements using Inverse AttentionEwa Magdalena Nowara, Daniel McDuff, Ashok Veeraraghavan. 4935-4944 [doi]

Adaptive Graph Convolution for Point Cloud AnalysisHaoran Zhou, Yidan Feng, Mingsheng Fang, Mingqiang Wei, Jing Qin 0001, Tong Lu. 4945-4954 [doi]

Weakly-supervised Video Anomaly Detection with Robust Temporal Feature Magnitude LearningYu Tian, Guansong Pang, Yuanhong Chen, Rajvinder Singh, Johan W. Verjans, Gustavo Carneiro. 4955-4966 [doi]

Improving De-raining Generalization via Neural ReorganizationJie Xiao, Man Zhou, Xueyang Fu, Aiping Liu, Zheng-Jun Zha. 4967-4976 [doi]

Towards Flexible Blind JPEG Artifacts RemovalJiaxi Jiang, Kai Zhang 0008, Radu Timofte. 4977-4986 [doi]

Learning to Remove Refractive Distortions from Underwater ImagesSimron Thapa, Nianyi Li, Jinwei Ye. 4987-4996 [doi]

Location-aware Single Image Reflection RemovalZheng Dong, Ke Xu 0010, Yin Yang 0002, Hujun Bao, Weiwei Xu, Rynson W. H. Lau. 4997-5006 [doi]

DC-ShadowNet: Single-Image Hard and Soft Shadow Removal Using Unsupervised Domain-Classifier Guided NetworkYeying Jin, Aashish Sharma, Robby T. Tan. 5007-5016 [doi]

Polarimetric Helmholtz StereopsisYuqi Ding, Yu Ji 0001, Mingyuan Zhou, Sing Bing Kang, Jinwei Ye. 5017-5026 [doi]

Self-born Wiring for Neural TreesYing Chen, Feng Mao, Jie Song, Xinchao Wang, Huiqiong Wang, Mingli Song. 5027-5036 [doi]

Student Customized Knowledge Distillation: Bridging the Gap Between Student and TeacherYichen Zhu, Yi Wang. 5037-5046 [doi]

Adaptive Curriculum LearningYajing Kong, Liu Liu, Jun Wang, Dacheng Tao. 5047-5056 [doi]

BlockPlanner: City Block Generation with Vectorized Graph RepresentationLinning Xu, Yuanbo Xiangli, Anyi Rao, Nanxuan Zhao, Bo Dai, Ziwei Liu, Dahua Lin. 5057-5066 [doi]

Rethinking Deep Image Prior for DenoisingYeonsik Jo, Se Young Chun, Jonghyun Choi. 5067-5076 [doi]

NASOA: Towards Faster Task-oriented Online Fine-tuning with a Zoo of ModelsHang Xu, Ning Kang 0001, Gengwei Zhang, Chuanlong Xie, Xiaodan Liang, Zhenguo Li. 5077-5086 [doi]

Learning Multiple Pixelwise Tasks Based on Loss Scale BalancingJae-Han Lee, Chul Lee, Chang-Su Kim 0001. 5087-5096 [doi]

Pixel Difference Networks for Efficient Edge DetectionZhuo Su 0002, Wenzhe Liu, Zitong Yu, Dewen Hu, Qing Liao 0001, Qi Tian 0001, Matti Pietikäinen, Li Liu 0002. 5097-5107 [doi]

Entropy Maximization and Meta Classification for Out-of-Distribution Detection in Semantic SegmentationRobin Chan, Matthias Rottmann, Hanno Gottschalk. 5108-5117 [doi]

Spectral Leakage and Rethinking the Kernel Size in CNNsNergis Tomen, Jan C. van Gemert. 5118-5127 [doi]

MUSIQ: Multi-scale Image Quality TransformerJunjie Ke, Qifei Wang, Yilin Wang, Peyman Milanfar, Feng Yang. 5128-5137 [doi]

BlockCopy: High-Resolution Video Processing with Block-Sparse Feature Propagation and Online PoliciesThomas Verelst, Tinne Tuytelaars. 5138-5147 [doi]

SACoD: Sensor Algorithm Co-Design Towards Efficient CNN-powered Intelligent PhlatCamYonggan Fu, Yang Zhang, Yue Wang 0036, Zhihan Lu, Vivek Boominathan, Ashok Veeraraghavan, Yingyan Lin. 5148-5157 [doi]

Unsupervised Curriculum Domain Adaptation for No-Reference Video Quality AssessmentPengfei Chen, Leida Li, Jinjian Wu, Weisheng Dong, Guangming Shi. 5158-5167 [doi]

Bit-Mixer: Mixed-precision networks with runtime bit-width selectionAdrian Bulat, Georgios Tzimiropoulos. 5168-5177 [doi]

ReCU: Reviving the Dead Weights in Binary Neural NetworksZihan Xu, Mingbao Lin, Jianzhuang Liu, Jie Chen 0001, Ling Shao 0001, Yue Gao 0002, Yonghong Tian 0001, Rongrong Ji. 5178-5188 [doi]

HIRE-SNN: Harnessing the Inherent Robustness of Energy-Efficient Deep Spiking Neural Networks by Training with Crafted Input NoiseSouvik Kundu 0002, Massoud Pedram, Peter A. Beerel. 5189-5198 [doi]

*Peng Chen, Bohan Zhuang, Chunhua Shen. 5199-5208 [doi]

Towards Memory-Efficient Neural Networks via Multi-Level in situ GenerationJiaqi Gu, Hanqing Zhu, Chenghao Feng, Mingjie Liu, Zixuan Jiang, Ray T. Chen, David Z. Pan. 5209-5218 [doi]

GDP: Stabilized Neural Network Pruning via Gates with Differentiable PolarizationYi Guo, Huan Yuan, Jianchao Tan, Zhangyang Wang, Sen Yang, Ji Liu. 5219-5230 [doi]

RMSMP: A Novel Deep Neural Network Quantization Framework with Row-wise Mixed Schemes and Multiple PrecisionsSung-En Chang, Yanyu Li, Mengshu Sun, Weiwen Jiang, Sijia Liu 0001, Yanzhi Wang, Xue Lin. 5231-5240 [doi]

Improving Low-Precision Network Quantization via Bin RegularizationTiantian Han, Dong Li, Ji Liu, Lu Tian, Yi Shan. 5241-5250 [doi]

Distance-aware QuantizationDohyung Kim, Junghyup Lee, Bumsub Ham. 5251-5260 [doi]

Improving Neural Network Efficiency via Post-training Quantization with Adaptive Floating-PointFangxin Liu, Wenbo Zhao, Zhezhi He, Yanzhi Wang, Zongwu Wang, Changzhi Dai, Xiaoyao Liang, Li Jiang 0002. 5261-5270 [doi]

Generalizable Mixed-Precision Quantization via Attribution Rank PreservationZiwei Wang, Han Xiao, Jiwen Lu, Jie Zhou 0001. 5271-5280 [doi]

Meta-Aggregator: Learning to Aggregate for 1-bit Graph Neural NetworksYongcheng Jing, Yiding Yang, Xinchao Wang, Mingli Song, Dacheng Tao. 5281-5290 [doi]

*Changyong Shu, Yifan Liu, Jianfei Gao, Zheng Yan, Chunhua Shen. 5291-5300 [doi]

Improving Generalization of Batch Whitening by Convolutional Unit OptimizationYooshin Cho, Hanbyel Cho, Youngsoo Kim, Junmo Kim. 5301-5309 [doi]

Dynamic Dual Gating Neural NetworksFanrong Li, Gang Li 0015, Xiangyu He, Jian Cheng 0001. 5310-5319 [doi]

Once Quantization-Aware Training: High Performance Extremely Low-bit Architecture SearchMingzhu Shen, Feng Liang, Ruihao Gong, Yuhang Li, Chuming Li, Chen Lin 0003, Fengwei Yu, Junjie Yan, Wanli Ouyang. 5320-5329 [doi]

Towards Mixed-Precision Quantization of Neural Networks via Constrained OptimizationWeihan Chen, Peisong Wang, Jian Cheng 0001. 5330-5339 [doi]

Sub-bit Neural Networks: Learning to Compress and Accelerate Binary Neural NetworksYikai Wang, Yi Yang 0001, Fuchun Sun 0001, Anbang Yao. 5340-5349 [doi]

Cluster-Promoting Quantization with Bit-Drop for Minimizing Network Quantization LossJung-Hyun Lee, Jihun Yun, Sung Ju Hwang, Eunho Yang. 5350-5359 [doi]

Fast and Efficient DNN Deployment via Deep Gaussian Transfer LearningQi Sun, Chen Bai, Tinghuan Chen, Hao Geng, Xinyun Zhang, Yang Bai, Bei Yu 0001. 5360-5370 [doi]

SmartShadow: Artistic Shadow Drawing Tool for Line DrawingsLvmin Zhang, Jinyue Jiang, Yi Ji 0001, Chunping Liu. 5371-5380 [doi]

BEV-Net: Assessing Social Distancing Compliance by Joint People Localization and Geometric ReasoningZhirui Dai, Yuepeng Jiang, Yi Li, Bo Liu, Antoni B. Chan, Nuno Vasconcelos. 5381-5391 [doi]

Towards Real-World Prohibited Item Detection: A Large-Scale X-ray BenchmarkBoying Wang, Libo Zhang, Longyin Wen, Xianglong Liu, Yanjun Wu. 5392-5401 [doi]

Explain Me the Painting: Multi-Topic Knowledgeable Art Description GenerationZechen Bai, Yuta Nakashima, Noa Garcia. 5402-5412 [doi]

ZFlow: Gated Appearance Flow-based Virtual Try-on with 3D PriorsAyush Chopra, Rishabh Jain, Mayur Hemani, Balaji Krishnamurthy. 5413-5422 [doi]

Structure-from-Sherds: Incremental 3D Reassembly of Axially Symmetric Pots from Unordered and Mixed Fragment CollectionsJe Hyeong Hong, Yoo Seong Jong, Muhammad Zeeshan Arshad, Young Min Kim 0001, Jinwook Kim. 5423-5431 [doi]

Rotation Averaging in a Split Second: A Primal-Dual Method and a Closed-Form for Cycle GraphsGabriel Moreira, Manuel Marques, João Paulo Costeira. 5432-5440 [doi]

imGHUM: Implicit Generative Models of 3D Human Shape and Articulated PoseThiemo Alldieck, Hongyi Xu, Cristian Sminchisescu. 5441-5450 [doi]

DeePSD: Automatic Deep Skinning And Pose Space Deformation For 3D Garment AnimationHugo Bertiche, Meysam Madadi, Emilio Tylson, Sergio Escalera. 5451-5460 [doi]

CanvasVAE: Learning to Generate Vector Graphic DocumentsKota Yamaguchi. 5461-5469 [doi]

Distinctiveness oriented Positional Equilibrium for Point Cloud RegistrationTaewon Min, Chonghyuk Song, Eunseok Kim, Inwook Shim. 5470-5478 [doi]

SnowflakeNet: Point Cloud Completion by Snowflake Point Deconvolution with Skip-TransformerPeng Xiang, Xin Wen, Yu-Shen Liu, Yan-Pei Cao, Pengfei Wan, Wen Zheng, Zhizhong Han. 5479-5489 [doi]

Superpoint Network for Point Cloud OversegmentationLe Hui, Jia Yuan, Mingmei Cheng, Jin Xie, Xiaoya Zhang, Jian Yang 0003. 5490-5499 [doi]

4D Cloud Scattering TomographyRoi Ronen, Yoav Y. Schechner, Eshkol Eytan. 5500-5509 [doi]

Feature Interactive Representation for Point Cloud RegistrationBingli Wu, Jie Ma, Gaojie Chen, Pei-an. 5510-5519 [doi]

Viewing Graph Solvability via Cycle ConsistencyFederica Arrigoni, Andrea Fusiello, Elisa Ricci 0001, Tomás Pajdla. 5520-5529 [doi]

MBA-VO: Motion Blur Aware Visual OdometryPeidong Liu, Xingxing Zuo, Viktor Larsson, Marc Pollefeys. 5530-5539 [doi]

Lightweight Multi-person Total Motion Capture Using Sparse Multi-view CamerasYuxiang Zhang, Zhe Li, Liang An, Mengcheng Li, Tao Yu 0007, Yebin Liu. 5540-5549 [doi]

Orthographic-Perspective Epipolar GeometryViktor Larsson, Marc Pollefeys, Magnus Oskarsson. 5550-5558 [doi]

Minimal Solutions for Panoramic Stitching Given Gravity PriorYaqing Ding, Daniel Barath, Zuzana Kukelova. 5559-5568 [doi]

UNISURF: Unifying Neural Implicit Surfaces and Radiance Fields for Multi-View ReconstructionMichael Oechsle, Songyou Peng, Andreas Geiger 0001. 5569-5579 [doi]

PR-RRN: Pairwise-Regularized Residual-Recursive Networks for Non-rigid Structure-from-MotionHaitian Zeng, Yuchao Dai, Xin Yu 0002, Xiaohan Wang, Yi Yang. 5580-5589 [doi]

NerfingMVS: Guided Optimization of Neural Radiance Fields for Indoor Multi-view StereoYi Wei, Shaohui Liu, Yongming Rao, Wang Zhao, Jiwen Lu, Jie Zhou 0001. 5590-5599 [doi]

H3D-Net: Few-Shot High-Fidelity 3D Head ReconstructionEduard Ramon, Gil Triginer, Janna Escur, Albert Pumarola, Jaime Garcia Giraldez, Xavier Giró i Nieto, Francesc Moreno-Noguer. 5600-5609 [doi]

Scene Synthesis via Uncertainty-Driven Attribute SynchronizationHaitao Yang 0005, Zaiwei Zhang, Siming Yan, Haibin Huang, Chongyang Ma, Yi Zheng, Chandrajit Bajaj, Qixing Huang. 5610-5620 [doi]

Out-of-Core Surface Reconstruction via Global TGV MinimizationNikolai Poliarnyi. 5621-5630 [doi]

Adaptive Surface Reconstruction with Multiscale Convolutional KernelsBenjamin Ummenhofer, Vladlen Koltun. 5631-5640 [doi]

Learning Icosahedral Spherical Probability Map Based on Bingham Mixture Model for Vanishing Point EstimationHaoang Li, Kai Chen, Pyojin Kim, Kuk-Jin Yoon, Zhe Liu, Kyungdon Joo, Yun-Hui Liu. 5641-5650 [doi]

3DeepCT: Learning Volumetric Scattering Tomography of CloudsYael Sde-Chen, Yoav Y. Schechner, Vadim Holodovsky, Eshkol Eytan. 5651-5662 [doi]

DeepPRO: Deep Partial Point Cloud Registration of ObjectsDonghoon Lee, Onur C. Hamsici, Steven Feng, Prachee Sharma, Thorsten Gernoth. 5663-5672 [doi]

Pri3D: Can 3D Priors Help 2D Representation Learning?Ji Hou, Saining Xie, Benjamin Graham, Angela Dai, Matthias Nießner. 5673-5682 [doi]

Extreme Structure from Motion for Indoor Panoramas without Visual OverlapsMohammad Amin Shabani, Weilian Song, Makoto Odamaki, Hirochika Fujiki, Yasutaka Furukawa. 5683-5691 [doi]

Dynamic View Synthesis from Dynamic Monocular VideoChen Gao, Ayush Saraf, Johannes Kopf, Jia-Bin Huang. 5692-5701 [doi]

Multi-view 3D Reconstruction with TransformersDan Wang 0011, Xinrui Cui, Xun Chen 0001, Zhengxia Zou, Tianyang Shi, Septimiu Salcudean, Z. Jane Wang 0001, Rabab Ward. 5702-5711 [doi]

EPP-MVSNet: Epipolar-assembling based Depth Prediction for Multi-view StereoXinjun Ma, Yue Gong, Qirui Wang, Jingwei Huang, Lei Chen, Fan Yu. 5712-5720 [doi]

BARF: Bundle-Adjusting Neural Radiance FieldsChen-Hsuan Lin, Wei-Chiu Ma, Antonio Torralba 0001, Simon Lucey. 5721-5731 [doi]

PlenOctrees for Real-time Rendering of Neural Radiance FieldsAlex Yu, Ruilong Li, Matthew Tancik, Hao Li 0015, Ren Ng, Angjoo Kanazawa. 5732-5741 [doi]

Neural Articulated Radiance FieldAtsuhiro Noguchi, Xiao Sun, Stephen Lin, Tatsuya Harada. 5742-5752 [doi]

Editing Conditional Radiance FieldsSteven Liu, Xiuming Zhang, Zhoutong Zhang, Richard Zhang 0001, Jun-Yan Zhu, Bryan Russell. 5753-5763 [doi]

AD-NeRF: Audio Driven Neural Radiance Fields for Talking Head SynthesisYudong Guo, Keyu Chen, Sen Liang, Yong-Jin Liu, Hujun Bao, Juyong Zhang. 5764-5774 [doi]

GTT-Net: Learned Generalized Trajectory TriangulationXiangyu Xu, Enrique Dunn. 5775-5784 [doi]

Deep Hybrid Self-Prior for Full 3D Mesh GenerationXingkui Wei, Zhengqing Chen, Yanwei Fu, Zhaopeng Cui, Yinda Zhang 0001. 5785-5794 [doi]

ARAPReg: An As-Rigid-As Possible Regularization Loss for Learning Deformable Shape GeneratorsQixing Huang, Xiangru Huang, Bo Sun, Zaiwei Zhang, Junfeng Jiang, Chandrajit Bajaj. 5795-5805 [doi]

3D Shape Generation and Completion through Point-Voxel DiffusionLinqi Zhou, Yilun Du, Jiajun Wu 0001. 5806-5815 [doi]

LSD-StructureNet: Modeling Levels of Structural Detail in 3D Part HierarchiesDominic Roberts, Ara Danielyan, Hang Chu, Mani Golparvar Fard, David Forsyth. 5816-5825 [doi]

Self-Calibrating Neural Radiance FieldsYoonwoo Jeong, Seokjun Ahn, Christopher Choy, Animashree Anandkumar, Minsu Cho, Jaesik Park. 5826-5834 [doi]

Mip-NeRF: A Multiscale Representation for Anti-Aliasing Neural Radiance FieldsJonathan T. Barron, Ben Mildenhall, Matthew Tancik, Peter Hedman, Ricardo Martin-Brualla, Pratul P. Srinivasan. 5835-5844 [doi]

Nerfies: Deformable Neural Radiance FieldsKeunhong Park, Utkarsh Sinha, Jonathan T. Barron, Sofien Bouaziz, Dan B. Goldman, Steven M. Seitz, Ricardo Martin-Brualla. 5845-5854 [doi]

Baking Neural Radiance Fields for Real-Time View SynthesisPeter Hedman, Pratul P. Srinivasan, Ben Mildenhall, Jonathan T. Barron, Paul E. Debevec. 5855-5864 [doi]

Putting NeRF on a Diet: Semantically Consistent Few-Shot View SynthesisAjay Jain, Matthew Tancik, Pieter Abbeel. 5865-5874 [doi]

PoGO-Net: Pose Graph Optimization with Graph Neural NetworksXinyi Li, Haibin Ling. 5875-5885 [doi]

Radial Distortion Invariant Factorization for Structure from MotionJosé Pedro Iglesias, Carl Olsson. 5886-5895 [doi]

Gaussian Fusion: Accurate 3D Reconstruction via Geometry-Guided Displacement InterpolationDuo Chen, Zixin Tang, Zhenyu Xu, Yunan Zheng, Yiguang Liu. 5896-5905 [doi]

Dynamical Pose EstimationHeng Yang, Chris Doran, Jean-Jacques E. Slotine. 5906-5915 [doi]

Calibrated and Partially Calibrated Semi-Generalized HomographiesSnehal Bhayani, Torsten Sattler, Daniel Barath, Patrik Beliansky, Janne Heikkilä, Zuzana Kukelova. 5916-5925 [doi]

ELLIPSDF: Joint Object Pose and Shape Optimization with a Bi-level Ellipsoid and Signed Distance Function DescriptionMo Shan, Qiaojun Feng, You-Yi Jau, Nikolay Atanasov. 5926-5935 [doi]

Learning Efficient Photometric Feature Transform for Multi-view StereoKaizhang Kang, Cihui Xie, Ruisheng Zhu, Xiaohe Ma, Ping Tan, Hongzhi Wu, Kun Zhou 0001. 5936-5945 [doi]

STR-GQN: Scene Representation and Rendering for Unknown Cameras Based on Spatial Transformation RoutingWen-Cheng Chen, Min-Chun Hu 0001, Chu-Song Chen. 5946-5955 [doi]

Deep Permutation Equivariant Structure from MotionDror Moran, Hodaya Koslowsky, Yoni Kasten, Haggai Maron, Meirav Galun, Ronen Basri. 5956-5966 [doi]

Pixel-Perfect Structure-from-Motion with Featuremetric RefinementPhilipp Lindenberger, Paul-Edouard Sarlin, Viktor Larsson, Marc Pollefeys. 5967-5977 [doi]

ODAM: Object Detection, Association, and Mapping using Posed RGB VideoKejie Li, Daniel DeTone, Steven Chen, Minh Vo, Ian Reid 0001, Hamid Rezatofighi, Chris Sweeney, Julian Straub, Richard A. Newcombe. 5978-5988 [doi]

SaccadeCam: Adaptive Visual Attention for Monocular Depth SensingBrevin Tilmon, Sanjeev J. Koppal. 5989-5998 [doi]

Transfusion: A Novel SLAM Method Focused on Transparent ObjectsYifan Zhu, Jiaxiong Qiu, Bo Ren. 5999-6008 [doi]

Matching in the Dark: A Dataset for Matching Image Pairs of Low-light ScenesWenzheng Song, Masanori Suganuma, Xing Liu 0010, Noriyuki Shimobayashi, Daisuke Maruta, Takayuki Okatani. 6009-6018 [doi]

DepthInSpace: Exploitation and Fusion of Multiple Video Frames for Structured-Light Depth EstimationMohammad Mahdi Johari, Camilla Carta, François Fleuret. 6019-6028 [doi]

Stacked Homography Transformations for Multi-View Pedestrian DetectionLiangchen Song, Jialian Wu, Ming Yang 0007, Qian Zhang 0009, Yuan Li, Junsong Yuan. 6029-6037 [doi]

Cross-Descriptor Visual Localization and MappingMihai Dusmanu, Ondrej Miksik, Johannes L. Schönberger, Marc Pollefeys. 6038-6047 [doi]

Minimal Cases for Computing the Generalized Relative Pose using Affine CorrespondencesBanglei Guan, Ji Zhao 0001, Daniel Barath, Friedrich Fraundorfer. 6048-6057 [doi]

Digging into Uncertainty in Self-supervised Multi-view StereoHongbin Xu, Zhipeng Zhou, Yali Wang, Wenxiong Kang, Baigui Sun, Hao Li 0030, Yu Qiao 0001. 6058-6067 [doi]

Differentiable Surface Rendering via Non-Differentiable SamplingForrester Cole, Kyle Genova, Avneesh Sud, Daniel Vlasic, Zhoutong Zhang. 6068-6077 [doi]

Pyramid Point Cloud Transformer for Large-Scale Place RecognitionLe Hui, Hang Yang, Mingmei Cheng, Jin Xie, Jian Yang 0003. 6078-6087 [doi]

(Just) A Spoonful of Refinements Helps the Registration Error Go DownSérgio Agostinho, Aljosa Osep, Alessio Del Bue, Laura Leal-Taixé. 6088-6097 [doi]

AdaFit: Rethinking Learning-based Normal Estimation on Point CloudsRunsong Zhu, Yuan Liu, Zhen Dong, Yuan Wang, Tengping Jiang, Wenping Wang, Bisheng Yang. 6098-6107 [doi]

Sampling Network Guided Cross-Entropy Method for Unsupervised Point Cloud RegistrationHaobo Jiang, Yaqi Shen, Jin Xie, Jun Li, Jianjun Qian, Jian Yang 0003. 6108-6117 [doi]

A Robust Loss for Point Cloud RegistrationZhi Deng, Yuxin Yao, BaiLin Deng, Juyong Zhang. 6118-6127 [doi]

Rational Polynomial Camera Model Warping for Deep Learning Based Satellite Multi-View Stereo MatchingJian Gao, Jin Liu, Shunping Ji. 6128-6137 [doi]

PatchMatch-RL: Deep MVS with Pixelwise Depth, Normal, and VisibilityJae-Yong Lee, Joseph DeGol, Chuhang Zou, Derek Hoiem. 6138-6147 [doi]

A Confidence-based Iterative Solver of Depths and Surface Normals for Deep Multi-view StereoWang Zhao, Shaohui Liu, Yi Wei, Hengkai Guo, Yong-Jin Liu. 6148-6157 [doi]

Just a Few Points are All You Need for Multi-view Stereo: A Novel Semi-supervised Learning Method for Multi-view StereoTaekyung Kim 0002, Jaehoon Choi, Seokeon Choi, Dongki Jung, Changick Kim. 6158-6166 [doi]

AA-RMVSNet: Adaptive Aggregation Recurrent Multi-view Stereo NetworkZizhuang Wei, Qingtian Zhu, Chen Min, Yisong Chen, Guoping Wang. 6167-6176 [doi]

Revisiting Stereo Depth Estimation From a Sequence-to-Sequence Perspective with TransformersZhaoshuo Li, Xingtong Liu, Nathan Drenkow, Andy S. Ding, Francis X. Creighton, Russell H. Taylor, Mathias Unberath. 6177-6186 [doi]

COTR: Correspondence Transformer for Matching Across ImagesWei Jiang, Eduard Trulls, Jan Hosang, Andrea Tagliasacchi, Kwang Moo Yi. 6187-6197 [doi]

On the Limits of Pseudo Ground Truth in Visual Camera Re-localisationEric Brachmann, Martin Humenberger, Carsten Rother, Torsten Sattler. 6198-6208 [doi]

iMAP: Implicit Mapping and Positioning in Real-TimeEdgar Sucar, Shikun Liu, Joseph Ortiz, Andrew J. Davison. 6209-6218 [doi]

DeepMultiCap: Performance Capture of Multiple Characters Using Sparse Multiview CamerasYang Zheng, Ruizhi Shao, Yuxiang Zhang, Tao Yu 0007, Zerong Zheng, Qionghai Dai, Yebin Liu. 6219-6229 [doi]

Learning to Bundle-adjust: A Graph Network Approach to Faster Optimization of Bundle Adjustment for Vehicular SLAMTetsuya Tanaka, Yukihiro Sasagawa, Takayuki Okatani. 6230-6239 [doi]

Faster Multi-Object Segmentation using Parallel Quadratic Pseudo-Boolean OptimizationNiels Jeppesen, Patrick M. Jensen, Anders Nymark Christensen, Anders B. Dahl, Vedrana Andersen Dahl. 6240-6249 [doi]

Fusion Moves for Graph MatchingLisa Hutschenreiter, Stefan Haller, Lorenz Feineis, Carsten Rother, Dagmar Kainmüller, Bogdan Savchynskyy. 6250-6259 [doi]

FFT-OT: A Fast Algorithm for Optimal TransportationNa Lei, Xianfeng Gu. 6260-6269 [doi]

Distilling Global and Local Logits with Densely Connected RelationsYoumin Kim, Jinbae Park, YounHo Jang, Muhammad Salman Ali, Tae Hyun Oh, Sung-Ho Bae. 6270-6280 [doi]

Learning to Match Features with Seeded Graph Matching Networkhongkai Chen, Zixin Luo, Jiahui Zhang, Lei Zhou, Xuyang Bai, Zeyu Hu, Chiew-Lan Tai, Long Quan. 6281-6290 [doi]

UASNet: Uncertainty Adaptive Sampling Network for Deep Stereo MatchingYamin Mao, Zhihua Liu, Weiming Li, Yuchao Dai, Qiang Wang, Yun-Tae Kim, Hong-Seok Lee. 6291-6299 [doi]

Fast Light-field Disparity Estimation with Multi-disparity-scale Cost AggregationZhicong Huang, Xuemei Hu, Zhou Xue, Weizhu Xu, Tao Yue. 6300-6309 [doi]

Making Higher Order MOT Scalable: An Efficient Approximate Solver for Lifted Disjoint PathsAndrea Hornáková, Timo Kaiser, Paul Swoboda, Michal Rolinek, Bodo Rosenhahn, Roberto Henschel. 6310-6320 [doi]

TMCOSS: Thresholded Multi-Criteria Online Subset Selection for Data-Efficient Autonomous DrivingSoumi Das, Harikrishna Patibandla, Suparna Bhattacharya, Kshounis Bera, Niloy Ganguly, Sourangshu Bhattacharya. 6321-6330 [doi]

GNeRF: GAN-based Neural Radiance Field without Posed CameraQuan Meng, Anpei Chen, Haimin Luo, Minye Wu, Hao Su 0001, Lan Xu, Xuming He 0001, Jingyi Yu. 6331-6341 [doi]

Auto Graph Encoder-Decoder for Neural Network PruningSixing Yu, Arya Mazaheri, Ali Jannesari 0001. 6342-6352 [doi]

Gradient Normalization for Generative Adversarial NetworksYi-Lun Wu, Hong-Han Shuai, Zhi Rui Tam, Hong-Yu Chiu. 6353-6362 [doi]

DRB-GAN: A Dynamic ResBlock Generative Adversarial Network for Artistic Style TransferWenju Xu, Chengjiang Long, Ruisheng Wang, Guanghui Wang 0001. 6363-6372 [doi]

WarpedGANSpace: Finding non-linear RBF paths in GAN latent spaceChristos Tzelepis, Georgios Tzimiropoulos, Ioannis Patras. 6373-6382 [doi]

Geometry-Aware Self-Training for Unsupervised Domain Adaptation on Object Point CloudsLongkun Zou, Hui Tang, Ke Chen 0004, Kui Jia. 6383-6392 [doi]

Progressive Seed Generation Auto-encoder for Unsupervised Point Cloud LearningJuYoung Yang, Pyunghwan Ahn, Doyeon Kim, Haeil Lee, Junmo Kim. 6393-6402 [doi]

Guided Point Contrastive Learning for Semi-supervised Point Cloud Semantic SegmentationLi Jiang, Shaoshuai Shi, Zhuotao Tian, Xin Lai, Shu Liu 0005, Chi-Wing Fu, Jiaya Jia. 6403-6412 [doi]

Bootstrap Your Own CorrespondencesMohamed El Banani, Justin Johnson 0001. 6413-6422 [doi]

Learning with Noisy Labels for Robust Point Cloud SegmentationShuquan Ye, Dongdong Chen 0001, Songfang Han, Jing Liao 0001. 6423-6432 [doi]

Synchronization of Group-labelled Multi-graphsAndrea Porfiri Dal Cin, Luca Magri, Federica Arrigoni, Andrea Fusiello, Giacomo Boracchi. 6433-6443 [doi]

Progressive Correspondence Pruning by Consensus LearningChen Zhao, Yixiao Ge, Feng Zhu 0006, Rui Zhao 0001, Hongsheng Li 0001, Mathieu Salzmann. 6444-6453 [doi]

Generalized Shuffled Linear RegressionFeiran Li, Kent Fujiwara, Fumio Okura, Yasuyuki Matsushita. 6454-6463 [doi]

Collaborative Optimization and Aggregation for Decentralized Domain Generalization and AdaptationGuile Wu, Shaogang Gong. 6464-6473 [doi]

JEM++: Improved Techniques for Training JEMXiulong Yang, Shihao Ji. 6474-6483 [doi]

SA-ConvONet: Sign-Agnostic Optimization of Convolutional Occupancy NetworksJiapeng Tang, Jiabao Lei, Dan Xu, Feiying Ma, Kui Jia, Lei Zhang 0006. 6484-6493 [doi]

Vis2Mesh: Efficient Mesh Reconstruction from Unstructured Point Clouds of Large Scenes with Learned Virtual View VisibilityShuang Song, Zhaopeng Cui, Rongjun Qin. 6494-6504 [doi]

Learning Signed Distance Field for Multi-view Surface ReconstructionJingyang Zhang, Yao Yao, Long Quan. 6505-6514 [doi]

Spatio-temporal Self-Supervised Representation Learning for 3D Point CloudsSiyuan Huang, Yichen Xie, Song Chun Zhu, Yixin Zhu. 6515-6525 [doi]

SPatchGAN: A Statistical Feature Based Discriminator for Unsupervised Image-to-Image TranslationXuning Shao, Weidong Zhang. 6526-6535 [doi]

Bias Loss for Mobile Neural NetworksLusine Abrahamyan, Valentin Ziatchin, Yiming Chen, Nikos Deligiannis. 6536-6546 [doi]

Self-Knowledge Distillation with Progressive Refinement of TargetsKyungyul Kim, Byeongmoon Ji, Doyoung Yoon, Sangheum Hwang. 6547-6556 [doi]

A Lazy Approach to Long-Horizon Gradient-Based Meta-LearningMuhammad Abdullah Jamal, Liqiang Wang, Boqing Gong. 6557-6566 [doi]

Manifold Matching via Deep Metric Learning for Generative ModelingMengyu Dai, Haibin Hang. 6567-6577 [doi]

Paint Transformer: Feed Forward Neural Painting with Stroke PredictionSonghua Liu, Tianwei Lin, Dongliang He, Fu Li, Ruifeng Deng, Xin Li, Errui Ding, Hao Wang 0014. 6578-6587 [doi]

Robust Trust Region for Weakly Supervised SegmentationDmitrii Marin, Yuri Boykov. 6588-6598 [doi]

Semantic Perturbations with Normalizing Flows for Improved GeneralizationOguz Kaan Yüksel, Sebastian U. Stich, Martin Jaggi, Tatjana Chavdarova. 6599-6609 [doi]

Domain Generalization via Gradient SurgeryLucas Mansilla, Rodrigo Echeveste, Diego H. Milone, Enzo Ferrante. 6610-6618 [doi]

PixelPyramids: Exact Inference Models from Lossless Image PyramidsShweta Mahajan, Stefan Roth 0001. 6619-6628 [doi]

AdaAttN: Revisit Attention Mechanism in Arbitrary Neural Style TransferSonghua Liu, Tianwei Lin, Dongliang He, Fu Li, Meiling Wang, Xin Li, Zhengxing Sun, Qian Li, Errui Ding. 6629-6638 [doi]

Evolving Search Space for Neural Architecture SearchYuanzheng Ci, Chen Lin, Ming Sun 0008, Boyu Chen, Hongwen Zhang, Wanli Ouyang. 6639-6649 [doi]

Searching for Robustness: Loss Learning for Noisy Classification TasksBoyan Gao, Henry Gouk, Timothy M. Hospedales. 6650-6659 [doi]

Extending Neural P-frame Codecs for B-frame CodingReza Pourreza 0002, Taco Cohen. 6660-6669 [doi]

Generative Layout Modeling using Constraint GraphsWamiq Reyaz Para, Paul Guerrero, Tom Kelly, Leonidas J. Guibas, Peter Wonka. 6670-6680 [doi]

When do GANs replicate? On the choice of dataset sizeQianli Feng, Chenqi Guo, Fabian Benitez-Quiroz, Aleix M. Martínez. 6681-6690 [doi]

ReStyle: A Residual-Based StyleGAN Encoder via Iterative RefinementYuval Alaluf, Or Patashnik, Daniel Cohen-Or. 6691-6700 [doi]

Orthogonal Jacobian Regularization for Unsupervised Disentanglement in Image GenerationYuxiang Wei 0001, Yupeng Shi, Xiao Liu, Zhilong Ji, Yuan Gao, Zhongqin Wu, Wangmeng Zuo. 6701-6710 [doi]

Dual Contrastive Loss and Attention for GANsNing Yu, Guilin Liu, Aysegul Dundar, Andrew Tao, Bryan Catanzaro, Larry Davis 0001, Mario Fritz. 6711-6722 [doi]

F-Drop&Match: GANs with a Dead Zone in the High-Frequency DomainShin'ya Yamaguchi, Sekitoshi Kanai. 6723-6731 [doi]

Harnessing the Conditioning Sensorium for Improved Image TranslationCooper Nederhood, Nicholas I. Kolkin, Deqing Fu, Jason Salavon. 6732-6741 [doi]

Multi-Class Multi-Instance Count Conditioned Adversarial Image GenerationAmrutha Saseendran, Kathrin Skubch, Margret Keuper. 6742-6751 [doi]

DeepCAD: A Deep Generative Network for Computer-Aided Design ModelsRundi Wu, Chang Xiao, Changxi Zheng. 6752-6762 [doi]

Scaling-up Disentanglement for Image TranslationAviv Gabbay, Yedid Hoshen. 6763-6772 [doi]

Online Multi-Granularity Distillation for GAN CompressionYuxi Ren, Jie Wu, XueFeng Xiao, Jianchao Yang. 6773-6783 [doi]

Toward a Visual Concept Vocabulary for GAN Latent SpaceSarah Schwettmann, Evan Hernandez, David Bau, Samuel Klein, Jacob Andreas, Antonio Torralba 0001. 6784-6792 [doi]

Where2Act: From Pixels to Actions for Articulated 3D ObjectsKaichun Mo, Leonidas J. Guibas, Mustafa Mukadam, Abhinav Gupta 0001, Shubham Tulsiani. 6793-6803 [doi]

Multiscale Vision TransformersHaoqi Fan 0001, Bo Xiong, Karttikeya Mangalam, Yanghao Li, Zhicheng Yan, Jitendra Malik, Christoph Feichtenhofer. 6804-6815 [doi]

ViViT: A Video Vision TransformerAnurag Arnab, Mostafa Dehghani 0001, Georg Heigold, Chen Sun 0002, Mario Lucic, Cordelia Schmid. 6816-6826 [doi]

End-to-End Dense Video Captioning with Parallel DecodingTeng Wang, Ruimao Zhang, Zhichao Lu, Feng Zheng, Ran Cheng, Ping Luo 0002. 6827-6837 [doi]

Learning to Cut by Watching MoviesAlejandro Pardo, Fabian Caba Heilbron, Juan León Alcázar, Ali K. Thabet, Bernard Ghanem. 6838-6848 [doi]

Field of Junctions: Extracting Boundary Structure at Low SNRDor Verbin, Todd E. Zickler. 6849-6858 [doi]

RINDNet: Edge Detection for Discontinuity in Reflectance, Illumination, Normal and DepthMengyang Pu, Yaping Huang, Qingji Guan, Haibin Ling. 6859-6868 [doi]

Local Temperature Scaling for Probability CalibrationZhipeng Ding, Xu Han, Peirong Liu, Marc Niethammer. 6869-6879 [doi]

An Elastica Geodesic Approach with Convexity Shape PriorDa Chen 0002, Laurent D. Cohen, Jean-Marie Mirebeau, Xuecheng Tai. 6880-6889 [doi]

Instances as QueriesYuxin Fang, Shusheng Yang, Xinggang Wang, Yu Li, Chen Fang, Ying Shan, Bin Feng, Wenyu Liu 0001. 6890-6899 [doi]

Seminar Learning for Click-Level Weakly Supervised Semantic SegmentationHongjun Chen, Jinbao Wang, Hong Cai Chen, Xiantong Zhen, Feng Zheng, Rongrong Ji, Ling Shao 0001. 6900-6909 [doi]

Re-distributing Biased Pseudo Labels for Semi-supervised Semantic Segmentation: A Baseline InvestigationRuifei He, Jihan Yang, Xiaojuan Qi. 6910-6920 [doi]

Hypercorrelation Squeeze for Few-Shot SegmenationJuhong Min, Dahyun Kang, Minsu Cho. 6921-6932 [doi]

Self-Regulation for Semantic SegmentationDong Zhang, Hanwang Zhang, Jinhui Tang, Xian-Sheng Hua 0001, Qianru Sun. 6933-6943 [doi]

Pseudo-mask Matters in Weakly-supervised Semantic SegmentationYi Li, Zhanghui Kuang, Liyang Liu, Yimin Chen, Wayne Zhang. 6944-6953 [doi]

Prototypical Matching and Open Set Rejection for Zero-Shot Semantic SegmentationHui Zhang, Henghui Ding. 6954-6963 [doi]

Leveraging Auxiliary Tasks with Affinity Learning for Weakly Supervised Semantic SegmentationLian Xu, Wanli Ouyang, Mohammed Bennamoun, Farid Boussaïd, Ferdous Sohel, Dan Xu 0002. 6964-6973 [doi]

Unlocking the Potential of Ordinary Classifier: Class-specific Adversarial Erasing Framework for Weakly Supervised Semantic SegmentationHyeokjun Kweon, Sung Hoon Yoon, Hyeonseong Kim, Daehee Park, Kuk-Jin Yoon. 6974-6983 [doi]

Context Decoupling Augmentation for Weakly Supervised Semantic SegmentationYukun Su, Ruizhou Sun, Guosheng Lin, Qingyao Wu. 6984-6994 [doi]

The surprising impact of mask-head architecture on novel class segmentationVighnesh Birodkar, Zhichao Lu, Siyang Li, Vivek Rathod, Jonathan Huang. 6995-7005 [doi]

RECALL: Replay-based Continual Learning in Semantic SegmentationAndrea Maracani, Umberto Michieli, Marco Toldo, Pietro Zanuttigh. 7006-7015 [doi]

3-SemiSeg: Contrastive Semi-supervised Segmentation via Cross-set Learning and Dynamic Class-balancingYanning Zhou 0001, Hang Xu, Wei Zhang 0196, Bin Gao, Pheng-Ann Heng. 7016-7025 [doi]

Generalize then Adapt: Source-Free Domain Adaptive Semantic SegmentationJogendra Nath Kundu, Akshay Kulkarni, Amit Singh, Varun Jampani, R. Venkatesh Babu. 7026-7036 [doi]

Calibrated Adversarial Refinement for Stochastic Semantic SegmentationElias Kassapis, Georgi Dikov, Deepak K. Gupta, Cedric Nugteren. 7037-7047 [doi]

Self-Mutating Network for Domain Adaptive Segmentation of Aerial ImagesKyungsu Lee, Haeyun Lee, Jae Youn Hwang. 7048-7057 [doi]

AINet: Association Implantation for Superpixel SegmentationYaxiong Wang, Yunchao Wei, Xueming Qian, Li Zhu, Yi Yang 0001. 7058-7067 [doi]

ShapeConv: Shape-aware Convolutional Layer for Indoor RGB-D Semantic SegmentationJinming Cao, Hanchao Leng, Dani Lischinski, Danny Cohen-Or, Changhe Tu, Yangyan Li. 7068-7077 [doi]

Persistent Homology based Graph Convolution Network for Fine-grained 3D Shape SegmentationChi Chong Wong, Chi-Man Vong. 7078-7087 [doi]

Sparse-to-dense Feature Matching: Intra and Inter domain Cross-modal Learning in Domain Adaptation for 3D Semantic SegmentationDuo Peng, Yinjie Lei, Wen Li, Pingping Zhang, Yulan Guo. 7088-7097 [doi]

TempNet: Online Semantic Segmentation on Large-scale Point Cloud SeriesYunsong Zhou, Hongzi Zhu, Chunqin Li, Tiankai Cui, Shan Chang, Minyi Guo. 7098-7107 [doi]

How Shift Equivariance Impacts Metric Learning for Instance SegmentationJosef Lorenz Rumberger, Xiaoyan Yu, Peter Hirsch, Melanie Dohmen, Vanessa Emanuela Guarino, Ashkan Mokarian, Lisa Mais, Jan Funke, Dagmar Kainmueller. 7108-7116 [doi]

Specialize and Fuse: Pyramidal Output Representation for Semantic SegmentationChi-Wei Hsiao, Cheng Sun 0004, Hwann-Tzong Chen, Min Sun. 7117-7126 [doi]

Joint Topology-preserving and Feature-refinement Network for Curvilinear Structure SegmentationMingfei Cheng, Kaili Zhao, Xuhong Guo, Yajing Xu, Jun Guo 0002. 7127-7136 [doi]

SOTR: Segmenting Objects with TransformersRuohao Guo, Dantong Niu, Liao Qu, Zhenbo Li. 7137-7146 [doi]

Cascade Image Matting with Deformable Graph RefinementZijian Yu, Xuhui Li 0001, Huijuan Huang, Wen Zheng, Li Chen. 7147-7156 [doi]

Self-supervised Video Object Segmentation by Motion GroupingCharig Yang, Hala Lamdouar, Erika Lu, Andrew Zisserman, Weidi Xie. 7157-7168 [doi]

ISNet: Integrate Image-Level and Semantic-Level Context for Semantic SegmentationZhenchao Jin, Bin Liu 0016, Qi Chu 0001, Nenghai Yu. 7169-7178 [doi]

Cross-Sentence Temporal and Semantic Relations in Video Activity LocalisationJiabo Huang, Yang Liu, Shaogang Gong, Hailin Jin. 7179-7188 [doi]

Multiview Pseudo-Labeling for Semi-supervised Learning from VideoBo Xiong, Haoqi Fan 0001, Kristen Grauman, Christoph Feichtenhofer. 7189-7199 [doi]

Boundary-sensitive Pre-training for Temporal Localization in VideosMengmeng Xu, Juan-Manuel Pérez-Rúa, Victor Escorcia, Brais Martínez, Xiatian Zhu, Li Zhang, Bernard Ghanem, Tao Xiang. 7200-7210 [doi]

Mining Contextual Information Beyond Image for Semantic SegmentationZhenchao Jin, Tao Gong, Dongdong Yu, Qi Chu 0001, Jian Wang, Changhu Wang, Jie Shao. 7211-7221 [doi]

Complementary Patch for Weakly Supervised Semantic SegmentationFei Zhang, Chaochen Gu, Chenyue Zhang, Yuchao Dai. 7222-7231 [doi]

From Contexts to Locality: Ultra-high Resolution Image Segmentation via Locality-aware Contextual CorrelationQi Li, Weixiang Yang, Wenxi Liu, Yuanlong Yu, Shengfeng He. 7232-7241 [doi]

Segmenter: Transformer for Semantic SegmentationRobin Strudel, Ricardo Garcia Pinel, Ivan Laptev, Cordelia Schmid. 7242-7252 [doi]

Pixel Contrastive-Consistent Semi-Supervised Semantic SegmentationYuanyi Zhong, Bodi Yuan, Hong Wu, Zhiqiang Yuan, Jian Peng 0001, Yu-Xiong Wang. 7253-7262 [doi]

ECS-Net: Improving Weakly Supervised Semantic Segmentation by Using Connections Between Class Activation MapsKunyang Sun, Haoqing Shi, Zhengming Zhang, Yongming Huang. 7263-7272 [doi]

Few-Shot Semantic Segmentation with Cyclic Memory NetworkGuo-Sen Xie, Huan Xiong, Jie Liu, Yazhou Yao, Ling Shao 0001. 7273-7282 [doi]

Exploring Cross-Image Pixel Contrast for Semantic SegmentationWenguan Wang, Tianfei Zhou, Fisher Yu, Jifeng Dai, Ender Konukoglu, Luc Van Gool. 7283-7293 [doi]

Real-time Instance Segmentation with Discriminative Orientation MapsWentao Du, Zhiyu Xiang, Shuya Chen, Chengyu Qiao, Yiman Chen, Tingming Bai. 7294-7303 [doi]

Unsupervised Segmentation incorporating Shape Prior via Generative Adversarial NetworksDahye Kim, Byung-Woo Hong. 7304-7314 [doi]

Unsupervised Point Cloud Object Co-segmentation by Co-contrastive Learning and Mutual Attention SamplingCheng-Kun Yang, Yung-Yu Chuang, Yen-Yu Lin. 7315-7324 [doi]

Conditional Diffusion for Interactive SegmentationXi Chen, Zhiyan Zhao, Feiwu Yu, Yilei Zhang, Manni Duan. 7325-7334 [doi]

Weakly Supervised Temporal Anomaly Segmentation with Dynamic Time WarpingDongha Lee, Sehun Yu, Hyunjun Ju, Hwanjo Yu. 7335-7344 [doi]

Predictive Feature Learning for Future Segmentation PredictionZihang Lin, Jiangxin Sun, Jianfang Hu, Qi-zhi Yu, Jian-Huang Lai, Wei-Shi Zheng. 7345-7354 [doi]

Dynamic Network Quantization for Efficient Video InferenceXimeng Sun, Rameswar Panda, Chun-Fu (Richard) Chen, Aude Oliva, Rogério Feris, Kate Saenko. 7355-7365 [doi]

3Net: Boundary-Aware Semi-Supervised Segmentation Network with Bilateral Graph ConvolutionHuimin Huang, Lanfen Lin, Yue Zhang, Yingying Xu, Jing Zheng, Xiongwei Mao, Xiaohan Qian, Zhiyi Peng, Jianying Zhou 0006, Yen-Wei Chen 0001, Ruofeng Tong 0001. 7366-7375 [doi]

A Weakly Supervised Amodal Segmenter with Boundary Uncertainty EstimationKhoi Nguyen, Sinisa Todorovic. 7376-7385 [doi]

Weakly Supervised Segmentation of Small Buildings with Point LabelsJae Hun Lee, Chanyoung Kim, Sanghoon Sull. 7386-7395 [doi]

Scribble-Supervised Semantic Segmentation by Uncertainty Reduction on Neural Representation and Self-Supervision on Neural EigenspaceZhiyi Pan, Peng Jiang, Yunhai Wang, Changhe Tu, Anthony G. Cohn. 7396-7405 [doi]

Scaling Semantic Segmentation Beyond 1K Classes on a Single GPUShipra Jain, Danda Pani Paudel, Martin Danelljan, Luc Van Gool. 7406-7416 [doi]

Differentiable Convolution Search for Point Cloud ProcessingXing Nie, Yongcheng Liu, Shaohong Chen, Jianlong Chang, Chunlei Huo, Gaofeng Meng, Qi Tian 0001, Weiming Hu, Chunhong Pan. 7417-7426 [doi]

DRINet: A Dual-Representation Iterative Learning Network for Point Cloud SegmentationMaosheng Ye, Shuangjie Xu, Tongyi Cao, Qifeng Chen. 7427-7436 [doi]

CPFN: Cascaded Primitive Fitting Networks for High-Resolution Point CloudsEric-Tuan Lê, Minhyuk Sung, Duygu Ceylan, Radomír Mech, Tamy Boubekeur, Niloy J. Mitra. 7438-7446 [doi]

Interpolation-Aware Padding for 3D Sparse Convolutional Neural NetworksYu-Qi Yang, Peng-Shuai Wang, Yang Liu. 7447-7455 [doi]

Spatio-Temporal Dynamic Inference Network for Group Activity RecognitionHangjie Yuan, Dong Ni 0002, Mang Wang. 7456-7465 [doi]

Dynamic Divide-and-Conquer Adversarial Training for Robust Semantic SegmentationXiaogang Xu, Hengshuang Zhao, Jiaya Jia. 7466-7475 [doi]

Towards Robustness of Deep Neural Networks via RegularizationYao Li, Martin Renqiang Min, Thomas C. M. Lee, Wenchao Yu, Erik Kruus, Wei Wang, Cho-Jui Hsieh. 7476-7485 [doi]

AdvDrop: Adversarial Attack to DNNs by Dropping InformationRanjie Duan, Yuefeng Chen, Dantong Niu, Yun Yang, A. Kai Qin, Yuan He. 7486-7495 [doi]

3VAADA: Submodular Subset Selection for Virtual Adversarial Active Domain AdaptationHarsh Rangwani, Arihant Jain, Sumukh K. Aithal, R. Venkatesh Babu. 7496-7505 [doi]

Can Shape Structure Features Improve Model Robustness under Diverse Adversarial Settings?Mingjie Sun, Zichao Li, Chaowei Xiao, Haonan Qiu, Bhavya Kailkhura, Mingyan Liu, Bo Li 0026. 7506-7515 [doi]

Self-Supervised Vessel Segmentation via Adversarial LearningYuxin Ma, Yang Hua, Hanming Deng, Tao Song, Hao Wang, Zhengui Xue, Heng Cao, Ruhui Ma, Haibing Guan. 7516-7525 [doi]

MultiSiam: Self-supervised Multi-instance Siamese Representation Learning for Autonomous DrivingKai Chen, Lanqing Hong, Hang Xu, Zhenguo Li, Dit-Yan Yeung. 7526-7534 [doi]

Tripartite Information Mining and Integration for Image MattingYuhao Liu, Jiake Xie, Xiao Shi, Yu Qiao, Yujie Huang, Yong Tang, Xin Yang 0011. 7535-7544 [doi]

OadTR: Online Action Detection with TransformersXiang Wang, Shiwei Zhang, Zhiwu Qing, Yuanjie Shao, Zhengrong Zuo, Changxin Gao, Nong Sang. 7545-7555 [doi]

AdaMML: Adaptive Multi-Modal Learning for Efficient Video RecognitionRameswar Panda, Chun-Fu (Richard) Chen, Quanfu Fan, Ximeng Sun, Kate Saenko, Aude Oliva, Rogério Feris. 7556-7565 [doi]

Q-Match: Iterative Shape Matching via Quantum AnnealingMarcel Seelbach Benkner, Zorah Lähner, Vladislav Golyanik, Christof Wunderlich, Christian Theobalt, Michael Moeller 0001. 7566-7576 [doi]

A Backdoor Attack against 3D Point Cloud ClassifiersZhen Xiang, David J. Miller 0001, Siheng Chen, Xi Li, George Kesidis. 7577-7587 [doi]

Robustness Certification for Point Cloud ModelsTobias Lorenz 0002, Anian Ruoss, Mislav Balunovic, Gagandeep Singh 0001, Martin T. Vechev. 7588-7598 [doi]

DRIVE: Deep Reinforced Accident Anticipation with Visual ExplanationWentao Bao, Qi Yu 0001, Yu Kong. 7599-7608 [doi]

Where are you heading? Dynamic Trajectory Prediction with Expert Goal ExamplesHe Zhao 0004, Richard P. Wildes. 7609-7618 [doi]

Feature Importance-aware Transferable Adversarial AttacksZhibo Wang, Hengchang Guo, Zhifei Zhang, Wenxin Liu, Zhan Qin, Kui Ren 0001. 7619-7628 [doi]

TkML-AP: Adversarial Attacks to Top-k Multi-Label LearningShu Hu, Lipeng Ke, Xin Wang 0045, Siwei Lyu. 7629-7637 [doi]

AGKD-BML: Defense Against Adversarial Attack by Attention Guided Knowledge Distillation and Bi-directional Metric LearningHong Wang, Yuefan Deng, Shinjae Yoo, Haibin Ling, Yuewei Lin. 7638-7647 [doi]

Just One Moment: Structural Vulnerability of Deep Action Recognition against One Frame AttackJaehui Hwang, Jun Hyuk Kim, Jun Ho Choi, Jong-Seok Lee. 7648-7656 [doi]

Sample Efficient Detection and Classification of Adversarial Attacks via Self-Supervised EmbeddingsMazda Moayeri, Soheil Feizi. 7657-7666 [doi]

Adversarial Example Detection Using Latent Neighborhood GraphAhmed Abusnaina, Yuhang Wu, Sunpreet S. Arora, Yizhen Wang, Fei Wang, Hao Yang, David Mohaisen. 7667-7676 [doi]

Parallel Rectangle Flip Attack: A Query-based Black-box Attack against Object DetectionSiyuan Liang, Baoyuan Wu, Yanbo Fan, Xingxing Wei, Xiaochun Cao. 7677-7687 [doi]

On Generating Transferable Targeted PerturbationsMuzammal Naseer, Salman H. Khan 0001, Munawar Hayat, Fahad Shahbaz Khan, Fatih Porikli. 7688-7697 [doi]

ProFlip: Targeted Trojan Attack with Progressive Bit FlipsHuili Chen, Cheng Fu, Jishen Zhao, Farinaz Koushanfar. 7698-7707 [doi]

Towards Understanding the Generative Capability of Adversarially Robust ClassifiersYao Zhu, Jiacheng Ma, Jiacheng Sun, Zewei Chen, Rongxin Jiang, Yaowu Chen, Zhenguo Li. 7708-7717 [doi]

Augmented Lagrangian Adversarial AttacksJérôme Rony, Eric Granger, Marco Pedersoli, Ismail Ben Ayed. 7718-7727 [doi]

Meta Gradient Adversarial AttackZheng Yuan 0005, Jie Zhang 0071, Yunpei Jia, Chuanqi Tan, Tao Xue, Shiguang Shan. 7728-7737 [doi]

Reliably fast adversarial training via latent adversarial perturbationGeon Yeong Park, Sang Wan Lee. 7738-7747 [doi]

Adversarial Attacks On Multi-Agent CommunicationJames Tu, Tsun-Hsuan Wang, Jingkang Wang, Sivabalan Manivasagam, Mengye Ren, Raquel Urtasun. 7748-7757 [doi]

Consistency-Sensitivity Guided Ensemble Black-Box Adversarial Attacks in Low-Dimensional SpacesJianhe Yuan, Zhihai He. 7758-7766 [doi]

Meta-Attack: Class-agnostic and Model-agnostic Physical Adversarial AttackWeiwei Feng, Baoyuan Wu, Tianzhu Zhang, Yong Zhang, Yongdong Zhang 0001. 7767-7776 [doi]

Minimal Adversarial Examples for Deep Learning on 3D Point CloudsJaeyeon Kim, Binh-Son Hua, Duc Thanh Nguyen, Sai Kit Yeung. 7777-7786 [doi]

Relating Adversarially Robust Generalization to Flat MinimaDavid Stutz, Matthias Hein 0001, Bernt Schiele. 7787-7797 [doi]

Batch Normalization Increases Adversarial Vulnerability and Decreases Adversarial Transferability: A Non-Robust Feature PerspectivePhilipp Benz, Chaoning Zhang, In-So Kweon. 7798-7807 [doi]

Integer-arithmetic-only Certified Robustness for Quantized Neural NetworksHaowen Lin, Jian Lou 0001, Li Xiong 0001, Cyrus Shahabi. 7808-7817 [doi]

On the Robustness of Vision Transformers to Adversarial ExamplesKaleel Mahmood, Rigel Mahmood, Marten van Dijk. 7818-7827 [doi]

Naturalistic Physical Adversarial Patch for Object DetectorsYu-Chih-Tuan Hu, Jun-Cheng Chen, Bo-Han Kung, Kai-Lung Hua, Daniel Stanley Tan. 7828-7837 [doi]

Exploiting Multi-Object Relationships for Detecting Adversarial Attacks in Complex ScenesMingjun Yin, Shasha Li, Zikui Cai, Chengyu Song, M. Salman Asif, Amit K. Roy Chowdhury, Srikanth V. Krishnamurthy. 7838-7847 [doi]

Data-free Universal Adversarial Perturbation and Black-box AttackChaoning Zhang, Philipp Benz, Adil Karjauv, In-So Kweon. 7848-7857 [doi]

Removing Adversarial Noise in Class Activation Feature SpaceDawei Zhou, Nannan Wang 0001, Chunlei Peng, Xinbo Gao 0001, Xiaoyu Wang, Jun Yu, Tongliang Liu. 7858-7867 [doi]

End-to-End Unsupervised Document Image Blind DenoisingMehrdad J. Gangeh, Marcin Plata, Hamid R. Motahari Nezhad, Nigel P. Duffy. 7868-7877 [doi]

Fooling LiDAR Perception via Adversarial Trajectory PerturbationYiming Li, Congcong Wen, Felix Juefei-Xu, Chen Feng. 7878-7887 [doi]

Sensor-Guided Optical FlowMatteo Poggi, Filippo Aleotti, Stefano Mattoccia. 7888-7898 [doi]

Group-aware Contrastive Regression for Action Quality AssessmentXumin Yu, Yongming Rao, Wenliang Zhao, Jiwen Lu, Jie Zhou 0001. 7899-7908 [doi]

Online-trained Upsampler for Deep Low Complexity Video CompressionJan P. Klopp, Keng-Chi Liu, Shao-Yi Chien, Liang-Gee Chen. 7909-7918 [doi]

Contrast and Order Representations for Video Self-supervised LearningKai Hu, Jie Shao, Yuan Liu, Bhiksha Raj, Marios Savvides, Zhiqiang Shen. 7919-7929 [doi]

Temporal Cue Guided Video Highlight Detection with Low-Rank Audio-Visual FusionQinghao Ye, Xiyue Shen, Yuan Gao, Zirui Wang, Qi Bi, Ping Li, Guang Yang 0006. 7930-7939 [doi]

VideoLT: Large-scale Long-tailed Video RecognitionXing Zhang, Zuxuan Wu, Zejia Weng, Huazhu Fu, Jingjing Chen, Yu-Gang Jiang, Larry Davis 0001. 7940-7949 [doi]

Cross-category Video Highlight Detection via Set-based LearningMinghao Xu, Hang Wang, Bingbing Ni, Riheng Zhu, Zhenbang Sun, Changhu Wang. 7950-7959 [doi]

PR-Net: Preference Reasoning for Personalized Video Highlight DetectionRunnan Chen, Penghao Zhou, Wenzhe Wang, Nenglun Chen, Pai Peng, Xing Sun, Wenping Wang. 7960-7969 [doi]

Enhancing Self-supervised Video Representation Learning via Multi-level Feature OptimizationRui Qian, Yuxi Li, Huabin Liu, John See, Shuangrui Ding, Xian Liu, Dian Li, Weiyao Lin. 7970-7981 [doi]

Foreground-Action Consistency Network for Weakly Supervised Temporal Action LocalizationLinjiang Huang, Liang Wang, Hongsheng Li. 7982-7991 [doi]

Multimodal Clustering Networks for Self-supervised Learning from Unlabeled VideosBrian Chen, Andrew Rouditchenko, Kevin Duarte, Hilde Kuehne, Samuel Thomas 0001, Angie W. Boggust, Rameswar Panda, Brian Kingsbury, Rogério Feris, David Harwath, James R. Glass, Michael Picheny, Shih-Fu Chang. 7992-8001 [doi]

Temporal Action Detection with Multi-level SupervisionBaifeng Shi, Qi Dai, Judy Hoffman, Kate Saenko, Trevor Darrell, Huijuan Xu 0001. 8002-8012 [doi]

Searching for Two-Stream Models in Multivariate Space for Video RecognitionXinyu Gong, Heng Wang, Zheng Shou 0001, Matt Feiszli, Zhangyang Wang, Zhicheng Yan. 8013-8022 [doi]

Crossover Learning for Fast Online Video Instance SegmentationShusheng Yang, Yuxin Fang, Xinggang Wang, Yu Li, Chen Fang, Ying Shan, Bin Feng, Wenyu Liu 0001. 8023-8032 [doi]

Domain Adaptive Video Segmentation via Temporal Consistency RegularizationDayan Guan, Jiaxing Huang 0001, Aoran Xiao, Shijian Lu. 8033-8044 [doi]

Video Object Segmentation with Dynamic Memory Networks and Adaptive Object AlignmentShuxian Liang, Xu Shen, Jianqiang Huang, Xian-Sheng Hua 0001. 8045-8054 [doi]

Generic Event Boundary Detection: A Benchmark for Event SegmentationMike Zheng Shou, Stan Weixian Lei, Weiyao Wang 0001, Deepti Ghadiyaram, Matt Feiszli. 8055-8064 [doi]

Weakly-Supervised Action Segmentation and Alignment via Transcript-Aware Union-of-Subspaces LearningZijia Lu, Ehsan Elhamifar. 8065-8075 [doi]

ASCNet: Self-supervised Video Representation Learning with Appearance-Speed ConsistencyDeng Huang, Wenhao Wu, Weiwen Hu, Xu Liu, Dongliang He, Zhihua Wu, Xiangmiao Wu, Mingkui Tan, Errui Ding. 8076-8085 [doi]

Detecting Human-Object Relationships in VideosJingwei Ji, Rishi Desai, Juan Carlos Niebles. 8086-8096 [doi]

Unified Graph Structured Models for Video UnderstandingAnurag Arnab, Chen Sun 0002, Cordelia Schmid. 8097-8106 [doi]

Joint Visual and Audio Learning for Video Highlight DetectionTaivanbat Badamdorj, Mrigank Rochan, Yang Wang, Li Cheng. 8107-8117 [doi]

TF-Blender: Temporal Feature Blender for Video Object DetectionYiming Cui, Liqi Yan, Zhiwen Cao, Dongfang Liu. 8118-8127 [doi]

Attention is not Enough: Mitigating the Distribution Discrepancy in Asynchronous Multimodal Sequence FusionTao Liang, Guosheng Lin, Lei Feng, Yan Zhang, Fengmao Lv. 8128-8136 [doi]

HighlightMe: Detecting Highlights from Human-Centric VideosUttaran Bhattacharya, Gang Wu, Stefano Petrangeli, Viswanathan Swaminathan, Dinesh Manocha. 8137-8147 [doi]

Interactive Prototype Learning for Egocentric Action RecognitionXiaohan Wang, Linchao Zhu, Heng Wang, Yi Yang 0001. 8148-8157 [doi]

Watch Only Once: An End-to-End Video Action Detection FrameworkShoufa Chen, Peize Sun, Enze Xie, Chongjian Ge, Jiannan Wu, Lan Ma, Jiajun Shen, Ping Luo 0002. 8158-8167 [doi]

Frequency-Aware Spatiotemporal Transformers for Video Inpainting DetectionBingyao Yu, Wanhua Li 0001, Xiu Li, Jiwen Lu, Jie Zhou 0001. 8168-8177 [doi]

Parallel Detection-and-Segmentation Learning for Weakly Supervised Instance SegmentationYunhang Shen, Liujuan Cao, Zhiwei Chen, Baochang Zhang 0001, Chi Su, Yongjian Wu, Feiyue Huang, Rongrong Ji. 8178-8188 [doi]

GistNet: a Geometric Structure Transfer Network for Long-Tailed RecognitionBo Liu, Haoxiang Li, Hao Kang, Gang Hua 0001, Nuno Vasconcelos. 8189-8198 [doi]

Semi-Supervised Semantic Segmentation with Pixel-Level Contrastive Learning from a Class-wise Memory BankIñigo Alonso, Alberto Sabater, David Ferstl, Luis Montesano, Ana C. Murillo. 8199-8208 [doi]

*Jianlong Yuan, Yifan Liu, Chunhua Shen, Zhibin Wang, Hao Li 0030. 8209-8218 [doi]

Self-Supervised Video Representation Learning with Meta-Contrastive NetworkYuanze Lin, Xun Guo, Yan Lu 0001. 8219-8229 [doi]

Continual Prototype Evolution: Learning Online from Non-Stationary Data StreamsMatthias De Lange, Tinne Tuytelaars. 8230-8239 [doi]

CCT-Net: Category-Invariant Cross-Domain Transfer for Medical Single-to-Multiple Disease DiagnosisYi Zhou 0007, Lei Huang 0015, Tao Zhou 0002, Ling Shao 0001. 8240-8250 [doi]

Exploring Inter-Channel Correlation for Diversity-preserved Knowledge DistillationLi Liu, Qingle Huang, Sihao Lin, Hongwei Xie, Bing Wang, Xiaojun Chang, Xiaodan Liang. 8251-8260 [doi]

Online Continual Learning with Natural Distribution Shifts: An Empirical Study with Visual DataZhipeng Cai 0003, Ozan Sener, Vladlen Koltun. 8261-8270 [doi]

Task Switching Network for Multi-task LearningGuolei Sun, Thomas Probst, Danda Pani Paudel, Nikola Popovic, Menelaos Kanakis, Jagruti Patel, Dengxin Dai, Luc Van Gool. 8271-8280 [doi]

Semantically Coherent Out-of-Distribution DetectionJingkang Yang, Haoqi Wang, Litong Feng, Xiaopeng Yan, Huabin Zheng, Wayne Zhang, Ziwei Liu 0002. 8281-8289 [doi]

Trash to Treasure: Harvesting OOD Data with Cross-Modal Matching for Open-Set Semi-Supervised LearningJunkai Huang, Chaowei Fang, Weikai Chen 0001, Zhenhua Chai, Xiaolin Wei, Pengxu Wei, Liang Lin, Guanbin Li. 8290-8299 [doi]

NAS-OoD: Neural Architecture Search for Out-of-Distribution GeneralizationHaoyue Bai, Fengwei Zhou, Lanqing Hong, Nanyang Ye 0002, S.-H. Gary Chan, Zhenguo Li. 8300-8309 [doi]

DRÆM - A discriminatively trained reconstruction embedding for surface anomaly detectionVitjan Zavrtanik, Matej Kristan, Danijel Skocaj. 8310-8319 [doi]

The Many Faces of Robustness: A Critical Analysis of Out-of-Distribution GeneralizationDan Hendrycks, Steven Basart, Norman Mu, Saurav Kadavath, Frank Wang, Evan Dorundo, Rahul Desai, Tyler Zhu, Samyak Parajuli, Mike Guo, Dawn Song, Jacob Steinhardt, Justin Gilmer. 8320-8329 [doi]

Keep CALM and Improve Visual Feature AttributionJae-Myung Kim, Junsuk Choe, Zeynep Akata, Seong Joon Oh. 8330-8340 [doi]

Unsupervised Dense Deformation Embedding Network for Template-Free Shape CorrespondenceRonghan Chen, Yang Cong, Jiahua Dong. 8341-8350 [doi]

Online Pseudo Label Generation by Hierarchical Cluster Dynamics for Adaptive Person Re-identificationYi Zheng, Shixiang Tang, Guolong Teng, Yixiao Ge, Kaijian Liu, Jing Qin 0001, Donglian Qi, Dapeng Chen. 8351-8361 [doi]

Shape Self-Correction for Unsupervised Point Cloud UnderstandingYe Chen, Jinxian Liu, Bingbing Ni, Hang Wang, Jiancheng Yang, Ning Liu, Teng Li, Qi Tian 0001. 8362-8371 [doi]

DetCo: Unsupervised Contrastive Learning for Object DetectionEnze Xie, Jian Ding, Wenhai Wang, Xiaohang Zhan, Hang Xu, Peize Sun, Zhenguo Li, Ping Luo 0002. 8372-8381 [doi]

Binocular Mutual Learning for Improving Few-shot ClassificationZiqi Zhou, Xi Qiu, Jiangtao Xie, Jianan Wu, Chi Zhang. 8382-8391 [doi]

Transductive Few-Shot Classification on the Oblique ManifoldGuodong Qi, Huimin Yu, Zhaohui Lu, Shuzhao Li. 8392-8402 [doi]

Learning Rare Category Classifiers on a Tight Labeling BudgetRavi Teja Mullapudi, Fait Poms, William R. Mark, Deva Ramanan, Kayvon Fatahalian. 8403-8412 [doi]

Task-aware Part Mining Network for Few-Shot LearningJiamin Wu, Tianzhu Zhang, Yongdong Zhang 0001, Feng Wu 0001. 8413-8422 [doi]

Semi-Supervised Learning of Visual Features by Non-Parametrically Predicting View Assignments with Support SamplesMahmoud Assran, Mathilde Caron, Ishan Misra, Piotr Bojanowski, Armand Joulin, Nicolas Ballas, Michael G. Rabbat. 8423-8432 [doi]

A Multi-Mode Modulator for Multi-Domain Few-Shot ClassificationYanbin Liu, Juho Lee, Linchao Zhu, Ling Chen, Humphrey Shi, Yi Yang 0001. 8433-8442 [doi]

LoFGAN: Fusing Local Representations for Few-shot Image GenerationZheng Gu, Wenbin Li 0006, Jing Huo, Lei Wang 0001, Yang Gao 0001. 8443-8451 [doi]

Interaction Compass: Multi-Label Zero-Shot Learning of Human-Object Interactions via Spatial RelationsDat Huynh, Ehsan Elhamifar. 8452-8463 [doi]

Unsupervised Few-Shot Action Recognition via Action-Appearance Aligned Meta-AdaptationJay Patravali, Gaurav Mittal, Ye Yu, Fuxin Li, Mei Chen. 8464-8474 [doi]

A Hierarchical Transformation-Discriminating Generative Model for Few Shot Anomaly DetectionShelly Sheynin, Sagie Benaim, Lior Wolf. 8475-8484 [doi]

Active Domain Adaptation via Clustering Uncertainty-weighted EmbeddingsViraj Prabhu, Arjun Chandrasekaran, Kate Saenko, Judy Hoffman. 8485-8494 [doi]

Domain Adaptive Semantic Segmentation with Self-Supervised Depth EstimationQin Wang 0013, Dengxin Dai, Lukas Hoyer, Luc Van Gool, Olga Fink. 8495-8505 [doi]

Towards Discriminative Representation Learning for Unsupervised Person Re-identificationTakashi Isobe, Dong Li, Lu Tian, Weihua Chen, Yi Shan, Shengjin Wang. 8506-8516 [doi]

Geometric Unsupervised Domain Adaptation for Semantic SegmentationVitor Guizilini, Jie Li 0031, Rares Ambrus, Adrien Gaidon. 8517-8527 [doi]

BiMaL: Bijective Maximum Likelihood Approach to Domain Adaptation in Semantic Scene SegmentationThanh-Dat Truong, Chi Nhan Duong, Ngan Le, Son Lam Phung, Chase Rainwater, Khoa Luu. 8528-8537 [doi]

SENTRY: Selective Entropy Optimization via Committee Consistency for Unsupervised Domain AdaptationViraj Prabhu, Shivam Khare, Deeksha Kartik, Judy Hoffman. 8538-8547 [doi]

Adversarial Robustness for Unsupervised Domain AdaptationMuhammad Awais, Fengwei Zhou, Hang Xu, Lanqing Hong, Ping Luo, Sung-Ho Bae, Zhenguo Li. 8548-8557 [doi]

ECACL: A Holistic Framework for Semi-Supervised Domain AdaptationKai Li 0012, Chang Liu, Handong Zhao, Yulun Zhang, Yun Fu. 8558-8567 [doi]

LabOR: Labeling Only if Required for Domain Adaptive Semantic SegmentationInkyu Shin, Dong-Jin Kim 0003, Jae-Won Cho, Sanghyun Woo, KwanYong Park, In-So Kweon. 8568-8578 [doi]

Transporting Causal Mechanisms for Unsupervised Domain AdaptationZhongqi Yue, Qianru Sun, Xian-Sheng Hua 0001, Hanwang Zhang. 8579-8588 [doi]

Self-Supervised Object Detection via Generative Image SynthesisSiva Karthik Mustikovela, Shalini De Mello, Aayush Prakash, Umar Iqbal, Sifei Liu, Thu Nguyen-Phuoc, Carsten Rother, Jan Kautz. 8589-8598 [doi]

Skeleton2Mesh: Kinematics Prior Injected Unsupervised Human Mesh RecoveryZhenbo Yu, Junjie Wang, Jingwei Xu, Bingbing Ni, Chenglong Zhao, Minsi Wang, Wenjun Zhang 0001. 8599-8609 [doi]

Intrinsic-Extrinsic Preserved GANs for Unsupervised 3D Pose TransferHaoyu Chen, Hao Tang 0005, Henglin Shi, Wei Peng, Nicu Sebe, Guoying Zhao. 8610-8619 [doi]

Unsupervised Layered Image Decomposition into Object PrototypesTom Monnier, Elliot Vincent, Jean Ponce, Mathieu Aubry. 8620-8630 [doi]

Towards Alleviating the Modeling Ambiguity of Unsupervised Monocular 3D Human Pose EstimationZhenbo Yu, Bingbing Ni, Jingwei Xu, Junjie Wang, Chenglong Zhao, Wenjun Zhang 0001. 8631 [doi]

Synthesized Feature based Few-Shot Class-Incremental Learning on a Mixture of SubspacesAli Cheraghian, Shafin Rahman, Sameera Ramasinghe, Pengfei Fang, Christian Simon, Lars Petersson, Mehrtash Harandi. 8641-8650 [doi]

Pseudo-loss Confidence Metric for Semi-supervised Few-shot LearningKai Huang, Jie Geng, Wen Jiang 0002, Xinyang Deng, Zhe Xu. 8651-8660 [doi]

DeFRCN: Decoupled Faster R-CNN for Few-Shot Object DetectionLimeng Qiao, Yuxuan Zhao, Zhiyuan Li, Xi Qiu, Jianan Wu, Chi Zhang. 8661-8670 [doi]

Curvature Generation in Curved Spaces for Few-Shot LearningZhi Gao, Yuwei Wu, Yunde Jia, Mehrtash Harandi. 8671-8680 [doi]

Learning to Hallucinate Examples from Extrinsic and Intrinsic SupervisionLiangke Gui, Adrien Bardes, Ruslan Salakhutdinov, Alexander Hauptmann 0001, Martial Hebert, Yu-Xiong Wang. 8681-8691 [doi]

Semantics Disentangling for Generalized Zero-Shot LearningZhi Chen, Yadan Luo, Ruihong Qiu, Sen Wang 0001, Zi Huang, Jingjing Li 0001, Zheng Zhang 0006. 8692-8700 [doi]

Mining Latent Classes for Few-shot SegmentationLihe Yang, Wei Zhuo, Lei Qi 0001, Yinghuan Shi, Yang Gao 0001. 8701-8710 [doi]

Discriminative Region-based Multi-Label Zero-Shot LearningSanath Narayan, Akshita Gupta, Salman H. Khan 0001, Fahad Shahbaz Khan, Ling Shao 0001, Mubarak Shah. 8711-8720 [doi]

Simpler is Better: Few-shot Semantic Segmentation with Classifier Weight TransformerZhihe Lu, Sen He, Xiatian Zhu, Li Zhang 0040, Yi-Zhe Song, Tao Xiang. 8721-8730 [doi]

Iterative label cleaning for transductive and semi-supervised few-shot learningMichalis Lazarou, Tania Stathaki, Yannis Avrithis. 8731-8740 [doi]

PIT: Position-Invariant Transform for Cross-FoV Domain AdaptationQiqi Gu, Qianyu Zhou 0001, Minghao Xu, Zhengyang Feng, Guangliang Cheng, Xuequan Lu, Jianping Shi, Lizhuang Ma. 8741-8750 [doi]

Domain-Invariant Disentangled Network for Generalizable Object DetectionChuang Lin, Zehuan Yuan, Sicheng Zhao, Peize Sun, Changhu Wang, Jianfei Cai 0001. 8751-8760 [doi]

Deep Transport Network for Unsupervised Video Object SegmentationKaihua Zhang, ZiCheng Zhao, Dong Liu, Qingshan Liu, Bo Liu. 8761-8770 [doi]

Divide-and-Assemble: Learning Block-wise Memory for Unsupervised Anomaly DetectionJinlei Hou, Yingying Zhang, Qiaoyong Zhong, Di Xie, Shiliang Pu, Hong Zhou. 8771-8780 [doi]

BAPA-Net: Boundary Adaptation and Prototype Alignment for Cross-domain Semantic SegmentationYahao Liu, Jinhong Deng, Xinchen Gao, Wen Li 0001, Lixin Duan. 8781-8791 [doi]

Variational Feature Disentangling for Fine-Grained Few-Shot ClassificationJingyi Xu, Hieu Le, Mingzhen Huang, Shahrukh Athar, Dimitris Samaras. 8792-8801 [doi]

Relational Embedding for Few-Shot ClassificationDahyun Kang, Heeseung Kwon, Juhong Min, Minsu Cho. 8802-8813 [doi]

Composable Augmentation Encoding for Video Representation LearningChen Sun 0002, Arsha Nagrani, Yonglong Tian, Cordelia Schmid. 8814-8824 [doi]

A Broad Study on the Transferability of Visual Representations with Contrastive LearningAshraful Islam, Chun-Fu Chen 0001, Rameswar Panda, Leonid Karlinsky, Richard J. Radke, Rogério Feris. 8825-8835 [doi]

Multi-Task Self-Training for Learning General RepresentationsGolnaz Ghiasi, Barret Zoph, Ekin D. Cubuk, Quoc V. Le, Tsung-Yi Lin. 8836-8845 [doi]

Unsupervised Domain Adaptive 3D Detection with Multi-Level ConsistencyZhipeng Luo, Zhongang Cai, Changqing Zhou, Gongjie Zhang, Haiyu Zhao, Shuai Yi, Shijian Lu, Hongsheng Li 0001, Shanghang Zhang, Ziwei Liu 0002. 8846-8855 [doi]

mDALU: Multi-Source Domain Adaptation and Label Unification with Partial DatasetsRui Gong, Dengxin Dai, Yuhua Chen, Wen Li 0001, Luc Van Gool. 8856-8865 [doi]

A Simple Feature Augmentation for Domain GeneralizationPan Li, Da Li, Wei Li, Shaogang Gong, Yanwei Fu, Timothy M. Hospedales. 8866-8875 [doi]

Collaborative Learning with Disentangled Features for Zero-shot Domain AdaptationWon Young Jhoo, Jae-Pil Heo. 8876-8885 [doi]

Deep Co-Training with Task Decomposition for Semi-Supervised Domain AdaptationLuyu Yang, Yan Wang 0051, Mingfei Gao, Abhinav Shrivastava, Kilian Q. Weinberger, Wei-Lun Chao, Ser-Nam Lim. 8886-8896 [doi]

Weak Adaptation Learning: Addressing Cross-domain Data Insufficiency with Weak AnnotatorShichao Xu, Lixu Wang, Yixuan Wang, Qi Zhu 0002. 8897-8906 [doi]

Contrastive Coding for Active Learning under Class Distribution MismatchPan Du, Suyun Zhao, Hui Chen, Shuwen Chai, Hong Chen 0001, Cuiping Li 0001. 8907-8916 [doi]

Gradient Distribution Alignment Certificates Better Adversarial Domain AdaptationZhiqiang Gao, Shufei Zhang, Kaizhu Huang, Qiufeng Wang, Chaoliang Zhong. 8917-8926 [doi]

Meta Learning on a Sequence of Imbalanced Domains with Difficulty AwarenessZhenyi Wang, Tiehang Duan, Le Fang, Qiuling Suo, Mingchen Gao. 8927-8937 [doi]

Confidence Calibration for Domain Generalization under Covariate ShiftYunye Gong, Xiao Lin, Yi Yao, Thomas G. Dietterich, Ajay Divakaran, Melinda T. Gervasio. 8938-8947 [doi]

Active Universal Domain AdaptationXinhong Ma, Junyu Gao, Changsheng Xu. 8948-8957 [doi]

Generalized Source-free Domain AdaptationShiqi Yang, Yaxing Wang, Joost van de Weijer 0001, Luis Herranz, Shangling Jui. 8958-8967 [doi]

RDA: Robust Domain Adaptation via Fourier Adversarial AttackingJiaxing Huang 0001, Dayan Guan, Aoran Xiao, Shijian Lu. 8968-8979 [doi]

OVANet: One-vs-All Network for Universal Domain AdaptationKuniaki Saito, Kate Saenko. 8980-8989 [doi]

Adaptive Adversarial Network for Source-free Domain AdaptationHaifeng Xia, Handong Zhao, Zhengming Ding. 8990-8999 [doi]

Generalized and Incremental Few-Shot Learning by Explicit Learning and Calibration without ForgettingAnna Kukleva, Hilde Kuehne, Bernt Schiele. 9000-9009 [doi]

On the Importance of Distractors for Few-Shot ClassificationRajshekhar Das, Yu-Xiong Wang, José M. F. Moura. 9010-9020 [doi]

Mixture-based Feature Space Learning for Few-shot Image ClassificationArman Afrasiyabi, Jean-François Lalonde, Christian Gagné. 9021-9031 [doi]

Coarsely-labeled Data for Better Few-shot TransferCheng Perng Phoo, Bharath Hariharan. 9032-9041 [doi]

Meta-Baseline: Exploring Simple Meta-Learning for Few-Shot LearningYinbo Chen, Zhuang Liu 0003, Huijuan Xu 0001, Trevor Darrell, Xiaolong Wang 0004. 9042-9051 [doi]

Multi-Target Adversarial Frameworks for Domain Adaptation in Semantic SegmentationAntoine Saporta, Tuan-Hung Vu, Matthieu Cord, Patrick Pérez. 9052-9061 [doi]

Dual Path Learning for Domain Adaptation of Semantic SegmentationYiting Cheng, Fangyun Wei, Jianmin Bao, Dong Chen 0003, Fang Wen, Wenqiang Zhang. 9062-9071 [doi]

Uncertainty-aware Pseudo Label Refinery for Domain Adaptive Semantic SegmentationYuxi Wang, Junran Peng, Zhaoxiang Zhang. 9072-9081 [doi]

Semantic Concentration for Domain AdaptationShuang Li 0008, Mixue Xie, Fangrui Lv, Chi Harold Liu, Jian Liang, Chen Qin, Wei Li. 9082-9091 [doi]

Multi-Anchor Active Domain Adaptation for Semantic SegmentationMunan Ning, Donghuan Lu, Dong Wei 0004, Cheng Bian, Chenglang Yuan, Shuang Yu, Kai Ma 0002, Yefeng Zheng 0001. 9092-9102 [doi]

CDS: Cross-Domain Self-supervised Pre-trainingDonghyun Kim, Kuniaki Saito, Tae Hyun Oh, Bryan A. Plummer, Stan Sclaroff, Kate Saenko. 9103-9112 [doi]

Knowledge Mining and Transferring for Domain Adaptive Object DetectionKun Tian, Chenghao Zhang, Ying Wang 0008, Shiming Xiang, Chunhong Pan. 9113-9122 [doi]

Robust Object Detection via Instance-Level Temporal Cycle ConfusionXin Wang 0066, Thomas E. Huang, Benlin Liu, Fisher Yu, Xiaolong Wang 0004, Joseph E. Gonzalez, Trevor Darrell. 9123-9132 [doi]

The Pursuit of Knowledge: Discovering and Localizing Novel Categories using Dual MemorySai Saketh Rambhatla, Rama Chellappa, Abhinav Shrivastava. 9133-9143 [doi]

*Yang Chen, Yu Wang 0102, Yingwei Pan, Ting Yao, Xinmei Tian 0001, Tao Mei 0001. 9144-9153 [doi]

Re-energizing Domain Discriminator with Sample Relabeling for Adversarial Domain AdaptationXin Jin 0014, Cuiling Lan, Wenjun Zeng, Zhibo Chen 0001. 9154-9163 [doi]

Tune it the Right Way: Unsupervised Validation of Domain Adaptation via Soft Neighborhood DensityKuniaki Saito, Donghyun Kim, Piotr Teterwak, Stan Sclaroff, Trevor Darrell, Kate Saenko. 9164-9173 [doi]

Exploring Robustness of Unsupervised Domain Adaptation in Semantic SegmentationJinyu Yang, Chunyuan Li, Weizhi An, Hehuan Ma, Yuzhi Guo, Yu Rong, Peilin Zhao, JunZhou Huang. 9174-9183 [doi]

Seeking Similarities over Differences: Similarity-based Domain Alignment for Adaptive Object DetectionFarzaneh Rezaeianaran, Rakshith Shetty, Rahaf Aljundi, Daniel Olmeda Reino, Shanshan Zhang, Bernt Schiele. 9184-9193 [doi]

Information-theoretic regularization for Multi-source Domain AdaptationGeon Yeong Park, Sang Wan Lee. 9194-9203 [doi]

Graph Contrastive ClusteringHuasong Zhong, Jianlong Wu, Chong Chen 0002, Jianqiang Huang, Minghua Deng, Liqiang Nie, Zhouchen Lin, Xian-Sheng Hua 0001. 9204-9213 [doi]

Multi-VAE: Learning Disentangled View-common and View-peculiar Visual Representations for Multi-view ClusteringJie Xu, Yazhou Ren 0001, Huayi Tang, Xiaorong Pu, Xiaofeng Zhu 0007, Ming Zeng, Lifang He 0001. 9214-9223 [doi]

Long Short View Feature Decomposition via Contrastive Video Representation LearningNadine Behrmann, Mohsen Fayyaz, Juergen Gall, Mehdi Noroozi. 9224-9233 [doi]

Video Pose Distillation for Few-Shot, Fine-Grained Sports Action RecognitionJames Hong, Matthew Fisher, Michaël Gharbi, Kayvon Fatahalian. 9234-9243 [doi]

Semi-Supervised Single-Stage Controllable GANs for Conditional Fine-Grained Image GenerationTianyi Chen, Yi Liu, Yunfei Zhang, Si Wu 0002, Yong Xu 0007, Liangbing Feng, Hau-San Wong. 9244-9253 [doi]

Influence Selection for Active LearningZhuoming Liu, Hao Ding, Huaping Zhong, Weijia Li, Jifeng Dai, Conghui He. 9254-9263 [doi]

A Unified Objective for Novel Class DiscoveryEnrico Fini, Enver Sangineto, Stéphane Lathuilière, Zhun Zhong, Moin Nabi, Elisa Ricci 0001. 9264-9272 [doi]

Localized Simple Multiple Kernel K-meansXinwang Liu, Sihang Zhou, Li Liu 0002, Chang Tang, Siwei Wang, Jiyuan Liu 0003, Yi Zhang. 9273-9281 [doi]

Energy-Based Open-World Uncertainty Modeling for Confidence CalibrationYezhen Wang, Bo Li 0080, Tong Che, Kaiyang Zhou, Ziwei Liu 0002, Dongsheng Li. 9282-9291 [doi]

Me-Momentum: Extracting Hard Confident Examples from Noisily Labeled DataYingbin Bai, Tongliang Liu. 9292-9301 [doi]

Towards Novel Target Discovery Through Open-Set Domain AdaptationTaotao Jing, Hongfu Liu, Zhengming Ding. 9302-9311 [doi]

Partial Video Domain Adaptation with Partial Adversarial Temporal Attentive NetworkYuecong Xu, Jianfei Yang, Haozhi Cao, Zhenghua Chen, Qi Li, Kezhi Mao. 9312-9321 [doi]

Vector-Decomposed Disentanglement for Domain-Invariant Object DetectionAming Wu, Rui Liu, Yahong Han, Linchao Zhu, Yi Yang 0001. 9322-9331 [doi]

STEM: An approach to Multi-source Domain Adaptation with GuaranteesVan-Anh Nguyen, Tuan Nguyen 0004, Trung Le, Quan Hung Tran, Dinh Phung 0001. 9332-9343 [doi]

MT-ORL: Multi-Task Occlusion Relationship LearningPanhe Feng, Qi She, Lei Zhu, Jiaxin Li, Lin Zhang, Zijian Feng, Changhu Wang, Chunpeng Li, Xuejing Kang, Anlong Ming. 9344-9353 [doi]

Always Be Dreaming: A New Approach for Data-Free Class-Incremental LearningJames Smith, Yen-Chang Hsu, Jonathan Balloch, Yilin Shen, Hongxia Jin, Zsolt Kira. 9354-9364 [doi]

Rehearsal revealed: The limits and merits of revisiting samples in continual learningEli Verwimp, Matthias De Lange, Tinne Tuytelaars. 9365-9374 [doi]

Densely Guided Knowledge Distillation using Multiple Teacher AssistantsWonchul Son, Jaemin Na, Junyong Choi, Wonjun Hwang. 9375-9384 [doi]

Testing using Privileged Information by Adapting Features with Statistical DependenceKwang In Kim, James Tompkin. 9385-9393 [doi]

Seasonal Contrast: Unsupervised Pre-Training from Uncurated Remote Sensing DataOscar Mañas, Alexandre Lacoste, Xavier Giró i Nieto, David Vázquez 0001, Pau Rodríguez. 9394-9403 [doi]

Boosting the Generalization Capability in Cross-Domain Few-shot Learning via Noise-enhanced Supervised AutoencoderHanwen Liang, Qiong Zhang, Peng Dai, Juwei Lu. 9404-9414 [doi]

Meta Navigator: Search for a Good Adaptation Policy for Few-shot LearningChi Zhang 0007, Henghui Ding, Guosheng Lin, Ruibo Li, Changhu Wang, Chunhua Shen. 9415-9424 [doi]

Few-shot Image Classification: Just Use a Library of Pre-trained Feature Extractors and a Simple ClassifierArkabandhu Chowdhury, Mingchao Jiang, Swarat Chaudhuri, Chris Jermaine. 9425-9434 [doi]

Few-Shot and Continual Learning with Attentive Independent MechanismsEugene Lee, Cheng-Han Huang, Chen-Yi Lee. 9435-9444 [doi]

Meta-Learning with Task-Adaptive Loss Function for Few-Shot LearningSungyong Baik, Janghoon Choi, Heewon Kim, Dohee Cho, Jaesik Min, Kyoung Mu Lee. 9445-9454 [doi]

CoMatch: Semi-supervised Learning with Contrastive Graph RegularizationJunnan Li 0001, Caiming Xiong, Steven C. H. Hoi. 9455-9464 [doi]

Learning from Noisy Data with Robust Representation LearningJunnan Li 0001, Caiming Xiong, Steven C. H. Hoi. 9465-9474 [doi]

Distributional Robustness Loss for Long-tail LearningDvir Samuel, Gal Chechik. 9475-9484 [doi]

Solving Inefficiency of Self-supervised Representation LearningGuangrun Wang, Keze Wang, Guangcong Wang, Philip H. S. Torr, Liang Lin. 9485-9495 [doi]

2L: Contrastive Continual LearningHyuntak Cha, Jaeho Lee, Jinwoo Shin. 9496-9505 [doi]

Universal Representation Learning from Multiple Domains for Few-shot ClassificationWei-Hong Li, Xialei Liu, Hakan Bilen. 9506-9515 [doi]

Exploiting a Joint Embedding Space for Generalized Zero-Shot Semantic SegmentationDonghyeon Baek, Youngmin Oh, Bumsub Ham. 9516-9525 [doi]

Field-Guide-Inspired Zero-Shot LearningUtkarsh Mall, Bharath Hariharan, Kavita Bala. 9526-9535 [doi]

SIGN: Spatial-information Incorporated Generative Network for Generalized Zero-shot Semantic SegmentationJiaxin Cheng, Soumyaroop Nandi, Prem Natarajan, Wael Abd-Almageed. 9536-9546 [doi]

Universal-Prototype Enhancing for Few-Shot Object DetectionAming Wu, Yahong Han, Linchao Zhu, Yi Yang 0001. 9547-9556 [doi]

On Compositions of Transformations in Contrastive Self-Supervised LearningMandela Patrick, Yuki Markus Asano, Polina Kuznetsova, Ruth Fong, João F. Henriques, Geoffrey Zweig, Andrea Vedaldi. 9557-9567 [doi]

With a Little Help from My Friends: Nearest-Neighbor Contrastive Learning of Visual RepresentationsDebidatta Dwibedi, Yusuf Aytar, Jonathan Tompson, Pierre Sermanet, Andrew Zisserman. 9568-9577 [doi]

On Feature Decorrelation in Self-Supervised LearningTianyu Hua, Wenxiao Wang 0002, Zihui Xue, Sucheng Ren, Yue Wang, Hang Zhao. 9578-9588 [doi]

ISD: Self-Supervised Learning by Iterative Similarity DistillationAjinkya Tejankar, Soroush Abbasi Koohpayegani, Vipin Pillai, Paolo Favaro, Hamed Pirsiavash. 9589-9598 [doi]

SelfReg: Self-supervised Contrastive Regularization for Domain GeneralizationDaehee Kim, Youngjun Yoo, Seunghyun Park, Jinkyu Kim, Jaekoo Lee. 9599-9608 [doi]

Concept Generalization in Visual Representation LearningMert Bülent Sariyildiz, Yannis Kalantidis, Diane Larlus, Karteek Alahari. 9609-9619 [doi]

An Empirical Study of Training Self-Supervised Vision TransformersXinlei Chen, Saining Xie, Kaiming He. 9620-9629 [doi]

Emerging Properties in Self-Supervised Vision TransformersMathilde Caron, Hugo Touvron, Ishan Misra, Hervé Jégou, Julien Mairal, Piotr Bojanowski, Armand Joulin. 9630-9640 [doi]

Do Image Classifiers Generalize Across Time?Vaishaal Shankar, Achal Dave, Rebecca Roelofs, Deva Ramanan, Benjamin Recht, Ludwig Schmidt. 9641-9649 [doi]

Joint Inductive and Transductive Learning for Video Object SegmentationYunyao Mao, Ning Wang 0020, Wengang Zhou, Houqiang Li. 9650-9659 [doi]

Learning Facial Representations from the Cycle-consistency of FaceJia-Ren Chang, Yong-Sheng Chen, Wei-chen Chiu. 9660-9669 [doi]

UVStyle-Net: Unsupervised Few-shot Learning of 3D Style Similarity Measure for B-RepsPeter Meltzer, Hooman Shayani, Amir Khasahmadi, Pradeep Kumar Jayaraman, Aditya Sanghi, Joseph G. Lambourne. 9670-9679 [doi]

Seeing Dynamic Scene in the Dark: A High-Quality Video Dataset with Mechatronic AlignmentRuixing Wang, Xiaogang Xu, Chi-Wing Fu, Jiangbo Lu, Bei Yu, Jiaya Jia. 9680-9689 [doi]

Large Scale Interactive Motion Forecasting for Autonomous Driving : The Waymo Open Motion DatasetScott Ettinger, Shuyang Cheng, Benjamin Caine, Chenxi Liu, Hang Zhao, Sabeek Pradhan, Yuning Chai, Ben Sapp, Charles R. Qi, Yin Zhou, Zoey Yang, Aurelien Chouard, Pei Sun, Jiquan Ngiam, Vijay Vasudevan, Alexander McCauley, Jonathon Shlens, Dragomir Anguelov. 9690-9699 [doi]

Contact-Aware Retargeting of Skinned MotionRuben Villegas, Duygu Ceylan, Aaron Hertzmann, Jimei Yang, Jun Saito. 9700-9709 [doi]

Video Autoencoder: self-supervised disentanglement of static 3D structure and motionZihang Lai, Sifei Liu, Alexei A. Efros, Xiaolong Wang 0004. 9710-9720 [doi]

Dissecting Image CropsBasile Van Hoorick, Carl Vondrick. 9721-9730 [doi]

A Hierarchical Variational Neural Uncertainty Model for Stochastic Video PredictionMoitreya Chatterjee, Narendra Ahuja, Anoop Cherian. 9731-9741 [doi]

X-World: Accessibility, Vision, and Autonomy MeetJimuyang Zhang, Minglan Zheng, Matthew Boyd, Eshed Ohn-Bar. 9742-9751 [doi]

Learning to Estimate Hidden Motions with Global Motion AggregationShihao Jiang, Dylan Campbell, Yao Lu, Hongdong Li, Richard I. Hartley. 9752-9761 [doi]

Unsupervised Point Cloud Pre-training via Occlusion CompletionHanchen Wang, Qi Liu, Xiangyu Yue, Joan Lasenby, Matt J. Kusner. 9762-9772 [doi]

Learn-to-Race: A Multimodal Control Environment for Autonomous RacingJames Herman, Jonathan Francis, Siddha Ganju, Bingqing Chen, Anirudh Koul, Abhinav Gupta 0001, Alexey Skabelkin, Ivan Zhukov, Max Kumskoy, Eric Nyberg. 9773-9782 [doi]

LOKI: Long Term and Key Intentions for Trajectory PredictionHarshayu Girase, Haiming Gang, Srikanth Malla, Jiachen Li 0001, Akira Kanehara, Karttikeya Mangalam, Chiho Choi. 9783-9792 [doi]

AgentFormer: Agent-Aware Transformers for Socio-Temporal Multi-Agent ForecastingYe Yuan 0007, Xinshuo Weng, Yanglan Ou, Kris Kitani. 9793-9803 [doi]

Human Trajectory Prediction via Counterfactual AnalysisGuangyi Chen 0002, Junlong Li, Jiwen Lu, Jie Zhou 0001. 9804-9813 [doi]

Visio-Temporal Attention for Multi-Camera Multi-Target AssociationYu-Jhe Li, Xinshuo Weng, Yan Xu, Kris Kitani. 9814-9824 [doi]

CrowdDriven: A New Challenging Dataset for Outdoor Visual LocalizationAra Jafarzadeh, Manuel López-Antequera, Pau Gargallo, Yubin Kuang, Carl Toft, Fredrik Kahl, Torsten Sattler. 9825-9835 [doi]

High-Performance Discriminative Tracking with TransformersBin Yu, Ming Tang 0001, Linyu Zheng, Guibo Zhu, Jinqiao Wang, Hao Feng, Xuetao Feng, Hanqing Lu. 9836-9845 [doi]

Saliency-Associated Object TrackingZikun Zhou, Wenjie Pei, Xin Li 0034, Hongpeng Wang, Feng Zheng, Zhenyu He 0001. 9846-9855 [doi]

Track without Appearance: Learn Box and Tracklet Embedding with Local and Global Motion Patterns for Vehicle TrackingGaoang Wang, Renshu Gu, Zuozhu Liu, Weijie Hu, Mingli Song, Jenq-Neng Hwang. 9856-9866 [doi]

Towards Interpretable Deep Metric Learning with Structural MatchingWenliang Zhao, Yongming Rao, Ziyi Wang, Jiwen Lu, Jie Zhou 0001. 9867-9876 [doi]

On Equivariant and Invariant Learning of Object Landmark RepresentationsZezhou Cheng, Jong-Chyi Su, Subhransu Maji. 9877-9886 [doi]

Deep Matching Prior: Test-Time Optimization for Dense CorrespondenceSunghwan Hong, Seungryong Kim. 9887-9897 [doi]

Learning Better Visual Data Similarities via New Grouplet Non-Euclidean EmbeddingYanfu Zhang, Lei Luo 0001, Wenhan Xian, Heng Huang. 9898-9907 [doi]

Clustering by Maximizing Mutual Information Across ViewsKien Do, Truyen Tran 0001, Svetha Venkatesh. 9908-9918 [doi]

Learning Compatible EmbeddingsQiang Meng, Chixiang Zhang, Xiaoqiang Xu, Feng Zhou. 9919-9928 [doi]

Contrasting Contrastive Self-Supervised Representation Learning PipelinesKlemen Kotar, Gabriel Ilharco, Ludwig Schmidt, Kiana Ehsani, Roozbeh Mottaghi. 9929-9939 [doi]

Modelling Neighbor Relation in Joint Space-Time Graph for Video Correspondence LearningZixu Zhao, Yueming Jin, Pheng-Ann Heng. 9940-9949 [doi]

Time-Equivariant Contrastive Video Representation LearningSimon Jenni, Hailin Jin. 9950-9960 [doi]

Co-Scale Conv-Attentional Image TransformersWeijian Xu, Yifan Xu, Tyler A. Chang, Zhuowen Tu. 9961-9970 [doi]

T-SVDNet: Exploring High-Order Prototypical Correlations for Multi-Source Domain AdaptationRuihuang Li, Xu Jia, Jianzhong He, Shuaijun Chen, Qinghua Hu. 9971-9980 [doi]

Field Convolutions for Surface CNNsThomas W. Mitchel, Vladimir G. Kim, Michael Kazhdan. 9981-9991 [doi]

Swin Transformer: Hierarchical Vision Transformer using Shifted WindowsZe Liu, Yutong Lin, Yue Cao 0001, Han Hu 0004, Yixuan Wei, Zheng Zhang 0022, Stephen Lin, Baining Guo. 9992-10002 [doi]

InSeGAN: A Generative Approach to Segmenting Identical Instances in Depth ImagesAnoop Cherian, Goncalo Dias Pais, Siddarth Jain, Tim K. Marks, Alan Sullivan. 10003-10012 [doi]

Rethinking and Improving Relative Position Encoding for Vision TransformerKan Wu, Houwen Peng, Minghao Chen, Jianlong Fu, Hongyang Chao. 10013-10021 [doi]

Weakly Supervised Contrastive LearningMingkai Zheng, Fei Wang 0032, Shan You, Chen Qian 0006, Changshui Zhang, Xiaogang Wang 0001, Chang Xu 0002. 10022-10031 [doi]

Unsupervised Semantic Segmentation by Contrasting Object Mask ProposalsWouter Van Gansbeke, Simon Vandenhende, Stamatios Georgoulis, Luc Van Gool. 10032-10042 [doi]

Divide and Contrast: Self-supervised Learning from Uncurated DataYonglong Tian, Olivier J. Hénaff, Aäron Van Den Oord. 10043-10054 [doi]

Rethinking Self-supervised Correspondence Learning: A Video Frame-level Similarity PerspectiveJiarui Xu, Xiaolong Wang. 10055-10065 [doi]

Efficient Visual Pretraining with Contrastive DetectionOlivier J. Hénaff, Skanda Koppula, Jean-Baptiste Alayrac, Aäron Van Den Oord, Oriol Vinyals, João Carreira. 10066-10076 [doi]

SketchAA: Abstract Representation for Abstract SketchesLan Yang, Kaiyue Pang, Honggang Zhang 0002, Yi-Zhe Song. 10077-10086 [doi]

LaLaLoc: Latent Layout Localisation in Dynamic, Unvisited EnvironmentsHenry Howard-Jenkins, José-Raúl Ruiz-Sarmiento, Victor Adrian Prisacariu. 10087-10096 [doi]

OpenForensics: Large-Scale Challenging Dataset For Multi-Face Forgery Detection And Segmentation In-The-WildTrung-Nghia Le, Huy H. Nguyen, Junichi Yamagishi, Isao Echizen. 10097-10107 [doi]

FloorPlanCAD: A Large-Scale CAD Drawing Dataset for Panoptic Symbol SpottingZhiwen Fan, Lingjie Zhu, Honghua Li, Xiaohao Chen, Siyu Zhu, Ping Tan. 10108-10117 [doi]

H2O: Two Hands Manipulating Objects for First Person Interaction RecognitionTaein Kwon, Bugra Tekin, Jan Stühmer, Federica Bogo, Marc Pollefeys. 10118-10128 [doi]

Contrastive Learning of Image Representations with Cross-Video Cycle-ConsistencyHaiping Wu, Xiaolong Wang. 10129-10139 [doi]

Self-Supervised Visual Representations Learning by Contrastive Mask PredictionYucheng Zhao, Guangting Wang, Chong Luo, Wenjun Zeng, Zheng-Jun Zha. 10140-10149 [doi]

Temporal Knowledge Consistency for Unsupervised Visual Representation LearningWeixin Feng, Yuanjiang Wang, Lihua Ma, Ye Yuan, Chi Zhang. 10150-10160 [doi]

Geography-Aware Self-Supervised LearningKumar Ayush, Burak Uzkent, Chenlin Meng, Kumar Tanmay, Marshall Burke, David B. Lobell, Stefano Ermon. 10161-10170 [doi]

Self-Supervised Representation Learning from Flow EquivarianceYuwen Xiong, Mengye Ren, Wenyuan Zeng, Raquel Urtasun Waabi. 10171-10180 [doi]

Improve Unsupervised Pretraining for Few-label TransferSuichan Li, Dongdong Chen 0001, Yinpeng Chen, Lu Yuan, Lei Zhang 0001, Qi Chu 0001, Bin Liu 0016, Nenghai Yu. 10181-10190 [doi]

Improving robustness against common corruptions with frequency biased modelsTonmoy Saikia, Cordelia Schmid, Thomas Brox. 10191-10200 [doi]

Temporal-wise Attention Spiking Neural Networks for Event Streams ClassificationMan Yao, Huanhuan Gao, Guangshe Zhao, Dingheng Wang, Yihan Lin, Zhao-Xu Yang, Guoqi Li. 10201-10210 [doi]

Understanding Robustness of Transformers for Image ClassificationSrinadh Bhojanapalli, Ayan Chakrabarti, Daniel Glasner, Daliang Li, Thomas Unterthiner, Andreas Veit. 10211-10221 [doi]

Learning Conditional Knowledge Distillation for Degraded-Reference Image Quality AssessmentHeliang Zheng, Huan Yang 0005, Jianlong Fu, Zheng-Jun Zha, Jiebo Luo. 10222-10231 [doi]

Self-Supervised Pretraining of 3D Features on any Point-CloudZaiwei Zhang, Rohit Girdhar, Armand Joulin, Ishan Misra. 10232-10243 [doi]

Active Learning for Deep Object Detection via Probabilistic ModelingJiwoong Choi, Ismail Elezi, Hyuk-Jae Lee, Clément Farabet, Jose M. Alvarez. 10244-10253 [doi]

ACAV100M: Automatic Curation of Large-Scale Datasets for Audio-Visual Video Representation LearningSangho Lee, Jiwan Chung, Youngjae Yu, Gunhee Kim, Thomas M. Breuel, Gal Chechik, Yale Song. 10254-10264 [doi]

Benchmark Platform for Ultra-Fine-Grained Visual Categorization Beyond Human PerformanceXiaohan Yu, Yang Zhao, Yongsheng Gao 0001, Xiaohui Yuan, Shengwu Xiong. 10265-10275 [doi]

Video Annotation for Visual Tracking via Selection and RefinementKenan Dai, Jie Zhao, Lijun Wang, Dong Wang 0004, Jianhua Li, Huchuan Lu, Xuesheng Qian, Xiaoyun Yang. 10276-10285 [doi]

Improving Contrastive Learning by Visualizing Feature TransformationRui Zhu, Bingchen Zhao, Jingen Liu, Zhenglong Sun, Chang Wen Chen. 10286-10295 [doi]

Rethinking preventing class-collapsing in metric learning with margin-based lossesElad Levi, Tete Xiao, Xiaolong Wang 0004, Trevor Darrell. 10296-10305 [doi]

Mean Shift for Self-Supervised LearningSoroush Abbasi Koohpayegani, Ajinkya Tejankar, Hamed Pirsiavash. 10306-10315 [doi]

Instance Similarity Learning for Unsupervised Feature RepresentationZiwei Wang, Yunsong Wang, Ziyi Wu, Jiwen Lu, Jie Zhou 0001. 10316-10325 [doi]

Warp Consistency for Unsupervised Learning of Dense CorrespondencesPrune Truong, Martin Danelljan, Fisher Yu, Luc Van Gool. 10326-10336 [doi]

Refining activation downsampling with SoftPoolAlexandros Stergiou, Ronald Poppe, Grigorios Kalliatakis. 10337-10346 [doi]

Adversarial Unsupervised Domain Adaptation with Conditional and Label Shift: Infer, Align and IterateXiaofeng Liu 0001, Zhenhua Guo 0001, Site Li, Fangxu Xing, Jane You, C. C. Jay Kuo, Georges El Fakhri, Jonghye Woo. 10347-10356 [doi]

RANK-NOSH: Efficient Predictor-Based Architecture Search via Non-Uniform Successive HalvingRuochen Wang, Xiangning Chen, Minhao Cheng, Xiaocheng Tang, Cho-Jui Hsieh. 10357-10366 [doi]

Distilling Holistic Knowledge with Graph Neural NetworksSheng Zhou 0004, Yucheng Wang, Defang Chen, Jiawei Chen 0007, Xin Wang 0019, Can Wang 0001, Jiajun Bu. 10367-10376 [doi]

BuildingNet: Learning to Label 3D BuildingsPratheba Selvaraju, Mohamed Nabail, Marios Loizou, Maria Maslioukova, Melinos Averkiou, Andreas Andreou, Siddhartha Chaudhuri, Evangelos Kalogerakis. 10377-10387 [doi]

Curious Representation Learning for Embodied IntelligenceYilun Du, Chuang Gan, Phillip Isola. 10388-10397 [doi]

ViewNet: Unsupervised Viewpoint Estimation from Conditional GenerationOctave Mariotti, Oisin Mac Aodha, Hakan Bilen. 10398-10408 [doi]

Motion-Augmented Self-Training for Video Recognition at Smaller ScaleKirill Gavrilyuk, Mihir Jain, Ilia Karmanov, Cees G. M. Snoek. 10409-10418 [doi]

PARTS: Unsupervised segmentation with slots, attention and independence maximizationDaniel Zoran, Rishabh Kabra, Alexander Lerchner, Danilo J. Rezende. 10419-10427 [doi]

Learning Spatio-Temporal Transformer for Visual TrackingBin Yan 0002, Houwen Peng, Jianlong Fu, Dong Wang 0004, Huchuan Lu. 10428-10437 [doi]

Temporally-Coherent Surface Reconstruction via Metric-Consistent AtlasesJan Bednarík, Vladimir G. Kim, Siddhartha Chaudhuri, Shaifali Parashar, Mathieu Salzmann, Pascal Fua, Noam Aigerman. 10438-10447 [doi]

SGMNet: Learning Rotation-Invariant Point Cloud Representations via Sorted Gram MatrixJianyun Xu, Xin Tang, Yushi Zhu, Jie Sun, Shiliang Pu. 10448-10457 [doi]

Point-set Distances for Learning Representations of 3D Point CloudsTrung Nguyen, Quang-Hieu Pham, Tam Le, Tung Pham 0001, Nhat Ho, Binh-Son Hua. 10458-10467 [doi]

Exploring Simple 3D Multi-Object Tracking for Autonomous DrivingChenxu Luo, Xiaodong Yang, Alan L. Yuille. 10468-10477 [doi]

High-Resolution Optical Flow from 1D Attention and CorrelationHaofei Xu, Jiaolong Yang, Jianfei Cai 0001, Juyong Zhang, Xin Tong. 10478-10487 [doi]

Not All Operations Contribute Equally: Hierarchical Operation-adaptive Predictor for Neural Architecture SearchZiye Chen, Yibing Zhan, Baosheng Yu, Mingming Gong, Bo Du 0001. 10488-10497 [doi]

Poly-NL: Linear Complexity Non-local Layers With 3rd Order PolynomialsFrancesca Babiloni, Ioannis Marras, Filippos Kokkinos, Jiankang deng, Grigorios Chrysos 0002, Stefanos Zafeiriou. 10498-10508 [doi]

Impact of Aliasing on Generalization in Deep Convolutional NetworksCristina Vasconcelos, Hugo Larochelle, Vincent Dumoulin, Rob Romijnders, Nicolas Le Roux, Ross Goroshin. 10509-10518 [doi]

Region Similarity Representation LearningTete Xiao, Colorado J. Reed, Xiaolong Wang 0004, Kurt Keutzer, Trevor Darrell. 10519-10528 [doi]

Personalized Image Semantic SegmentationYu Zhang, Chang-Bin Zhang, Peng-Tao Jiang, Ming-Ming Cheng, Feng Mao. 10529-10539 [doi]

Space-Time Crop & Attend: Improving Cross-modal Video Representation LearningMandela Patrick, Po-Yao Huang 0001, Ishan Misra, Florian Metze, Andrea Vedaldi, Yuki M. Asano, João F. Henriques. 10540-10552 [doi]

Partner-Assisted Learning for Few-Shot Image ClassificationJiawei Ma, Hanchen Xie, Guangxing Han, Shih-Fu Chang, Aram Galstyan, Wael Abd-Almageed. 10553-10562 [doi]

Focus on the Positives: Self-Supervised Learning for Biodiversity MonitoringOmiros Pantazis, Gabriel J. Brostow, Kate E. Jones, Oisin Mac Aodha. 10563-10572 [doi]

Weakly Supervised Representation Learning with Coarse LabelsYuanhong Xu, Qi Qian 0001, Hao Li 0030, Rong Jin 0001, Juhua Hu. 10573-10581 [doi]

Webly Supervised Fine-Grained Recognition: Benchmark Datasets and An ApproachZeren Sun, Yazhou Yao, Xiu-Shen Wei, Yongshun Zhang, Fumin Shen, Jianxin Wu, Jian Zhang 0002, Heng Tao Shen. 10582-10591 [doi]

von Mises-Fisher Loss: An Exploration of Embedding Geometries for Supervised LearningTyler R. Scott, Andrew C. Gallagher, Michael C. Mozer. 10592-10602 [doi]

Contrastive Learning for Label Efficient Semantic SegmentationXiangyun Zhao, Raviteja Vemulapalli, Philip Andrew Mansfield, Boqing Gong, Bradley Green, Lior Shapira, Ying Wu. 10603-10613 [doi]

LoOp: Looking for Optimal Hard Negative Embeddings for Deep Metric LearningBhavya Vasudeva, Puneesh Deora, Saumik Bhattacharya, Umapada Pal 0001, Sukalpa Chanda. 10614-10623 [doi]

Do Different Deep Metric Learning Losses Lead to Similar Learned Features?Konstantin Kobs, Michael Steininger, Andrzej Dulny, Andreas Hotho. 10624-10634 [doi]

DiagViB-6: A Diagnostic Benchmark Suite for Vision Models in the Presence of Shortcut and Generalization OpportunitiesElias Eulig, Piyapat Saranrittichai, Chaithanya Kumar Mummadi, Kilian Rambach, William Beluch, Xiahan Shi, Volker Fischer 0003. 10635-10644 [doi]

Kernel Methods in Hyperbolic SpacesPengfei Fang, Mehrtash Harandi, Lars Petersson. 10645-10654 [doi]

Lipschitz Continuity Guided Knowledge DistillationYuzhang Shang, Bin Duan, Ziliang Zong, Liqiang Nie, Yan Yan 0002. 10655-10664 [doi]

Learning with Privileged TasksYuru Song, Zan Lou, Shan You, Erkun Yang, Fei Wang 0032, Chen Qian 0006, Changshui Zhang, Xiaogang Wang 0001. 10665-10674 [doi]

Lifelong Infinite Mixture Model Based on Knowledge-Driven Dirichlet ProcessFei Ye, Adrian G. Bors. 10675-10684 [doi]

Low-Shot Validation: Active Importance Sampling for Estimating Classifier Performance on Rare CategoriesFait Poms, Vishnu Sarukkai, Ravi Teja Mullapudi, Nimit Sharad Sohoni, William R. Mark, Deva Ramanan, Kayvon Fatahalian. 10685-10694 [doi]

Cloud Transformers: A Universal Approach To Point Cloud Processing TasksKirill Mazur, Victor Lempitsky. 10695-10704 [doi]

DepthTrack: Unveiling the Power of RGBD TrackingSong Yan, Jinyu Yang, Jani Käpylä, Feng Zheng, Ales Leonardis, Joni-Kristian Kämäräinen. 10705-10713 [doi]

Transparent Object Tracking BenchmarkHeng Fan, Halady Akhilesha Miththanthaya, Harshit, Siranjiv Ramana Rajan, Xiaoqiong Liu, Zhilin Zou, Yuewei Lin, Haibin Ling. 10714-10723 [doi]

KoDF: A Large-scale Korean DeepFake Detection DatasetPatrick Kwon, Jaeseong You, Gyuhyeon Nam, Sungwoo Park, Gyeongsu Chae. 10724-10733 [doi]

Dynamic Surface Function Networks for Clothed Human BodiesAndrei Burov, Matthias Nießner, Justus Thies. 10734-10744 [doi]

ACDC: The Adverse Conditions Dataset with Correspondences for Semantic Driving Scene UnderstandingChristos Sakaridis, Dengxin Dai, Luc Van Gool. 10745-10755 [doi]

Unidentified Video Objects: A Benchmark for Dense, Open-World SegmentationWeiyao Wang 0001, Matt Feiszli, Heng Wang, Du Tran. 10756-10765 [doi]

Omnidata: A Scalable Pipeline for Making Multi-Task Mid-Level Vision Datasets from 3D ScansAinaz Eftekhar, Alexander Sax, Jitendra Malik, Amir Roshan Zamir. 10766-10776 [doi]

End-to-End Video Instance Segmentation via Spatial-Temporal Graph Neural NetworksTao Wang, Ning Xu 0007, Kean Chen, Weiyao Lin. 10777-10786 [doi]

Separable Flow: Learning Motion Cost Volumes for Optical Flow EstimationFeihu Zhang, Oliver J. Woodford, Victor Prisacariu, Philip H. S. Torr. 10787-10797 [doi]

ORBIT: A Real-World Few-Shot Dataset for Teachable Object RecognitionDaniela Massiceti, Luisa M. Zintgraf, John Bronskill, Lida Theodorou, Matthew Tobias Harris, Edward Cutrell, Cecily Morrison, Katja Hofmann, Simone Stumpf. 10798-10808 [doi]

Wanderlust: Online Continual Object Detection in the Real WorldJianren Wang, Xin Wang, Yue Shang-Guan, Abhinav Gupta. 10809-10818 [doi]

Learning to Adversarially Blur Visual Object TrackingQing Guo 0005, Ziyi Cheng, Felix Juefei-Xu, Lei Ma 0003, Xiaofei Xie, Yang Liu 0003, Jianjun Zhao. 10819-10828 [doi]

MOTSynth: How Can Synthetic Data Help Pedestrian Detection and Tracking?Matteo Fabbri, Guillem Brasó, Gianluca Maugeri, Orcun Cetintas, Riccardo Gasparini, Aljosa Osep, Simone Calderara, Laura Leal-Taixé, Rita Cucchiara. 10829-10839 [doi]

Learning to Track with Object PermanencePavel Tokmakov, Jie Li 0031, Wolfram Burgard, Adrien Gaidon. 10840-10849 [doi]

StereOBJ-1M: Large-scale Stereo Image Dataset for 6D Object Pose EstimationXingyu Liu, Shun Iwase, Kris M. Kitani. 10850-10859 [doi]

SynFace: Face Recognition with Synthetic DataHaibo Qiu, Baosheng Yu, Dihong Gong, Zhifeng Li 0001, Wei Liu 0005, Dacheng Tao. 10860-10870 [doi]

UltraPose: Synthesizing Dense Pose with 1 Billion Points by Human-body Decoupling 3D ModelHaonan Yan, Jiaqi Chen, Xujie Zhang, Shengkai Zhang, Nianhong Jiao, Xiaodan Liang, Tianxiang Zheng. 10871-10880 [doi]

Common Objects in 3D: Large-Scale Learning and Evaluation of Real-life 3D Category ReconstructionJeremy Reizenstein, Roman Shapovalov, Philipp Henzler, Luca Sbordone, Patrick Labatut, David Novotný. 10881-10891 [doi]

Hypersim: A Photorealistic Synthetic Dataset for Holistic Indoor Scene UnderstandingMike Roberts, Jason Ramapuram, Anurag Ranjan, Atulit Kumar, Miguel Ángel Bautista 0001, Nathan Paczan, Russ Webb, Joshua M. Susskind. 10892-10902 [doi]

Towards Real-world X-ray Security Inspection: A High-Quality Benchmark And Lateral Inhibition Module For Prohibited Items DetectionRenshuai Tao, Yanlu Wei, Xiangjian Jiang, Hainan Li, Haotong Qin, Jiakai Wang, Yuqing Ma, Libo Zhang, Xianglong Liu. 10903-10912 [doi]

3D-FRONT: 3D Furnished Rooms with layOuts and semaNTicsHuan Fu, Bowen Cai, Lin Gao 0004, Lingxiao Zhang, Jiaming Wang, Cao Li, Qixun Zeng, Chengyue Sun, Rongfei Jia, Binqiang Zhao, Hao Zhang 0002. 10913-10922 [doi]

BV-Person: A Large-scale Dataset for Bird-view Person Re-identificationCheng Yan, Guansong Pang, Lei Wang, Jile Jiao, Xuetao Feng, Chunhua Shen, Jingjing Li. 10923-10932 [doi]

FloW: A Dataset and Benchmark for Floating Waste Detection in Inland WatersYuwei Cheng, Jiannan Zhu, Mengxin Jiang, Jie Fu, Changsong Pang, Peidong Wang, Kris Sankaran, Olawale Onabola, Yimin Liu, Dianbo Liu, Yoshua Bengio. 10933-10942 [doi]

BioFors: A Large Biomedical Image Forensics DatasetEkraam Sabir, Soumyaroop Nandi, Wael AbdAlmageed, Prem Natarajan. 10943-10953 [doi]

The Power of Points for Modeling Humans in ClothingQianli Ma, Jinlong Yang, Siyu Tang 0001, Michael J. Black. 10954-10964 [doi]

Action-Conditioned 3D Human Motion Synthesis with Transformer VAEMathis Petrovich, Michael J. Black, Gül Varol. 10965-10975 [doi]

EventHPE: Event-based 3D Human Pose and Shape EstimationShihao Zou, Chuan Guo, Xinxin Zuo, Sen Wang 0001, Pengyu Wang, Xiaoqin Hu, Shoushun Chen, Minglun Gong, Li Cheng 0001. 10976-10985 [doi]

Egocentric Pose Estimation from Human Vision SpanHao Jiang 0007, Vamsi Krishna Ithapu. 10986-10994 [doi]

*Xiaodan Hu, Narendra Ahuja. 10995-11004 [doi]

Human Pose Regression with Residual Log-likelihood EstimationJiefeng Li, Siyuan Bian, Ailing Zeng, Can Wang, Bo Pang, Wentao Liu 0002, Cewu Lu. 11005-11014 [doi]

SPEC: Seeing People in the Wild with an Estimated CameraMuhammed Kocabas, Chun-Hao P. Huang, Joachim Tesch, Lea Müller, Otmar Hilliges, Michael J. Black. 11015-11025 [doi]

ARCH++: Animation-Ready Clothed Human Reconstruction RevisitedTong He, Yuanlu Xu, Shunsuke Saito, Stefano Soatto, Tony Tung. 11026-11036 [doi]

Keypoint CommunitiesDuncan Zauss, Sven Kreiss, Alexandre Alahi. 11037-11046 [doi]

Removing the Bias of Integral Pose RegressionKerui Gu, Linlin Yang, Angela Yao. 11047-11056 [doi]

Speech Drives Templates: Co-Speech Gesture Synthesis with Learned TemplatesShenhan Qian, Zhi Tu, YiHao Zhi, Wen Liu 0003, Shenghua Gao. 11057-11066 [doi]

SignBERT: Pre-Training of Hand-Model-Aware Representation for Sign Language RecognitionHezhen Hu, Weichao Zhao, Wengang Zhou, Yuechen Wang, Houqiang Li. 11067-11076 [doi]

CPF: Learning a Contact Potential Field to Model the Hand-Object InteractionLixin Yang, Xinyu Zhan 0001, Kailin Li, Wenqiang Xu, Jiefeng Li, Cewu Lu. 11077-11086 [doi]

Hand-Object Contact Consistency Reasoning for Human Grasps GenerationHanwen Jiang, Shaowei Liu, Jiashun Wang, Xiaolong Wang 0004. 11087-11096 [doi]

SOMA: Solving Optical Marker-Based MoCap AutomaticallyNima Ghorbani, Michael J. Black. 11097-11106 [doi]

PARE: Part Attention Regressor for 3D Human Body EstimationMuhammed Kocabas, Chun-Hao P. Huang, Otmar Hilliges, Michael J. Black. 11107-11117 [doi]

Learning Realistic Human Reposing using Cyclic Self-Supervision with 3D Shape, Pose, and Appearance ConsistencySoubhik Sanyal, Betty Mohler, Alex Vorobiov, Larry Davis 0001, Timo Bolkart, Javier Romero 0002, Matthew Loper, Michael J. Black. 11118-11127 [doi]

Graph-Based 3D Multi-Person Pose Estimation Using Multi-View ImagesSize Wu, Sheng Jin 0007, Wentao Liu 0002, Lei Bai 0001, Chen Qian 0006, Dong Liu, Wanli Ouyang. 11128-11137 [doi]

Shape-aware Multi-Person Pose Estimation from Multi-View ImagesZijian Dong, Jie Song 0006, Xu Chen, Chen Guo, Otmar Hilliges. 11138-11148 [doi]

Camera Distortion-aware 3D Human Pose Estimation in Video with Optimization-based Meta-LearningHanbyel Cho, Yooshin Cho, Jaemyung Yu, Junmo Kim. 11149-11158 [doi]

Monocular, One-stage, Regression of Multiple 3D PeopleYu Sun, Qian Bao, Wu Liu, Yili Fu, Michael J. Black, Tao Mei 0001. 11159-11168 [doi]

End-to-End Detection and Pose Estimation of Two Interacting HandsDong-Uk Kim, Kwang In Kim, SeungRyul Baek. 11169-11178 [doi]

Probabilistic Monocular 3D Human Pose Estimation with Normalizing FlowsTom Wehrbein, Marco Rudolph, Bodo Rosenhahn, Bastian Wandt. 11179-11188 [doi]

Space-Time-Separable Graph Convolutional Network for Pose ForecastingTheodoros Sofianos, Alessio Sampieri, Luca Franco, Fabio Galasso. 11189-11198 [doi]

Hierarchical Kinematic Probability Distributions for 3D Human Shape and Pose Estimation from Images in the WildAkash Sengupta, Ignas Budvytis, Roberto Cipolla. 11199-11209 [doi]

Self-Supervised 3D Hand Pose Estimation from monocular RGB via Contrastive LearningAdrian Spurr, Aneesh Dahiya, Xi Wang, Xucong Zhang, Otmar Hilliges. 11210-11219 [doi]

An Empirical Study of the Collapsing Problem in Semi-Supervised 2D Human Pose EstimationRongchang Xie, Chunyu Wang, Wenjun Zeng, Yizhou Wang 0001. 11220-11229 [doi]

Learning to Regress Bodies from Images using Differentiable Semantic RenderingSai Kumar Dwivedi, Nikos Athanasiou, Muhammed Kocabas, Michael J. Black. 11230-11239 [doi]

HandFoldingNet: A 3D Hand Pose Estimation Network Using Multiscale-Feature Guided Folding of a 2D Hand SkeletonWencan Cheng, Jae-Hyun Park, Jong Hwan Ko. 11240-11249 [doi]

Learning Causal Representation for Training Cross-Domain Pose Estimator via Generative InterventionsXiheng Zhang, Yongkang Wong, Xiaofei Wu, Juwei Lu, Mohan S. Kankanhalli, Xiangdong Li, Weidong Geng. 11250-11260 [doi]

Hand Image Understanding via Deep Multi-Task LearningXiong Zhang, Hongsheng Huang, Jianchao Tan, Hongmin Xu, Cheng Yang, Guozhu Peng, Lei Wang, Ji Liu 0002. 11261-11272 [doi]

Audio2Gestures: Generating Diverse Gestures from Speech Audio with Conditional Variational AutoencodersJing Li 0071, Di Kang, Wenjie Pei, Xuefei Zhe, Ying Zhang, Zhenyu He 0001, Linchao Bao. 11273-11282 [doi]

Self-Mutual Distillation Learning for Continuous Sign Language RecognitionAiming Hao, Yuecong Min, Xilin Chen 0001. 11283-11292 [doi]

TokenPose: Learning Keypoint Tokens for Human Pose EstimationYanjie Li, Shoukui Zhang, Zhicheng Wang, Sen Yang, Wankou Yang, Shu-Tao Xia, Erjin Zhou. 11293-11302 [doi]

The Animation Transformer: Visual Correspondence via Segment MatchingEvan Casey, Víctor Pérez, Zhuoru Li. 11303-11312 [doi]

Contextually Plausible and Diverse 3D Human Motion PredictionSadegh Aliakbarian, Fatemeh Sadat Saleh, Lars Petersson, Stephen Gould, Mathieu Salzmann. 11313-11322 [doi]

Learning Motion Priors for 4D Human Body Capture in 3D ScenesSiwei Zhang, Yan Zhang 0054, Federica Bogo, Marc Pollefeys, Siyu Tang 0001. 11323-11333 [doi]

Interacting Two-Hand 3D Pose and Shape Reconstruction from Single Color ImageBaowen Zhang, Yangang Wang, Xiaoming Deng 0001, Yinda Zhang 0001, Ping Tan, CuiXia Ma, Hongan Wang. 11334-11343 [doi]

SemiHand: Semi-supervised Hand Pose Estimation with ConsistencyLinlin Yang, Shicheng Chen, Angela Yao. 11344-11353 [doi]

Stochastic Scene-Aware Motion PredictionMohamed Hassan, Duygu Ceylan, Ruben Villegas, Jun Saito, Jimei Yang, Yi Zhou, Michael J. Black. 11354-11364 [doi]

Neural Architecture Search for Joint Human Parsing and Pose EstimationDan Zeng, Yuhang Huang, Qian Bao, Junjie Zhang, Chi Su, Wu Liu. 11365-11374 [doi]

Weakly Supervised Text-based Person Re-IdentificationShizhen Zhao, Changxin Gao, Yuanjie Shao, Wei-Shi Zheng, Nong Sang. 11375-11384 [doi]

Single Image 3D Shape Retrieval via Cross-Modal Instance and Category Contrastive LearningMing-Xian Lin, Jie Yang 0038, He Wang, Yu-Kun Lai, Rongfei Jia, Binqiang Zhao, Lin Gao 0004. 11385-11395 [doi]

Learning Deep Local Features with Multiple Dynamic Attentions for Large-Scale Image RetrievalHui Wu, Min Wang 0019, Wengang Zhou, Houqiang Li. 11396-11405 [doi]

Cherry-Picking Gradients: Learning Low-Rank Embeddings of Visual Data via Differentiable Cross-ApproximationMikhail Usvyatsov, Anastasia Makarova, Rafael Ballester-Ripoll, Maxim Rakhuba, Andreas Krause 0001, Konrad Schindler. 11406-11415 [doi]

Learning Skeletal Graph Neural Networks for Hard 3D Pose EstimationAiling Zeng, Xiao Sun, Lei Yang, Nanxuan Zhao, Minhao Liu, Qiang Xu 0001. 11416-11425 [doi]

PyMAF: 3D Human Pose and Shape Regression with Pyramidal Mesh Alignment Feedback LoopHongwen Zhang, Yating Tian, Xinchi Zhou, Wanli Ouyang, Yebin Liu, Limin Wang 0002, Zhenan Sun. 11426-11436 [doi]

Revitalizing Optimization for 3D Human Pose and Shape Estimation: A Sparse Constrained FormulationTaosha Fan, Kalyan Vasudev Alwala, Donglai Xiang, WeiPeng Xu, Todd D. Murphey, Mustafa Mukadam. 11437-11446 [doi]

MSR-GCN: Multi-Scale Residual Graph Convolution Networks for Human Motion PredictionLingwei Dang, Yongwei Nie, Chengjiang Long, Qing Zhang, Guiqing Li. 11447-11456 [doi]

Modulated Graph Convolutional Network for 3D Human Pose EstimationZhiming Zou, Wei Tang. 11457-11467 [doi]

HuMoR: 3D Human Motion Model for Robust Pose EstimationDavis Rempe, Tolga Birdal, Aaron Hertzmann, Jimei Yang, Srinath Sridhar 0002, Leonidas J. Guibas. 11468-11479 [doi]

Estimating Egocentric 3D Human Pose in Global SpaceJian Wang 0042, Lingjie Liu, WeiPeng Xu, Kripasindhu Sarkar, Christian Theobalt. 11480-11489 [doi]

EM-POSE: 3D Human Pose Estimation from Sparse Electromagnetic TrackersManuel Kaufmann, Yi Zhao, Chengcheng Tang, Lingling Tao, Christopher D. Twigg, Jie Song 0006, Robert Wang 0002, Otmar Hilliges. 11490-11500 [doi]

Normalized Human Pose Features for Human Action Video AlignmentJingyuan Liu, Mingyi Shi, Qifeng Chen, Hongbo Fu, Chiew-Lan Tai. 11501-11511 [doi]

Physics-based Human Motion Estimation and Synthesis from VideosKevin Xie, Tingwu Wang, Umar Iqbal, Yunrong Guo, Sanja Fidler, Florian Shkurti. 11512-11521 [doi]

Visual Alignment Constraint for Continuous Sign Language RecognitionYuecong Min, Aiming Hao, Xiujuan Chai, Xilin Chen 0001. 11522-11531 [doi]

Aligning Subtitles in Sign Language VideosHannah Bull, Triantafyllos Afouras, Gül Varol, Samuel Albanie, Liliane Momeni, Andrew Zisserman. 11532-11541 [doi]

TACo: Token-aware Cascade Contrastive Learning for Video-Text AlignmentJianwei Yang, Yonatan Bisk, Jianfeng Gao. 11542-11552 [doi]

Support-Set Based Cross-Supervision for Video GroundingXinpeng Ding, Nannan Wang 0001, Shiwei Zhang, De Cheng, Xiaomeng Li, Ziyuan Huang, Mingqian Tang, Xinbo Gao 0001. 11553-11562 [doi]

TeachText: CrossModal Generalized Distillation for Text-Video RetrievalIoana Croitoru, Simion-Vlad Bogolin, Marius Leordeanu, Hailin Jin, Andrew Zisserman, Samuel Albanie, Yang Liu. 11563-11573 [doi]

SNARF: Differentiable Forward Skinning for Animating Non-Rigid Neural Implicit ShapesXu Chen, Yufeng Zheng, Michael J. Black, Otmar Hilliges, Andreas Geiger 0001. 11574-11584 [doi]

Probabilistic Modeling for Human Mesh RecoveryNikos Kolotouros, Georgios Pavlakos, Dinesh Jayaraman, Kostas Daniilidis. 11585-11594 [doi]

Deep Virtual Markers for Articulated 3D ShapesHyomin Kim, Jungeon Kim, Jaewon Kam, Jaesik Park, Seungyong Lee 0001. 11595-11605 [doi]

Self-supervised Transfer Learning for Hand Mesh Recovery from Binocular ImagesZheng Chen, Sihan Wang, Yi Sun 0009, Xiaohong Ma. 11606-11614 [doi]

Neural TMDlayer: Modeling Instantaneous flow of features via SDE GeneratorsZihang Meng, Vikas Singh, Sathya N. Ravi. 11615-11624 [doi]

∗Yujun Cai, Yiwei Wang 0001, Yiheng Zhu, Tat-Jen Cham, Jianfei Cai 0001, Junsong Yuan, Jun Liu 0036, Chuanxia Zheng, Sijie Yan, Henghui Ding, Xiaohui Shen, Ding Liu, Nadia Magnenat-Thalmann. 11625-11635 [doi]

3D Human Pose Estimation with Spatial and Temporal TransformersCe Zheng, Sijie Zhu, Matías Mendieta, Taojiannan Yang, Chen Chen 0001, Zhengming Ding. 11636-11645 [doi]

TravelNet: Self-supervised Physically Plausible Hand Motion Learning from Monocular Color ImagesZimeng Zhao, Xi Zhao, Yangang Wang. 11646-11656 [doi]

DECA: Deep viewpoint-Equivariant human pose estimation using Capsule AutoencodersNicola Garau, Niccoló Bisagno, Piotr Bródka, Nicola Conci. 11657-11666 [doi]

Full-Body Motion from a Single Head-Mounted Device: Generating SMPL Poses from Partial ObservationsAndrea Dittadi, Sebastian Dziadzio, Darren Cosker, Ben Lundell, Thomas J. Cashman 0001, Jamie Shotton. 11667-11677 [doi]

Towards Accurate Alignment in Real-time 3D Hand-Mesh ReconstructionXiao Tang, Tianyu Wang 0003, Chi-Wing Fu. 11678-11687 [doi]

Neural-GIF: Neural Generalized Implicit Functions for Animating People in ClothingGarvita Tiwari, Nikolaos Sarafianos, Tony Tung, Gerard Pons-Moll. 11688-11698 [doi]

Motion Adaptive Pose Estimation from Compressed VideosZhipeng Fan, Jun Liu 0036, Yao Wang. 11699-11708 [doi]

DensePose 3D: Lifting Canonical Surface Maps of Articulated Objects to the Third DimensionRoman Shapovalov, David Novotný, Benjamin Graham, Patrick Labatut, Andrea Vedaldi. 11709-11719 [doi]

Online Knowledge Distillation for Efficient Pose EstimationZheng Li, Jingwen Ye, Mingli Song, Ying Huang 0003, Zhigeng Pan. 11720-11730 [doi]

Improving Robustness of Facial Landmark Detection by Defending against Adversarial AttacksCongcong Zhu, Xiaoqiang Li, Jide Li, Songmin Dai. 11731-11740 [doi]

Ranking Models in Unlabeled New EnvironmentsXiaoxiao Sun, Yunzhong Hou, Weijian Deng, Hongdong Li, Liang Zheng 0001. 11741-11751 [doi]

DOLG: Single-Stage Image Retrieval with Deep Orthogonal Fusion of Local and Global FeaturesMin Yang, Dongliang He, Miao Fan, Baorong Shi, Xuetong Xue, Fu Li, Errui Ding, Jizhou Huang. 11752-11761 [doi]

Product1M: Towards Weakly Supervised Instance-Level Product Retrieval via Cross-Modal PretrainingXunlin Zhan, Yangxin Wu, Xiao Dong, Yunchao Wei, Minlong Lu, Yichi Zhang, Hang Xu, Xiaodan Liang. 11762-11771 [doi]

Learning with Memory-based Virtual Classes for Deep Metric LearningByungSoo Ko, Geonmo Gu, Han-Gyu Kim. 11772-11781 [doi]

TransPose: Keypoint Localization via TransformerSen Yang, Zhibin Quan, Mu Nie, Wankou Yang. 11782-11792 [doi]

Explainable Person Re-Identification with Attribute-guided Metric DistillationXiaodong Chen, Xinchen Liu, Wu Liu, Xiaoping Zhang 0003, Yongdong Zhang 0001, Tao Mei 0001. 11793-11802 [doi]

CM-NAS: Cross-Modality Neural Architecture Search for Visible-Infrared Person Re-IdentificationChaoyou Fu, Yibo Hu, Xiang Wu 0001, Hailin Shi, Tao Mei 0001, Ran He. 11803-11812 [doi]

Occlude Them All: Occlusion-Aware Attention Network for Occluded Person Re-IDPeixian Chen, Wenfeng Liu, Pingyang Dai, Jianzhuang Liu, Qixiang Ye, Mingliang Xu, Qi'an Chen, Rongrong Ji. 11813-11822 [doi]

Memory-augmented Dynamic Neural Relational InferenceDong Gong, Zhen Zhang 0008, Qinfeng (Javen) Shi, Anton van den Hengel. 11823-11832 [doi]

The Center of Attention: Center-Keypoint Grouping via Attention for Multi-Person Pose EstimationGuillem Brasó, Nikita Kister, Laura Leal-Taixé. 11833-11843 [doi]

IDM: An Intermediate Domain Module for Domain Adaptive Person Re-IDYongxing Dai, Jun Liu 0036, Yifan Sun 0003, Zekun Tong, Chi Zhang 0026, Ling-Yu Duan. 11844-11854 [doi]

Occluded Person Re-Identification with Single-scale Global RepresentationsCheng Yan, Guansong Pang, Jile Jiao, Xiao Bai 0001, Xuetao Feng, Chunhua Shen. 11855-11864 [doi]

Learning to Know Where to See: A Visibility-Aware Approach for Occluded Person Re-identificationJinrui Yang, Jiawei Zhang, Fufu Yu, Xinyang Jiang, Mengdan Zhang, Xing Sun, Ying-Cong Chen, Wei-Shi Zheng. 11865-11874 [doi]

Clothing Status Awareness for Long-Term Person Re-IdentificationYan Huang 0023, Qiang Wu 0001, Jingsong Xu, Yi Zhong 0002, Zhaoxiang Zhang. 11875-11884 [doi]

Beyond Road Extraction: A Dataset for Map Update using Aerial ImagesFavyen Bastani, Sam Madden. 11885-11894 [doi]

HiT: Hierarchical Transformer with Momentum Contrast for Video-Text RetrievalSong Liu, Haoqi Fan 0003, Shengsheng Qian, Yiru Chen, Wenkui Ding, Zhongyuan Wang. 11895-11905 [doi]

ALADIN: All Layer Adaptive Instance Normalization for Fine-grained Style SimilarityDan Ruta, Saeid Motiian, Baldo Faieta, Zhe Lin 0001, Hailin Jin, Alex Filipkowski, Andrew Gilbert, John P. Collomosse. 11906-11915 [doi]

Rethinking Spatial Dimensions of Vision TransformersByeongho Heo, Sangdoo Yun, Dongyoon Han, Sanghyuk Chun, Junsuk Choe, Seong Joon Oh. 11916-11925 [doi]

Stochastic Transformer Networks with Linear Competing Units: Application to end-to-end SL TranslationAndreas Voskou, Konstantinos P. Panousis, Dimitrios Kosmopoulos, Dimitris N. Metaxas, Sotirios Chatzis. 11926-11935 [doi]

Building-GAN: Graph-Conditioned Architectural Volumetric Design GenerationKai-Hung Chang, Chin-Yi Cheng, Jieliang Luo, Shingo Murata, Mehdi Nourbakhsh, Yoshito Tsuji. 11936-11945 [doi]

LIRA: Learnable, Imperceptible and Robust Backdoor AttacksKhoa Doan, Yingjie Lao, Weijie Zhao 0001, Ping Li 0001. 11946-11956 [doi]

Inferring high-resolution traffic accident risk maps based on satellite imagery and GPS trajectoriesSongtao He, Mohammad Amin Sadeghi, Sanjay Chawla, Mohammad Alizadeh, Hari Balakrishnan, Samuel Madden. 11957-11965 [doi]

EC-DARTS: Inducing Equalized and Consistent Optimization into DARTSQinqin Zhou, Xiawu Zheng, Liujuan Cao, Bineng Zhong, Teng Xi, Gang Zhang, Errui Ding, Mingliang Xu, Rongrong Ji. 11966-11975 [doi]

PT-CapsNet: A Novel Prediction-Tuning Capsule Network Suitable for Deeper ArchitecturesChenbin Pan, Senem Velipasalar. 11976-11985 [doi]

Weakly Supervised Person Search with Region Siamese NetworksChuchu Han, Kai Su, Dongdong Yu, Zehuan Yuan, Changxin Gao, Nong Sang, Yi Yang 0001, Changhu Wang. 11986-11995 [doi]

ASMR: Learning Attribute-Based Person Search with Adaptive Semantic Margin RegularizerBoseung Jeong, Jicheol Park, Suha Kwak. 11996-12005 [doi]

Pyramid Spatial-Temporal Aggregation for Video-based Person Re-IdentificationYingquan Wang, Pingping Zhang, Shang Gao, Xia Geng, Huchuan Lu, Dong Wang 0004. 12006-12015 [doi]

Video-based Person Re-identification with Spatial and Temporal Memory NetworksChanho Eom, Geon Lee, Junghyup Lee, Bumsub Ham. 12016-12025 [doi]

Learning by Aligning: Visible-Infrared Person Re-identification using Cross-Modal CorrespondencesHyunJong Park, Sanghoon Lee, Junghyup Lee, Bumsub Ham. 12026-12035 [doi]

Universal Cross-Domain Retrieval: Generalizing Across Classes and DomainsSoumava Paul, Titir Dutta, Soma Biswas. 12036-12044 [doi]

Deep Relational Metric LearningWenzhao Zheng, Borui Zhang, Jiwen Lu, Jie Zhou 0001. 12045-12054 [doi]

Deep Symmetric Network for Underexposed Image Enhancement with Recurrent Attentional LearningLin Zhao, Shao-Ping Lu, Tao Chen, Zhenglu Yang, Ariel Shamir. 12055-12064 [doi]

Self-supervised Product Quantization for Deep Unsupervised Image RetrievalYoung-Kyun Jang, Nam Ik Cho. 12065-12074 [doi]

Learning specialized activation functions with the Piecewise Linear UnitYucong Zhou, Zezhou Zhu, Zhao Zhong. 12075-12084 [doi]

Instance-level Image Retrieval using Reranking TransformersFuwen Tan, Jiangbo Yuan, Vicente Ordonez. 12085-12095 [doi]

Face Image Retrieval with Attribute ManipulationAlireza Zaeemzadeh, Shabnam Ghadar, Baldo Faieta, Zhe Lin 0001, Nazanin Rahnavard, Mubarak Shah, Ratheesh Kalarot. 12096-12105 [doi]

Video Geo-Localization Employing Geo-Temporal Feature Learning and GPS Trajectory SmoothingKrishna Regmi, Mubarak Shah. 12106-12115 [doi]

Telling the What while Pointing to the Where: Multimodal Queries for Image RetrievalSoravit Changpinyo, Jordi Pont-Tuset, Vittorio Ferrari, Radu Soricut. 12116-12126 [doi]

Learning Attribute-driven Disentangled Representations for Interactive Fashion RetrievalYuxin Hou, Eleonora Vig, Michael Donoser, Loris Bazzani. 12127-12137 [doi]

Bayesian Triplet Loss: Uncertainty Quantification in Image RetrievalFrederik Warburg, Martin Jørgensen, Javier Civera, Søren Hauberg. 12138-12148 [doi]

Viewpoint Invariant Dense Matching for Visual GeolocalizationGabriele Moreno Berton, Carlo Masone, Valerio Paolicelli, Barbara Caputo. 12149-12158 [doi]

Vision Transformers for Dense PredictionRené Ranftl, Alexey Bochkovskiy, Vladlen Koltun. 12159-12168 [doi]

Robustness via Cross-Domain EnsemblesTeresa Yeo, Oguzhan Fatih Kar, Amir Roshan Zamir. 12169-12179 [doi]

Vector Neurons: A General Framework for SO(3)-Equivariant NetworksCongyue Deng, Or Litany, Yueqi Duan, Adrien Poulenard, Andrea Tagliasacchi, Leonidas J. Guibas. 12180-12189 [doi]

Product Quantizer Aware Inverted Index for Scalable Nearest Neighbor SearchHae-Chan Noh, Taeho Kim, Jae-Pil Heo. 12190-12198 [doi]

Direct Differentiable Augmentation SearchAoming Liu, Zehao Huang, Zhiwu Huang, Naiyan Wang. 12199-12208 [doi]

Distilling Optimal Neural Networks: Rapid Search in Diverse SpacesBert Moons, Parham Noorzad, Andrii Skliar, Giovanni Mariani, Dushyant Mehta, Chris Lott, Tijmen Blankevoort. 12209-12218 [doi]

FairNAS: Rethinking Evaluation Fairness of Weight Sharing Neural Architecture SearchXiangxiang Chu, Bo Zhang 0046, Ruijun Xu. 12219-12228 [doi]

Homogeneous Architecture Augmentation for Neural PredictorYuqiao Liu 0002, Yehui Tang, Yanan Sun 0001. 12229-12238 [doi]

LeViT: a Vision Transformer in ConvNet's Clothing for Faster InferenceBenjamin Graham, Alaaeldin El-Nouby, Hugo Touvron, Pierre Stock, Armand Joulin, Hervé Jégou, Matthijs Douze. 12239-12249 [doi]

AutoFormer: Searching Transformers for Visual RecognitionMinghao Chen, Houwen Peng, Jianlong Fu, Haibin Ling. 12250-12260 [doi]

BossNAS: Exploring Hybrid CNN-transformers with Block-wisely Self-supervised Neural Architecture SearchChanglin Li, Tao Tang, Guangrun Wang, Jiefeng Peng, Bing Wang, Xiaodan Liang, Xiaojun Chang. 12261-12271 [doi]

Unifying Nonlocal Blocks for Neural NetworksLei Zhu, Qi She, Duo Li, Yanye Lu, Xuejing Kang, Jie Hu 0019, Changhu Wang. 12272-12281 [doi]

Adaptive Convolutions with Per-pixel Dynamic Filter AtomZe Wang, Zichen Miao, Jun Hu, Qiang Qiu. 12282-12291 [doi]

Learning Latent Architectural Distribution in Differentiable Neural Architecture Search via Variational Information MaximizationYaoming Wang, Yuchen Liu, Wenrui Dai, Chenglin Li, Junni Zou, Hongkai Xiong. 12292-12301 [doi]

AdvRush: Searching for Adversarially Robust Neural ArchitecturesJisoo Mok, Byunggook Na, Hyeokjun Choe, Sungroh Yoon. 12302-12312 [doi]

Orthogonal Projection LossKanchana Ranasinghe, Muzammal Naseer, Munawar Hayat, Salman H. Khan 0001, Fahad Shahbaz Khan. 12313-12323 [doi]

One-pass Multi-view Clustering for Large-scale DataJiyuan Liu 0003, Xinwang Liu, Yuexiang Yang, Li Liu, Siqi Wang 0001, Weixuan Liang, Jiangyong Shi. 12324-12333 [doi]

Pi-NAS: Improving Neural Architecture Search by Reducing Supernet Training Consistency ShiftJiefeng Peng, Jiqi Zhang, Changlin Li, Guangrun Wang, Xiaodan Liang, Liang Lin. 12334-12344 [doi]

Gravity-Aware Monocular 3D Human-Object ReconstructionRishabh Dabral, Soshi Shimada, Arjun Jain, Christian Theobalt, Vladislav Golyanik. 12345-12354 [doi]

Uncertainty-Aware Human Mesh Recovery from Video by Learning Part-Based 3D DynamicsGun Hee Lee, Seong-Whan Lee. 12355-12364 [doi]

EventHands: Real-Time Neural 3D Hand Pose Estimation from an Event StreamViktor Rudnev, Vladislav Golyanik, Jiayi Wang, Hans-Peter Seidel, Franziska Mueller 0001, Mohamed Elgharib, Christian Theobalt. 12365-12375 [doi]

SO-Pose: Exploiting Self-Occlusion for Direct 6D Pose EstimationYan Di, Fabian Manhardt, Gu Wang 0001, Xiangyang Ji, Nassir Navab, Federico Tombari. 12376-12385 [doi]

Single View Physical Distance Estimation using Human PoseXiaohan Fei, Henry Wang, Lin Lee Cheong, Xiangyu Zeng, Meng Wang, Joseph Tighe. 12386-12396 [doi]

Reconstructing Hand-Object Interactions in the WildZhe Cao, Ilija Radosavovic, Angjoo Kanazawa, Jitendra Malik. 12397-12406 [doi]

Structured Outdoor Architecture Reconstruction by Exploration and ClassificationFuyang Zhang, Xiang Xu, Nelson Nauata, Yasutaka Furukawa. 12407-12415 [doi]

Sat2Vid: Street-view Panoramic Video Synthesis from a Single Satellite ImageZuoyue Li, Zhenqiang Li, Zhaopeng Cui, Rongjun Qin, Marc Pollefeys, Martin R. Oswald. 12416-12425 [doi]

3DIAS: 3D Shape Reconstruction with Implicit Algebraic SurfacesMohsen Yavartanoo, Jaeyoung Chung, Reyhaneh Neshatavar, Kyoung Mu Lee. 12426-12435 [doi]

3DStyleNet: Creating 3D Shapes with Geometric and Texture Style VariationsKangxue Yin, Jun Gao, Maria Shugrina, Sameh Khamis, Sanja Fidler. 12436-12445 [doi]

Unsupervised Learning of Fine Structure Generation for 3D Point Clouds by 2D Projection MatchingChao Chen, Zhizhong Han, Yu-Shen Liu, Matthias Zwicker. 12446-12457 [doi]

CSG-Stump: A Learning Friendly CSG-Like Representation for Interpretable Shape ParsingDaxuan Ren, Jianmin Zheng, Jianfei Cai 0001, Jiatong Li, Haiyong Jiang, Zhongang Cai, Junzhe Zhang, Liang Pan, Mingyuan Zhang, Haiyu Zhao, Shuai Yi. 12458-12467 [doi]

ME-PCN: Point Completion Conditioned on Mask EmptinessBingchen Gong, Yinyu Nie, Yiqun Lin, Xiaoguang Han, Yizhou Yu. 12468-12477 [doi]

PoinTr: Diverse Point Cloud Completion with Geometry-Aware TransformersXumin Yu, Yongming Rao, Ziyi Wang, Zuyan Liu, Jiwen Lu, Jie Zhou 0001. 12478-12487 [doi]

RFNet: Recurrent Forward Network for Dense Point Cloud CompletionTianxin Huang, Hao Zou, Jinhao Cui, Xuemeng Yang, Mengmeng Wang, Xiangrui Zhao, Jiangning Zhang, Yi Yuan, Yifan Xu, Yong Liu 0007. 12488-12497 [doi]

SLIDE: Single Image 3D Photography with Soft Layering and Depth-aware InpaintingVarun Jampani, Huiwen Chang, Kyle Sargent, Abhishek Kar, Richard Tucker 0001, Michael Krainin, Dominik Kaeser, William T. Freeman, David Salesin, Brian Curless, Ce Liu. 12498-12507 [doi]

Worldsheet: Wrapping the World in a 3D Sheet for View Synthesis from a Single ImageRonghang Hu, Nikhila Ravi, Alexander C. Berg, Deepak Pathak. 12508-12517 [doi]

Learning Indoor Inverse Rendering with 3D Spatially-Varying LightingZian Wang, Jonah Philion, Sanja Fidler, Jan Kautz. 12518-12527 [doi]

3D Building Reconstruction from Monocular Remote Sensing ImagesWeijia Li, Lingxuan Meng, Jinwang Wang, Conghui He, Gui-Song Xia, Dahua Lin. 12528-12537 [doi]

In-the-Wild Single Camera 3D Reconstruction Through Moving Water SurfacesJinhui Xiong, Wolfgang Heidrich. 12538-12547 [doi]

RetrievalFuse: Neural 3D Scene Reconstruction with a DatabaseYawar Siddiqui, Justus Thies, Fangchang Ma, Qi Shan, Matthias Nießner, Angela Dai. 12548-12557 [doi]

MINE: Towards Continuous Depth MPI with NeRF for Novel View SynthesisJiaxin Li, Zijian Feng, Qi She, Henghui Ding, Changhu Wang, Gim Hee Lee. 12558-12568 [doi]

Patch2CAD: Patchwise Embedding Learning for In-the-Wild Shape Retrieval from a Single ImageWeicheng Kuo, Anelia Angelova, Tsung-Yi Lin, Angela Dai. 12569-12579 [doi]

Toward Realistic Single-View 3D Object Reconstruction with Unsupervised Learning from Multiple ImagesLong-Nhat Ho, Anh-Tuan Tran, Quynh Phung, Minh Hoai. 12580-12590 [doi]

Geometric Deep Neural Network using Rigid and Non-Rigid Transformations for Human Action RecognitionRasha Friji, Hassen Drira, Faten Chaieb, Hamza Kchok, Sebastian Kurtek. 12591-12600 [doi]

Bridging Unsupervised and Supervised Depth from Focus via All-in-Focus SupervisionNing-Hsu Wang, Ren Wang, Yu-Lun Liu, Yu-Hao Huang, Yu-Lin Chang, Chia-Ping Chen, Kevin Jou. 12601-12611 [doi]

DeepPanoContext: Panoramic 3D Scene Understanding with Holistic Scene Context Graph and Relation-based OptimizationCheng Zhang, Zhaopeng Cui, Cai Chen, Shuaicheng Liu, Bing Zeng, Hujun Bao, Yinda Zhang 0001. 12612-12621 [doi]

Fine-grained Semantics-aware Representation Enhancement for Self-supervised Monocular Depth EstimationHyunyoung Jung, Eunhyeok Park, Sungjoo Yoo. 12622-12632 [doi]

Deep Implicit Surface Point Prediction NetworksRahul Venkatesh, Tejan Karmali, Sarthak Sharma, Aurobrata Ghosh, R. Venkatesh Babu, László A. Jeni, Maneesh Singh 0001. 12633-12642 [doi]

StructDepth: Leveraging the structural regularities for self-supervised indoor depth estimationBoying Li, Yuan Huang, Zeyu Liu, Danping Zou, Wenxian Yu. 12643-12653 [doi]

Learning Anchored Unsigned Distance Functions with Gradient Direction Alignment for Single-view Garment ReconstructionFang Zhao 0006, Wenhao Wang, ShengCai Liao, Ling Shao 0001. 12654-12663 [doi]

NeRD: Neural Reflectance Decomposition from Image CollectionsMark Boss, Raphael Braun, Varun Jampani, Jonathan T. Barron, Ce Liu, Hendrik P. A. Lensch. 12664-12674 [doi]

NPMs: Neural Parametric Models for 3D Deformable ShapesPablo R. Palafox, Aljaz Bozic, Justus Thies, Matthias Nießner, Angela Dai. 12675-12685 [doi]

4DComplete: Non-Rigid Motion Estimation Beyond the Observable SurfaceYang Li, Hikari Takehara, Takafumi Taketomi, Bo Zheng, Matthias Nießner. 12686-12696 [doi]

Holistic Pose Graph: Modeling Geometric Structure among Objects in a Scene using Graph Inference for 3D Object PredictionJiwei Xiao, Ruiping Wang 0001, Xilin Chen 0001. 12697-12706 [doi]

Can Scale-Consistent Monocular Depth Be Learned in a Self-Supervised Scale-Invariant Manner?Lijun Wang, Yifan Wang, Linzhao Wang, Yunlong Zhan, Ying Wang, Huchuan Lu. 12707-12716 [doi]

Self-supervised Monocular Depth Estimation for All Day Images using Domain SeparationLina Liu, Xibin Song, Mengmeng Wang, Yong Liu 0007, Liangjun Zhang. 12717-12726 [doi]

Unsupervised Depth Completion with Calibrated Backprojection LayersAlex Wong 0001, Stefano Soatto. 12727-12736 [doi]

PX-NET: Simple and Efficient Pixel-Wise Training of Photometric Stereo NetworksFotios Logothetis, Ignas Budvytis, Roberto Mecca, Roberto Cipolla. 12737-12746 [doi]

Boosting Monocular Depth Estimation with Lightweight 3D Point FusionLam Huynh, Phong Nguyen 0001, Jirí Matas, Esa Rahtu, Janne Heikkilä. 12747-12756 [doi]

R-MSFM: Recurrent Multi-Scale Feature Modulation for Monocular Depth EstimatingZhongkai Zhou, Xinnan Fan, Pengfei Shi, Yuanxue Xin. 12757-12766 [doi]

MonoIndoor: Towards Good Practice of Self-Supervised Monocular Depth Estimation for Indoor EnvironmentsPan Ji, Runze Li, Bir Bhanu, Yi Xu. 12767-12776 [doi]

DnD: Dense Depth Estimation in Crowded Dynamic Indoor ScenesDongki Jung, Jaehoon Choi, Yonghan Lee, Deokhwa Kim, Changick Kim, Dinesh Manocha, Donghwan Lee. 12777-12787 [doi]

Adaptive confidence thresholding for monocular depth estimationHyesong Choi, Hunsang Lee, Sunkyung Kim, Sunok Kim, Seungryong Kim, Kwanghoon Sohn, Dongbo Min. 12788-12798 [doi]

Towards High Fidelity Monocular Face Reconstruction with Rich Reflectance using Self-supervised Learning and Ray TracingAbdallah Dib, Cédric Thébault, Junghyun Ahn, Philippe Henri Gosselin, Christian Theobalt, Louis Chevallier. 12799-12809 [doi]

Sparse Needlets for Lighting Estimation with Spherical Transport LossFangneng Zhan, Changgong Zhang, Wenbo Hu, Shijian Lu, Feiying Ma, Xuansong Xie, Ling Shao 0001. 12810-12819 [doi]

SurfaceNet: Adversarial SVBRDF Estimation from a Single ImageGiuseppe Vecchio, Simone Palazzo, Concetto Spampinato. 12820-12828 [doi]

Adaptive Surface Normal Constraint for Depth EstimationXiaoxiao Long, Cheng Lin, Lingjie Liu, Wei Li 0200, Christian Theobalt, Ruigang Yang, Wenping Wang. 12829-12838 [doi]

VaPiD: A Rapid Vanishing Point Detector via Learned OptimizersShichen Liu, Yichao Zhou, Yajie Zhao. 12839-12848 [doi]

GyroFlow: Gyroscope-Guided Unsupervised Optical Flow LearningHaiPeng Li, Kunming Luo, Shuaicheng Liu. 12849-12858 [doi]

Towards Interpretable Deep Networks for Monocular Depth EstimationZunzhi You, Yi-Hsuan Tsai, Wei-chen Chiu, Guanbin Li. 12859-12868 [doi]

Hierarchical Memory Matching Network for Video Object SegmentationHongje Seong, Seoung Wug Oh, Joon-Young Lee, Seongwon Lee, Suhyeon Lee 0002, Euntai Kim. 12869-12878 [doi]

PIAP-DF: Pixel-Interested and Anti Person-Specific Facial Action Unit Detection Net with Discrete Feedback LearningYang Tang, Wangding Zeng, Dafei Zhao, Honggang Zhang. 12879-12888 [doi]

Context-Sensitive Temporal Feature Learning for Gait RecognitionXiaohu Huang, Duowang Zhu, Hao Wang, Xinggang Wang, Bo Yang, Botao He, Wenyu Liu 0001, Bin Feng 0001. 12889-12898 [doi]

DeepGaze IIE: Calibrated prediction in and out-of-domain for state-of-the-art saliency modelingAkis Linardos, Matthias Kümmerer, Ori Press, Matthias Bethge. 12899-12908 [doi]

I2UV-HandNet: Image-to-UV Prediction Network for Accurate and High-fidelity 3D Hand Mesh ModelingPing Chen, Yujin Chen, Dong Yang, Fangyin Wu, Qin Li, Qingpei Xia, Yong Tan. 12909-12918 [doi]

Mesh GraphormerKevin Lin, Lijuan Wang, Zicheng Liu 0001. 12919-12928 [doi]

CodeNeRF: Disentangled Neural Radiance Fields for Object CategoriesWonbong Jang, Lourdes Agapito. 12929-12938 [doi]

Non-Rigid Neural Radiance Fields: Reconstruction and Novel View Synthesis of a Dynamic Scene From Monocular VideoEdgar Tretschk, Ayush Tewari, Vladislav Golyanik, Michael Zollhöfer, Christoph Lassner, Christian Theobalt. 12939-12950 [doi]

THUNDR: Transformer-based 3D HUmaN Reconstruction with MarkersMihai Zanfir, Andrei Zanfir, Eduard Gabriel Bazavan, William T. Freeman, Rahul Sukthankar, Cristian Sminchisescu. 12951-12960 [doi]

Discovering 3D Parts from Image CollectionsChun-Han Yao, Wei-Chih Hung, Varun Jampani, Ming-Hsuan Yang 0001. 12961-12970 [doi]

Planar Surface Reconstruction from Sparse ViewsLinyi Jin, Shengyi Qian 0001, Andrew Owens, David F. Fouhey. 12971-12980 [doi]

A-SDF: Learning Disentangled Signed Distance Functions for Articulated Shape RepresentationJiteng Mu, Weichao Qiu, Adam Kortylewski, Alan L. Yuille, Nuno Vasconcelos, Xiaolong Wang. 12981-12991 [doi]

SIMstack: A Generative Shape and Instance Model for Unordered Object StacksZoe Landgraf, Raluca Scona, Tristan Laidlow, Stephen James, Stefan Leutenegger, Andrew J. Davison. 12992-13002 [doi]

Sketch2Mesh: Reconstructing and Editing 3D Shapes from SketchesBenoît Guillard, Edoardo Remelli, Pierre Yvernay, Pascal Fua. 13003-13012 [doi]

Encoder-decoder with Multi-level Attention for 3D Human Shape and Pose EstimationZiniu Wan, Zhengjia Li, Maoqing Tian, Jianbo Liu, Shuai Yi, Hongsheng Li 0001. 13013-13022 [doi]

Object Tracking by Jointly Exploiting Frame and Event DomainJiqing Zhang, Xin Yang 0011, Yingkai Fu, Xiaopeng Wei, Baocai Yin, Bo Dong. 13023-13032 [doi]

Learning an Augmented RGB Representation with Cross-Modal Knowledge Distillation for Action DetectionRui Dai, Srijan Das, François Brémond. 13033-13044 [doi]

Learning Self-Similarity in Space and Time as Generalized Motion for Video Action RecognitionHeeseung Kwon, Manjin Kim, Suha Kwak, Minsu Cho. 13045-13055 [doi]

Motion Guided Attention Fusion to Recognize Interactions from VideosTae Soo Kim 0001, Jonathan D. Jones, Gregory D. Hager. 13056-13066 [doi]

Multiresolution Deep Implicit Functions for 3D Shape RepresentationZhang Chen, Yinda Zhang 0001, Kyle Genova, Sean Ryan Fanello, Sofien Bouaziz, Christian Häne, Ruofei Du, Cem Keskin, Thomas A. Funkhouser, Danhang Tang. 13067-13076 [doi]

Geometric Granularity Aware Pixel-to-MeshYue Shi, Bingbing Ni, Jinxian Liu, Dingyi Rong, Ye Qian, Wenjun Zhang 0001. 13077-13086 [doi]

Efficient and Differentiable Shadow Computation for Inverse ProblemsLinjie Lyu, Marc Habermann, Lingjie Liu, Mallikarjun B. R. 0001, Ayush Tewari, Christian Theobalt. 13087-13096 [doi]

Motion Basis Learning for Unsupervised Deep Homography Estimation with Subspace ProjectionNianjin Ye, Chuan Wang 0001, Haoqiang Fan, Shuaicheng Liu. 13097-13105 [doi]

SLIM: Self-Supervised LiDAR Scene Flow and Motion SegmentationStefan Andreas Baur, David Josef Emmerichs, Frank Moosmann, Peter Pinggera, Björn Ommer, Andreas Geiger 0001. 13106-13116 [doi]

Estimating and Exploiting the Aleatoric Uncertainty in Surface Normal EstimationGwangbin Bae, Ignas Budvytis, Roberto Cipolla. 13117-13126 [doi]

On Exposing the Challenging Long Tail in Future Prediction of Traffic ActorsOsama Makansi, Özgün Çiçek, Yassine Marrakchi, Thomas Brox. 13127-13137 [doi]

MG-GAN: A Multi-Generator Model Preventing Out-of-Distribution Samples in Pedestrian Trajectory PredictionPatrick Dendorfer, Sven Elflein, Laura Leal-Taixé. 13138-13147 [doi]

Unlimited Neighborhood Interaction for Heterogeneous Trajectory PredictionFang Zheng, Le Wang 0003, Sanping Zhou, Wei Tang, Zhenxing Niu, Nanning Zheng 0001, Gang Hua 0001. 13148-13157 [doi]

MEDIRL: Predicting the Visual Attention of Drivers via Maximum Entropy Deep Inverse Reinforcement LearningSonia Baee, Erfan Pakdamanian, Inki Kim, Lu Feng 0001, Vicente Ordonez, Laura E. Barnes. 13158-13168 [doi]

Voxel-based Network for Shape Completion by Leveraging Edge GenerationXiaogang Wang, Marcelo H. Ang, Gim Hee Lee. 13169-13178 [doi]

Box-Aware Feature Enhancement for Single Object Tracking on Point CloudsChaoda Zheng, Xu Yan 0014, Jiantao Gao, Weibing Zhao, Wei Zhang, Zhen Li 0026, Shuguang Cui. 13179-13188 [doi]

CAPTRA: CAtegory-level Pose Tracking for Rigid and Articulated Objects from Point CloudsYijia Weng, He Wang 0010, Qiang Zhou, Yuzhe Qin, Yueqi Duan, Qingnan Fan, Baoquan Chen, Hao Su 0001, Leonidas J. Guibas. 13189-13198 [doi]

A General Recurrent Tracking Framework without Real DataShuai Wang 0027, Hao Sheng 0001, Yang Zhang 0032, Yubin Wu, Zhang Xiong 0001. 13199-13208 [doi]

PCAM: Product of Cross-Attention Matrices for Rigid Registration of Point CloudsAnh-Quan Cao, Gilles Puy, Alexandre Boulch, Renaud Marlet. 13209-13218 [doi]

M3D-VTON: A Monocular-to-3D Virtual Try-On NetworkFuwei Zhao, Zhenyu Xie, Michael Kampffmeyer, Haoye Dong, Songfang Han, Tianxiang Zheng, Tao Zhang, Xiaodan Liang. 13219-13229 [doi]

Three Steps to Multimodal Trajectory Prediction: Modality Clustering, Classification and SynthesisJianhua Sun 0003, Yuxuan Li, Haoshu Fang, Cewu Lu. 13230-13239 [doi]

Square Root Marginalization for Sliding-Window Bundle AdjustmentNikolaus Demmel, David Schubert, Christiane Sommer, Daniel Cremers, Vladyslav Usenko. 13240-13248 [doi]

Provably Approximated Point Cloud RegistrationIbrahim Jubran, Alaa Maalouf, Ron Kimmel, Dan Feldman. 13249-13258 [doi]

Likelihood-Based Diverse Sampling for Trajectory ForecastingYecheng Jason Ma, Jeevana Priya Inala, Dinesh Jayaraman, Osbert Bastani. 13259-13268 [doi]

Self-Supervised 3D Face Reconstruction via Conditional EstimationYanDong Wen, Weiyang Liu, Bhiksha Raj, Rita Singh. 13269-13278 [doi]

Motion Prediction using Trajectory CuesZhenguang Liu, Pengxiang Su, Shuang Wu 0002, Xuanjing Shen, Haipeng Chen 0002, Yanbin Hao, Meng Wang 0001. 13279-13288 [doi]

Generating Smooth Pose Sequences for Diverse Human Motion PredictionWei Mao, Miaomiao Liu, Mathieu Salzmann. 13289-13298 [doi]

Spatially Conditioned Graphs for Detecting Human-Object InteractionsFrederic Z. Zhang, Dylan Campbell, Stephen Gould. 13299-13307 [doi]

Self-supervised 3D Skeleton Action Representation Learning with Motion Consistency and ContinuityYukun Su, Guosheng Lin, Qingyao Wu. 13308-13318 [doi]

Learn to Match: Automatic Matching Network Design for Visual TrackingZhipeng Zhang, Yihao Liu, Xiao Wang, Bing Li 0001, Weiming Hu. 13319-13328 [doi]

Evidential Deep Learning for Open Set Action RecognitionWentao Bao, Qi Yu 0001, Yu Kong. 13329-13338 [doi]

Channel-wise Topology Refinement Graph Convolution for Skeleton-Based Action RecognitionYuxin Chen, Ziqi Zhang, Chunfeng Yuan, Bing Li 0001, Ying Deng, Weiming Hu. 13339-13348 [doi]

Consistency-Aware Graph Network for Human Interaction UnderstandingZhenhua Wang 0003, Jiajun Meng, Dongyan Guo, Jianhua Zhang 0002, Qinfeng (Javen) Shi, Shengyong Chen. 13349-13358 [doi]

GeomNet: A Neural Network Based on Riemannian Geometries of SPD Matrix Space and Cholesky Space for 3D Skeleton-Based Interaction RecognitionXuan Son Nguyen. 13359-13369 [doi]

TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the WildVida Adeli, Mahsa Ehsanpour, Ian D. Reid 0001, Juan Carlos Niebles, Silvio Savarese, Ehsan Adeli 0001, Hamid Rezatofighi. 13370-13380 [doi]

AI Choreographer: Music Conditioned 3D Dance Generation with AIST++Ruilong Li, Shan Yang, David A. Ross, Angjoo Kanazawa. 13381-13392 [doi]

AdaSGN: Adapting Joint Number and Model Size for Efficient Skeleton-Based Action RecognitionLei Shi 0018, Yifan Zhang 0001, Jian Cheng 0001, Hanqing Lu. 13393-13402 [doi]

Skeleton Cloud Colorization for Unsupervised 3D Action Representation LearningSiyuan Yang, Jun Liu 0036, Shijian Lu, Meng Hwa Er, Alex C. Kot. 13403-13413 [doi]

Else-Net: Elastic Semantic Network for Continual Action Recognition from Skeleton DataTianjiao Li, Qiuhong Ke, Hossein Rahmani, Rui En Ho, Henghui Ding, Jun Liu 0036. 13414-13423 [doi]

Learning Target Candidate Association to Keep Track of What Not to TrackChristoph Mayer 0007, Martin Danelljan, Danda Pani Paudel, Luc Van Gool. 13424-13434 [doi]

Divide and Conquer for Single-frame Temporal Action LocalizationChen Ju, Peisen Zhao, Siheng Chen, Ya Zhang 0002, Yanfeng Wang, Qi Tian 0001. 13435-13444 [doi]

HAA500: Human-Centric Atomic Action Dataset with Curated VideosJihoon Chung, Cheng-hsin Wuu, Hsuan-ru Yang, Yu-Wing Tai, Chi-Keung Tang. 13445-13454 [doi]

Discovering Human Interactions with Large-Vocabulary Objects via Query and Multi-Scale DetectionSuchen Wang, Kim-Hui Yap, Henghui Ding, Jiyan Wu, Junsong Yuan, Yap-Peng Tan. 13455-13464 [doi]

Social Fabric: Tubelet Compositions for Video Relation DetectionShuo Chen 0010, Zenglin Shi, Pascal Mettes, Cees G. M. Snoek. 13465-13474 [doi]

The Spatio-Temporal Poisson Point Process: A Simple Model for the Alignment of Event Camera DataCheng Gu, Erik G. Learned-Miller, Daniel Sheldon, Guillermo Gallego 0002, Pia Bideau. 13475-13484 [doi]

Anticipative Video TransformerRohit Girdhar, Kristen Grauman. 13485-13495 [doi]

Enriching Local and Global Contexts for Temporal Action LocalizationZixin Zhu, Wei Tang, Le Wang 0003, Nanning Zheng 0001, Gang Hua 0001. 13496-13505 [doi]

Relaxed Transformer Decoders for Direct Action Proposal GenerationJing Tan, Jiaqi Tang, Limin Wang 0002, Gangshan Wu. 13506-13515 [doi]

MultiSports: A Multi-Person Video Dataset of Spatio-Temporally Localized Sports ActionsYixuan Li, Lei Chen, Runyu He, Zhenzhi Wang 0001, Gangshan Wu, Limin Wang 0002. 13516-13525 [doi]

Learning to Track Objects from Unlabeled VideosJilai Zheng, Chao Ma 0004, Houwen Peng, Xiaokang Yang. 13526-13535 [doi]

Generating Masks from Boxes by Mining Spatio-Temporal Consistencies in VideosBin Zhao, Goutam Bhat, Martin Danelljan, Luc Van Gool, Radu Timofte. 13536-13546 [doi]

Channel Augmented Joint Learning for Visible-Infrared RecognitionMang Ye, Weijian Ruan, Bo Du 0001, Mike Zheng Shou. 13547-13556 [doi]

VidTr: Video Transformer Without ConvolutionsYanyi Zhang, Xinyu Li, Chunhui Liu, Bing Shuai, Yi Zhu, Biagio Brattoli, Hao Chen, Ivan Marsic, Joseph Tighe. 13557-13567 [doi]

A Hybrid Video Anomaly Detection Framework via Memory-Augmented Flow Reconstruction and Flow-Guided Frame PredictionZhian Liu, Yongwei Nie, Chengjiang Long, Qing Zhang, Guiqing Li. 13568-13577 [doi]

Assignment-Space-based Multi-Object Tracking and SegmentationAnwesa Choudhuri, Girish Chowdhary 0001, Alexander G. Schwing. 13578-13587 [doi]

D2-Net: Weakly-Supervised Action Localization via Discriminative Embeddings and Denoised ActivationsSanath Narayan, Hisham Cholakkal, Munawar Hayat, Fahad Shahbaz Khan, Ming-Hsuan Yang 0001, Ling Shao 0001. 13588-13597 [doi]

Learning Cross-Modal Contrastive Features for Video Domain AdaptationDonghyun Kim, Yi-Hsuan Tsai, Bingbing Zhuang, Xiang Yu 0002, Stan Sclaroff, Kate Saenko, Manmohan Chandraker. 13598-13607 [doi]

Selective Feature Compression for Efficient Activity Recognition InferenceChunhui Liu, Xinyu Li, Hao Chen, Davide Modolo, Joseph Tighe. 13608-13617 [doi]

Elaborative Rehearsal for Zero-shot Action RecognitionShizhe Chen, Dong Huang. 13618-13627 [doi]

Learning Action Completeness from Points for Weakly-supervised Temporal Action LocalizationPilhyeon Lee, Hyeran Byun. 13628-13637 [doi]

Video Self-Stitching Graph Network for Temporal Action LocalizationChen Zhao, Ali K. Thabet, Bernard Ghanem. 13638-13647 [doi]

GroupFormer: Group Activity Recognition with Clustered Spatial-Temporal TransformerShuaicheng Li, Qianggang Cao, Lingbo Liu, Kunlin Yang, Shinan Liu, Jun Hou, Shuai Yi. 13648-13657 [doi]

Multi-Modal Multi-Action Video RecognitionZhensheng Shi, Ju Liang, Qianqian Li, Haiyong Zheng, Zhaorui Gu, Junyu Dong, Bing Zheng. 13658-13667 [doi]

Target Adaptive Context Aggregation for Video Scene Graph GenerationYao Teng, Limin Wang 0002, Zhifeng Li, Gangshan Wu. 13668-13677 [doi]

Class-Incremental Learning for Action Recognition in VideosJaeyoo Park, Minsoo Kang, Bohyung Han. 13678-13687 [doi]

TAM: Temporal Adaptive Module for Video RecognitionZhaoyang Liu, Limin Wang 0002, Wayne Wu, Chen Qian 0006, Tong Lu. 13688-13698 [doi]

Efficient Action Recognition via Dynamic Knowledge PropagationHanul Kim, Mihir Jain, Jun-Tae Lee, Sungrack Yun, Fatih Porikli. 13699-13708 [doi]

CAG-QIL: Context-Aware Actionness Grouping via Q Imitation Learning for Online Temporal Action LocalizationHyolim Kang, Kyungmin Kim, Yumin Ko, Seon Joo Kim. 13709-13718 [doi]

Class Semantics-based Attention for Action DetectionDeepak Sridhar, Niamul Quader, Srikanth Muralidharan, Yaoxin Li, Peng Dai, Juwei Lu. 13719-13728 [doi]

Image Synthesis via Semantic CompositionYi Wang, Lu Qi, Ying-Cong Chen, Xiangyu Zhang 0005, Jiaya Jia. 13729-13738 [doi]

PIRenderer: Controllable Portrait Image Generation via Semantic Neural RenderingYurui Ren, Ge Li 0002, Yuanqi Chen, Thomas H. Li, Shan Liu 0001. 13739-13748 [doi]

Image Shape Manipulation from a Single Augmented Training SampleYael Vinker, Eliahu Horwitz, Nir Zabari, Yedid Hoshen. 13749-13758 [doi]

Learning Object-Compositional Neural Radiance Field for Editable Scene RenderingBangbang Yang, Yinda Zhang 0001, Yinghao Xu, Yijin Li, Han Zhou, Hujun Bao, Guofeng Zhang 0001, Zhaopeng Cui. 13759-13768 [doi]

A Latent Transformer for Disentangled Face Editing in Images and VideosXu Yao, Alasdair Newson, Yann Gousseau, Pierre Hellier. 13769-13778 [doi]

Talk-to-Edit: Fine-Grained Facial Editing via DialogYuming Jiang 0003, Ziqi Huang, Xingang Pan, Chen Change Loy, Ziwei Liu 0002. 13779-13788 [doi]

FashionMirror: Co-attention Feature-remapping Virtual Try-on with Sequential Template PosesChieh-Yun Chen, Ling Lo, Pin-Jui Huang, Hong-Han Shuai, Wen-Huang Cheng. 13789-13798 [doi]

Image Synthesis from Layout with Locality-Aware Mask AdaptionZejian Li, Jingyu Wu, Immanuel Koh, Yongchuan Tang, Lingyun Sun. 13799-13808 [doi]

Learned Spatial Representations for Few-shot Talking-Head SynthesisMoustafa Meshry, Saksham Suri, Larry S. Davis, Abhinav Shrivastava. 13809-13818 [doi]

Motion-Aware Dynamic Architecture for Efficient Frame InterpolationMyungsub Choi, Suyoung Lee, Heewon Kim, Kyoung Mu Lee. 13819-13828 [doi]

3D Human Texture Estimation from a Single Image with TransformersXiangyu Xu, Chen Change Loy. 13829-13838 [doi]

Structure-transformed Texture-enhanced Network for Person Image SynthesisMunan Xu, Yuanqi Chen, Shan Liu 0001, Thomas H. Li, Ge Li 0002. 13839-13848 [doi]

Learning to Stylize Novel ViewsHsin-Ping Huang, Hung-Yu Tseng, Saurabh Saini, Maneesh Singh 0001, Ming-Hsuan Yang 0001. 13849-13858 [doi]

Learning Generative Models of Textured 3D Meshes from Real-World ImagesDario Pavllo, Jonas Kohler, Thomas Hofmann, Aurélien Lucchi. 13859-13869 [doi]

VariTex: Variational Neural Face TexturesMarcel C. Bühler, Abhimitra Meka, Gengyan Li, Thabo Beeler, Otmar Hilliges. 13870-13879 [doi]

Multiple Heads are Better than One: Few-shot Font Generation with Multiple Localized ExpertsSong Park, Sanghyuk Chun, Junbum Cha, Bado Lee, Hyunjung Shim. 13880-13889 [doi]

From Continuity to Editability: Inverting GANs with Consecutive ImagesYangyang Xu, Yong Du 0003, Wenpeng Xiao, Xuemiao Xu, Shengfeng He. 13890-13898 [doi]

Focal Frequency Loss for Image Reconstruction and SynthesisLiming Jiang, Bo Dai, Wayne Wu, Chen Change Loy. 13899-13909 [doi]

Frequency Domain Image Translation: More Photo-realistic, Better Identity-preservingMu Cai, Hong Zhang, Huijuan Huang, Qichuan Geng, Yixuan Li, Gao Huang. 13910-13920 [doi]

GAN Inversion for Out-of-Range Images with Geometric TransformationsKyoungkook Kang, Seongtae Kim, Sunghyun Cho. 13921-13929 [doi]

Detail Me More: Improving GAN's photo-realism of complex scenesRaghudeep Gadde, Qianli Feng, Aleix M. Martínez. 13930-13939 [doi]

DAE-GAN: Dynamic Aspect-aware GAN for Text-to-Image SynthesisShulan Ruan, Yong Zhang 0034, Kun Zhang, Yanbo Fan, Fan Tang, Qi Liu 0003, Enhong Chen. 13940-13949 [doi]

Labels4Free: Unsupervised Segmentation using StyleGANRameen Abdal, Peihao Zhu, Niloy J. Mitra, Peter Wonka. 13950-13959 [doi]

Diagonal Attention and Style-based GAN for Content-Style Disentanglement in Image Generation and TranslationGihyun Kwon, Jong Chul Ye. 13960-13969 [doi]

Learning High-Fidelity Face Texture Completion without Complete Face TextureJongyoo Kim, Jiaolong Yang, Xin Tong. 13970-13979 [doi]

Deep Halftoning with Reversible Binary PatternMenghan Xia, Wenbo Hu, Xueting Liu, Tien-Tsin Wong. 13980-13989 [doi]

TransferI2I: Transfer Learning for Image-to-Image Translation from Small DatasetsYaxing Wang, Héctor Laria Mantecon, Joost van de Weijer 0001, Laura Lopez-Fuentes, Bogdan C. Raducanu. 13990-13999 [doi]

Instance-wise Hard Negative Example Generation for Contrastive Learning in Unpaired Image-to-Image TranslationWeilun Wang, Wengang Zhou, Jianmin Bao, Dong Chen 0003, Houqiang Li. 14000-14009 [doi]

Multi-Scale Separable Network for Ultra-High-Definition Video DeblurringSenyou Deng, Wenqi Ren, Yanyang Yan, Tao Wang, Fenglong Song, Xiaochun Cao. 14010-14019 [doi]

FuseFormer: Fusing Fine-Grained Information in Transformers for Video InpaintingRui Liu 0019, Hanming Deng, Yangyi Huang, Xiaoyu Shi, Lewei Lu, Wenxiu Sun, Xiaogang Wang 0001, Jifeng Dai, Hongsheng Li 0001. 14020-14029 [doi]

Sketch Your Own GANSheng-yu Wang, David Bau, Jun-Yan Zhu. 14030-14040 [doi]

Omni-GAN: On the Secrets of cGANs and BeyondPeng Zhou, Lingxi Xie, Bingbing Ni, Cong Geng, Qi Tian 0001. 14041-14051 [doi]

GANcraft: Unsupervised 3D Neural Rendering of Minecraft WorldsZekun Hao, Arun Mallya, Serge J. Belongie, Ming-Yu Liu 0001. 14052-14062 [doi]

GAN-Control: Explicitly Controllable GANsAlon Shoshan, Nadav Bhonker, Igor Kviatkovsky, Gérard G. Medioni. 14063-14073 [doi]

Towards Discovery and Attribution of Open-world GAN Generated ImagesSharath Girish, Saksham Suri, Sai Saketh Rambhatla, Abhinav Shrivastava. 14074-14083 [doi]

PixelSynth: Generating a 3D-Consistent Experience from a Single ImageChris Rockwell, David F. Fouhey, Justin Johnson 0001. 14084-14093 [doi]

WaveFill: A Wavelet-based Generation Network for Image InpaintingYingchen Yu, Fangneng Zhan, Shijian Lu, Jianxiong Pan, Feiying Ma, Xuansong Xie, Chunyan Miao. 14094-14103 [doi]

MVSNeRF: Fast Generalizable Radiance Field Reconstruction from Multi-View StereoAnpei Chen, Zexiang Xu, Fuqiang Zhao, Xiaoshuai Zhang, Fanbo Xiang, Jingyi Yu, Hao Su 0001. 14104-14113 [doi]

Image Inpainting via Conditional Texture and Structure Dual GenerationXiefan Guo, Hongyu Yang, Di Huang 0001. 14114-14123 [doi]

Aligning Latent and Image Spaces to Connect the UnconnectableIvan Skorokhodov, Grigorii Sotnikov, Mohamed Elhoseiny. 14124-14133 [doi]

Rethinking the Truly Unsupervised Image-to-Image TranslationKyungjune Baek, Yunjey Choi, Youngjung Uh, Jaejun Yoo, Hyunjung Shim. 14134-14143 [doi]

CR-Fill: Generative Image Inpainting with Auxiliary Contextual ReconstructionYu Zeng, Zhe Lin 0001, Huchuan Lu, Vishal M. Patel. 14144-14153 [doi]

Unaligned Image-to-Image Translation by Learning to ReweightShaoan Xie, Mingming Gong, Yanwu Xu 0001, Kun Zhang 0001. 14154-14164 [doi]

Image Manipulation Detection by Multi-View Multi-Scale SupervisionXinru Chen, Chengbo Dong, Jiaqi Ji, Juan Cao, Xirong Li 0001. 14165-14173 [doi]

From Two to One: A New Scene Text Recognizer with Visual Language Modeling NetworkYuxin Wang, Hongtao Xie, Shancheng Fang, Jing Wang, Shenggao Zhu, Yongdong Zhang 0001. 14174-14183 [doi]

Neural Strokes: Stylized Line Drawing of 3D ShapesDifan Liu, Matthew Fisher, Aaron Hertzmann, Evangelos Kalogerakis. 14184-14193 [doi]

Modulated Periodic Activations for Generalizable Local Functional RepresentationsIshit Mehta, Michaël Gharbi, Connelly Barnes, Eli Shechtman, Ravi Ramamoorthi, Manmohan Chandraker. 14194-14203 [doi]

SIGNET: Efficient Neural Representation for Light FieldsBrandon Yushan Feng, Amitabh Varshney. 14204-14213 [doi]

Searching for Controllable Image Restoration NetworksHeewon Kim, Sungyong Baik, Myungsub Choi, Janghoon Choi, Kyoung Mu Lee. 14214-14223 [doi]

Cortical Surface Shape Analysis Based on Alexandrov PolyhedraMin Zhang, Yang Guo, Na Lei, Zhou Zhao, Jianfeng Wu, Xiaoyin Xu, Yalin Wang 0001, Xianfeng Gu. 14224-14232 [doi]

Toward Spatially Unbiased Generative ModelsJooyoung Choi, Jungbeom Lee, Yonghyun Jeong, Sungroh Yoon. 14233-14242 [doi]

LatentCLR: A Contrastive Learning Approach for Unsupervised Discovery of Interpretable DirectionsOguz Kaan Yüksel, Enis Simsar, Ezgi Gülperi Er, Pinar Yanardag. 14243-14252 [doi]

Semantically Robust Unpaired Image Translation for Data with Unmatched Semantics StatisticsZhiwei Jia, Bodi Yuan, Kangkang Wang, Hong Wu, David Clifford, Zhiqiang Yuan, Hao Su 0001. 14253-14263 [doi]

Unsupervised Image Generation with Infinite Generative Adversarial NetworksHui-ying, He Wang 0002, Tianjia Shao, Yin Yang 0002, Kun Zhou 0001. 14264-14273 [doi]

Reality Transform Adversarial Generators for Image Splicing Forgery Detection and LocalizationXiuli Bi, Zhipeng Zhang, Bin Xiao 0002. 14274-14283 [doi]

Unconstrained Scene Generation with Locally Conditioned Radiance FieldsTerrance Devries, Miguel Ángel Bautista 0001, Nitish Srivastava, Graham W. Taylor, Joshua M. Susskind. 14284-14293 [doi]

Animatable Neural Radiance Fields for Modeling Dynamic Human BodiesSida Peng, Junting Dong, Qianqian Wang, Shangzhan Zhang, Qing Shuai, Xiaowei Zhou, Hujun Bao. 14294-14303 [doi]

Neural Radiance Flow for 4D View Synthesis and Video ProcessingYilun Du, Yinan Zhang, Hong-Xing Yu, Joshua B. Tenenbaum, Jiajun Wu 0001. 14304-14314 [doi]

KiloNeRF: Speeding up Neural Radiance Fields with Thousands of Tiny MLPsChristian Reiser, Songyou Peng, Yiyi Liao, Andreas Geiger 0001. 14315-14325 [doi]

FastNeRF: High-Fidelity Neural Rendering at 200FPSStephan J. Garbin, Marek Kowalski, Matthew Johnson 0003, Jamie Shotton, Julien P. C. Valentin. 14326-14335 [doi]

Geometry-Free View Synthesis: Transformers and no 3D PriorsRobin Rombach, Patrick Esser, Björn Ommer. 14336-14346 [doi]

ILVR: Conditioning Method for Denoising Diffusion Probabilistic ModelsJooyoung Choi, Sungwon Kim, Yonghyun Jeong, Youngjune Gwon, Sungroh Yoon. 14347-14356 [doi]

Towards Vivid and Diverse Image Colorization with Generative Color PriorYanze Wu, Xintao Wang, Yu Li, Honglun Zhang, Xun Zhao, Ying Shan. 14357-14366 [doi]

Physics-based Differentiable Depth Sensor SimulationBenjamin Planche, Rajat Vikram Singh. 14367-14377 [doi]

HeadGAN: One-shot Neural Head Synthesis and EditingMichail Christos Doukas, Stefanos Zafeiriou, Viktoriia Sharmanska. 14378-14387 [doi]

EigenGAN: Layer-Wise Eigen-Learning for GANsZhenliang He, Meina Kan, Shiguang Shan. 14388-14397 [doi]

Collaging Class-specific GANs for Semantic Image SynthesisYuheng Li, Yijun Li, Jingwan Lu, Eli Shechtman, Yong Jae Lee, Krishna Kumar Singh. 14398-14407 [doi]

Latent Transformations via NeuralODEs for GAN-based Image EditingValentin Khrulkov, Leyla Mirvakhabova, Ivan V. Oseledets, Artem Babenko. 14408-14417 [doi]

Dual Projection Generative Adversarial Networks for Conditional Image GenerationLigong Han, Martin Renqiang Min, Anastasis Stathopoulos, Yu Tian, Ruijiang Gao, Asim Kadav, Dimitris N. Metaxas. 14418-14427 [doi]

Artificial Fingerprinting for Generative Models: Rooting Deepfake Attribution in Training DataNing Yu, Vladislav Skripniuk, Sahar Abdelnabi, Mario Fritz. 14428-14437 [doi]

Infinite Nature: Perpetual View Generation of Natural Scenes from a Single ImageAndrew Liu, Ameesh Makadia, Richard Tucker 0001, Noah Snavely, Varun Jampani, Angjoo Kanazawa. 14438-14447 [doi]

Occlusion-Aware Video Object InpaintingLei Ke, Yu-Wing Tai, Chi-Keung Tang. 14448-14458 [doi]

ELF-VC: Efficient Learned Flexible-Rate Video CodingOren Rippel, Alexander G. Anderson, Kedar Tatwawadi, Sanjay Nair, Craig Lytle, Lubomir D. Bourdev. 14459-14468 [doi]

XVFI: eXtreme Video Frame InterpolationHyeonjun Sim, Jihyong Oh, Munchurl Kim. 14469-14478 [doi]

OSCAR-Net: Object-centric Scene Graph Attention for Image AttributionEric Nguyen, Tu Bui, Viswanathan (Vishy) Swaminathan, John P. Collomosse. 14479-14488 [doi]

Learning a Sketch Tensor Space for Image Inpainting of Man-made ScenesChenjie Cao, Yanwei Fu. 14489-14498 [doi]

Embedding Novel Views in a Single JPEG ImageYue Wu 0012, Guotao Meng, Qifeng Chen. 14499-14507 [doi]

EgoRenderer: Rendering Human Avatars from Egocentric Camera ImagesTao Hu, Kripasindhu Sarkar, Lingjie Liu, Matthias Zwicker, Christian Theobalt. 14508-14518 [doi]

Asymmetric Bilateral Motion Estimation for Video Frame InterpolationJunheum Park, Chul Lee, Chang-Su Kim 0001. 14519-14528 [doi]

STRIVE: Scene Text Replacement In VideosVijay Kumar B. G, Jeyasri Subramanian, Varnith Chordia, Eugene Bart, Shaobo Fang, Kelly Guan, Raja Bala. 14529-14538 [doi]

Parallel Multi-Resolution Fusion Network for Image InpaintingWentao Wang, Jianfu Zhang 0003, Li Niu, Haoyu Ling, Xue Yang, Liqing Zhang 0001. 14539-14548 [doi]

Towards Complete Scene and Regular Shape for Distortion Rectification by Curve-Aware ExtrapolationKang Liao, Chunyu Lin, Yunchao Wei, Feng Li, Shangrong Yang, Yao Zhao 0001. 14549-14558 [doi]

Internal Video Inpainting by Implicit Long-range PropagationHao Ouyang, Tengfei Wang 0002, Qifeng Chen. 14559-14568 [doi]

Training Weakly Supervised Video Frame Interpolation with EventsZhiyang Yu, Yu Zhang, Deyuan Liu, Dongqing Zou, Xijun Chen, Yebin Liu, Jimmy S. Ren. 14569-14578 [doi]

Flow-Guided Video Inpainting with Scene TemplatesDong Lao, Peihao Zhu, Peter Wonka, Ganesh Sundaramoorthi. 14579-14588 [doi]

Domain-Aware Universal Style TransferKibeom Hong, Seogkyu Jeon, Huan Yang 0005, Jianlong Fu, Hyeran Byun. 14589-14597 [doi]

StyleFormer: Real-time Arbitrary Style Transfer via Parametric Style CompositionXiaolei Wu, Zhihao Hu, Lu Sheng, Dong Xu 0001. 14598-14607 [doi]

Bridging the Gap between Label- and Reference-based Synthesis in Multi-attribute Image-to-Image TranslationQiusheng Huang, Zhilin Zheng, Xueqi Hu, Li Sun, Qingli Li. 14608-14617 [doi]

Dressing in Order: Recurrent Person Image Generation for Pose Transfer, Virtual Try-on and Outfit EditingAiyu Cui, Daniel McKee, Svetlana Lazebnik. 14618-14627 [doi]

Gait Recognition via Effective Global-Local Feature Representation and Local Temporal AggregationBeibei Lin, Shunli Zhang, Xin Yu 0002. 14628-14636 [doi]

Unpaired Learning for High Dynamic Range Image Tone MappingYael Vinker, Inbar Huberman-Spiegelglas, Raanan Fattal. 14637-14646 [doi]

Deep Edge-Aware Interactive Colorization against Color-Bleeding EffectsEungyeup Kim, Sanghyeon Lee, Jeonghoon Park, Somi Choi, Choonghyun Seo, Jaegul Choo. 14647-14656 [doi]

Neural Image Compression via Attentional Multi-scale Back Projection and Frequency DecompositionGe Gao, Pei-you, Rong Pan, Shunyuan Han, Yuanyuan Zhang, Yuchao Dai, Hojae Lee. 14657-14666 [doi]

Dynamic Cross Feature Fusion for Remote Sensing PansharpeningXiao Wu, Ting-Zhu Huang, Liang-Jian Deng, Tian-Jing Zhang. 14667-14676 [doi]

Attention-based Multi-Reference Learning for Image Super-ResolutionMarco Pesavento, Marco Volino, Adrian Hilton. 14677-14686 [doi]

iPOKE: Poking a Still Image for Controlled Stochastic Video SynthesisAndreas Blattmann, Timo Milbich, Michael Dorkenwald, Björn Ommer. 14687-14697 [doi]

Point-Based Modeling of Human ClothingIlya Zakharkin, Kirill Mazur, Artur Grigorev, Victor Lempitsky. 14698-14707 [doi]

SLAMP: Stochastic Latent Appearance and Motion PredictionAdil Kaan Akan, Erkut Erdem, Aykut Erdem, Fatma Güney. 14708-14717 [doi]

Pathdreamer: A World Model for Indoor NavigationJing Yu Koh, Honglak Lee, Yinfei Yang, Jason Baldridge, Peter Anderson. 14718-14728 [doi]

Click to Move: Controlling Video Generation with Sparse MotionPierfrancesco Ardino, Marco De Nadai, Bruno Lepri, Elisa Ricci 0001, Stéphane Lathuilière. 14729-14738 [doi]

Accelerating Atmospheric Turbulence Simulation via Learned Phase-to-Space TransformZhiyuan Mao, Nicholas Chimitt, Stanley H. Chan. 14739-14748 [doi]

Benchmarking Ultra-High-Definition Image Super-resolutionKaihao Zhang, Dongxu Li, Wenhan Luo, Wenqi Ren, Björn Stenger, Wei Liu 0005, Hongdong Li, Ming-Hsuan Yang 0001. 14749-14758 [doi]

Painting from PartDongsheng Guo, Haoru Zhao, Yunhao Cheng, Haiyong Zheng, Zhaorui Gu, Bing Zheng. 14759-14768 [doi]

Joint Audio-Visual Deepfake DetectionYipin Zhou, Ser-Nam Lim. 14780-14789 [doi]

DisUnknown: Distilling Unknown Factors for Disentanglement LearningSitao Xiang, Yuming Gu, Pengda Xiang, Menglei Chai, Hao Li 0015, Yajie Zhao, Mingming He. 14790-14799 [doi]

Membership Inference Attacks are Easier on Difficult ProblemsAvital Shafran, Shmuel Peleg, Yedid Hoshen. 14800-14809 [doi]

Understanding and Evaluating Racial Biases in Image CaptioningDora Zhao, Angelina Wang, Olga Russakovsky. 14810-14820 [doi]

Robust Watermarking for Deep Neural Networks via Bi-level OptimizationPeng Yang, Yingjie Lao, Ping Li 0001. 14821-14830 [doi]

Detection and Continual Learning of Novel Face Presentation AttacksMohammad Rostami, Leonidas Spinoulas, Mohamed E. Hussein 0001, Joe Mathai, Wael Abd-Almageed. 14831-14840 [doi]

Manifold Alignment for Semantically Aligned Style TransferJing Huo, Shiyin Jin, Wenbin Li 0006, Jing Wu 0004, Yu-Kun Lai, Yinghuan Shi, Yang Gao 0001. 14841-14849 [doi]

Image Harmonization with TransformerZonghui Guo, Dongsheng Guo, Haiyong Zheng, Zhaorui Gu, Bing Zheng, Junyu Dong. 14850-14859 [doi]

Diverse Image Style Transfer via Invertible Cross-Space MappingHaibo Chen, Lei Zhao, Huiming Zhang, Zhizhong Wang, Zhiwen Zuo, Ailin Li, Wei Xing, Dongming Lu. 14860-14869 [doi]

LocalTrans: A Multiscale Local Transformer Network for Cross-Resolution Homography EstimationRuizhi Shao, Gaochang Wu, Yuemei Zhou, Ying Fu, Lu Fang, Yebin Liu. 14870-14879 [doi]

SemIE: Semantically-aware Image ExtrapolationBholeshwar Khurana, Soumya Ranjan Dash, Abhishek Bhatia, Aniruddha Mahapatra, Hrituraj Singh, Kuldeep Kulkarni. 14880-14889 [doi]

Calibrating Concepts and Operations: Towards Symbolic Reasoning on Real ImagesZhuowan Li, Elias Stengel-Eskin, Yixiao Zhang, Cihang Xie, Quan Tran, Benjamin Van Durme, Alan L. Yuille. 14890-14899 [doi]

3D Local Convolutional Neural Networks for Gait RecognitionZhen Huang, Dixiu Xue, Xu Shen, Xinmei Tian 0001, Houqiang Li, Jianqiang Huang, Xian-Sheng Hua 0001. 14900-14909 [doi]

Learning Instance-level Spatial-Temporal Patterns for Person Re-identificationMin Ren, Lingxiao He, Xingyu Liao, Wu Liu, Yunlong Wang, Tieniu Tan. 14910-14919 [doi]

Joint Visual Semantic Reasoning: Multi-Stage Decoder for Text RecognitionAyan Kumar Bhunia, Aneeshan Sain, Amandeep Kumar, Shuvozit Ghose, Pinaki Nath Chowdhury, Yi-Zhe Song. 14920-14929 [doi]

Towards the Unseen: Iterative Text Recognition by Distilling from ErrorsAyan Kumar Bhunia, Pinaki Nath Chowdhury, Aneeshan Sain, Yi-Zhe Song. 14930-14939 [doi]

ICE: Inter-instance Contrastive Encoding for Unsupervised Person Re-identificationHao Chen, Benoit Lagadec, François Brémond. 14940-14949 [doi]

Discover the Unknown Biased Attribute of an Image ClassifierZhiheng Li, Chenliang Xu. 14950-14959 [doi]

Understanding and Mitigating Annotation Bias in Facial Expression RecognitionYunliang Chen, Jungseock Joo. 14960-14971 [doi]

BiaSwap: Removing Dataset Bias with Bias-Tailored Swapping AugmentationEungyeup Kim, Jihyeon Lee, Jaegul Choo. 14972-14981 [doi]

Learning Bias-Invariant Representation by Cross-Sample Mutual Information MinimizationWei Zhu 0015, Haitian Zheng, Haofu Liao, Weijian Li, Jiebo Luo. 14982-14992 [doi]

TransReID: Transformer-based Object Re-IdentificationShuting He, Hao Luo 0004, Pichao Wang, Fan Wang, Hao Li 0030, Wei Jiang 0009. 14993-15002 [doi]

Learning Self-Consistency for Deepfake DetectionTianchen Zhao, Xiang Xu, Mingze Xu, Hui Ding, Yuanjun Xiong, Wei Xia. 15003-15013 [doi]

Self-supervised Domain Adaptation for Forgery Localization of JPEG Compressed ImagesYuan Rao, Jiangqun Ni. 15014-15023 [doi]

Exploring Temporal Coherence for More General Video Face Forgery DetectionYinglin Zheng, Jianmin Bao, Dong Chen 0003, Ming Zeng, Fang Wen. 15024-15034 [doi]

TransForensics: Image Forgery Localization with Dense Self-AttentionJing Hao, Zhixin Zhang, Shicai Yang, Di Xie, Shiliang Pu. 15035-15044 [doi]

Adaptive Label Noise Cleaning with Meta-Supervision for Deep Face RecognitionYaobin Zhang, Weihong Deng, Yaoyao Zhong, Jiani Hu, Xian Li, Dongyue Zhao, Dongchao Wen. 15045-15055 [doi]

Ensemble Attention Distillation for Privacy-Preserving Federated LearningXuan Gong, Abhishek Sharma, Srikrishna Karanam, Ziyan Wu, Terrence Chen, David S. Doermann, Arun Innanje. 15056-15066 [doi]

PASS: Protected Attribute Suppression System for Mitigating Bias in Face RecognitionPrithviraj Dhar, Joshua Gleason, Aniket Roy, Carlos Domingo Castillo, Rama Chellappa. 15067-15076 [doi]

Multi-Expert Adversarial Attack Detection in Person Re-identification Using Context InconsistencyXueping Wang, Shasha Li, Min Liu 0008, Yaonan Wang, Amit K. Roy Chowdhury. 15077-15087 [doi]

ID-Reveal: Identity-aware DeepFake Video DetectionDavide Cozzolino, Andreas Rössler, Justus Thies, Matthias Nießner, Luisa Verdoliva. 15088-15097 [doi]

Social NCE: Contrastive Learning of Socially-aware Motion RepresentationsYuejiang Liu, Qi Yan, Alexandre Alahi. 15098-15109 [doi]

Hierarchical Object-to-Zone Graph for Object NavigationSixian Zhang, Xinhang Song, Yubing Bai, Weijie Li, Yakui Chu, Shuqiang Jiang. 15110-15120 [doi]

GridToPix: Training Embodied Agents with Minimal SupervisionUnnat Jain, Iou-Jen Liu, Svetlana Lazebnik, Aniruddha Kembhavi, Luca Weihs, Alexander G. Schwing. 15121-15131 [doi]

Active Learning for Lane Detection: A Knowledge Distillation ApproachFengchao Peng, Chao Wang, Jianzhuang Liu, Zhen Yang. 15132-15141 [doi]

Waypoint Models for Instruction-guided Navigation in Continuous EnvironmentsJacob Krantz, Aaron Gokaslan, Dhruv Batra, Stefan Lee, Oleksandr Maksymets. 15142-15151 [doi]

Geometry-based Distance Decomposition for Monocular 3D Object DetectionXuepeng Shi, Qi Ye, Xiaozhi Chen, Chuangrong Chen, Zhixiang Chen, Tae-Kyun Kim. 15152-15161 [doi]

GRF: Learning a General Radiance Field for 3D Representation and RenderingAlex Trevithick, Bo Yang 0027. 15162-15172 [doi]

Change is Everywhere: Single-Temporal Supervised Object Change Detection in Remote Sensing ImageryZhuo Zheng, Ailong Ma, Liangpei Zhang, Yanfei Zhong. 15173-15182 [doi]

Indoor Scene Generation from a Collection of Semantic-Segmented Depth ImagesMingjia Yang, Yu-Xiao Guo 0001, Bin Zhou, Xin Tong 0001. 15183-15192 [doi]

Globally Optimal and Efficient Manhattan Frame Estimation by Delimiting Rotation Search SpaceWuwei Ge, Yu Song, Baichao Zhang, Zehua Dong. 15193-15201 [doi]

End-to-End Urban Driving by Imitating a Reinforcement Learning CoachZhejun Zhang, Alexander Liniger, Dengxin Dai, Fisher Yu, Luc Van Gool. 15202-15212 [doi]

From Goals, Waypoints & Paths To Long Term Human Trajectory ForecastingKarttikeya Mangalam, Yang An, Harshayu Girase, Jitendra Malik. 15213-15222 [doi]

VSAC: Efficient and Accurate Estimator for H and FMaksym Ivashechkin, Daniel Barath, Jirí Matas. 15223-15232 [doi]

BabelCalib: A Universal Approach to Calibrating Central CamerasYaroslava Lochman, Kostiantyn Liepieshov, Jianhui Chen, Michal Perdoch, Christopher Zach, James Pritts. 15233-15242 [doi]

Robust Small Object Detection on the Water Surface through Fusion of Camera and Millimeter Wave RadarYuwei Cheng, Hu Xu, Yimin Liu. 15243-15252 [doi]

FIERY: Future Instance Prediction in Bird's-Eye View from Surround Monocular CamerasAnthony Hu, Zak Murez, Nikhil Mohan, Sofía Dudas, Jeffrey Hawke, Vijay Badrinarayanan, Roberto Cipolla, Alex Kendall. 15253-15262 [doi]

Fog Simulation on Real LiDAR Point Clouds for 3D Object Detection in Adverse WeatherMartin Hahner, Christos Sakaridis, Dengxin Dai, Luc Van Gool. 15263-15272 [doi]

LSG-CPD: Coherent Point Drift with Local Surface Geometry for Point Cloud RegistrationWeixiao Liu, Hongtao Wu, Gregory S. Chirikjian. 15273-15282 [doi]

DenseTNT: End-to-end Trajectory Prediction from Dense Goal SetsJunru Gu, Chen Sun 0002, Hang Zhao. 15283-15292 [doi]

Hierarchical Disentangled Representation Learning for Outdoor Illumination Estimation and EditingPiaopiao Yu, Jie Guo 0001, Fan Huang, Cheng Zhou, Hongwei Che, Xiao Ling, Yanwen Guo 0001. 15293-15302 [doi]

Continuous Copy-Paste for One-stage Multi-object Tracking and SegmentationZhenbo Xu, Ajin Meng, Zhenbo Shi, Wei Yang 0011, Zhi Chen, Liusheng Huang. 15303-15312 [doi]

Deep Metric Learning for Open World Semantic SegmentationJun Cen, Peng Yun, Junhao Cai, Michael Yu Wang, Ming Liu. 15313-15322 [doi]

PrimitiveNet: Primitive Instance Segmentation with Local Primitive Embedding under Adversarial MetricJingwei Huang, Yanfeng Zhang, Mingwei Sun. 15323-15333 [doi]

Scribble-Supervised Semantic Segmentation InferenceJingshan Xu, Chuanwei Zhou, Zhen Cui 0001, Chunyan Xu, Yuge Huang, Pengcheng Shen, Shaoxin Li, Jian Yang 0003. 15334-15343 [doi]

Scaling up instance annotation via label propagationDim P. Papadopoulos, Ethan Weber, Antonio Torralba 0001. 15344-15353 [doi]

THDA: Treasure Hunt Data Augmentation for Semantic NavigationOleksandr Maksymets, Vincent Cartillier, Aaron Gokaslan, Erik Wijmans, Wojciech Galuba, Stefan Lee, Dhruv Batra. 15354-15363 [doi]

Pose Invariant Topological Memory for Visual NavigationAsuto Taniguchi, Fumihiro Sasaki, Ryota Yamashina. 15364-15373 [doi]

FLAR: A Unified Prototype Framework for Few-sample Lifelong Active RecognitionLei Fan, Peixi Xiong, Wei Wei, Ying Wu. 15374-15383 [doi]

Learning of Visual Relations: The Devil is in the TailsAlakh Desai, Tz-Ying Wu, Subarna Tripathi, Nuno Vasconcelos. 15384-15393 [doi]

Rethinking 360° Image Visual Attention Modelling with Unsupervised LearningYasser Abdelaziz Dahou Djilali, Tarun Krishna, Kevin McGuinness, Noel E. O'Connor. 15394-15404 [doi]

Standardized Max Logits: A Simple yet Effective Approach for Identifying Unexpected Road Obstacles in Urban-Scene SegmentationSanghun Jung, Jungsoo Lee, Daehoon Gwak, Sungha Choi, Jaegul Choo. 15405-15414 [doi]

4D-Net for Learned Multi-Modal AlignmentA. J. Piergiovanni, Vincent Casser, Michael S. Ryoo, Anelia Angelova. 15415-15425 [doi]

SPG: Unsupervised Domain Adaptation for 3D Object Detection via Semantic Point GenerationQiangeng Xu, Yin Zhou, Weiyue Wang 0002, Charles R. Qi, Dragomir Anguelov. 15426-15436 [doi]

HiFT: Hierarchical Feature Transformer for Aerial TrackingZiang Cao, Changhong Fu 0001, Junjie Ye, Bowen Li, Yiming Li 0003. 15437-15446 [doi]

Hierarchical Aggregation for 3D Instance SegmentationShaoyu Chen, Jiemin Fang, Qian Zhang 0009, Wenyu Liu 0001, Xinggang Wang. 15447-15456 [doi]

Learning Inner-Group Relations on Point CloudsHaoxi Ran, Wei Zhuo, Jun Liu, Li Lu. 15457-15467 [doi]

VMNet: Voxel-Mesh Network for Geodesic-Aware 3D Semantic SegmentationZeyu Hu, Xuyang Bai, Jiaxiang Shang, Runze Zhang, Jiayu Dong, Xin Wang, Guangyuan Sun, Hongbo Fu, Chiew-Lan Tai. 15468-15478 [doi]

Warp-Refine Propagation: Semi-Supervised Auto-labeling via Cycle-consistencyAditya Ganeshan, Alexis Vallet, Yasunori Kudo, Shin-ichi Maeda, Tommi Kerola, Rares Ambrus, Dennis Park, Adrien Gaidon. 15479-15489 [doi]

ReDAL: Region-based and Diversity-aware Active Learning for Point Cloud Semantic SegmentationTsung-Han Wu, Yueh-Cheng Liu, Yu-Kai Huang, Hsin-Ying Lee, Hung-Ting Su, Ping-Chia Huang, Winston H. Hsu. 15490-15499 [doi]

Perturbed Self-Distillation: Weakly Supervised Large-Scale Point Cloud Semantic SegmentationYachao Zhang, Yanyun Qu, Yuan Xie 0006, Zonghao Li, Shanshan Zheng, Cuihua Li. 15500-15508 [doi]

Revealing the Reciprocal Relations between Self-Supervised Stereo and Monocular Depth EstimationZhi Chen, Xiaoqing Ye, Wei Yang 0011, Zhenbo Xu, Xiao Tan 0001, Zhikang Zou, Errui Ding, Xinming Zhang, Liusheng Huang. 15509-15518 [doi]

FOVEA: Foveated Image Magnification for Autonomous NavigationChittesh Thavamani, Mengtian Li, Nicolas Cebron, Deva Ramanan. 15519-15528 [doi]

Spatial Uncertainty-Aware Semi-Supervised Crowd CountingYanda Meng, Hongrun Zhang, Yitian Zhao, Xiaoyun Yang, Xuesheng Qian, Xiaowei Huang 0001, Yalin Zheng. 15529-15539 [doi]

Excavating the Potential Capacity of Self-Supervised Monocular Depth EstimationRui Peng, Ronggang Wang, Yawen Lai, Luyang Tang, Yangang Cai. 15540-15549 [doi]

Crowd Counting With Partial Annotations in an ImageYanyu Xu, Ziming Zhong, Dongze Lian, Jing Li, Zhengxin Li, Xinxing Xu, Shenghua Gao. 15550-15559 [doi]

Personalized Trajectory Prediction via Distribution DiscriminationGuangyi Chen 0002, Junlong Li, Nuoxing Zhou, Liangliang Ren, Jiwen Lu. 15560-15569 [doi]

Learning to drive from a world on railsDian Chen 0001, Vladlen Koltun, Philipp Krähenbühl. 15570-15579 [doi]

Bifold and Semantic Reasoning for Pedestrian Behavior PredictionAmir Rasouli, Mohsen Rohani, Jun Luo. 15580-15590 [doi]

Procedure Planning in Instructional Videos via Contextual Modeling and Model-based Policy LearningJing Bi, Jiebo Luo, Chenliang Xu. 15591-15600 [doi]

Prediction by Anticipation: An Action-Conditional Prediction Method based on Interaction LearningErshad Banijamali, Mohsen Rohani, Elmira Amirloo Abolfathi, Jun Luo, Pascal Poupart. 15601-15610 [doi]

Robust 2D/3D Vehicle Parsing in Arbitrary Camera Views for CVISHui Miao, Feixiang Lu, Zongdai Liu, Liangjun Zhang, Dinesh Manocha, Bin Zhou. 15611-15620 [doi]

AutoShape: Real-Time Shape-Aware Monocular 3D Object DetectionZongdai Liu, Dingfu Zhou, Feixiang Lu, Jin Fang, Liangjun Zhang. 15621-15630 [doi]

Road Anomaly Detection by Partial Image Reconstruction with Segmentation CouplingTomas Vojir, Tomás Sipka, Rahaf Aljundi, Nikolay Chumerin, Daniel Olmeda Reino, Jiri Matas. 15631-15640 [doi]

Structured Bird's-Eye-View Traffic Scene Understanding from Onboard ImagesYigit Baran Can, Alexander Liniger, Danda Pani Paudel, Luc Van Gool. 15641-15650 [doi]

Multi-View Radar Semantic SegmentationArthur Ouaknine, Alasdair Newson, Patrick Pérez, Florence Tupin, Julien Rebut. 15651-15660 [doi]

VIL-100: A New Dataset and A Baseline Model for Video Instance Lane DetectionYujun Zhang, Lei Zhu 0003, Wei Feng 0005, Huazhu Fu, Mingqian Wang, Qingxia Li, Cheng Li, Song Wang 0002. 15661-15670 [doi]

RobustNav: Towards Benchmarking Robustness in Embodied NavigationPrithvijit Chattopadhyay, Judy Hoffman, Roozbeh Mottaghi, Aniruddha Kembhavi. 15671-15680 [doi]

Triggering Failures: Out-Of-Distribution detection by learning from local adversarial attacks in Semantic SegmentationVictor Besnier, Andrei Bursuc, David Picard, Alexandre Briot. 15681-15690 [doi]

Robustness and Generalization via Generative Adversarial TrainingOmid Poursaeed, Tianxing Jiang, Harry Yang, Serge J. Belongie, Ser-Nam Lim. 15691-15700 [doi]

Learnable Boundary Guided Adversarial TrainingJiequan Cui, Shu Liu 0005, Liwei Wang, Jiaya Jia. 15701-15710 [doi]

Safety-aware Motion Prediction with Unseen Vehicles for Autonomous DrivingXuanchi Ren, Tao Yang, Li Erran Li, Alexandre Alahi, Qifeng Chen. 15711-15720 [doi]

Toward Human-Like Grasp: Dexterous Grasping via Semantic Representation of Object-HandTianqiang Zhu, Rina Wu, Xiangbo Lin, Yi Sun 0009. 15721-15731 [doi]

Act the Part: Learning Interaction Strategies for Articulated Object Part DiscoverySamir Yitzhak Gadre, Kiana Ehsani, Shuran Song. 15732-15741 [doi]

H2O: A Benchmark for Visual Human-human Object Handover AnalysisRuolin Ye, Wenqiang Xu, Zhendong Xue, Tutian Tang, Yanfeng Wang, Cewu Lu. 15742-15751 [doi]

The Functional Correspondence ProblemZihang Lai, Senthil Purushwalkam, Abhinav Gupta 0001. 15752-15761 [doi]

Continual Neural Mapping: Learning An Implicit Scene Representation from Sequential ObservationsZike Yan, Yuxin Tian, Xuesong Shi, Ping Guo, Peng Wang, Hongbin Zha. 15762-15772 [doi]

NEAT: Neural Attention Fields for End-to-End Autonomous DrivingKashyap Chitta, Aditya Prakash, Andreas Geiger 0001. 15773-15783 [doi]

MGNet: Monocular Geometric Scene Understanding for Autonomous DrivingMarkus Schön, Michael Buchholz, Klaus Dietmayer. 15784-15795 [doi]

Visual Distant Supervision for Scene Graph GenerationYuan Yao, Ao Zhang, Xu Han 0007, Mengdi Li, Cornelius Weber, Zhiyuan Liu 0001, Stefan Wermter, Maosong Sun. 15796-15806 [doi]

Generative Compositional Augmentations for Scene Graph PredictionBoris Knyazev, Harm de Vries, Catalina Cangea, Graham W. Taylor, Aaron C. Courville, Eugene Belilovsky. 15807-15817 [doi]

In-Place Scene Labelling and Understanding with Implicit Scene RepresentationShuaifeng Zhi, Tristan Laidlow, Stefan Leutenegger, Andrew J. Davison. 15818-15827 [doi]

Interaction via Bi-directional Graph of Semantic Region Affinity for Scene ParsingHenghui Ding, Hui Zhang, Jun Liu, Jiaxin Li, Zijian Feng, Xudong Jiang. 15828-15838 [doi]

Enhanced Boundary Learning for Glass-like Object SegmentationHao He, Xiangtai Li, Guangliang Cheng, Jianping Shi, Yunhai Tong, Gaofeng Meng, Véronique Prinet, Lubin Weng. 15839-15848 [doi]

Exploring Relational Context for Multi-Task Dense PredictionDavid Brüggemann, Menelaos Kanakis, Anton Obukhov, Stamatios Georgoulis, Luc Van Gool. 15849-15858 [doi]

Segmentation-grounded Scene Graph GenerationSiddhesh Khandelwal, Mohammed Suhail, Leonid Sigal. 15859-15869 [doi]

Visual Graph Memory with Unsupervised Representation for Visual NavigationObin Kwon, Nuri Kim, Yunho Choi, Hwiyeon Yoo, Jeongho Park, Songhwai Oh. 15870-15879 [doi]

Topic Scene Graph Generation by Attention Distillation from CaptionWenbin Wang, Ruiping Wang 0001, Xilin Chen 0001. 15880-15890 [doi]

Grounding Consistency: Distilling Spatial Common Sense for Precise Visual Relationship DetectionMarkos Diomataris, Nikolaos Gkanatsios, Vassilis Pitsikalis, Petros Maragos. 15891-15900 [doi]

Exploring Long Tail Visual Relationship Recognition with Large VocabularySherif Abdelkarim, Aniket Agarwal, Panos Achlioptas, Jun Chen 0021, Jiaji Huang, Boyang Li 0001, Kenneth Church 0001, Mohamed Elhoseiny. 15901-15910 [doi]

Context-aware Scene Graph Generation with Seq2Seq TransformersYichao Lu, Himanshu Rai, Jason Chang, Boris Knyazev, Guang Wei Yu, Shashank Shekhar 0005, Graham W. Taylor, Maksims Volkovs. 15911-15921 [doi]

Episodic Transformer for Vision-and-Language NavigationAlexander Pashevich, Cordelia Schmid, Chen Sun 0002. 15922-15932 [doi]

Graspness Discovery in Clutters for Fast and Accurate Grasp DetectionChenxi Wang, Haoshu Fang, Minghao Gou, Hongjie Fang, Jin Gao, Cewu Lu. 15944-15953 [doi]

Pose Correction for Highly Accurate Visual Localization in Large-scale Indoor SpacesJanghun Hyeon, Joohyung Kim, Nakju Lett Doh. 15954-15963 [doi]

Exploiting Scene Graphs for Human-Object Interaction DetectionTao He 0007, Lianli Gao, Jingkuan Song, Yuan-Fang Li. 15964-15973 [doi]

Deep Hough Voting for Robust Global RegistrationJunha Lee, Seungwook Kim, Minsu Cho, Jaesik Park. 15974-15983 [doi]

P2-Net: Joint Description and Detection of Local Features for Pixel and Point MatchingBing Wang 0013, Changhao Chen, Zhaopeng Cui, Jie Qin, Chris Xiaoxuan Lu, Zhengdi Yu, Peijun Zhao, Zhen Dong, Fan Zhu 0001, Niki Trigoni, Andrew Markham. 15984-15993 [doi]

Interpretation of Emergent Communication in Heterogeneous Collaborative Embodied AgentsShivansh Patel, Saim Wani, Unnat Jain, Alexander G. Schwing, Svetlana Lazebnik, Manolis Savva, Angel X. Chang. 15993-15943 [doi]

HRegNet: A Hierarchical Network for Large-scale Outdoor LiDAR Point Cloud RegistrationFan Lu 0001, Guang Chen 0001, YinLong Liu, Lijun Zhang, Sanqing Qu, Shu Liu, Rongqi Gu. 15994-16003 [doi]

RPVNet: A Deep and Efficient Range-Point-Voxel Fusion Network for LiDAR Point Cloud SegmentationJianyun Xu, Ruixiang Zhang, Jian Dou, Yushi Zhu, Jie Sun, Shiliang Pu. 16004-16013 [doi]

MonteFloor: Extending MCTS for Reconstructing Accurate Large-Scale Floor PlansSinisa Stekovic, Mahdi Rad, Friedrich Fraundorfer, Vincent Lepetit. 16014-16023 [doi]

Self-Supervised Real-to-Sim Scene GenerationAayush Prakash, Shoubhik Debnath, Jean-Francois Lafleche, Eric Cameracci, Gavriel State, Stan Birchfield, Marc T. Law. 16024-16034 [doi]

Regularizing Nighttime Weirdness: Efficient Self-supervised Monocular Depth Estimation in the DarkKun Wang, Zhenyu Zhang, Zhiqiang Yan, Xiang Li 0041, Baobei Xu, Jun Li 0027, Jian Yang 0003. 16035-16044 [doi]

Variational Attention: Propagating Domain-Specific Knowledge for Multi-Domain Learning in Crowd CountingBinghui Chen, Zhaoyi Yan, Ke Li, Pengyu Li, Biao Wang, Wangmeng Zuo, Lei Zhang 0006. 16045-16055 [doi]

GP-S3Net: Graph-based Panoptic Sparse Semantic Segmentation NetworkRyan Razani, Ran Cheng, Enxu Li, Ehsan Taghavi, Yuan Ren, Bingbing Liu. 16056-16065 [doi]

VolumeFusion: Deep Depth Fusion for 3D Scene ReconstructionJaesung Choe, Sunghoon Im, François Rameau, Minjun Kang, In-So Kweon. 16066-16075 [doi]

RAIN: Reinforced Hybrid Attention Inference Network for Motion ForecastingJiachen Li 0001, Fan Yang, Hengbo Ma, Srikanth Malla, Masayoshi Tomizuka, Chiho Choi. 16076-16086 [doi]

LookOut: Diverse Multi-Future Prediction and Planning for Self-DrivingAlexander Cui, Sergio Casas 0002, Abbas Sadat, Renjie Liao, Raquel Urtasun. 16087-16096 [doi]

Auxiliary Tasks and Exploration Enable ObjectGoal NavigationJoel Ye, Dhruv Batra, Abhishek Das, Erik Wijmans. 16097-16106 [doi]

The Surprising Effectiveness of Visual Odometry Techniques for Embodied PointGoal NavigationXiaoming Zhao, Harsh Agrawal, Dhruv Batra, Alexander G. Schwing. 16107-16116 [doi]

Glimpse-Attend-and-Explore: Self-Attention for Active Visual ExplorationSoroush Seifi, Abhishek Jha, Tinne Tuytelaars. 16117-16126 [doi]

Bayesian Deep Basis Fitting for Depth Completion with UncertaintyChao Qu, Wenxin Liu, Camillo J. Taylor. 16127-16137 [doi]

Admix: Enhancing the Transferability of Adversarial AttacksXiaosen Wang, Xuanran He, Jingdong Wang 0001, Kun He 0001. 16138-16147 [doi]

Aha! Adaptive History-driven Attack for Decision-based Black-box ModelsJie Li, Rongrong Ji, Peixian Chen, Baochang Zhang 0001, Xiaopeng Hong, Ruixin Zhang, Shaoxin Li, Jilin Li, Feiyue Huang, Yongjian Wu. 16148-16157 [doi]

Knowledge-Enriched Distributional Model Inversion AttacksSi Chen, Mostafa Kahla, Ruoxi Jia, Guo-Jun Qi. 16158-16167 [doi]

Attack as the Best Defense: Nullifying Image-to-image Translation GANs via Limit-aware Adversarial AttackChin-Yuan Yeh, Hsi-Wen Chen, Hong-Han Shuai, De-Nian Yang, Ming-Syan Chen. 16168-16177 [doi]

Full-Velocity Radar Returns by Radar-Camera FusionYunfei Long, Daniel D. Morris, Xiaoming Liu 0002, Marcos Castro, Punarjay Chakravarty, Praveen Narayanan. 16178-16187 [doi]

PU-EVA: An Edge-Vector based Approximation Solution for Flexible-scale Point Cloud UpsamplingLuqing Luo, Lulu Tang, Wanyi Zhou, Shizheng Wang, Zhi-Xin Yang. 16188-16197 [doi]

A Closer Look at Rotation-invariant Deep Point Cloud AnalysisFeiran Li, Kent Fujiwara, Fumio Okura, Yasuyuki Matsushita. 16198-16207 [doi]

CTRL-C: Camera calibration TRansformer with Line-ClassificationJinwoo Lee, Hyunsung Go, Hyunjoon Lee, Sunghyun Cho, Min-Hyuk Sung, Junho Kim. 16208-16217 [doi]

SurfGen: Adversarial 3D Shape Synthesis with Explicit Surface DiscriminatorsAndrew Luo, Tianqin Li, Wen-Hao Zhang, Tai Sing Lee. 16218-16228 [doi]

Adaptive Focus for Efficient Video RecognitionYulin Wang, Zhaoxi Chen 0007, Haojun Jiang, Shiji Song, Yizeng Han, Gao Huang. 16229-16238 [doi]

Point TransformerHengshuang Zhao, Li Jiang, Jiaya Jia, Philip H. S. Torr, Vladlen Koltun. 16239-16248 [doi]

Transformer-Based Attention Networks for Continuous Pixel-Wise PredictionGuanglei Yang, Hao Tang 0005, Mingli Ding, Nicu Sebe, Elisa Ricci 0001. 16249-16259 [doi]

Perception-Aware Multi-Sensor Fusion for 3D LiDAR Semantic SegmentationZhuangwei Zhuang, Rong Li, Kui Jia, Qicheng Wang, Yuanqing Li, Mingkui Tan. 16260-16270 [doi]

Region-aware Contrastive Learning for Semantic SegmentationHanzhe Hu, Jinshi Cui, Liwei Wang. 16271-16281 [doi]

Refining Action Segmentation with Hierarchical Video RepresentationsHyemin Ahn, Dongheui Lee. 16282-16290 [doi]

Condensing a Sequence to One Informative Frame for Video RecognitionZhaofan Qiu, Ting Yao, Yan Shu, Chong-Wah Ngo, Tao Mei 0001. 16291-16300 [doi]

Vision-Language Transformer and Query Generation for Referring SegmentationHenghui Ding, Chang Liu, Suchen Wang, Xudong Jiang. 16301-16310 [doi]

Salient Object Ranking with Position-Preserved AttentionHao Fang, Daoxin Zhang, Yi Zhang, Minghao Chen 0001, Jiawei Li, Yao Hu, Deng Cai 0001, Xiaofei He 0001. 16311-16321 [doi]

Few-Shot Visual Relationship Co-LocalizationRevant Teotia, Vaibhav Mishra, Mayank Maheshwari, Anand Mishra 0001. 16322-16331 [doi]

Graph-to-3D: End-to-End Generation and Manipulation of 3D Scenes Using Scene GraphsHelisa Dhamo, Fabian Manhardt, Nassir Navab, Federico Tombari. 16332-16341 [doi]

Unconditional Scene Graph GenerationSarthak Garg, Helisa Dhamo, Azade Farshad, Sabrina Musatian, Nassir Navab, Federico Tombari. 16342-16351 [doi]

Spatial-Temporal Transformer for Dynamic Scene Graph GenerationYuren Cong, Wentong Liao, Hanno Ackermann, Bodo Rosenhahn, Michael Ying Yang. 16352-16362 [doi]

From General to Specific: Informative Scene Graph Generation via Balance AdjustmentYuyu Guo 0001, Lianli Gao, Xuanhan Wang, Yuxuan Hu, Xing Xu 0001, Xu Lu, Heng Tao Shen, Jingkuan Song. 16363-16372 [doi]

A Simple Baseline for Weakly-Supervised Scene Graph GenerationJing Shi 0005, Yiwu Zhong, Ning Xu, Yin Li 0003, Chenliang Xu. 16373-16382 [doi]

Cross-Modality Person Re-Identification via Modality Confusion and Center AggregationXin Hao, Sanyuan Zhao, Mang Ye, Jianbing Shen. 16383-16392 [doi]

Practical Relative Order Attack in Deep RankingMo Zhou, Le Wang 0003, Zhenxing Niu, Qilin Zhang, Yinghui Xu, Nanning Zheng 0001, Gang Hua 0001. 16393-16402 [doi]

Low Curvature Activations Reduce Overfitting in Adversarial TrainingVasu Singla, Sahil Singla 0002, Soheil Feizi, David Jacobs. 16403-16413 [doi]

Defending against Universal Adversarial Patches by Clipping Feature NormsCheng Yu, Jiansheng Chen, Youze Xue, Yuyang Liu, Weitao Wan, Jiayu Bao, Huimin Ma. 16414-16422 [doi]

Revisiting Adversarial Robustness Distillation: Robust Soft Labels Make Student BetterBojia Zi, Shihao Zhao, Xingjun Ma, Yu-Gang Jiang. 16423-16432 [doi]

CLEAR: Clean-up Sample-Targeted Backdoor in Neural NetworksLiuwan Zhu, Rui Ning, Chunsheng Xin, Chonggang Wang, Hongyi Wu. 16433-16442 [doi]

Invisible Backdoor Attack with Sample-Specific TriggersYuezun Li, Yiming Li, Baoyuan Wu, Longkang Li, Ran He, Siwei Lyu. 16443-16452 [doi]

Rethinking the Backdoor Attacks' Triggers: A Frequency PerspectiveYi Zeng, won Park, Z. Morley Mao, Ruoxi Jia. 16453-16461 [doi]

Black-box Detection of Backdoor Attacks with Limited Information and DataYinpeng Dong, Xiao Yang, Zhijie Deng, Tianyu Pang, Zihao Xiao, Hang Su 0006, Jun Zhu 0001. 16462-16471 [doi]

PointBA: Towards Backdoor Attacks in 3D Point CloudXinke Li, Zhirui Chen, Yue Zhao, Zekun Tong, Yabang Zhao, Andrew Lim 0001, Joey Tianyi Zhou. 16472-16481 [doi]

runs on WebDSL