IEEE/CVF Conference on Computer Vision and Pattern Recognition, CVPR 2023 - Workshops, Vancouver, BC, Canada, June 17-24, 2023

researchr

You are not signed in
Sign in
Sign up

IEEE/CVF Conference on Computer Vision and Pattern Recognition, CVPR 2023 - Workshops, Vancouver, BC, Canada, June 17-24, 2023. IEEE, 2023. [doi]

Conference: cvpr2023

Abstract is missing.

Memory-efficient and GPU-oriented visual anomaly detection with incremental dimension reductionTeng-Yok Lee, Yusuke Nagai, Akira Minezawa. 1-9 [doi]

Selective Bokeh Effect TransformationJuewen Peng, Zhiyu Pan, Chengxin Liu, Xianrui Luo, Huiqiang Sun, Liao Shen, Ke Xian, Zhiguo Cao 0001. 1-9 [doi]

Learning unbiased classifiers from biased data with meta-learningRuggero Ragonesi, Pietro Morerio, Vittorio Murino. 1-9 [doi]

The Casual Conversations v2 Dataset : A diverse, large benchmark for measuring fairness and robustness in audio/vision/speech modelsBilal Porgali, Vítor Albiero, Jordan Ryda, Cristian Canton-Ferrer, Caner Hazirbas. 10-17 [doi]

Schrödinger's Camera: First Steps Towards a Quantum-Based Privacy Preserving CameraHannah Kirkland, Sanjeev J. Koppal. 18-27 [doi]

Robustness Against Gradient based Attacks through Cost Effective Network Fine-TuningAkshay Agarwal 0001, Nalini K. Ratha, Richa Singh 0001, Mayank Vatsa. 28-37 [doi]

Gradient Attention Balance Network: Mitigating Face Recognition Racial Bias via Gradient AttentionLinzhi Huang, Mei Wang, Jiahao Liang, Weihong Deng, Hongzhi Shi, Dongchao Wen, Yingjie Zhang, Jian Zhao. 38-47 [doi]

Estimating and Maximizing Mutual Information for Knowledge DistillationAman Shrivastava, Yanjun Qi, Vicente Ordonez. 48-57 [doi]

Synthetic Sample Selection for Generalized Zero-Shot LearningShreyank N. Gowda. 58-67 [doi]

MMRNet: Improving Reliability for Multimodal Object Detection and Segmentation for Bin Picking via Multimodal RedundancyYuhao Chen, Hayden Gunraj, E. Zhixuan Zeng, Robbie Meyer, Maximilian Gilles, Alexander Wong. 68-77 [doi]

DPPD: Deformable Polar Polygon Object DetectionYang Zheng, Oles Andrienko, Yonglei Zhao, Minwoo Park, Trung Pham. 78-87 [doi]

Joint Camera and LiDAR Risk AnalysisOliver Zendel 0001, Johannes Huemer, Markus Murschitz, Gustavo Fernández Domínguez, Amadeus Lobe. 88-97 [doi]

Exploiting the Complementarity of 2D and 3D Networks to Address Domain-Shift in 3D Semantic SegmentationAdriano Cardace, Pierluigi Zama Ramirez, Samuele Salti, Luigi di Stefano. 98-109 [doi]

Training Strategies for Vision Transformers for Object DetectionApoorv Singh. 110-118 [doi]

EGA-Depth: Efficient Guided Attention for Self-Supervised Multi-Camera Depth EstimationYunxiao Shi, Hong Cai, Amin Ansari, Fatih Porikli. 119-129 [doi]

Improving Rare Classes on nuScenes LiDAR segmentation Through Targeted Domain AdaptationVickram Rajendran, Chuck Tang, Frits van Paasschen. 130-139 [doi]

Does Image Anonymization Impact Computer Vision Training?Håkon Hukkelås, Frank Lindseth. 140-150 [doi]

MotionTrack: End-to-End Transformer-based Multi-Object Tracking with LiDAR-Camera FusionCe Zhang, Chengjie Zhang, Yiluan Guo, Lingji Chen, Michael Happold. 151-160 [doi]

HazardNet: Road Debris Detection by Augmentation of Synthetic ModelsTae Eun Choe, Jane Wu, Xiaolin Lin, Karen Kwon, Minwoo Park. 161-171 [doi]

FUTR3D: A Unified Sensor Fusion Framework for 3D DetectionXuanyao Chen, Tianyuan Zhang 0002, Yue Wang, Yilun Wang, Hang Zhao. 172-181 [doi]

RadarGNN: Transformation Invariant Graph Neural Network for Radar-based PerceptionFelix Fent, Philipp Bauerschmidt, Markus Lienkamp. 182-191 [doi]

MobileDeRainGAN: An Efficient Semi-Supervised Approach to Single Image Rain Removal for Task-Driven ApplicationsRuphan Swaminathan, Pradyot V. N. Korupolu. 192-201 [doi]

TorchSparse++: Efficient Point Cloud EngineHaotian Tang, Shang Yang, Zhijian Liu, Ke Hong, Zhongming Yu, Xiuyu Li, Guohao Dai, Yu Wang 0002, Song Han 0003. 202-209 [doi]

Ultra-Sonic Sensor based Object Detection for Autonomous VehiclesTommaso Nesti, Santhosh Boddana, Burhaneddin Yaman. 210-218 [doi]

Improvements to Image Reconstruction-Based Performance Prediction for Semantic Segmentation in Highly Automated DrivingAndreas Bär, Daniel Kusuma, Tim Fingscheidt. 219-229 [doi]

LiDAR-Based Localization on Highways Using Raw Data and Pole-Like Object FeaturesSheng-Cheng Lee, Victor Lu, Chieh-Chih Wang, Wen-Chieh Lin. 230-237 [doi]

Zero-shot Classification at Different Levels of GranularityMatías Molina. 238-244 [doi]

Difficulty Estimation with Action Scores for Computer Vision TasksOctavio Arriaga, Sebastian Palacio, Matias Valdenegro-Toro. 245-253 [doi]

Detail-Preserving Self-Supervised Monocular Depth with Self-Supervised Structural SharpeningJuan Luis Gonzalez Bello, Jaeho Moon, Munchurl Kim. 254-264 [doi]

LD-GAN: Low-Dimensional Generative Adversarial Network for Spectral Image Generation with Variance RegularizationEmmanuel Martinez, Roman Jacome, Alejandra Hernandez-Rojas, Henry Arguello. 265-275 [doi]

Isolated Sign Language Recognition based on Tree Structure Skeleton ImagesDavid Laines, Miguel González-Mendoza 0001, Gilberto Ochoa-Ruiz, Gissella Bejarano. 276-284 [doi]

SUPRA: Superpixel Guided Loss for Improved Multi-modal Segmentation in EndoscopyRafael Martinez Garcia Peña, Mansoor Ali Teevno, Gilberto Ochoa-Ruiz, Sharib Ali. 285-294 [doi]

Deep Prototypical-Parts Ease Morphological Kidney Stone Identification and are Competitively Robust to Photometric PerturbationsDaniel Flores-Araiza, Francisco Javier Lopez-Tiro, Jonathan El Beze, Jacques Hubert, Miguel González-Mendoza 0001, Gilberto Ochoa-Ruiz, Christian Daul. 295-304 [doi]

Wildlife Image Generation from Scene GraphsYoshio Rubio, Marco A. Contreras-Cruz. 305-314 [doi]

Towards Characterizing the Semantic Robustness of Face RecognitionJuan C. Pérez, Motasem Alfarra, Ali K. Thabet, Pablo Arbeláez, Bernard Ghanem. 315-325 [doi]

High-level context representation for emotion recognition in imagesWillams de Lima Costa, Estefania Talavera Martínez, Lucas Silva Figueiredo, Veronica Teichrieb. 326-334 [doi]

Mitigating Catastrophic Interference using Unsupervised Multi-Part Attention for RGB-IR Face RecognitionKshitij Nikhal, Nkiruka Uzuegbunam, Bridget Kennedy, Benjamin S. Riggan. 335-344 [doi]

Multi-sensor Ensemble-guided Attention Network for Aerial Vehicle Perception Beyond Visible SpectrumAlicja Kwasniewska, Anastacia MacAllister, Rey Nicolas, Javier Garzás. 345-353 [doi]

C-PLES: Contextual Progressive Layer Expansion with Self-attention for Multi-class Landslide Segmentation on Mars using Multimodal Satellite ImageryAbel A. Reyes, Sidike Paheding, A. Rajaneesh, K. S. Sajinkumar, Thomas Oommen. 354-364 [doi]

Enhanced Thermal-RGB Fusion for Robust Object DetectionWassim A. El Ahmar, Yahya Massoud, Dhanvin Kolhatkar, Hamzah Alghamdi, Mohammad Al Ja'afreh, Robert Laganière, Riad I. Hammoud. 365-374 [doi]

Detecting Underwater Discrete Scatterers in Echograms with Deep Learning-Based Semantic SegmentationRhythm Vohra, Femina Senjaliya, Melissa Cote, Amanda Dash, Alexandra Branzan Albu, Julek Chawarski, Steve Pearce, Kaan Ersahin. 375-384 [doi]

A Meta-learning Approach for Domain Generalisation across Visual Modalities in Vehicle Re-identificationEleni Kamenou, Jesús Martínez del Rincón, Paul Miller 0003, Patricia Devlin-Hill. 385-393 [doi]

VisiTherS: Visible-thermal infrared stereo disparity estimation of human silhouetteNoreen Anwar, Philippe Duplessis-Guindon, Guillaume-Alexandre Bilodeau, Wassim Bouachir. 394-402 [doi]

Multimodal Object Detection by Channel Switching and Spatial AttentionYue Cao, Junchi Bin, Jozsef Hamari, Erik Blasch, Zheng Liu 0002. 403-411 [doi]

Multi-modal Aerial View Object Classification Challenge Results - PBVS 2023Spencer Low, Oliver Nina, Angel Domingo Sappa, Erik Blasch, Nathan Inkawhich. 412-421 [doi]

IR Reasoner: Real-time Infrared Object Detection by Visual ReasoningMeryem Mine Gündogan, Tolga Aksoy, Alptekin Temizel, Ugur Halici. 422-430 [doi]

Photometric Correction for Infrared SensorsJinCheng Zhang, Andrew R. Willis, Kevin M. Brink. 431-439 [doi]

Multispectral Contrastive Learning with Viewmaker NetworksJasmine Bayrooti, Noah D. Goodman, Alex Tamkin. 440-448 [doi]

Spectral Transfer Guided Active Domain Adaptation For Thermal ImageryBerkcan Ustun, Ahmet Kagan Kaya, Ezgi Cakir Ayerden, Fazil Altinel. 449-458 [doi]

Thermal Infrared Single Image Dehazing and Blind Image Quality AssessmentFabian Erlenbusch, Constanze Merkt, Bernardo de Oliveira, Alexander Gatter, Friedhelm Schwenker, Ulrich Klauck, Michael Teutsch. 459-469 [doi]

Thermal Image Super-Resolution Challenge Results - PBVS 2023Rafael E. Rivadeneira, Angel Domingo Sappa, Boris Xavier Vintimilla, Chenyang Wang 0002, Junjun Jiang, Xianming Liu, Zhiwei Zhong, Dai Bin, Li Ruodi, Shengye Li. 470-478 [doi]

A Three-Stage Framework with Reliable Sample Pool for Long-Tailed ClassificationFeng Cai, Keyu Wu, Haipeng Wang, Feng Wang. 479-486 [doi]

DeepMAO: Deep Multi-scale Aware Overcomplete Network for Building Segmentation in Satellite ImageryAniruddh Sikdar, Sumanth Udupa, Prajwal Gurunath, Suresh Sundaram. 487-496 [doi]

MoundCount: A detection-based approach for automatic counting of planting microsites on UAV imagesAhmed Zgaren, Wassim Bouachir, Nizar Bouguila, Riad I. Hammoud. 497-506 [doi]

CoReFusion: Contrastive Regularized Fusion for Guided Thermal Super-ResolutionAditya Kasliwal, Pratinav Seth, Sriya Rallabandi, Sanchit Singhal. 507-514 [doi]

Multi-modal Aerial View Image Challenge: Translation from Synthetic Aperture Radar to Electro-Optical Domain Results - PBVS 2023Spencer Low, Oliver Nina, Angel Domingo Sappa, Erik Blasch, Nathan Inkawhich. 515-523 [doi]

Seeing Through the Data: A Statistical Evaluation of Prohibited Item Detection Benchmark Datasets for X-ray Security ScreeningBrian K. S. Isaac-Medina, Seyma Yucer, Neelanjan Bhowmik, Toby P. Breckon. 524-533 [doi]

Appearance Label Balanced Triplet Loss for Multi-modal Aerial View Object ClassificationRaghunath Sai Puttagunta, Zhu Li 0001, Shuvra S. Bhattacharyya, George York. 534-542 [doi]

Topology Preserving Compositionality for Robust Medical Image SegmentationAinkaran Santhirasekaram, Mathias Winkler, Andrea G. Rockall, Ben Glocker. 543-552 [doi]

Shape and Intensity Analysis of Glioblastoma Multiforme TumorsYi Tang Chen, Sebastian Kurtek. 553-560 [doi]

Robust Hierarchical Symbolic Explanations in Hyperbolic Space for Image ClassificationAinkaran Santhirasekaram, Avinash Kori, Mathias Winkler, Andrea G. Rockall, Francesca Toni, Ben Glocker. 561-570 [doi]

Euler Characteristic Transform Based Topological Loss for Reconstructing 3D Images from Single 2D SlicesKalyan Varma Nadimpalli, Amit Chattopadhyay, Bastian Rieck. 571-579 [doi]

Topology-Aware Focal Loss for 3D Image SegmentationAndac Demir, Elie Massaad, Bulent Kiziltan. 580-589 [doi]

Hamming Similarity and Graph Laplacians for Class Partitioning and Adversarial Image DetectionHuma Jamil, Yajing Liu, Turgay Caglar, Christina M. Cole, Nathaniel Blanchard, Christopher Peterson 0001, Michael Kirby. 590-599 [doi]

TopFusion: Using Topological Feature Space for Fusion and Imputation in Multi-Modal DataAudun Myers, Henry Kvinge, Tegan Emerson. 600-609 [doi]

Quantifying Extrinsic Curvature in Neural ManifoldsFrancisco Acosta, Sophia Sanborn, Khanh Dao Duc, Manu S. Madhav, Nina Miolane. 610-619 [doi]

Making Corgis Important for Honeycomb Classification: Adversarial Attacks on Concept-based Explainability ToolsDavis Brown, Henry Kvinge. 620-627 [doi]

Face Animation with an Attribute-Guided Diffusion ModelBohan Zeng, Xuhui Liu, Sicheng Gao, Boyu Liu, Hong Li, Jianzhuang Liu, Baochang Zhang 0001. 628-637 [doi]

Explore the Power of Synthetic Data on Few-shot Object DetectionShaobo Lin, Kun Wang, Xingyu Zeng, Rui Zhao. 638-647 [doi]

Internal Diverse Image CompletionNoa Alkobi, Tamar Rott Shaham, Tomer Michaeli. 648-658 [doi]

Leveraging GANs for data scarcity of COVID-19: Beyond the hypeHazrat Ali, Christer Grönlund, Zubair Shah. 659-667 [doi]

Face Transformer: Towards High Fidelity and Accurate Face SwappingKaiwen Cui, Rongliang Wu, Fangneng Zhan, Shijian Lu. 668-677 [doi]

Controllable GAN Synthesis Using Non-Rigid Structure-from-MotionRené Haas, Stella Graßhof, Sami S. Brandt. 678-687 [doi]

Discovering Class-Specific GAN Controls for Semantic Image SynthesisEdgar Schönfeld, Julio Borges, Vadim Sushko, Bernt Schiele, Anna Khoreva. 688-697 [doi]

One-shot Unsupervised Domain Adaptation with Personalized Diffusion ModelsYasser Benigmim, Subhankar Roy, Slim Essid, Vicky Kalogeiton, Stéphane Lathuilière. 698-708 [doi]

DeSRF: Deformable Stylized Radiance FieldShiyao Xu, Lingzhi Li 0002, Li Shen 0005, Zhouhui Lian. 709-718 [doi]

Unsupervised Style-based Explicit 3D Face Reconstruction from Single ImageHeng Yu, Zoltan A. Milacski, László A. Jeni. 719-729 [doi]

Generating Adversarial Attacks in the Latent SpaceNitish Shukla, Sudipta Banerjee. 730-739 [doi]

Unsupervised Bidirectional Style Transfer Network using Local Feature Transform ModuleKangmin Bae, Hyung-il Kim, Yongjin Kwon, Jinyoung Moon. 740-749 [doi]

Improving Normalizing Flows with the Approximate Mass for Out-of-Distribution DetectionSamy Chali, Inna Kucher, Marc Duranton, Jacques-Olivier Klein. 750-758 [doi]

Scene Graph Driven Text-Prompt Generation for Image InpaintingTripti Shukla, Paridhi Maheshwari, Rajhans Singh, Ankita Shukla, Kuldeep Kulkarni, Pavan K. Turaga. 759-768 [doi]

Diversity is Definitely Needed: Improving Model-Agnostic Zero-shot Classification via Stable DiffusionJordan Shipard, Arnold Wiliem, Kien Nguyen Thanh, Wei Xiang 0001, Clinton Fookes. 769-778 [doi]

Benchmarking Robustness to Text-Guided CorruptionsMohammadreza Mofayezi, Yasamin Medghalchi. 779-786 [doi]

Look ATME: The Discriminator Mean Entropy Needs AttentionEdgardo Solano-Carrillo, Ángel Bueno Rodríguez, Borja Carrillo-Perez, Yannik Steiniger, Jannis Stoppe. 787-796 [doi]

Diffusion-Enhanced PatchMatch: A Framework for Arbitrary Style Transfer with Diffusion ModelsMark Hamazaspyan, Shant Navasardyan. 797-805 [doi]

Identity-driven Three-Player Generative Adversarial Network for Synthetic-based Face RecognitionJan Niklas Kolf, Tim Rieber, Jurek Elliesen, Fadi Boutros, Arjan Kuijper, Naser Damer. 806-816 [doi]

GAN-based Vision Transformer for High-Quality Thermal Image EnhancementMohamed Amine Marnissi, Abir Fathallah. 817-825 [doi]

Vision + Language Applications: A SurveyYutong Zhou, Nobutaka Shimada. 826-842 [doi]

Universal Guidance for Diffusion ModelsArpit Bansal, Hong-Min Chu, Avi Schwarzschild, Soumyadip Sengupta, Micah Goldblum, Jonas Geiping, Tom Goldstein. 843-852 [doi]

Exploring Compositional Visual Generation with Latent Classifier GuidanceChanghao Shi, Haomiao Ni, Kai Li 0012, Shaobo Han, Mingfu Liang, Martin Renqiang Min. 853-862 [doi]

A Geometric and Photometric Exploration of GAN and Diffusion Synthesized FacesMatyás Bohácek, Hany Farid. 874-883 [doi]

Exposing GAN-Generated Profile Photos from Compact EmbeddingsShivansh Mundra, Gonzalo J. Aniano Porcile, Smit Marvaniya, James R. Verbus, Hany Farid. 884-892 [doi]

AutoSplice: A Text-prompt Manipulated Image Dataset for Media ForensicsShan Jia, Mingzhen Huang, Zhou Zhou, Yan Ju, Jialing Cai, Siwei Lyu. 893-903 [doi]

AI-Synthesized Voice Detection Using Neural Vocoder ArtifactsChengzhe Sun, Shan Jia, Shuwei Hou, Siwei Lyu. 904-912 [doi]

EKILA: Synthetic Media Provenance and Attribution for Generative ArtKar Balan, Shruti Agarwal, Simon Jenni, Andy Parsons, Andrew Gilbert, John P. Collomosse. 913-922 [doi]

Harnessing the Power of Text-image Contrastive Models for Automatic Detection of Online MisinformationHao Chen, Peng Zheng, Xin Wang, Shu Hu, Bin Zhu, Jinrong Hu, Xi Wu, Siwei Lyu. 923-932 [doi]

RoSteALS: Robust Steganography using Autoencoder Latent SpaceTu Bui, Shruti Agarwal, Ning Yu, John P. Collomosse. 933-942 [doi]

Audio-Visual Person-of-Interest DeepFake DetectionDavide Cozzolino, Alessandro Pianese, Matthias Nießner, Luisa Verdoliva. 943-952 [doi]

Open Set Classification of GAN-based Image Manipulations via a ViT-based Hybrid ArchitectureJun Wang, Omran Alamayreh, Benedetta Tondi, Mauro Barni. 953-962 [doi]

MTN: Forensic Analysis of MP4 Video Files Using Graph Neural NetworksZiyue Xiang, Amit Kumar Singh Yadav, Paolo Bestagini, Stefano Tubaro, Edward J. Delp. 963-972 [doi]

Intriguing properties of synthetic images: from generative adversarial networks to diffusion modelsRiccardo Corvi, Davide Cozzolino, Giovanni Poggi, Koki Nagano, Luisa Verdoliva. 973-982 [doi]

Defending Low-Bandwidth Talking Head Videoconferencing Systems From Real-Time Puppeteering AttacksDanial Samadi Vahdati, Tai D. Nguyen, Matthew C. Stamm. 983-992 [doi]

Multimodaltrace: Deepfake Detection using Audiovisual Representation LearningMuhammad Anas Raza, Khalid Mahmood Malik. 993-1000 [doi]

Exposing Fine-Grained Adversarial Vulnerability of Face Anti-Spoofing ModelsSonglin Yang, Wei Wang 0025, Chenye Xu, Ziwen He, Bo Peng 0002, Jing Dong 0003. 1001-1010 [doi]

Robust Partial Fingerprint RecognitionYufei Zhang, Rui Zhao, Ziyi Zhao, Naveen Ramakrishnan, Manoj Aggarwal, Gerard Medioni, Qiang Ji. 1011-1020 [doi]

PIC-Score: Probabilistic Interpretable Comparison Score for Optimal Matching Confidence in Single- and Multi-Biometric Face RecognitionPedro C. Neto, Ana F. Sequeira, Jaime S. Cardoso 0001, Philipp Terhörst. 1021-1029 [doi]

Gait Recognition from Fisheye ImagesChi Xu 0003, Yasushi Makihara, Xiang Li 0028, Yasushi Yagi. 1030-1040 [doi]

Face Recognition Accuracy Across Demographics: Shining a Light Into the ProblemHaiyu Wu, Vítor Albiero, K. S. Krishnapriya, Michael C. King, Kevin W. Bowyer. 1041-1050 [doi]

BeCAPTCHA-Type: Biometric Keystroke Data Generation for Improved Bot DetectionDaniel DeAlcala, Aythami Morales, Rubén Tolosana, Alejandro Acien, Julian Fiérrez, Santiago Hernandez, Miguel A. Ferrer, Moisés Díaz. 1051-1060 [doi]

SynthASpoof: Developing Face Presentation Attack Detection Based on Privacy-friendly Synthetic DataMeiling Fang, Marco Huber, Naser Damer. 1061-1070 [doi]

The Universal Face Encoder: Learning Disentangled Representations Across Different AttributesSandipan Banerjee, Ajjen Joshi, Jay Turcot. 1071-1080 [doi]

A Closer Look at Geometric Temporal Dynamics for Face Anti-SpoofingChih-Jung Chang, Yaw-Chern Lee, Shih-Hsuan Yao, Min-Hung Chen, Chien-Yi Wang, Shang-Hong Lai, Trista Pei-chun Chen. 1081-1091 [doi]

FlexiCurve: Flexible Piecewise Curves Estimation for Photo RetouchingChongyi Li, Chunle Guo, Shangchen Zhou, Qiming Ai, Ruicheng Feng, Chen Change Loy. 1092-1101 [doi]

BeautyREC: Robust, Efficient, and Component-Specific Makeup TransferQixin Yan, Chunle Guo, Jixin Zhao, Yuekun Dai, Chen Change Loy, Chongyi Li. 1102-1110 [doi]

SCONE-GAN: Semantic Contrastive learning-based Generative Adversarial Network for an end-to-end image translationIman Abbasnejad, Fabio Zambetta, Flora D. Salim, Timothy Wiley, Jeffrey Chan, Russell Gallagher, Ehsan Abbasnejad. 1111-1120 [doi]

Adaptive Human-Centric Video Compression for Humans and MachinesWei Jiang, Hyomin Choi, Fabien Racapé. 1121-1129 [doi]

ProgDTD: Progressive Learned Image Compression with Double-Tail-Drop TrainingAli Hojjat, Janek Haberer, Olaf Landsiedel. 1130-1139 [doi]

RB-Dust - A Reference-based Dataset for Vision-based Dust RemovalPeter Buckel, Timo Oksanen, Thomas Dietmueller. 1140-1149 [doi]

Quantum Annealing for Single Image Super-ResolutionHan Yao Choong, Suryansh Kumar 0001, Luc Van Gool. 1150-1159 [doi]

Unlimited-Size Diffusion RestorationYinhuai Wang, Jiwen Yu, Runyi Yu, Jian Zhang 0018. 1160-1167 [doi]

Benchmark Dataset and Effective Inter-Frame Alignment for Real-World Video Super-ResolutionRuohao Wang, Xiaohui Liu 0003, Zhilu Zhang, Xiaohe Wu, Chun-Mei Feng, Lei Zhang 0006, Wangmeng Zuo. 1168-1177 [doi]

SS-TTA: Test-Time Adaption for Self-Supervised Denoising MethodsMasud An Nur Islam Fahim, Jani Boutellier. 1178-1187 [doi]

High-Resolution Synthetic RGB-D Datasets for Monocular Depth EstimationAakash Rajpal, Noshaba Cheema, Klaus Illgner-Fehns, Philipp Slusallek, Sunil Prasad Jaiswal. 1188-1198 [doi]

Expanding Synthetic Real-World Degradations for Blind Video Super ResolutionMehran Jeelani, Sadbhawna, Noshaba Cheema, Klaus Illgner-Fehns, Philipp Slusallek, Sunil Prasad Jaiswal. 1199-1208 [doi]

Deep Dehazing Powered by Image Processing NetworkGuisik Kim, Jinhee Park, Junseok Kwon. 1209-1218 [doi]

Denoising Diffusion Models for Plug-and-Play Image RestorationYuanzhi Zhu, Kai Zhang 0008, Jingyun Liang, Jiezhang Cao, Bihan Wen, Radu Timofte, Luc Van Gool. 1219-1229 [doi]

Saliency-aware Stereoscopic Video RetargetingHassan Imani, Md Baharul Islam, Lai-Kuan Wong. 1230-1239 [doi]

FRR-Net: A Real-Time Blind Face Restoration and Relighting NetworkSamira Pouyanfar, Sunando Sengupta, Mahmoud Mohammadi, Ebey Abraham, Brett Bloomquist, Lukas Dauterman, Anjali Parikh, Steve Lim, Eric Sommerlade. 1240-1250 [doi]

Blind Image Inpainting via Omni-dimensional Gated Attention and Wavelet QueriesShruti S. Phutke, Ashutosh Kulkarni, Santosh Kumar Vipparthi, Subrahmanyam Murala. 1251-1260 [doi]

Rip Current Segmentation: A Novel Benchmark and YOLOv8 Baseline ResultsAndrei Dumitriu, Florin Tatui, Florin Miron, Radu-Tudor Ionescu, Radu Timofte. 1261-1271 [doi]

High-Perceptual Quality JPEG Decoding via Posterior SamplingSean Man, Guy Ohayon, Theo Adrai, Michael Elad. 1272-1282 [doi]

Large Kernel Distillation Network for Efficient Single Image Super-ResolutionChengxing Xie, Xiaoming Zhang, Linze Li, Haiteng Meng, Tianlin Zhang, Tianrui Li 0001, Xiaole Zhao. 1283-1292 [doi]

OPDN: Omnidirectional Position-aware Deformable Network for Omnidirectional Image Super-ResolutionXiaopeng Sun, Weiqi Li, Zhenyu Zhang, Qiufang Ma, Xuhan Sheng, Ming Cheng, Haoyu Ma, Shijie Zhao, Jian Zhang, Junlin Li, Li Zhang 0006. 1293-1301 [doi]

Zoom-VQA: Patches, Frames and Clips Integration for Video Quality AssessmentKai Zhao, Kun Yuan, Ming Sun, Xing Wen. 1302-1310 [doi]

Pyramid Ensemble Structure for High Resolution Image Shadow RemovalShuhao Cui, Junshi Huang, Shuman Tian, Mingyuan Fan, Jiaqi Zhang, Li Zhu, Xiaoming Wei, Xiaolin Wei. 1311-1319 [doi]

NTIRE 2023 Challenge on Light Field Image Super-Resolution: Dataset, Methods and ResultsYingqian Wang, Longguang Wang, Zhengyu Liang, Jungang Yang, Radu Timofte, Yulan Guo, Kai Jin, Zeqiang Wei, Angulia Yang, Sha Guo, Mingzhi Gao, Xiuzhuang Zhou, Vinh Van Duong, Thuc Nguyen Huu, Jonghoon Yim, Byeungwoo Jeon, Yutong Liu, Zhen Cheng, Zeyu Xiao, Ruikang Xu, Zhiwei Xiong, Gaosheng Liu, Manchang Jin, Huanjing Yue, Jingyu Yang, Chen Gao, Shuo Zhang, Song Chang, Youfang Lin, Wentao Chao, Xuechun Wang, Guanghui Wang, Fuqing Duan, Wang Xia, Yan Wang, Peiqi Xia, Shunzhou Wang, Yao Lu, Ruixuan Cong, Hao Sheng 0001, Da Yang, Rongshan Chen, Sizhe Wang, Zhenglong Cui, Yilei Chen, Yongjie Lu, Dongjun Cai, Ping An, Ahmed Salem 0005, Hatem Ibrahem, Bilel Yagoub, Hyun Soo Kang, Zekai Zeng, Heng Wu. 1320-1335 [doi]

Learning Epipolar-Spatial Relationship for Light Field Image Super-ResolutionAhmed Salem 0005, Hatem Ibrahem, Hyun Soo Kang. 1336-1345 [doi]

NTIRE 2023 Challenge on Stereo Image Super-Resolution: Methods and ResultsLongguang Wang, Yulan Guo, Yingqian Wang, Juncheng Li, Shuhang Gu, Radu Timofte, Ming Cheng, Haoyu Ma, Qiufang Ma, Xiaopeng Sun, Shijie Zhao, Xuhan Sheng, Yukang Ding, Ming Sun, Xing Wen, Dafeng Zhang, Jia Li, Fan Wang, Zheng Xie, Zongyao He, Zidian Qiu, Zilin Pan, Zhihao Zhan, Xingyuan Xian, Zhi Jin, Yuanbo Zhou, Wei Deng, Ruofeng Nie, Jiajun Zhang, Qinquan Gao, Tong Tong 0001, Kexin Zhang 0003, Junpei Zhang, Rui Peng, Yanbiao Ma, Licheng Jiao, Haoran Bai, Lingshun Kong, Jinshan Pan, Jiangxin Dong, Jinhui Tang 0001, Pu Cao, Tianrui Huang, Lu Yang, Qing Song, Bingxin Chen, Chunhua He, Meiyun Chen, Zijie Guo, Shaojuan Luo, Chengzhi Cao, Kunyu Wang, Fanrui Zhang, Qiang Zhang, Nancy Mehta, Subrahmanyam Murala, Akshay Dudhane, Yujin Wang, Lingen Li, Garas Gendy, Nabil Sabor, Jingchao Hou, Guanghui He, Junyang Chen, Hao Li, Yukai Shi, Zhijing Yang, Wenbin Zou, Yunchen Zhang, Mingchao Jiang, ZhongXin Yu, Ming Tan, Hongxia Gao, Ziwei Luo, Fredrik K. Gustafsson, Zheng Zhao, Jens Sjölund, Thomas B. Schön, Jingxiang Chen, Bo Yang, XiSheryl Zhang, Chenghua Li, Weijun Yuan, Zhan Li, Ruting Deng, Jintao Zeng, Pulkit Mahajan, Sahaj Mistry, Shreyas Chatterjee, Vinit Jakhetiya, Badri N. Subudhi, Sunil Prasad Jaiswal, Zhao Zhang 0001, Huan Zheng, Suiyi Zhao, Yangcheng Gao, Yanyan Wei, Bo Wang, Gen Li, Aijin Li, Lei Sun, Ke Chen, Congling Tang, Yunzhe Li, Jun Chen, Yuan-Chun Chiang, Yi-Chung Chen, Zhi-Kai Huang, Hao-Hsiang Yang, I-Hsiang Chen, Sy-Yen Kuo, Yiheng Wang, Gang Zhu, Xingyi Yang, Songhua Liu, Yongcheng Jing, Xingyu Hu, Jianwen Song, Changming Sun, Arcot Sowmya, Seung-Ho Park, Xiaoyan Lei, Jingchao Wang, Chenbo Zhai, Yufei Zhang, Weifeng Cao, Wenlong Zhang. 1346-1372 [doi]

DistgEPIT: Enhanced Disparity Learning for Light Field Image Super-ResolutionKai Jin, Angulia Yang, Zeqiang Wei, Sha Guo, Mingzhi Gao, Xiuzhuang Zhou. 1373-1383 [doi]

NTIRE 2023 Challenge on HR Depth from Images of Specular and Transparent SurfacesPierluigi Zama Ramirez, Fabio Tosi, Luigi di Stefano, Radu Timofte, Alex Costanzino, Matteo Poggi, Samuele Salti, Stefano Mattoccia, Jun Shi, Dafeng Zhang, Yong A, Yixiang Jin, Dingzhe Li, Chao Li, Zhiwen Liu, Qi Zhang, Yixing Wang, Shi Yin. 1384-1395 [doi]

Cross-View Hierarchy Network for Stereo Image Super-ResolutionWenbin Zou, Hongxia Gao, Liang Chen, Yunchen Zhang, Mingchao Jiang, ZhongXin Yu, Ming Tan. 1396-1405 [doi]

A Data-Centric Solution to NonHomogeneous Dehazing via Vision TransformerYangyi Liu, Huan Liu, Liangyan Li, Zijun Wu, Jun Chen. 1406-1415 [doi]

Stereo Cross Global Learnable Attention Module for Stereo Image Super-ResolutionYuanbo Zhou, Yuyang Xue, Wei Deng, Ruofeng Nie, Jiajun Zhang, Jiaqi Pu, Qinquan Gao, Junlin Lan, Tong Tong 0001. 1416-1425 [doi]

SC-NAFSSR: Perceptual-Oriented Stereo Image Super-Resolution Using Stereo Consistency Guided NAFSSRZidian Qiu, Zongyao He, Zhihao Zhan, Zilin Pan, Xingyuan Xian, Zhi Jin. 1426-1435 [doi]

TSRFormer: Transformer Based Two-stage Refinement for Single Image Shadow RemovalHua-En Chang, Chia-Hsuan Hsieh, Hao-Hsiang Yang, I-Hsiang Chen, Yi-Chung Chen, Yu-Chiang Frank Wang, Zhi-Kai Huang, Wei-Ting Chen, Sy-Yen Kuo. 1436-1446 [doi]

Semantic Guidance Learning for High-Resolution Non-homogeneous DehazingHao-Hsiang Yang, I-Hsiang Chen, Chia-Hsuan Hsieh, Hua-En Chang, Yuan-Chun Chiang, Yi-Chung Chen, Zhi-Kai Huang, Wei-Ting Chen, Sy-Yen Kuo. 1447-1455 [doi]

Back to the future: a night photography rendering ISP without deep learningSimone Zini, Claudio Rota, Marco Buzzelli, Simone Bianco 0001, Raimondo Schettini. 1465-1473 [doi]

VDPVE: VQA Dataset for Perceptual Video EnhancementYixuan Gao, Yuqin Cao, Tengchuan Kou, Wei Sun 0029, Yunlong Dong, Xiaohong Liu, Xiongkuo Min, Guangtao Zhai. 1474-1483 [doi]

A Simple Transformer-style Network for Lightweight Image Super-resolutionGaras Gendy, Nabil Sabor, Jingchao Hou, Guanghui He. 1484-1494 [doi]

Efficient Deep Models for Real-Time 4K Image Super-Resolution. NTIRE 2023 Benchmark and ReportMarcos V. Conde, Eduard Zamfir, Radu Timofte, Daniel Motilla, Cen Liu, Zexin Zhang, Yunbo Peng, Yue Lin, Jiaming Guo, Xueyi Zou, Yuyi Chen, Yi Liu, Jia Hao, Youliang Yan, Yuanfan Zhang, Gen Li, Lei Sun, Lingshun Kong, Haoran Bai, Jinshan Pan, Jiangxin Dong, Jinhui Tang 0001, Mustafa Ayazoglu, Bahri Batuhan Bilecen, Mingxi Li, Yuhang Zhang, Xianjun Fan, Yankai Sheng, Long Sun, Zibin Liu, Weiran Gou, Shaoqing Li, Ziyao Yi, Yan Xiang, Dehui Kong, Ke Xu, Ganzorig Gankhuyag, Kihwan Yoon, Jin Zhang, Gaocheng Yu, Feng Zhang, Hongbin Wang, Zhou Zhou, Jiahao Chao, Hongfan Gao, Jiali Gong, Zhengfeng Yang, Zhenbing Zeng, Chengpeng Chen, Zichao Guo, Anjin Park, Yuqing Liu, Qi Jia, Hongyuan Yu, Xuanwu Yin, Dongyang Zhang, Ting Fu, Zhengxue Cheng, Shiai Zhu, Dajiang Zhou, Weichen Yu, Lin Ge, Jiahua Dong, Yajun Zou, Zhuoyuan Wu, Binnan Han, Xiaolin Zhang, Heng Zhang, Ben Shao, Shaolong Zheng, Daheng Yin, Baijun Chen, Mengyang Liu, Marian-Sergiu Nistor, Yi-Chung Chen, Zhi-Kai Huang, Yuan-Chun Chiang, Wei-Ting Chen, Hao-Hsiang Yang, Hua-En Chang, I-Hsiang Chen, Chia-Hsuan Hsieh, Sy-Yen Kuo, Tu Vo, Qingsen Yan, Yun Zhu, Jinqiu Su, Yanning Zhang, Cheng Zhang, Jiaying Luo, Youngsun Cho, Nakyung Lee, Kunlong Zuo. 1495-1521 [doi]

Towards Real-Time 4K Image Super-ResolutionEduard Zamfir, Marcos V. Conde, Radu Timofte. 1522-1532 [doi]

Quality assessment of enhanced videos guided by aesthetics and technical quality attributesMirko Agarla, Luigi Celona, Claudio Rota, Raimondo Schettini. 1533-1541 [doi]

BokehOrNot: Transforming Bokeh Effect with Image Transformer and Lens Metadata EmbeddingZhihao Yang, Wenyi Lian, Siyuan Lai. 1542-1550 [doi]

NTIRE 2023 Quality Assessment of Video Enhancement ChallengeXiaohong Liu, Xiongkuo Min, Wei Sun, Yulun Zhang, Kai Zhang, Radu Timofte, Guangtao Zhai, Yixuan Gao, Yuqin Cao, Tengchuan Kou, Yunlong Dong, Ziheng Jia, Yilin Li, Kai Zhao, Heng Cong, Hang Shi, Zhiliang Ma, Mirko Agarla, Zhiwei Huang, Hongye Liu, Ironhead Chuang, Haotian Fan, Shiqi Zhou, Yu Lai, Wenqi Wang, Haoning Wu, Chunzheng Zhu, Shiling Zhao, Hanene Brachemi Meftah, Tengfei Shi, Azadeh Mansouri. 1551-1569 [doi]

NTIRE 2023 Video Colorization ChallengeXiaoyang Kang, Xianhui Lin, Kai Zhang, Zheng Hui, Wangmeng Xiang, Jun-Yan He, Xiaoming Li, Peiran Ren, Xuansong Xie, Radu Timofte, Yixin Yang, Jinshan Pan, Zhong Zheng, Peng Qiyan, Jiangxin Zhang, Jinhui Dong, Jinjing Tan, Chi-Chen Lin, Lin Qipei Li, Qirong Liang, Ruipeng Gang, Xiaofeng Liu, Shuang Feng, Shuai Liu, Hao Wang, Chaoyu Feng, Furui Bai, Yuqian Zhang, Guangqi Shao, Xiaotao Wang, Lei Lei, Siqi Chen, Yu Zhang, Hanning Xu, Zheyuan Liu, Zhao Zhang 0001, Yan Luo, Zhichao Zuo. 1570-1581 [doi]

AsConvSR: Fast and Lightweight Super-Resolution Network with Assembled ConvolutionsJiaming Guo, Xueyi Zou, Yuyi Chen, Yi Liu, Jia Hao, Jianzhuang Liu, Youliang Yan. 1582-1592 [doi]

Mixer-based Local Residual Network for Lightweight Image Super-resolutionGaras Gendy, Nabil Sabor, Jingchao Hou, Guanghui He. 1593-1602 [doi]

NAFBET: Bokeh Effect Transformation with Parameter Analysis Block based on NAFNetXiangyu Kong, Fan Wang, Dafeng Zhang, Jinlong Wu, Zikun Liu. 1603-1612 [doi]

SB-VQA: A Stack-Based Video Quality Assessment Framework for Video EnhancementDing-Jiun Huang, Yu-Ting Kao, Tieh-Hung Chuang, Ya-Chun Tsai, Jing-Kai Lou, Shuen-Huei Guan. 1613-1622 [doi]

Bicubic++: Slim, Slimmer, Slimmest Designing an Industry-Grade Super-Resolution NetworkBahri Batuhan Bilecen, Mustafa Ayazoglu. 1623-1332 [doi]

Efficient Multi-Lens Bokeh Effect Rendering and TransformationTim Seizinger, Marcos V. Conde, Manuel Kolmet, Tom E. Bishop, Radu Timofte. 1633-1642 [doi]

Lens-to-Lens Bokeh Effect Transformation. NTIRE 2023 Challenge ReportMarcos V. Conde, Manuel Kolmet, Tim Seizinger, Tom E. Bishop, Radu Timofte, Xiangyu Kong, Dafeng Zhang, Jinlong Wu, Fan Wang, Juewen Peng, Zhiyu Pan, Chengxin Liu, Xianrui Luo, Huiqiang Sun, Liao Shen, Zhiguo Cao 0001, Ke Xian, Chaowei Liu, Zigeng Chen, Xingyi Yang, Songhua Liu, Yongcheng Jing, Michael Bi Mi, Xinchao Wang, Zhihao Yang, Wenyi Lian, Siyuan Lai, Haichuan Zhang, Trung Hoang, Amirsaeed Yazdani, Vishal Monga, Ziwei Luo, Fredrik K. Gustafsson, Zheng Zhao, Jens Sjölund, Thomas B. Schön, Yuxuan Zhao, Baoliang Chen, Yiqing Xu, JiXiangNiu. 1643-1659 [doi]

Multi-level Dispersion Residual Network for Efficient Image Super-ResolutionYanyu Mao, Nihao Zhang, Qian Wang 0019, Bendu Bai, Wanying Bai, Haonan Fang, Peng Liu, Mingyue Li, Shengbo Yan. 1660-1669 [doi]

TransER: Hybrid Model and Ensemble-based Sequential Learning for Non-homogenous DehazingTrung Hoang, Haichuan Zhang, Amirsaeed Yazdani, Vishal Monga. 1670-1679 [doi]

Refusion: Enabling Large-Size Realistic Image Restoration with Latent-Space Diffusion ModelsZiwei Luo, Fredrik K. Gustafsson, Zheng Zhao 0004, Jens Sjölund, Thomas B. Schön. 1680-1691 [doi]

DIPNet: Efficiency Distillation and Iterative Pruning for Image Super-ResolutionLei Yu, Xinpeng Li, Youwei Li, Ting Jiang, Qi Wu, Haoqiang Fan, Shuaicheng Liu. 1692-1701 [doi]

Hybrid Transformer and CNN Attention Network for Stereo Image Super-resolutionMing Cheng, Haoyu Ma, Qiufang Ma, Xiaopeng Sun, Weiqi Li, Zhenyu Zhang, Xuhan Sheng, Shijie Zhao, Junlin Li, Li Zhang 0006. 1702-1711 [doi]

Reparameterized Residual Feature Network For Lightweight Image Super-ResolutionWeijian Deng, Hongjie Yuan, Lunhui Deng, Zengtong Lu. 1712-1721 [doi]

RTTLC: Video Colorization with Restored Transformer and Test-time Local ConverterJinjing Li, Qirong Liang, Qipei Li, Ruipeng Gang, Ji Fang, Chi-Chen Lin, Shuang Feng, Xiaofeng Liu. 1722-1730 [doi]

NTIRE 2023 Challenge on 360° Omnidirectional Image and Video Super-Resolution: Datasets, Methods and ResultsMingdeng Cao, Chong Mou, Fanghua Yu, Xintao Wang, Yinqiang Zheng, Jian Zhang, Chao Dong, Gen Li, Ying Shan, Radu Timofte, Xiaopeng Sun, Weiqi Li, Zhenyu Zhang, Xuhan Sheng, Bin Chen, Haoyu Ma, Ming Cheng, Shijie Zhao, Wanwan Cui, Tianyu Xu, Chunyang Li, Long Bao, Heng Sun, Huaibo Huang, Xiaoqiang Zhou, Yuang Ai, Ran He, Renlong Wu, Yi Yang, Zhilu Zhang, Shuohao Zhang, Junyi Li, Yunjin Chen, Dongwei Ren, Wangmeng Zuo, Qian Wang, Hao-Hsiang Yang, Yi-Chung Chen, Zhi-Kai Huang, Wei-Ting Chen, Yuan-Chun Chiang, Hua-En Chang, I-Hsiang Chen, Chia-Hsuan Hsieh, Sy-Yen Kuo, Zebin Zhang, Jiaqi Zhang, Yuhui Wang, Shuhao Cui, Junshi Huang, Li Zhu, Shuman Tian, Wei Yu, Bingchun Luo. 1731-1745 [doi]

Lightweight Real-Time Image Super-Resolution Network for 4K ImagesGanzorig Gankhuyag, Kihwan Yoon, Jinman Park, Haeng Seon Son, Kyoungwon Min. 1746-1755 [doi]

Attention Retractable Frequency Fusion Transformer for Image Super ResolutionQiang Zhu, Pengfei Li, Qianhui Li. 1756-1763 [doi]

SwinFSR: Stereo Image Super-Resolution using SwinIR and Frequency Domain KnowledgeKe Chen, Liangyan Li, Huan Liu, Yunzhe Li, Congling Tang, Jun Chen. 1764-1774 [doi]

LSDIR: A Large Scale Dataset for Image RestorationYawei Li, Kai Zhang 0008, Jingyun Liang, Jiezhang Cao, Ce Liu, Rui Gong, Yulun Zhang, Hao Tang 0005, Yun Liu, Denis Demandolx, Rakesh Ranjan, Radu Timofte, Luc Van Gool. 1775-1787 [doi]

NTIRE 2023 Image Shadow Removal Challenge ReportFlorin-Alexandru Vasluianu, Tim Seizinger, Radu Timofte, Shuhao Cui, Junshi Huang, Shuman Tian, Mingyuan Fan, Jiaqi Zhang, Li Zhu, Xiaoming Wei, Xiaolin Wei, Ziwei Luo, Fredrik K. Gustafsson, Zheng Zhao, Jens Sjölund, Thomas B. Schön, Xiaoyi Dong, Xi Sheryl Zhang, Chenghua Li, Cong Leng, Woon-Ha Yeo, Wang-Taek Oh, Yeoreum Lee, Han-Cheol Ryu, Jinting Luo, Chengzhi Jiang, Mingyan Han, Qi Wu, Wenjie Lin, Lei Yu, Xinpeng Li, Ting Jiang, Haoqiang Fan, Shuaicheng Liu, Shuning Xu, Binbin Song, Xiangyu Chen, Shile Zhang, Jiantao Zhou, Zhao Zhang 0001, Suiyi Zhao, Huan Zheng, Yangcheng Gao, Yanyan Wei, Bo Wang, Jiahuan Ren, Yan Luo, Yuki Kondo, Riku Miyata, Fuma Yasue, Taito Naruki, Norimichi Ukita, Hua-En Chang, Hao-Hsiang Yang, Yi-Chung Chen, Yuan-Chun Chiang, Zhi-Kai Huang, Wei-Ting Chen, I-Hsiang Chen, Chia-Hsuan Hsieh, Sy-Yen Kuo, Li Xianwei, Huiyuan Fu, Chunlin Liu, Huadong Ma, Binglan Fu, Huiming He, Mengjia Wang, Wenxuan She, Yu Liu, Sabari Nathan, Priya Kansal, Zhongjian Zhang, Huabin Yang, Yan Wang, Yanru Zhang, Shruti S. Phutke, Ashutosh Kulkarni, MD Raqib Khan, Subrahmanyam Murala, Santosh Kumar Vipparthi, Heng Ye, Zixi Liu, Xingyi Yang, Songhua Liu, Yinwei Wu, Yongcheng Jing, Qianhao Yu, Naishan Zheng, Jie Huang 0017, Yuhang Long, Mingde Yao, Feng Zhao, Bowen Zhao, Nan Ye, Ning Shen, Yanpeng Cao, Tong Xiong, Weiran Xia, Dingwen Li, Shuchen Xia. 1788-1807 [doi]

NTIRE 2023 HR NonHomogeneous Dehazing Challenge ReportCodruta O. Ancuti, Cosmin Ancuti, Florin-Alexandru Vasluianu, Radu Timofte, Han Zhou, Wei Dong, Yangyi Liu, Jun Chen, Huan Liu, Liangyan Li, Zijun Wu, Yubo Dong, Yuyan Li, Tian Qiu, Yu He, Yonghong Lu, Yinwei Wu, Zhenxiang Jiang, Songhua Liu, Xingyi Yang, Yongcheng Jing, Bilel Benjdira, Anas M. Ali, Anis Koubaa, Hao-Hsiang Yang, I-Hsiang Chen, Wei-Ting Chen, Zhi-Kai Huang, Yi-Chung Chen, Chia-Hsuan Hsieh, Hua-En Chang, Yuan-Chun Chiang, Sy-Yen Kuo, Yu Guo, Yuan Gao, Ryan Wen Liu, Yuxu Lu, Jingxiang Qu, Shengfeng He, Wenqi Ren, Trung Hoang, Haichuan Zhang, Amirsaeed Yazdani, Vishal Monga, Lehan Yang, Alex Jiahao Wu, Tiancheng Mai, Xiaofeng Cong, Xuemeng Yin, Xuefei Yin, Hazim Emad, Ahmed Abdallah, Yahya Yasser, Dalia Elshahat, Esraa Elbaz, Zhan Li, Wenqing Kuang, Ziwei Luo, Fredrik K. Gustafsson, Zheng Zhao, Jens Sjölund, Thomas B. Schön, Zhao Zhang, Yanyan Wei, Junhu Wang, Suiyi Zhao, Huan Zheng, Jin Guo, Yangfan Sun, Tianli Liu, Dejun Hao, Kui Jiang, Anjali Sarvaiya, Kalpesh Prajapati, Ratnadeep Patra, Pragnesh Barik, Chaitanya Rathod, Kishor P. Upla, Kiran B. Raja, Raghavendra Ramachandra, Christoph Busch 0001. 1808-1825 [doi]

WSRD: A Novel Benchmark for High Resolution Image Shadow RemovalFlorin-Alexandru Vasluianu, Tim Seizinger, Radu Timofte. 1826-1835 [doi]

Temporal Consistent Automatic Video Colorization via Semantic CorrespondenceYu Zhang, Siqi Chen, Mingdao Wang, Xianlin Zhang, Chuang Zhu, Yue Zhang, Xueming Li. 1836-1845 [doi]

Video Quality Assessment Based on Swin Transformer with Spatio-Temporal Feature Fusion and Data AugmentationWei Wu, Shuming Hu, PengXiang Xiao, Sibin Deng, Yilin Li, Ying Chen, Kai Li. 1846-1854 [doi]

Streamlined Global and Local Features Combinator (SGLC) for High Resolution Image DehazingBilel Benjdira, Anas M. Ali, Anis Koubaa. 1855-1864 [doi]

NTIRE 2023 Challenge on Image Super-Resolution (×4): Methods and ResultsYulun Zhang, Kai Zhang, Zheng Chen, Yawei Li, Radu Timofte, Junpei Zhang, Kexin Zhang 0003, Rui Peng, Yanbiao Ma, Licheng Jia, Huaibo Huang, Xiaoqiang Zhou, Yuang Ai, Ran He, Yajun Qiu, Qiang Zhu, Pengfei Li, Qianhui Li, Shuyuan Zhu, Dafeng Zhang, Jia Li, Fan Wang, Chunmiao Li, Taehyung Kim, Jungkeong Kil, Eon Kim, Yeonseung Yu, Beomyeol Lee, Subin Lee, Seokjae Lim, Somi Chae, Heungjun Choi, Zhi-Kai Huang, YiChung Chen, Yuan-Chun Chiang, Hao-Hsiang Yang, Wei-Ting Chen, Hua-En Chang, I-Hsiang Chen, Chia-Hsuan Hsieh, Sy-Yen Kuo, Ui-Jin Choi, Marcos V. Conde, Sunder Ali Khowaja, Jiseok Yoon, Ik Hyun Lee, Garas Gendy, Nabil Sabor, Jingchao Hou, Guanghui He, Zhao Zhang 0001, Baiang Li, Huan Zheng, Suiyi Zhao, Yangcheng Gao, Yanyan Wei, Jiahuan Ren, Jiayu Wei, Yanfeng Li, Jia Sun, Zhanyi Cheng, Zhiyuan Li, Xu Yao, Xinyi Wang, Danxu Li, Xuan Cui, Jun Cao, Cheng Li, Jianbin Zheng, Anjali Sarvaiya, Kalpesh Prajapati, Ratnadeep Patra, Pragnesh Barik, Chaitanya Rathod, Kishor P. Upla, Kiran B. Raja, Raghavendra Ramachandra, Christoph Busch 0001. 1865-1884 [doi]

SCANet: Self-Paced Semi-Curricular Attention Network for Non-Homogeneous Image DehazingYu Guo, Yuan Gao, Ryan Wen Liu, Yuxu Lu, Jingxiang Qu, Shengfeng He, Wenqi Ren. 1885-1894 [doi]

Breaking Through the Haze: An Advanced Non-Homogeneous Dehazing Method based on Fast Fourier Convolution and ConvNeXtHan Zhou, Wei Dong, Yangyi Liu, Jun Chen. 1895-1904 [doi]

NTIRE 2023 Challenge on Image Denoising: Methods and ResultsYawei Li, Yulun Zhang, Radu Timofte, Luc Van Gool, Zhijun Tu, Kunpeng Du, Hailing Wang, Hanting Chen, Wei Li, Xiaofei Wang, Jie Hu, Yunhe Wang, Xiangyu Kong, Jinlong Wu, Dafeng Zhang, Jianxing Zhang, Shuai Liu, Furui Bai, Chaoyu Feng, Hao Wang, Yuqian Zhang, Guangqi Shao, Xiaotao Wang, Lei Lei, Rongjian Xu, Zhilu Zhang, Yunjin Chen, Dongwei Ren, Wangmeng Zuo, Qi Wu, Mingyan Han, Shen Cheng, HaiPeng Li, Ting Jiang, Chengzhi Jiang, Xinpeng Li, Jinting Luo, Wenjie Lin, Lei Yu, Haoqiang Fan, Shuaicheng Liu, Aditya Arora, Syed Waqas Zamir, Javier Vazquez-Corral, Konstantinos G. Derpanis, Michael S. Brown, Hao Li, Zhihao Zhao, Jinshan Pan, Jiangxin Dong, Jinhui Tang 0001, Bo Yang, Jingxiang Chen, Chenghua Li, Xi Zhang, Zhao Zhang 0001, Jiahuan Ren, Zhicheng Ji, Kang Miao, Suiyi Zhao, Huan Zheng, Yanyan Wei, Kangliang Liu, Xiangcheng Du, Sijie Liu, Yingbin Zheng, Xingjiao Wu, Cheng Jin, Rajeev Irny, Sriharsha Koundinya, Vighnesh Kamath, Gaurav Khandelwal, Sunder Ali Khowaja, Jiseok Yoon, Ik Hyun Lee, Shijie Chen, Chengqiang Zhao, Huabin Yang, Zhongjian Zhang, Junjia Huang, Yanru Zhang. 1905-1921 [doi]

NTIRE 2023 Challenge on Efficient Super-Resolution: Methods and ResultsYawei Li, Yulun Zhang, Radu Timofte, Luc Van Gool, Lei Yu, Youwei Li, Xinpeng Li, Ting Jiang, Qi Wu, Mingyan Han, Wenjie Lin, Chengzhi Jiang, Jinting Luo, Haoqiang Fan, Shuaicheng Liu, Yucong Wang, Minjie Cai, Mingxi Li, Yuhang Zhang, Xianjun Fan, Yankai Sheng, Yanyu Mao, Nihao Zhang, Qian Wang, Mingjun Zheng, Long Sun, Jinshan Pan, Jiangxin Dong, Jinhui Tang 0001, Zhongbao Yang, Yan Wang, Erlin Pan, Qixuan Cai, Xinan Dai, Magauiya Zhussip, Nikolay Kalyazin, Dmitry Vyal, Xueyi Zou, Youliang Yan, Heaseo Chung, Jin Zhang, Gaocheng Yu, Feng Zhang, Hongbin Wang, Bohao Liao, Zhibo Du, Yu-Liang Wu, Gege Shi, Long Peng, Yang Wang, Yang Cao, Zhengjun Zha, Zhi-Kai Huang, Yi-Chung Chen, Yuan-Chun Chiang, Hao-Hsiang Yang, Wei-Ting Chen, Hua-En Chang, I-Hsiang Chen, Chia-Hsuan Hsieh, Sy-Yen Kuo, Xin Liu, Jiahao Pan, Hongyuan Yu, Weichen Yu, Lin Ge, Jiahua Dong, Yajun Zou, Zhuoyuan Wu, Binnan Han, Xiaolin Zhang, Heng Zhang, Xuanwu Yin, Kunlong Zuo, Weijian Deng, Hongjie Yuan, Zengtong Lu, Mingyu Ouyang, Wenzhuo Ma, Nian Liu, Hanyou Zheng, Yuantong Zhang, Junxi Zhang, Zhenzhong Chen, Garas Gendy, Nabil Sabor, Jingchao Hou, Guanghui He, Yurui Zhu, Xi Wang, Xueyang Fu, Zheng-Jun Zha, Daheng Yin, Mengyang Liu, Baijun Chen, Ao Li, Lei Luo, Kangjun Jin, Ce Zhu, Xiaoming Zhang, Chengxing Xie, Linze Li, Haiteng Meng, Tianlin Zhang, Tianrui Li 0001, Xiaole Zhao, Zhao Zhang, Baiang Li, Huan Zheng, Suiyi Zhao, Yangcheng Gao, Jiahuan Ren, Kang Hu, Jingpeng Shi, Zhijian Wu, Dingjiang Huang, Jinchen Zhu, Hui Li, Qianru Xv, Tianle Liu, Gang Wu, Junpeng Jiang, Xianming Liu, Junjun Jiang, Mingjian Zhang, Shizhuang Weng, Jing Hu, Chengxu Wu, Qinrui Fan, Chengming Feng, Ziwei Luo, Shu Hu, Siwei Lyu, Xi Wu, Xin Wang. 1922-1960 [doi]

Spatial-Angular Multi-Scale Mechanism for Light Field Spatial Super-ResolutionChen Gao, Youfang Lin, Song Chang, Shuo Zhang 0003. 1961-1970 [doi]

A Single Residual Network with ESA Modules and DistillationYucong Wang, Minjie Cai. 1971-1981 [doi]

NTIRE 2023 Challenge on Night Photography RenderingAlina Shutova, Egor I. Ershov, Georgy Perevozchikov, Ivan Ermakov, Nikola Banic, Radu Timofte, Richard Collins, Maria Efimova, Arseniy P. Terekhin, Simone Zini, Claudio Rota, Marco Buzzelli, Simone Bianco 0001, Raimondo Schettini, Chunxia Lei, Tingniao Wang, Song Wang, Shuai Liu 0009, Chaoyu Feng, Guangqi Shao, Hao Wang, Xiaotao Wang, Lei Lei, Lu Xu, Chao Zhang, Yasi Wang, Jin Guo, Yangfan Sun, Tianli Liu, Hao Dejun, Furkan Kinli, Baris Özcan, Furkan Kiraç, Hyerin Chung, Nakyung Lee, Sungkeun Kwak, Marcos V. Conde, Tim Seizinger, Florin-Alexandru Vasluianu, Omar Elezabi, Chia-Hsuan Hsieh, Wei-Ting Chen, Hao-Hsiang Yang, Zhi-Kai Huang, Hua-En Chang, I-Hsiang Chen, Yi-Chung Chen, Yuan-Chun Chiang. 1982-1993 [doi]

CrisisHateMM: Multimodal Analysis of Directed and Undirected Hate Speech in Text-Embedded Images from Russia-Ukraine ConflictAashish Bhandari, Siddhant Bikram Shah, Surendrabikram Thapa, Usman Naseem, Mehwish Nasim. 1994-2003 [doi]

Prioritised Moderation for Online AdvertisingPhanideep Gampa, Akash Anil Valsangkar, Shailesh Choubey, Pooja A. 2004-2012 [doi]

L1BSR: Exploiting Detector Overlap for Self-Supervised Single-Image Super-Resolution of Sentinel-2 L1B ImageryNgoc-Long Nguyen, Jérémy Anger, Axel Davy, Pablo Arias 0001, Gabriele Facciolo. 2013-2023 [doi]

APPLeNet: Visual Attention Parameterized Prompt Learning for Few-Shot Remote Sensing Image Generalization using CLIPMainak Singha, Ankit Jha, Bhupendra Solanki, Shirsha Bose, Biplab Banerjee. 2024-2034 [doi]

Multi-Date Earth Observation NeRF: The Detail Is in the ShadowsRoger Marí, Gabriele Facciolo, Thibaud Ehret. 2035-2045 [doi]

Cascaded Zoom-in Detector for High Resolution Aerial ImagesAkhil Meethal, Eric Granger, Marco Pedersoli. 2046-2055 [doi]

Handheld Burst Super-Resolution Meets Multi-Exposure Satellite ImageryJamy Lafenetre, Ngoc-Long Nguyen, Gabriele Facciolo, Thomas Eboli. 2056-2064 [doi]

Solar Irradiance Anticipative TransformerThomas M. Mercier, Tasmiat Rahman, Amin Sabet. 2065-2074 [doi]

GeoMultiTaskNet: remote sensing unsupervised domain adaptation using geographical coordinatesValerio Marsocci, Nicolas Gonthier, Anatol Garioud, Simone Scardapane, Clément Mallet. 2075-2085 [doi]

UnCRtainTS: Uncertainty Quantification for Cloud Removal in Optical Satellite Time SeriesPatrick Ebel 0002, Vivien Sainte Fare Garnot, Michael Schmitt 0003, Jan Dirk Wegner, Xiao Xiang Zhu. 2086-2096 [doi]

DeepSim-Nets: Deep Similarity Networks for Stereo Image MatchingMohamed Ali Chebbi, Ewelina Rupnik, Marc Pierrot Deseilligny, Paul Lopes. 2097-2105 [doi]

Deep unfolding for hyper sharpening using a high-frequency injection moduleJamila Mifdal, Marc Tomás-Cruz, Alessandro Sebastianelli, Bartomeu Coll, Joan Duran. 2106-2115 [doi]

Seasonal Domain Shift in the Global South: Dataset and Deep Features AnalysisGeorgios Voulgaris, Andy Philippides, Jonathan Dolley, Jeremy Reffin, Fiona Marshall, Novi Quadrianto. 2116-2124 [doi]

Comprehensive quality assessment of optical satellite imagery using weakly supervised video learningValerie Pasquarella, Christopher F. Brown, Wanda Czerwinski, William Rucklidge. 2125-2135 [doi]

Multi-Modal Multi-Objective Contrastive Learning for Sentinel-1/2 ImageryJonathan Prexl, Michael Schmitt 0003. 2136-2144 [doi]

Sparse Multimodal Vision Transformer for Weakly Supervised Semantic SegmentationJoëlle Hanna, Michael Mommert, Damian Borth. 2145-2154 [doi]

Inferring the past: a combined CNN-LSTM deep learning framework to fuse satellites for historical inundation mappingJonathan Giezendanner, Rohit Mukherjee, Matthew Purri, Mitchell Thomas, Max Mauerman, A. K. M. Saiful Islam, Beth Tellman. 2155-2165 [doi]

Masked Vision Transformers for Hyperspectral Image ClassificationLinus Scheibenreif, Michael Mommert, Damian Borth. 2166-2176 [doi]

VideoMatt: A Simple Baseline for Accessible Real-Time Video MattingJiachen Li 0003, Marianna Ohanyan, Vidit Goel, Shant Navasardyan, Yunchao Wei, Humphrey Shi. 2177-2186 [doi]

QuickSRNet: Plain Single-Image Super-Resolution Architecture for Faster Inference on Mobile PlatformsGuillaume Berger, Manik Dhingra, Antoine Mercier 0005, Yashesh Savani, Sunny Panchal, Fatih Porikli. 2187-2196 [doi]

Real-time Segmenting Human Portrait at AnywhereRuifeng Yuan, Yuhao Cheng, Yiqiang Yan, Haiyan Liu. 2197-2203 [doi]

High-efficiency Device-Cloud Collaborative Transformer ModelPenghao Jiang, Ke Xin, Chunxi Li, Yinsi Zhou. 2204-2210 [doi]

MobileViG: Graph-Based Sparse Attention for Mobile Vision ApplicationsMustafa Munir, William Avery, Radu Marculescu. 2211-2219 [doi]

DIFT: Dynamic Iterative Field Transforms for Memory Efficient Optical FlowRisheek Garrepalli, Jisoo Jeong, Rajeswaran C. Ravindran, Jamie Menjay Lin, Fatih Porikli. 2220-2229 [doi]

PerfHD: Efficient ViT Architecture Performance Ranking using Hyperdimensional ComputingDongning Ma, Pengfei Zhao, Xun Jiao. 2230-2237 [doi]

AutoShot: A Short Video Dataset and State-of-the-Art Shot Boundary DetectionWentao Zhu 0001, Yufang Huang, Xiufeng Xie, Wenxian Liu, Jincan Deng, Debing Zhang, Zhangyang Wang, Ji Liu 0002. 2238-2247 [doi]

Pareto-aware Neural Architecture Generation for Diverse Computational BudgetsYong Guo, Yaofo Chen, Yin Zheng, Qi Chen, Peilin Zhao, JunZhou Huang, Jian Chen, Mingkui Tan. 2248-2258 [doi]

Exploring the Potential of Neural Dataset SearchRyosuke Yamada, Risa Shinoda, Hirokatsu Kataoka. 2259-2266 [doi]

2-Aug: Adaptive Automated Data AugmentationLujun Li, Anggeng Li. 2267-2274 [doi]

Hardware-aware NAS by Genetic Optimisation with a Design Space Exploration SimulatorLotte Hendrickx, Arne Symons, Wiebe Van Ranst, Marian Verhelst, Toon Goedemé. 2275-2283 [doi]

Systematic Architectural Design of Scale Transformed Attention Condenser DNNs via Multi-Scale Class Representational Response Similarity AnalysisAndrew Hryniowski, Alexander Wong. 2284-2292 [doi]

Fast GraspNeXt: A Fast Self-Attention Neural Network Architecture for Multi-task Learning in Computer Vision Tasks for Robotic Grasping on the EdgeAlexander Wong, Yifan Wu, Saad Abbasi, Saeejith Nair, Yuhao Chen, Mohammad Javad Shafiee. 2293-2297 [doi]

Certified Adversarial Robustness Within Multiple Perturbation BoundsSoumalya Nandi, Sravanti Addepalli, Harsh Rangwani, R. Venkatesh Babu. 2298-2305 [doi]

Adversarial Defense in Aerial DetectionYuwei Chen, Shiyong Chu. 2306-2313 [doi]

Investigating Catastrophic Overfitting in Fast Adversarial Training: A Self-fitting PerspectiveZhengbao He, Tao Li, Sizhe Chen, Xiaolin Huang. 2314-2321 [doi]

Universal Watermark Vaccine: Universal Adversarial Perturbations for Watermark ProtectionJianbo Chen, Xinwei Liu, Siyuan Liang, Xiaojun Jia, Yuan Xun. 2322-2329 [doi]

Robustness with Query-efficient Adversarial Attack using Reinforcement LearningSoumyendu Sarkar, Ashwin Ramesh Babu, Sajad Mousavi, Sahand Ghorbanpour, Vineet Gundecha, Antonio Guillen, Ricardo Luna Gutierrez, Avisek Naug. 2330-2337 [doi]

Don't FREAK Out: A Frequency-Inspired Approach to Detecting Backdoor Poisoned Samples in DNNsHasan Abed Al Kader Hammoud, Adel Bibi, Philip H. S. Torr, Bernard Ghanem. 2338-2345 [doi]

Exploring Diversified Adversarial Robustness in Neural Networks via Robust Mode ConnectivityRen Wang 0008, Yuxuan Li, Sijia Liu 0001. 2346-2352 [doi]

How many dimensions are required to find an adversarial example?Charles Godfrey, Henry Kvinge, Elise Bishoff, Myles Mckay, Davis Brown, Tim Doster, Eleanor Byler. 2353-2360 [doi]

An Extended Study of Human-like Behavior under Adversarial TrainingPaul Gavrikov, Janis Keuper, Margret Keuper. 2361-2368 [doi]

Deep Convolutional Sparse Coding Networks for Interpretable Image FusionZixiang Zhao, Jiang-She Zhang 0001, Haowen Bai, Yicheng Wang, Yukun Cui, Lilun Deng, Kai Sun 0007, Chunxia Zhang 0002, Junmin Liu, Shuang Xu. 2369-2377 [doi]

Generating Adversarial Samples in Mini-Batches May Be Detrimental To Adversarial RobustnessTimothy Redgrave, Colton Crum. 2378-2384 [doi]

A Pilot Study of Query-Free Adversarial Attack against Stable DiffusionHaomin Zhuang, Yihua Zhang, Sijia Liu 0001. 2385-2392 [doi]

Implications of Solution Patterns on Adversarial RobustnessHengyue Liang, Buyun Liang, Ju Sun, Ying Cui, Tim Mitchell. 2393-2400 [doi]

Are Labels Needed for Incremental Instance Learning?Mert Kilickaya, Joaquin Vanschoren. 2401-2409 [doi]

A Closer Look at Rehearsal-Free Continual LearningJames Seale Smith, Junjiao Tian, Shaunak Halbe, Yen-Chang Hsu, Zsolt Kira. 2410-2420 [doi]

3Former: Debiased Dual Distilled Transformer for Incremental LearningAbdelrahman Mohamed, Rushali Grandhe, K. J. Joseph, Salman H. Khan 0001, Fahad Shahbaz Khan. 2421-2430 [doi]

How Efficient Are Today's Continual Learning Algorithms?Md Yousuf Harun, Jhair Gallardo, Tyler L. Hayes, Christopher Kanan. 2431-2436 [doi]

Online Distillation with Continual Learning for Cyclic Domain ShiftsJoachim Houyon, Anthony Cioppa, Yasir Ghunaim, Motasem Alfarra, Anaïs Halin, Maxim Henry, Bernard Ghanem, Marc Van Droogenbroeck. 2437-2446 [doi]

Continual Learning for LiDAR Semantic Segmentation: Class-Incremental and Coarse-to-Fine strategies on Sparse DataElena Camuffo, Simone Milani. 2447-2456 [doi]

Continual Domain Adaptation through Pruning-aided Domain-specific Weight ModulationPrasanna B, Sunandini Sanyal, R. Venkatesh Babu. 2457-2463 [doi]

CoVIO: Online Continual Learning for Visual-Inertial OdometryNiclas Vödisch, Daniele Cattaneo 0001, Wolfram Burgard, Abhinav Valada. 2464-2473 [doi]

Just a Glimpse: Rethinking Temporal Information for Video Continual LearningLama Alssum, Juan León Alcázar, Merey Ramazanova, Chen Zhao 0002, Bernard Ghanem. 2474-2483 [doi]

SCALE: Online Self-Supervised Lifelong Learning without Prior KnowledgeXiaofan Yu, Yunhui Guo, Sicun Gao, Tajana Rosing. 2484-2495 [doi]

CLVOS23: A Long Video Object Segmentation Dataset for Continual LearningAmir Nazemi, Zeyad Moustafa, Paul W. Fieguth. 2496-2505 [doi]

Density Map Distillation for Incremental Object CountingChenshen Wu, Joost van de Weijer 0001. 2506-2515 [doi]

Simulating Task-Free Continual Learning Streams From Existing DatasetsAristotelis Chrysakis, Marie-Francine Moens. 2516-2524 [doi]

Lifelong Learning of Task-Parameter Relationships for Knowledge TransferShikhar Srivastava 0001, Mohammad Yaqub, Karthik Nandakumar. 2525-2534 [doi]

TFRGAN: Leveraging Text Information for Blind Face Restoration with Extreme DegradationChengxing Xie, Qian Ning, Weisheng Dong, Guangming Shi. 2535-2545 [doi]

The MONET dataset: Multimodal drone thermal dataset recorded in rural scenariosLuigi Riz, Andrea Caraffa, Matteo Bortolon, Mohamed Lamine Mekhalfi, Davide Boscaini, André Moura, José Antunes, André Dias, Hugo Silva 0003, Andreas Leonidou, Christos Constantinides, Christos Keleshis, Dante Abate, Fabio Poiesi. 2546-2554 [doi]

SSGVS: Semantic Scene Graph-to-Video SynthesisYuren Cong, Jinhui Yi, Bodo Rosenhahn, Michael Ying Yang. 2555-2565 [doi]

Multi Event Localization by Audio-Visual Fusion with Omnidirectional Camera and Microphone ArrayWenru Zheng, Ryota Yoshihashi, Rei Kawakami, Ikuro Sato, Asako Kanezaki. 2566-2574 [doi]

Dynamic Multimodal FusionZihui Xue, Radu Marculescu. 2575-2584 [doi]

Exposing and Mitigating Spurious Correlations for Cross-Modal RetrievalJae-Myung Kim, A. Sophia Koepke, Cordelia Schmid, Zeynep Akata. 2585-2595 [doi]

Adapting Grounded Visual Question Answering Models to Low Resource LanguagesYing Wang, Jonas Pfeiffer, Nicolas Carion, Yann LeCun, Aishwarya Kamath. 2596-2605 [doi]

SEM-POS: Grammatically and Semantically Correct Video CaptioningAsmar Nadeem, Adrian Hilton 0001, Robert Dawes, Graham A. Thomas, Annin Mustafa. 2606-2616 [doi]

Robust Multiview Multimodal Driver Monitoring System Using Masked Multi-Head Self-AttentionYiming Ma, Victor Sanchez, Soodeh Nikan, Devesh Upadhyay, Bhushan Atote, Tanaya Guha. 2617-2625 [doi]

Learning CLIP Guided Visual-Text Fusion Transformer for Video-based Pedestrian Attribute RecognitionJun Zhu, Jiandong Jin, Zihan Yang, Xiaohao Wu, Xiao Wang. 2626-2629 [doi]

Causalainer: Causal Explainer for Automatic Video SummarizationJia-Hong Huang, Chao-Han Huck Yang, Pin-Yu Chen, Min-Hung Chen, Marcel Worring. 2630-2636 [doi]

Is Multimodal Vision Supervision Beneficial to Language?Avinash Madasu, Vasudev Lal. 2637-2642 [doi]

Abstract Visual Reasoning Enabled by LanguageGiacomo Camposampiero, Loïc Houmard, Benjamin Estermann, Joël Mathys, Roger Wattenhofer. 2643-2647 [doi]

Multimodal Integration of Human-Like Attention in Visual Question AnsweringEkta Sood, Fabian Kögel, Philipp Müller 0001, Dominike Thomas, Mihai Bâce, Andreas Bulling. 2648-2658 [doi]

Kappa Angle Regression with Ocular Counter-Rolling Awareness for Gaze EstimationShiwei Jin, Ji Dai, Truong Nguyen 0001. 2659-2668 [doi]

GazeCaps: Gaze Estimation with Self-Attention-Routed CapsulesHengfei Wang, Jun O. Oh, Hyung Jin Chang, Jin Hee Na, Minwoo Tae, Zhongqun Zhang, Sang-Il Choi. 2669-2677 [doi]

Where are they looking in the 3D space?Nora Horanyi, Linfang Zheng, Eunji Chong, Ales Leonardis, Hyung Jin Chang. 2678-2687 [doi]

EFE: End-to-end Frame-to-Gaze EstimationHaldun Balim, Seonwook Park, Xi Wang, Xucong Zhang, Otmar Hilliges. 2688-2697 [doi]

Octree Transformer: Autoregressive 3D Shape Generation on Hierarchically Structured SequencesMoritz Ibing, Gregor Kobsik, Leif Kobbelt. 2698-2707 [doi]

3DSSR: 3D Subscene RetrievalReza Asad, Manolis Savva. 2708-2716 [doi]

Attention-based Part Assembly for 3D Volumetric Shape ModelingChengzhi Wu, Junwei Zheng, Julius Pfrommer, Jürgen Beyerer. 2717-2726 [doi]

SepicNet: Sharp Edges Recovery by Parametric Inference of Curves in 3D ShapesKseniya Cherenkova, Elona Dupont, Anis Kacem 0001, Ilya Arzhannikov, Gleb Gusev, Djamila Aouada. 2727-2735 [doi]

IPD-Net: SO(3) Invariant Primitive Decompositional Network for 3D Point CloudsRamesh Ashok Tabib, Nitishkumar Upasi, Tejas Anvekar, Dikshit Hegde, Uma Mudenagudi. 2736-2744 [doi]

OO-dMVMT: A Deep Multi-view Multi-task Classification Framework for Real-time 3D Hand Gesture Classification and SegmentationFederico Cunico, Federico Girella, Andrea Avogaro, Marco Emporio, Andrea Giachetti 0001, Marco Cristani. 2745-2754 [doi]

Three Recipes for Better 3D Pseudo-GTs of 3D Human Mesh Estimation in the WildGyeongsik Moon, Hongsuk Choi, Sanghyuk Chun, Jiyoung Lee, Sangdoo Yun. 2755-2764 [doi]

3DSAINT Representation for 3D Point CloudsChandra Kambhamettu. 2765-2774 [doi]

Face Image Lighting Enhancement Using a 3D ModelQiulin Chen, Jan P. Allebach. 2775-2784 [doi]

BOP Challenge 2022 on Detection, Segmentation and Pose Estimation of Specific Rigid ObjectsMartin Sundermeyer, Tomás Hodan, Yann Labbé, Gu Wang 0001, Eric Brachmann, Bertram Drost, Carsten Rother, Jirí Matas. 2785-2794 [doi]

Dual Attention Poser: Dual Path Body Tracking Based on AttentionXinhan Di, Xiaokun Dai, Xinkang Zhang, Xinrong Chen. 2795-2804 [doi]

Efficient Multi-exposure Image Fusion via Filter-dominated Fusion and Gradient-driven Unsupervised LearningKaiwen Zheng, Jie Huang 0017, Hu Yu, Feng Zhao 0004. 2805-2814 [doi]

Asymmetric Color Transfer with Consistent Modality LearningKaiwen Zheng, Jie Huang 0017, Man Zhou, Feng Zhao 0004. 2815-2823 [doi]

FF-Former: Swin Fourier Transformer for Nighttime Flare RemovalDafeng Zhang, Jia OuYang, Guanqun Liu, Xiaobing Wang, Xiangyu Kong, Zhezhu Jin. 2824-2832 [doi]

OTST: A Two-Phase Framework for Joint Denoising and Remosaicing in RGBW CFAZhihao Fan, Xun Wu, Fanqing Meng, Yaqi Wu, Feng Zhang. 2833-2842 [doi]

Hard-negative Sampling with Cascaded Fine-Tuning Network to Boost Flare Removal Performance in the Nighttime ImagesSoonyong Song, Heechul Bae. 2843-2852 [doi]

MIPI 2023 Challenge on Nighttime Flare Removal: Methods and ResultsYuekun Dai, Chongyi Li, Shangchen Zhou, Ruicheng Feng, Qingpeng Zhu, Qianhui Sun, Wenxiu Sun, Chen Change Loy, Jinwei Gu, Shuai Liu, Hao Wang, Chaoyu Feng, Luyang Wang, Guangqi Shao, Chenguang Zhang, Xiaotao Wang, Lei Lei, Dafeng Zhang, Xiangyu Kong, Guanqun Liu, Mengmeng Bai, Jia OuYang, Xiaobing Wang, Jiahui Yuan, Xinpeng Li, Chengzhi Jiang, Ting Jiang, Wenjie Lin, Qi Wu, Mingyan Han, Jinting Luo, Lei Yu, Haoqiang Fan, Shuaicheng Liu, Bo Yan, Zhuang Li, Yadong Li, Hongbin Wang, Soonyong Song, Minghan Fu, Rayyan Azam Khan, Fang-Xiang Wu, Zhao Zhang 0001, Suiyi Zhao, Huan Zheng, Yangcheng Gao, Yanyan Wei, Jiahuan Ren, Bo Wang, Yan Luo, Shuaibo Gao, Wenhui Wu, Sicong Kang, Nikhil Akalwadi, Ankit Raichur, Vinod Patil, Allabakash G, Swaroop A, Amogh Joshi, Chaitra Desai, Ramesh Ashok Tabib, Ujwala Patil, Uma Mudenagudi, Sicheng Li, Ruoxi Zhu, Jiazheng Lian, Shusong Xu, Zihao Liu, Sabari Nathan, Priya Kansal. 2853-2863 [doi]

MIPI 2023 Challenge on RGB+ToF Depth Completion: Methods and ResultsQingpeng Zhu, Wenxiu Sun, Yuekun Dai, Chongyi Li, Shangchen Zhou, Ruicheng Feng, Qianhui Sun, Chen Change Loy, Jinwei Gu, Yi Yu, Yangke Huang, Kang Zhang, Meiya Chen, Yu Wang, Yongchao Li, Hao Jiang, Amrit Kumar Muduli, Vikash Kumar, Kunal Swami, Pankaj Kumar Bajpai, Yunchao Ma, Jiajun Xiao, Zhi Ling. 2864-2870 [doi]

MIPI 2023 Challenge on RGBW Fusion: Methods and ResultsQianhui Sun, Qingyu Yang, Chongyi Li, Shangchen Zhou, Ruicheng Feng, Yuekun Dai, Wenxiu Sun, Qingpeng Zhu, Chen Change Loy, Jinwei Gu, Hongyuan Yu, Yuqing Liu, Weichen Yu, Lin Ge, Xiaolin Zhang, Qi Jia, Heng Zhang, Xuanwu Yin, Kunlong Zuo, Qi Wu, Wenjie Lin, Ting Jiang, Chengzhi Jiang, Mingyan Han, Xinpeng Li, Jinting Luo, Lei Yu, Haoqiang Fan, Shuaicheng Liu, Kunyu Wang, Chengzhi Cao, Yuanshen Guan, Jiyuan Xia, Ruikang Xu, Mingde Yao, Zhiwei Xiong. 2871-2877 [doi]

MIPI 2023 Challenge on RGBW Remosaic: Methods and ResultsQianhui Sun, Qingyu Yang, Chongyi Li, Shangchen Zhou, Ruicheng Feng, Yuekun Dai, Wenxiu Sun, Qingpeng Zhu, Chen Change Loy, Jinwei Gu, Yuqing Liu, Hongyuan Yu, Weichen Yu, Zhen Dong, Binnan Han, Qi Jia, Xuanwu Yin, Kunlong Zuo, Yaqi Wu, Zhihao Fan, Fanqing Meng, Xun Wu, Jiawei Zhang, Feng Zhang, Mingyan Han, Jinting Luo, Qi Wu, Ting Jiang, Chengzhi Jiang, Wenjie Lin, Xinpeng Li, Lei Yu, Haoqiang Fan, Shuaicheng Liu. 2878-2885 [doi]

Multi-Task Learning based Video Anomaly Detection with AttentionMohammad Baradaran, Robert Bergevin. 2886-2896 [doi]

Are we certain it's anomalous?Alessandro Flaborea, Bardh Prenkaj, Bharti Munjal, Marco Aurelio Sterpa, Dario Aragona, Luca Podo, Fabio Galasso. 2897-2907 [doi]

Exploring the Importance of Pretrained Feature Extractors for Unsupervised Anomaly Detection and LocalizationLars Heckler, Rebecca König, Paul Bergmann. 2917-2926 [doi]

Self-Supervised Normalizing Flows for Image Anomaly Detection and LocalizationLi-Ling Chiu, Shang-Hong Lai. 2927-2936 [doi]

On Advantages of Mask-level Recognition for Outlier-aware SegmentationMatej Grcic, Josip Saric, Sinisa Segvic. 2937-2947 [doi]

Denoising diffusion models for out-of-distribution detectionMark S. Graham, Walter H. L. Pinaya, Petru-Daniel Tudosiu, Parashkev Nachev, Sébastien Ourselin, M. Jorge Cardoso. 2948-2957 [doi]

Anomaly Detection with Domain AdaptationZiyi Yang, Iman Soltani Bozchalooi, Eric Darve. 2958-2967 [doi]

Back to the Feature: Classical 3D Features are (Almost) All You Need for 3D Anomaly DetectionEliahu Horwitz, Yedid Hoshen. 2968-2977 [doi]

FewSOME: One-Class Few Shot Anomaly Detection with Siamese NetworksNiamh Belton, Misgina Tsighe Hagos, Aonghus Lawlor, Kathleen M. Curran. 2978-2987 [doi]

SANO: Score-based Diffusion Model for Anomaly Localization in DermatologyÁlvaro González-Jiménez, Simone Lionetti, Marc Pouly, Alexander A. Navarini. 2988-2994 [doi]

Region-based Appearance and Flow Characteristics for Anomaly Detection in Infrared Surveillance ImageryYona Falinie A. Gaus, Neelanjan Bhowmik, Brian K. S. Isaac-Medina, Hubert P. H. Shum, Amir Atapour Abarghouei, Toby P. Breckon. 2995-3005 [doi]

Motion Matters: Difference-based Multi-scale Learning for Infrared UAV DetectionRuian He, Shili Zhou, Ri Cheng, Yuqi Sun, Weimin Tan, Bo Yan 0001. 3006-3015 [doi]

A Real-time and Lightweight Method for Tiny Airborne Object DetectionYanyi Lyu, Zhunga Liu, Huandong Li, Dongxiu Guo, Yimin Fu. 3016-3025 [doi]

A Global-Local Tracking Framework Driven by Both Motion and Appearance for Infrared Anti-UAVYifan Li, Dian Yuan, Meng Sun, Hongyu Wang, Xiaotao Liu, Jing Liu. 3026-3035 [doi]

A Unified Transformer-based Tracker for Anti-UAV TrackingQianjin Yu, Yinchao Ma, Jianfeng He, Dawei Yang, Tianzhu Zhang. 3036-3046 [doi]

Strong Detector with Simple TrackerZongheng Tang, YuLu Gao, Zizheng Xun, Fengguang Peng, Yifan Sun 0003, Si Liu 0001, Bo Li. 3047-3053 [doi]

Video Tiny-Object Detection Guided by the Spatial-Temporal Motion InformationXin Yang, Gang Wang, Weiming Hu, Jin Gao, Shubo Lin, Liang Li, Kai Gao, Yizheng Wang. 3054-3063 [doi]

The Second Monocular Depth Estimation ChallengeJaime Spencer, C. Stella Qian, Michaela Trescakova, Chris Russell 0001, Simon Hadfield, Erich W. Graf, Wendy J. Adams, Andrew J. Schofield, James H. Elder, Richard Bowden, Ali Anwar 0002, Hao Chen, Xiaozhi Chen, Kai Cheng, Yuchao Dai, Huynh Thai Hoa, Sadat Hossain, Jianmian Huang, Mohan Jing, Bo Li, Chao Li, Baojun Li, Zhiwen Liu, Stefano Mattoccia, Siegfried Mercelis, MyungWoo Nam, Matteo Poggi, Xiaohua Qi, Jiahui Ren, Yang Tang, Fabio Tosi, Linh Trinh, S. M. Nadim Uddin, Khan Muhammad Umair, Kaixuan Wang, Yufei Wang, Yixing Wang, Mochu Xiang, Guangkai Xu, Wei Yin, Jun Yu, Qi Zhang, Chaoqiang Zhao. 3064-3076 [doi]

Exploring the Utility of Self-Supervised Pretraining Strategies for the Detection of Absent Lung Sliding in M-Mode Lung UltrasoundBlake VanBerlo, Brian Li, Alexander Wong, Jesse Hoey, Robert Arntfield. 3077-3086 [doi]

Self-Supervised Learning for Accurate Liver View Classification in Ultrasound Images with Minimal Labeled DataAbder-Rahman Ali, Anthony E. Samir, Peng Guo. 3087-3093 [doi]

A deep learning-based approach to increase efficiency in the acquisition of ultrasonic non-destructive testing datasetsNick Luiken, Matteo Ravasi. 3094-3102 [doi]

Deep Learning Video Classification of Lung Ultrasound Features Associated with PneumoniaDaniel E. Shea, Sourabh Kulhare, Rachel Millin, Zohreh Laverriere, Courosh Mehanian, Charles B. Delahunt, Dipayan Banik, Xinliang Zheng, Meihua Zhu, Ye Ji, Travis Ostbye, Martha-Marie S. Mehanian, Atinuke Uwajeh, Adeseye M. Akinsete, Fen Wang, Matthew P. Horning. 3103-3112 [doi]

Image Inpainting with Hypergraphs for Resolution Improvement in Scanning Acoustic MicroscopyAyush Somani, Pragyan Banerjee, Krishna Agarwal, Manu Rastogi, Dilip K. Prasad, Anowarul Habib. 3113-3122 [doi]

DOAD: Decoupled One Stage Action Detection NetworkShuning Chang, Pichao Wang, Fan Wang, Jiashi Feng, Mike Zheng Shou. 3123-3232 [doi]

A New Dataset and Approach for Timestamp Supervised Action Segmentation Using Human Object InteractionSaif Iftekar Sayed, Reza Ghoddoosian, Bhaskar Trivedi, Vassilis Athitsos. 3133-3142 [doi]

Multi-Annotation Attention Model for Video SummarizationHacene Terbouche, Maryan Morel, Mariano Rodriguez, Alice Othmani. 3143-3152 [doi]

Global Motion Understanding in Large-Scale Video Object SegmentationVolodymyr Fedynyak, Yaroslav Romanus, Oles Dobosevych, Igor Babin, Roman Riazantsev. 3153-3162 [doi]

Multi-Object Tracking by Self-supervised Learning Appearance ModelKaer Huang, Kanokphan Lertniphonphan, Feng Chen, Jian Li, Zhepeng Wang. 3163-3169 [doi]

An Improved Association Pipeline for Multi-Person TrackingDaniel Stadler, Jürgen Beyerer. 3170-3179 [doi]

Pixel-level Contrastive Learning of Driving Videos with Optical FlowTomoya Takahashi, Shingo Yashima, Kohta Ishikawa, Ikuro Sato, Rio Yokota. 3180-3187 [doi]

Benchmarking the Robustness of LiDAR-Camera Fusion for 3D Object DetectionKaicheng Yu, Tang Tao, Hongwei Xie, Zhiwei Lin, Tingting Liang, Bing Wang, Peng Chen, Dayang Hao, Yongtao Wang, Xiaodan Liang. 3188-3198 [doi]

LDFA: Latent Diffusion Face Anonymization for Self-driving ApplicationsMarvin Klemp, Kevin Rösch, Royden Wagner, Jannik Quehl, Martin Lauer. 3199-3205 [doi]

Integrated Perception and Planning for Autonomous Vehicle Navigation: An Optimization-based ApproachShubham Kedia, Yu Zhou, Sambhu H. Karumanchi. 3206-3215 [doi]

Correlation Pyramid Network for 3D Single Object TrackingMengmeng Wang, Teli Ma, Xingxing Zuo, Jiajun Lv, Yong Liu 0007. 3216-3225 [doi]

Contrastive Learning for Depth PredictionRizhao Fan, Matteo Poggi, Stefano Mattoccia. 3226-3237 [doi]

DynStatF: An Efficient Feature Fusion Strategy for LiDAR 3D Object DetectionYao Rong, Xiangyu Wei, Tianwei Lin, Yueyu Wang, Enkelejda Kasneci. 3238-3247 [doi]

Lanelet2 for nuScenes: Enabling Spatial Semantic Relationships and Diverse Map-based Anchor PathsAlexander Naumann, Felix Hertlein, Daniel Grimm, Maximilian Zipfl, Steffen Thoma, Achim Rettinger, Lavdim Halilaj, Juergen Luettin, Stefan Schmid 0002, Holger Caesar. 3248-3257 [doi]

Consistency and Accuracy of CelebA Attribute ValuesHaiyu Wu, Grace Bezold, Manuel Günther, Terrance E. Boult, Michael C. King, Kevin W. Bowyer. 3258-3266 [doi]

Compensation Learning in Semantic SegmentationTimo Kaiser, Christoph Reinders, Bodo Rosenhahn. 3267-3278 [doi]

Scoring Your Prediction on Unseen DataYuhao Chen, Shen Zhang, Renjie Song. 3279-3288 [doi]

Digital Twin Tracking Dataset (DTTD): A New RGB+Depth 3D Dataset for Longer-Range Object Tracking ApplicationsWeiyu Feng, Seth Z. Zhao, Chuanyu Pan, Adam Chang, Yichen Chen, Zekun Wang, Allen Y. Yang. 3289-3298 [doi]

K-means Clustering Based Feature Consistency Alignment for Label-free Model EvaluationShuyu Miao, Lin Zheng, Jingjing Liu, Hong Jin. 3299-3307 [doi]

Exploring Video Frame Redundancies for Efficient Data Sampling and Annotation in Instance SegmentationJihun Yoon, Min-Kook Choi. 3308-3317 [doi]

WEDGE: A multi-weather autonomous driving dataset built from generative vision-language modelsAboli Marathe, Deva Ramanan, Rahee Walambe, Ketan Kotecha. 3318-3327 [doi]

Human Gesture and Gait Analysis for Autism DetectionSania Zahan, Syed Zulqarnain Gilani, Ghulam Mubashar Hassan, Ajmal Mian. 3328-3337 [doi]

Privileged Knowledge Distillation for Dimensional Emotion Recognition in the WildMuhammad Haseeb Aslam, Muhammad Osama Zeeshan, Marco Pedersoli, Alessandro L. Koerich, Simon Bacon, Eric Granger. 3338-3347 [doi]

Online LiDAR-to-Vehicle Alignment Using Lane Markings and Traffic SignsYao Hu, Xinyu Du, Shengbing Jiang. 3348-3357 [doi]

DeepSmooth: Efficient and Smooth Depth CompletionSriram Krishna, Basavaraja Shanthappa Vandrotti. 3358-3367 [doi]

Network Specialization via Feature-level Knowledge DistillationGaowen Liu, Yuzhang Shang, Yuguang Yao, Ramana Kompella. 3368-3375 [doi]

ST-RoomNet: Learning Room Layout Estimation From Single Image Through Unsupervised Spatial TransformationsHatem Ibrahem, Ahmed Salem 0005, Hyun Soo Kang. 3376-3384 [doi]

PanopticVis: Integrated Panoptic Segmentation for Visibility Estimation at Twilight and NightHidetomo Sakaino. 3385-3398 [doi]

Light Field Synthesis from a Monocular Image using Variable LDIJunhyeong Bak, In Kyu Park. 3399-3407 [doi]

Toward Real-World Light Field Super-ResolutionZeyu Xiao, Ruisheng Gao, Yutong Liu, Yueyi Zhang, Zhiwei Xiong. 3408-3418 [doi]

Disentangling Local and Global Information for Light Field Depth EstimationXueting Yang, Junli Deng, Rongshan Chen, Ruixuan Cong, Wei Ke 0001, Hao Sheng 0001. 3419-3427 [doi]

CNT-NeRF: Carbon Nanotube Forest Depth Layer Decomposition in SEM Imagery using Generative Adversarial NetworksNguyen P. Nguyen, Ramakrishna Surya, Prasad Calyam, Kannappan Palaniappan, Matthew R. Maschmann, Filiz Bunyak. 3428-3437 [doi]

EPI-Guided Cost Construction Network for Light Field Disparity EstimationTun Wang, Rongshan Chen, Ruixuan Cong, Da Yang, Zhenglong Cui, Fangping Li, Hao Sheng 0001. 3438-3446 [doi]

A Data-Driven Approach based on Dynamic Mode Decomposition for Efficient Encoding of Dynamic Light FieldsJoshitha Ravishankar, Sally Khaidem, Mansi Sharma. 3447-3453 [doi]

Multi-view Semantic Information Guidance for Light Field Image SegmentationYiming Li, Ruixuan Cong, Sizhe Wang, Mingyuan Zhao, Yang Zhang 0032, Fangping Li, Hao Sheng 0001. 3454-3462 [doi]

Implicit Epipolar Geometric Function based Light Field Continuous Angular RepresentationLin Zhong, Bangcheng Zong, Qiming Wang, Junle Yu, WenHui Zhou. 3463-3472 [doi]

LFNAT 2023 Challenge on Light Field Depth Estimation: Methods and ResultsHao Sheng 0001, Yebin Liu, Jingyi Yu, Gaochang Wu, Wei Xiong, Ruixuan Cong, Rongshan Chen, Longzhao Guo, Yanlin Xie, Shuo Zhang, Song Chang, Youfang Lin, Wentao Chao, Xuechun Wang, Guanghui Wang, Fuqing Duan, Tun Wang, Da Yang, Zhenglong Cui, Sizhe Wang, Mingyuan Zhao, Qiong Wang, Qianyu Chen, Zhengyu Liang, Yingqian Wang, Jungang Yang, Xueting Yang, Junli Deng. 3473-3485 [doi]

Diffusart: Enhancing Line Art Colorization with Conditional Diffusion ModelsHernan Carrillo, Michaël Clément, Aurélie Bugeau, Edgar Simo-Serra. 3486-3490 [doi]

FreqHPT: Frequency-aware attention and flow fusion for Human Pose TransferLiyuan Ma, Tingwei Gao, Haibin Shen, Kejie Huang. 3491-3496 [doi]

Fashion-Specific Ambiguous Expression Interpretation with Partial Visual-Semantic EmbeddingRyotaro Shimizu, Takuma Nakamura, Masayuki Goto. 3497-3502 [doi]

SkiLL: Skipping Color and Label Landscape: Self Supervised Design Representations for Products in E-commerceVinay Kumar Verma, Dween Rabius Sanny, Shreyas Sunil Kulkarni, Prateek Sircar, Abhishek Singh, Deepak Gupta. 3503-3507 [doi]

SHIFT15M: Fashion-specific dataset for set-to-set matching with several distribution shiftsMasanari Kimura, Takuma Nakamura, Yuki Saito. 3508-3513 [doi]

FashionVQA: A Domain-Specific Visual Question Answering SystemMingyu Wang, Ata Mahjoubfar, Anupama Joshi. 3514-3519 [doi]

Shape of You: Precise 3D shape estimations for diverse body typesRohan Sarkar, Achal Dave, Gerard Medioni, Benjamin Biggs. 3520-3524 [doi]

Image Reference-guided Fashion Design with Structure-aware Transfer by Diffusion ModelsShidong Cao, Wenhao Chai, Shengyu Hao, Gaoang Wang. 3525-3529 [doi]

Name your style: text-guided artistic style transferZhi-Song Liu, Li-wen Wang, Wan-Chi Siu, Vicky Kalogeiton. 3530-3534 [doi]

DETR-based Layered Clothing Segmentation and Fine-Grained Attribute RecognitionHao Tian, Yu Cao, P. Y. Mok. 3535-3539 [doi]

KBody: Balanced monocular whole-body estimationNikolaos Zioulis, James F. O'Brien. 3540-3545 [doi]

Gatha: Relational Loss for enhancing text-based style transferSurgan Jandial, Shripad Deshmukh, Abhinav Java, Simra Shahid, Balaji Krishnamurthy. 3546-3551 [doi]

Shape-Net: Room Layout Estimation from Panoramic Images Robust to Occlusion using Knowledge Distillation with 3D Shapes as Additional InputsMizuki Tabata, Kana Kurata, Junichiro Tamamatsu. 3552-3561 [doi]

U2RLE: Uncertainty-Guided 2-Stage Room Layout EstimationPooya Fayyazsanavi, Zhiqiang Wan, Will Hutchcroft, Ivaylo Boyadzhiev, Yuguang Li, Jana Kosecka, Sing Bing Kang. 3562-3570 [doi]

Motion-state Alignment for Video Semantic SegmentationJinming Su, Ruihong Yin, Shuaibin Zhang, Junfeng Luo. 3571-3580 [doi]

Perceive, Excavate and Purify: A Novel Object Mining Framework for Instance SegmentationJinming Su, Ruihong Yin, Xingyue Chen, Junfeng Luo. 3581-3590 [doi]

PanopticRoad: Integrated Panoptic Road Segmentation Under Adversarial ConditionsHidetomo Sakaino. 3591-3603 [doi]

A unified model for continuous conditional video predictionXi Ye, Guillaume-Alexandre Bilodeau. 3604-3613 [doi]

Best Practices for 2-Body Pose ForecastingMuhammad Rameez Ur Rahman, Luca Scofano, Edoardo De Matteis, Alessandro Flaborea, Alessio Sampieri, Fabio Galasso. 3614-3624 [doi]

3D-IntPhys: Towards More Generalized 3D-grounded Visual Intuitive Physics under Challenging ScenesHaotian Xue, Antonio Torralba 0001, Joshua B. Tenenbaum, Daniel Yamins, Yunzhu Li, Hsiao-Yu Tung. 3625-3635 [doi]

StillFast: An End-to-End Approach for Short-Term Object Interaction AnticipationFrancesco Ragusa, Giovanni Maria Farinella, Antonino Furnari. 3636-3645 [doi]

Bush Detection for Vision-based UGV Guidance in Blueberry Orchards: Data Set and MethodsVladan Filipovic, Dimitrije Stefanovic, Nina Pajevic, Zeljana Grbovic, Nemanja Djuric, Marko Panic. 3646-3655 [doi]

DPOSE: Online Keypoint-CAM Guided Inference for Driver Pose Estimation with GMM-based Balanced SamplingYuyu Guo, Yancheng Bai, Daiqi Shi, Yan Cai 0001, Wei Bian. 3656-3665 [doi]

CIPF: Crossing Intention Prediction Network based on Feature Fusion Modules for Improving Pedestrian SafetyJe-Seok Ham, Dae Hoe Kim, NamKyo Jung, Jinyoung Moon. 3666-3675 [doi]

DNA: Deformable Neural Articulations Network for Template-free Dynamic 3D Human Reconstruction from Monocular RGB-D VideoKhoa Vo 0001, Trong-Thang Pham, Kashu Yamazaki, Minh Q. Tran, Ngan Le. 3676-3685 [doi]

ODSmoothGrad: Generating Saliency Maps for Object DetectorsChul Gwon, Steven C. Howell. 3686-3690 [doi]

Sanity checks for patch visualisation in prototype-based image classificationRomain Xu-Darme, Georges Quénot, Zakaria Chihani, Marie-Christine Rousset. 3691-3696 [doi]

The Manifold Hypothesis for Gradient-Based ExplanationsSebastian Bordt, Uddeshya Upadhyay, Zeynep Akata, Ulrike von Luxburg. 3697-3702 [doi]

Hierarchical Explanations for Video Action RecognitionSadaf Gulshad, Teng Long, Nanne van Noord. 3703-3708 [doi]

A Confusion Matrix for Evaluating Feature Attribution MethodsAnna Arias-Duart, Ettore Mariotti, Dario Garcia-Gasulla, Jose Maria Alonso-Moral. 3709-3714 [doi]

Robustness of Visual Explanations to Common Data Augmentation MethodsLenka Tetková, Lars Kai Hansen. 3715-3720 [doi]

Localized Shortcut RemovalNicolas M. Müller, Jochen Jacobs, Jennifer Williams, Konstantin Böttinger. 3721-3725 [doi]

Towards Evaluating Explanations of Vision Transformers for Medical ImagingPiotr Komorowski, Hubert Baniecki, Przemyslaw Biecek. 3726-3732 [doi]

Seg-XRes-CAM: Explaining Spatially Local Regions in Image SegmentationSyed Nouman Hasany, Caroline Petitjean, Fabrice Mériaudeau. 3733-3738 [doi]

Analyzing Results of Depth Estimation Models with Monocular CriteriaJonas Theiner, Nils Nommensen, Jim Rhotert, Matthias Springstein, Eric Müller-Budack, Ralph Ewerth. 3739-3743 [doi]

Text2Concept: Concept Activation Vectors Directly from TextMazda Moayeri, Keivan Rezaei, Maziar Sanjabi, Soheil Feizi. 3744-3749 [doi]

CAVLI - Using image associations to produce local concept-based explanationsPushkar Shukla, Sushil Bharati, Matthew A. Turk. 3750-3755 [doi]

Vision DiffMask: Faithful Interpretation of Vision Transformers with Differentiable Patch MaskingAngelos Nalmpantis, Apostolos Panagiotopoulos, John Gkountouras, Konstantinos Papakostas, Wilker Aziz. 3756-3763 [doi]

Ante-Hoc Generation of Task-Agnostic Interpretation MapsAkash Guna R. T, Raul Benitez, O. K. Sikha. 3764-3769 [doi]

Disentangling Neuron Representations with Concept VectorsLaura O'Mahony, Vincent Andrearczyk, Henning Müller, Mara Graziani. 3770-3775 [doi]

Shared Interest...Sometimes: Understanding the Alignment between Human Perception, Vision Architectures, and Saliency Map TechniquesKatelyn Morrison, Ankita Mehra, Adam Perer. 3776-3781 [doi]

ZEBRA: Explaining rare cases through outlying interpretable conceptsPedro Madeira, André V. Carreiro, Alex Gaudio, Luís Rosado, Filipe Soares, Asim Smailagic. 3782-3788 [doi]

Uncovering the Inner Workings of STEGO for Safe Unsupervised Semantic SegmentationAlexander Koenig, Maximilian Schambach, Johannes S. Otterbach. 3789-3798 [doi]

Coherent Concept-based Explanations in Medical Image and Its Application to Skin Lesion DiagnosisCristiano Patrício, João C. Neves, Luís F. Teixeira 0001. 3799-3808 [doi]

Maximum Entropy Information Bottleneck for Uncertainty-aware Stochastic EmbeddingSungtae An, Nataraj Jammalamadaka, Eunji Chong. 3809-3818 [doi]

Optimizing Explanations by Network Canonization and Hyperparameter SearchFrederik Pahde, Galip Ümit Yolcu, Alexander Binder, Wojciech Samek, Sebastian Lapuschkin. 3819-3828 [doi]

Revealing Hidden Context Bias in Segmentation and Object Detection through Concept-specific ExplanationsMaximilian Dreyer, Reduan Achtibat, Thomas Wiegand, Wojciech Samek, Sebastian Lapuschkin. 3829-3839 [doi]

Investigating CLIP Performance for Meta-data Generation in AD DatasetsSujan Sai Gannamaneni, Arwin Sadaghiani, Rohil Prakash Rao, Michael Mock, Maram Akila. 3840-3850 [doi]

A Novel Benchmark for Refinement of Noisy Localization Labels in Autolabeled Datasets for Object DetectionAndreas Bär, Jonas Uhrig, Jeethesh Pai Umesh, Marius Cordts, Tim Fingscheidt. 3851-3860 [doi]

RL-CAM: Visual Explanations for Convolutional Networks using Reinforcement LearningSoumyendu Sarkar, Ashwin Ramesh Babu, Sajad Mousavi, Sahand Ghorbanpour, Vineet Gundecha, Antonio Guillen, Ricardo Luna Gutierrez, Avisek Naug. 3861-3869 [doi]

Category Differences Matter: A Broad Analysis of Inter-Category Error in Semantic SegmentationJingxing Zhou, Jürgen Beyerer. 3870-3880 [doi]

Beyond AUROC & co. for evaluating out-of-distribution detection performanceGaladrielle Humblot-Renaux, Sergio Escalera, Thomas B. Moeslund. 3881-3890 [doi]

Interpretable Model-Agnostic Plausibility Verification for 2D Object Detectors Using Domain-Invariant Concept Bottleneck ModelsMert Keser, Gesina Schwalbe, Azarm Nowzad, Alois Knoll. 3891-3900 [doi]

Live Demonstration: PINK: Polarity-based Anti-flicker for Event CamerasGyubeom Im, Keunjoo Park, Junseok Kim, Bongki Son, Seungchul Shin, Haechang Lee. 3901-3902 [doi]

Exploring Joint Embedding Architectures and Data Augmentations for Self-Supervised Representation Learning in Event-Based VisionSami Barchid, José Mennesson, Chaabane Djeraba. 3903-3912 [doi]

How Many Events Make an Object? Improving Single-frame Object Detection on the 1 Mpx DatasetAlexander Kugele, Thomas Pfeil, Michael Pfeiffer 0001, Elisabetta Chicca. 3913-3922 [doi]

Entropy Coding-based Lossless Compression of Asynchronous Event SequencesIonut Schiopu, Radu Ciprian Bilcu. 3923-3930 [doi]

Live Demonstration: Tangentially Elongated Gaussian Belief Propagation for Event-based Incremental Optical Flow EstimationYusuke Sekikawa, Jun Nagata. 3931-3932 [doi]

Within-Camera Multilayer Perceptron DVS DenoisingAntonio Rios-Navarro, S. Guo, G. Abarajithan, K. Vijayakumar, Alejandro Linares-Barranco, Thea Aarrestad, Ryan Kastner, Tobi Delbrück. 3933-3942 [doi]

EVREAL: Towards a Comprehensive Benchmark and Analysis Suite for Event-based Video ReconstructionBurak Ercan, Onur Eker, Aykut Erdem, Erkut Erdem. 3943-3952 [doi]

HUGNet: Hemi-Spherical Update Graph Neural Network applied to low-latency event-based optical flowThomas Dalgaty, Thomas Mesquida, Damien Joubert, Amos Sironi, Pascal Vivet, Christoph Posch. 3953-3962 [doi]

PDAVIS: Bio-inspired Polarization Event CameraGermain Haessig, Damien Joubert, Justin Haque, Moritz B. Milde, Tobi Delbruck, Viktor Gruev. 3963-3972 [doi]

Live Demo: E2P-Events to Polarization Reconstruction from PDAVIS EventsTobi Delbruck, Zuowen Wang, Haiyang Mei, Germain Haessig, Damien Joubert, Justin Haque, Yingkai Chen, Moritz B. Milde, Viktor Gruev. 3973-3975 [doi]

Event-IMU fusion strategies for faster-than-IMU estimation throughputWilliam Chamorro, Joan Solà, Juan Andrade-Cetto. 3976-3983 [doi]

Density Invariant Contrast Maximization for Neuromorphic Earth ObservationsSami Arja, Alexandre Marcireau, Richard L. Balthazor, Matthew G. McHarg, Saeed Afshar, Gregory Cohen. 3984-3994 [doi]

Live Demonstration: SCAMP-7Laurie Bose, Piotr Dudek, Stephen J. Carey, Jianing Chen. 3995-3996 [doi]

*Antony W. N'Dri, Thomas Barbier, Céline Teulière, Jochen Triesch. 3997-4006 [doi]

X-maps: Direct Depth Lookup for Event-based Structured Light SystemsWieland Morgenstern, Niklas Gard, Simon Baumann, Anna Hilsmann, Peter Eisert. 4007-4015 [doi]

M3ED: Multi-Robot, Multi-Sensor, Multi-Environment Event DatasetKenneth Chaney, Fernando Cladera Ojeda, Ziyun Wang, Anthony Bisulco, M. Ani Hsieh, Christopher M. Korpela, Vijay Kumar 0001, Camillo J. Taylor, Kostas Daniilidis. 4016-4023 [doi]

MoveEnet: Online High-Frequency Human Pose Estimation with an Event CameraGaurvi Goyal, Franco Di Pietro, Nicoló Carissimi, Arren Glover, Chiara Bartolozzi. 4024-4033 [doi]

Live Demonstration: Integrating Event Based Hand Tracking Into TouchFree InteractionsRyan Page. 4034-4035 [doi]

Fast Trajectory End-Point Prediction with Event Cameras for Reactive Robot ControlMarco Monforte, Luna Gava, Massimiliano Iacono, Arren Glover, Chiara Bartolozzi. 4036-4044 [doi]

Shining light on the DVS pixel: A tutorial and discussion about biasing and optimizationRui Graça, Brian Mcreynolds, Tobi Delbruck. 4045-4053 [doi]

Live Demonstration: Event-based Visual MicrophoneRyogo Niwa, Tatsuki Fushimi, Kenta Yamamoto, Yoichi Ochiai. 4054-4055 [doi]

Interpolation-Based Event Visual Data Filtering AlgorithmsMarcin Kowalczyk, Tomasz Kryjak. 4056-4064 [doi]

PEDRo: an Event-based Dataset for Person Detection in RoboticsChiara Boretti, Philippe Bich, Fabio Pareschi, Luciano Prono, Riccardo Rovatti, Gianluca Setti. 4065-4070 [doi]

Low-latency monocular depth estimation using event timing on neuromorphic hardwareStefano Chiavazza, Svea Marie Meyer, Yulia Sandamirskaya. 4071-4080 [doi]

Live Demonstration: Real-time Event-based Speed Detection using Spiking Neural NetworksArjun Roy, Manish Nagaraj, Chamika Mihiranga Liyanagedera, Kaushik Roy 0001. 4081-4082 [doi]

Asynchronous Events-based Panoptic Segmentation using Graph Mixer Neural NetworkSanket Kachole, Yusra Alkendi, Fariborz Baghaei Naeini, Dimitrios Makris 0001, Yahya H. Zweiri. 4083-4092 [doi]

Frugal event data: how small is too small? A human performance assessment with shrinking dataAmélie Gruel, Lucía Trillo Carreras, Marina Bueno García, Ewa Kupczyk, Jean Martinet. 4093-4100 [doi]

End-to-end Neuromorphic Lip ReadingHugo Bulzomi, Marcel Schweiker, Amélie Gruel, Jean Martinet. 4101-4108 [doi]

Neuromorphic Event-based Facial Expression RecognitionLorenzo Berlincioni, Luca Cultrera, Chiara Albisani, Lisa Cresti, Andrea Leonardo, Sara Picchioni, Federico Becattini, Alberto Del Bimbo. 4109-4119 [doi]

Event-based Blur Kernel Estimation For Blind Motion DeblurringTakuya Nakabayashi, Kunihiro Hasegawa, Masakazu Matsugu, Hideo Saito. 4120-4128 [doi]

Neuromorphic Optical Flow and Real-time Implementation with Event CamerasYannick Schnider, Stanislaw Wozniak, Mathias Gehrig, Jules Lecomte, Axel von Arnim, Luca Benini, Davide Scaramuzza 0001, Angeliki Pantazi. 4129-4138 [doi]

Flow cytometry with event-based vision and spiking neuromorphic hardwareSteven Abreu, Muhammed Gouda, Alessio Lugnan, Peter Bienstman. 4139-4147 [doi]

Live Demonstration: ANN vs SNN vs Hybrid Architectures for Event-based Real-time Gesture Recognition and Optical Flow EstimationAdarsh Kumar Kosta, Marco Paul E. Apolinario, Kaushik Roy 0001. 4148-4149 [doi]

Sparse-E2VID: A Sparse Convolutional Model for Event-Based Video Reconstruction Trained with Real Event NoisePablo Rodrigo Gantier Cadena, Yeqiang Qian, Chunxiang Wang, Ming Yang 0002. 4150-4158 [doi]

Improving Shape Awareness and Interpretability in Deep Networks Using Geometric MomentsRajhans Singh, Ankita Shukla, Pavan K. Turaga. 4159-4168 [doi]

GenSim: Unsupervised Generic Garment SimulatorLokender Tiwari, Brojeshwar Bhowmick, Sanjana Sinha. 4169-4178 [doi]

GPr-Net: Geometric Prototypical Network for Point Cloud Few-Shot LearningTejas Anvekar, Dena Bazazian. 4179-4188 [doi]

MM-BSN: Self-Supervised Image Denoising for Real-World with Multi-Mask based on Blind-Spot NetworkDan Zhang, Fangfang Zhou, Yuwen Jiang, Zhengming Fu. 4189-4198 [doi]

Dilated Convolutional Transformer for High-Quality Image DerainingYufeng Li, Jiyang Lu, Hongming Chen, Xianhao Wu, Xiang Chen. 4199-4207 [doi]

Temporally Averaged Regression for Semi-Supervised Low-Light Image EnhancementSunhyeok Lee, Donggon Jang, Dae-Shik Kim. 4208-4217 [doi]

Learning to See in Nighttime Driving Scenes with Inter-frequency PriorsZhentao Fan, Xianhao Wu, Xiang Chen, Yufeng Li. 4218-4225 [doi]

FLIGHT Mode On: A Feather-Light Network for Low-Light Image EnhancementMustafa Ozcan, Hamza Ergezer, Mustafa Ayazoglu. 4226-4235 [doi]

NeRT: Implicit Neural Representations for Unsupervised Atmospheric Turbulence MitigationWeiyun Jiang, Vivek Boominathan, Ashok Veeraraghavan. 4236-4243 [doi]

Theia: Bleed-Through Estimation with Convolutional Neural NetworksNajib Ishaq, Nathan Hotaling, Nicholas Schaub. 4244-4252 [doi]

New Bayesian Focal Loss Targeting Aleatoric Uncertainty Estimate: Pollen Image RecognitionNatalia Khanzhina, Maxim Kashirin, Andrey Filchenkov. 4253-4262 [doi]

A Super-Resolution Training Paradigm Based on Low-Resolution Data Only to Surpass the Technical Limits of STEM and STM MicroscopyBjörn Möller, Jan Pirklbauer, Marvin Klingner, Peer Kasten, Markus Etzkorn, Tim J. Seifert, Uta Schlickum, Tim Fingscheidt. 4263-4272 [doi]

Learning to Correct Sloppy Annotations in Electron Microscopy VolumesMinghao Chen, Mukesh Bangalore Renuka, Lu Mi, Jeff Lichtman, Nir Shavit, Yaron Meirovitch. 4273-4284 [doi]

RxRx1: A Dataset for Evaluating Experimental Batch Correction MethodsMaciej Sypetkowski, Morteza Rezanejad, Saber Saberian, Oren Kraus, John Urbanik, James Taylor, Ben Mabey, Mason Victors, Jason Yosinski, Alborz Rezazadeh Sereshkeh, Imran S. Haque, Berton Earnshaw. 4285-4294 [doi]

One-shot and Partially-Supervised Cell Image Segmentation Using Small Visual PromptSota Kato, Kazuhiro Hotta. 4295-4304 [doi]

Giga-SSL: Self-Supervised Learning for Gigapixel ImagesTristan Lazard, Marvin Lerousseau, Etienne Decencière, Thomas Walter 0003. 4305-4314 [doi]

An Ensemble Method with Edge Awareness for Abnormally Shaped Nuclei SegmentationYue Han, Yang Lei, Viktor Shkolnikov, Daisy Xin, Alicia Auduong, Steven Barcelo, Jan P. Allebach, Edward J. Delp. 4315-4325 [doi]

Out of Distribution Generalization via Interventional Style Transfer in Single-Cell MicroscopyWolfgang M. Pernice, Michael Doron, Alex Quach, Aditya Pratapa, Sultan Kenjeyev, Nicholas De Veaux, Michio Hirano, Juan C. Caicedo. 4326-4335 [doi]

Fast Local ThicknessVedrana Andersen Dahl, Anders Bjorholm Dahl. 4336-4344 [doi]

What Makes a Good Data Augmentation for Few-Shot Unsupervised Image Anomaly Detection?Lingrui Zhang, Shuheng Zhang, Guoyang Xie, Jiaqi Liu, Hua Yan, Jinbao Wang, Feng Zheng, Yaochu Jin. 4345-4354 [doi]

Towards Automated Polyp Segmentation Using Weakly- and Semi-Supervised Learning and Deformable TransformersGuangyu Ren, Michalis Lazarou, Jing Yuan, Tania Stathaki. 4355-4364 [doi]

N-pad : Neighboring Pixel-based Industrial Anomaly DetectionJunKyu Jang, Eugene Hwang, Sung Hyuk Park. 4365-4374 [doi]

XDNet: A Few-Shot Meta-Learning Approach for Cross-Domain Visual InspectionXian Yeow Lee, Lasitha Vidyaratne, Mahbubul Alam, Ahmed K. Farahat, Dipanjan Ghosh, Maria Teresa Gonzalez Diaz, Chetan Gupta 0001. 4375-4384 [doi]

Glass Wool Defect Detection Using an Improved YOLOv5Yizhou Jin, Yu Lu, Gang Zhou, Qingjie Liu, Yunhong Wang. 4385-4394 [doi]

Assigned MURA Defect Generation Based on Diffusion ModelWeizhi Liu, Chang Liu, Qiang Liu, Dahai Yu. 4395-4402 [doi]

Parcel3D: Shape Reconstruction from Single RGB Images for Applications in Transportation LogisticsAlexander Naumann, Felix Hertlein, Laura Dörr, Kai Furmans. 4403-4413 [doi]

How Do Label Errors Affect Thin Crack Detection by DNNsLiang Xu, Han Zou, Takayuki Okatani. 4414-4423 [doi]

Synthetic Data for Defect Segmentation on Complex Metal SurfacesJuraj Fulir, Lovro Bosnar, Hans Hagen, Petra Gospodnetic. 4424-4434 [doi]

Unsupervised Automatic Defect Inspection based on Image Matching and Local One-class ClassificationChengkan Lv, Zhengtao Zhang, Fei Shen, Feng Zhang. 4435-4444 [doi]

Diversified and Multi-Class Controllable Industrial Defect Synthesis for Data Augmentation and TransferJing Wei, Fei Shen, Chengkan Lv, Zhengtao Zhang, Feng Zhang, Huabin Yang. 4445-4453 [doi]

Towards Sim-to-Real Industrial Parts Classification with Synthetic DatasetXiaomeng Zhu, Talha Bilal, Pär Mårtensson, Lars Hanson, Mårten Björkman, Atsuto Maki. 4454-4463 [doi]

Leveraging Multi-view Data for Improved Detection Performance: An Industrial Use CaseFaranak Shamsafar, Sunil Prasad Jaiswal, Benjamin Kelkel, Kireeti Bodduna, Klaus Illgner-Fehns. 4464-4471 [doi]

3Net: Accurate and Efficient Edge-based Self-Supervised Stereo Matching NetworkI-Sheng Fang, Hsiao-Chieh Wen, Chia-Lun Hsu, Po Chung Jen, Ping-Yang Chen, Yong-Sheng Chen. 4472-4481 [doi]

Hardware-Aware Pruning for FPGA Deep Learning AcceleratorsJef Plochaet, Toon Goedemé. 4482-4490 [doi]

Uncertainty in Real-Time Semantic Segmentation on Embedded SystemsEthan Goan, Clinton Fookes. 4491-4501 [doi]

Fully-Binarized Distance Computation based On-device Few-Shot Learning for XR applicationsVivek Parmar, Sandeep Kaur Kingra, Syed Shakib Sarwar, Ziyun Li, Barbara De Salvo, Manan Suri. 4502-4508 [doi]

Localized Latent Updates for Fine-Tuning Vision-Language ModelsMoritz Ibing, Isaak Lim, Leif Kobbelt. 4509-4518 [doi]

Data-Free Model Pruning at Initialization via ExpandersJames Stewart, Umberto Michieli, Mete Ozay. 4519-4524 [doi]

ETAD: Training Action Detection End to End on a LaptopShuming Liu, Mengmeng Xu, Chen Zhao 0002, Xu Zhao, Bernard Ghanem. 4525-4534 [doi]

DynaShare: Task and Instance Conditioned Parameter Sharing for Multi-Task LearningElahe Rahimian, Golara Javadi, Frederick Tung, Gabriel Leivas Oliveira. 4535-4543 [doi]

Content-Adaptive Downsampling in Convolutional Neural NetworksRobin Hesse, Simone Schaub-Meyer, Stefan Roth 0001. 4544-4553 [doi]

STAR: Sparse Thresholded Activation under partial-Regularization for Activation Sparsity ExplorationZeqi Zhu, Arash Pourtaherian, Luc Waeijen, Egor Bondarev, Orlando Moreira. 4554-4563 [doi]

MIMMO: Multi-Input Massive Multi-Output Neural NetworkMartin Ferianc, Miguel Rodrigues. 4564-4569 [doi]

Revisiting Class Imbalance for End-to-end Semi-Supervised Object DetectionPurbayan Kar, Vishal Chudasama, Naoyuki Onoe, Pankaj Wasnik. 4570-4579 [doi]

MARRS: Modern Backbones Assisted Co-training for Rapid and Robust Semi-Supervised Domain AdaptationSaurabh Kumar Jain, Sukhendu Das. 4580-4589 [doi]

Similar Class Style Augmentation for Efficient Cross-Domain Few-Shot LearningManogna Sreenivas, Soma Biswas. 4590-4598 [doi]

Token Merging for Fast Stable DiffusionDaniel Bolya, Judy Hoffman. 4599-4603 [doi]

Accelerable Lottery Tickets with the Mixed-Precision QuantizationZhangheng Li, Yu Gong, Zhenyu Zhang, Xingyun Xue, Tianlong Chen, Yi Liang, Bo Yuan, Zhangyang Wang. 4604-4612 [doi]

Vision Transformers with Mixed-Resolution TokenizationTomer Ronen, Omer Levy, Avram Golbert. 4613-4622 [doi]

Envisioning a Next Generation Extended Reality Conferencing System with Efficient Photorealistic Human RenderingChuanyue Shen, Letian Zhang, Zhangsihao Yang, Masood Mortazavi, Xiyun Song, Liang Peng, Heather Yu. 4623-4632 [doi]

Quantized Proximal Averaging Networks for Compressed Image RecoveryKartheek Kumar Reddy Nareddy, Mani Madhoolika Bulusu, Praveen Kumar Pokala, Chandra Sekhar Seelamantula. 4633-4643 [doi]

Phase-field Models for Lightweight Graph Convolutional NetworksHichem Sahbi. 4644-4650 [doi]

Speed Is All You Need: On-Device Acceleration of Large Diffusion Models via GPU-Aware OptimizationsYu-Hui Chen, Raman Sarokin, Juhyun Lee, Jiuqiang Tang, Chuo-Ling Chang, Andrei Kulik, Matthias Grundmann. 4651-4655 [doi]

DeepGEMM: Accelerated Ultra Low-Precision Inference on CPU Architectures using Lookup TablesDarshan C. Ganji, Saad Ashfaq, Ehsan Saboori, Sudhakar Sah, Saptarshi Mitra, MohammadHossein AskariHemmat, Alexander Hoffman, Ahmed Hassanien, Mathieu Léonardon. 4656-4664 [doi]

BinaryViT: Pushing Binary Vision Transformers Towards Convolutional ModelsPhuoc-Hoan Charles Le, Xinlin Li. 4665-4674 [doi]

Rethinking Dilated Convolution for Real-time Semantic SegmentationRoland Gao. 4675-4684 [doi]

Making Models Shallow Again: Jointly Learning to Reduce Non-Linearity and Depth for Latency-Efficient Private InferenceSouvik Kundu 0002, Yuke Zhang, Dake Chen, Peter A. Beerel. 4685-4689 [doi]

BlazeStyleGAN: A Real-Time On-Device StyleGANHaolin Jia, Qifei Wang, Omer Tov, Yang Zhao, Fei Deng, Lu Wang, Chuo-Ling Chang, Tingbo Hou, Matthias Grundmann. 4690-4694 [doi]

DeCAtt: Efficient Vision Transformers with Decorrelated Attention HeadsMayukh Bhattacharyya, Soumitri Chattopadhyay, Sayan Nag. 4695-4699 [doi]

Dataset Efficient Training with Model EnsemblingYeonju Ro, Cong Xu, Agnieszka Ciborowska, Suparna Bhattacharya, Frankie Li, Martin Foltin. 4700-4704 [doi]

Recursions Are All You Need: Towards Efficient Deep Unfolding NetworksRawwad Alhejaili, Motaz Alfarraj, Hamzah Luqman, Ali Al-Shaikhi. 4705-4714 [doi]

CFDP: Common Frequency Domain PruningSamir Khaki, Weihan Luo. 4715-4724 [doi]

Dynamic Inference Acceleration of 3D Point Cloud Deep Neural Networks Using Point Density and EntropyGyudo Park, Soohyeok Kang, Wencan Cheng, Jong Hwan Ko. 4725-4729 [doi]

AdaMTL: Adaptive Input-dependent Inference for Efficient Multi-Task LearningMarina Neseem, Ahmed Agiza, Sherief Reda. 4730-4739 [doi]

Pre-training Auto-generated Volumetric Shapes for 3D Medical Image SegmentationRyu Tadokoro, Ryosuke Yamada, Hirokatsu Kataoka. 4740-4745 [doi]

Improving Cross-Domain Detection with Self-Supervised LearningKai Li 0012, Curtis Wigington, Chris Tensmeyer, Vlad I. Morariu, Handong Zhao, Varun Manjunatha, Nikolaos Barmpalios, Yun Fu 0001. 4746-4755 [doi]

Self-Supervised Video Similarity LearningGiorgos Kordopatis-Zilos, Giorgos Tolias, Christos Tzelepis, Ioannis Kompatsiaris, Ioannis Patras, Symeon Papadopoulos. 4756-4766 [doi]

MEnsA: Mix-up Ensemble Average for Unsupervised Multi Target Domain Adaptation on 3D Point CloudsAshish Sinha, Jonghyun Choi. 4767-4777 [doi]

HNSSL: Hard Negative-Based Self-Supervised LearningWentao Zhu, Jingya Liu, Yufang Huang. 4778-4787 [doi]

Self-supervised 3D Human Pose Estimation from a Single ImageJose Sosa, David C. Hogg. 4788-4797 [doi]

SimDE: A Simple Domain Expansion Approach for Single-source Domain GeneralizationQinwei Xu, Ruipeng Zhang, Yiyan Wu 0001, Ya Zhang 0002, Ning Liu, Yanfeng Wang. 4798-4808 [doi]

Impact of Pseudo Depth on Open World Object Segmentation with Minimal User GuidanceRobin Schön, Katja Ludwig, Rainer Lienhart. 4809-4819 [doi]

An Effective Crop-Paste Pipeline for Few-shot Object DetectionShaobo Lin, Kun Wang, Xingyu Zeng, Rui Zhao. 4820-4828 [doi]

Improving Data-Efficient Fossil Segmentation via Model EditingIndu Panigrahi, Ryan Manzuk, Adam Maloof, Ruth Fong. 4829-4838 [doi]

What Affects Learned Equivariance in Deep Image Recognition Models?Robert-Jan Bruintjes, Tomasz Motyka, Jan van Gemert. 4839-4847 [doi]

Zero-shot Unsupervised Transfer Instance SegmentationGyungin Shin, Samuel Albanie, Weidi Xie. 4848-4858 [doi]

Zero-Shot Action Recognition with Transformer-based Video Semantic EmbeddingKeval Doshi, Yasin Yilmaz. 4859-4868 [doi]

Contrast, Stylize and Adapt: Unsupervised Contrastive Learning Framework for Domain Adaptive Semantic SegmentationTianyu Li, Subhankar Roy, Huayi Zhou, Hongtao Lu, Stéphane Lathuilière. 4869-4879 [doi]

OWL (Observe, Watch, Listen): Audiovisual Temporal Context for Localizing Actions in Egocentric VideosMerey Ramazanova, Victor Escorcia, Fabian Caba Heilbron, Chen Zhao 0002, Bernard Ghanem. 4880-4890 [doi]

Mutual Exclusive Modulator for Long-Tailed RecognitionHaixu Long, Xiaolin Zhang, Yanbin Liu, Zongtai Luo, Jianbo Liu. 4891-4900 [doi]

Neural Transformation Network to Generate Diverse Views for Contrastive LearningTaekyung Kim 0002, Debasmit Das, Seokeon Choi, Minki Jeong, Seunghan Yang, Sungrack Yun, Changick Kim. 4901-4911 [doi]

Posture-based Infant Action Recognition in the Wild with Very Limited DataXiaofei Huang, Lingfei Luan, Elaheh Hatamimajoumerd, Michael Wan, Pooria Daneshvar Kakhaki, Rita Obeid, Sarah Ostadabbas. 4912-4921 [doi]

Leveraging triplet loss for unsupervised action segmentationElena Belén Bueno-Benito, Biel Tura Vecino, Mariella Dimiccoli. 4922-4930 [doi]

Improving Automatic Target Recognition in Low Data Regime using Semi-Supervised Learning and Generative Data AugmentationFadoua Khmaissia, Hichem Frigui. 4931-4939 [doi]

In Defense of Structural Symbolic Representation for Video Event-Relation PredictionAndrew Lu, Xudong Lin 0003, Yulei Niu, Shih-Fu Chang. 4940-4950 [doi]

Language Models are Causal Knowledge Extractors for Zero-shot Video Question AnsweringHung-Ting Su, Yulei Niu, Xudong Lin 0003, Winston H. Hsu, Shih-Fu Chang. 4951-4960 [doi]

NamedMask: Distilling Segmenters from Complementary Foundation ModelsGyungin Shin, Weidi Xie, Samuel Albanie. 4961-4970 [doi]

LSFSL: Leveraging Shape Information in Few-shot LearningDeepan Chakravarthi Padmanabhan, Shruthi Gowda, Elahe Arani, Bahram Zonooz. 4971-4980 [doi]

Reliable Student: Addressing Noise in Semi-Supervised 3D Object DetectionFarzad Nozarian, Shashank Agarwal, Farzaneh Rezaeianaran, Danish Shahzad, Atanas Poibrenski, Christian Müller 0014, Philipp Slusallek. 4981-4990 [doi]

Zero-shot Object Classification with Large-scale Knowledge GraphKohei Shiba, Yusuke Mukuta, Tatsuya Harada. 4991-4998 [doi]

Stream-Based Active Distillation for Scalable Model DeploymentDani Manjah, Davide Cacciarelli, Mohamed Benkedadra, Baptiste Standaert, Gauthier Rotsart De Hertaing, Benoît Macq, Stéphane Galland, Christophe De Vleeschouwer. 4999-5007 [doi]

Incorporating Visual Grounding In GCN For Zero-shot Learning Of Human Object Interaction ActionsChinmaya Devaraj, Cornelia Fermüller, Yiannis Aloimonos. 5008-5017 [doi]

OpenFed: A Comprehensive and Versatile Open-Source Federated Learning FrameworkDengsheng Chen, Vince Junkai Tan, Zhilin Lu, Enhua Wu, Jie Hu 0019. 5018-5026 [doi]

Federated Learning in Non-IID Settings Aided by Differentially Private Synthetic DataHuancheng Chen, Haris Vikalo. 5027-5036 [doi]

Many-Task Federated Learning: A New Problem Setting and A Simple BaselineRuisi Cai, Xiaohan Chen, Shiwei Liu, Jayanth Srinivasa, Myungjin Lee, Ramana Kompella, Zhangyang Wang. 5037-5045 [doi]

Mixed Quantization Enabled Federated Learning to Tackle Gradient Inversion AttacksPretom Roy Ovi, Emon Dey, Nirmalya Roy, Aryya Gangopadhyay. 5046-5054 [doi]

Asynchronous Federated Continual LearningDonald Shenaj, Marco Toldo, Alberto Rigon, Pietro Zanuttigh. 5055-5063 [doi]

TimelyFL: Heterogeneity-aware Asynchronous Federated Learning with Adaptive Partial TrainingTuo Zhang, Lei Gao, SunWoo Lee, Mi Zhang 0002, Salman Avestimehr. 5064-5073 [doi]

SoccerNet-Caption: Dense Video Captioning for Soccer Broadcasts CommentariesHassan Mkhallati, Anthony Cioppa, Silvio Giancola, Bernard Ghanem, Marc Van Droogenbroeck. 5074-5085 [doi]

VARS: Video Assistant Referee System for Automated Soccer Decision Making from Multiple ViewsJan Held, Anthony Cioppa, Silvio Giancola, Abdullah Hamdi, Bernard Ghanem, Marc Van Droogenbroeck. 5086-5097 [doi]

Towards Active Learning for Action Spotting in Association Football VideosSilvio Giancola, Anthony Cioppa, Julia Georgieva, Johsan Billingham, Andreas Serner, Kerry Peek, Bernard Ghanem, Marc Van Droogenbroeck. 5098-5108 [doi]

Monocular 3D Human Pose Estimation for Sports Broadcasts using Partial Sports Field RegistrationTobias Baumgartner 0002, Stefanie Klatt. 5109-5118 [doi]

Combining Physics and Deep Learning Models to Simulate the Flight of a Golf BallWilliam J. McNally, Jacob Lambeth, Dustin Brekke. 5119-5128 [doi]

A Scale-Invariant Trajectory Simplification Method for Efficient Data Collection in VideosYang Liu, Luiz G. Hafemann. 5129-5138 [doi]

NeighborTrack: Single Object Tracking by Bipartite Matching with Neighbor Tracklets and Its Applications to SportsYu-Hsi Chen, Chien-Yao Wang, Cheng-Yun Yang, Hung-Shuo Chang, Youn-Long Lin, Yung-Yu Chuang, Hong-Yuan Mark Liao. 5139-5148 [doi]

Human Spine Motion Capture using Perforated Kinesiology TapeHendrik Hachmann, Bodo Rosenhahn. 5149-5157 [doi]

SPARTAN: Self-supervised Spatiotemporal Transformers Approach to Group Activity RecognitionNaga Venkata Sai Raviteja Chappa, Pha A. Nguyen, Alexander H. Nelson, Han-Seok Seo, Xin Li 0005, Page Daniel Dobbs, Khoa Luu. 5158-5168 [doi]

One-shot skeleton-based action recognition on strength and conditioning exercisesMichael Deyzel, Rensu P. Theart. 5169-5178 [doi]

All Keypoints You Need: Detecting Arbitrary Keypoints on the Body of Triple, High, and Long Jump AthletesKatja Ludwig, Julian Lorenz, Robin Schön, Rainer Lienhart. 5179-5187 [doi]

Visualizing Skiers' Trajectories in Monocular VideosMatteo Dunnhofer, Luca Sordi, Christian Micheloni. 5188-5198 [doi]

TemPose: a new skeleton-based transformer model designed for fine-grained motion recognition in badmintonMagnus Ibh, Stella Grasshof, Dan Witzner Hansen, Pascal Madeleine. 5199-5208 [doi]

Homography based Player Identification in Live SportsYash Pandya, Kaustav Nandy, Shivam Agarwal. 5209-5218 [doi]

SportsPose - A Dynamic 3D sports pose datasetChristian Keilstrup Ingwersen, Christian Mikkelstrup, Janus Nørtoft Jensen, Morten Rieger Hannemose, Anders Bjorholm Dahl. 5219-5228 [doi]

Self-Supervised Video Interaction Classification using Image Representation of Skeleton DataFarzaneh Askari, Ruixi Jiang, Zhiwei Li, Jiatong Niu, Yuyan Shi, James J. Clark. 5229-5238 [doi]

Enhancing Multi-Camera People Tracking with Anchor-Guided Clustering and Spatio-Temporal Consistency ID Re-AssignmentHsiang-Wei Huang, Cheng-Yen Yang, Zhongyu Jiang, Pyong-Kun Kim, Kyoungoh Lee, Kwangju Kim, Samartha Ramkumar, Chaitanya Mullapudi, In-Su Jang, Chung-I Huang, Jenq-Neng Hwang. 5239-5249 [doi]

Peer-to-Peer Federated Continual Learning for Naturalistic Driving Action RecognitionLiangqi Yuan, Yunsheng Ma, Lu Su, Ziran Wang. 5250-5259 [doi]

Integrating Appearance and Spatial-Temporal Information for Multi-Camera People TrackingWenjie Yang, Zhenyu Xie, Yaoming Wang, Yang Zhang 0002, Xiao Ma, Bing Hao. 5260-5269 [doi]

Action Probability Calibration for Efficient Naturalistic Driving Action LocalizationRong-Chang Li, Cong Wu, Linze Li, Zhongwei Shen, Tianyang Xu, Xiaojun Wu 0001, Xi Li 0001, Jiwen Lu, Josef Kittler. 5270-5277 [doi]

DACNet: A Deep Automated Checkout Network with Selective DeblurringYichen Cai, Aoran Jiao. 5278-5286 [doi]

2DAR: Multi-View Multi-Scale Driver Action Recognition with Vision TransformerYunsheng Ma, Liangqi Yuan, Amr Abdelraouf, Kyungtae Han, Rohit Gupta, Zihao Li, Ziran Wang. 5287-5294 [doi]

Robust and Scalable Vehicle Re-Identification via Self-SupervisionPirazh Khorramshahi, Vineet Shenoy, Rama Chellappa. 5295-5304 [doi]

FishEye8K: A Benchmark and Dataset for Fisheye Camera Object DetectionMunkhjargal Gochoo, Munkh-Erdene Otgonbold, Erkhembayar Ganbold, Jun-Wei Hsieh, Ming-Ching Chang, Ping-Yang Chen, Byambaa Dorj, Hamad Al Jassmi, Ganzorig Batnasan, Fady Alnajjar, Mohammed Abduljabbar, Fang-Pang Lin. 5305-5313 [doi]

Nordic Vehicle Dataset (NVD): Performance of vehicle detectors using newly captured NVD from UAV in different snowy weather conditionsHamam Mokayed, Amirhossein Nayebiastaneh, Kanjar de, Stergios Sozos, Olle Hagner, Björn Backe. 5314-5322 [doi]

Improving Multi-Agent Motion Prediction with Heuristic Goals and Motion RefinementCarlos Gómez Huélamo, Marcos V. Conde, Rafael Barea, Luis Miguel Bergasa. 5323-5332 [doi]

Improving Deep Learning-based Automatic Checkout System Using Image Enhancement TechniquesLong Hoang Pham, Duong Nguyen-Ngoc Tran, Huy Hung Nguyen, Hyung Joon Jeon, Tai Huu-Phuong Tran, Hyung-Min Jeon, Jae Wook Jeon. 5333-5340 [doi]

Robust Automatic Motorcycle Helmet Violation Detection for an Intelligent Transportation SystemDuong Nguyen-Ngoc Tran, Long Hoang Pham, Hyung Joon Jeon, Huy Hung Nguyen, Hyung-Min Jeon, Tai Huu-Phuong Tran, Jae Wook Jeon. 5341-5349 [doi]

Real-time Multi-Class Helmet Violation Detection Using Few-Shot Data Sampling Technique and YOLOv8Armstrong Aboah, Bin Wang, Ulas Bagci, Yaw Adu-Gyamfi. 5350-5358 [doi]

DeepSegmenter: Temporal Action Localization for Detecting Anomalies in Untrimmed Naturalistic Driving VideosArmstrong Aboah, Ulas Bagci, Abdul Rashid Mussah, Neema Jakisa Owor, Yaw Adu-Gyamfi. 5359-5365 [doi]

Video Analytics for Detecting Motorcyclist Helmet Rule ViolationsChun-Ming Tsai, Jun-Wei Hsieh, Ming-Ching Chang, Guan-Lin He, Ping-Yang Chen, Wei-Tsung Chang, Yi-Kuan Hsieh. 5366-5374 [doi]

Multi View Action Recognition for Distracted Driver Behavior LocalizationWei Zhou, Yinlong Qian, Zequn Jie, Lin Ma. 5375-5380 [doi]

Helmet Rule Violation Detection for Motorcyclists using a Custom Tracking Framework and Advanced Object Detection TechniquesViet Hung Duong, Quang-Huy Tran, Huu Si Phuc Nguyen, Duc Quyen Nguyen, Tien Cuong Nguyen. 5381-5390 [doi]

CheckSORT: Refined Synthetic Data Combination and Optimized SORT for Automatic Retail CheckoutZiqiang Shi, Zhongling Liu, Liu Liu, Rujie Liu, Takuma Yamamoto, Xiaoyu Mi, Daisuke Uchida. 5391-5398 [doi]

Leveraging Future Trajectory Prediction for Multi-Camera People TrackingYuntae Jeon, Dai Quoc Tran, Minsoo Park, Seunghee Park. 5399-5408 [doi]

Comprehensive Visual Features and Pseudo Labeling for Robust Natural Language-based Vehicle RetrievalBach Hoang Ngo, Dat Thanh Nguyen, Nhat-Tuong Do-Tran, Phuc Pham Huy Thien, Minh-Hung An, Tuan Ngoc Nguyen, Loi Nguyen Hoang, Vinh Dinh Nguyen, Quang Vinh Dinh. 5409-5418 [doi]

A Unified Multi-modal Structure for Retrieving Tracked Vehicles through Natural Language DescriptionsDong Xie, Linhu Liu, Shengjun Zhang, Jiang Tian. 5419-5427 [doi]

Triplet Temporal-based Video Recognition with Multiview for Temporal Action LocalizationHuy Duong Le, Minh Quan Vu, Manh Tung Tran, Nguyen Van Phuc. 5428-5434 [doi]

Multi-Attention Transformer for Naturalistic Driving Action RecognitionXiaodong Dong, Ruijie Zhao, Hao Sun, Dong Wu, Jin Wang, Xuyang Zhou, Jiang Liu, Shun Cui, Zhongjiang He. 5435-5441 [doi]

ReidTrack: Reid-only Multi-target Multi-camera TrackingAndreas Specker, Jürgen Beyerer. 5442-5452 [doi]

Transformer-based Fusion of 2D-pose and Spatio-temporal Embeddings for Distracted Driver Action RecognitionErkut Akdag, Zeqi Zhu, Egor Bondarev, Peter H. N. de With. 5453-5462 [doi]

Addressing the Occlusion Problem in Multi-Camera People Tracking with Human Pose EstimationJeongho Kim, Wooksu Shin, Hancheol Park, Jong-Won Baek. 5463-5469 [doi]

An Effective Motorcycle Helmet Object Detection Framework for Intelligent Traffic SafetyShun Cui, Tiantian Zhang, Hao Sun, Xuyang Zhou, Wenqing Yu, Aigong Zhen, Qihang Wu, Zhongjiang He. 5470-5476 [doi]

PRB-FPN+: Video Analytics for Enforcing Motorcycle Helmet LawsBor-Shiun Wang, Ping-Yang Chen, Yi-Kuan Hsieh, Jun-Wei Hsieh, Ming-Ching Chang, Jiaxin He, Shin-You Teng, HaoYuan Yue, Yu-Chee Tseng. 5477-5485 [doi]

AdaptCD: An Adaptive Target Region-based Commodity Detection SystemZeliang Ma, Delong Liu, Zhe Cui, Yanyun Zhao. 5486-5495 [doi]

Multi-camera People Tracking With Mixture of Realistic and Synthetic KnowledgeQuang Qui-Vinh Nguyen, Huy Dinh-Anh Le, Truc Thi-Thanh Chau, Duc-Tuan Luu, Nhat Minh Chung, Synh Viet-Uyen Ha. 5496-5506 [doi]

Adaptive RoI with pretrained models for Automated Retail CheckoutAnudeep Dhonde, Prabhudev Guntur, Vinitha Palani. 5507-5510 [doi]

Tracked-Vehicle Retrieval by Natural Language Descriptions with Multi-Contextual Adaptive KnowledgeHuy Dinh-Anh Le, Quang Qui-Vinh Nguyen, Duc Trung Luu, Truc Thi-Thanh Chau, Nhat Minh Chung, Synh Viet-Uyen Ha. 5511-5519 [doi]

Hierarchical Clustering and Refinement for Generalized Multi-Camera Person TrackingZongyi Li, Runsheng Wang, He Li, Bohao Wei, Yuxuan Shi, Hefei Ling, Jiazhong Chen, Boyuan Liu, Zhongyang Li, Hanqing Zheng. 5520-5529 [doi]

Enhancing Retail Checkout through Video Inpainting, YOLOv8 Detection, and DeepSort TrackingArpita Vats, David C. Anastasiu. 5530-5537 [doi]

The 7th AI City ChallengeMilind Naphade, Shuo Wang, David C. Anastasiu, Zheng Tang, Ming-Ching Chang, Yue Yao, Liang Zheng 0001, Mohammed Shaiqur Rahman, Meenakshi S. Arya, Anuj Sharma, Qi Feng 0004, Vitaly Ablavsky, Stan Sclaroff, Pranamesh Chakraborty, Sanjita Prajapati, Alice Li, Shangru Li, Krishna Kunadharaju, Shenxin Jiang, Rama Chellappa. 5538-5548 [doi]

TEVAD: Improved video anomaly detection with captionsWeiling Chen, Keng Teck Ma, Zi Jian Yew, Minhoe Hur, David Aik-Aun Khoo. 5549-5559 [doi]

Improving language-supervised object detection with linguistic structure analysisArushi Rai, Adriana Kovashka. 5560-5570 [doi]

BMRN: Boundary Matching and Refinement Network for Temporal Moment Localization with Natural LanguageMuah Seol, Jonghee Kim, Jinyoung Moon. 5571-5579 [doi]

Making the V in Text-VQA MatterShamanthak Hegde, Soumya Jahagirdar, Shankar Gangisetty. 5580-5588 [doi]

Weakly Supervised Visual Question Answer GenerationCharani Alampalle, Shamanthak Hegde, Soumya Jahagirdar, Shankar Gangisetty. 5589-5597 [doi]

Visual Semantic Relatedness Dataset for Image CaptioningAhmed Sabir, Francesc Moreno-Noguer, Lluís Padró 0001. 5598-5606 [doi]

CLIP-Guided Vision-Language Pre-training for Question Answering in 3D ScenesMaria Parelli, Alexandros Delitzas, Nikolas Hars, Georgios Vlassis, Sotiris Anagnostidis, Gregor Bachmann, Thomas Hofmann. 5607-5612 [doi]

T2V2T: Text-to-Video-to-Text Fusion for Text-to-Video RetrievalJonghee Kim, Youngwan Lee, Jinyoung Moon. 5613-5618 [doi]

Curriculum Learning for Data-Efficient Vision-Language AlignmentTejas Srinivasan, Xiang Ren, Jesse Thomason. 5619-5624 [doi]

Sign Language Translation from Instructional VideosLaia Tarrés, Gerard I. Gállego, Amanda Cardoso Duarte, Jordi Torres, Xavier Giró i Nieto. 5625-5635 [doi]

Underwater Moving Object Detection using an End-to-End Encoder-Decoder Architecture and GraphSage with Aggregator and RefactoringMeghna Kapoor, Suvam Patra, Badri Narayan Subudhi, Vinit Jakhetiya, Ankur Bansal. 5636-5645 [doi]

Dense Multitask Learning to Reconfigure ComicsDeblina Bhattacharjee, Sabine Süsstrunk, Mathieu Salzmann. 5646-5655 [doi]

Perception Over Time: Temporal Dynamics for Robust Image UnderstandingMaryam Daniali, Edward Kim. 5656-5665 [doi]

Nonverbal Communication Cue Recognition: A Pathway to More Accessible CommunicationZoya Shafique, Haiyan Wang 0019, Yingli Tian. 5666-5674 [doi]

A Light-Weight Human Eye Fixation Solution for Smartphone ApplicationsSudha Velusamy, Rakesh Radarapu, Anandavardhan Hegde, Narayan Kothari. 5675-5680 [doi]

Frame Level Emotion Guided Dynamic Facial Expression Recognition with Emotion GroupingBokyeung Lee, Hyunuk Shin, Bonhwa Ku, Hanseok Ko. 5681-5691 [doi]

Large-Scale Facial Expression Recognition Using Dual-Domain Affect Fusion for Noisy LabelsDexter Neo, Tsuhan Chen, Stefan Winkler 0001. 5692-5700 [doi]

Exploring Expression-related Self-supervised Learning and Spatial Reserve Pooling for Affective Behaviour AnalysisFanglei Xue, Yifan Sun 0003, Yi Yang 0001. 5701-5708 [doi]

Dynamic Noise Injection for Facial Expression Recognition In-the-WildSanghwa Hong, Jin-Woo Jeong. 5709-5715 [doi]

EmotiEffNets for Facial Processing in Video-based Valence-Arousal Prediction, Expression Classification and Action Unit DetectionAndrey V. Savchenko. 5716-5724 [doi]

ABAW5 Challenge: A Facial Affect Recognition Approach Utilizing Transformer Encoder and Audiovisual FusionZiyang Zhang, Liuwei An, Zishun Cui, Ao Xu, Tengteng Dong, Yueqi Jiang, Jingyi Shi, Xin Liu, Xiao Sun 0003, Meng Wang. 5725-5734 [doi]

Compound Expression Recognition In-the-wild with AU-assisted Meta Multi-task LearningXiman Li, Weihong Deng, Shan Li, Yong Li. 5735-5744 [doi]

SPECTRE: Visual Speech-Informed Perceptual 3D Facial Expression Reconstruction from VideosPanagiotis Paraskevas Filntisis, George Retsinas, Foivos Paraperas Papantoniou, Athanasios Katsamanis, Anastasios Roussos, Petros Maragos. 5745-5755 [doi]

Leveraging TCN and Transformer for effective visual-audio fusion in continuous emotion recognitionWeiwei Zhou, Jiada Lu, Zhaolong Xiong, Weifeng Wang. 5756-5763 [doi]

Multimodal Continuous Emotion Recognition: A Technical Report for ABAW5Su Zhang 0004, Ziyuan Zhao, Cuntai Guan. 5764-5769 [doi]

Ensemble Spatial and Temporal Vision Transformer for Action Units DetectionVu Ngoc Tu, Van Thong Huynh, Trong-Nghia Nguyen, Soo-Hyung Kim. 5770-5776 [doi]

Multi-modal Emotion Reaction Intensity Estimation with Temporal AugmentationFeng Qiu, Bowen Ma, Wei Zhang, Yu Ding 0001. 5777-5784 [doi]

Local Region Perception and Relationship Learning Combined with Feature Fusion for Facial Action Unit DetectionJun Yu 0001, Renda Li, Zhongpeng Cai, Gongpeng Zhao, Guochen Xie, Jichao Zhu, Wangyuan Zhu, Qiang Ling, Lei Wang, Cong Wang, Luyu Qiu, Wei Zheng. 5785-5792 [doi]

Multi-modal Facial Affective Analysis based on Masked AutoencoderWei Zhang, Bowen Ma, Feng Qiu, Yu Ding 0001. 5793-5802 [doi]

Exploring Large-scale Unlabeled Faces to Enhance Facial Expression RecognitionJun Yu 0001, Zhongpeng Cai, Renda Li, Gongpeng Zhao, Guochen Xie, Jichao Zhu, Wangyuan Zhu, Qiang Ling, Lei Wang, Cong Wang, Luyu Qiu, Wei Zheng. 5803-5810 [doi]

A Dual Branch Network for Emotional Reaction Intensity EstimationJun Yu 0001, Jichao Zhu, Wangyuan Zhu, Zhongpeng Cai, Guochen Xie, Renda Li, Gongpeng Zhao, Qiang Ling, Lei Wang, Cong Wang, Luyu Qiu, Wei Zheng. 5811-5818 [doi]

Relational Edge-Node Graph Attention Network for Classification of Micro-ExpressionsAnkith Jain Rakesh Kumar, Bir Bhanu. 5819-5828 [doi]

Analysis of Emotion Annotation Strength Improves Generalization in Speech Emotion Recognition ModelsJoao Palotti, Gagan Narula, Lekan Raheem, Herbert Bay. 5829-5837 [doi]

Multimodal Feature Extraction and Fusion for Emotional Reaction Intensity Estimation and Expression Classification in Videos with TransformersJia Li, Yin Chen, Xuesong Zhang, Jiantao Nie, Ziqiang Li, Yangchen Yu, Yan Zhang, Richang Hong, Meng Wang 0001. 5838-5844 [doi]

t-RAIN: Robust generalization under weather-aliasing label shift attacksAboli Marathe, Sanjana Prabhu. 5845-5854 [doi]

Multi-modal Information Fusion for Action Unit Detection in the WildYuanyuan Deng, Xiaolong Liu, Liyu Meng, Wenqiang Jiang, Youqiang Dong, Chuanhe Liu. 5855-5862 [doi]

EVAEF: Ensemble Valence-Arousal Estimation Framework in the WildXiaolong Liu, Lei Sun, Wenqiang Jiang, Fengyuan Zhang, Yuanyuan Deng, Zhaopei Huang, Liyu Meng, Yuchen Liu 0003, Chuanhe Liu. 5863-5871 [doi]

Facial Expression Recognition Based on Multi-modal Features for Videos in the WildChuanhe Liu, Xinjie Zhang, Xiaolong Liu, Tenggan Zhang, Liyu Meng, Yuchen Liu 0003, Yuanyuan Deng, Wenqiang Jiang. 5872-5879 [doi]

Inferring Affective Experience from the Big Picture Metaphor: A Two-dimensional Visual Breadth ModelSong Tong, Jingyi Duan, Xuefeng Liang, Takatsune Kumada, Kaiping Peng, Ryoichi Nakashima. 5880-5888 [doi]

ABAW: Valence-Arousal Estimation, Expression Recognition, Action Unit Detection & Emotional Reaction Intensity Estimation ChallengesDimitrios Kollias, Panagiotis Tzirakis, Alice Baird, Alan Cowen, Stefanos Zafeiriou. 5889-5898 [doi]

Spatial-Temporal Graph-Based AU Relationship Learning for Facial Action Unit DetectionZihan Wang 0005, Siyang Song, Cheng Luo, Yuzhi Zhou, Shiling Wu, Weicheng Xie 0001, LinLin Shen. 5899-5907 [doi]

Unmasking Your Expression: Expression-Conditioned GAN for Masked Face InpaintingSridhar Sola, Darshan Gera. 5908-5916 [doi]

TempT: Temporal consistency for Test-time adaptationOnur Cezmi Mutlu, Mohammadmahdi Honarmand, Saimourya Surabhi, Dennis P. Wall. 5917-5923 [doi]

A Unified Approach to Facial Affect Analysis: the MAE-Face Visual RepresentationBowen Ma, Wei Zhang, Feng Qiu, Yu Ding 0001. 5924-5933 [doi]

Integrating Holistic and Local Information to Estimate Emotional Reaction IntensityYini Fang, Liang Wu, Frederic Jumelle, Bertram E. Shi. 5934-5939 [doi]

Deep Learning-Enabled Sleep Staging From Vital Signs and Activity Measured Using a Near-Infrared Video CameraJonathan Carter, João Jorge, Bindia Venugopal, Oliver Gibson, Lionel Tarassenko. 5940-5949 [doi]

Photoplethysmography imaging algorithm for real-time monitoring of skin perfusion mapsUldis Rubins, Aleksejs Miscuks, Yousef Qawqzeh, Zbignevs Marcinkevics, Andris Grabovskis. 5950-5956 [doi]

Improving Systolic Blood Pressure Prediction from Remote Photoplethysmography Using a Stacked Ensemble RegressorLieke Dorine van Putten, K. E. Bamford. 5957-5964 [doi]

A Temporal Encoder-Decoder Approach to Extracting Blood Volume Pulse Signal Morphology from Face VideosFulan Li, Surendrabikram Thapa, Shreyas Bhat, Abhijit Sarkar, A. Lynn Abbott. 5965-5974 [doi]

Camera-based Recovery of Cardiovascular Signals from Unconstrained Face Videos using an Attention NetworkYogesh Deshpande, Surendrabikram Thapa, Abhijit Sarkar, A. Lynn Abbott. 5975-5984 [doi]

Promoting Generalization in Cross-Dataset Remote PhotoplethysmographyNathan Vance, Jeremy Speth, Benjamin Sporrer, Patrick J. Flynn. 5985-5993 [doi]

Full-Body Cardiovascular Sensing with Remote PhotoplethysmographyLu Niu, Jeremy Speth, Nathan Vance, Benjamin Sporrer, Adam Czajka, Patrick J. Flynn. 5994-6004 [doi]

Contactless Respiratory Rate Monitoring For ICU Patients Based On Unsupervised LearningZimeng Liu, Bin Huang, Chun-Liang Lin, Chieh-Liang Wu, Changchen Zhao, Wen-Cheng Chao, Yu-Cheng Wu, Yadan Zheng, Zhiru Wang. 6005-6014 [doi]

LSTC-rPPG: Long Short-Term Convolutional Network for Remote PhotoplethysmographyJun-Seong Lee, Gyutae Hwang, Moonwook Ryu, Sang-Jun Lee. 6015-6023 [doi]

Frequency Tracker for Unsupervised Heart Rate EstimationIskander Zhalbekov, Leonid Beynenson, Alexey Trushkov, Ivan Bulychev, Wenshuai Yin. 6024-6033 [doi]

Multi-View Body Image-Based Prediction of Body Mass Index and Various Body Part SizesSeunghyun Kim, Kunyoung Lee, Eui Chul Lee. 6034-6041 [doi]

Respiratory Rate Estimation Based on Detected Mask Area in Thermal ImagesNatalia Kowalczyk, Jacek Ruminski. 6042-6051 [doi]

Single Image based Infant Body Height and Weight EstimationHuaijing Shu, Lirong Ren, Liping Pan, Dongmin Huang, Hongzhou Lu, Wenjin Wang. 6052-6059 [doi]

Camera based Eye State Estimation for ICU Patients: A Pilot Clinical StudyHaowen Wang, Weijun Huang, Jia Huang, Guowei Wang, Hongzhou Lu, Wenjin Wang. 6060-6067 [doi]

Remote mass facial temperature screening in varying ambient temperatures and distancesChu Chu Qiu, Jing Wei Chin, Kwan Long Wong, Tsz Tai Chan, Yu Dong He, Richard H. Y. So. 6068-6076 [doi]

Deep learning-based image enhancement for robust remote photoplethysmography in various illumination scenariosShutao Chen, Sui Kei Ho, Jing Wei Chin, Kin Ho Luo, Tsz Tai Chan, Richard Hau Yue So, Kwan Long Wong. 6077-6085 [doi]

Optimizing Camera Exposure Control Settings for Remote Vital Sign Measurements in Low-Light EnvironmentsIsmoil Odinaev, Jing Wei Chin, Kin Ho Luo, Zhang Ke, Richard Hau Yue So, Kwan Long Wong. 6086-6093 [doi]

Real-Time Estimation of Heart Rate in Situations Characterized by Dynamic Illumination using Remote PhotoplethysmographyPatrik Hansen, Marianela García Lozano, Farzad Kamrani, Joel Brynielsson. 6094-6103 [doi]

Language Guided Local Infiltration for Interactive Image RetrievalFuxiang Huang, Lei Zhang 0038. 6104-6113 [doi]

ZippyPoint: Fast Interest Point Detection, Description, and Matching through Mixed Precision DiscretizationMenelaos Kanakis, Simon Maurer, Matteo Spallanzani, Ajad Chhatkuli, Luc Van Gool. 6114-6123 [doi]

Geometry Enhanced Reference-based Image Super-resolutionHan Zou, Liang Xu, Takayuki Okatani. 6124-6133 [doi]

SphereGlue: Learning Keypoint Matching on High Resolution Spherical ImagesChristiano Couto Gava, Vishal Mukunda, Tewodros Habtegebrial, Federico Raue, Sebastian Palacio, Andreas Dengel 0001. 6134-6144 [doi]

Multi-scale Local Implicit Keypoint Descriptor for Keypoint MatchingJongmin Lee, Eunhyeok Park, Sungjoo Yoo. 6145-6154 [doi]

Are Local Features All You Need for Cross-Domain Visual Place Recognition?Giovanni Barbarani, Mohamad Mostafa, Hajali Bayramov, Gabriele Trivigno, Gabriele Moreno Berton, Carlo Masone, Barbara Caputo. 6155-6165 [doi]

Learning Multi-scale Representations with Single-stream Network for Video RetrievalChia-Hui Wang, Yu-Chee Tseng, Ting-Hui Chiang, Yan-Ann Chen. 6166-6176 [doi]

Structured Epipolar Matcher for Local Feature MatchingJiahao Chang, Jiahuan Yu, Tianzhu Zhang. 6177-6186 [doi]

ConVol-E: Continuous Volumetric Embeddings for Human-Centric Dense Correspondence EstimationAmogh Tiwari, Pranav Manu, Nakul Rathore, Astitva Srivastava, Avinash Sharma 0001. 6187-6195 [doi]

Find My Astronaut Photo: Automated Localization and Georectification of Astronaut PhotographyAlex Stoken, Kenton Fisher. 6196-6205 [doi]

DeepRM: Deep Recurrent Matching for 6D Pose RefinementAlexander Avery, Andreas E. Savakis. 6206-6214 [doi]

KBody: Towards general, robust, and aligned monocular whole-body estimationNikolaos Zioulis, James F. O'Brien. 6215-6225 [doi]

Pretrained Pixel-Aligned Reference Network for 3D Human ReconstructionGee-Sern Hsu, Yu-Hong Lin, Chin-Cheng Chang. 6226-6234 [doi]

ECA-ConvNeXt: A Rice Leaf Disease Identification Model Based on ConvNeXtXiaoqi Wang, Yaojun Wang, Jingbo Zhao, Jing Niu. 6235-6243 [doi]

CherryPicker: Semantic Skeletonization and Topological Reconstruction of Cherry TreesLukas Meyer, Andreas Gilson, Oliver Scholz, Marc Stamminger. 6244-6253 [doi]

PeanutNeRF: 3D Radiance Field for PeanutsFarah Saeed, Jin Sun, Peggy Ozias-Akins, Ye Juliet Chu, Changying Charlie Li. 6254-6263 [doi]

Mushroom Segmentation and 3D Pose Estimation from Point Clouds using Fully Convolutional Geometric Features and Implicit Pose EncodingGeorge Retsinas, Niki Efthymiou, Petros Maragos. 6264-6271 [doi]

Agronav: Autonomous Navigation Framework for Agricultural Robots and Vehicles using Semantic Segmentation and Semantic Line DetectionShivam K. Panda, Yongkyu Lee, M. Khalid Jawed. 6272-6281 [doi]

A Realistic Synthetic Mushroom Scenes DatasetDafni Anagnostopoulou, George Retsinas, Niki Efthymiou, Panayiotis Paraskevas Filntisis, Petros Maragos. 6282-6289 [doi]

MTLSegFormer: Multi-task Learning with Transformers for Semantic Segmentation in Precision AgricultureDiogo Nunes Gonçalves, José Marcato Jr., Pedro Zamboni, Hemerson Pistori, Jonathan Li 0001, Keiller Nogueira, Wesley Nunes Gonçalves. 6290-6298 [doi]

On the Real-Time Semantic Segmentation of Aphid Clusters in the WildRaiyan Rahman, Christopher Indris, Tianxiao Zhang, Kaidong Li, Brian McCornack, Daniel Flippo, Ajay Sharda, Guanghui Wang 0001. 6299-6306 [doi]

ConvMLP: Hierarchical Convolutional MLPs for VisionJiachen Li 0003, Ali Hassani 0001, Steven Walton 0001, Humphrey Shi. 6307-6316 [doi]

Cali-NCE: Boosting Cross-modal Video Representation Learning with Calibrated AlignmentNanxuan Zhao, Jianbo Jiao, Weidi Xie, Dahua Lin. 6317-6327 [doi]

Open-TransMind: A New Baseline and Benchmark for 1st Foundation Model Challenge of Intelligent TransportationYifeng Shi, Feng Lv, Xinliang Wang, Chunlong Xia, Shaojie Li, Shujie Yang, Teng Xi, Gang Zhang. 6328-6335 [doi]

Attack-Agnostic Deep Face Anti-SpoofingAjian Liu, Zichang Tan, Yanyan Liang, Jun Wan 0001. 6336-6345 [doi]

Flexible-Modal Face Anti-Spoofing: A BenchmarkZitong Yu, Ajian Liu, Chenxu Zhao, Kevin H. M. Cheng, Xu Cheng 0003, Guoying Zhao 0001. 6346-6351 [doi]

Adversarial Domain Generalization for Surveillance Face Anti-SpoofingYongluo Liu, Yaowen Xu, Zhaofan Zou, Zhuming Wang, Bowen Zhang, Lifang Wu, Zhizhi Guo, Zhixiang He. 6352-6360 [doi]

Surveillance Face Presentation Attack Detection ChallengeHao Fang, Ajian Liu, Jun Wan 0001, Sergio Escalera, Hugo Jair Escalante, Zhen Lei 0001. 6361-6371 [doi]

Dynamic Feature Queue for Surveillance Face Anti-spoofing via Progressive TrainingKeyao Wang, Mouxiao Huang, Guosheng Zhang, Haixiao Yue, Gang Zhang, Yu Qiao. 6372-6379 [doi]

Wild Face Anti-Spoofing Challenge 2023: Benchmark and ResultsDong Wang, Jia Guo, Qiqi Shao, Haochi He, Zhian Chen, Chuanbao Xiao, Ajian Liu, Sergio Escalera, Hugo Jair Escalante, Zhen Lei 0001, Jun Wan 0001, Jiankang deng. 6380-6391 [doi]

Exploring the Effectiveness of Lightweight Architectures for Face Anti-SpoofingYoanna Martínez-Díaz, Heydi Méndez-Vázquez, Luis S. Luevano, Miguel González-Mendoza 0001. 6392-6402 [doi]

Bandpass Filter Based Dual-stream Network for Face Anti-spoofingDingheng Zeng, Liang Gao, Hao Fang, Guohui Xiang, Yue Feng, Quan Lu. 6403-6410 [doi]

Human Pose Estimation in Monocular Omnidirectional Top-View ImagesJingrui Yu, Tobias Scheck, Roman Seidel, Yukti Adya, Dipankar Nandi, Gangolf Hirtz. 6411-6420 [doi]

Applications of Deep Learning for Top-View Omnidirectional Imaging: A SurveyJingrui Yu, Ana Cecilia Pérez Grassi, Gangolf Hirtz. 6421-6433 [doi]

FishDreamer: Towards Fisheye Semantic Completion via Unified Image Outpainting and SegmentationHao Shi, Yu Li, Kailun Yang 0001, Jiaming Zhang 0001, Kunyu Peng, Alina Roitberg, Yaozu Ye, Huajian Ni, Kaiwei Wang, Rainer Stiefelhagen. 6434-6444 [doi]

Visual Gyroscope: Combination of Deep Learning Features and Direct Alignment for Panoramic StabilizationBruno Berenguel-Baeta, Antoine N. André, Guillaume Caron, Jesus Bermudez-Cameo, Josechu J. Guerrero. 6445-6448 [doi]

PanoPoint: Self-Supervised Feature Points Detection and Description for 360° PanoramaHengzhi Zhang, Hong Yi, Haijing Jia, Wei Wang, Makoto Odamaki. 6449-6458 [doi]

Graph-CoVis: GNN-based Multi-view Panorama Global Pose EstimationNegar Nejatishahidin, Will Hutchcroft, Manjunath Narayana, Ivaylo Boyadzhiev, Yuguang Li, Naji Khosravan, Jana Kosecká, Sing Bing Kang. 6459-6468 [doi]

GPR-Net: Multi-view Layout Estimation via a Geometry-aware Panorama Registration NetworkJheng-Wei Su, Chi-Han Peng, Peter Wonka, Hung-Kuo Chu. 6469-6478 [doi]

A System for Dense Monocular Mapping with a Fisheye CameraLouis Gallagher, Ganesh Sistu, Jonathan Horgan, John B. McDonald. 6479-6487 [doi]

ODIN: An OmniDirectional INdoor dataset capturing Activities of Daily Living from multiple synchronized modalitiesSiddharth Ravi, Pau Climent-Pérez, Théo Morales, Carlo Huesca-Spairani, Kooshan Hashemifard, Francisco Flórez-Revuelta. 6488-6497 [doi]

Self-supervised Interest Point Detection and Description for Fisheye and Perspective ImagesMarcela Mera-Trujillo, Shivang Patel, Yu Gu, Gianfranco Doretto. 6498-6507 [doi]

DeFlow: Self-supervised 3D Motion Estimation of Debris FlowLiyuan Zhu, Yuru Jia, Shengyu Huang, Nicholas Meyer, Andreas Wieser, Konrad Schindler, Jordan Aaron. 6508-6517 [doi]

Pointless Global Bundle Adjustment With Relative Motions HessiansEwelina Rupnik, Marc Pierrot Deseilligny. 6518-6526 [doi]

PSMNet-FusionX3: LiDAR-Guided Deep Learning Stereo Dense Matching On Aerial ImagesTeng Wu, Bruno Vallet, Marc Pierrot Deseilligny. 6527-6536 [doi]

TransFusion: Multi-modal Fusion Network for Semantic SegmentationAbhisek Maiti, Sander Oude Elberink, George Vosselman. 6537-6547 [doi]

Scan2LoD3: Reconstructing semantic 3D building models at LoD3 using ray casting and Bayesian networksOlaf Wysocki, Yan Xia 0003, Magdalena Wysocki, Eleonora Grilli, Ludwig Hoegner, Daniel Cremers, Uwe Stilla. 6548-6558 [doi]

Few-Shot Depth Completion Using Denoising Diffusion Probabilistic ModelWeihang Ran, Wei Yuan, Ryosuke Shibasaki. 6559-6567 [doi]

Fusion-SUNet: Spatial Layout Consistency for 3D Semantic SegmentationMaryam Jameela, Gunho Sohn, Sunghwan Yoo. 6568-6576 [doi]

Human Vision Based 3D Point Cloud Semantic Segmentation of Large-Scale Outdoor ScenesSunghwan Yoo, Yeonjeong Jeong, Maryam Jameela, Gunho Sohn. 6577-6586 [doi]

CAMM: Building Category-Agnostic and Animatable 3D Models from Monocular VideosTianshu Kuai, Akash Karthikeyan, Yash Kant, Ashkan Mirzaei, Igor Gilitschenski. 6587-6597 [doi]

Unbiased 4D: Monocular 4D Reconstruction with a Neural Deformation ModelErik C. M. Johnson, Marc Habermann, Soshi Shimada, Vladislav Golyanik, Christian Theobalt. 6598-6607 [doi]

Robust Monocular 3D Human Motion with Lasso-Based Differential KinematicsAbed Malti. 6608-6618 [doi]

2Former for Dynamic Body ModelingHaidong Zhu, Zhaoheng Zheng, Wanrong Zheng, Ram Nevatia. 6619-6628 [doi]

External Links

Cite Key

Statistics

PDF

Researchr

IEEE/CVF Conference on Computer Vision and Pattern Recognition, CVPR 2023 - Workshops, Vancouver, BC, Canada, June 17-24, 2023

Abstract

Table of Contents