IEEE/CVF International Conference on Computer Vision, ICCV 2023 - Workshops, Paris, France, October 2-6, 2023

researchr

You are not signed in
Sign in
Sign up

IEEE/CVF International Conference on Computer Vision, ICCV 2023 - Workshops, Paris, France, October 2-6, 2023. IEEE, 2023. [doi]

Conference: iccvw2023

Abstract is missing.

Polygon Detection for Room Layout Estimation using Heterogeneous Graphs and WireframesDavid Gillsjö, Gabrielle Flood, Kalle Åström. 1-10 [doi]

Fine-Grained is Too Coarse: A Novel Data-Centric Approach for Efficient Scene Graph GenerationMaëlic Neau, Paulo E. Santos, Anne-Gwenn Bosser, Cédric Buche. 11-20 [doi]

Knowledge Informed Sequential Scene Graph Verification Using VQADao Thauvin, Stéphane Herbin. 21-31 [doi]

DeepCut: Unsupervised Segmentation using Graph Neural Networks ClusteringAmit Aflalo, Shai Bagon, Tamar Kashti, Yonina C. Eldar. 32-41 [doi]

nuScenes Knowledge Graph - A comprehensive semantic representation of traffic scenes for trajectory predictionLeon Mlodzian, ZhiGang Sun, Hendrik Berkemeyer, Sebastian Monka, Zixu Wang, Stefan Dietze, Lavdim Halilaj, Juergen Luettin. 42-52 [doi]

Relational Prior Knowledge Graphs for Detection and Instance SegmentationOsman Ülger, Yu Wang 0065, Ysbrand Galama, Sezer Karaoglu, Theo Gevers, Martin R. Oswald. 53-61 [doi]

Haystack: A Panoptic Scene Graph Dataset to Evaluate Rare Predicate ClassesJulian Lorenz, Florian Barthel, Daniel Kienzle, Rainer Lienhart. 62-70 [doi]

Exploring the Road Graph in Trajectory Forecasting for Autonomous DrivingRémy Sun, Diane Lingrand, Frédéric Precioso. 71-80 [doi]

Dynamic Scene Graph Representation for Surgical VideoFelix Holm, Ghazal Ghazaei, Tobias Czempiel, Ege Özsoy, Stefan Saur, Nassir Navab. 81-87 [doi]

SceneGenie: Scene Graph Guided Diffusion Models for Image SynthesisAzade Farshad, Yousef Yeganeh, Yu Chi 0002, Chengzhi Shen, Björn Ommer, Nassir Navab. 88-98 [doi]

Padding Aware NeuronsDario Garcia-Gasulla, Victor Gimenez-Abalos, Pablo A. Martin-Torres. 99-108 [doi]

Geometric Superpixel Representations for Efficient Image Classification with Graph Neural NetworksRadu A. Cosma, Lukas Knobel, Putri A. van der Linden, David M. Knigge, Erik J. Bekkers. 109-118 [doi]

Using and Abusing EquivarianceTom Edixhoven, Attila Lengyel 0001, Jan C. van Gemert. 119-128 [doi]

DFM-X: Augmentation by Leveraging Prior Knowledge of Shortcut LearningShunxin Wang, Christoph Brune, Raymond N. J. Veldhuis, Nicola Strisciuglio. 129-138 [doi]

No Data Augmentation? Alternative Regularizations for Effective Training on Small DatasetsLorenzo Brigato, Stavroula G. Mougiakakou. 139-148 [doi]

COSE: A Consistency-Sensitivity Metric for Saliency on Image ClassificationRangel Daroya, Aaron Sun, Subhransu Maji. 149-158 [doi]

Video BagNet: short temporal receptive fields increase robustness in long-term action recognitionOmbretta Strafforello, Xin Liu, Klamer Schutte, Jan van Gemert. 159-166 [doi]

PARTICLE: Part Discovery and Contrastive Learning for Fine-grained RecognitionOindrila Saha, Subhransu Maji. 167-176 [doi]

Self-supervised Learning of Contextualized Local Visual EmbeddingsThalles Silva, Hélio Pedrini, Adín Ramírez Rivera. 177-186 [doi]

DeepVAT: A Self-Supervised Technique for Cluster Assessment in Image DatasetsAlokendu Mazumder, Tirthajit Baruah, Akash Kumar Singh, Pagadala Krishna Murthy, Vishwajeet Pattanaik, Punit Rathore. 187-195 [doi]

RV-VAE: Integrating Random Variable Algebra into Variational AutoencodersVassilis C. Nicodemou, Iason Oikonomidis, Antonis A. Argyros. 196-205 [doi]

Geometric Contrastive LearningYeskendir Koishekenov, Sharvaree P. Vadgama, Riccardo Valperga, Erik J. Bekkers. 206-215 [doi]

Good Fences Make Good NeighboursImanol González Estepa, Jesús M. Rodríguez-de-Vera, Bhalaji Nagarajan, Petia Radeva. 216-226 [doi]

Data Efficient Single Image Dehazing via Adversarial Auto-Augmentation and extended Atmospheric Scattering ModelPranjay Shyam, Hyunjin Yoo. 227-237 [doi]

Distilling Part-whole Hierarchical Knowledge from a Huge Pretrained Class Agnostic Segmentation FrameworkAhmed Radwan, Mohamed S. Shehata. 238-246 [doi]

Logarithm-transform aided Gaussian Sampling for Few-Shot LearningVaibhav Ganatra. 247-252 [doi]

InterAug: A Tuning-Free Augmentation Policy for Data-Efficient and Robust Object DetectionKowshik Thopalli, Devi S, Jayaraman J. Thiagarajan. 253-261 [doi]

Enhancing CLIP with GPT-4: Harnessing Visual Descriptions as PromptsMayug Maniparambil, Chris Vorster, Derek Molloy, Noel Murphy, Kevin McGuinness, Noel E. O'Connor. 262-271 [doi]

Retrieving-to-Answer: Zero-Shot Video Question Answering with Frozen Large Language ModelsJunting Pan, Ziyi Lin, Yuying Ge, Xiatian Zhu, Renrui Zhang, Yi Wang, Yu Qiao, Hongsheng Li. 272-283 [doi]

Interaction-Aware Prompting for Zero-Shot Spatio-Temporal Action DetectionWei-Jhe Huang, Jheng-Hsien Yeh, Min-Hung Chen, Gueter Josmy Faure, Shang-Hong Lai. 284-293 [doi]

ClipCrop: Conditioned Cropping Driven by Vision-Language ModelZhihang Zhong, Mingxi Cheng, Zhirong Wu, Yuhui Yuan, Yinqiang Zheng, Ji Li, Han Hu 0001, Stephen Lin 0001, Yoichi Sato, Imari Sato. 294-304 [doi]

Painter: Teaching Auto-regressive Language Models to Draw SketchesReza Pourreza 0002, Apratim Bhattacharyya, Sunny Panchal, Mingu Lee, Pulkit Madan, Roland Memisevic. 305-314 [doi]

Video Attribute Prototype Network: A New Perspective for Zero-Shot Video ClassificationBo Wang, Kaili Zhao, Hongyang Zhao, Shi Pu, Bo Xiao, Jun Guo. 315-324 [doi]

Video-and-Language (VidL) models and their cognitive relevanceAnne Zonneveld, Albert Gatt, Iacer Calixto. 325-338 [doi]

Towards an Exhaustive Evaluation of Vision-Language Foundation ModelsEmmanuelle Salin, Stéphane Ayache, Benoît Favre. 339-352 [doi]

Coarse to Fine Frame Selection for Online Open-ended Video Question AnsweringSai Vidyaranya Nuthalapati, Anirudh Tunga. 353-361 [doi]

FIVA: Facial Image and Video Anonymization and Anonymization DefenseFelix Rosberg, Eren Erdal Aksoy, Cristofer Englund, Fernando Alonso-Fernandez. 362-371 [doi]

A Comprehensive Framework for Evaluating Deepfake Generators: Dataset, Metrics Performance, and Comparative AnalysisSahar Husseini, Jean-Luc Dugelay. 372-381 [doi]

Online Detection of AI-Generated ImagesDavid C. Epstein, Ishan Jain, Oliver Wang, Richard Zhang 0001. 382-392 [doi]

WaterLo: Protect Images from Deepfakes Using Localized Semi-Fragile WatermarkNicolas Beuve, Wassim Hamidouche, Olivier Déforges. 393-402 [doi]

TrainFors: A Large Benchmark Training Dataset for Image Manipulation Detection and LocalizationSoumyaroop Nandi, Prem Natarajan, Wael Abd-Almageed. 403-414 [doi]

Undercover Deepfakes: Detecting Fake Segments in VideosSanjay Saha, Rashindrie Perera, Sachith Seneviratne, Tamasha Malepathirana, Sanka Rasnayaka, Deshani Geethika, Terence Sim, Saman K. Halgamuge. 415-425 [doi]

Revisiting Generalizability in Deepfake Detection: Improving Metrics and Stabilizing TransferSarthak Kamat, Shruti Agarwal, Trevor Darrell, Anna Rohrbach. 426-435 [doi]

Learning Interpretable Forensic Representations via Local Window ModulationSowmen Das, Md. Ruhul Amin. 436-447 [doi]

Detecting Images Generated by Deep Diffusion Models using their Local Intrinsic DimensionalityPeter Lorenz, Ricard L. Durall, Janis Keuper. 448-459 [doi]

Deepfakes Signatures Detection in the Handcrafted Features SpaceAssia Hamadene, Abdeldjalil Ouahabi, Abdenour Hadid. 460-466 [doi]

Interpretable-through-prototypes deepfake detection for diffusion modelsAgil Aghasanli, Dmitry Kangin, Plamen P. Angelov. 467-474 [doi]

Attending Generalizability in Course of Deep Fake Detection by Exploring Multi-task LearningPranav Balaji, Abhijit Das 0001, Srijan Das, Antitza Dantcheva. 475-484 [doi]

Improving Deep Learning on Hyperspectral Images of Grain by Incorporating Domain Knowledge from ChemometricsOle-Christian Galbo Engstrøm, Erik Schou Dreier, Birthe Møller Jespersen, Kim Steenstrup Pedersen. 485-494 [doi]

An Interpretable Framework to Characterize Compound Treatments on Filamentous Fungi using Cell Painting and Deep Metric LearningLaurent Lejeune, Morgane Roussin, Bruno Leggio, Aurélia Vernay. 495-504 [doi]

Weed Mapping with Convolutional Neural Networks on High Resolution Whole-Field ImagesYuemin Wang, Thuan Ha, Kathryn Aldridge, Hema Sudhakar Duddu, Steve Shirtliffe, Ian Stavness. 505-514 [doi]

Non-Destructive Infield Quality Estimation of Strawberries using Deep ArchitecturesCees Jol, Junhan Wen, Jan van Gemert. 515-524 [doi]

Estimation of Crop Production by Fusing Images and Crop FeaturesÁngela Casado-García, Jónathan Heras, Xabier Simon Martínez-Goñi, Jon Miranda-Apodaca, Usue Pérez-López. 525-530 [doi]

Plant Root Occlusion Inpainting with Generative Adversarial NetworkHao Song, Karim Panjvani, Zhigang Liu, Huzaifa Amar, Leon Kochian, Shengjian Ye, Xuan Yang, J. Allan Feurtado, Krunal Chavda, Karina Angela Chimbo Huatatoca, Mark G. Eramian. 531-539 [doi]

A new large dataset and a transfer learning methodology for plant phenotyping in Vertical FarmsNico Samà, Etienne David, Simone Rossetti, Alessandro Antona, Benjamin Franchetti, Fiora Pirri. 540-551 [doi]

Deep Learning for Apple Fruit Quality Inspection using X-Ray ImagingAstrid Tempelaere, Leen Van Doorselaer, Jiaqi He, Pieter Verboven, Tinne Tuytelaars, Bart M. Nicolaï. 552-560 [doi]

Deep learning based 3d reconstruction for phenotyping of wheat seeds: a dataset, challenge, and baseline methodVsevolod Cherepashkin, Erenus Yildiz, Andreas Fischbach, Leif Kobbelt, Hanno Scharr. 561-571 [doi]

Analyzing the Behavior of Cauliflower Harvest-Readiness Models by Investigating Feature RelevancesNiklas Penzel, Jana Kierdorf, Ribana Roscher, Joachim Denzler. 572-581 [doi]

Semantic Segmentation of Crops and Weeds with Probabilistic Modeling and Uncertainty QuantificationEkin Celikkan, Mohammadmehdi Saberioon, Martin Herold, Nadja Klein. 582-592 [doi]

Class-Incremental Learning of Plant and Disease Detection: Growing Branches with Knowledge DistillationMathieu Pagé Fortin. 593-603 [doi]

Adapting Vision Foundation Models for Plant PhenotypingFeng Chen, Mario Valerio Giuffrida, Sotirios A. Tsaftaris. 604-613 [doi]

Group-Conditional Conformal Prediction via Quantile Regression Calibration for Crop and Weed ClassificationPaul Melki, Lionel Bombrun, Boubacar Diallo, Jérôme Dias, Jean Pierre Da Costa. 614-623 [doi]

Vision-based Monitoring of the Short-term Dynamic Behaviour of Plants for Automated PhenotypingNikolaus Wagner, Grzegorz Cielniak. 624-633 [doi]

Rapid tomato DUS trait analysis using an optimized mobile-based coarse-to-fine instance segmentation algorithmDan Jeric Arcega Rustia, Guido Alexander Jansen, Selwin Hageraats, Joseph Peller, Rick van de Zedde, Cécile Marchennay, Wim Sangster, Gosia Blokker. 634-642 [doi]

Pollinators as Data Collectors: Estimating Floral Diversity with Bees and Computer VisionFrederic Tausch, Jan Wagner, Simon Klaus. 643-650 [doi]

Inductive Conformal Prediction for Harvest-Readiness Classification of Cauliflower Plants: A Comparative Study of Uncertainty Quantification MethodsMohamed Farag, Jana Kierdorf, Ribana Roscher. 651-659 [doi]

Detection of Fusarium Damaged Kernels in Wheat Using Deep Semi-Supervised Learning on a Novel WheatSeedBelt DatasetKeyhan Najafian, Lingling Jin, H. Randy Kutcher, Mackenzie Hladun, Samuel Horovatin, Maria Alejandra Oviedo-Ludena, Sheila Maria Pereira De Andrade, Lipu Wang, Ian Stavness. 660-669 [doi]

Embedded plant recognition: a benchmark for low footprint deep neural networksMohammed El Amine Sehaba, Carlos Crispim Junior, Laure Tougne Rodet. 670-677 [doi]

Unlocking Comparative Plant Scoring with Siamese Neural Networks and Pairwise Pseudo LabellingZane K. J. Hartley, Rob J. Lind, Nicholas Smith, Bob Collison, Andrew P. French. 678-684 [doi]

Unified Automatic Plant Cover and Phenology PredictionMatthias Körschens, Solveig Franziska Bucher, Christine Römermann, Joachim Denzler. 685-693 [doi]

Reinforcement learning with space carving for plant scanningAntonio Pico Villalpando, Matthias Kubisch, David Colliaux, Peter Hanappe, Verena V. Hafner. 694-701 [doi]

Towards Automated Regulation of Jacobaea Vulgaris in Grassland using Deep Neural NetworksMoritz Schauer, Renke Hohl, Dennis Vaupel, Diethelm Bienhaus, Seyed Eghbal Ghobadi. 702-711 [doi]

Efficient Grapevine Structure Estimation in Vineyards ConditionsTheophile Gentilhomme, Michael Villamizar, Jerome Corre, Jean-Marc Odobez. 712-720 [doi]

A Hybrid Visual Transformer for Efficient Deep Human Activity RecognitionYoucef Djenouri, Ahmed Nabil Belbachir. 721-730 [doi]

SCSC: Spatial Cross-scale Convolution Module to Strengthen both CNNs and TransformersXijun Wang, Xiaojie Chu, Chunrui Han, Xiangyu Zhang 0005. 731-741 [doi]

TSOSVNet: Teacher-student collaborative knowledge distillation for Online Signature VerificationChandra Sekhar Vorugunti, Avinash Gautam, Viswanath Pulabaigari, Sreeja SR, Rama Krishna Sai G. 742-751 [doi]

SeMask: Semantically Masked Transformers for Semantic SegmentationJitesh Jain, Anukriti Singh, Nikita Orlov, Zilong Huang, Jiachen Li 0003, Steven Walton 0001, Humphrey Shi. 752-761 [doi]

Interactive Image Segmentation with Cross-Modality Vision TransformersKun Li, George Vosselman, Michael Ying Yang. 762-772 [doi]

Which Tokens to Use? Investigating Token Reduction in Vision TransformersJoakim Bruslund Haurum, Sergio Escalera, Graham W. Taylor, Thomas B. Moeslund. 773-783 [doi]

Actor-agnostic Multi-label Action Recognition with Multi-modal QueryAnindya Mondal, Sauradip Nag, Joaquin M. Prada, Xiatian Zhu, Anjan Dutta 0001. 784-794 [doi]

Hierarchical Spatiotemporal Transformers for Video Object SegmentationJun-Sang Yoo 0002, Hongjae Lee, Seung-Won Jung. 795-805 [doi]

Explaining through Transformer Input SamplingAlexandre Englebert, Sédrick Stassin, Géraldin Nanfack, Sidi Ahmed Mahmoudi, Xavier Siebert, Olivier Cornu, Christophe De Vleeschouwer. 806-815 [doi]

IDTransformer: Transformer for Intrinsic Image DecompositionPartha Das, Maxime Gevers, Sezer Karaoglu, Theo Gevers. 816-825 [doi]

All-pairs Consistency Learning for Weakly Supervised Semantic SegmentationWeixuan Sun, Yanhao Zhang, Zhen Qin, Zheyuan Liu 0002, Lin Cheng, Fanyi Wang, Yiran Zhong, Nick Barnes. 826-837 [doi]

MSViT: Dynamic Mixed-scale Tokenization for Vision TransformersJakob Drachmann Havtorn, Amélie Royer, Tijmen Blankevoort, Babak Ehteshami Bejnordi. 838-848 [doi]

TransInpaint: Transformer-based Image Inpainting with Context AdaptationPourya Shamsolmoali, Masoumeh Zareapoor, Eric Granger. 849-858 [doi]

Spatio-Temporal Convolution-Attention Video NetworkAli Diba, Vivek Sharma 0001, Mohammad Mahdi Arzani, Luc Van Gool. 859-869 [doi]

Dual-Contrastive Dual-Consistency Dual-Transformer: A Semi-Supervised Approach to Medical Image SegmentationZiyang Wang, Congying Ma. 870-879 [doi]

On Moving Object Segmentation from Monocular Video with TransformersChristian Homeyer, Christoph Schnörr. 880-891 [doi]

MOSAIC: Multi-Object Segmented Arbitrary Stylization Using CLIPPrajwal Ganugula, Y. S. S. S. Santosh Kumar, N. K. Sagar Reddy, Prabhath Chellingi, Avinash Thakur, Neeraj Kasera, C. Shyam Anand. 892-903 [doi]

Template-guided Illumination Correction for Document Images with Imperfect Geometric ReconstructionFelix Hertlein, Alexander Naumann. 904-913 [doi]

Adaptive Self-Training for Object DetectionRenaud Vandeghen, Gilles Louppe, Marc Van Droogenbroeck. 914-923 [doi]

Tensor Factorization for Leveraging Cross-Modal Knowledge in Data-Constrained Infrared Object DetectionManish Sharma, Moitreya Chatterjee, Kuan-Chuan Peng, Suhas Lohit, Michael N. Jones. 924-932 [doi]

Learning Universal Semantic Correspondences with No Supervision and Automatic Data CurationAleksandar Shtedritski, Andrea Vedaldi, Christian Rupprecth. 933-943 [doi]

Semantic RGB-D Image SynthesisShijie Li, Rong Li, Juergen Gall. 944-952 [doi]

JEDI: Joint Expert Distillation in a Semi-Supervised Multi-Dataset Student-Teacher Scenario for Video Action RecognitionLucian Bicsi, Bogdan Alexe, Radu-Tudor Ionescu, Marius Leordeanu. 953-962 [doi]

Frequency-Aware Self-Supervised Long-Tailed LearningCi-Siang Lin, Min-Hung Chen, Yu-Chiang Frank Wang. 963-972 [doi]

SelectNAdapt: Support Set Selection for Few-Shot Domain AdaptationYoussef Dawoud, Gustavo Carneiro 0001, Vasileios Belagiannis. 973-982 [doi]

Self-supervised Hypergraphs for Learning Multiple World InterpretationsAlina Marcu, Mihai Cristian Pîrvu, Dragos Costea, Emanuela Haller, Emil Slusanschi, Nabil Belbachir, Rahul Sukthankar, Marius Leordeanu. 983-992 [doi]

MIAD: A Maintenance Inspection Dataset for Unsupervised Anomaly DetectionTianpeng Bao, Jiadong Chen, Wei Li, Xiang Wang, Jingjing Fei, Liwei Wu, Rui Zhao, Ye Zheng. 993-1002 [doi]

Self-training and multi-task learning for limited data: evaluation study on object detectionHoàng-Ân Lê, Minh-Tan Pham. 1003-1009 [doi]

Augmenting Features via Contrastive Learning-based Generative Model for Long-Tailed ClassificationMinho Park, Hyung-il Kim, Hwa Jeon Song, Dong-Oh Kang. 1010-1019 [doi]

Boosting Semi-Supervised Learning by bridging high and low-confidence predictionsKhanh-Binh Nguyen, Joon-Sung Yang. 1020-1030 [doi]

FedLID: Self-Supervised Federated Learning for Leveraging Limited Image DataAthanasios Psaltis, Anestis Kastellos, Charalampos Z. Patrikakis, Petros Daras. 1031-1040 [doi]

A Horse with no Labels: Self-Supervised Horse Pose Estimation from Unlabelled Images and Synthetic PriorJose Sosa, David C. Hogg. 1041-1048 [doi]

Enhancing Classification Accuracy on Limited Data via Unconditional GANChunsan Hong, Byunghee Cha, Bohyung Kim, Tae Hyun Oh. 1049-1057 [doi]

Deep Generative Networks for Heterogeneous Augmentation of Cranial DefectsKamil Kwarciak, Marek Wodzinski. 1058-1066 [doi]

360° from a Single Camera: A Few-Shot Approach for LiDAR SegmentationLaurenz Reichardt, Nikolas Ebert, Oliver Wasenmüller. 1067-1075 [doi]

Guiding Video Prediction with Explicit Procedural KnowledgePatrick Takenaka, Johannes Maucher, Marco F. Huber. 1076-1084 [doi]

G2L: A High-Dimensional Geometric Approach for Automatic Generation of Highly Accurate Pseudo-labelsJohn R. Kender, Parijat Dube, Zhengyang Han, Bishwaranjan Bhattacharjee. 1085-1094 [doi]

Image Guided Inpainting with Parameter Efficient LearningSangbeom Lim, Seungryong Kim. 1095-1103 [doi]

ILSH: The Imperial Light-Stage Head Dataset for Human Head View SynthesisJiali Zheng, Youngkyoon Jang, Athanasios Papaioannou, Christos Kampouris, Rolandos-Alexandros Potamias, Foivos Paraperas Papantoniou, Efstathios Galanakis, Ales Leonardis, Stefanos Zafeiriou. 1104-1112 [doi]

VSCHH 2023: A Benchmark for the View Synthesis Challenge of Human HeadsYoungkyoon Jang, Jiali Zheng, Jifei Song, Helisa Dhamo, Eduardo Pérez-Pellitero, Thomas Tanay, Matteo Maggioni, Richard Shaw, Sibi Catley-Chandar, Yiren Zhou, Jiankang deng, Ruijie Zhu, Jiahao Chang, Ziyang Song, Jiahuan Yu, Tianzhu Zhang, Khanh-Binh Nguyen, Joon-Sung Yang, Andreea Dogaru, Bernhard Egger, Heng Yu, Aarush Gupta, Joel Julin, László A. Jeni, Hyeseong Kim, Jungbin Cho, Dosik Hwang, Deukhee Lee, Doyeon Kim, Dongseong Seo, SeungJin Jeon, Youngdon Choi, Jun Seok Kang, Ahmet Cagatay Seker, Sang Chul Ahn, Ales Leonardis, Stefanos Zafeiriou. 1113-1120 [doi]

A Simple and Generic Framework for Feature Distillation via Channel-wise TransformationZiwei Liu, Yongtao Wang, Xiaojie Chu, Nan Dong, Shengxiang Qi, Haibin Ling. 1121-1130 [doi]

Deterministic Neural Illumination Mapping for Efficient Auto-White Balance CorrectionFurkan Kinli, Doga Yilmaz, Baris Özcan, Furkan Kiraç. 1131-1139 [doi]

A Comprehensive Study of Transfer Learning under ConstraintsTom Pégeot, Inna Kucher, Adrian Popescu 0001, Bertrand Delezoide. 1140-1149 [doi]

Ray-Patch: An Efficient Querying for Light Field TransformersTomás Berriel Martins, Javier Civera 0001. 1150-1155 [doi]

Cross-model temporal cooperation via saliency maps for efficient frame classificationTomaso Trinci, Tommaso Bianconcini, Leonardo Sarti, Leonardo Taccari, Francesco Sambo. 1156-1160 [doi]

YOLOBench: Benchmarking Efficient Object Detectors on Embedded SystemsIvan Lazarevich, Matteo Grimaldi, Ravish Kumar, Saptarshi Mitra, Shahrukh Khan, Sudhakar Sah. 1161-1170 [doi]

Accelerating Deep Neural Networks via Semi-Structured Activation SparsityMatteo Grimaldi, Darshan C. Ganji, Ivan Lazarevich, Sudhakar Sah Deeplite. 1171-1180 [doi]

Revisiting Kernel Temporal Segmentation as an Adaptive Tokenizer for Long-form Video UnderstandingMohamed Afham, Satya Narayan Shukla, Omid Poursaeed, Pengchuan Zhang, Ashish Shah, Sernam Lim. 1181-1186 [doi]

NCQS: Nonlinear Convex Quadrature Surrogate Hyperparameter OptimizationSophia J. Abraham, Kehelwala Dewage Gayan Maduranga, Jeffery Kinnison, Jonathan D. Hauenstein, Walter J. Scheirer. 1187-1195 [doi]

When Layers Play the Lottery, all Tickets Win at InitializationArtur Jordão, George Corrêa de Araújo, Helena de Almeida Maia, Hélio Pedrini. 1196-1205 [doi]

Video Action Recognition with Adaptive Zooming Using Motion ResidualsMostafa Shahabinejad, Irina Kezele, Seyed shahabeddin Nabavi, WenTao Liu, Seel Patel, Yuanhao Yu, Yang Wang 0003, Jin Tang. 1206-1215 [doi]

Shapley Deep Learning: A Consensus for General-Purpose Vision SystemsYoucef Djenouri, Ahmed Nabil Belbachir, Tomasz P. Michalak, Anis Yazidi. 1216-1225 [doi]

HyperSparse Neural Networks: Shifting Exploration to Exploitation through Adaptive RegularizationPatrick Glandorf, Timo Kaiser, Bodo Rosenhahn. 1226-1235 [doi]

Reconstructing Pruned Filters using Cheap Spatial TransformationsRoy Miles, Krystian Mikolajczyk. 1236-1244 [doi]

Enhancing Differentiable Architecture Search: A Study on Small Number of Cell Blocks in the Search Stage, and Important Branches-based Cells SelectionBedionita Soro, Chong Song. 1245-1253 [doi]

CoroNetGAN: Controlled Pruning of GANs via HypernetworksAman Kumar, Khushboo Anand, Shubham Mandloi, Ashutosh Mishra, Avinash Thakur, Neeraj Kasera, Prathosh A P. 1254-1263 [doi]

Developing Robust and Lightweight Adversarial Defenders by Enforcing Orthogonality on Attack-Agnostic Denoising AutoencodersAristeidis Bifis, Emmanouil Z. Psarakis, Dimitrios I. Kosmopoulos. 1264-1273 [doi]

QBitOpt: Fast and Accurate Bitwidth Reallocation during TrainingJorn Peters, Marios Fournarakis, Markus Nagel, Mart van Baalen, Tijmen Blankevoort. 1274-1283 [doi]

MGiaD: Multigrid in all dimensions. Efficiency and robustness by weight sharing and coarsening in resolution and channel dimensionsAntonia van Betteray, Matthias Rottmann, Karsten Kahl. 1284-1293 [doi]

Accumulation Knowledge Distillation for Conditional GAN CompressionTingwei Gao, Rujiao Long. 1294-1303 [doi]

Characterizing Face Recognition for Resource Efficient Deployment on EdgeAyan Biswas, Sai Amrit Patnaik, A. H. Abdul Hafez, Anoop M. Namboodiri. 1304-1313 [doi]

MOFA: A Model Simplification Roadmap for Image Restoration on Mobile DevicesXiangyu Chen, Ruiwen Zhen, Shuai Li, Xiaotian Li, Guanghui Wang 0001. 1314-1324 [doi]

DetOFA: Efficient Training of Once-for-All Networks for Object Detection using Path FilterYuiko Sakuma, Masato Ishii, Takuya Narihira. 1325-1334 [doi]

Post Training Mixed Precision Quantization of Neural Networks using First-Order InformationArun Chauhan 0004, Utsav Tiwari, Vikram N. R. 1335-1344 [doi]

ZiCo-BC: A Bias Corrected Zero-Shot NAS for Vision TasksKartikeya Bhardwaj, Hsin-Pai Cheng, Sweta Priyadarshi, Zhuojin Li. 1345-1349 [doi]

Bi-Encoder Cascades for Efficient Image SearchRobert Hönig, Jan Ackermann, Mingyuan Chi. 1350-1355 [doi]

Tiny and Efficient Model for the Edge Detection GeneralizationXavier Soria, Yachuan Li, Mohammad Rouhani, Angel Domingo Sappa. 1356-1365 [doi]

Factorized Dynamic Fully-Connected Layers for Neural NetworksFrancesca Babiloni, Thomas Tanay, Jiankang deng, Matteo Maggioni, Stefanos Zafeiriou. 1366-1375 [doi]

DONNAv2 - Lightweight Neural Architecture Search for Vision tasksSweta Priyadarshi, Tianyu Jiang, Hsin-Pai Cheng, Sendil Krishna, Viswanath Ganapathy, Chirag Patel. 1376-1384 [doi]

RCD-SGD: Resource-Constrained Distributed SGD in Heterogeneous Environment Via Submodular PartitioningHaoze He, Parijat Dube. 1385-1393 [doi]

Can Unstructured Pruning Reduce the Depth in Deep Neural Networks?Zhu Liao, Victor Quétu, Van Tam Nguyen, Enzo Tartaglione. 1394-1398 [doi]

Surround the Nonlinearity: Inserting Foldable Convolutional Autoencoders to Reduce Activation FootprintBaptiste Rossigneux, Inna Kucher, Vincent Lorrain, Emmanuel Casseau. 1399-1403 [doi]

Cross-Domain Transfer Learning with CoRTe: Consistent and Reliable Transfer from Black-Box to Lightweight Segmentation ModelClaudia Cuttano, Antonio Tavera, Fabio Cermelli, Giuseppe Averta, Barbara Caputo. 1404-1414 [doi]

Efficient Neural PDE-Solvers using Quantization Aware TrainingWinfried van den Dool, Tijmen Blankevoort, Max Welling, Yuki M. Asano. 1415-1424 [doi]

Single-Shot Pruning for Pre-trained Models: Rethinking the Importance of Magnitude PruningHirokazu Kohama, Hiroaki Minoura, Tsubasa Hirakawa, Takayoshi Yamashita, Hironobu Fujiyoshi. 1425-1434 [doi]

SCoTTi: Save Computation at Training Time with an adaptive frameworkZiyu Li, Enzo Tartaglione, Van Tam Nguyen. 1435-1444 [doi]

Softmax Bias Correction for Quantized Generative ModelsNilesh Prasad Pandey, Marios Fournarakis, Chirag Patel, Markus Nagel. 1445-1450 [doi]

Entropic Score metric: Decoupling Topology and Size in Training-free NASNiccolò Cavagnero, Luca Robbiano, Francesca Pistilli, Barbara Caputo, Giuseppe Averta. 1451-1460 [doi]

Fast Object Detection in High-Resolution VideosRyan Tran, Atul Kanaujia, Vasu Parameswaran. 1461-1470 [doi]

Extending TrOCR for Text Localization-Free OCR of Full-Page Scanned Receipt ImagesHongkuan Zhang, Edward Whittaker, Ikuo Kitagishi. 1471-1477 [doi]

Multi-Exit Resource-Efficient Neural Architecture for Image Classification with Optimized Fusion BlockYouva Addad, Alexis Lechervy, Frédéric Jurie. 1478-1483 [doi]

Lightweight Vision Transformer with Spatial and Channel Enhanced Self-AttentionJiahao Zheng, Longqi Yang, Yiying Li, Ke Yang, Zhiyuan Wang, Jun Zhou. 1484-1488 [doi]

Dynamic Neural Network is All You Need: Understanding the Robustness of Dynamic Mechanisms in Neural NetworksMirazul Haque, Wei Yang 0013. 1489-1498 [doi]

AntiNODE: Evaluating Efficiency Robustness of Neural ODEsMirazul Haque, Simin Chen, Wasif Arman Haque, Cong Liu, Wei Yang 0013. 1499-1509 [doi]

Shannon Strikes Again! Entropy-based Pruning in Deep Neural Networks for Transfer Learning under Extreme Memory and Computation BudgetsGabriele Spadaro, Riccardo Renzulli, Andrea Bragagnolo, Jhony H. Giraldo, Attilio Fiandrotti, Marco Grangetto, Enzo Tartaglione. 1510-1514 [doi]

InstaTune: Instantaneous Neural Architecture Search During Fine-TuningSharath Nittur Sridhar, Souvik Kundu 0002, Sairam Sundaresan, Maciej Szankin, Anthony Sarah. 1515-1519 [doi]

Quantized Generative Models for Solving Inverse ProblemsKartheek Kumar Reddy Nareddy, Vinayak Killedar, Chandra Sekhar Seelamantula. 1520-1525 [doi]

RCV2023 Challenges: Benchmarking Model Training and Inference for Resource-Constrained Deep LearningRishabh Tiwari, Arnav Chavan, Deepak Gupta, Gowreesh Mago, Animesh Gupta, Akash Gupta, Suraj Sharan, Yukun Yang, Shanwei Zhao, Shihao Wang, Youngjun Kwak, Seonghun Jeong, Yunseung Lee, Changick Kim, Subin Kim, Ganzorig Gankhuyag, Ho Jung, Junwhan Ryu, HaeMoon Kim, Byeong Hak Kim, Tu Vo, Sheir Zaheer, Alexander Holston, Chan Y. Park, Dheemant Dixit, Nahush Lele, Kushagra Bhushan, Debjani Bhowmick, Devanshu Arya, Sadaf Gulshad, AmirHossein Habibian, Amir Ghodrati, Babak Ehteshami Bejnordi, Jai Gupta, Zhuang Liu 0003, Jiahui Yu, Dilip K. Prasad, Zhiqiang Shen. 1526-1535 [doi]

Scalable MAV Indoor Reconstruction with Neural Implicit SurfacesHaoda Li, Puyuan Yi, Yunhao Liu 0007, Avideh Zahor. 1536-1544 [doi]

PanoStyle: Semantic, Geometry-Aware and Shading Independent Photorealistic Style Transfer for Indoor Panoramic ScenesMuhammad Tukur, A. Ur Rehman, Giovanni Pintore, Enrico Gobbetti, J. Schneider, M. Agus. 1545-1556 [doi]

MARL: Multi-scale Archetype Representation Learning for Urban Building Energy ModelingXinwei Zhuang, Zixun Huang, Wentao Zeng, Luisa Caldas. 1557-1564 [doi]

SSIG: A Visually-Guided Graph Edit Distance for Floor Plan SimilarityCasper C. J. van Engelenburg, Seyran Khademi, Jan C. van Gemert. 1565-1574 [doi]

Floor Plan Reconstruction from Sparse Views: Combining Graph Neural Network with Constrained DiffusionArnaud Gueze, Matthieu Ospici, Damien Rohmer, Marie-Paule Cani. 1575-1584 [doi]

3D surface Approximation of the Entire Bayeux Tapestry for Improved Pedagogical AccessMarjorie Redon, Matthieu Pizenberg, Yvain Quéau, Abderrahim Elmoataz. 1585-1594 [doi]

DeFi: Detection and Filling of Holes in Point Clouds Towards Restoration of Digitized Cultural Heritage ModelsRamesh Ashok Tabib, Dikshit Hegde, Tejas Anvekar, Uma Mudenagudi. 1595-1604 [doi]

Facsimiles-based deep learning for matching relief-printed decorations on medieval ceramic sherdsKhawla Brahim, Sylvie Treuillet, Matthieu Exbrayat, Sébastien Jesset. 1605-1614 [doi]

Learning to rank approach for refining image retrieval in visual artsTetiana Yemelianenko, Iuliia Tkachenko, Tess Masclef, Mihaela Scuturici, Serge Miguet. 1615-1623 [doi]

MatchMakerNet: Enabling Fragment Matching for Cultural Heritage AnalysisAriana M. Villegas-Suarez, Cristian Lopez, Ivan Sipiran. 1624-1633 [doi]

Evaluation of 3D Reconstruction for Cultural Heritage ApplicationsCristián Llull, Nelson Baloian, Benjamin Bustos, Kornelius Kupczik, Ivan Sipiran, Andres Baloian. 1634-1643 [doi]

ASUR3D: Arbitrary Scale Upsampling and Refinement of 3D Point Clouds using Local Occupancy FieldsAkash Kumbar, Tejas Anvekar, Ramesh Ashok Tabib, Uma Mudenagudi. 1644-1653 [doi]

Hyperspectral Imaging of In-Site Stained Glasses: Illumination Variation Compensation Using Two Perpendicular ScansSuzan Joseph Kessy, Takuya Funatomi, Kazuya Kitano, Yuki Fujimura, Guillaume Caron, El Mustapha Mouaddib, Yasuhiro Mukaigawa. 1654-1662 [doi]

Pigment Mapping for Tomb Murals using Neural Representation and Physics-based ModelMayuka Tsuji, Yuki Fujimura, Takuya Funatomi, Yasuhiro Mukaigawa, Tetsuro Morimoto, Takeshi Oishi, Jun Takamatsu, Katsushi Ikeuchi. 1663-1671 [doi]

CNN based Cuneiform Sign Detection Learned from Annotated 3D Renderings and Mapped Photographs with Illumination AugmentationErnst Stötzner, Timo Homburg, Hubert Mara. 1672-1680 [doi]

Semantic Segmentation using Foundation Models for Cultural Heritage: an Experimental Study on Notre-Dame de ParisKévin Réby, Anaïs Guilhelm, Livio De Luca. 1681-1689 [doi]

An interactive method for adaptive acquisition in Reflectance Transformation Imaging for cultural heritageMuhammad Arsalan Khawaja, Sony George, Franck Marzani, Jon Yngve Hardeberg, Alamin Mansouri. 1690-1698 [doi]

Diffusion Based Augmentation for Captioning and Retrieval in Cultural HeritageDario Cioni, Lorenzo Berlincioni, Federico Becattini, Alberto Del Bimbo. 1699-1708 [doi]

Semantic Motif Segmentation of Archaeological Fresco FragmentsAref Enayati, Luca Palmieri, Sebastiano Vascon, Marcello Pelillo, Sinem Aslan. 1709-1717 [doi]

Volumetric Fast Fourier Convolution for Detecting Ink on the Carbonized Herculaneum PapyriFabio Quattrini, Vittorio Pippi, Silvia Cascianelli, Rita Cucchiara. 1718-1726 [doi]

Building CAD Model Reconstruction from Point Clouds via Instance Segmentation, Signed Distance Function, and Graph CutTakayuki Shinohara, Yonghe Li, Mitsuteru Sakamoto, Toshiaki Satoh. 1727-1736 [doi]

2D Cross-View Object Segmentation and Perceptual Grouping in Computer-Aided Design DrawingsMohamed Dhia Elhak Besbes, Zahra Vahidi Ferdousi, Hedi Tabia, Mouna Fradi. 1737-1746 [doi]

APNet: Urban-level Scene Segmentation of Aerial Images and Point CloudsWeijie Wei, Martin R. Oswald, Fatemeh Karimi Nejadasl, Theo Gevers. 1747-1756 [doi]

Rotation-invariant Hierarchical Segmentation on Poincaré Ball for 3D Point CloudPierre Onghena, Leonardo Gigli, Santiago Velasco-Forero. 1757-1766 [doi]

Fine-Tuned but Zero-Shot 3D Shape Sketch View Similarity and RetrievalGianluca Berardi, Yulia Gryaditskaya. 1767-1777 [doi]

SHARP Challenge 2023: Solving CAD History and pArameters Recovery from Point clouds and 3D scans. Overview, Datasets, Metrics, and BaselinesDimitrios Mallis, Sk Aziz Ali, Elona Dupont, Kseniya Cherenkova, Ahmet Serdar Karadeniz, Mohammad Sadil Khan, Anis Kacem 0001, Gleb Gusev, Djamila Aouada. 1778-1787 [doi]

The First Visual Object Tracking Segmentation VOTS2023 Challenge ResultsMatej Kristan, Jirí Matas, Martin Danelljan, Michael Felsberg, Hyung Jin Chang, Luka Cehovin Zajc, Alan Lukezic, Ondrej Drbohlav, Zhongqun Zhang, Khanh-Tung Tran, Xuan-Son Vu, Johanna Björklund, Christoph Mayer 0007, Yushan Zhang, Lei Ke, Jie Zhao, Gustavo Fernández, Noor Al-Shakarji, Dong An, Michael Arens, Stefan Becker, Goutam Bhat, Sebastian Bullinger, Antoni B. Chan, Shijie Chang, Hanyuan Chen, Xin Chen, Yan Chen, Zhenyu Chen, Yangming Cheng, Yutao Cui, Chunyuan Deng, Jiahua Dong, Matteo Dunnhofer, Wei Feng, Jianlong Fu, Jie Gao, Ruize Han, Zeqi Hao, Jun-Yan He, Keji He, Zhenyu He 0001, Xiantao Hu, Kaer Huang, Yuqing Huang, Yi Jiang, Ben Kang, Jin-Peng Lan, Hyungjun Lee, Chenyang Li, Jiahao Li, Ning Li, Wangkai Li, Xiaodi Li, Xin Li, Pengyu Liu, Yue Liu, Huchuan Lu, Bin Luo, Ping Luo, Yinchao Ma, Deshui Miao, Christian Micheloni, Kannappan Palaniappan, Hancheol Park, Matthieu Paul, Houwen Peng, Zekun Qian, Gani Rahmon, Norbert Scherer-Negenborn, Pengcheng Shao, Wooksu Shin, Elham Soltani Kazemi, Tianhui Song, Rainer Stiefelhagen, Rui Sun, Chuanming Tang, Zhangyong Tang, Imad Eddine Toubal, Jack Valmadre, Joost van de Weijer 0001, Luc Van Gool, Jash Vira, Stéphane Vujasinovic, Cheng Wan, Jia Wan, Dong Wang 0004, Fei Wang 0032, Feifan Wang, He Wang, Limin Wang, Song Wang, Yaowei Wang, Zhepeng Wang, Gangshan Wu, Jiannan Wu, Qiangqiang Wu, Xiaojun Wu 0001, Anqi Xiao, Jinxia Xie, Chenlong Xu, Min Xu, Tianyang Xu, Yuanyou Xu, Bin Yan 0004, Dawei Yang, Ming-Hsuan Yang 0001, Tianyu Yang, Yi Yang, Zongxin Yang, Xuanwu Yin, Fisher Yu 0001, Hongyuan Yu, Qianjin Yu, Weichen Yu, Yongsheng Yuan, Zehuan Yuan, Jianlin Zhang, Lu Zhang, Tianzhu Zhang, Guodongfang Zhao, Shaochuan Zhao, Yaozong Zheng, Bineng Zhong, Jiawen Zhu, Xuefeng Zhu, Yueting Zhuang, ChengAo Zong, Kunlong Zuo. 1788-1810 [doi]

Vision-Based Treatment Localization with Limited Data: Automated Documentation of Military Emergency Medical ProceduresTrevor Powers, Elaheh Hatamimajoumerd, William Chu, Vishakk Rajendran, Rishi Shah, Frank Diabour, Marc Vaillant, Richard Fletcher, Sarah Ostadabbas. 1811-1820 [doi]

Autonomous mobile robot for automatic out of stock detection in a supermarketGiuseppe De Simone, Pasquale Foggia, Alessia Saggese, Mario Vento. 1821-1830 [doi]

Real-Time Optimisation-Based Path Planning for Visually Impaired People in Dynamic EnvironmentsHadeel R. Surougi, Julie A. McCann. 1831-1840 [doi]

Enhancing Human-Robot Collaborative Object Search through Human Behavior Observation and DialogTakahiro Ishii, Jun Miura, Kotaro Hayashi. 1841-1848 [doi]

Open Scene Understanding: Grounded Situation Recognition Meets Segment Anything for Helping People with Visual ImpairmentsRuiping Liu, Jiaming Zhang 0001, Kunyu Peng, Junwei Zheng, Ke Cao, Yufan Chen, Kailun Yang 0001, Rainer Stiefelhagen. 1849-1859 [doi]

Personalized Monitoring in Home Healthcare: An Assistive System for Post Hip Replacement RehabilitationAlaa Kryeem, Shmuel Raz, Dana Eluz, Dorit Itah, Hagit Hel-Or, Ilan Shimshoni. 1860-1869 [doi]

Repetition-aware Image Sequence Sampling for Recognizing Repetitive Human ActionsKonstantinos Bacharidis, Antonis A. Argyros. 1870-1879 [doi]

IFPNet: Integrated Feature Pyramid Network with Fusion Factor for Lane DetectionZinan Lv, Dong Han, Wenzhe Wang, Cheng Chen. 1880-1889 [doi]

Affordance segmentation of hand-occluded containers from exocentric imagesTommaso Apicella, Alessio Xompero, Edoardo Ragusa, Riccardo Berta, Andrea Cavallaro, Paolo Gastaldo. 1890-1899 [doi]

Multi-Camera 3D Position Estimation using Conditional Random FieldShusuke Matsuda, Nattaon Techasarntikul, Hideyuki Shimonishi. 1900-1908 [doi]

VLMAH: Visual-Linguistic Modeling of Action History for Effective Action AnticipationVictoria Manousaki, Konstantinos Bacharidis, Konstantinos E. Papoutsakis, Antonis A. Argyros. 1909-1919 [doi]

Towards estimation of human intent in assistive robotic teleoperation using kinaesthetic and visual feedbackMuneeb Ahmed, Brejesh Lall, Rajesh Kumar, Arzad Alam Kherani. 1920-1926 [doi]

SHOWMe: Benchmarking Object-agnostic Hand-Object 3D ReconstructionAnilkumar Swamy, Vincent Leroy 0003, Philippe Weinzaepfel, Fabien Baradel, Salma Galaaoui, Romain Brégier, Matthieu Armando, Jean-Sébastien Franco, Grégory Rogez. 1927-1936 [doi]

Learnt Contrastive Concept Embeddings for Sign RecognitionRyan Wong 0003, Necati Cihan Camgöz, Richard Bowden. 1937-1946 [doi]

Is context all you need? Scaling Neural Sign Language Translation to Large Domains of DiscourseOzge Mercanoglu Sincan, Necati Cihan Camgöz, Richard Bowden. 1947-1957 [doi]

A New Dataset for End-to-End Sign Language Translation: The Greek Elementary School DatasetAndreas Voskou, Konstantinos P. Panousis, Harris Partaourides, Kyriakos Tolias, Sotirios Chatzis. 1958-1967 [doi]

Multimodal Error Correction with Natural Language and Pointing GesturesStefan Constantin, Fevziye Irem Eyiokur, Dogucan Yaman, Leonard Bärmann, Alex Waibel. 1968-1978 [doi]

Modeling Visual Impairments with Artificial Neural Networks: a ReviewLucia Schiatti, Monica Gori, Martin Schrimpf, Giulia Cappagli, Federica Morelli, Sabrina Signorini, Boris Katz, Andrei Barbu. 1979-1991 [doi]

Continuous Hand Gesture Recognition for Human-Robot Collaborative AssemblyBogdan Kwolek. 1992-1999 [doi]

From Scarcity to Understanding: Transfer Learning for the Extremely Low Resource Irish Sign LanguageRuth Holmes, Ellen Rushe, Mathieu De Coster, Maxim Bonnaerens, Shinichi Satoh, Akihiro Sugimoto, Anthony Ventresque. 2000-2009 [doi]

FewFaceNet: A Lightweight Few-Shot Learning-based Incremental Face Authentication for Edge CamerasAbu Sufian, Anirudha Ghosh, Debaditya Barman, Marco Leo, Cosimo Distante, Baihua Li. 2010-2019 [doi]

CLIP goes 3D: Leveraging Prompt Tuning for Language Grounded 3D RecognitionDeepti Hegde, Jeya Maria Jose Valanarasu, Vishal M. Patel 0001. 2020-2030 [doi]

Learning to Prompt CLIP for Monocular Depth Estimation: Exploring the Limits of Human LanguageDylan Auty, Krystian Mikolajczyk. 2031-2049 [doi]

CLIP-FO3D: Learning Free Open-world 3D Scene Representations from 2D Dense CLIPJunbo Zhang, Runpei Dong, Kaisheng Ma. 2040-2051 [doi]

The Change You Want to See (Now in 3D)Ragav Sachdeva, Andrew Zisserman. 2052-2061 [doi]

Dynamic Texts From UAV Perspective Natural ImagesHidetomo Sakaino. 2062-2073 [doi]

SpyroPose: SE(3) Pyramids for Object Pose Distribution EstimationRasmus Laurvig Haugaard, Frederik Hagelskjær, Thorbjørn Mosekjær Iversen. 2074-2083 [doi]

Diff3DHPE: A Diffusion Model for 3D Human Pose EstimationJieming Zhou, Tong Zhang, Zeeshan Hayder, Lars Petersson, Mehrtash Harandi. 2084-2094 [doi]

Revisiting Fully Convolutional Geometric Features for Object 6D Pose EstimationJaime Corsetti, Davide Boscaini, Fabio Poiesi. 2095-2104 [doi]

Accidental Turntables: Learning 3D Pose by Watching Objects TurnZezhou Cheng, Matheus Gadelha, Subhransu Maji. 2105-2114 [doi]

NeRF-Pose: A First-Reconstruct-Then-Regress Approach for Weakly-supervised 6D Object Pose EstimationFu Li, Shishir Reddy Vutukur, Hao Yu 0010, Ivan Shugurov, Benjamin Busam, Shaowu Yang, Slobodan Ilic. 2115-2125 [doi]

CNOS: A Strong Baseline for CAD-based Novel Object SegmentationVan Nguyen Nguyen, Thibault Groueix, Georgy Ponimatkin, Vincent Lepetit, Tomas Hodan. 2126-2132 [doi]

Reconstruction of 3D Interaction Models from Images using Shape PriorMehrshad Mirmohammadi, Parham Saremi, Yen-ling Kuo, Xi Wang. 2133-2139 [doi]

PoseMatcher: One-shot 6D Object Pose Estimation by Deep Feature MatchingPedro Castro, Tae-Kyun Kim. 2140-2149 [doi]

SegDA: Maximum Separable Segment Mask with Pseudo Labels for Domain Adaptive Semantic SegmentationAnant Khandelwal. 2150-2160 [doi]

Cross-Dimensional Refined Learning for Real-Time 3D Visual Perception from Monocular VideoZiyang Hong, C. Patrick Yue. 2161-2170 [doi]

A Lightweight Skeleton-Based 3D-CNN for Real-Time Fall Detection and Action RecognitionNadhira Noor, In Kyu Park. 2171-2180 [doi]

A Dual Perspective of Human Motion Analysis - 3D Pose Estimation and 2D Trajectory PredictionMayssa Zaier, Hazem Wannous, Hassen Drira, Jacques Boonaert. 2181-2191 [doi]

THÖR-Magni: Comparative Analysis of Deep Learning Models for Role-conditioned Human Mtion PredictionTiago Rodrigues de Almeida 0001, Andrey Rudenko, Tim Schreiter, Yufei Zhu, Eduardo Gutiérrez-Maestro, Lucas Morillo-Méndez, Tomasz Piotr Kucner, Óscar Martínez Mozos, Martin Magnusson 0002, Luigi Palmieri, Kai O. Arras, Achim J. Lilienthal. 2192-2201 [doi]

SynDrone - Multi-modal UAV Dataset for Urban ScenariosGiulia Rizzoli, Francesco Barbato, Matteo Caligiuri, Pietro Zanuttigh. 2202-2212 [doi]

Do Planar Constraints Improve Camera Pose Estimation in Monocular SLAM?Charlotte Arndt, Reza Sabzevari, Javier Civera 0001. 2213-2222 [doi]

LightNet: Generative Model for Enhancement of Low-Light ImagesChaitra Desai, Nikhil Akalwadi, Amogh Joshi, Sampada Malagi, Chinmayee Mandi, Ramesh Ashok Tabib, Ujwala Patil, Uma Mudenagudi. 2223-2232 [doi]

Domain Adversarial Learning Towards Underwater Image EnhancementMeghna Kapoor, Rohan Baghel, Badri Narayan Subudhi, Vinit Jakhetiya, Ankur Bansal. 2233-2243 [doi]

Embedded Deformation-based Compression for Human 3D Dynamic Meshes with Changing TopologyHuong Hoang, Kunyao Chen, Truong Nguyen, Pamela Cosman. 2244-2254 [doi]

Window-based Model Averaging Improves Generalization in Heterogeneous Federated LearningDebora Caldarola, Barbara Caputo, Marco Ciccone. 2255-2263 [doi]

TP-NoDe: Topology-aware Progressive Noising and Denoising of Point Clouds towards UpsamplingAkash Kumbar, Tejas Anvekar, Tulasi Amitha Vikrama, Ramesh Ashok Tabib, Uma Mudenagudi. 2264-2274 [doi]

Mirror U-Net: Marrying Multimodal Fission with Multi-task Learning for Semantic Segmentation in Medical ImagingZdravko Marinov, Simon Reiß, David Kersting, Jens Kleesiek, Rainer Stiefelhagen. 2275-2285 [doi]

SEPAL: Spatial Gene Expression Prediction from Local GraphsGabriel Mejía, Paula Cárdenas, Daniela Ruiz, Angela Castillo, Pablo Arbeláez. 2286-2295 [doi]

Transformers Pay Attention to Convolutions Leveraging Emerging Properties of ViTs by Dual Attention-Image NetworkYousef Yeganeh, Azade Farshad, Peter Weinberger, Seyed-Ahmad Ahmadi, Ehsan Adeli 0001, Nassir Navab. 2296-2307 [doi]

RRc-UNet 3D for lung tumor segmentation from CT scans of Non-Small Cell Lung Cancer patientsVan Linh Le, Olivier Saut. 2308-2317 [doi]

Topo-CXR: Chest X-ray TB and Pneumonia Screening with Topological Machine LearningFaisal Ahmed, Brighton Nuwagira, Furkan Torlak, Baris Coskunuzer. 2318-2328 [doi]

Contrastive Image Synthesis and Self-supervised Feature Adaptation for Cross-Modality Biomedical Image SegmentationXinrong Hu, Corey Wang, Yiyu Shi 0001. 2329-2338 [doi]

Cross-grained Contrastive Representation for Unsupervised Lesion Segmentation in Medical ImagesZiqi Yu, Botao Zhao 0001, Yipin Zhang, Shengjie Zhang, Xiang Chen, Haibo Yang 0002, Tingying Peng, Xiao-yong Zhang. 2339-2346 [doi]

Semi-supervised Quality Evaluation of Colonoscopy ProceduresIdan Kligvasser, George Leifman, Roman Goldenberg, Ehud Rivlin, Michael Elad. 2347-2355 [doi]

Ensuring a connected structure for Retinal Vessels Deep-Learning SegmentationIdriss Dulau, Catherine Helmer, Cécile Delcourt, Marie Beurton-Aimar. 2356-2365 [doi]

CLIPath: Fine-tune CLIP with Visual Feature Fusion for Pathology Image Analysis Towards Minimizing Data Collection EffortsZhengfeng Lai, Zhuoheng Li, Luca Cerny Oliveira, Joohi Chauhan, Brittany N. Dugger, Chen-Nee Chuah. 2366-2372 [doi]

Implicit Neural Representation in Medical Imaging: A Comparative SurveyAmirali Molaei, Amirhossein Aminimehr, Armin Tavakoli, Amirhossein Kazerouni, Bobby Azad, Reza Azad, Dorit Merhof. 2373-2383 [doi]

HyperCoil-Recon: A Hypernetwork-based Adaptive Coil Configuration Task Switching Network for MRI ReconstructionSriprabha Ramanarayanan, Mohammad Al Fahim, Rahul G. S., Amrit Kumar Jethi, Keerthi Ram, Mohanasankar Sivaprakasam. 2384-2393 [doi]

Self-Supervised Anomaly Detection from Anomalous Training Data via Iterative Latent Token MaskingAshay Patel, Petru-Daniel Tudosiu, Walter H. L. Pinaya, Mark S. Graham, Olusola Adeleke, Gary J. Cook, Vicky Goh, Sébastien Ourselin, M. Jorge Cardoso. 2394-2402 [doi]

Robust AMD Stage Grading with Exclusively OCTA Modality Leveraging 3D VolumeHaochen Zhang, Anna Heinke, Carlo Miguel B. Galang, Daniel N. Deussen, Bo Wen, Dirk-Uwe G. Bartsch, William R. Freeman, Truong Q. Nguyen, Cheolhong An. 2403-2412 [doi]

Segmentation-based Assessment of Tumor-Vessel Involvement for Surgical Resectability Prediction of Pancreatic Ductal AdenocarcinomaChristiaan G. A. Viviers, Mark Ramaekers, M. M. Amaan Valiuddin, Terese Hellström, Nick Tasios, John van der Ven, Igor Jacobs, Lotte Ewals, Joost Nederend, Peter H. N. de With, Misha Luyer, Fons van der Sommen. 2413-2423 [doi]

Sharing is Caring: Concurrent Interactive Segmentation and Model Training using a Joint ModelIvan Mikhailov, Benoit Chauveau, Nicolas Bourdel, Adrien Bartoli. 2424-2433 [doi]

Robust MSFM Learning Network for Classification and Weakly Supervised LocalizationKomal Kumar, Balakrishna Pailla, Kalyan Tadepalli, Sudipta Roy 0002. 2434-2443 [doi]

DISGAN: Wavelet-informed Discriminator Guides GAN to MRI Super-resolution with Noise CleaningQi Wang, Lucas Mahler, Julius Steiglechner, Florian Birk, Klaus Scheffler, Gabriele Lohmann. 2444-2453 [doi]

Studying the Impact of Augmentations on Medical Confidence CalibrationAdrit Rao, Joon-Young Lee, Oliver Aalami. 2454-2464 [doi]

Multimodal Contrastive Learning and Tabular Attention for Automated Alzheimer's Disease PredictionWeichen Huang. 2465-2474 [doi]

Weakly Semi-supervised Detector-based Video Classification with Temporal Context for Lung UltrasoundGary Y. Li, Li Chen, Mohsen Zahiri, Naveen Balaraju, Shubham Patil, Courosh Mehanian, Cynthia Gregory, Kenton W. Gregory, Balasundar Raju, Jochen Kruecker, Alvin Chen. 2475-2484 [doi]

Order-ViT: Order Learning Vision Transformer for Cancer Classification in Pathology ImagesJu Cheon Lee, Jin Tae Kwak. 2485-2494 [doi]

Mind the Clot: Automated LVO Detection on CTA using Deep LearningShubham Kumar, Arjun Agarwal, Satish Golla, Swetha Tanamala, Ujjwal Upadhyay, Subhankar Chattoraj, Preetham Putha, Sasank Chilamkurthy. 2495-2504 [doi]

A Comparative Study of Vision Transformer Encoders and Few-shot Learning for Medical Image ClassificationMaxat Nurgazin, Nguyen Anh Tu. 2505-2513 [doi]

RheumaVIT: transformer-based model for Automated Scoring of Hand Joints in Rheumatoid ArthritisAlexander Stolpovsky, Elizaveta Dakhova, Polina Druzhinina, Polina Postnikova, Daniil Kudinsky, Alexander Smirnov, Anastasia Sukhinina, Alexander Lila, Anvar Kurmukov. 2514 [doi]

AW-Net: A Novel Fully Connected Attention-based Medical Image Segmentation ModelDebojyoti Pal, Tanushree Meena, Dwarikanath Mahapatra, Sudipta Roy 0002. 2524-2533 [doi]

Geodesic Regression Characterizes 3D Shape Changes in the Female Brain During MenstruationAdele Myers, Caitlin M. Taylor, Emily G. Jacobs, Nina Miolane. 2534-2543 [doi]

Computational Evaluation of the Combination of Semi-Supervised and Active Learning for Histopathology Image Segmentation with Missing AnnotationsLaura Gálvez Jiménez, Lucile Dierckx, Maxime Amodei, Hamed Razavi Khosroshahi, Natarajan Chidambaran, Anh Thu Phan Ho, Alberto Franzin. 2544-2555 [doi]

Towards Robust Natural-Looking Mammography Lesion Synthesis on Ipsilateral Dual-Views Breast Cancer AnalysisThanh Huy Nguyen, Quang-Hien Kha, Thai Ngoc Toan Truong, Ba Thinh Lam, Ba-Hung Ngo, Quang Vinh Dinh, Nguyen-Quoc-Khanh Le. 2556-2565 [doi]

End-to-End Deep Learning for Reconstructing Segmented 3D CT Image from Multi-Energy X-ray ProjectionsSiqi Wang, Tatsuya Yatagawa, Yutaka Ohtake, Toru Aoki, Jun Hotta. 2566-2574 [doi]

Combating Coronary Calcium Scoring Bias for Non-gated CT by Semantic Learning on Gated CTJiajian Li, Anwei Li, Jiansheng Fang, Yonghe Hou, Chao Song, Huifang Yang, Jingwen Wang, Hongbo Liu 0007, Jiang Liu 0001. 2575-2583 [doi]

Comprehensive Multimodal Segmentation in Medical Imaging: Combining YOLOv8 with SAM and HQ-SAM ModelsSumit Pandey, Kuan-Fu Chen, Erik B. Dam. 2584-2590 [doi]

Semantic Parsing of Colonoscopy Videos with Multi-Label Temporal NetworksOri Kelner, Or Weinstein, Ehud Rivlin, Roman Goldenberg. 2591-2598 [doi]

Towards Fixing Clever-Hans Predictors with Counterfactual Knowledge DistillationSidney Bender, Christopher J. Anders, Pattarawat Chormai, Heike Marxfeld, Jan Herrmann, Grégoire Montavon. 2599-2607 [doi]

Causality-Driven One-Shot Learning for Prostate Cancer Grading from MRIGianluca Carloni, Eva Pachetti, Sara Colantonio. 2608-2616 [doi]

ShaRPy: Shape Reconstruction and Hand Pose Estimation from RGB-D with UncertaintyVanessa Wirth 0001, Anna-Maria Liphardt, Birte Coppers, Johanna Bräunig, Simon Heinrich, Sigrid Leyendecker, Arnd Kleyer, Georg Schett, Martin Vossiek, Bernhard Egger, Marc Stamminger. 2617-2625 [doi]

An Empirical Analysis for Zero-Shot Multi-Label Classification on COVID-19 CT Scans and Uncurated ReportsEthan Dack, Lorenzo Brigato, Matthew McMurray, Matthias Fontanellaz, Thomas Frauenfelder, Hanno Hoppe, Aristomenis Exadaktylos, Thomas Geiser, Manuela Funke-Chambour, Andreas Christe, Lukas Ebner, Stavroula G. Mougiakakou. 2626-2635 [doi]

Fusion Approaches to Predict Post-stroke Aphasia Severity from Multimodal Neuroimaging DataSaurav Chennuri, Sha Lai, Anne Billot, Maria Varkanitsa, Emily J. Braun, Swathi Kiran, Archana Venkataraman, Janusz Konrad, Prakash Ishwar, Margrit Betke. 2636-2645 [doi]

Self-supervised Semantic Segmentation: Consistency over TransformationSanaz Karimijafarbigloo, Reza Azad, Amirhossein Kazerouni, Yury Velichko, Ulas Bagci, Dorit Merhof. 2646-2655 [doi]

ALFA - Leveraging All Levels of Feature Abstraction for Enhancing the Generalization of Histopathology Image Classification Across Unseen HospitalsMilad Sikaroudi, Seyedeh Maryam Hosseini, Shahryar Rahnamayan, Hamid R. Tizhoosh. 2656-2665 [doi]

Pathology-Based Ischemic Stroke Etiology Classification via Clot Composition Guided Multiple Instance LearningMara Pleasure, Ekaterina Redekop, Jennifer S. Polson, Haoyue Zhang, Naoki Kaneko, William Speier, Corey W. Arnold. 2666-2675 [doi]

Enhancing Medical Image Segmentation: Optimizing Cross-Entropy Weights and Post-Processing with AutoencodersPranav Singh, Luoyao Chen, Mei Chen, Jinqian Pan, Raviteja Chukkapalli, Shravan Chaudhari, Jacopo Cirrone. 2676-2685 [doi]

Using Large Text To Image Models with Structured Prompts for Skin Disease Identification: A Case StudySajith Rajapaksa, Jean Marie Uwabeza Vianney, Renell Castro, Farzad Khalvati, Shubhra Aich. 2686-2693 [doi]

CheXFusion: Effective Fusion of Multi-View Features using Transformers for Long-Tailed Chest X-Ray ClassificationDongkyun Kim. 2694-2702 [doi]

Robust Asymmetric Loss for Multi-Label Long-Tailed LearningWongi Park, Inhyuk Park, Sungeun Kim, Jongbin Ryu. 2703-2712 [doi]

Effect of Stage Training for Long-Tailed Multi-Label Image ClassificationYosuke Yamagishi, Shohei Hanaoka. 2713-2720 [doi]

Advanced Augmentation and Ensemble Approaches for Classifying Long-Tailed Multi-Label Chest X-RaysTrong-Hieu Nguyen Mau, Tuan-Luc Huynh, Thanh Danh Le, Hai Dang Nguyen, Minh-Triet Tran. 2721-2730 [doi]

An Optimized Ensemble Framework for Multi-Label Classification on Long-Tailed Chest X-ray DataJaehyup Jeong, Bosoung Jeoun, Yeonju Park, Bohyung Han. 2731-2738 [doi]

Enhancing Multi-Label Long-Tailed Classification on Chest X-Rays through ML-GCN AugmentationHyeryeong Seo, Minhyuk Lee, Woojin Cheong, Hyekyung Yoon, Sohyung Kim, Myungjoo Kang. 2739-2748 [doi]

Chest X-Ray Feature Pyramid Sum Model with Diseased Area Data Augmentation MethodChanghyun Kim, Giyeol Kim, Sooyoung Yang, Hyunsu Kim, Sangyool Lee, Hansu Cho. 2749-2758 [doi]

Sparse Linear Concept Discovery ModelsKonstantinos P. Panousis, Dino Ienco, Diego Marcos. 2759-2763 [doi]

ProVLA: Compositional Image Search with Progressive Vision-Language Alignment and Multimodal FusionZhizhang Hu, Xinliang Zhu, Son Tran, René Vidal, Arnab Dhua. 2764-2769 [doi]

Vision-Language Models Performing Zero-Shot Tasks Exhibit Disparities Between Gender GroupsMelissa Hall, Laura Gustafson, Aaron Adcock, Ishan Misra, Candace Ross. 2770-2777 [doi]

BiLMa: Bidirectional Local-Matching for Text-based Person Re-identificationTakuro Fujii, Shuhei Tarashima. 2778-2782 [doi]

Alignment and Generation Adapter for Efficient Video-text UnderstandingHan Fang, Zhifei Yang, Yuhan Wei, Xianghao Zang, Chao Ban, Zerun Feng, Zhongjiang He, Yongxiang Li, Hao Sun. 2783-2789 [doi]

LLaViLo: Boosting Video Moment Retrieval via Adapter-Based Multimodal ModelingKaijing Ma, Xianghao Zang, Zerun Feng, Han Fang, Chao Ban, Yuhan Wei, Zhongjiang He, Yongxiang Li, Hao Sun. 2790-2795 [doi]

Zero-Shot and Few-Shot Video Question Answering with Multi-Modal PromptsDeniz Engin, Yannis Avrithis. 2797-2802 [doi]

ECO: Ensembling Context Optimization for Vision-Language ModelsLorenzo Agnolucci, Alberto Baldrati, Francesco Todino, Federico Becattini, Marco Bertini 0001, Alberto Del Bimbo. 2803-2807 [doi]

A Cross-Dataset Study on the Brazilian Sign Language TranslationAmanda Hellen de Avellar Sarmento, Moacir Antonelli Ponti. 2808-2812 [doi]

Context-VQA: Towards Context-Aware and Purposeful Visual Question AnsweringNandita Naik, Christopher Potts, Elisa Kreiss. 2813-2817 [doi]

Explaining Vision and Language through Graphs of Events in Space and TimeMihai Masala, Nicolae Cudlenco, Traian Rebedea, Marius Leordeanu. 2818-2823 [doi]

Mapping Memes to Words for Multimodal Hateful Meme ClassificationGiovanni Burbi, Alberto Baldrati, Lorenzo Agnolucci, Marco Bertini 0001, Alberto Del Bimbo. 2824-2828 [doi]

Cross-Modal Dense Passage Retrieval for Outside Knowledge Visual Question AnsweringBenjamin Z. Reichman, Larry Heck. 2829-2834 [doi]

PatFig: Generating Short and Long Captions for Patent FiguresDana Aubakirova, Kim Gerdes, Lufei Liu. 2835-2841 [doi]

An empirical study of the effect of video encoders on Temporal Video GroundingIgnacio M. De La Jara, Cristian Rodriguez Opazo, Edison Marrese-Taylor, Felipe Bravo-Marquez. 2842-2847 [doi]

Towards Vision-Language Mechanistic Interpretability: A Causal Tracing Tool for BLIPVedant Palit, Rohan Pandey, Aryaman Arora, Paul Pu Liang. 2848-2853 [doi]

Multimodal Neurons in Pretrained Text-Only TransformersSarah Schwettmann, Neil Chowdhury, Samuel Klein, David Bau, Antonio Torralba 0001. 2854-2859 [doi]

Looking at words and points with attention: a benchmark for text-to-shape coherenceAndrea Amaduzzi, Giuseppe Lisanti, Samuele Salti, Luigi di Stefano. 2860-2869 [doi]

BluNF: Blueprint Neural FieldRobin Courant, Xi Wang, Marc Christie, Vicky Kalogeiton. 2870-2879 [doi]

NeRF-GAN Distillation for Efficient 3D-Aware Generation with ConvolutionsMohamad Shahbazi, Evangelos Ntavelis, Alessio Tonioni, Edo Collins, Danda Pani Paudel, Martin Danelljan, Luc Van Gool. 2880-2890 [doi]

LatentSwap3D: Semantic Edits on 3D Image GANsEnis Simsar, Alessio Tonioni, Evin Pinar Örnek, Federico Tombari. 2891-2901 [doi]

BuilDiff: 3D Building Shape Generation using Single-Image Conditional Point Cloud Diffusion ModelsYao Wei, George Vosselman, Michael Ying Yang. 2902-2911 [doi]

Set-the-Scene: Global-Local Training for Generating Controllable NeRF ScenesDana Cohen-Bar, Elad Richardson, Gal Metzer, Raja Giryes, Daniel Cohen-Or. 2912-2921 [doi]

SPARF: Large-Scale Learning of 3D Sparse Radiance Fields from Few Input ImagesAbdullah Hamdi, Bernard Ghanem, Matthias Nießner. 2922-2932 [doi]

Blended-NeRF: Zero-Shot Object Generation and Blending in Existing Neural Radiance FieldsOri Gordon, Omri Avrahami, Dani Lischinski. 2933-2943 [doi]

S2RF: Semantically Stylized Radiance FieldsMoneish Kumar, Neeraj Panse, Dishani Lahiri. 2944-2949 [doi]

Is there progress in activity progress prediction?Frans de Boer, Jan C. van Gemert, Jouke Dijkstra, Silvia L. Pintea. 2950-2958 [doi]

Are current long-term video understanding datasets long-term?Ombretta Strafforello, Klamer Schutte, Jan C. van Gemert. 2959-2968 [doi]

VAST: Vivify Your Talking Avatar via Zero-Shot Expressive Facial Style TransferLiyang Chen, Zhiyong Wu 0001, Runnan Li, Weihong Bao, Jun Ling, Xu Tan 0003, Sheng Zhao. 2969-2979 [doi]

PAT: Position-Aware Transformer for Dense Multi-Label Action DetectionFaegheh Sardari, Armin Mustafa, Philip J. B. Jackson, Adrian Hilton 0001. 2980-2989 [doi]

Expressive Talking Head Video Encoding in StyleGAN2 Latent SpaceTrevine Oorloff, Yaser Yacoob. 2990-2999 [doi]

Benchmarking Data Efficiency and Computational Efficiency of Temporal Action Localization ModelsJan Warchocki, Teodor Oprescu, Yunhan Wang, Alexandru Damacus, Paul Misterka, Robert-Jan Bruintjes, Attila Lengyel 0001, Ombretta Strafforello, Jan van Gemert. 3000-3008 [doi]

InFusion: Inject and Attention Fusion for Multi Concept Zero-Shot Text-based Video EditingAnant Khandelwal. 3009-3018 [doi]

LEMMS: Label Estimation of Multi-feature Movie SegmentsBartolomeo Vacchetti, Dawit Mureja Argaw, Tania Cequtelli. 3019-3027 [doi]

Pointing Gesture Recognition via Self-supervised Regularization for ASD ScreeningCheol-Hwan Yoo, Jang-Hee Yoo, Ho-Won Kim 0002, ByungOk Han. 3028-3035 [doi]

External Commonsense Knowledge as a Modality for Social Intelligence Question-AnsweringSanika Natu, Shounak Sural, Sulagna Sarkar. 3036-3042 [doi]

D-ViSA: A Dataset for Detecting Visual Sentiment from Art ImagesSeoyun Kim, ChaeHee An, Junyeop Cha, Dongjae Kim, Eunil Park. 3043-3051 [doi]

Few Labels are Enough! Semi-supervised Graph Learning for Social InteractionNicola Corbellini, Jhony H. Giraldo, Giovanna Varni, Gualtiero Volpe. 3052-3060 [doi]

Interaction acceptance modelling and estimation for a proactive engagement in the context of human-robot interactionsTimothée Dhaussy, Bassam Jabaian, Fabrice Lefèvre. 3061-3066 [doi]

Multi-Modal Correlated Network with Emotional Reasoning Knowledge for Social Intelligence Question-AnsweringBaijun Xie, Chung Hyuk Park. 3067-3073 [doi]

Just Ask Plus: Using Transcripts for VideoQAMohammad Javad Pirhadi, Motahhare Mirzaei, Sauleh Eetemadi. 3074-3077 [doi]

GANDiffFace: Controllable Generation of Synthetic Datasets for Face Recognition with Realistic VariationsPietro Melzi, Christian Rathgeb, Ruben Tolosana, Rubén Vera-Rodríguez, Dominik Lawatsch, Florian Domin, Maxim Schaubert. 3078-3087 [doi]

PoseBias: On Dataset Bias and Task Difficulty - Is there an Optimal Camera Position for Facial Image Analysis?Mohit Choithwani, Sneha Almeida, Bernhard Egger. 3088-3096 [doi]

Kinship Representation Learning with Face Componential RelationWen-Tai Su, Min-Hung Chen, Chien-Yi Wang, Shang-Hong Lai, Trista Pei-chun Chen. 3097-3106 [doi]

Disjoint Pose and Shape for 3D Face ReconstructionRaja Kumar, Jiahao Luo, Alex Pang, James Davis 0001. 3107-3117 [doi]

M2C: Concise Music Representation for 3D Dance GenerationMatthew Marchellus, In Kyu Park. 3118-3127 [doi]

Denoising Diffusion for 3D Hand Pose Estimation from ImagesMaksym Ivashechkin, Oscar Mendez, Richard Bowden. 3128-3137 [doi]

POSTER: A Pyramid Cross-Fusion Transformer Network for Facial Expression RecognitionCe Zheng, Matías Mendieta, Chen Chen 0001. 3138-3147 [doi]

Dynamic Multiview Refinement of 3D Hand Datasets using Differentiable Ray TracingGiorgos Karvounas, Nikolaos Kyriazis, Iason Oikonomidis, Antonis A. Argyros. 3148-3158 [doi]

Controllable Inversion of Black-Box Face Recognition Models via DiffusionManuel Kansy, Anton Raël, Graziana Mignone, Jacek Naruniec, Christopher Schroers, Markus H. Gross, Romann M. Weber. 3159-3169 [doi]

A Unified Approach for Occlusion Tolerant 3D Facial Pose Capture and Gaze Estimation using MocapNETsAmmar Qammaz, Antonis A. Argyros. 3170-3180 [doi]

A Gated Attention Transformer for Multi-Person Pose TrackingAndreas Doering, Juergen Gall. 3181-3190 [doi]

Occluded Gait Recognition via Silhouette Registration Guided by Automated Occlusion Degree EstimationChi Xu 0003, Shogo Tsuji, Yasushi Makihara, Xiang Li, Yasushi Yagi. 3191-3201 [doi]

Unraveling a Decade: A Comprehensive Survey on Isolated Sign Language RecognitionNoha A. Sarhan, Simone Frintrop. 3202-3211 [doi]

DiffHPE: Robust, Coherent 3D Human Pose Lifting with DiffusionCédric Rommel, Eduardo Valle, Mickaël Chen, Souhaiel Khalfaoui, Renaud Marlet, Matthieu Cord, Patrick Pérez. 3212-3221 [doi]

STRIDE: Street View-based Environmental Feature Detection and Pedestrian Collision PredictionCristina González, Nicolás Ayobi, Felipe Escallón, Laura Baldovino-Chiquillo, Maria Wilches-Mogollón, Donny Pasos, Nicole Ramírez, José Pinzón, Olga L. Sarmiento, D. Alex Quistberg, Pablo Arbeláez. 3222-3234 [doi]

Surround-View Vision-based 3D Detection for Autonomous Driving: A SurveyApoorv Singh. 3235-3244 [doi]

Tracing the Influence of Predecessors on Trajectory PredictionMengmeng Liu, Hao Cheng 0008, Michael Ying Yang. 3245-3255 [doi]

Traffic Mirror Detection and Annotation Methods from Street Images of Open Data for Preventing Accidents at Intersections by AlertDa Li, Hikaru Hagura, Taichi Miyabashira, Yukiko Kawai, Shintaro Ono. 3256-3262 [doi]

Efficient, Self-Supervised Human Pose Estimation with Inductive Prior TuningNobline Yoo, Olga Russakovsky. 3263-3272 [doi]

Temporal DINO: A Self-supervised Video Strategy to Enhance Action PredictionIzzeddin Teeti, Rongali Sai Bhargav, Vivek Singh, Andrew Bradley, Biplab Banerjee, Fabio Cuzzolin. 3273-3283 [doi]

Progressive Feature Adjustment for Semi-supervised Learning from Pretrained ModelsHai-ming Xu, Lingqiao Liu, Hao Chen, Ehsan Abbasnejad, Rafael Felix. 3284-3294 [doi]

OpenIncrement: A Unified Framework for Open Set Recognition and Deep Class-Incremental LearningJiawen Xu, Claas Grohnfeldt, Odej Kao. 3295-3303 [doi]

Transformer-Based Sensor Fusion for Autonomous Driving: A SurveyApoorv Singh. 3304-3309 [doi]

Trajectory-Prediction with Vision: A SurveyApoorv Singh. 3310-3315 [doi]

Memory-augmented Variational Adaptation for Online Few-shot SegmentationJie Liu, Yingjun Du, Zehao Xiao, Cees G. M. Snoek, Jan-Jakob Sonke, Efstratios Gavves. 3316-3325 [doi]

Instant Continual Learning of Neural Radiance FieldsRyan Po, Zhengyang Dong, Alexander W. Bergman, Gordon Wetzstein. 3326-3336 [doi]

ScrollNet: Dynamic Weight Importance for Continual LearningFei Yang 0004, Kai Wang 0060, Joost van de Weijer 0001. 3337-3347 [doi]

Identification of Novel Classes for Improving Few-Shot Object DetectionZeyu Shangguan, Mohammad Rostami. 3348-3358 [doi]

SAM-Adapter: Adapting Segment Anything in Underperformed ScenesTianrun Chen, Lanyun Zhu, Chaotao Ding, Runlong Cao, Yan Wang, Shangzhan Zhang, Zejian Li, Lingyun Sun, Ying Zang, Papa Mao. 3359-3367 [doi]

Experience Replay as an Effective Strategy for Optimizing Decentralized Federated LearningMatteo Pennisi, Federica Proietto Salanitri, Giovanni Bellitto, Concetto Spampinato, Simone Palazzo, Bruno Casella, Marco Aldinucci. 3368-3375 [doi]

Clustering-based Domain-Incremental LearningChristiaan Lamers, René Vidal, Nabil Belbachir, Niki van Stein, Thomas Bäck, Paris Giampouras. 3376-3384 [doi]

Multimodal Parameter-Efficient Few-Shot Class Incremental LearningMarco D'Alessandro, Alberto Alonso, Enrique Calabrés, Mikel Galar. 3385-3395 [doi]

Multi-Task Hypergraphs for Semi-supervised Learning using Earth ObservationsMihai Cristian Pîrvu, Alina Marcu, Alexandra Dobrescu, Nabil Belbachir, Marius Leordeanu. 3396-3406 [doi]

Multi-Task Consistency for Active LearningAral Hekimoglu, Philipp Friedrich, Walter Zimmer, Michael Schmidt 0015, Alvaro Marcos-Ramiro, Alois Knoll. 3407-3416 [doi]

Class-Incremental Learning using Diffusion Model for Distillation and ReplayQuentin Jodelet, Xin Liu, Yin Jun Phua, Tsuyoshi Murata. 3417-3425 [doi]

Flashback for Continual LearningLeila Mahmoodi, Mehrtash Harandi, Peyman Moghadam. 3426-3435 [doi]

Continual Evidential Deep Learning for Out-of-Distribution DetectionEduardo Aguilar 0001, Bogdan Raducanu, Petia Radeva, Joost van de Weijer 0001. 3436-3446 [doi]

Continual Learning with Deep Streaming Regularized Discriminant AnalysisJoe Khawand, Peter Hanappe, David Colliaux. 3447-3454 [doi]

FedRCIL: Federated Knowledge Distillation for Representation based Contrastive Incremental LearningAthanasios Psaltis, Christos Chatzikonstantinou, Charalampos Z. Patrikakis, Petros Daras. 3455-3464 [doi]

SATHUR: Self Augmenting Task Hallucinal Unified Representation for Generalized Class Incremental LearningSathursan Kanagarajah, Thanuja Ambegoda, Ranga Rodrigo. 3465-3472 [doi]

Memory Population in Continual Learning via Outlier EliminationJulio Hurtado, Alain Raymond-Saez, Vladimir Araujo, Vincenzo Lomonaco, Alvaro Soto, Davide Bacciu. 3473-3482 [doi]

AR-TTA: A Simple Method for Real-World Continual Test-Time AdaptationDamian Sójka, Sebastian Cygert, Bartlomiej Twardowski, Tomasz Trzcinski. 3483-3487 [doi]

Looking through the past: better knowledge retention for generative replay in continual learningValeriya Khan, Sebastian Cygert, Bartlomiej Twardowski, Tomasz Trzcinski. 3488-3492 [doi]

Decision Boundary Optimization for Few-shot Class-Incremental LearningChenxu Guo, Qi Zhao, Shuchang Lyu, Binghao Liu, Chunlei Wang, Lijiang Chen, Guangliang Cheng. 3493-3503 [doi]

Adapt Your Teacher: Improving Knowledge Distillation for Exemplar-free Continual LearningFilip Szatkowski, Mateusz Pyla, Marcin Przewiezlikowski, Sebastian Cygert, Bartlomiej Twardowski, Tomasz Trzcinski. 3504-3509 [doi]

A Comprehensive Empirical Evaluation on Online Continual LearningAlbin Soutif-Cormerais, Antonio Carta, Andrea Cossu, Julio Hurtado, Vincenzo Lomonaco, Joost van de Weijer 0001, Hamed Hemati. 3510-3520 [doi]

TKIL: Tangent Kernel Optimization for Class Balanced Incremental LearningJinlin Xiang, Eli Shlizerman. 3521-3531 [doi]

Improving Replay Sample Selection and Storage for Less Forgetting in Continual LearningDaniel Brignac, Niels Lobo, Abhijit Mahalanobis. 3532-3541 [doi]

Selective Freezing for Efficient Continual LearningAmelia Sorrenti, Giovanni Bellitto, Federica Proietto Salanitri, Matteo Pennisi, Concetto Spampinato, Simone Palazzo. 3542-3551 [doi]

Confusion Mixup Regularized Multimodal Fusion Network for Continual Egocentric Activity RecognitionHanxin Wang, Shuchang Zhou 0002, Qingbo Wu 0001, Hongliang Li 0001, Fanman Meng, Linfeng Xu 0001, Heqian Qiu. 3552-3561 [doi]

Margin Contrastive Learning with Learnable-Vector for Continual LearningKotaro Nagata, Kazuhiro Hotta. 3562-3568 [doi]

A Simple Signal for Domain ShiftGoirik Chakrabarty, Manogna Sreenivas, Soma Biswas. 3569-3576 [doi]

On the Effectiveness of LayerNorm Tuning for Continual Learning in Vision TransformersThomas De Min, Massimiliano Mancini, Karteek Alahari, Xavier Alameda-Pineda, Elisa Ricci 0001. 3577-3586 [doi]

Comparative Study of Natural Replay and Experience Replay in Online Object DetectionBaptiste Wagner, Denis Pellerin, Sylvain Huet. 3587-3595 [doi]

Unseen And Adverse Outdoor Scenes Recognition Through Event-based CaptionsHidetomo Sakaino. 3596-3603 [doi]

Adversarial Examples with Specular HighlightsVanshika Vats, Koteswar Rao Jerripothula. 3604-3613 [doi]

IPCert: Provably Robust Intellectual Property Protection for Machine LearningZhengyuan Jiang, Minghong Fang, Neil Zhenqiang Gong. 3614-3623 [doi]

Fair Robust Active Learning by Joint InconsistencyTsung-Han Wu, Hung-Ting Su, Shang-Tse Chen, Winston H. Hsu. 3624-3633 [doi]

Classification robustness to common optical aberrationsPatrick Müller, Alexander Braun, Margret Keuper. 3634-3645 [doi]

Defense-Prefix for Preventing Typographic Attacks on CLIPHiroki Azuma, Yusuke Matsui. 3646-3655 [doi]

Semantically Enhanced Scene Captions with Physical and Weather Condition ChangesHidetomo Sakaino. 3656-3668 [doi]

PRAT: PRofiling Adversarial aTtacksRahul Ambati, Naveed Akhtar, Ajmal Mian, Yogesh S. Rawat. 3669-3678 [doi]

On the Adversarial Robustness of Multi-Modal Foundation ModelsChristian Schlarmann, Matthias Hein 0001. 3679-3687 [doi]

Black-Box Attacks on Image Activity Prediction and its Natural Language ExplanationsAlina Elena Baia, Valentina Poggioni, Andrea Cavallaro. 3688-3697 [doi]

OMG-Attack: Self-Supervised On-Manifold Generation of Transferable Evasion AttacksOfir Bar Tal, Adi Haviv, Amit H. Bermano. 3698-3708 [doi]

On the unreasonable vulnerability of transformers for image restoration - and an easy fixShashank Agnihotri, Kanchana Vaishnavi Gandikota, Julia Grabinski, Paramanand Chandramouli, Margret Keuper. 3709-3719 [doi]

Targeted Adversarial Attacks on Generalizable Neural Radiance FieldsAndrás Horváth, Csaba Mate Józsa. 3720-3729 [doi]

Guarding the Guardians: Automated Analysis of Online Child Sexual AbuseJuanita Puentes, Angela Castillo, Wilmar Osejo, Yuly Calderón, Viviana Quintero, Lina Saldarriaga, Diana Agudelo, Pablo Arbeláez. 3730-3734 [doi]

Rapid Flood Inundation Forecast Using Fourier Neural OperatorAlexander Y. Sun, Zhi Li, Wonhyun Lee, Qixing Huang, Bridget R. Scanlon, Clint Dawson 0001. 3735-3741 [doi]

Fusing VHR Post-disaster Aerial Imagery and LiDAR Data for Roof Classification in the CaribbeanIsabelle Tingzon, Nuala Margaret Cowan, Pierre Chrzanowski. 3742-3749 [doi]

Deep Learning Driven Detection of Tsunami Related Internal Gravity Waves: a path towards open-ocean natural hazards detectionValentino Constantinou, Michela Ravanelli, Hamlin Liu, Jacob Bortnik. 3750-3755 [doi]

TeleViT: Teleconnection-driven Transformers Improve Subseasonal to Seasonal Wildfire ForecastingIoannis Prapas, Nikolaos-Ioannis Bountos, Spyros Kondylatos, Dimitrios Michail 0001, Gustau Camps-Valls, Ioannis Papoutsis. 3756-3761 [doi]

Rapid building damage assessment workflow: An implementation for the 2023 Rolling Fork, Mississippi tornado eventCaleb Robinson, Simone Fobi Nsutezo, Anthony Ortiz, Tina Sederholm, Rahul Dodhia, Cameron Birge, Kasie Richards, Kris Pitcher, Paulo Duarte, Juan M. Lavista Ferres. 3762-3766 [doi]

FireFly: A Synthetic Dataset for Ember Detection in WildfireYue Hu, Xinan Ye, YiFei Liu, Souvik Kundu 0002, Gourav Datta, Srikar Mutnuri, Namo Asavisanu, Nora Ayanian, Konstantinos Psounis, Peter A. Beerel. 3767-3771 [doi]

Drones4Good: Supporting Disaster Relief Through Remote Sensing and AINina Merkle, Reza Bahmanyar, Corentin Henry, Seyed Majid Azimi, Xiangtian Yuan, Simon Schopferer, Veronika Gstaiger, Stefan Auer, Anne Schneibel, Marc Wieland, Thomas Kraft. 3772-3776 [doi]

Estimation of Human Condition at Disaster Site Using Aerial Drone ImagesTomoki Arai, Kenji Iwata, Kensho Hara, Yutaka Satoh. 3777-3785 [doi]

Open Problems in Computer Vision for Wilderness SAR and The Search for Patricia Wu-MuradThomas Manzini, Robin R. Murphy. 3786-3791 [doi]

ACTIS: Improving data efficiency by leveraging semi-supervised Augmentation Consistency Training for Instance SegmentationJosef Lorenz Rumberger, Jannik Franzen, Peter Hirsch 0001, Jan Philipp Albrecht, Dagmar Kainmueller. 3792-3801 [doi]

Class-Guided Image-to-Image Diffusion: Cell Painting from Brightfield Images with Class LabelsJan Oscar Cross-Zamirski, Praveen Anand, Guy B. Williams, Elizabeth Mouchet, Yinhai Wang, Carola-Bibiane Schönlieb. 3802-3811 [doi]

Complex-Valued Retrievals From Noisy Images Using Diffusion ModelsNadav Torem, Roi Ronen, Yoav Y. Schechner, Michael Elad. 3812-3822 [doi]

Deep Learning Framework using Sparse Diffusion MRI for Diagnosis of Frontotemporal DementiaAbhishek Tiwari 0005, Ananya Singhal, Saurabh J. Shigwan, Rajeev Kumar Singh. 3823-3829 [doi]

DeepContrast: Deep Tissue Contrast Enhancement using Synthetic Data Degradations and OOD Model PredictionsNuno Pimpão Martins, Yannis Kalaidzidis, Marino Zerial, Florian Jug. 3830-3839 [doi]

Direct Unsupervised DenoisingBenjamin Salmon, Alexander Krull. 3840-3847 [doi]

Discrete Representation Learning for Modeling Imaging-based Spatial Transcriptomics DataDig Vijay Kumar Yarlagadda, Joan Massagué, Christina S. Leslie. 3848-3857 [doi]

Focus on Content not Noise: Improving Image Generation for Nuclei Segmentation by Suppressing Steganography in CycleGANJonas Utz, Tobias Weise, Maja Schlereth, Fabian Wagner, Mareike Thies, Mingxuan Gu, Stefan Uderhardt, Katharina Breininger. 3858-3866 [doi]

Generating Synthetic Computed Tomography (CT) Images to Improve the Performance of Machine Learning Model for Pediatric Abdominal Anomaly DetectionSamayan Bhattacharya, Avigyan Bhattacharya, Sk Shahnawaz. 3867-3875 [doi]

Leveraging Classic Deconvolution and Feature Extraction in Zero-Shot Image RestorationTomás Chobola, Gesine Müller, Veit Dausmann, Anton Theileis, Jan Taucher, Jan Huisken, Tingying Peng. 3876-3885 [doi]

NU-Net: a self-supervised smart filter for enhancing blobs in bioimagesSeongbin Lim, Emmanuel Beaurepaire, Anatole Chessel. 3886-3895 [doi]

On the risk of manual annotations in 3D confocal microscopy image segmentationJustin Sonneck, Shuo Zhao, Jianxu Chen 0001. 3896-3904 [doi]

PCTrans: Position-Guided Transformer with Query Contrast for Biological Instance SegmentationQi Chen, Wei Huang, Xiaoyu Liu, Jiacheng Li, Zhiwei Xiong. 3905-3914 [doi]

Reinforcement learning for instance segmentation with high-level priorsPaul Hilt, Maedeh Zarvandi, Edgar Kaziakhmedov, Sourabh Bhide, Maria Leptin, Constantin Pape, Anna Kreshuk. 3915-3924 [doi]

SortedAP: Rethinking evaluation metrics for instance segmentationLong Chen 0014, Yuli Wu 0001, Johannes Stegmaier, Dorit Merhof. 3925-3931 [doi]

Spatio-Temporal Analysis of Patient-Derived Organoid Videos Using Deep Learning for the Prediction of Drug EfficacyLeo Fillioux, Emilie Gontran, Jérôme Cartry, Jacques RR Mathieu, Sabrina Bedja, Alice Boilève, Paul-Henry Cournède, Fanny Jaulin, Stergios Christodoulidis, Maria Vakalopoulou. 3932-3941 [doi]

The TYC Dataset for Understanding Instance-Level Semantics and Motions of Cells in MicrostructuresChristoph Reich, Tim Prangemeier, Heinz Koeppl. 3942-3953 [doi]

Towards Hierarchical Regional Transformer-based Multiple Instance LearningJosef Cersovsky, Sadegh Mohammadi 0003, Dagmar Kainmueller, Johannes Höhne. 3954-3962 [doi]

Transformer-based Detection of Microorganisms on High-Resolution Petri Dish ImagesNikolas Ebert, Didier Stricker, Oliver Wasenmüller. 3963-3972 [doi]

Virtual perturbations to assess explainability of deep-learning based cell fate predictorsChristopher J. Soelistyo, Guillaume Charras, Alan R. Lowe. 3973-3982 [doi]

On the Interplay of Convolutional Padding and Adversarial RobustnessPaul Gavrikov, Janis Keuper. 3983-3992 [doi]

What Does Really Count? Estimating Relevance of Corner Cases for Semantic Segmentation in Automated DrivingJasmin Breitenstein, Florian Heidecker, Maria Lyssenko, Daniel Bogdoll, Maarten Bieshaar, J. Marius Zöllner, Bernhard Sick, Tim Fingscheidt. 3993-4002 [doi]

GPS-GLASS: Learning Nighttime Semantic Segmentation Using Daytime Video and GPS dataHongjae Lee, Changwoo Han, Jun-Sang Yoo 0002, Seung-Won Jung. 4003-4012 [doi]

Camera-Based Road Snow Coverage EstimationKai Cordes, Hellward Broszio. 4013-4021 [doi]

You can have your ensemble and run it too - Deep Ensembles Spread Over TimeIsak Meding, Alexander Bodin, Adam Tonderski, Joakim Johnander, Christoffer Petersson, Lennart Svensson. 4022-4031 [doi]

T-FFTRadNet: Object Detection with Swin Vision Transformers from Raw ADC Radar SignalsJames Giroux, Martin Bouchard 0001, Robert Laganière. 4032-4041 [doi]

Unsupervised Domain Adaptation for Self-Driving from Past Traversal FeaturesTravis Zhang, Katie Luo, Cheng Perng Phoo, Yurong You, Wei-Lun Chao, Bharath Hariharan, Mark E. Campbell, Kilian Q. Weinberger. 4042-4048 [doi]

Introspection of 2D Object Detection using Processed Neural Activation Patterns in Automated Driving SystemsHakan Yekta Yatbaz, Mehrdad Dianati, Konstantinos Koufos, Roger Woodman. 4049-4056 [doi]

Synthetic Dataset Acquisition for a Specific Target DomainJoshua Niemeijer, Sudhanshu Mittal, Thomas Brox. 4057-4066 [doi]

Anomaly-Aware Semantic Segmentation via Style-Aligned OoD AugmentationDan Zhang, Kaspar Sakmann, William Beluch, Robin Hutmacher, Yumeng Li. 4067-4075 [doi]

An Empirical Analysis of Range for 3D Object DetectionNeehar Peri, Mengtian Li, Benjamin Wilson, Yu-Xiong Wang, James Hays, Deva Ramanan. 4076-4085 [doi]

On Offline Evaluation of 3D Object Detection for Autonomous DrivingTim Schreier, Katrin Renz, Andreas Geiger 0001, Kashyap Chitta. 4086-4091 [doi]

Identifying Systematic Errors in Object Detectors with the SCROD PipelineValentyn Boreiko, Matthias Hein 0001, Jan Hendrik Metzen. 4092-4101 [doi]

Sensitivity analysis of AI-based algorithms for autonomous driving on optical wavefront aberrations induced by the windshieldDominik Werner Wolf, Markus Ulrich, Nikhil Kapoor. 4102-4111 [doi]

Gaussian Image Anomaly Detection with Greedy Eigencomponent SelectionTetiana Gula, João P. C. Bertoldo. 4112-4120 [doi]

Sub-Ensembles for Fast Uncertainty Estimation in Neural NetworksMatias Valdenegro-Toro. 4121-4129 [doi]

A Simple and Robust Framework for Cross-Modality Medical Image Segmentation applied to Vision TransformersMatteo Bastico, David Ryckelynck, Laurent Corté, Yannick Tillier, Etienne Decencière. 4130-4140 [doi]

An Experimental Protocol for Neural Architecture Search in Super-ResolutionJesús Leopoldo Llano García, Raúl Monroy, Víctor Adrián Sosa-Hernández. 4141-4148 [doi]

Exploring Image Classification Robustness and Interpretability with Right for the Right Reasons Data AugmentationFlávio Arthur Oliveira Santos, Cleber Zanchettin. 4149-4158 [doi]

Optical Solutions for Spectral Imaging Inverse Problems with a Shift-Variant SystemSergio Urrea, Roman Jacome, M. Salman Asif, Henry Arguello, Hans Garcia. 4159-4166 [doi]

Improving Automatic Endoscopic Stone Recognition Using a Multi-view Fusion Approach Enhanced with Two-Step Transfer LearningFrancisco Javier Lopez-Tiro, Elias Villalvazo-Avila, Juan Pablo Betancur-Rengifo, Iván Reyes-Amezcua, Jacques Hubert, Gilberto Ochoa-Ruiz, Christian Daul. 4167-4174 [doi]

UPGPT: Universal Diffusion Model for Person Image Generation, Editing and Pose TransferSoon Yau Cheong, Armin Mustafa, Andrew Gilbert. 4175-4184 [doi]

Generative Approach for Probabilistic Human Mesh Recovery using Diffusion ModelsHanbyel Cho, Junmo Kim. 4185-4190 [doi]

Personalized 3D Human Pose and Shape RefinementTom Wehrbein, Bodo Rosenhahn, Iain A. Matthews, Carsten Stoll. 4191-4201 [doi]

Extract-and-Adaptation Network for 3D Interacting Hand Mesh RecoveryJoonkyu Park, Daniel Sungho Jung, Gyeongsik Moon, Kyoung Mu Lee. 4202-4211 [doi]

Effective Whole-body Pose Estimation with Two-stages DistillationZhendong Yang, Ailing Zeng, Chun Yuan, Yu Li 0003. 4212-4222 [doi]

BoDiffusion: Diffusing Sparse Observations for Full-Body Human Motion SynthesisAngela Castillo, María Escobar, Guillaume Jeanneret, Albert Pumarola, Pablo Arbeláez, Ali K. Thabet, Artsiom Sanakoyeu. 4223-4233 [doi]

Intrinsic Appearance Decomposition Using Point Cloud RepresentationXiaoyan Xing, Konrad Groh, Sezer Karaoglu, Theo Gevers. 4234-4238 [doi]

Noise-in, Bias-out: Balanced and Real-time MoCap SolvingGeorgios Albanis, Nikolaos Zioulis, Spyridon Thermos, Anargyros Chatzitofis, Kostas Kolomvatsos. 4239-4249 [doi]

Temporally Consistent Semantic Segmentation using Spatially Aware Multi-view Semantic Fusion for Indoor RGB-D videosFengyuan Sun, Sezer Karaoglu, Theo Gevers. 4250-4259 [doi]

Efficient 3D Reconstruction, Streaming and Visualization of Static and Dynamic Scene Parts for Multi-client Live-telepresence in Large-scale EnvironmentsLeif Van Holland, Patrick Stotko, Stefan Krumpen, Reinhard Klein, Michael Weinmann. 4260-4274 [doi]

On-device Real-time Custom Hand Gesture RecognitionEsha Uboweja, David Tian, Qifei Wang, Yi Chun Kuo, Joe Zou, Lu Wang, George Sung, Matthias Grundmann. 4275-4279 [doi]

MAMMOS: MApping Multiple human MOtion with Scene understanding and natural interactionsDonggeun Lim, Cheongi Jeong, Young Min Kim 0001. 4280-4289 [doi]

NOVA: NOvel View Augmentation for Neural Composition of Dynamic ObjectsDakshit Agrawal, Jiajie Xu, Siva Karthik Mustikovela, Ioannis Gkioulekas, Ashish Shrivastava, Yuning Chai. 4290-4294 [doi]

FArMARe: a Furniture-Aware Multi-task methodology for Recommending Apartments based on the user interestsAli Abdari, Alex Falcon, Giuseppe Serra 0001. 4295-4305 [doi]

Confusing Large Models by Confusing Small ModelsVítor Albiero, Raghav Mehta, Ivan Evtimov, Samuel J. Bell, Levent Sagun, Aram Markosyan. 4306-4314 [doi]

Misalignment-Free Relation Aggregation for Multi-Source-Free Domain AdaptationHao-Wei Yeh, Qier Meng, Tatsuya Harada. 4315-4324 [doi]

Consistency Regularization for Generalizable Source-free Domain AdaptationLongxiang Tang, Kai Li, Chunming He, Yulun Zhang, Xiu Li. 4325-4335 [doi]

Unsupervised Camouflaged Object Segmentation as Domain AdaptationYi Zhang, Chengyi Wu. 4336-4346 [doi]

Class-aware Memory Guided Unbiased Weighting for Universal Domain Adaptive Object DetectionQinghai Lang, Zhenwei He, Xiaowei Fu, Lei Zhang. 4347-4356 [doi]

AD-CLIP: Adapting Domains in Prompt Space Using CLIPMainak Singha, Harsh Pal, Ankit Jha, Biplab Banerjee. 4357-4366 [doi]

Raising the Bar on the Evaluation of Out-of-Distribution DetectionJishnu Mukhoti, Tsung-Yu Lin, Bor-Chun Chen, Ashish Shah, Philip H. S. Torr, Puneet K. Dokania, Ser-Nam Lim. 4367-4377 [doi]

A Re-Parameterized Vision Transformer (ReVT) for Domain-Generalized Semantic SegmentationJan-Aike Termöhlen, Timo Bartels, Tim Fingscheidt. 4378-4387 [doi]

LORD: Leveraging Open-Set Recognition with Unknown DataTobias Koch 0003, Christian Riess, Thomas Köhler 0004. 4388-4398 [doi]

Masking Strategies for Background Bias Removal in Computer Vision ModelsAnanthu Aniraj, Cássio F. Dantas, Dino Ienco, Diego Marcos. 4399-4407 [doi]

Assessing the Impact of Diversity on the Resilience of Deep Learning Ensembles: A Comparative Study on Model Architecture, Output, Activation, and AttributionRafael Rosales, Pablo Munoz, Michael Paulitsch. 4408-4418 [doi]

DatasetEquity: Are All Samples Created Equal? In The Quest For Equity Within DatasetsShubham Shrivastava, Xianling Zhang, Sushruth Nagesh, Armin Parchami. 4419-4428 [doi]

Benchmarking Image Classifiers for Physical Out-of-Distribution Examples DetectionOjaswee, Akshay Agarwal 0001, Nalini K. Ratha. 4429-4437 [doi]

Gradient Estimation for Unseen Domain Risk Minimization with Pre-Trained ModelsByounggyu Lew, Donghyun Son, Buru Chang. 4438-4448 [doi]

Leveraging Visual Attention for out-of-distribution DetectionLuca Cultrera, Lorenzo Seidenari, Alberto Del Bimbo. 4449-4458 [doi]

2GAN: Rethinking Entanglement by Self-correcting Correlated GAN SpaceZikun Chen, Han Zhao 0002, Parham Aarabi, Ruowei Jiang. 4459-4468 [doi]

Can Self-Supervised Representation Learning Methods Withstand Distribution Shifts and Corruptions?Prakash Chandra Chhipa, Johan Rodahl Holmgren, Kanjar de, Rajkumar Saini, Marcus Liwicki. 4469-4478 [doi]

Far Away in the Deep Space: Dense Nearest-Neighbor-Based Out-of-Distribution DetectionSilvio Galesso, Max Argus, Thomas Brox. 4479-4489 [doi]

Gaussian Latent Representations for Uncertainty Estimation using Mahalanobis Distance in Deep ClassifiersAishwarya Venkataramanan, Assia Benbihi, Martin Laviale, Cédric Pradalier. 4490-4499 [doi]

Probabilistic MIMO U-Net: Efficient and Accurate Uncertainty Estimation for Pixel-wise RegressionAnton Baumann, Thomas Roßberg, Michael Schmitt 0003. 4500-4508 [doi]

Calibrated Out-of-Distribution Detection with a Generic RepresentationTomás Vojír, Jan Sochman, Rahaf Aljundi, Jirí Matas. 4509-4518 [doi]

DELO: Deep Evidential LiDAR Odometry using Partial Optimal TransportSk Aziz Ali, Djamila Aouada, Gerd Reis, Didier Stricker. 4519-4528 [doi]

Dual-level Interaction for Domain Adaptive Semantic SegmentationDongyu Yao, Boheng Li. 4529-4538 [doi]

UncLe-SLAM: Uncertainty Learning for Dense Neural SLAMErik Sandström, Kevin Ta, Luc Van Gool, Martin R. Oswald. 4539-4550 [doi]

Distance Matters For Improving Performance Estimation Under Covariate ShiftMélanie Roschewitz, Ben Glocker. 4551-4561 [doi]

Identifying Out-of-Domain Objects with Dirichlet Deep Neural NetworksAhmed Hammam, Frank Bonarens, Seyed Eghbal Ghobadi, Christoph Stiller. 4562-4571 [doi]

A Simple and Explainable Method for Uncertainty Estimation using Attribute Prototype NetworksClaudius Zelenka, Andrea Göhring, Daniyal Kazempour, Maximilian Hünemörder, Lars Schmarje, Peer Kröger. 4572-4581 [doi]

Biased Class disagreement: detection of out of distribution instances by using differently biased semantic segmentation modelsRoberto Alcover-Couso, Juan C. SanMiguel, Marcos Escudero-Viñolo. 4582-4590 [doi]

Exploring Inlier and Outlier Specification for Improved Medical OOD DetectionVivek Sivaraman Narayanaswamy, Yamen Mubarka, Rushil Anirudh, Deepta Rajan, Jayaraman J. Thiagarajan. 4591-4600 [doi]

Adversarial Attacks Against Uncertainty QuantificationEmanuele Ledda, Daniele Angioni, Giorgio Piras, Giorgio Fumera, Battista Biggio, Fabio Roli. 4601-4610 [doi]

Unsupervised Confidence Approximation: Trustworthy Learning from Noisy Labelled DataNavid Rabbani, Adrien Bartoli. 4611-4619 [doi]

The Robust Semantic Segmentation UNCV2023 Challenge ResultsXuanlong Yu, Yi Zuo, Zitao Wang, Xiaowen Zhang, Jiaxuan Zhao, Yuting Yang, Licheng Jiao, Rui Peng, Xinyi Wang, Junpei Zhang, Kexin Zhang 0003, Fang Liu, Roberto Alcover-Couso, Juan C. SanMiguel, Marcos Escudero-Viñolo, Hanlin Tian, Kenta Matsui, Tianhao Wang 0026, Fahmy Adan, Zhitong Gao, Xuming He 0001, Quentin Bouniot, Hossein Moghaddam, Shyam Nandan Rai, Fabio Cermelli, Carlo Masone, Andrea Pilzer, Elisa Ricci 0001, Andrei Bursuc, Arno Solin, Martin Trapp 0001, Rui Li, Angela Yao, Wenlong Chen, Ivor Simpson, Neill D. F. Campbell, Gianni Franchi. 4620-4630 [doi]

What If the TV Was Off? Examining Counterfactual Reasoning Abilities of Multi-modal Language ModelsLetian Zhang, Xiaotong Zhai, Zhongkai Zhao, Xin Wen, Bingchen Zhao. 4631-4635 [doi]

Uni-NLX: Unifying Textual Explanations for Vision and Vision-Language TasksFawaz Sammani, Nikos Deligiannis. 4636-4641 [doi]

SelfGraphVQA: A Self-Supervised Graph Neural Network for Scene-based Question AnsweringBruno Souza, Marius Aasan, Hélio Pedrini, Adín Ramírez Rivera. 4642-4647 [doi]

Understanding Video Scenes through Text: Insights from Text-based Video Question AnsweringSoumya Jahagirdar, Minesh Mathew, Dimosthenis Karatzas, C. V. Jawahar. 4648-4652 [doi]

Iterative Robust Visual Grounding with Masked Reference based Centerpoint SupervisionMenghao Li, Chunlei Wang, Wenquan Feng, Shuchang Lyu, Guangliang Cheng, Xiangtai Li, Binghao Liu, Qi Zhao. 4653-4658 [doi]

MMTF: Multi-Modal Temporal Fusion for Commonsense Video Question AnsweringMobeen Ahmad, Geonwoo Park, Dongchan Park, Sanguk Park. 4659-4664 [doi]

Pointing out Human Answer Mistakes in a Goal-Oriented Visual DialogueRyosuke Oshima, Seitaro Shinagawa, Hideki Tsunashima, Qi Feng, Shigeo Morishima. 4665-4670 [doi]

Language-enhanced RNR-Map: Querying Renderable Neural Radiance Field maps with natural languageFrancesco Taioli, Federico Cunico, Federico Girella, Riccardo Bologna, Alessandro Farinelli, Marco Cristani. 4671-4676 [doi]

CLIP-Decoder : ZeroShot Multilabel Classification using Multimodal CLIP Aligned RepresentationsMuhammad Ali, Salman H. Khan 0001. 4677-4681 [doi]

External Links

Cite Key

Statistics

PDF

Researchr

IEEE/CVF International Conference on Computer Vision, ICCV 2023 - Workshops, Paris, France, October 2-6, 2023

Abstract

Table of Contents