IEEE Trans. Circuits Syst. Video Techn.

researchr

You are not signed in
Sign in
Sign up

7803	--	7819	Kai Niu 0002, Yanyi Liu, Yuzhou Long, Yan Huang 0008, Liang Wang 0001, Yanning Zhang. An Overview of Text-Based Person Search: Recent Advances and Future Directions
7820	--	7829	Guoyu Yang, Jie Lei 0002, Hao Tian, Zunlei Feng, Ronghua Liang. Asymptotic Feature Pyramid Network for Labeling Pixels and Regions
7830	--	7843	Ke Song, Guoqiang Liang, Zhaojie Chen, Yanning Zhang. Non-Exemplar Class-Incremental Learning by Random Auxiliary Classes Augmentation and Mixed Features
7844	--	7855	Wujie Zhou, Bitao Jian, Meixin Fang, Xiena Dong, Yuanyuan Liu 0004, Qiuping Jiang. DGPINet-KD: Deep Guided and Progressive Integration Network With Knowledge Distillation for RGB-D Indoor Scene Analysis
7856	--	7869	Qiming Li, Jinghang Cheng, Yin Gao, Jun Li 0043. Learning Geometric Information via Transformer Network for Key-Points Based Motion Segmentation
7870	--	7881	Yandong Bi, Huajie Jiang, Yongli Hu, Yanfeng Sun, Baocai Yin. Fair Attention Network for Robust Visual Question Answering
7882	--	7895	Jian Sun, Hao Sun, Lin Lei, Kefeng Ji, Gangyao Kuang. TirSA: A Three Stage Approach for UAV-Satellite Cross-View Geo-Localization Based on Self-Supervised Feature Enhancement
7896	--	7911	Yu Xue, Lai-Man Po, Wing Yin Yu, Haoxuan Wu, Xuyuan Xu, Kun Li, Yuyang Liu. Self-Calibration Flow Guided Denoising Diffusion Model for Human Pose Transfer
7912	--	7921	Yi Zhang, Xiaotian Zhu. Attention-Based Layer Fusion and Token Masking for Weakly Supervised Semantic Segmentation
7922	--	7934	Dongyue Li, Songlin Du. ContextMatcher: Detector-Free Feature Matching With Cross-Modality Context
7935	--	7946	Daosong Hu, Kai Huang 0001. Semi-Supervised Multitask Learning Using Gaze Focus for Gaze Estimation
7947	--	7961	Hao Feng, Keyi Zhou, Wengang Zhou, Yufei Yin, Jiajun Deng, Qi Sun, Houqiang Li. Recurrent Generic Contour-Based Instance Segmentation With Progressive Learning
7962	--	7974	Yisheng Zhao, Huaiyu Zhu 0004, Ruohong Huan, Yaoqi Bao, Yun Pan. Heterogeneous Graph Network for Action Detection
7975	--	7985	Sungjune Park, Hyunjun Kim, Yong Man Ro. Integrating Language-Derived Appearance Elements With Visual Cues in Pedestrian Detection
7986	--	7997	Enhao Zhang, Chuanxing Geng, Chaohua Li, Songcan Chen. Dynamic Learnable Logit Adjustment for Long-Tailed Visual Recognition
7998	--	8012	Fupeng Chu, Yang Cong, Ronghan Chen. OPEN: Occlusion-Invariant Perception Network for Single Image-Based 3D Shape Retrieval
8013	--	8025	Xiao He, Mingrui Zhu, Nannan Wang 0001, Xinbo Gao 0001. Few-Shot Font Generation by Learning Style Difference and Similarity
8026	--	8040	Tianhuan Huang, Xianye Ben, Chen Gong 0002, Wenzheng Xu, Qiang Wu 0001, Hongchao Zhou. GaitDAN: Cross-View Gait Recognition via Adversarial Domain Adaptation
8041	--	8052	Yinan Wu 0001, Licheng Jiao, Xu Liu 0006, Fang Liu 0001, Shuyuan Yang, Lingling Li 0002. Domain Adaptation-Aware Transformer for Hyperspectral Object Tracking
8053	--	8066	Shiyao Li, Zhenhua Zhu, Hanbo Sun, Xuefei Ning, Guohao Dai, Yiming Hu, Huazhong Yang, Yu Wang 0002. Toward High-Accuracy and Real-Time Two-Stage Small Object Detection on FPGA
8067	--	8079	Fan Wan, Xingyu Miao, Haoran Duan, Jingjing Deng 0001, Rui Gao, Yang Long 0001. Sentinel-Guided Zero-Shot Learning: A Collaborative Paradigm Without Real Data Exposure
8080	--	8092	Chenhao Wu, Qingbo Wu 0001, Rui Ma, King Ngi Ngan, Hongliang Li 0001, Fanman Meng, Heqian Qiu. Continual Cross-Domain Image Compression via Entropy Prior Guided Knowledge Distillation and Scalable Decoding
8093	--	8106	Shuai Guo 0002, Qiuwen Wang, Yijie Gao, Rong Xie, Lin Li 0062, Fang Zhu, Li Song 0001. Depth-Guided Robust Point Cloud Fusion NeRF for Sparse Input Views
8107	--	8121	Yufan Wang, Le Huang, Qunfei Zhao, Zeyang Xia, Ning Zhao. Hybrid Shape Deformation for Face Reconstruction in Aesthetic Orthodontics
8122	--	8134	Shaojie Zhang, Jianqin Yin, Yonghao Dang, Jiajun Fu. SiT-MLP: A Simple MLP With Point-Wise Topology Feature Learning for Skeleton-Based Action Recognition
8135	--	8147	Jiahe Zhu, Jinji Zheng, Xinyi Xia, Yifan Li, Zhiru Li, Xicai Li. IGM-MELv2: Infrared Guiding Modal Multiuser Eye Localization System on ARM CPU for Autostereoscopic Displays
8148	--	8160	Anlei Zhu, YingHui Wang, Jinlong Yang 0002, Tao Yan, Haomiao Ma, Wei Li 0121. YOWOv3: A Lightweight Spatio-Temporal Joint Network for Video Action Detection
8161	--	8171	Chang Liu 0071, Jie Zhao 0014, Chunjuan Bo, Shengming Li, Dong Wang 0004, Huchuan Lu. LGTrack: Exploiting Local and Global Properties for Robust Visual Tracking
8172	--	8187	Zhaoqilin Yang, GaoYun An, ZhenXing Zheng, Shan Cao, Qiuqi Ruan. GBC: Guided Alignment and Adaptive Boosting CLIP Bridging Vision and Language for Robust Action Recognition
8188	--	8200	Jie Wu, Leyuan Fang, Jun Yue. TAKD: Target-Aware Knowledge Distillation for Remote Sensing Scene Classification
8201	--	8214	Wenlve Zhou, Zhiheng Zhou. Unsupervised Domain Adaption Harnessing Vision-Language Pre-Training
8215	--	8229	Wenmin Huang, Weiqi Luo 0001, Xiaochun Cao, Jiwu Huang. Interactive Generative Adversarial Networks With High-Frequency Compensation for Facial Attribute Editing
8230	--	8241	Yifei Qian, Xiaopeng Hong, Zhongliang Guo 0001, Ognjen Arandjelovic, Carl R. Donovan. Semi-Supervised Crowd Counting With Contextual Modeling: Facilitating Holistic Understanding of Crowd Scenes
8242	--	8252	Zhimin Wei, Zhipeng Zhang, Peng Wu, Ji Wang, Peng Wang 0015, Yanning Zhang. Fine-Granularity Alignment for Text-Based Person Retrieval Via Semantics-Centric Visual Division
8253	--	8265	Haoyuan Jin, Xuesong Nie, Yunfeng Yan, Xi Chen, Zhihang Zhu, Donglian Qi. AHOR: Online Multi-Object Tracking With Authenticity Hierarchizing and Occlusion Recovery
8266	--	8280	Zhilin Zhang, Chengxiu Liu, Xiaoxu Wang, Ziyu Han, Guantai Yang, Cheng Wang, Panfeng Huang, Qianbo Lu. DLP-Fusion: Depth of Field, Light Source, and Polarization Fusion Toward Intelligent Optical Imaging for Complex Scenes
8281	--	8291	Ye Huang, Di Kang, Shenghua Gao, Wen Li 0001, Lixin Duan. High-Level Feature Guided Decoding for Semantic Segmentation
8292	--	8309	Tung Minh Tran, Doanh C. Bui, Tam V. Nguyen 0002, Khang Nguyen 0001. Transformer-Based Spatio-Temporal Unsupervised Traffic Anomaly Detection in Aerial Videos
8310	--	8326	Xiaoqiang Zhu, Jiayu Zhou, Lihua You, Xiaosong Yang, Jian Chang, Jian-Jun Zhang 0001, Dan Zeng 0001. DFIE3D: 3D-Aware Disentangled Face Inversion and Editing via Facial-Contrastive Learning
8327	--	8342	Zidong Liu, Jiasong Wu, Zeyu Shen, Xin Chen, Qianyu Wu, Zhiguo Gui, Lotfi Senhadji, Huazhong Shu. Improving End-to-End Sign Language Translation With Adaptive Video Representation Enhanced Transformer
8343	--	8354	Yongzhe Yuan, Yue Wu 0004, Mingyu Yue, Maoguo Gong, Xiaolong Fan, Wenping Ma 0001, Qiguang Miao. Learning Discriminative Features via Multi-Hierarchical Mutual Information for Unsupervised Point Cloud Registration
8355	--	8367	ATing Yin, Yaonan Wang 0001, Jianxu Mao, Hui Zhang 0023, Xiuyi Chen. Category-Contextual Relation Encoding Network for Few-Shot Object Detection
8368	--	8381	Wen Wen, Mu Li 0005, Yiru Yao, Xiangjie Sui, Yabin Zhang 0002, Long Lan, Yuming Fang, Kede Ma. Perceptual Quality Assessment of Virtual Reality Videos in the Wild
8382	--	8397	Guangning Xu, Michael K. Ng 0001, Yunming Ye, Xutao Li, Ge Song, Bowen Zhang 0005, Zhichao Huang. TLS-MWP: A Tensor-Based Long- and Short-Range Convolution for Multiple Weather Prediction
8398	--	8411	Hao Liu, Lijun He, Miao Zhang, Fan Li 0003. VADiffusion: Compressed Domain Information Guided Conditional Diffusion for Video Anomaly Detection
8412	--	8426	Guanyi Li, Junjie Zhang 0002, Enquan Yang, Haoran Jiang, Dan Zeng 0001. Multi-Level Information Fusion Network With Edge Information Injection for Single-Band Cloud Detection
8427	--	8441	Yiwen Shan, Dong Hu, Zhi Wang 0015. A Novel Truncated Norm Regularization Method for Multi-Channel Color Image Denoising
8442	--	8455	Tong Qiao, Hang Shao, Shichuang Xie, Ran Shi. Unsupervised Generative Fake Image Detector
8456	--	8468	Sicheng Pan, Yingming Li. EBDNet: Integrating Optical Flow With Kernel Prediction for Burst Denoising
8469	--	8480	Yong Wang, Pengbo Zhou, Guohua Geng, Li An, Kang Li, Ruoxue Li. Neighborhood Multi-Compound Transformer for Point Cloud Registration
8481	--	8493	Yuting Yang 0008, Licheng Jiao, Xu Liu 0006, Lingling Li 0002, Fang Liu 0001, Shuyuan Yang, Xiangrong Zhang. Efficient LWPooling: Rethinking the Wavelet Pooling for Scene Parsing
8494	--	8508	Xiaoxu Chen, Jingfan Tan, Tao Wang 0052, Kaihao Zhang, Wenhan Luo, Xiaochun Cao. Toward Real-World Blind Face Restoration With Generative Diffusion Prior
8509	--	8521	Yu Wang 0073, Liquan Chen, Kunliang Yu, Tong Fu. A Secure Spatio-Temporal Chaotic Pseudorandom Generator for Image Encryption
8522	--	8535	Xiao Wang, Yang Lu 0009, Wanchuan Yu, Yanwei Pang, Hanzi Wang. Few-Shot Action Recognition via Multi-View Representation Learning
8536	--	8546	Zhidan Ran, Xuan Wei, Wei Liu, Xiaobo Lu. Multiscale Aligned Spatial-Temporal Interaction for Video-Based Person Re-Identification
8547	--	8561	Lan Li 0005, Meiping Song, Qiang Zhang 0011, Yushuai Dong, Yulei Wang 0002, Qiangqiang Yuan. Local Extremum Constrained Total Variation Model for Natural and Hyperspectral Image Non-Blind Deblurring
8562	--	8575	Yuzhen Niu, Rui Xu, Zhihua Lin, Wenxi Liu. STD-Net: Spatio-Temporal Decomposition Network for Video Demoiréing With Sparse Transformers
8576	--	8588	Eunpil Park, Jaejun Yoo, Jae-Young Sim. Universal Dehazing via Haze Style Transfer
8589	--	8601	Liangliang Song, Zhixi Feng, Shuyuan Yang, Xinyu Zhang, Licheng Jiao. Interactive Spectral-Spatial Transformer for Hyperspectral Image Classification
8602	--	8613	Meiqi Wu, Kaiqi Huang, Yuanqiang Cai, Shiyu Hu, YuZhong Zhao, Weiqiang Wang. Finger in Camera Speaks Everything: Unconstrained Air-Writing for Real-World
8614	--	8628	Haoran Wei, Qingbo Wu 0001, Chenhao Wu, King Ngi Ngan, Hongliang Li 0001, Fanman Meng, Heqian Qiu. Robust Unpaired Image Dehazing via Adversarial Deformation Constraint
8629	--	8643	Yurong Chen 0003, Yaonan Wang 0001, Hui Zhang 0023. Prior Images Guided Generative Autoencoder Model for Dual-Camera Compressive Spectral Imaging
8644	--	8656	Kaijie He, Jun Xie 0003, Xinguang Dai, Kenglun Chang, Feng Chen 0044, Zhepeng Wang 0002. STADet: Streaming Timing-Aware Video Lane Detection
8657	--	8671	Sanaz Nami, Farhad Pakdaman, Mahmoud Reza Hashemi, Shervin Shirmohammadi, Moncef Gabbouj. Lightweight Multitask Learning for Robust JND Prediction Using Latent Space and Reconstructed Frames
8672	--	8683	Wenyan Pan, Wentao Ma, Shan Zhao 0002, Lichuan Gu, Guolong Shi, Zhihua Xia, Meng Wang 0001. Image Manipulation Detection With Cascade Hierarchical Graph Representation
8684	--	8697	Rongqin Liang, Yuanman Li, Jiantao Zhou 0001, Xia Li 0006. Text-Driven Traffic Anomaly Detection With Temporal High-Frequency Modeling in Driving Videos
8698	--	8709	Aihua Zheng, Fan Yuan, Haichuan Zhang, Jiaxiang Wang 0001, Chao Tang, Chenglong Li 0002. Public-Private Attributes-Based Variational Adversarial Network for Audio-Visual Cross-Modal Matching
8710	--	8721	Jiayuan Xie, Jiali Chen, Zhenghao Liu, Yi Cai 0001, Qingbao Huang, Qing Li 0001. Video Question Generation for Dynamic Changes
8722	--	8735	Yabin Zhu, Chenglong Li 0002, Xiao Wang 0014, Jin Tang 0001, Zhixiang Huang. RGBT Tracking via Progressive Fusion Transformer With Dynamically Guided Learning
8736	--	8752	Yihui Fan, Xin Jin 0002, Siyao Zhou 0003, Shun Zou. Light Fields Stitching for Windowed-6DoF VR Content
8753	--	8765	Yingxue Xu, Guihua Wen, Yang Hu, Pei Yang 0001. Modeling Hierarchical Structural Distance for Unsupervised Domain Adaptation
8766	--	8778	Huimin Ma, Siwei Wang 0001, Junpu Zhang, Shengju Yu, Suyuan Liu, Xinwang Liu 0002, Kunlun He. Symmetric Multi-View Subspace Clustering With Automatic Neighbor Discovery
8779	--	8793	Wei Huang, Zhiliang Peng, Li Dong 0004, Furu Wei, Qixiang Ye, Jianbin Jiao. Generic-to-Specific Distillation of Masked Autoencoders
8794	--	8807	Xinju Wu, Pingping Zhang, Meng Wang 0017, Peilin Chen, Shiqi Wang 0001, Sam Kwong. Geometric Prior Based Deep Human Point Cloud Geometry Compression
8808	--	8820	Xiaohan Fang, Peilin Chen, Meng Wang 0017, Xi Xie, Shiqi Wang 0001, Shanshe Wang, Siwei Ma. Exploiting Bidirectional Quality Impulse for Reference Picture Resampled Gaming Video Coding
8821	--	8835	Chen Zhu, Guo Lu, Huanbang Chen, Donghui Feng 0003, Shen Wang, Yan Zhao, Rong Xie, Li Song 0001. A Character Position-Aware Compression Framework for Screen Text Image
8836	--	8847	Hadi Amirpour, Klaus Schoeffmann, Mohammad Ghanbari 0001, Christian Timmerer. DeepVCA: Deep Video Complexity Analyzer
8848	--	8861	Chunhui Yang, Jiayu Yang, Yongqi Zhai, Ronggang Wang. FICNet: An End to End Network for Free-View Image Coding
8862	--	8880	Liying Gao, Bingliang Jiao, Yuzhou Long, Kai Niu 0002, He Huang, Peng Wang 0015, Yanning Zhang. Contrastive Pedestrian Attentive and Correlation Learning Network for Occluded Person Re-Identification
8881	--	8895	Kaixiang Chen, Pengfei Fang, Zi Ye, Liyan Zhang 0001. Multi-Scale Explicit Matching and Mutual Subject Teacher Learning for Generalizable Person Re-Identification
8896	--	8911	Ruomei Wang 0001, Jiawei Feng, Fuwei Zhang, Xiaonan Luo, Yuanmao Luo. Modality-Aware Heterogeneous Graph for Joint Video Moment Retrieval and Highlight Detection
8912	--	8923	Yuzhe Fu, Changchun Zhou, Tianling Huang, Eryi Han, Yifan He, Hailong Jiao. SoftAct: A High-Precision Softmax Architecture for Transformers Supporting Nonlinear Functions
8924	--	8938	Mingyue Niu, Ya Li, Jianhua Tao 0001, Xiuzhuang Zhou, Björn W. Schuller. DepressionMLP: A Multi-Layer Perceptron Architecture for Automatic Depression Level Prediction via Facial Keypoints and Action Units
8939	--	8952	Xianglong Wang, Eric Rigall, Xifeng An, Zhihao Li, Qing Cai, Shu Zhang 0002, Junyu Dong. A New Benchmark and Low Computational Cost Localization Method for Cephalometric Analysis
8953	--	8965	Zhaojie Chu, Kailing Guo, Xiaofen Xing, Yilin Lan, Bolun Cai, Xiangmin Xu. CorrTalk: Correlation Between Hierarchical Speech and Facial Activity Variances for 3D Animation
8966	--	8971	Qinghai Zheng. Flexible and Parameter-Free Graph Learning for Multi-View Spectral Clustering
8972	--	8977	Dengyong Zhang, Jiahao Chen, Xin Liao, Feng Li, Jiaxin Chen, Gaobo Yang. Face Forgery Detection via Multi-Feature Fusion and Local Enhancement
8978	--	8982	Binzhe Li, Bolin Chen, Zhao Wang 0004, Shiqi Wang 0001, Yan Ye. Semantic Face Compression for Metaverse: A Compact 3D Descriptor Based Approach

6615	--	6619	Wenguan Wang, Tianfei Zhou, Dongfang Liu, Zheng Thomas Tang, Alexander C. Loui. Guest Editorial Introduction to the Special Issue on Label-Efficient Learning on Video Data
6620	--	6633	Wenyi Zhao, Lu Yang 0006, Weidong Zhang 0007, Yongqin Tian, Wenhe Jia, Wei Li, Mu Yang, Xipeng Pan, Huihua Yang. Learning What and Where to Learn: A New Perspective on Self-Supervised Learning
6634	--	6645	Qiuxia Lai, Ailing Zeng, Ye Wang 0011, Lihong Cao, Yu Li 0007, Qiang Xu 0001. Self-Supervised Video Representation Learning via Capturing Semantic Changes Indicated by Saccades
6646	--	6660	Chao Wang, Zheng Tang. The Staged Knowledge Distillation in Video Classification: Harmonizing Student Progress by a Complementary Weakly Supervised Framework
6661	--	6673	Shoubin Yu, Zhongyin Zhao, Haoshu Fang, Andong Deng, Haisheng Su, Dongliang Wang, Weihao Gan, Cewu Lu, Wei Wu 0021. Regularity Learning via Explicit Distribution Modeling for Skeletal Video Anomaly Detection
6674	--	6685	Ruotong Hu, Xianzhi Wang 0001, Xiaojun Chang, Yongle Zhang, Yeqi Hu, Xinyuan Liu, Shusong Yu. CStrCRL: Cross-View Contrastive Learning Through Gated GCN With Strong Augmentations for Skeleton Recognition
6686	--	6698	Xuemei Zhang, Peng Zhao, Jinsheng Ji, Xiankai Lu, Yilong Yin. Video Corpus Moment Retrieval via Deformable Multigranularity Feature Fusion and Adversarial Training
6699	--	6709	Yin Tang, Tao Chen 0012, Xiruo Jiang, Yazhou Yao, Guo-Sen Xie, Heng Tao Shen. Holistic Prototype Attention Network for Few-Shot Video Object Segmentation
6710	--	6721	Yawen Lu, Jie Zhang 0066, Su Sun, Qianyu Guo, Zhiwen Cao, Songlin Fei, Baijian Yang 0001, Yingjie Victor Chen. Label-Efficient Video Object Segmentation With Motion Clues
6722	--	6734	Mingjie Sun, Jimin Xiao, Eng Gee Lim, Cairong Zhao, Yao Zhao 0001. Unified Multi-Modality Video Object Segmentation Using Reinforcement Learning
6735	--	6748	Ruiheng Zhang, Lu Li, Qi Zhang, Jin Zhang, Lixin Xu, Baomin Zhang, Binglu Wang. Differential Feature Awareness Network Within Antagonistic Learning for Infrared-Visible Object Detection
6749	--	6761	Chuangye Guo, Kang Liu 0014, Donghu Deng, Xuelong Li 0001. ViT Spatio-Temporal Feature Fusion for Aerial Object Tracking
6762	--	6773	Zhixiong Nan, Tao Xiang 0001. Third-Person View Attention Prediction in Natural Scenarios With Weak Information Dependency and Human-Scene Interaction Mechanism
6774	--	6784	Xiyue Wang, De Cai, Sen Yang 0006, Yiming Cui, Junyou Zhu, Kanran Wang, Junhan Zhao. SAC-Net: Enhancing Spatiotemporal Aggregation in Cervical Histological Image Classification via Label-Efficient Weakly Supervised Learning
6785	--	6796	Jiake Leng, Yiyan Zhang, Xiang Liu, Yiming Cui, Junhan Zhao, Yongxin Ge. Error-Robust and Label-Efficient Deep Learning for Understanding Tumor Microenvironment From Spatial Transcriptomics
6797	--	6808	Qingxuan Shi, Yihang Li, Huijun Di, Enyi Wu. Self-Supervised Interactive Image Segmentation
6809	--	6813	Shengxi Li, Xuelong Li, Leonardo Chiariglione, Jiebo Luo, Wenwu Wang 0001, Zhengyuan Yang, Danilo P. Mandic, Hamido Fujita. Introduction to the Special Issue on AI-Generated Content for Multimedia
6814	--	6832	Fatemeh Nazarieh, Zhenhua Feng, Muhammad Awais 0001, Wenwu Wang 0001, Josef Kittler. A Survey of Cross-Modal Visual Content Generation
6833	--	6846	Chunyi Li, Zicheng Zhang, Haoning Wu 0001, Wei Sun 0029, Xiongkuo Min, Xiaohong Liu 0001, Guangtao Zhai, Weisi Lin. AGIQA-3K: An Open Database for AI-Generated Image Quality Assessment
6847	--	6859	Yixuan Wang, Wengang Zhou, Jianmin Bao, Weilun Wang, Li Li 0040, Houqiang Li. CLIP2GAN: Toward Bridging Text With the Latent Space of GANs
6860	--	6873	Hong Chen, Yipeng Zhang 0003, Xin Wang 0019, Xuguang Duan, Yuwei Zhou, Wenwu Zhu 0001. DisenDreamer: Subject-Driven Text-to-Image Generation With Sample-Aware Disentangled Tuning
6874	--	6887	Jiyao Pu, Haoran Duan, Junzhe Zhao, Yang Long 0001. Rules for Expectation: Learning to Generate Rules via Social Environment Modeling
6888	--	6900	Jin Liu 0020, Xi Wang 0014, Xiaomeng Fu, Yesheng Chai, Cai Yu, Jiao Dai, Jizhong Han. OSM-Net: One-to-Many One-Shot Talking Head Generation With Spontaneous Head Motions
6901	--	6912	Cong Jin, Ruolin Zhu, Zixing Zhu, Lu Yang 0006, Min Yang, Jiebo Luo. MtArtGPT: A Multi-Task Art Generation System With Pre-Trained Transformer
6913	--	6925	Yang Zhao 0002, Huaen Li, Zhao Zhang 0001, Yuan Chen, Qing Liu 0022, Xiaojuan Zhang. Regional Traditional Painting Generation Based on Controllable Disentanglement Model
6926	--	6936	Yang Yu 0039, Xiaolong Liu, Rongrong Ni, Siyuan Yang, Yao Zhao 0001, Alex C. Kot. PVASS-MDD: Predictive Visual-Audio Alignment Self-Supervision for Multimodal Deepfake Detection
6937	--	6948	Miao Liu, Jing Wang 0037, Xinyuan Qian, Haizhou Li 0001. Audio-Visual Temporal Forgery Detection Using Embedding-Level Fusion and Multi-Dimensional Contrastive Loss
6949	--	6962	Yihao Huang 0001, Felix Juefei-Xu, Qing Guo 0005, Yang Liu 0003, Geguang Pu. Dodging DeepFake Detection via Implicit Spatial-Domain Notch Filtering
6963	--	6977	Qiyuan Du, Yiping Duan, Zhipeng Xie, Xiaoming Tao, Linsu Shi, Zhijuan Jin. Optical Flow-Based Spatiotemporal Sketch for Video Representation: A Novel Framework
6978	--	6992	Junlong Gao, Chuanmin Jia, Zhimeng Huang, Shanshe Wang, Siwei Ma, Wen Gao 0001. Rate-Distortion Optimized Cross Modal Compression With Multiple Domains
6993	--	7004	Fangyuan Gao, Xin Deng 0002, Junpeng Jing, Xin Zou, Mai Xu. Extremely Low Bit-Rate Image Compression via Invertible Image Generation
7005	--	7016	Hefeng Wu, Weifeng Chen, Zhibin Liu, Tianshui Chen, Zhiguang Chen, Liang Lin. Contrastive Transformer Learning With Proximity Data Generation for Text-Based Person Search
7017	--	7028	Zhen Qin 0002, Yujie Chen, Guosong Zhu, Erqiang Zhou, Yingjie Zhou, Yicong Zhou, Ce Zhu. Enhanced Pseudo-Label Generation With Self-Supervised Training for Weakly- Supervised Semantic Segmentation
7029	--	7040	Wenxue Guan, Haobo Li, Dawei Xu, Jiaxin Liu, Shenghua Gong, Jun Liu 0006. Frequency Generation for Real-World Image Super-Resolution
7041	--	7056	Huaizhang Liao, Jingyuan Xia, ZhiXiong Yang, Fulin Pan, Zhen Liu 0004, Yongxiang Liu. Meta-Learning Based Domain Prior With Application to Optical-ISAR Image Translation
7057	--	7068	Ge Shi 0002, Sinuo Deng, Bo Wang, Chong Feng, Yan Zhuang, Xiaomei Wang. One for All: A Unified Generative Framework for Image Emotion Classification
7069	--	7079	Chunwei Tian, Menghua Zheng, Bo Li 0004, Yanning Zhang, Shichao Zhang 0001, David Zhang 0001. Perceptive Self-Supervised Learning Network for Noisy Image Watermark Removal
7080	--	7094	Linjun Li, Tao Jin, Wang Lin, Hao Jiang, Wenwen Pan, Jian Wang, Shuwen Xiao, Yan Xia 0006, Weihao Jiang, Zhou Zhao. Multi-Granularity Relational Attention Network for Audio-Visual Question Answering
7095	--	7105	Feilong Cao, Lingpeng Wang, Hailiang Ye. SharpGConv: A Novel Graph Method With Plug-and-Play Sharpening Convolution for Point Cloud Registration
7106	--	7120	Qinghua Ren, Shijian Lu, Qirong Mao, Ming Dong 0001. Exploring Prototype-Anchor Contrast for Semantic Segmentation
7121	--	7134	Jinxiang Zhu, Qi Wang, Xinyu Dong, Weijian Ruan, Haolin Chen, Liang Lei, Gefei Hao. FSNA: Few-Shot Object Detection via Neighborhood Information Adaption and All Attention
7135	--	7148	Ziye Fang, Xin Jiang, Hao Tang 0007, Zechao Li. Learning Contrastive Self-Distillation for Ultra-Fine-Grained Visual Categorization Targeting Limited Samples
7149	--	7164	Yongxi Li, Wenzhong Tang, Shuai Wang, Shengsheng Qian, Changsheng Xu. Distribution-Guided Hierarchical Calibration Contrastive Network for Unsupervised Person Re-Identification
7165	--	7175	Jiahao Xu, Xinzhu Ma, Lin Zhang, Bo Zhang 0069, Tao Chen 0003. Push-and-Pull: A General Training Framework With Differential Augmentor for Domain Generalized Point Cloud Classification
7176	--	7189	Kaijie He, Canlong Zhang, Sheng Xie, Zhixin Li 0001, Zhi-wen Wang, Rui-Guo Qin. Target-Aware Tracking With Spatial-Temporal Context Attention
7190	--	7201	Han Lin, Yingjian Li, Zheng Zhang 0006, Lei Zhu 0002, Yong Xu 0001. Learning With Noisy Labels by Semantic and Feature Space Collaboration
7202	--	7215	YiBo Zhao, Hua Zhang 0003, Zan Gao, Weili Guan, Meng Wang 0001, Shengyong Chen. A Snippets Relation and Hard-Snippets Mask Network for Weakly-Supervised Temporal Action Localization
7216	--	7230	Xiaoying Yuan, Tingfa Xu, Xincong Liu, Ying Wang, Haolin Qin, Yuqiang Fang, Jianan Li. Multi-Step Temporal Modeling for UAV Tracking
7231	--	7243	Jinhong Deng, Wen Li 0001, Lixin Duan. Balanced Teacher for Source-Free Object Detection
7244	--	7258	Sungjun Jang, Heansung Lee 0001, Woo Jin Kim, Jungho Lee, Sungmin Woo, Sangyoun Lee. Multi-Scale Structural Graph Convolutional Network for Skeleton-Based Action Recognition
7259	--	7271	Baozhen Sun, Zhenhua Wang 0003, Shilei Wang, Yongkang Cheng, Jifeng Ning. Bidirectional Interaction of CNN and Transformer Feature for Visual Tracking
7272	--	7283	Yiming Wang 0007, Dongxia Chang, Zhiqiang Fu, Jie Wen 0001, Yao Zhao 0001. Partially View-Aligned Representation Learning via Cross-View Graph Contrastive Network
7284	--	7300	Yanjie Liang, Haosheng Chen 0001, Qiangqiang Wu, Changqun Xia, Jia Li 0003. Joint Spatio-Temporal Similarity and Discrimination Learning for Visual Tracking
7301	--	7314	Jiale Zhang, Chengxin Liu, Ke Xian, Zhiguo Cao 0001. Hierarchical Feature Warping and Blending for Talking Head Animation
7315	--	7327	Kangdao Liu, Xiaolin Xiao, Jinkun You, Yicong Zhou. Robust Discriminative t-Linear Subspace Learning for Image Feature Extraction
7328	--	7343	Kunchi Li, Hongyang Chen, Jun Wan 0001, Shan Yu. ESDB: Expand the Shrinking Decision Boundary via One-to-Many Information Matching for Continual Learning With Small Memory
7344	--	7358	Kunpeng Wang, Zhengzheng Tu, Chenglong Li 0002, Cheng Zhang 0010, Bin Luo 0001. Learning Adaptive Fusion Bank for Multi-Modal Salient Object Detection
7359	--	7372	Xiaoqiang Lu, Licheng Jiao, Lingling Li 0002, Fang Liu 0001, Xu Liu 0006, Shuyuan Yang. Self Pseudo Entropy Knowledge Distillation for Semi-Supervised Semantic Segmentation
7373	--	7385	Minghua Zhang, Qiuyang Zhang, Wei Song 0007, Dongmei Huang, Qi He 0003. PromptVT: Prompting for Efficient and Accurate Visual Tracking
7386	--	7400	Tianlu Zhang, Xiaoyi He, Qiang Jiao, Qiang Zhang 0020, Jungong Han. AMNet: Learning to Align Multi-Modality for RGB-T Tracking
7401	--	7416	Yimei Liu, Qing Cai, Congcong Wang, Jian Yang, Hao Fan 0004, Junyu Dong, Sheng Chen 0001. Geometry-Enhanced Attentive Multi-View Stereo for Challenging Matching Scenarios
7417	--	7429	Xu Liu, Jianing Li, Jinqiao Shi, Xiaopeng Fan, Yonghong Tian 0001, Debin Zhao. Event-Based Monocular Depth Estimation With Recurrent Transformers
7430	--	7439	Liqun Lin, Guangpeng Wei, Kanglin Liu, Wanjian Feng, Tiesong Zhao. LightViD: Efficient Video Deblurring With Spatial-Temporal Feature Fusion
7440	--	7453	Tao Zhou 0002, Yi Zhou 0007, Guangyu Li, Geng Chen 0001, Jianbing Shen. Uncertainty-Aware Hierarchical Aggregation Network for Medical Image Segmentation
7454	--	7466	Xin Liu, Biao Qian, Haipeng Liu 0004, Dan Guo, Yang Wang 0023, Meng Wang 0001. Seeking False Hard Negatives for Graph Contrastive Learning
7467	--	7483	Qihua Feng, Peiya Li, ZhiXun Lu, Chaozhuo Li 0001, Zefan Wang, Zhiquan Liu, Chunhui Duan, Feiran Huang, Jian Weng 0001, Philip S. Yu. EViT: Privacy-Preserving Image Retrieval via Encrypted Vision Transformer in Cloud Computing
7484	--	7497	Dandan Zhan, Jiahao Wu, Xing Luo, Zhi Jin. Learning From Text: A Multimodal Face Inpainting Network for Irregular Holes
7498	--	7511	Ahmet Burakhan Koyuncu, Panqi Jia, Atanas Boev, Elena Alshina, Eckehard G. Steinbach. Efficient Contextformer: Spatio-Channel Window Attention for Fast Context Modeling in Learned Image Compression
7512	--	7522	Deqian Mao, Shanshan Gao, Zhenyu Li, Honghao Dai, Yunfeng Zhang 0001, Yuanfeng Zhou. Aggregating Global and Local Representations via Hybrid Transformer for Video Deraining
7523	--	7536	Pei-an, Xuzhong Hu, Junfeng Ding, Jun Zhang, Jie Ma, You Yang, Qiong Liu 0001. OL-Reg: Registration of Image and Sparse LiDAR Point Cloud With Object-Level Dense Correspondences
7537	--	7549	Lei He 0010, Yongfang Xie, Shiwen Xie, Zhaohui Jiang 0001, Zhipeng Chen. Iterative Self-Guided Image Filtering
7550	--	7565	Zizhuo Li, Chunbao Su, Fan Fan 0001, Jun Huang 0008, Jiayi Ma 0001. MC-Net: Integrating Multi-Level Geometric Context for Two-View Correspondence Learning
7566	--	7576	Chunwei Tian, Menghua Zheng, Tiancai Jiao, Wangmeng Zuo, Yanning Zhang, Chia-Wen Lin. A Self-Supervised CNN for Image Watermark Removal
7577	--	7588	Tianwei Zhou, Songbai Tan, Baoquan Zhao, Guanghui Yue 0001. Multitask Deep Neural Network With Knowledge-Guided Attention for Blind Image Quality Assessment
7589	--	7600	Yu Tian, Shiqi Wang 0001, Baoliang Chen, Sam Kwong. Causal Representation Learning for GAN-Generated Face Image Quality Assessment
7601	--	7613	Weiwei Zhang, Yufeng Guo, Junhuang Wang, Jianqing Zhu, Huanqiang Zeng. Collaborative Knowledge Distillation
7614	--	7627	Zhengeng Yang, Hongshan Yu, Wei Sun 0028, Li Cheng 0001, Ajmal Mian. Domain-Invariant Prototypes for Semantic Segmentation
7628	--	7642	Mengxin Gong, Xiuli Chai, Yang Lu 0013, Yushu Zhang. Exploiting Four-Dimensional Chaotic Systems With Dissipation and Optimized Logical Operations for Secure Image Compression and Encryption
7643	--	7656	Jiaqing Zhang, Jie Lei 0001, Weiying Xie, Geng Yang, Daixun Li, Yunsong Li. Multimodal Informative ViT: Information Aggregation and Distribution for Hyperspectral and LiDAR Classification
7657	--	7670	Zhuyang Xie, Yan Yang 0001, Jie Wang, Xiaorong Liu, Xiaofan Li. Trustworthy Multimodal Fusion for Sentiment Analysis in Ordinal Sentiment Space
7671	--	7682	Nianzu Qiao, Changyin Sun, Lu Dong 0002, Quanbo Ge. Semi-Supervised Feature Distillation and Unsupervised Domain Adversarial Distillation for Underwater Image Enhancement
7683	--	7698	Tengfei Liang, Yi Jin 0001, Wu Liu, Tao Wang 0011, Songhe Feng, Yidong Li. Bridging the Gap: Multi-Level Cross-Modality Joint Alignment for Visible-Infrared Person Re-Identification
7699	--	7711	Hao Zhang, Yujie Dun, Yixuan Pei, Shenqi Lai, Chengxu Liu, Kaipeng Zhang, Xueming Qian. HF-HRNet: A Simple Hardware Friendly High-Resolution Network
7712	--	7724	Xiao Lu 0002, Yulin Yuan, Xing Liu, Lucai Wang, Xuanyu Zhou, Yimin Yang. Low-Light Salient Object Detection by Learning to Highlight the Foreground Objects
7725	--	7741	Chao Li, Shanzhi Yin, Chuanmin Jia, Fanyang Meng, Yonghong Tian 0001, Yongsheng Liang. Multirate Progressive Entropy Model for Learned Image Compression
7742	--	7755	Guangjin Pan, Shugong Xu, Shunqing Zhang, Xiaojing Chen 0001, Yanzan Sun. Quality of Experience Oriented Cross-Layer Optimization for Real-Time XR Video Transmission
7756	--	7770	Yihang Zhang, Sheng Cheng, Zongming Guo, Xinggong Zhang. Inferring Video Streaming Quality of Real-Time Communication Inside Network
7771	--	7784	Mingcong Lu, Ruifan Li, Fangxiang Feng, Zhanyu Ma, Xiaojie Wang 0006. LGR-NET: Language Guided Reasoning Network for Referring Expression Comprehension
7785	--	7800	Jiang Yu, Fengyong Li, Zichi Wang, Wen Si, Xinpeng Zhang 0001. Diverse Batch Steganography Using Model-Based Selection and Double-Layered Payload Assignment

5215	--	5228	YinLong Liu, Guang Chen 0001, Alois Knoll. Absolute Pose Estimation With a Known Direction by Motion Decoupling
5229	--	5241	Pengcheng Li, Chenqiang Gao, Fangcen Liu, Deyu Meng, Yan Yan 0002. THISNet: Tooth Instance Segmentation on 3D Dental Models via Highlighting Tooth Regions
5242	--	5254	Xiao Kang, Xingbo Liu, Xuening Zhang, Xiushan Nie, Yilong Yin. Online Discriminative Cross-Modal Hashing
5255	--	5265	Yihuan Zhu, Yunan Liu, Chunpeng Wang, Simiao Wang, Mingyu Lu. Intermediate Domain-Based Meta Learning Framework for Adaptive Object Detection
5266	--	5281	Jingyu Li, Lei Zhang 0119, Kun Zhang 0040, Bo Hu, Hongtao Xie, Zhendong Mao. Cascade Semantic Prompt Alignment Network for Image Captioning
5282	--	5294	Hao Qi, Huiyu Zhou 0001, Junyu Dong, Xinghui Dong. Small Sample Image Segmentation by Coupling Convolutions and Transformers
5295	--	5305	Hongbo Xu, Lichun Wang 0002, Kai Xu 0012, Fangyu Fu, Baocai Yin, Qingming Huang. A New Training Data Organization Form and Training Mode for Unbiased Scene Graph Generation
5306	--	5320	Yong Luo, Hongwei Ge, Yuxuan Liu, Chunguo Wu. Representation Robustness and Feature Expansion for Exemplar-Free Class-Incremental Learning
5321	--	5334	Qi Gao, Mingfeng Yin, Xiang Wu, Di Liu, Yuming Bo. Online Multi-Scale Classification and Global Feature Modulation for Robust Visual Tracking
5335	--	5349	Yu Liu 0040, Sitong Su, Junchen Zhu, Feng Zheng, Lianli Gao, Jingkuan Song. Allowing Supervision in Unsupervised Deformable- Instances Image-to-Image Translation
5350	--	5360	Cheng Wang, Yuxin Fang, Jiemin Fang, Peng Guo, Rui Wu 0018, He Huang, Xinggang Wang, Chang Huang, Wenyu Liu 0001. Efficient Task-Specific Feature Re-Fusion for More Accurate Object Detection and Instance Segmentation
5361	--	5375	Shikun Zhang, Jiaqi Yang 0002, Zhaoshuai Qi, Yanning Zhang 0001. Toward Meta-Shape-Based Multi-View 3D Point Cloud Registration: An Evaluation
5376	--	5388	Jinyu Yang, Mingqi Gao 0003, Runmin Cong, Chengjie Wang, Feng Zheng, Ales Leonardis. Unveiling the Power of Visible-Thermal Video Object Segmentation
5389	--	5399	Sen Xu, Shikui Wei, Tao Ruan, Yao Zhao 0001. ESNet: An Efficient Framework for Superpixel Segmentation
5400	--	5413	Hongchen Tan, Baocai Yin, Kaiqiang Xu, Huasheng Wang, Xiuping Liu, Xin Li 0003. Attention-Bridged Modal Interaction for Text-to-Image Generation
5414	--	5423	Zhizhe Liu, Shuai Zheng 0005, Xiaoyi Sun, Zhenfeng Zhu, Yawei Zhao, Xuebing Yang, Yao Zhao 0001. The Devil Is in the Boundary: Boundary-Enhanced Polyp Segmentation
5424	--	5439	Hanqing Yang 0002, Sijia Cai, Bing Deng, Jieping Ye, Guosheng Lin, Yu Zhang 0018. Context-Aware and Semantic-Consistent Spatial Interactions for One-Shot Object Detection Without Fine-Tuning
5440	--	5451	Weijia Liu, Jiuxin Cao, Ran Wei, Xuelin Zhu, Bo Liu 0004. Enhancing Micro-Video Venue Recognition via Multi-Modal and Multi-Granularity Object Relations
5452	--	5465	Xihang Hu, Xiaoli Zhang 0001, Fasheng Wang, Jing Sun, Fuming Sun. Efficient Camouflaged Object Detection Network Based on Global Localization Perception and Local Guidance Refinement
5466	--	5479	Zonglin Li, Zhaoxin Zhang, Shengfeng He, Quanling Meng, Shengping Zhang, Bineng Zhong, Rongrong Ji. Identity-Aware Variational Autoencoder for Face Swapping
5480	--	5492	Yidan Fan, Yongxin Yu, Wenhuan Lu, Yahong Han. Weakly-Supervised Video Anomaly Detection With Snippet Anomalous Attention
5493	--	5504	Jiashuo Li, Songlin Dong, Yihong Gong, Yuhang He, Xing Wei 0001. Analogical Learning-Based Few-Shot Class-Incremental Learning
5505	--	5518	An Tao, Yueqi Duan, Yingqi Wang, Jiwen Lu, Jie Zhou 0001. Dynamics-Aware Adversarial Attack of Adaptive Neural Networks
5519	--	5532	Yuhang He, Zhiheng Ma, Xing Wei 0001, Yihong Gong. Knowledge Synergy Learning for Multi-Modal Tracking
5533	--	5545	Mengzhu Wang, Shanshan Wang 0008, Xun Yang 0001, Jianlong Yuan, Wenju Zhang. Equity in Unsupervised Domain Adaptation by Nuclear Norm Maximization
5546	--	5559	Jin Liu, Huiyuan Fu, Xin Wang 0001, Huadong Ma. SwinIT: Hierarchical Image-to-Image Translation Framework Without Cycle Consistency
5560	--	5574	Zhaobin Chang, Xiong Gao, Na Li, Huiyu Zhou 0001, Yonggang Lu. DRNet: Disentanglement and Recombination Network for Few-Shot Semantic Segmentation
5575	--	5588	Minghao Zou, Qingtian Zeng, Xue Zhang. Weakly-Supervised Action Learning in Procedural Task Videos via Process Knowledge Decomposition
5589	--	5602	Zaiyang Yu, Lusi Li, Jinlong Xie, Changshuo Wang 0001, Weijun Li, Xin Ning 0001. Pedestrian 3D Shape Understanding for Person Re-Identification via Multi-View Learning
5603	--	5615	Yuxiao Wang 0003, Qi Liu 0005, Yu Lei. TED-Net: Dispersal Attention for Perceiving Interaction Region in Indirectly-Contact HOI Detection
5616	--	5629	Zhifu Zhao, Ziwei Chen, Jianan Li 0003, Xiaotian Wang 0001, Xuemei Xie, Lei Huang, Wanxin Zhang, Guangming Shi. Glimpse and Zoom: Spatio-Temporal Focused Dynamic Network for Skeleton-Based Action Recognition
5630	--	5640	Zhuohao Sun, Yiqiao Qiu, Zhijun Tan, Weishi Zheng 0001, Ruixuan Wang. Classifier-Head Informed Feature Masking and Prototype-Based Logit Smoothing for Out-of-Distribution Detection
5641	--	5652	Mengyu Gao, Qiulei Dong. Adaptive Conditional Denoising Diffusion Model With Hybrid Affinity Regularizer for Generalized Zero-Shot Learning
5653	--	5664	Ren Wang, Tae Sung Kim, Jin-Sung Kim, Hyuk-Jae Lee. Toward Real-World Multi-View Object Classification: Dataset, Benchmark, and Analysis
5665	--	5676	Saihui Hou, Panjian Huang, Xu Liu 0008, Chunshui Cao, Yongzhen Huang. Cloth-Imbalanced Gait Recognition via Hallucination
5677	--	5692	Doyoung Kim, Taewan Kim, Inwoong Lee, Sanghoon Lee 0001. Kinematic Diversity and Rhythmic Alignment in Choreographic Quality Transformers for Dance Quality Assessment
5693	--	5703	Yang Xu, Yan Yan 0001, Jing-Hao Xue, Yang Hua, Hanzi Wang. Unpaired Caricature-Visual Face Recognition via Feature Decomposition-Restoration-Decomposition
5704	--	5715	Yunbo Rao, Qingsong Lv, Andrei Sharf, Zhanglin Cheng. RWS: Refined Weak Slice for Semantic Segmentation Enhancement
5716	--	5727	Mochu Xiang, Jing Zhang 0052, Nick Barnes, Yuchao Dai. Measuring and Modeling Uncertainty Degree for Monocular Depth Estimation
5728	--	5741	Fan Qi, Huaiwen Zhang, Xiaoshan Yang, Changsheng Xu. A Versatile Multimodal Learning Framework for Zero-Shot Emotion Recognition
5742	--	5752	Mingzhi Yuan, Kexue Fu, Zhihao Li, Yucong Meng, Ao Shen, Manning Wang. Robust Point Cloud Registration via Random Network Co-Ensemble
5753	--	5764	Jian Wang 0113, Fan Li 0003, Yi An, Xuchong Zhang, Hongbin Sun 0001. Toward Robust LiDAR-Camera Fusion in BEV Space via Mutual Deformable Attention and Temporal Aggregation
5765	--	5775	Zhepeng Gong, Guobao Xiao, Ziwei Shi, Riqing Chen, Jun Yu 0002. MSGA-Net: Progressive Feature Matching via Multi-Layer Sparse Graph Attention
5776	--	5789	Dawei Zhang 0002, Xin Xiao, Zhonglong Zheng, Yunliang Jiang, Yi Yang. Probabilistic Assignment With Decoupled IoU Prediction for Visual Tracking
5790	--	5804	Ruixuan Cong, Hao Sheng 0001, Dazhi Yang, Da Yang 0001, Rongshan Chen, Sizhe Wang, Zhenglong Cui. End-to-End Semantic Segmentation Utilizing Multi-Scale Baseline Light Field
5805	--	5817	Jiashan Wu, Chunbo Lang, Gong Cheng 0003, Xingxing Xie, Junwei Han. Retentive Compensation and Personality Filtering for Few-Shot Remote Sensing Object Detection
5818	--	5829	Bowei Yan, Chunbo Lang, Gong Cheng 0003, Junwei Han. Understanding Negative Proposals in Generic Few-Shot Object Detection
5830	--	5842	Zhihao Chen 0004, Liang Wan, Yefan Xiao, Lei Zhu 0003, Huazhu Fu. Learning Physical-Spatio-Temporal Features for Video Shadow Removal
5843	--	5855	Jinwei Ren, Jianke Zhu. Pyramid Deep Fusion Network for Two-Hand Reconstruction From RGB-D Images
5856	--	5867	Junwei Zhao, Shiliang Zhang, Zhaofei Yu, Tiejun Huang 0001. SpiReco: Fast and Efficient Recognition of High-Speed Moving Objects With Spike Camera
5868	--	5883	Bicheng Guo, Lilin Xu, Tao Chen 0003, Peng Ye, Shibo He, Haoyu Liu, Jiming Chen 0001. Latency-Aware Neural Architecture Performance Predictor With Query-to-Tier Technique
5884	--	5896	Tianshu Song, Leida Li, Deqiang Cheng, Pengfei Chen 0003, Jinjian Wu. Active Learning-Based Sample Selection for Label-Efficient Blind Image Quality Assessment
5897	--	5907	Keke Zhang, Tiesong Zhao, Weiling Chen, Yuzhen Niu, Jinsong Hu, Weisi Lin. Perception-Driven Similarity-Clarity Tradeoff for Image Super-Resolution Quality Assessment
5908	--	5920	Zhaoshui He, Hao Liang, Senquan Yang, Wenqing Su, Peitao Wang, Zhijie Lin, Beihai Tan, Shengli Xie. Accelerating Robust-Object-Tracking via Level-3 BLAS-Based Sparse Learning
5921	--	5934	Pan Mu, Guanyao Wu, Jinyuan Liu 0001, Yuduo Zhang, Xin Fan 0001, Risheng Liu. Learning to Search a Lightweight Generalized Network for Medical Image Fusion
5935	--	5950	ShiJie Wen, Li Yang 0014, Mai Xu, Minglang Qiao, Tao Xu, Lin Bai 0001. Saliency Prediction on Mobile Videos: A Fixation Mapping-Based Dataset and A Transformer Approach
5951	--	5962	Haoyang Peng, Baopu Li, Bo Zhang 0069, Xin Chen 0040, Tao Chen 0003, Hongyuan Zhu. Multi-View Vision Fusion Network: Can 2D Pre-Trained Model Boost 3D Point Cloud Data-Scarce Learning?
5963	--	5976	Han Chen, Qi Wang, Kailin Xie, Liang Lei, Matthieu Gaetan Lin, Tian Lv, Yongjin Liu 0001, Jiebo Luo 0001. SD-FSOD: Self-Distillation Paradigm via Distribution Calibration for Few-Shot Object Detection
5977	--	5994	De Han, Xing Cheng, Nan Guo, Xiaochun Ye, Benjamin Rainer, Peter Priller. Momentum Cross-Modal Contrastive Learning for Video Moment Retrieval
5995	--	6008	Yuantong Zhang, Baoxin Teng, Daiqin Yang, Zhenzhong Chen, Haichuan Ma, Gang Li, Wenpeng Ding. Learning a Single Convolutional Layer Model for Low Light Image Enhancement
6009	--	6023	Huafeng Li, Dan Wang, Yuxin Huang, Yafei Zhang, Zhengtao Yu 0001. Generation and Recombination for Multifocus Image Fusion With Free Number of Inputs
6024	--	6038	Guangfei Li, Wenbing Liu, Quanxue Gao, Qianqian Wang 0001, Jungong Han, Xinbo Gao 0001. Self-Supervised Edge Perceptual Learning Framework for High-Resolution Remote Sensing Images Classification
6039	--	6050	Haixin Wang, Lu Zhou, Yingying Chen 0003, Zhiyang Chen 0002, Ming Tang 0001, Jinqiao Wang. EFCPose: End-to-End Multi-Person Pose Estimation With Fully Convolutional Heads
6051	--	6062	Guangxing Wang, Gong Cheng 0003, Peicheng Zhou, Junwei Han. Cross-Level Attentive Feature Aggregation for Change Detection
6063	--	6076	Zixiao Wang 0002, Hongtao Xie, Yuxin Wang 0002, Hai Xu, Guoqing Jin. DCFP: Distribution Calibrated Filter Pruning for Lightweight and Accurate Long-Tail Semantic Segmentation
6077	--	6091	Lin Yuan 0002, Kai Liang, Xiao Pu 0002, Yan Zhang 0108, Jiaxu Leng, Tao Wu 0003, Nannan Wang 0001, Xinbo Gao 0001. Invertible Image Obfuscation for Facial Privacy Protection via Secure Flow
6092	--	6104	Yanting Liu, Hui Yin, Ai-Xin Chong, Jin Wan. Reference-Based Image Dehazing With Internal and External Contrastive Learning
6105	--	6115	Lanqing Guo, Siyu Huang, Haosen Liu 0001, Bihan Wen. Toward Robust Image Denoising via Flow-Based Joint Image and Noise Model
6116	--	6127	Yuan Zhou 0006, Axin Guo, Shuwei Huo, Yu Liu 0004, Sun-Yuan Kung. Weakly Supervised Video Re-Localization Through Multi-Agent-Reinforced Switchable Network
6128	--	6143	Xinjue Hu, Zhangjie Fu, Xiang Zhang 0023, Yanyu Chen. Invisible and Steganalysis-Resistant Deep Image Hiding Based on One-Way Adversarial Invertible Networks
6144	--	6155	Zhenhao Sun, Meng Wang 0017, Peilin Chen, Xu Wang 0006, Shiqi Wang 0001, Sam Kwong. Revisiting All-Zero Block Detection for Versatile Video Coding
6156	--	6166	Shifei Ding, Qidong Wang, Lili Guo, Xuan Li, Ling Ding 0001, Xindong Wu 0001. Wavelet and Adaptive Coordinate Attention Guided Fine-Grained Residual Network for Image Denoising
6167	--	6180	Zhiwen Zuo, Ailin Li, Zhizhong Wang, Lei Zhao 0011, Jianfeng Dong, Xun Wang 0007, Meng Wang 0001. Statistics Enhancement Generative Adversarial Networks for Diverse Conditional Image Synthesis
6181	--	6193	Hao Wei 0005, Chenyang Ge, Zhiyuan Li, Xin Qiao, Pengchao Deng. Toward Extreme Image Rescaling With Generative Prior and Invertible Prior
6194	--	6206	Xiaohui Chen, Lin Chen, Lingjun Chen, Peng Chen, Guanqun Sheng, Xiaosheng Yu, Yaobin Zou. Modeling Thermal Infrared Image Degradation and Real-World Super-Resolution Under Background Thermal Noise and Streak Interference
6207	--	6223	Xiongli Chai, Feng Shao 0001, Baoyang Mu, Hangwei Chen, Qiuping Jiang, Yo-Sung Ho. Plain-PCQA: No-Reference Point Cloud Quality Assessment by Analysis of Plain Visual and Geometrical Components
6224	--	6237	Zhu Liu 0004, Jinyuan Liu 0001, Guanyao Wu, Zihang Chen, Xin Fan 0001, Risheng Liu. Searching a Compact Architecture for Robust Multi-Exposure Image Fusion
6238	--	6252	Dan Guo, Kun Li 0008, Bin Hu 0001, Yan Zhang 0053, Meng Wang 0001. Benchmarking Micro-Action Recognition: Dataset, Methods, and Applications
6253	--	6264	Jiahao Wang 0002, Fang Liu 0001, Licheng Jiao, Yingjia Gao, Hao Wang 0211, Lingling Li 0002, Puhua Chen, Xu Liu 0006, Shuo Li 0010. Satellite Video Object Tracking Based on Location Prompts
6265	--	6278	Jie Gui, Xiaofeng Cong, Chengwei Peng, Yuan Yan Tang, James Tin-Yau Kwok. Fooling the Image Dehazing Models by First Order Gradient
6279	--	6290	Zihan Zhou 0007, Jing Li 0026, Dexiang Zhong, Yong Xu 0007, Patrick Le Callet. Deep Blind Image Quality Assessment Using Dynamic Neural Model With Dual-Order Statistics
6291	--	6302	Jie Zhao, Shikui Wei, Yakun Chang, Tao Ruan, Yao Zhao 0001. Model-Free Rectification via Cascaded Distortion Model and Enhanced Backward Flow Network
6303	--	6317	Shenglun Chen, Hong Zhang, Xinzhu Ma, Zhihui Wang 0001, Haojie Li. Learning Pixel-Wise Continuous Depth Representation via Clustering for Depth Completion
6318	--	6333	Wenbin Yan, Xiaogang Zhang, Hua Chen 0008. Occlusion-Aware Unsupervised Light Field Depth Estimation Based on Multi-Scale GANs
6334	--	6346	Jilong Wang 0002, Wei Gao 0003, Ge Li 0002. Zoom to Perceive Better: No-Reference Point Cloud Quality Assessment via Exploring Effective Multiscale Feature
6347	--	6362	Zijian Chen 0001, Wei Sun 0029, Jun Jia, Fangfang Lu, Zicheng Zhang, Jing Liu 0002, Ru Huang 0002, Xiongkuo Min, Guangtao Zhai. BAND-2k: Banding Artifact Noticeable Database for Banding Detection and Quality Assessment
6363	--	6375	Yinuo Jiang, Beitong Zhou, Xiaoyu Liu, Qingyi Li, Cheng Cheng. GTINet: Global Topology-Aware Interactions for Unsupervised Point Cloud Registration
6376	--	6390	Tengfei Liu, Yongli Hu, Junbin Gao, Yanfeng Sun, Baocai Yin. Hierarchical Multi-Modal Prompting Transformer for Multi-Modal Long Document Classification
6391	--	6402	Xin Li, Guopu Zhu, Shen Wang 0004, Yicong Zhou, Xinpeng Zhang 0001. Deep Reverse Attack on SIFT Features With a Coarse-to-Fine GAN Model
6403	--	6415	Hanwei Zhu, Baoliang Chen, Lingyu Zhu 0006, Peilin Chen, Linqi Song, Shiqi Wang 0001. Video Quality Assessment for Spatio-Temporal Resolution Adaptive Coding
6416	--	6429	Mingyi Yang, Fei Yang 0004, Luka Murn, Marc Górriz Blanch, Juil Sock, Shuai Wan, FuZheng Yang 0001, Luis Herranz. Task-Switchable Pre-Processor for Image Compression for Multiple Machine Vision Tasks
6430	--	6444	Xiaofeng Huang, Ran Tang, Rui Pan, Haibing Yin, Zhao Wang 0004, Shiqi Wang 0001, Siwei Ma. Parallelized RDOQ Algorithm and Fully Pipelined Hardware Architecture for AVS3 Video Coding
6445	--	6459	Fabian Brand, Jürgen Seiler, André Kaup. Conditional Residual Coding: A Remedy for Bottleneck Problems in Conditional Inter Frame Coding
6460	--	6473	Xihua Sheng, Li Li 0040, Dong Liu 0002, Houqiang Li. Spatial Decomposition and Temporal Fusion Based Inter Prediction for Learned Video Compression
6474	--	6488	Mengyao Li, Liquan Shen, Xia Hua, Zhaoyi Tian. EUICN: An Efficient Underwater Image Compression Network
6489	--	6502	Hao Liu 0044, Hui Yuan 0001, Raouf Hamzaoui, Qi Liu 0029, Shuai Li 0005. PU-Mask: 3D Point Cloud Upsampling via an Implicit Virtual Mask
6503	--	6516	Qingrong Cheng, Zhenshan Tan, Keyu Wen, Cheng Chen, Xiaodong Gu 0001. Semantic Pre-Alignment and Ranking Learning With Unified Framework for Cross-Modal Retrieval
6517	--	6529	Xuening Zhang, Xingbo Liu, Xiushan Nie, Xiao Kang, Yilong Yin. Semi-Supervised Semi-Paired Cross-Modal Hashing
6530	--	6541	Jiaxing Li, Wai-Keung Wong, Lin Jiang, Xiaozhao Fang, Shengli Xie, Yong Xu 0001. CKDH: CLIP-Based Knowledge Distillation Hashing for Cross-Modal Retrieval
6542	--	6558	Zhe Li, Lei Zhang 0119, Kun Zhang 0040, Yongdong Zhang 0001, Zhendong Mao. Fast, Accurate, and Lightweight Memory-Enhanced Embedding Learning Framework for Image-Text Retrieval
6559	--	6575	Lei Chen, Zhen Deng, Libo Liu, Shibai Yin. Multilevel Semantic Interaction Alignment for Video-Text Cross-Modal Retrieval
6576	--	6589	Qinghang Su, Dayan Wu, Chenming Wu, Bo Li 0063, Weiping Wang 0005. From Data to Optimization: Data-Free Deep Incremental Hashing With Data Disambiguation and Adaptive Proxies
6590	--	6607	Zhe Li, Lei Zhang 0119, Kun Zhang 0040, Yongdong Zhang 0001, Zhendong Mao. Improving Image-Text Matching With Bidirectional Consistency of Cross-Modal Alignment
6608	--	6612	Hongliang Lei, Tianlei Wang, Xianfu Bao, Huafei Huang, Jiuwen Cao. Auxiliary Label Classification Based Multi-Label Limb Movement Recognition of Preterm Infant

4143	--	4158	Zongtao He, Liuyi Wang, Ronghao Dang, Shu Li, Qingqing Yan, Chengju Liu, Qijun Chen. Learning Depth Representation From RGB-D Videos by Time-Aware Contrastive Pre-Training
4159	--	4174	Dongliang Chang, Aneeshan Sain, Zhanyu Ma, Yi-Zhe Song, Ruiping Wang 0001, Jun Guo 0002. Mind the Gap: Open Set Domain Adaptation via Mutual-to-Separate Framework
4175	--	4189	Dandan Fan, Xu Liang, Chunsheng Zhang, Wei Jia 0001, David Zhang 0001. AMGNet: Aligned Multilevel Gabor Convolution Network for Palmprint Recognition
4190	--	4201	Cong Li, Gong Cheng 0003, Junwei Han. Boosting Knowledge Distillation via Intra-Class Logit Distribution Smoothing
4202	--	4213	Dingchang Hu, Siang Chen, Huazhong Yang, Guijin Wang. Query-Guided Support Prototypes for Few-Shot 3D Indoor Segmentation
4214	--	4228	Tuo Cao, Wenxiao Zhang, Yanping Fu, Shengjie Zheng, Fei Luo 0004, Chunxia Xiao. DGECN++: A Depth-Guided Edge Convolutional Network for End-to-End 6D Pose Estimation via Attention Mechanism
4229	--	4242	Buzhen Huang, Jingyi Ju, Yuan Shu, Yangang Wang. Simultaneously Recovering Multi-Person Meshes and Multi-View Cameras With Human Semantics
4243	--	4256	Xiongzheng Li, Jinsong Zhang, Yu-Kun Lai, Jing-Yu Yang 0002, Kun Li 0001. High-Quality Animatable Dynamic Garment Reconstruction From Monocular Videos
4257	--	4269	Dongming Zhang, Chenqin Fu, Dingyu Lu, Jun Li, Yongdong Zhang 0001. Bi-Source Reconstruction-Based Classification Network for Face Forgery Video Detection
4270	--	4284	Jiayi Guo, Hayk Manukyan 0001, Chenyu Yang, Chaofei Wang, Levon Khachatryan, Shant Navasardyan, Shiji Song, Humphrey Shi, Gao Huang. FaceCLIP: Facial Image-to-Video Translation via a Brief Text Description
4285	--	4298	Zhijie Lin, Zhaoshui He, Xu Wang, Bing Zhang, Chang Liu, Wenqing Su, Ji Tan, Shengli Xie. DBGANet: Dual-Branch Geometric Attention Network for Accurate 3D Tooth Segmentation
4299	--	4310	Guiyu Xia, Wenkai Ye, Peng Xue, Yubao Sun, Qingshan Liu 0001. Motion Compression Using Structurally Connected Neural Network
4311	--	4324	Chang Li, Yingchi Mao, Qian Huang, Xiaowei Zhu, Jie Wu 0001. Scale-Aware Graph Convolutional Network With Part-Level Refinement for Skeleton-Based Human Action Recognition
4325	--	4341	Huafeng Qin, Haofei Xi, Yantao Li 0001, Mounim A. El-Yacoubi, Jun Wang 0071, Xinbo Gao 0001. Adversarial Learning-Based Data Augmentation for Palm-Vein Identification
4342	--	4353	Qing Tian, Heyang Sun, Shun Peng, Yuhui Zheng, Jun Wan 0001, Zhen Lei 0001. DCL: Dipolar Confidence Learning for Source-Free Unsupervised Domain Adaptation
4354	--	4366	Ruijie Zhu, Ziyang Song, Li Liu, Jianfeng He, Tianzhu Zhang, Yongdong Zhang 0001. HA-Bins: Hierarchical Adaptive Bins for Robust Monocular Depth Estimation Across Multiple Datasets
4367	--	4377	Jiacheng Wei, Guosheng Lin, Kim-Hui Yap, Fayao Liu, Tzu-Yi Hung. Dense Supervision Propagation for Weakly Supervised Semantic Segmentation on 3D Point Clouds
4378	--	4391	Zhong Wang 0009, Lin Zhang 0014, Shengjie Zhao, Yicong Zhou. Ct-LVI: A Framework Toward Continuous-Time Laser-Visual-Inertial Odometry and Mapping
4392	--	4406	Youjiang Yu, Kaibing Zhang, Xiaohua Wang, Nannan Wang 0001, Xinbo Gao 0001. An Adaptive Region Proposal Network With Progressive Attention Propagation for Tiny Person Detection From UAV Images
4407	--	4420	Jun-Bo Zhang, Wei Feng, Mengbiao Zhao, Fei Yin, Xu-Yao Zhang, Cheng-Lin Liu 0001. Video Text Detection With Robust Feature Representation
4421	--	4433	Guanyu Zhu, Yong Zhou 0003, Rui Yao, Hancheng Zhu. Information Gap Narrowing for Point Cloud Few-Shot Segmentation
4434	--	4444	Dan Song 0006, Jianhao Zeng, Min Liu 0008, Xuanya Li, An-An Liu. Fashion Customization: Image Generation Based on Editing Clue
4445	--	4457	Hongyang Yu, Xin-Feng Zhang 0001, Yaowei Wang 0001, Qingming Huang, Baocai Yin. Multiple-Level Distillation for Video Fine-Grained Accident Detection
4458	--	4472	Neng Dong, Liyan Zhang 0001, Shuanglin Yan, Hao Tang 0007, Jinhui Tang 0001. Erasing, Transforming, and Noising Defense Network for Occluded Person Re-Identification
4473	--	4488	Weiyi Lv, Ning Zhang, Junjie Zhang 0002, Dan Zeng 0001. One-Shot Multiple Object Tracking With Robust ID Preservation
4489	--	4502	Zhongmou Ying, Xianfeng Yuan, Boyi Song, Yong Song, Fengyu Zhou, Weihua Sheng. Accurate and Efficient 3D Panoptic Mapping Using Diverse Information Modalities and Multidimensional Data Association
4503	--	4515	Haojie Li, Mingxuan Li, Qijie Peng, Shijie Wang, Hong Yu 0005, Zhihui Wang 0001. Correlation-Guided Semantic Consistency Network for Visible-Infrared Person Re-Identification
4516	--	4527	Yi-Xing Peng, Yu-Ming Tang, Kun-Yu Lin, Wei-Shi Zheng 0001. Generalized Intra-Camera Supervised Person Re-Identification
4528	--	4541	Hao Chen, Yonghan Dong, Zhe-Ming Lu, Yunlong Yu, Jungong Han. Self-Prompting Perceptual Edge Learning for Dense Prediction
4542	--	4555	Qi Li, Dan Guo, Wei Qian, Xilan Tian, Xiao Sun 0003, Haifeng Zhao, Meng Wang 0001. Channel-Wise Interactive Learning for Remote Heart Rate Estimation From Facial Video
4556	--	4567	Zhengqi Liu, Yutian Lin, Tianyang Liu, Bo Du. Reliable Cross-Camera Learning in Random Camera Person Re-Identification
4568	--	4580	Songchun Zhang, Chunhui Zhao 0001. Cross-Video Contextual Knowledge Exploration and Exploitation for Ambiguity Reduction in Weakly Supervised Temporal Action Localization
4581	--	4595	Chuang Chen, Xiao Sun 0003, Zhengzheng Tu, Meng Wang 0001. AST-GCN: Augmented Spatial Temporal Graph Convolutional Neural Network for Gait Emotion Recognition
4596	--	4609	Yuankai Lin, Hua Yang 0002, Tao Cheng, Wending Zhou, Zhouping Yin. DySPN: Learning Dynamic Affinity for Image-Guided Depth Completion
4610	--	4624	Boxiang Yun, Baiying Lei, Jieneng Chen, Huiyu Wang, Song Qiu, Wei Shen 0002, Qingli Li, Yan Wang. SpecTr: Spectral Transformer for Microscopic Hyperspectral Pathology Image Segmentation
4625	--	4638	Jin Yang, Ping Wei 0001, Nanning Zheng 0001. Cross Time-Frequency Transformer for Temporal Action Localization
4639	--	4652	Peng Xing, Yanpeng Sun, Dan Zeng 0001, Zechao Li. Normal Image Guided Segmentation Framework for Unsupervised Anomaly Detection
4653	--	4667	Xing Nie, Bolin Ni, Jianlong Chang, Gaofeng Meng, Chunlei Huo, Shiming Xiang, Qi Tian 0001. Pro-Tuning: Unified Prompt Tuning for Vision Tasks
4668	--	4681	Yifan Zuo, Yaping Xu, Yifeng Zeng, Yuming Fang, Xiaoshui Huang, Jiebin Yan. 2 GSTran: Depth Map Super-Resolution via Asymmetric Attention With Guidance Selection
4682	--	4697	Kunqian Li, Hongtao Fan, Qi Qi, Chi Yan, Kun Sun 0002, Q. M. Jonathan Wu. TCTL-Net: Template-Free Color Transfer Learning for Self-Attention Driven Underwater Image Enhancement
4698	--	4712	Changshuo Wang 0001, Xin-ning, Weijun Li, Xiao Bai 0001, Xingyu Gao 0001. 3D Person Re-Identification Based on Global Semantic Guidance and Local Feature Aggregation
4713	--	4728	Yinyi Li, Liquan Shen, Mengyao Li, Zhengyong Wang, Lihao Zhuang. RUIESR: Realistic Underwater Image Enhancement and Super Resolution
4729	--	4744	Zhixi Feng, Shilin Tong, Shuyuan Yang, Xinyu Zhang, Licheng Jiao. Pseudo-Label-Assisted Subdomain Adaptation for Hyperspectral Image Classification
4745	--	4761	Fuya Luo, Shu-Lin Liu, Yijun Cao, Kai-Fu Yang, Chang-Yong Xie, Yong Liu, Yongjie Li 0001. Nighttime Thermal Infrared Image Colorization With Feedback-Based Object Appearance Learning
4762	--	4772	Guang-yong Chen, Wu-Ding Weng, Jian-Nan Su, Min Gan, C. L. Philip Chen. Dynamic Degradation Intensity Estimation for Adaptive Blind Super-Resolution: A Novel Approach and Benchmark Dataset
4773	--	4785	Xiaomei Feng, Qi Jia 0001, Zikun Zhao, Yu Liu 0012, Xinwei Xue, Xin Fan 0001. Edge-Aware Correlation Learning for Unsupervised Progressive Homography Estimation
4786	--	4799	Ping Kong, An Li, Daidou Guo, Liang Zhou, Chuan Qin 0001. Joint Lossless Compression and Encryption for Medical Images
4800	--	4816	Chenyang Shi, Yuzhen Li, Ningfang Song, Boyi Wei, Yibo Zhang, Wenzhuo Li, Jing Jin. Identifying Light Interference in Event-Based Vision
4817	--	4828	Shaokai Liu, Hao Feng, Wengang Zhou. Rethinking Supervision in Document Unwarping: A Self-Consistent Flow-Free Approach
4829	--	4842	Haonan Zhang, Pengpeng Zeng, Lianli Gao, Xinyu Lyu, Jingkuan Song, Heng Tao Shen. SPT: Spatial Pyramid Transformer for Image Captioning
4843	--	4856	Jie Fu, Junyu Gao 0002, Bing-Kun Bao, Changsheng Xu. Multimodal Imbalance-Aware Gradient Modulation for Weakly-Supervised Audio-Visual Video Parsing
4857	--	4873	Hui Luo, Zhuangwei Zhuang, Yuanqing Li 0001, Mingkui Tan, Cen Chen, Jianlin Zhang. Toward Compact and Robust Model Learning Under Dynamically Perturbed Environments
4874	--	4886	Weijia Wu 0001, YuZhong Zhao, Zhuang Li, Lianlei Shan, Hong Zhou, Mike Zheng Shou. Continual Learning for Image Segmentation With Dynamic Query
4887	--	4898	Chaoran Cui, Fan'an Meng, Chunyun Zhang, Ziyi Liu, Lei Zhu 0002, Shuai Gong, Xue Lin. Adversarial Source Generation for Source-Free Domain Adaptation
4899	--	4913	Kenghong Lin, Xutao Li, Yunming Ye, Shanshan Feng, Baoquan Zhang, Guangning Xu, Ziye Wang. Spherical Neural Operator Network for Global Weather Prediction
4914	--	4927	Jingfan Tan, Xiaoxu Chen, Tao Wang 0052, Kaihao Zhang, Wenhan Luo, Xiaochun Cao. Blind Face Restoration for Under-Display Camera via Dictionary Guided Transformer
4928	--	4941	Guangfei Li, Quanxue Gao, Jungong Han, Xinbo Gao 0001. A Coarse-to-Fine Cell Division Approach for Hyperspectral Remote Sensing Image Classification
4942	--	4956	Aiping Huang, Lijian Li, Le Zhang 0001, Yuzhen Niu, Tiesong Zhao, Chia-Wen Lin. Multi-View Graph Embedding Learning for Image Co-Segmentation and Co-Localization
4957	--	4972	Yongcheng Cui, Guohui Tian, Zhengsong Jiang, Mengyang Zhang, Yu Gu, Yifei Wang. An Active Task Cognition Method for Home Service Robot Using Multi-Graph Attention Fusion Mechanism
4973	--	4988	Si Chen 0002, Hui Da, Da-Han Wang, Xu-Yao Zhang, Yan Yan 0001, Shunzhi Zhu. HASI: Hierarchical Attention-Aware Spatio-Temporal Interaction for Video-Based Person Re-Identification
4989	--	5001	Guanghui Wu, Hao Liu, Longguang Wang, Kunhong Li 0001, Yulan Guo, Zengping Chen. Self-Supervised Multi-Frame Monocular Depth Estimation for Dynamic Scenes
5002	--	5017	Xincong Liu, Tingfa Xu, Ying Wang, Zhinong Yu, Xiaoying Yuan, Haolin Qin, Jianan Li. BACTrack: Building Appearance Collection for Aerial Tracking
5018	--	5032	Jun Tang, Chenyan Lu, Zhengxue Liu, Jiale Li, Hang Dai, Yong Ding 0003. CTVSR: Collaborative Spatial-Temporal Transformer for Video Super-Resolution
5033	--	5048	Ziwen Li, Yuanjie Shao, Feng Zhang, Jinpu Zhang, Yuehuan Wang, Nong Sang. Difficulty-Aware Dynamic Network for Lightweight Exposure Correction
5049	--	5062	Ping Li 0006, Yu Zhang, Li Yuan, Jian Zhao, Xianghua Xu, Xiaoqin Zhang. Adversarial Attacks on Video Object Segmentation With Hard Region Discovery
5063	--	5076	Huiwen Ren, Zetian Song, Liang Wei, Danni Wang, Yi Luo, Dongping Pan, Yucheng Sun, Haitao Yang 0001, Fangdong Chen, Shanshe Wang, Siwei Ma, Wen Gao 0001. A Novel Visually-Lossless Compression Model for Low-Latency Interaction
5077	--	5090	Ziqiang Zheng, Hao Ren 0002, Yang Wu 0001, WeiChuan Zhang, Hong Lu 0001, Yang Yang 0002, Heng Tao Shen. Fully Unsupervised Domain-Agnostic Image Retrieval
5091	--	5103	Songlian Li, Min Hu, Xiongwu Xiao, Zhigang Tu 0001. Patch Similarity Self-Knowledge Distillation for Cross-View Geo-Localization
5104	--	5117	Yongguo Ling, Zhun Zhong, Zhiming Luo, Shaozi Li, Nicu Sebe. Bridge Gap in Pixel and Feature Level for Cross-Modality Person Re-Identification
5118	--	5131	Yongxin Wang 0001, Yu-Wei Zhan, Zhen-Duo Chen, Xin Luo 0006, Xin-Shun Xu. Multiple Information Embedded Hashing for Large-Scale Cross-Modal Retrieval
5132	--	5145	Min Cao, Yang Bai, Ziqiang Cao, Liqiang Nie, Min Zhang 0005. Efficient Image-Text Retrieval via Keyword-Guided Pre-Screening
5146	--	5159	Minqiang Yang, Yujie Gao, Longzhe Tang, Jian Hou 0012, Bin Hu 0001. Wearable Eye-Tracking System for Synchronized Multimodal Data Acquisition
5160	--	5175	Penggang Qin, Shiwei Wu, Tong Xu 0001, Yanbin Hao, Fuli Feng, Chen Zhu, Enhong Chen. When I Fall in Love: Capturing Video-Oriented Social Relationship Evolution via Attentive GNN
5176	--	5190	Zhiying Song, Pengfei Wang, Jinrun Zhou, Zongxin Yang, Yi Yang, Zhefeng Gong, Nenggan Zheng. MuscleParseNet: A Novel Framework for Parsing Muscles of Drosophila Larva in Light-Sheet Fluorescence Microscopy Images
5191	--	5206	Hao Wang 0060, Jinwei Wang, Jiawei Zhang, Xiangyang Luo, Bin Ma 0003, Bin Li 0011, Jinsheng Sun. General Forensics for Aligned Double JPEG Compression Based on the Quantization Interference
5207	--	5212	Rui Zhao 0010, Ruiqin Xiong, Jian Zhang 0018, Zhaofei Yu, Shuyuan Zhu, Lei Ma 0008, Tiejun Huang 0001. Spike Camera Image Reconstruction Using Deep Spiking Neural Networks

3063	--	3066	Dong Liu 0002, Shan Liu 0001, João Ascenso, Dong Tian, Lu Yu 0003. Guest Editorial Special Section on Recent Standardization Efforts for Learning-Based Visual Data Coding
3067	--	3081	Zhaobin Zhang, Semih Esenlik, Yaojun Wu, Meng Wang 0017, Kai Zhang 0007, Li Zhang 0006. End-to-End Learning-Based Image Compression With a Decoupled Framework
3082	--	3095	Junqi Shi, Ming Lu, Zhan Ma. Rate-Distortion Optimized Post-Training Quantization for Learned Image Compression
3096	--	3110	Chuanmin Jia, Feng Ye, Fanke Dong, Kai Lin, Leonardo Chiariglione, Siwei Ma, Huifang Sun, Wen Gao 0001. MPAI-EEV: Standardization Efforts of Artificial Intelligence Based End-to-End Video Coding
3111	--	3124	Jianghao Jia, Yuantong Zhang, Han Zhu, Zhenzhong Chen, Zizheng Liu, Xiaozhong Xu, Shan Liu 0001. Deep Reference Frame Generation Method for VVC Inter Prediction Enhancement
3125	--	3137	Dongmei Xue, Li Li 0040, Dong Liu 0002, Houqiang Li. Lightweight Context Model Equipped aiWave in Response to the AVS Call for Evidence on Volumetric Medical Image Coding
3138	--	3155	SooWoong Kim, Jihoon Do, Jungwon Kang, Hui-Yong Kim. Rate-Rendering Distortion Optimized Preprocessing for Texture Map Compression of 3D Reconstructed Scenes
3156	--	3167	Yeongwoong Kim, Hyewon Jeong, Janghyun Yu, Younhee Kim, Jooyoung Lee 0004, Seyoon Jeong, Hui-Yong Kim. End-to-End Learnable Multi-Scale Feature Compression for VCM
3168	--	3179	Yunjian Feng, Kunyang Zhou, Jun Li 0011, MengChu Zhou. Incremental Learning-Based Lane Detection for Automated Rubber-Tired Gantries in a Container Terminal
3180	--	3191	Yongli Hu, Lincong Feng, Huajie Jiang, Mengting Liu, Baocai Yin. Domain-Aware Prototype Network for Generalized Zero-Shot Learning
3192	--	3203	Xiaoqin Zhang 0002, Min Li, Sheng Lin, Hang Xu, Guobao Xiao. Transformer-Based Multimodal Emotional Perception for Dynamic Facial Expression Recognition in the Wild
3204	--	3219	Jiaqi Wang, Huafeng Liu 0001, Liping Jing. Transparent Embedding Space for Interpretable Image Recognition
3220	--	3231	Zhen Mei, Peng Ye, Baopu Li, Tao Chen 0003, Jiayuan Fan, Wanli Ouyang. DeNKD: Decoupled Non-Target Knowledge Distillation for Complementing Transformer-Based Unsupervised Domain Adaptation
3232	--	3244	Ziheng Yan, Yuankai Qi, Guorong Li, Xinyan Liu, Weigang Zhang, Ming-Hsuan Yang 0001, Qingming Huang. Progressive Multi-Resolution Loss for Crowd Counting
3245	--	3259	Dongliang Zhou, Haijun Zhang 0002, Jianghong Ma, Jianyang Shi. BC-GAN: A Generative Adversarial Network for Synthesizing a Batch of Collocated Clothing
3260	--	3270	Lu Zhou, Yingying Chen 0003, Jinqiao Wang. Dual-Path Transformer for 3D Human Pose Estimation
3271	--	3285	Danyang Tu, Wei Shen 0002, Wei Sun 0029, Xiongkuo Min, Guangtao Zhai, Changwen Chen. Un-Gaze: A Unified Transformer for Joint Gaze-Location and Gaze-Object Detection
3286	--	3298	Guanghui Yue 0001, Houlu Xiao, Hai Xie, Tianwei Zhou, Wei Zhou 0021, Weiqing Yan, Baoquan Zhao, Tianfu Wang 0001, Qiuping Jiang. Dual-Constraint Coarse-to-Fine Network for Camouflaged Object Detection
3299	--	3312	Yuting Mou, Xinghao Jiang, Ke Xu 0003, Tanfeng Sun, Zepeng Wang 0002. Compressed Video Action Recognition With Dual-Stream and Dual-Modal Transformer
3313	--	3326	Yutong Liu, Zhen Cheng, Zeyu Xiao, Zhiwei Xiong. Light Field Super-Resolution Using Decoupled Selective Matching
3327	--	3339	Congqi Cao, Yizhe Wang, Yueran Zhang, Yue Lu, Xin Zhang, Yanning Zhang. Co-Occurrence Matters: Learning Action Relation for Temporal Action Localization
3340	--	3352	Yadang Chen, Dingwei Zhang, Yuhui Zheng, Zhi-Xin Yang 0001, Enhua Wu, Haixing Zhao. Boosting Video Object Segmentation via Robust and Efficient Memory Network
3353	--	3367	Zheng'ao Wang, Zikun Zhou, Fanglin Chen 0001, Jun Xu, Wenjie Pei, Guangming Lu. Robust Tracking via Fully Exploring Background Prior Knowledge
3368	--	3382	Dongpan Chen, Dehui Kong, Jinghua Li, Lichun Wang 0002, Junna Gao, Baocai Yin. OASNet: Object Affordance State Recognition Network With Joint Visual Features and Relational Semantic Embeddings
3383	--	3394	Xianlun Tang, Qiao Yang, Xi Zhang, Wuquan Deng, Huiming Wang 0002, Xinbo Gao 0001. A Refinement Method for Single-Stage Object Detection Based on Progressive Decoupled Task Alignment
3395	--	3408	Zeyu Ma, Ziqiang Zheng, Jiwei Wei, Yang Yang 0002, Heng Tao Shen. Instance-Dictionary Learning for Open-World Object Detection in Autonomous Driving Scenarios
3409	--	3423	Peirong Ma, Zhiquan He, Wu Ran, Hong Lu 0001. A Transferable Generative Framework for Multi-Label Zero-Shot Learning
3424	--	3438	Xiaoqiang Shi, Zhenyu Yin, Guangjie Han, Wenzhuo Liu, Li Qin, Yuanguo Bi, Shurui Li. BSSNet: A Real-Time Semantic Segmentation Network for Road Scenes Inspired From AutoEncoder
3439	--	3450	Daoheng Li, Xiushan Nie, Rui Gong, Ximing Lin, Hui Yu 0001. Multi-Branch GAN-Based Abnormal Events Detection via Context Learning in Surveillance Videos
3451	--	3464	Guoqiang Liang, Zhaojie Chen, Zhaoqiang Chen, Shiyu Ji, Yanning Zhang. New Insights on Relieving Task-Recency Bias for Online Class Incremental Learning
3465	--	3480	Liuchi Xu, Jin Ren, Zhenhua Huang 0001, Wei-Shi Zheng 0001, Yunwen Chen. Improving Knowledge Distillation via Head and Tail Categories
3481	--	3495	Xin Ding, Zheng Wang, Jing Fang, Zhenyu Shu, Ruimin Hu, Chia-Wen Lin. Watch You Under Low-Resolution and Low-Illumination: Face Enhancement via Bi-Factor Degradation Decoupling
3496	--	3509	Xiaowei Zhao, Yuqing Ma, Duorui Wang, Yifan Shen, Yixuan Qiao, Xianglong Liu 0001. Revisiting Open World Object Detection
3510	--	3522	Hao Sheng 0001, Shuai Wang 0027, Haobo Chen, Da Yang, Yang Huang, Jiahao Shen, Wei Ke 0001. Discriminative Feature Learning With Co-Occurrence Attention Network for Vehicle ReID
3523	--	3537	Bo Liu 0002, Peng Sun, Yanshan Xiao, Shilei Zhao, Xiaokai Li, Tiantian Peng, Zhiyu Zheng, Yongsheng Huang. Dictionary-Based Multi-View Learning With Privileged Information
3538	--	3550	Lihong Qiao, Shixin Wu, Bin Xiao 0002, Yucheng Shu, Xiao Luan, Sicheng Lu, Weisheng Li 0001, Xinbo Gao 0001. Boosting Robust Multi-Focus Image Fusion With Frequency Mask and Hyperdimensional Computing
3551	--	3562	Zhao Pei, Jiaqing Zhang, Wenwen Zhang, Miao Wang, Jianing Wang, Yee-Hong Yang. Autofocusing for Synthetic Aperture Imaging Based on Pedestrian Trajectory Prediction
3563	--	3575	Lanxiao Wang, Heqian Qiu, Benliu Qiu, Fanman Meng, Qingbo Wu 0001, Hongliang Li. TridentCap: Image-Fact-Style Trident Semantic Framework for Stylized Image Captioning
3576	--	3588	Siqi Lu, Fengxu Guan, Hanyu Zhang, Haitao Lai. Speed-Up DDPM for Real-Time Underwater Image Enhancement
3589	--	3605	Haiming Yao, Wenyong Yu, Wei Luo, Zhenfeng Qiang, Donghao Luo, Xiaotian Zhang. Learning Global-Local Correspondence With Semantic Bottleneck for Logical Anomaly Detection
3606	--	3618	Zhaokang Liao, Wengang Zhou, Houqiang Li. DaFIR: Distortion-Aware Representation Learning for Fisheye Image Rectification
3619	--	3632	Dengdi Sun, Leilei Cheng, Song Chen, Chenglong Li 0002, Yun Xiao, Bin Luo 0001. UAV-Ground Visual Tracking: A Unified Dataset and Collaborative Learning Approach
3633	--	3646	Sheng Liu, Jinsong Leng, Xi-Le Zhao, Haijin Zeng, Yao Wang 0003, Jing-Hua Yang. Learnable Spatial-Spectral Transform-Based Tensor Nuclear Norm for Multi-Dimensional Visual Data Recovery
3647	--	3662	Yuanfei Huang, Jie Li 0001, Yanting Hu, Hua Huang 0001, Xinbo Gao 0001. Deep Convolution Modulation for Image Super-Resolution
3663	--	3673	Jin Liu 0018, Guoxiang Wang, Jialong Xie, Fengyu Zhou, Huijuan Xu 0001. Video Question Answering With Semantic Disentanglement and Reasoning
3674	--	3686	Jie Geng, Shuai Song, Wen Jiang 0002. Dual-Path Feature Aware Network for Remote Sensing Image Semantic Segmentation
3687	--	3699	Zheng Xie, Rui Guo, Chencheng Zhang, Xiaohua Qian. A Clinically Guided Graph Convolutional Network for Assessment of Parkinsonian Pronation-Supination Movements of Hands
3700	--	3713	Wei Wu 0019, Hao Chang, Zhu Li 0001. See SIFT in a Rain
3714	--	3727	Huan Chen, Wangcai Zhao, Tingfa Xu, Guokai Shi, Shiyun Zhou, Peifu Liu, Jianan Li. Spectral-Wise Implicit Neural Representation for Hyperspectral Image Reconstruction
3728	--	3741	Jie Wen 0001, Gehui Xu, Zhanyan Tang, Wei Wang 0169, Lunke Fei, Yong Xu 0001. Graph Regularized and Feature Aware Matrix Factorization for Robust Incomplete Multi-View Clustering
3742	--	3754	Zhaoxin Liu, Jinjian Wu, Guangming Shi, Wen Yang, Weisheng Dong, Qinghang Zhao. Motion-Oriented Hybrid Spiking Neural Networks for Event-Based Motion Deblurring
3755	--	3767	Kaihao Zhang, Tao Wang 0052, Wenhan Luo, Wenqi Ren, Björn Stenger, Wei Liu 0005, Hongdong Li, Ming-Hsuan Yang 0001. MC-Blur: A Comprehensive Benchmark for Image Deblurring
3768	--	3781	Zhenghao Wang, Jing Lian, Linhui Li, Jian Zhao 0029. A Novel Framework for Scene Graph Generation via Prior Knowledge
3782	--	3794	Yonghui Wang, Wengang Zhou, Yunyao Mao, Houqiang Li. Detect Any Shadow: Segment Anything for Video Shadow Detection
3795	--	3805	JunBin Yuan, Aiqing Zhu, Qingzhen Xu, Kanoksak Wattanachote, Yongyi Gong. CTIF-Net: A CNN-Transformer Iterative Fusion Network for Salient Object Detection
3806	--	3818	QiHao Zhao, Fan Zhang 0007, Wei Hu, Songhe Feng, Jun Liu 0036. OHD: An Online Category-Aware Framework for Learning With Noisy Labels Under Long-Tailed Distribution
3819	--	3833	Mengru Ma, Wenping Ma 0001, Licheng Jiao, Xu Liu 0006, Fang Liu 0001, Lingling Li 0002, Shuyuan Yang. MBSI-Net: Multimodal Balanced Self-Learning Interaction Network for Image Classification
3834	--	3845	Guanghui Yue 0001, Jie Gao, Runmin Cong, Tianwei Zhou, Leida Li, Tianfu Wang 0001. Deep Pyramid Network for Low-Light Endoscopic Image Enhancement
3846	--	3859	Zhong Wang 0009, Lin Zhang 0014, Shengjie Zhao, Yicong Zhou. Global Localization in Large-Scale Point Clouds via Roll-Pitch-Yaw Invariant Place Recognition and Low-Overlap Global Registration
3860	--	3875	Bolei Chen, Jiaxu Kang, Ping Zhong 0002, Yongzheng Cui, Siyi Lu, Yixiong Liang, Jianxin Wang 0001. Think Holistically, Act Down-to-Earth: A Semantic Navigation Strategy With Continuous Environmental Representation and Multi-Step Forward Planning
3876	--	3890	Jianqi Chen, Yilan Zhang, Zhengxia Zou, Keyan Chen, Zhenwei Shi. Dense Pixel-to-Pixel Harmonization via Continuous Image Representation
3891	--	3904	Jiayin Sun, Hong Wang, Qiulei Dong. Hierarchical Attention Network for Open-Set Fine-Grained Image Recognition
3905	--	3918	Chunjie Ma, Lina Du, Li Zhuo 0001, Jiafeng Li. MPLA-Net: Multiple Pseudo Label Aggregation Network for Weakly Supervised Video Salient Object Detection
3919	--	3929	Jinsong Zhang, Lingfeng Gu, Yu-Kun Lai, Xueyang Wang, Kun Li 0001. Toward Grouping in Large Scenes With Occlusion-Aware Spatio-Temporal Transformers
3930	--	3942	Wujie Zhou, Jiankang Hong, Weiqing Yan, Qiuping Jiang. Modal Evaluation Network via Knowledge Distillation for No-Service Rail Surface Defect Detection
3943	--	3956	Hongping Gan, Xiaoyang Wang, Lijun He, Jie Liu. Learned Two-Step Iterative Shrinkage Thresholding Algorithm for Deep Compressive Sensing
3957	--	3970	Qi Zhu 0010, Naishan Zheng, Jie Huang 0017, Man Zhou, Jinghao Zhang, Feng Zhao 0004. Learning Spatio-Temporal Sharpness Map for Video Deblurring
3971	--	3982	Qinglong Cao, Yuntian Chen, Chao Ma 0004, Xiaokang Yang. Break the Bias: Delving Semantic Transform Invariance for Few-Shot Segmentation
3983	--	3997	Biao Wang, Wenling Li, Bin Zhang 0023, Yang Liu 0096, Junping Du. Correlation Filters for UAV Online Tracking Based on Complementary Appearance Model and Reversibility Reasoning
3998	--	4010	Ying Yang, Tao Xiang 0001, Xiao Lv, Shangwei Guo, Tieyong Zeng. The Illusion of Visual Security: Reconstructing Perceptually Encrypted Images
4011	--	4026	Qingsen Yan, Tao Hu, Yuan Sun, Hao Tang 0005, Yu Zhu 0004, Wei Dong, Luc Van Gool, Yanning Zhang. Toward High-Quality HDR Deghosting With Conditional Diffusion Models
4027	--	4039	Jiancong Chen, Meng Wang 0017, Pingping Zhang, Shurun Wang, Shiqi Wang 0001. Sparse-to-Dense: High Efficiency Rate Control for End-to-End Scale-Adaptive Video Coding
4040	--	4053	Cunhui Dong, Haichuan Ma, Zhuoyuan Li, Li Li 0040, Dong Liu 0002. Temporal Wavelet Transform-Based Low-Complexity Perceptual Quality Enhancement of Compressed Video
4054	--	4069	Zheng Fang, MingKui Zheng, Pingping Chen, Zhifeng Chen, Dapeng Oliver Wu. Camera Pose-Based Background Modeling for Video Coding in Moving Cameras
4070	--	4083	Birendra Kathariya, Zhu Li 0001, Geert Van Der Auwera. Joint Pixel and Frequency Feature Learning and Fusion via Channel-Wise Transformer for High-Efficiency Learned In-Loop Filter in VVC
4084	--	4094	Binzhe Li, Bolin Chen, Zhao Wang 0004, Baoliang Chen, Shiqi Wang 0001, Yan Ye. Quality Harmonization for Virtual Composition in Online Video Communications
4095	--	4108	Hu Cao, Lei Huang 0010, Jie Nie, Zhiqiang Wei 0002. Unsupervised Deep Hashing With Fine-Grained Similarity-Preserving Contrastive Learning for Image Retrieval
4109	--	4119	Zailong Chen, Lei Wang 0001, Peng Wang 0023, Peng Gao. Question-Aware Global-Local Video Understanding Network for Audio-Visual Question Answering
4120	--	4134	Yang Yang 0045, Peiling Wen, Wenbo Ye, Beichen Li, Yue Lang. Blind Universal Denoising for Radar Micro-Doppler Spectrograms Using Identical Dual Learning and Reciprocal Adversarial Training
4135	--	4140	Zhen Yang, Yuanfang Guo, Junfu Wang, Di Huang 0001, Xiuguo Bao, Yunhong Wang. Towards Video Anomaly Detection in the Real World: A Binarization Embedded Weakly-Supervised Network

1983	--	1999	Jianwu Fang, Jiahuan Qiao, Jianru Xue, Zhengguo Li. Vision-Based Traffic Accident Detection and Anticipation: A Survey
2000	--	2009	Aqi Gao, Yanwei Pang, Jing Nie, Zhuang Shao, Jiale Cao, Yishun Guo, Xuelong Li 0001. ESGN: Efficient Stereo Geometry Network for Fast 3D Object Detection
2010	--	2025	Zan Gao, Peng Chen, Tao Zhuo, Meng Liu 0006, Lei Zhu 0002, Meng Wang 0001, Shengyong Chen. A Semantic Perception and CNN-Transformer Hybrid Network for Occluded Person Re-Identification
2026	--	2040	Shenghao Li, Zeyang Xia, Qunfei Zhao. Representing Boundary-Ambiguous Scene Online With Scale-Encoded Cascaded Grids and Radiance Field Deblurring
2041	--	2055	Yuxin Chen, Ziqi Zhang, Zhongang Qi, Chunfeng Yuan, Jie Wang, Ying Shan, Bing Li 0001, Weiming Hu, Xiaohu Qie, Jianping Wu. DARTScore: DuAl-Reconstruction Transformer for Video Captioning Evaluation
2056	--	2069	Guanzhou Ke, Guoqing Chao, Xiaoli Wang, Chenyang Xu, Yongqi Zhu, Yang Yu. A Clustering-Guided Contrastive Fusion for Multi-View Representation Learning
2070	--	2082	Yueming Lyu, Yue Jiang, Bo Peng 0002, Jing Dong 0003. InfoStyler: Disentanglement Information Bottleneck for Artistic Style Transfer
2083	--	2096	Hao Li, Di-Hua Zhai, Yuanqing Xia. ERDUnet: An Efficient Residual Double-Coding Unet for Medical Image Segmentation
2097	--	2111	Yanfeng Wang, Lv Tang, Yijie Zhong, Bo Li 0115. From Composited to Real-World: Transformer-Based Natural Image Matting
2112	--	2124	Daikun Liu, Teng Wang, Changyin Sun. Voxel-Based Multi-Scale Transformer Network for Event Stream Processing
2125	--	2135	Yaozong Zheng, Bineng Zhong, Qihua Liang, Guorong Li, Rongrong Ji, Xianxian Li. Toward Unified Token Learning for Vision-Language Tracking
2136	--	2150	Lili Liu, Zhaoqiang Xia, Xiaobiao Zhang, Jinye Peng, Xiaoyi Feng, Guoying Zhao 0001. Information-Enhanced Network for Noncontact Heart Rate Estimation From Facial Videos
2151	--	2165	Yingbo Tang, Zhiqiang Cao, Yuequan Yang, Jierui Liu, Junzhi Yu. Semi-Supervised Few-Shot Object Detection via Adaptive Pseudo Labeling
2166	--	2178	Xiaojia Zhao, Qiangqiang Shen, Yongyong Chen, Yongsheng Liang, Junxin Chen, Yicong Zhou. Self-Completed Bipartite Graph Learning for Fast Incomplete Multi-View Clustering
2179	--	2194	Lian Wu, Chao Huang 0008, Lunke Fei, Shuping Zhao, Jianchuan Zhao, Zhongwei Cui, Yong Xu 0001. Video-Based Fall Detection Using Human Pose and Constrained Generative Adversarial Network
2195	--	2208	Yuandong Li, Qinglei Hu, Zhenchao Ouyang, Shuhan Shen. Neural Reflectance Decomposition Under Dynamic Point Light
2209	--	2222	Wei Cong, Yang Cong, Gan Sun, Yuyang Liu, Jiahua Dong 0001. Self-Paced Weight Consolidation for Continual Learning
2223	--	2234	Lixiong Qin, Mei Wang, Chao Deng, Ke Wang, Xi Chen, Jiani Hu, Weihong Deng. SwinFace: A Multi-Task Transformer for Face Recognition, Expression Recognition, Age Estimation and Attribute Estimation
2235	--	2248	Bingtao Ma, Yang Cong, Yu Ren. IOSL: Incremental Open Set Learning
2249	--	2260	Yinyuan Wang, Haowen Du, Zhuo Cheng, Changxin Gao, Longsheng Wei, Bin Fang, Fei Xiao, Dapeng Luo. KRRNet: Keypoint Relational Regression Network for Bottom-Up Anchor-Free Object Detection
2261	--	2273	Shansi Zhang, Nan Meng, Edmund Y. Lam. Unsupervised Light Field Depth Estimation via Multi-View Feature Matching With Occlusion Prediction
2274	--	2288	Haomin Liu, Linsheng Zhao, Zhen Peng, Weijian Xie, Mingxuan Jiang, Hongbin Zha, Hujun Bao, Guofeng Zhang 0001. A Low-Cost and Scalable Framework to Build Large-Scale Localization Benchmark for Augmented Reality
2289	--	2303	Yu Ran, Weijia Wang, Mingjie Li 0004, Lin-Cheng Li, Yuan-Gen Wang, Jin Li 0002. Cross-Shaped Adversarial Patch Attack
2304	--	2317	Hengmin Zhang, Bihan Wen, Zhiyuan Zha, Bob Zhang 0001, Yang Tang, Guo Yu 0001, Wenli Du. Accelerated PALM for Nonconvex Low-Rank Matrix Recovery With Theoretical Analysis
2318	--	2331	Yusheng Peng, Gaofeng Zhang, Jun Shi 0006, Xiangyu Li, Liping Zheng. MRGTraj: A Novel Non-Autoregressive Approach for Human Trajectory Prediction
2332	--	2345	Yu Qiu, Yun Liu 0011, Le Zhang 0001, Haotian Lu, Jing Xu. Boosting Salient Object Detection With Transformer-Based Asymmetric Bilateral U-Net
2346	--	2360	Yang Yang, Qiang Zhang 0020. Finding Camouflaged Objects Along the Camouflage Mechanisms
2361	--	2373	Guodong Du 0005, Liyan Zhang 0001. Enhanced Invariant Feature Joint Learning via Modality-Invariant Neighbor Relations for Cross-Modality Person Re-Identification
2374	--	2384	Kangkai Zhang, Shiming Ge, Ruixin Shi, Dan Zeng 0001. Low-Resolution Object Recognition With Cross-Resolution Relational Contrastive Distillation
2385	--	2398	Lu Zou, Zhangjin Huang, Naijie Gu, Guoping Wang. GPT-COPE: A Graph-Guided Point Transformer for Category-Level Object Pose Estimation
2399	--	2413	Junxing Hu, Hongwen Zhang 0001, Yunlong Wang 0003, Min Ren, Zhenan Sun. Personalized Graph Generation for Monocular 3D Human Pose and Shape Estimation
2414	--	2425	Shaoyu Zhang 0001, Chen Chen 0036, Qiong Xie, Haigang Sun, Fei Dong, Silong Peng. Distribution Unified and Probability Space Aligned Teacher-Student Learning for Imbalanced Visual Recognition
2426	--	2438	Kai Zeng, Hui Zhang 0023, Wei Wang, Yaonan Wang 0001, Jianxu Mao. Deep Stereo Network With MRF-Based Cost Aggregation
2439	--	2452	Linqing Zhao, Wenzhao Zheng, Yueqi Duan, Jie Zhou 0001, Jiwen Lu. SPTR: Structure-Preserving Transformer for Unsupervised Indoor Depth Completion
2453	--	2468	Fei Wang, Jun Cheng 0002. HQDec: Self-Supervised Monocular Depth Estimation Based on a High-Quality Decoder
2469	--	2483	Weidong Zhang 0007, Ling Zhou, Peixian Zhuang, Guohou Li, Xipeng Pan, Wenyi Zhao, Chongyi Li. Underwater Image Enhancement via Weighted Wavelet Visual Perception Fusion
2484	--	2497	Zehong Zhou, Fei Zhou 0001, Guoping Qiu. Blind Image Quality Assessment Based on Separate Representations and Adaptive Interaction of Content and Distortion
2498	--	2511	Zhaoshuai Qi, Jingqi Pang, Yifeng Hao, Rui Hu, Yanning Zhang. A Minimal Solution for Sphere-Based Camera-Projector Pair Calibration
2512	--	2524	Yakun Ju, Muwei Jian, Cong Wang 0018, Cong Zhang, Junyu Dong, Kin-Man Lam 0001. Estimating High-Resolution Surface Normals via Low-Resolution Photometric Stereo Images
2525	--	2535	Xingning Dong, Qingpei Guo, Tian Gan, Qing Wang, Jianlong Wu, Xiangyuan Ren, Yuan Cheng, Wei Chu. 3: Shared Network Pre-Training and Significant Semantic Strengthening for Various Video-Text Tasks
2536	--	2549	Kaiwei Zhang, Dandan Zhu, Xiongkuo Min, Zhongpai Gao, Guangtao Zhai. Synergetic Assessment of Quality and Aesthetic: Approach and Comprehensive Benchmark Dataset
2550	--	2563	Lanqing Guo, Renjie Wan, Wenhan Yang, Alex C. Kot, Bihan Wen. Cross-Image Disentanglement for Low-Light Enhancement in Real World
2564	--	2576	Xingyu Miao, Yang Bai, Haoran Duan, Yawen Huang, Fan Wan, Xinxing Xu, Yang Long 0001, Yefeng Zheng 0001. DS-Depth: Dynamic and Static Depth Estimation via a Fusion Cost Volume
2577	--	2590	Yuan Rao, Wenjie Liu, Kunqian Li, Hao Fan, Sen Wang 0002, Junyu Dong. Deep Color Compensation for Generalized Underwater Image Enhancement
2591	--	2603	Jingyang Ye, Erzhen Pan, Wenfu Xu. Digital Video Stabilization Method Based on Periodic Jitters of Airborne Vision of Large Flapping Wing Robots
2604	--	2618	Yuanjian Qiao, Mingwen Shao, Leiquan Wang, Wangmeng Zuo. Learning Depth-Density Priors for Fourier-Based Unpaired Image Restoration
2619	--	2632	Ziying Song, Caiyan Jia, Lei Yang, Haiyue Wei, Lin Liu. GraphAlign++: An Accurate Feature Alignment by Graph Matching for Multi-Modal 3D Object Detection
2633	--	2647	Qinglin Liu, Shengping Zhang, Quanling Meng, Bineng Zhong, Peiqiang Liu, Hongxun Yao. End-to-End Human Instance Matting
2648	--	2662	Jing Li, Liu Yang, Qinghua Hu. Enhancing Multi-Source Open-Set Domain Adaptation Through Nearest Neighbor Classification With Self-Supervised Vision Transformer
2663	--	2676	Haojun Dai, Rangding Wang, Dawen Xu 0001, Songhan He, Lin Yang. HEVC Video Steganalysis Based on PU Maps and Multi-Scale Convolutional Residual Network
2677	--	2693	Hao Su, Xuefeng Liu 0001, Jianwei Niu 0002, Jiahe Cui, Ji Wan, Xinghao Wu, Nana Wang. MARVEL: Raster Gray-Level Manga Vectorization via Primitive-Wise Deep Reinforcement Learning
2694	--	2705	Weihao Zhao, Han Wu 0002, Weidong He, Haoyang Bi, Hao Wang 0076, Chen Zhu, Tong Xu 0001, Enhong Chen. Hierarchical Multi-Modal Attention Network for Time-Sync Comment Video Recommendation
2706	--	2718	Zhiqi Pang, Chunyu Wang, Lingling Zhao, Yang Liu 0006, Gaurav Sharma 0001. Cross-Modality Hierarchical Clustering and Refinement for Unsupervised Visible-Infrared Person Re-Identification
2719	--	2733	Yanshan Xiao, Jianwei Zhang, Bo Liu 0002, Liang Zhao, Xiangjun Kong, Zhifeng Hao. Multi-View Maximum Margin Clustering With Privileged Information Learning
2734	--	2748	Zhicheng Sheng, Liqiang Nie, Min Zhang 0005, Xiaojun Chang, Yan Yan 0002. Stochastic Latent Talking Face Generation Toward Emotional Expressions and Head Poses
2749	--	2762	Ying Fu 0001, Yang Hong, Yunhao Zou, Qiankun Liu, Yiming Zhang, Ning Liu, Chenggang Yan 0001. Raw Image Based Over-Exposure Correction Using Channel-Guidance Strategy
2763	--	2774	Bin Ma 0003, Zhongquan Tao, Ruihe Ma, Chunpeng Wang, Jian Li 0034, Xiaolong Li 0001. A High-Performance Robust Reversible Data Hiding Algorithm Based on Polar Harmonic Fourier Moments
2775	--	2788	Yunzuo Zhang, Yameng Liu, Weili Kang, Ran Tao 0003. VSS-Net: Visual Semantic Self-Mining Network for Video Summarization
2789	--	2802	Yi Xiao, Qiangqiang Yuan, Kui Jiang, Xianyu Jin, Jiang He, Liangpei Zhang 0001, Chia-Wen Lin. Local-Global Temporal Difference Learning for Satellite Video Super-Resolution
2803	--	2813	Xiaolong Liu, Yang Yu, Xiaolong Li 0001, Yao Zhao 0001. MCL: Multimodal Contrastive Learning for Deepfake Detection
2814	--	2831	Suhang Gu, Fu-Lai Chung, Shitong Wang 0001. A Novel Style Takagi-Sugeno-Kang Fuzzy Classifier With Its Fast Training on Style Data
2832	--	2844	Xiaogang Song, Fuqiang Guo, Lei Zhang 0081, Xiaofeng Lu, Xinhong Hei 0001. Salient Object Detection With Dual-Branch Stepwise Feature Fusion and Edge Refinement
2845	--	2860	Shengju Yu, Siwei Wang 0001, Yi Wen 0001, Ziming Wang, Zhigang Luo, En Zhu, Xinwang Liu 0002. How to Construct Corresponding Anchors for Incomplete Multiview Clustering
2861	--	2875	Zhiquan He, Wu Ran, Shulin Liu, Kehua Li, Jiawen Lu, Chang-Yong Xie, Yong Liu, Hong Lu 0001. Low-Light Image Enhancement With Multi-Scale Attention and Frequency-Domain Optimization
2876	--	2890	Mingxiu Li, Wei Yu 0002, Qinglin Liu, Zonglin Li, Ru Li 0002, Bineng Zhong, Shengping Zhang. Hybrid Transformers With Attention-Guided Spatial Embeddings for Makeup Transfer and Removal
2891	--	2907	Shaohui Li, Wenrui Dai, Yimian Fang, Ziyang Zheng, Wen Fei, Hongkai Xiong, Wei Zhang 0001. Revisiting Learned Image Compression With Statistical Measurement of Latent Representations
2908	--	2921	Mu-Jung Chen, Yi-Hsin Chen, Wen-Hsiao Peng. B-CANF: Adaptive B-Frame Coding With Conditional Augmented Normalizing Flows
2922	--	2933	Dongmei Xue, Haichuan Ma, Li Li 0040, Dong Liu 0002, Zhiwei Xiong, Houqiang Li. DBVC: An End-to-End 3-D Deep Biomedical Video Coding Framework
2934	--	2948	Dongyi Zhang, Feng Li 0037, Man Liu, Runmin Cong, Huihui Bai 0001, Meng Wang 0001, Yao Zhao 0001. Exploring Resolution Fields for Scalable Image Compression With Uncertainty Guidance
2949	--	2958	Jing Zhang, Yonghong Hou, Zhaoqing Pan, Bo Peng 0007, Nam Ling, Jianjun Lei. SWGNet: Step-Wise Reference Frame Generation Network for Multiview Video Coding
2959	--	2972	Shenshen Li, Xing Xu 0001, Xun Jiang, Fumin Shen, Xin Liu 0011, Heng Tao Shen. Multi-Grained Attention Network With Mutual Exclusion for Composed Query-Based Image Retrieval
2973	--	2988	Kun Zhang 0040, Bo Hu, Huatian Zhang, Zhe Li, Zhendong Mao. Enhanced Semantic Similarity Learning Framework for Image-Text Matching
2989	--	3002	Zhikai Hu, Yiu-ming Cheung, Mengke Li, Weichao Lan, Donglin Zhang, Qiang Liu 0018. Joint Semantic Preserving Sparse Hashing for Cross-Modal Retrieval
3003	--	3016	Meng Liu 0006, Di Zhou, Jie Guo, Xin Luo 0006, Zan Gao, Liqiang Nie. Semantic-Aware Contrastive Learning With Proposal Suppression for Video Semantic Role Grounding
3017	--	3029	Qing Li 0018, Changqing Zhang, Qinghua Hu, Pengfei Zhu 0001, Huazhu Fu, Lei Chen 0011. Stabilizing Multispectral Pedestrian Detection With Evidential Hybrid Fusion
3030	--	3042	Hang Shao, Lei Luo 0001, Jianjun Qian, Shuo Chen, Chuanfei Hu, Jian Yang 0003. TranPhys: Spatiotemporal Masked Transformer Steered Remote Photoplethysmography Estimation
3043	--	3048	Yizhuo Song, Pengyang Zhao, Siqi Wang, Qingmin Liao, Wenming Yang. Study of 3D Finger Vein Biometrics on Imaging Device Design and Multi-View Verification
3049	--	3055	Xiang Gao 0009, Hainan Cui, Wantao Huang, Menghan Li, Shuhan Shen. IRAv3+: Hierarchical Incremental Rotation Averaging via Multiple Connected Dominating Sets
3056	--	3060	Tianshu Chu, Zuopeng Yang, Xiaolin Huang. Improving the Post-Training Neural Network Quantization by Prepositive Feature Quantization

1322	--	1338	Ting Yu 0002, Xiaojun Lin, Shuhui Wang, Weiguo Sheng, Qingming Huang, Jun Yu 0002. A Comprehensive Survey of 3D Dense Captioning: Localizing and Describing Objects in 3D Scenes
1339	--	1351	Guangxing Han, Xuan Zhang 0006, Chongrong Li. One-Shot Unsupervised Cross-Domain Person Re-Identification
1352	--	1363	Fanfan Ji, Yunpeng Chen, Luoqi Liu, Xiao-Tong Yuan. Cross-Domain Few-Shot Classification via Dense-Sparse-Dense Regularization
1364	--	1375	Jiaxin Ye, Bineng Zhong, Qihua Liang, Shengping Zhang, Xianxian Li, Rongrong Ji. Positive-Sample-Free Object Tracking via a Soft Constraint
1376	--	1387	Yuhe Ding, Jian Liang, Bo Jiang 0002, Aihua Zheng, Ran He 0001. MAPS: A Noise-Robust Progressive Learning Approach for Source-Free Domain Adaptive Keypoint Detection
1388	--	1402	Shukai Wu, Xiao Yan, Weiming Liu 0005, Shuchang Xu, Sanyuan Zhang. Self-Driven Dual-Path Learning for Reference-Based Line Art Colorization Under Limited Data
1403	--	1412	Dongdong Zhao 0002, Hongli Li, Shi Yan 0002. Spatial-Temporal Synchronous Transformer for Skeleton-Based Hand Gesture Recognition
1413	--	1426	Yi Shi, Shixuan Zhao 0001, Jiang Wu, Zhangbi Wu, Hongmei Yan. Fixated Object Detection Based on Saliency Prior in Traffic Scenes
1427	--	1440	Chengxu Liu, Yaru Zhang, Yao Xue, Xueming Qian. AJENet: Adaptive Joints Enhancement Network for Abnormal Behavior Detection in Office Scenario
1441	--	1455	Yaotao Xiahou, Ning Li, Xiaochao Li. Identity Consistency Multi-Viewpoint Generative Aggregation for Person Re-Identification
1456	--	1468	Tianrui Shen, Yingmei Wei, Lai Kang, Shanshan Wan, Yee-Hong Yang. MCCG: A ConvNeXt-Based Multiple-Classifier Method for Cross-View Geo-Localization
1469	--	1480	Peggy Tang, Kun Hu, Lei Zhang 0001, Jiebo Luo, Zhiyong Wang 0001. TLDW: Extreme Multimodal Summarization of News Videos
1481	--	1492	Jun Yang, Lizhi Bai, Yaoru Sun, Chunqi Tian, Maoyu Mao, Guorun Wang. Pixel Difference Convolutional Network for RGB-D Semantic Segmentation
1493	--	1507	Qiang Zhang 0020, Qi Qin, Yang Yang, Qiang Jiao, Jungong Han. Feature Calibrating and Fusing Network for RGB-D Salient Object Detection
1508	--	1518	Chuanbo Yu, Bo Peng 0007, Qingming Huang, Jianjun Lei. PIPC-3Ddet: Harnessing Perspective Information and Proposal Correlation for 3D Point Cloud Object Detection
1519	--	1531	Chongye Guo, Hongbo Wang, Yingjie Xia, Guorui Feng. Learning Appearance-Motion Synergy via Memory-Guided Event Prediction for Video Anomaly Detection
1532	--	1545	Chunmei He, Xiuguang Li, Yue Xia, Jing Tang, Jie Yang, Zhengchun Ye. Addressing the Overfitting in Partial Domain Adaptation With Self-Training and Contrastive Learning
1546	--	1558	Chenchen Liu, Yadong Mu. Multi-Granularity Interaction for Multi-Person 3D Motion Prediction
1559	--	1571	Sui Paul Ang, Son Lam Phung, Ly Bui, Abdesselam Bouzerdoum. AdaptorNAS: A New Perturbation-Based Neural Architecture Search for Hyperspectral Image Segmentation
1572	--	1585	Shumin An, Qingmin Liao, Zongqing Lu, Jing-Hao Xue. Dual Correlation Network for Efficient Video Semantic Segmentation
1586	--	1603	Bingliang Jiao, Lu Yang, Liying Gao, Peng Wang 0015, Shizhou Zhang, Yanning Zhang. Vehicle Re-Identification in Aerial Images and Videos: Dataset and Approach
1604	--	1614	Bingzheng Liu, Bo Peng 0007, Zhe Zhang, Qingming Huang, Nam Ling, Jianjun Lei. Unsupervised Single-View Synthesis Network via Style Guidance and Prior Distillation
1615	--	1626	Anqi Liu, Sumei Li, Yongli Chang, Yonghong Hou. Multi-Scale Visual Perception Based Progressive Feature Interaction Network for Stereo Image Super-Resolution
1627	--	1640	Junhua Liao, Haihan Duan, Wanbing Zhao, Kanghui Feng, Yanbing Yang, Liangyin Chen. A Video Shot Occlusion Detection Algorithm Based on the Abnormal Fluctuation of Depth Information
1641	--	1655	Yixuan Gao, Xiongkuo Min, Yucheng Zhu, Xiao-Ping Zhang 0002, Guangtao Zhai. Blind Image Quality Assessment: A Fuzzy Neural Network for Opinion Score Distribution Prediction
1656	--	1669	Zhihong Zeng, Haijun Liu 0001, Fenglei Chen, Xiaoheng Tan. AirSOD: A Lightweight Network for RGB-D Salient Object Detection
1670	--	1683	Yuanjing Luo, Tongqing Zhou, Shenglan Cui, Yunfan Ye, Fang Liu 0002, Zhiping Cai. Fixing the Double Agent Vulnerability of Deep Watermarking: A Patch-Level Solution Against Artwork Plagiarism
1684	--	1695	Wenjie Yin, Yonghong Hou, Zihui Guo, Kailin Liu. Spatial-Temporal Enhanced Network for Continuous Sign Language Recognition
1696	--	1711	Jian Ma, Xiaoyin Zhang, Cheng Jin, Ping An, Guoming Xu. Light Field Image Quality Assessment Using Natural Scene Statistics and Texture Degradation
1712	--	1725	Yangyang Zhao, Qingchun Zheng, Peihao Zhu 0003, Xu Zhang, Wenpeng Ma. TUFusion: A Transformer-Based Universal Fusion Algorithm for Multimodal Images
1726	--	1742	Zheng Liang, Weidong Zhang 0007, Rui Ruan, Peixian Zhuang, Xiwang Xie, Chongyi Li. Underwater Image Quality Improvement via Color, Detail, and Contrast Restoration
1743	--	1756	Chaofan Zheng, Lianli Gao, Xinyu Lyu, Pengpeng Zeng, Abdulmotaleb El-Saddik, Heng Tao Shen. Dual-Branch Hybrid Learning Network for Unbiased Scene Graph Generation
1757	--	1771	Yajun Qiu, Qiang Zhu, Shuyuan Zhu, Bing Zeng. Dual Circle Contrastive Learning-Based Blind Image Super-Resolution
1772	--	1785	Yishi Li, Yuhao Zhang, Rui Lai. TinyPillarNet: Tiny Pillar-Based Network for 3D Point Cloud Object Detection at Edge
1786	--	1798	Shuyuan Lin, Anjia Yang, Taotao Lai, Jian Weng 0001, Hanzi Wang. Multi-Motion Segmentation via Co-Attention-Induced Heterogeneous Model Fitting
1799	--	1814	Zhongyun Hua, Xingyu Liu, Yifeng Zheng, Shuang Yi, Yushu Zhang. Reversible Data Hiding Over Encrypted Images via Preprocessing-Free Matrix Secret Sharing
1815	--	1826	Zhiwen Shao, Yuchen Su, Yong Zhou 0003, Fanrong Meng, Hancheng Zhu, Bing Liu 0016, Rui Yao. CT-Net: Arbitrary-Shaped Text Detection via Contour Transformer
1827	--	1840	Ru Li 0002, Peng Dai, Guanghui Liu 0001, Shengping Zhang, Bing Zeng, Shuaicheng Liu. PBR-GAN: Imitating Physically-Based Rendering With Generative Adversarial Networks
1841	--	1856	Kuai Dai, Xutao Li, Yunming Ye, Yaowei Wang 0001, Shanshan Feng, Di Xian. Exploring and Exploiting High-Order Spatial-Temporal Dynamics for Long-Term Frame Prediction
1857	--	1872	Yuanman Li, Liangpei Hu, Li Dong 0006, Haiwei Wu, Jinyu Tian, Jiantao Zhou 0001, Xia Li 0006. Transformer-Based Image Inpainting Detection via Label Decoupling and Constrained Adversarial Training
1873	--	1885	Jing Ye, Changzhen Qiu, Zhiyong Zhang. SNR-Prior Guided Trajectory-Aware Transformer for Low-Light Video Enhancement
1886	--	1899	Tao Gao 0001, Yuanbo Wen, Kaihao Zhang, Jing Zhang 0052, Ting Chen 0003, Lidong Liu, Wenhan Luo. Frequency-Oriented Efficient Transformer for All-in-One Weather-Degraded Image Restoration
1900	--	1913	Xiaoqian Zhang, Shuai Zhao, Jing Wang, Li Guo, Xiao Wang, HuaiJiang Sun. Purity-Preserving Kernel Tensor Low-Rank Learning for Robust Subspace Clustering
1914	--	1926	Min Meng 0001, Jiaxuan Sun, Jigang Liu, Jun Yu 0002, Jigang Wu. Semantic Disentanglement Adversarial Hashing for Cross-Modal Retrieval
1927	--	1940	Teng Wang, Jiawen Li, Changyin Sun. DeHi: A Decoupled Hierarchical Architecture for Unaligned Ground-to-Aerial Geo-Localization
1941	--	1953	Hui Cui 0004, Fengling Li, Lei Zhu 0002, Jingjing Li 0001, Zheng Zhang 0006. Online Query Expansion Hashing for Efficient Image Retrieval
1954	--	1969	Yuanyuan Ma, Lige Xu, Yi Zhang, Tao Zhang, Xiangyang Luo. Steganalysis Feature Selection With Multidimensional Evaluation and Dynamic Threshold Allocation
1970	--	1975	Weixiang Li, Shihang Wu, Bin Li 0011, Weixuan Tang, Xinpeng Zhang 0001. Payload-Independent Direct Cost Learning for Image Steganography
1976	--	1980	Yanchen Zuo, Changsheng Gao, Dong Liu 0002, Li Li 0040, Yueyi Zhang, Xiaoyan Sun 0001. Learned Rate-Distortion Cost Prediction for Ultrafast Screen Content Intra Coding

662	--	0	Wenwu Zhu 0001. Editor-in-Chief Message
663	--	680	Rui Wang 0050, Xiaojun Wu 0001, Tianyang Xu, Cong Hu, Josef Kittler. Deep Metric Learning on the SPD Manifold for Image Set Classification
681	--	694	Xiangsheng Li, Manlu Liu, Qiang Ling. Pixel-Wise Gamma Correction Mapping for Low-Light Image Enhancement
695	--	708	Ziwei Zheng, Le Yang 0007, Yulin Wang, Miao Zhang, Lijun He, Gao Huang, Fan Li 0003. Dynamic Spatial Focus for Efficient Compressed Video Action Recognition
709	--	723	Jin Wang, Chenyang Li, Yunhui Shi, Dan Wang, Mu-En Wu, Nam Ling, Baocai Yin. MSF-Net: Multi-Scale Feedback Reconstruction for Guided Depth Map Super-Resolution
724	--	737	Jun Liu 0053, Zhongqiang Luo, Xingzhong Xiong. Online Learning Samples and Adaptive Recovery for Robust RGB-T Tracking
738	--	753	Hao Wang, Shixin Sun, Peng Ren 0001. Underwater Color Disparities: Cues for Enhancing Underwater Images Toward Natural Color Consistencies
754	--	769	Pengfei Bi, Xue Du. Arbitrary Triangle Structure Adaptive Mean PCA and Image Recognition
770	--	785	Seonghyun Park 0003, An Gia Vien, Chul Lee. Cross-Modal Transformers for Infrared and Visible Image Fusion
786	--	798	Cong Cao 0005, Huanjing Yue, Xin Liu 0012, Jing-Yu Yang 0002. Unsupervised HDR Image and Video Tone Mapping via Contrastive Learning
799	--	814	Guojia Hou, Nan Li, Peixian Zhuang, Kunqian Li, Hai-Han Sun, Chongyi Li. Non-Uniform Illumination Underwater Image Restoration via Illumination Channel Sparsity Prior
815	--	827	Shuzhou Sun, Huali Xu, Yan Li 0063, Ping Li 0016, Bin Sheng 0001, Xiao Lin. FastAL: Fast Evaluation Module for Efficient Dynamic Deep Active Learning Using Broad Learning System
828	--	838	Hengmin Zhang, Junbin Gao, Jianjun Qian, Jian Yang, Chunyan Xu, Bob Zhang 0001. Linear Regression Problem Relaxations Solved by Nonconvex ADMM With Convergence Analysis
839	--	851	Shuai Shao 0006, Yan Wang 0076, Bin Liu 0021, Weifeng Liu 0001, Yanjiang Wang 0001, Baodi Liu. FADS: Fourier-Augmentation Based Data-Shunting for Few-Shot Classification
852	--	865	Chun-Yi Lin, Muhamad Amirul Haq, Jiunhan Chen, Shanq-Jang Ruan, Edwin Naroska. Efficient Saliency Map Detection for Low-Light Images Based on Image Gradient
866	--	881	Xiaoling Li, Yanfeng Li 0001, Houjin Chen, Yahui Peng, Pan Pan. CCAFusion: Cross-Modal Coordinate Attention Network for Infrared and Visible Image Fusion
882	--	896	Chunlei Li 0002, Xiao Li, Xueping Wang, Di Huang 0001, Zhoufeng Liu, Liang Liao. FG-AGR: Fine-Grained Associative Graph Representation for Facial Expression Recognition in the Wild
897	--	910	Huaiyuan Xu, Jing Liao 0001, Huaping Liu 0001, Yuxiang Sun. Learning Semantic Alignment Using Global Features and Multi-Scale Confidence
911	--	923	Zhenhua Tang, Yanbin Hao, Jia Li, Richang Hong. FTCM: Frequency-Temporal Collaborative Module for Efficient 3D Human Pose Estimation in Video
924	--	937	Yanan Wu, Songhe Feng, Gongpei Zhao, Yi Jin 0001. Transformer Driven Matching Selection Mechanism for Multi-Label Image Classification
938	--	954	Liyun Zhang, Photchara Ratsamee, Zhaojie Luo, Yuki Uranishi, Manabu Higashida, Haruo Takemura. Panoptic-Level Image-to-Image Translation for Object Recognition and Visual Odometry Enhancement
955	--	972	Runze Li, Bir Bhanu. Energy-Motion Features Aggregation Network for Players' Fine-Grained Action Analysis in Soccer Videos
973	--	982	Yefei He, Luoming Zhang, Weijia Wu, Hong Zhou. Binarizing by Classification: Is Soft Function Really Necessary?
983	--	994	Wei Zhang, Lincheng Li, Yu Ding 0001, Wei Chen 0001, Zhigang Deng, Xin Yu 0002. Detecting Facial Action Units From Global-Local Fine-Grained Expressions
995	--	1006	Lin Xi, Weihai Chen, Xingming Wu, Zhong Liu, Zhengguo Li. Online Unsupervised Video Object Segmentation via Contrastive Motion Clustering
1007	--	1019	Rui Wang, Bineng Zhong, Yan Chen. Motion-Driven Tracking via End-to-End Coarse-to-Fine Verifying
1020	--	1031	Xiantao Hu, Bineng Zhong, Qihua Liang, Shengping Zhang, Ning Li, Xianxian Li, Rongrong Ji. Transformer Tracking via Frequency Fusion
1032	--	1042	Zining Chen, Weiqiu Wang, Zhicheng Zhao, Fei Su, Aidong Men, Yuan Dong. Instance Paradigm Contrastive Learning for Domain Generalization
1043	--	1056	Hao Peng 0005, Guofeng Tong. Class-Aware 3D Detector From Point Clouds With Partial Knowledge Diffusion and Center-Weighted IoU
1057	--	1069	Chao Qi, Jianqin Yin, Jinghang Xu, Pengxiang Ding. Instance-Incremental Scene Graph Generation From Real-World Point Clouds via Normalizing Flows
1070	--	1085	Yilei Chen, Gongyang Li, Ping An, Zhi Liu, Xinpeng Huang, Qiang Wu 0001. Light Field Salient Object Detection With Sparse Views via Complementary and Discriminative Interaction Network
1086	--	1097	Jiazhong Cen, Zekun Jiang, Lingxi Xie, Dongsheng Jiang, Wei Shen 0002, Qi Tian 0001. Consensus Synergizes With Memory: A Simple Approach for Anomaly Segmentation in Urban Scenes
1098	--	1113	Guangkun Feng, Ting-Bing Xu, Fulin Liu, Mingkun Liu, Zhenzhong Wei. NVR-Net: Normal Vector Guided Regression Network for Disentangled 6D Pose Estimation
1114	--	1122	Xiaoyu Ni, Liang Yuan, Kai Lv. Efficient Single-Object Tracker Based on Local-Global Feature Fusion
1123	--	1134	Ye Wang, Guoshuai Zhao, Xueming Qian. Improved Continually Evolved Classifiers for Few-Shot Class-Incremental Learning
1135	--	1146	Yandong Bi, Huajie Jiang, Yongli Hu, Yanfeng Sun, Baocai Yin. See and Learn More: Dense Caption-Aware Representation for Visual Question Answering
1147	--	1158	Shengqin Jiang, Qing Wang, Fengna Cheng, Yuankai Qi, Qingshan Liu. A Unified Object Counting Network With Object Occupation Prior
1159	--	1173	Guilin Zhu, Runmin Wang, Yingying Liu, Zhenlin Zhu, Changxin Gao, Li Liu, Nong Sang. An Adaptive Post-Processing Network With the Global-Local Aggregation for Semantic Segmentation
1174	--	1185	Jiawei Wu, Haoyi Fan, Zuoyong Li, Guanghai Liu 0001, Shouying Lin. Information Transfer in Semi-Supervised Semantic Segmentation
1186	--	1198	Yufei Wang, Yuxin Mao, Qi Liu, Yuchao Dai. Decomposed Guided Dynamic Filters for Efficient RGB-Guided Depth Completion
1199	--	1211	Zhenglong Cui, Hao Sheng 0001, Da Yang, Sizhe Wang, Rongshan Chen, Wei Ke 0001. Light Field Depth Estimation for Non-Lambertian Objects via Adaptive Cross Operator
1212	--	1227	Lei Chen, Huhe Dai, Yuan Zheng 0002. RAFNet: Reparameterizable Across-Resolution Fusion Network for Real-Time Image Semantic Segmentation
1228	--	1240	Yangyang Xu, Xiangtai Li, Haobo Yuan, Yibo Yang, Lefei Zhang. Multi-Task Learning With Multi-Query Transformer for Dense Prediction
1241	--	1254	Fengyong Li, Zhen Qi, Xinpeng Zhang 0001, Chuan Qin 0001. Progressive Histogram Modification for JPEG Reversible Data Hiding
1255	--	1265	Zhiqing Guo, Liejun Wang, Wenzhong Yang, Gaobo Yang, Keqin Li 0001. LDFnet: Lightweight Dynamic Fusion Network for Face Forgery Detection by Integrating Local Artifacts and Global Texture Information
1266	--	1280	Ruyong Ren, Qixian Hao, Shaozhang Niu, Keyang Xiong, Jiwei Zhang 0007, Maosen Wang. MFI-Net: Multi-Feature Fusion Identification Networks for Artificial Intelligence Manipulation
1281	--	1294	Vignesh V. Menon, Prajit T. Rajendran, Christian Feldmann, Klaus Schoeffmann, Mohammed Ghanbari 0001, Christian Timmerer. JND-Aware Two-Pass Per-Title Encoding Scheme for Adaptive Live Streaming
1295	--	1309	Xiaobo Hu, Youfang Lin, Shuo Wang, Zhihao Wu 0001, Kai Lv. Agent-Centric Relation Graph for Object Visual Navigation
1310	--	1315	Wilfred Kisku, Amandeep Kaur 0005, Deepak Mishra 0003. An Intelligent System With Reduced Readout Power and Lightweight CNN for Vision Applications
1316	--	1320	Zuopeng Yang, Tianshu Chu, Xin Lin, Erdun Gao, Daqing Liu, Jie Yang 0002, Chaoyue Wang. Eliminating Contextual Prior Bias for Semantic Image Editing via Dual-Cycle Diffusion

12100	--	12111	Guangyu Huang, Yan Yan 0001, Jing-Hao Xue, Wentao Zhu 0002, Xiongbiao Luo. Interpretable Heterogeneous Teacher-Student Learning Framework for Hybrid-Supervised Pulmonary Nodule Detection
12112	--	12126	Tianjiao Li, Yang Luo, Wei Zhang 0021, Lingyu Duan, Jun Liu 0036. HARDer-Net: Hardness-Guided Discrimination Network for 3D Early Activity Prediction
12127	--	12141	Wencong Gu, Haihong Xiao, Xueyan Zhao, Wenxiong Kang. EA-MVSNet: Learning Error-Awareness for Enhanced Multi-View Stereo
12142	--	12157	Haoran Hou, Mingtao Feng, Zijie Wu, Weisheng Dong, Qing Zhu, Yaonan Wang 0001, Ajmal Mian. 3D Object Detection From Point Cloud via Voting Step Diffusion
12158	--	12170	Haozhe Cheng, Jihua Zhu, Naiwen Hu, Jinqian Chen, Wenbiao Yan. PTM: Torus Masking for 3D Representation Learning Guided by Robust and Trusted Teachers
12171	--	12183	Kexin Li, Tao Jiang 0042, Zongxin Yang, Yi Yang 0001, Yueting Zhuang, Jun Xiao 0001. IDPro: Flexible Interactive Video Object Segmentation by ID-Queried Concurrent Propagation
12184	--	12196	Zhenyu Shu, XuFei Sun, Chaoyi Pang, Shiqing Xin. 3D Shape Segmentation via Attentive Nonuniform Downsampling
12197	--	12209	Jiaxing Sun, Yinghui Sun, Xiaobo Shen 0001, Quansen Sun. Query-Guided Prototype Optimization for Few-Shot Classification
12210	--	12220	Zhe Tao, Lu Yu 0004, Hantao Yao, Shucheng Huang, Changsheng Xu. Class Incremental Learning for Light-Weighted Networks
12221	--	12232	Xiaotian Yin, Jiamin Wu, Wenfei Yang, Xu Zhou, Shifeng Zhang, Tianzhu Zhang. Hierarchy-Aware Interactive Prompt Learning for Few-Shot Classification
12233	--	12243	Chenping Fu, Jiewen Xiao, Wanqi Yuan, Risheng Liu, Xin Fan 0001. Learning Cruxes to Push for Object Detection in Low-Quality Images
12244	--	12257	Sai Yang, Fan Liu 0003, Delong Chen, Huaxi Huang, Jun Zhou 0001. Few-Shot Classification Model Compression via School Learning
12258	--	12273	Fan Zhang, Hongbing Ji, YongQuan Zhang, Zhigang Zhu 0002. Joint Spatial and Temporal Feature Enhancement Network for Disturbed Object Detection
12274	--	12287	Chuanfei Hu, Chenyang Zhao, Hang Shao 0001, Jin Deng, Yongxiong Wang. TMFF: Trustworthy Multi-Focus Fusion Framework for Multi-Label Sewer Defect Classification in Sewer Inspection Videos
12288	--	12300	Junhao Lin, Jiaxing Shen, Xin Yang 0011, Huazhu Fu, Qing Zhang 0006, Ping Li 0016, Bin Sheng 0001, Liansheng Wang, Lei Zhu 0003. Learning Motion-Guided Multi-Scale Memory Features for Video Shadow Detection
12301	--	12315	Yongsheng Dong, Yu Zhang, Xuelong Li 0001. Dual-Encoding Matching Adversarial Learning for Image Cartoonlization
12316	--	12329	Langkun Chen, Long Gao, Yan Jiang, Yunsong Li, Gang He 0002, Jifeng Ning. Local-Global Self-Attention for Transformer-Based Object Tracking
12330	--	12344	Zonghao Lu, Bing Cao, Qinghua Hu. LiDAR-Camera Continuous Fusion in Voxelized Grid for Semantic Scene Completion
12345	--	12359	Haoxuan Wang, Pengyang Ling, Xin Fan 0005, Tao Tu 0006, Jinjin Zheng, Huaian Chen, Yi Jin 0002, Enhong Chen. All-in-One Hardware-Oriented Model Compression for Efficient Multi-Hardware Deployment
12360	--	12375	Dingkang Yang, Mingcheng Li, Linhao Qu, Kun Yang 0010, Peng Zhai, Song Wang 0002, Lihua Zhang. Asynchronous Multimodal Video Sequence Fusion via Learning Modality-Exclusive and -Agnostic Representations
12376	--	12387	Xiaolin Xiao, Yue Wu, Yue-jiao Gong. Relative Comparison-Based Consensus Learning for Multi-View Subspace Clustering
12388	--	12398	Liang Chen, Bineng Zhong, Qihua Liang, Yaozong Zheng, Zhiyi Mo, Shuxiang Song. Top-Down Cross-Modal Guidance for Robust RGB-T Tracking
12399	--	12410	Wen-Long Zhang, Rui-sheng Jia, Hu Wang, Cheng-Yue Che, Hong-mei Sun. A Self-Supervised Learning Network for Student Engagement Recognition From Facial Expressions
12411	--	12424	Weili Shi, Ronghang Zhu, Sheng Li 0001. Unsupervised Class-Imbalanced Domain Adaptation With Pairwise Adversarial Training and Semantic Alignment
12425	--	12436	Guoguang Zhang, Yepeng Tang, Chunjie Zhang, Xiaolong Zheng 0001, Yao Zhao 0001. Entity Dependency Learning Network With Relation Prediction for Video Visual Relation Detection
12437	--	12449	Xin Zheng, Zhengqu Li, Deyang Liu, Xiaofei Zhou, Caifeng Shan. Spatial Attention-Guided Light Field Salient Object Detection Network With Implicit Neural Representation
12450	--	12465	Changcai Yang, Xiaojie Li, Jiayi Ma 0001, Fengyuan Zhuang, Lifang Wei, Riqing Chen, Guodong Chen. CGR-Net: Consistency Guided ResFormer for Two-View Correspondence Learning
12466	--	12479	Ran Liu 0006, Xiwei Ren, Hui An, Lin Yi. Layered Hole Filling Based on Depth-Aware Decomposition and GAN-Enhanced Background Reconstruction for DIBR
12480	--	12495	Long Shi, Lei Cao, Jun Wang 0089, Badong Chen. Enhanced Latent Multi-View Subspace Clustering
12496	--	12509	Yuning Cui 0001, Wenqi Ren, Alois Knoll. Omni-Kernel Modulation for Universal Image Restoration
12510	--	12523	Jun Zheng, Yining Qian, Chenyu Wang. Design and Cryptographic Implementation of an Evolutionary Digital Chaotic Model
12524	--	12534	Xunquan Tong, Pengwen Dai, Xugong Qin, Rui Wang 0032, Wenqi Ren. Granularity-Aware Single-Point Scene Text Spotting With Sequential Recurrence Self-Attention
12535	--	12549	Bin Li 0011, Jian Shi, Weixiang Li, Haodong Li 0001. WebP-JPEG Transcoding Detection by Spotting Re-Compression Artifacts With CNN-ViT for Processing Dual-Domain Features
12550	--	12567	Zhiwen Wang 0002, Maosong Ran, Ziyuan Yang 0001, Hui Yu, Jie Jing, Tao Wang, Jingfeng Lu, Yi Zhang 0018. Generalizable MRI Motion Correction via Compressed Sensing Equivariant Imaging Prior
12568	--	12580	Zhenbao Yu, Banglei Guan, Shunkun Liang, Zibin Liu, Yang Shang, Qifeng Yu. Globally Optimal Solution to the Generalized Relative Pose Estimation Problem Using Affine Correspondences
12581	--	12593	Qian Xu, Xiaobin Hu, Donghao Luo, Ying Tai, Chengjie Wang, Yuntao Qian. Efficiently Exploiting Spatially Variant Knowledge for Video Deblurring
12594	--	12607	Tong Wang 0022, Xiaoming Qi, Guanyu Yang. Polyp Segmentation via Semantic Enhanced Perceptual Network
12608	--	12623	Chao Wang 0028, Shuren Qi, Zhiqiu Huang, Yushu Zhang 0001, Rushi Lan, Xiaochun Cao, Feng-Lei Fan. Spatial-Frequency Discriminability for Revealing Adversarial Perturbations
12624	--	12637	Aimei Dong, Long Wang, Jian Liu, Jingyuan Xu, Guixin Zhao, Yi Zhai, Guohua Lv, Jinyong Cheng. Co-Enhancement of Multi-Modality Image Fusion and Object Detection via Feature Adaptation
12638	--	12651	Mingchen Song, Fengqin Yao, Guoqiang Zhong 0001, Zhong Ji, Xiaowei Zhang 0003. Matching Multi-Scale Feature Sets in Vision Transformer for Few-Shot Classification
12652	--	12664	Dongdong Li, Yihan Fan, Zhe Wang 0002. DRSCDM: A Novel Density-Related Clustering for Complex High-Dimensional Data Streams
12665	--	12675	Wenxiao Tang, Shiqi Chen, Minghui Wang, M. Saad Shakeel, Jian Jin, Wenxiong Kang, Weisi Lin. Adaptive Positive Sample Selection and Dynamic Soft Label Assignment for Keypoint Detection
12676	--	12691	Zhicheng Sheng, Fan Liu, Meng Liu 0006, Feng Zheng, Liqiang Nie. Open-Set Synthesis for Free-Viewpoint Human Body Reenactment of Novel Poses
12692	--	12701	Shibang Liu, Xuemei Xie, Guangming Shi. Human Pose Estimation via Parse Graph of Body Structure
12702	--	12714	Jie Geng, Weichen Ma, Wen Jiang 0002. Causal Intervention and Parameter-Free Reasoning for Few-Shot SAR Target Recognition
12715	--	12729	Chenxi Yang, Yujia Liu, Dingquan Li, Tingting Jiang 0001. Exploring Vulnerabilities of No-Reference Image Quality Assessment Models: A Query-Based Black-Box Method
12730	--	12740	Feifei Ding, Jianjun Li. Multi-Level Collaborative Learning for Multi-Target Domain Adaptive Semantic Segmentation
12741	--	12755	Xiao Ke, Qiuqin Chen, Hao Liu, Wenzhong Guo. GFENet: Generalization Feature Extraction Network for Few-Shot Object Detection
12756	--	12769	Yongchao Wang, Xiuli Bi, Bo Liu 0047, Yang Wei, Weisheng Li 0001, Bin Xiao 0002. Learning Discriminative Representations From Cross-Scale Features for Camouflaged Object Detection
12770	--	12781	Jiahao Wang 0002, Fang Liu 0001, Licheng Jiao, Yingjia Gao, Hao Wang 0211, Shuo Li 0010, Lingling Li 0002, Puhua Chen, Xu Liu 0006. Visual and Language Collaborative Learning for RGBT Object Tracking
12782	--	12795	Rongchuan Zhang, Peisong He, Haoliang Li, Shiqi Wang 0001, Yun Cao. Temporal Diversified Self-Contrastive Learning for Generalized Face Forgery Detection
12796	--	12810	Hao Li 0009, Zeyu Yang, Maoguo Gong, Shiguo Chen, A. Kai Qin, Zhenxing Niu, Yue Wu 0004, Yu Zhou. ShiftAttack: Toward Attacking the Localization Ability of Object Detector
12811	--	12822	Yike Zhu, Runwen Hu, Shijun Xiang. Invertible Image Decolorization With CFEH and Reversible Data Hiding
12823	--	12836	Wenhao Cai, Junli Zhao, Ran Yi, Minjing Yu, Fuqing Duan, Zhenkuan Pan 0001, Yong-Jin Liu 0001. MFDAN: Multi-Level Flow-Driven Attention Network for Micro-Expression Recognition
12837	--	12848	Yunsong Li, Xin Zhang 0092, Weiying Xie, Jiaqing Zhang, Leyuan Fang, Jiawei Du. Markov-PQ: Joint Pruning-Quantization via Learnable Markov Chain
12849	--	12861	Xingxing Jia, Ting Yu, Xiangyang Luo, Daoshun Wang, Huiyu Zhou 0001. Maximizing Contrast in XOR-Based Visual Cryptography Schemes
12862	--	12872	Zonglin Li, Zhaoxin Zhang, Peiqiang Liu, Qinglin Liu, Xin Sun. Toward Open-World Text-Driven Face Generation and Manipulation via StyleGAN3
12873	--	12878	Hanwei Zhu, Xiangjie Sui, Baoliang Chen, Xuelin Liu, Peilin Chen, Yuming Fang, Shiqi Wang 0001. 2AFC Prompting of Large Multimodal Models for Image Quality Assessment
12880	--	12893	Linhui Li, Xiaotong Lin 0002, Yejia Huang, Zizhen Zhang, Jian-Fang Hu. Beyond Minimum-of-N: Rethinking the Evaluation and Methods of Pedestrian Trajectory Prediction
12894	--	12906	Beihang Song, Jing Li 0055, Jia Wu 0001, Jun Chang, Jun Wan 0005. Direction Prediction Redefinition: Transfer Angle to Scale in Oriented Object Detection
12907	--	12922	Zhongjian Huang, Licheng Jiao, Jinyue Zhang, Xu Liu 0006, Fang Liu 0001, Xiangrong Zhang, Lingling Li 0002, Puhua Chen. A Graph Association Motion-Aware Tracker for Tiny Object in Satellite Videos
12923	--	12936	Guibiao Liao, Kaichen Zhou, Zhenyu Bao, Kanglin Liu, Qing Li 0029. OV-NeRF: Open-Vocabulary Neural Radiance Fields With Vision and Language Foundation Models for 3D Semantic Understanding
12937	--	12948	Xiaoning Sun, HuaiJiang Sun, Dong Wei 0007, Jin Wang, Bin Li 0084, Weiqing Li, Jianfeng Lu. Unified Privileged Knowledge Distillation Framework for Human Motion Prediction
12949	--	12962	Li Shen 0009, Xuyi Fan, Hongguang Li. Overlapped Trajectory-Enhanced Visual Tracking
12963	--	12976	Longkun Zou, Wanru Zhu, Ke Chen 0004, Lihua Guo, Kailing Guo, Kui Jia, Yaowei Wang 0001. Boosting Cross-Domain Point Classification via Distilling Relational Priors From 2D Transformers
12977	--	12990	Yanjun Liu, Wenming Yang, Qingmin Liao. DiffVein: A Unified Diffusion Network for Finger Vein Segmentation and Authentication
12991	--	13003	Yaoyan Zheng, Hongyu Yang, Di Huang 0001. Deep Common Feature Mining for Efficient Video Semantic Segmentation
13004	--	13015	Keyang Cheng, Jingfeng Tang, Hongjian Gu, Hao Wan, Maozhen Li 0001. Cross-Block Sparse Class Token Contrast for Weakly Supervised Semantic Segmentation
13016	--	13028	Xing Lan, Jiayi Lyu, Kun Dong, Hanyu Jiang, Qinghao Hu, Jian Xue. Does Pixel Value Represent Facial Landmark Well in Heatmap?
13029	--	13043	Hui Li 0035, Liang Liao, Chaofeng Chen, Xiaopeng Fan, Wangmeng Zuo, Weisi Lin. Continual Learning of No-Reference Image Quality Assessment With Channel Modulation Kernel
13044	--	13057	Hongshuo Tian, Ning Xu 0003, Mohan S. Kankanhalli, An-An Liu. Gaussian Distribution-Aware Commonsense Knowledge Learning for Scene Graph Generation
13058	--	13070	Zhong Ji, Jiahe Wu, Yaodong Wang, Aiping Yang, Jungong Han. Progressive Semantic Reconstruction Network for Weakly Supervised Referring Expression Grounding
13071	--	13084	Yanqing Yao, Gong Cheng 0003, Chunbo Lang, Xiang Yuan, Xingxing Xie, Junwei Han. Hierarchical Mask Prompting and Robust Integrated Regression for Oriented Object Detection
13085	--	13098	Qingsen Bao, Lei Chen 0011, Feng Zhang, Jun Wang 0024, Changqing Zhang. Causal Evidence Learning for Trusted Open Set Recognition Under Covariate Shift
13099	--	13112	Xuejun Li, Yuan Zong, Wenming Zheng. Adaptive Multi-Scale Iterative Optimized Video Object Segmentation Based on Correlation Enhancement
13113	--	13126	Zhaoliang Liu, Jinhe Su, Guorong Cai, Yidong Chen 0006, Binghui Zeng, Zongyue Wang. GeoRGS: Geometric Regularization for Real-Time Novel View Synthesis From Sparse Inputs
13127	--	13140	Yan-Bo Liu, Yingxiang Hu, Guo Cao, Yanfeng Shang. Semi-Supervised Crowd Counting via Multi-Task Pseudo-Label Self-Correction Strategy
13141	--	13151	Xuehui Wu, Huanliang Xu, Henry Leung, Xiaobo Lu, Yanbin Li. F2CENet: Single-Image Object Counting Based on Block Co-Saliency Density Map Estimation
13152	--	13163	Wentao Zhang, Yujun Huang, Weizhuo Zhang, Tong Zhang 0017, Qicheng Lao, Yue Yu 0001, Wei-Shi Zheng 0001, Ruixuan Wang. Continual Learning of Image Classes With Language Guidance From a Vision-Language Model
13164	--	13176	Xiao He 0014, Mingrui Zhu, Dongxin Chen, Nannan Wang 0001, Xinbo Gao 0001. Diff-Privacy: Diffusion-Based Face Privacy Protection
13177	--	13189	Zhe Kong, Wentian Zhang, Tao Wang 0052, Kaihao Zhang, Yuexiang Li, Xiaoying Tang 0001, Wenhan Luo. Dual Teacher Knowledge Distillation With Domain Alignment for Face Anti-Spoofing
13190	--	13200	Jian Yang 0030, Zhiyu Guan, Jun Li 0072, Zhi-Ping Shi 0002, Xianglong Liu 0001. Diffusion Patch Attack With Spatial-Temporal Cross-Evolution for Video Recognition
13201	--	13212	Qinghai Zheng, Haoyu Tang. Twin Reciprocal Completion for Incomplete Multi-View Clustering
13213	--	13225	Yongshan Zhang, Jianwen Qi, Xinxin Wang, Zhihua Cai, Jiangtao Peng, Yicong Zhou. Tensorial Global-Local Graph Self-Representation for Hyperspectral Band Selection
13226	--	13243	Tao Ye 0002, Xiangpeng Deng, Xiao Cong, Hongkun Zhou, Xiangming Yan. Parallelization Strategy of Non-Local Means Filtering Algorithm for Real-Time Denoising of Forward-Looking Multi-Beam Sonar Images
13244	--	13256	Sicong Kang, Shuaibo Gao, Wenhui Wu, Xu Wang 0006, Shuoyao Wang, Guoping Qiu. Image Intrinsic Components Guided Conditional Diffusion Model for Low-Light Image Enhancement
13257	--	13270	Jize Xue, Yongqiang Zhao 0001, Tongle Wu, Jonathan Cheung-Wai Chan. Tensor Convolution-Like Low-Rank Dictionary for High-Dimensional Image Representation
13271	--	13281	Panwang Xia, Yi Wan 0001, Zhi Zheng, Yongjun Zhang 0002, Jiwei Deng. Enhancing Cross-View Geo-Localization With Domain Alignment and Scene Consistency
13282	--	13296	Haodong Wang, Heng Yao, Chuan Qin 0001, Xinpeng Zhang 0001. When Robust Reversible Watermarking Meets Cropping Attacks
13297	--	13310	Zhuohang Dang, Minnan Luo, Chengyou Jia, Guang Dai, Jihong Wang, Xiaojun Chang, Jingdong Wang 0001. Disentangled Representation Learning With Transmitted Information Bottleneck
13311	--	13323	Xingjiang Ma, Jing Yang 0017, Jiacheng Lin, Zhenzhe Zheng, Shaobo Li 0001, Bingqi Hu, Xianghong Tang. LVAR-CZSL: Learning Visual Attributes Representation for Compositional Zero-Shot Learning
13324	--	13337	Chenghang Lai, Haibo Wang, Weifeng Ge, Xiangyang Xue 0001. Object-Centric Cross-Modal Knowledge Reasoning for Future Event Prediction in Videos
13338	--	13348	Hongxin Wu, Qinghou Zeng, Chen Guo, Tiesong Zhao, Chang Wen Chen. Target-Aware Camera Placement for Large-Scale Video Surveillance
13349	--	13363	Zhicong Lu, Li Jin 0001, Ziwei Chen, Changyuan Tian, Xian Sun, Xiaoyu Li, Yi Zhang 0083, Qi Li, Guangluan Xu. Relation-Aware Multi-Pass Comparison Deconfounded Network for Change Captioning
13364	--	13372	Shaohan Tan, Yixuan Zhang, Songhao Zhu. SMFRNet: Complex Scene Lane Detection With Start Point-Guided Multi-Dimensional Feature Refinement
13373	--	13385	Yan Xian, Hong Yu 0007, Huaxiong Li, Guoyin Wang 0001. Class Incremental Learning via Semantic Information Mapping and Background Information Calibrating
13386	--	13400	Fan Yang 0032, Shigeyuki Odashima, Shoichi Masui, Ikuo Kusajima, Sosuke Yamao, Shan Jiang 0006. Enhancing Multi-Camera Gymnast Tracking Through Domain Knowledge Integration
13401	--	13412	Ming Li 0029, Zhaohui Yang 0001, Tao Wang 0026, Yushu Zhang 0001, Wenying Wen. Dual Protection for Image Privacy and Copyright via Traceable Adversarial Examples
13413	--	13426	Lina Lin, Deyang Wu, Jiayan Wang, Yanli Chen, Xinpeng Zhang 0001, Hanzhou Wu. Automatic, Robust, and Blind Video Watermarking Resisting Camera Recording
13427	--	13440	Bochen Xie, Yongjian Deng, Zhanpeng Shao, Qingsong Xu, Youfu Li 0001. Event Voxel Set Transformer for Spatiotemporal Representation Learning on Event Streams
13441	--	13451	Jiebin Yan, Lei Wu, Yuming Fang, Xuelin Liu, Xue Xia, Weide Liu. Video Quality Assessment for Online Processing: From Spatial to Temporal Sampling
13452	--	13462	Wei Zhou 0021, Zhou Wang 0001. Perceptual Depth Quality Assessment of Stereoscopic Omnidirectional Images
13463	--	13477	Boxiong Wu, Jiangtao Nie, Wei Wei 0008, Lei Zhang 0054, Yanning Zhang 0001. Adjustable Visible and Infrared Image Fusion
13478	--	13493	Liming Xu, Hanqi Li, Bochuan Zheng, Weisheng Li 0001, Jiancheng Lv 0001. Deep Lifelong Cross-Modal Hashing
13494	--	13506	Muwei Jian, Rui Wang, Xiaoyang Yu, Feng Xu 0005, Hui Yu 0001, Kin-Man Lam 0001. UniFRD: A Unified Method for Facial Image Restoration Based on Diffusion Probabilistic Model
13507	--	13517	Dongliang Chen, Guihua Wen, Pei Yang 0001, Huihui Li, Chuyun Chen, Bao Wang. CFAN-SDA: Coarse-Fine Aware Network With Static-Dynamic Adaptation for Facial Expression Recognition in Videos
13518	--	13529	Yuling Su, Xueliang Liu, Zhen Huang 0006, Jun He, Richang Hong, Meng Wang 0001. Reallocating and Evolving General Knowledge for Few-Shot Learning
13530	--	13542	Bodong Cheng, Juncheng Li 0003, Jun Shi 0004, Yingying Fang, Guixu Zhang, Yin Chen, Tieyong Zeng, Zhi Li. WeaFU: Weather-Informed Image Blind Restoration via Multi-Weather Distribution Diffusion
13543	--	13555	Qinghua Zhang, Fangjun Huang. Robust Generative Steganography Based on Image Mapping
13556	--	13568	Guo Lu, Xingtong Ge, Tianxiong Zhong, Qiang Hu 0003, Jing Geng. Preprocessing Enhanced Image Compression for Machine Vision
13569	--	13583	Bingjing Hou, Leilei Huang, Ming-e Jing, Yibo Fan. A High-Throughput and Memory-Efficient Deblocking Filter Hardware Architecture for VVC
13584	--	13595	Chenyu Lu, Nan Zhang 0014, Shiliang Sun. A Lightweight Multi-Grained Image-Text Retrieval Paradigm via Cascaded Representation Learning and Parameter-Free Feature Aggregation
13596	--	13610	Yueqi Zhang, Lichen Feng, Hongwei Shan, Zhangming Zhu. A 109-GOPs/W FPGA-Based Vision Transformer Accelerator With Weight-Loop Dataflow Featuring Data Reusing and Resource Saving
13611	--	13625	Tongbo Wang, Hua Huang. Future Feature-Based Supervised Contrastive Learning for Streaming Perception
13626	--	13641	Jiang Yu, Jing Zhang, Zichi Wang, Fengyong Li, Xinpeng Zhang 0001. Cover Selection in Encrypted Images
13642	--	13654	Yixuan Zhou 0001, Yi Qu, Xing Xu 0001, Fumin Shen, Jingkuan Song, Heng Tao Shen. BatchNorm-Based Weakly Supervised Video Anomaly Detection

10524	--	10537	Ancong Wu, Chengzhi Lin, Wei-Shi Zheng 0001. Asymmetric Mutual Learning for Unsupervised Transferable Visible-Infrared Re-Identification
10538	--	10550	Kan Guo, Daxin Tian, Yongli Hu, Chunmian Lin, Yanfeng Sun, Jianshan Zhou, Xuting Duan, Junbin Gao, Baocai Yin. CFMMC-Align: Coarse-Fine Multi-Modal Contrastive Alignment Network for Traffic Event Video Question Answering
10551	--	10563	Jiawen Zhu, Xin Chen 0032, Pengyu Zhang, Xinying Wang 0005, Dong Wang 0004, Wenda Zhao, Huchuan Lu. SRRT: Exploring Search Region Regulation for Visual Object Tracking
10564	--	10577	Wei Yao, Hongwen Zhang 0001, Yunlian Sun, Jinhui Tang 0001. STAF: 3D Human Mesh Recovery From Video With Spatio-Temporal Alignment Fusion
10578	--	10589	Jinhua Hu, Yonghong Hou, Zihui Guo, Jiajun Gao. Global and Local Contrastive Learning for Self-Supervised Skeleton-Based Action Recognition
10590	--	10603	Qing Wang, Xulun Ye, Nongxiao Wang. Learning Low-Rank Representation Approximation for Few-Shot Deep Subspace Clustering
10604	--	10617	Chengrui Wei, Meng Yang 0002, Lei He, Nanning Zheng 0001. FS-Depth: Focal-and-Scale Depth Estimation From a Single Image in Unseen Indoor Scene
10618	--	10631	Qingqing Yan, Shu Li, Zongtao He, Mengxian Hu, Chengju Liu, Qijun Chen. DR-Block: Convolutional Dense Reparameterization for CNN Generalization Free Improvement
10632	--	10645	Xuze Hao, Xuhao Jiang, Wenqian Ni, Weimin Tan, Bo Yan 0001. Prompt-Guided Semantic-Aware Distillation for Weakly Supervised Incremental Semantic Segmentation
10646	--	10661	Yinsai Guo, Hang Yu 0006, Liyan Ma, Xiangfeng Luo, Shaorong Xie. DIE-CDK: A Discriminative Information Enhancement Method With Cross-Modal Domain Knowledge for Fine-Grained Ship Detection
10662	--	10677	Yi Luo, Feng Shao 0001, Baoyang Mu, Hangwei Chen, Zhuo Li, Qiuping Jiang. Dynamic Weighted Fusion and Progressive Refinement Network for Visible-Depth-Thermal Salient Object Detection
10678	--	10691	Wenkang Shan, Yuhuai Zhang, Xinfeng Zhang 0001, Shanshe Wang, Xilong Zhou, Siwei Ma, Wen Gao 0001. Diffusion-Based Hypotheses Generation and Joint-Level Hypotheses Aggregation for 3D Human Pose Estimation
10692	--	10703	Yicheng Lin, Yunlong Jiang, Xujia Jiao, Bin Han 0010. Learned Good Features to Track
10704	--	10717	Hanlin Guo, Guobao Xiao, Lumei Su, Tianyou Li, Da-Han Wang, Hanzi Wang. Second-Order Proximity Guided Sampling Consensus for Robust Model Fitting
10718	--	10731	Xingyu Zhu, Xiangbo Shu, Jinhui Tang 0001. Motion-Aware Mask Feature Reconstruction for Skeleton-Based Action Recognition
10732	--	10742	Jie Zhu, Bo Peng 0007, Bingzheng Liu, Qingming Huang, Jianjun Lei. Self-Constructing Stereo Correspondences for Unsupervised Multi-View Stereo
10743	--	10752	Zhuoran Xie, Miao Yang, Mengjiao Shen, Yuquan Qiu, Xinyu Wang. FIOD-VUE: Focusing on Invariant Information in Object Detection of Varying Underwater Environment
10753	--	10763	Chao Zheng, Li Liu, Yu Meng, Xiaorui Peng, Meijun Wang. Few-Shot Point Cloud Semantic Segmentation via Support-Query Feature Interaction
10764	--	10778	Yalong Jiang, Changkang Li, Wenrui Ding, Jinzhi Xiang, Zheru Chi. Reasonable Anomaly Detection Based on Long-Term Sequence Modeling
10779	--	10792	Ruiqiu Wang, Tao Su, Dan Xu 0007, Jianlai Chen, Yuan Liang. MIGA-Net: Multi-View Image Information Learning Based on Graph Attention Network for SAR Target Recognition
10793	--	10804	Weichao Zhao, Hezhen Hu, Wengang Zhou, Yunyao Mao, Min Wang 0019, Houqiang Li. MASA: Motion-Aware Masked Autoencoder With Semantic Alignment for Sign Language Recognition
10805	--	10816	Jin Liu 0018, Jialong Xie, Fengyu Zhou, Shengfeng He. Question Type-Aware Debiasing for Test-Time Visual Question Answering Model Adaptation
10817	--	10830	Xuanyu Zhang, Bin Chen, Wenzhen Zou, Shuai Liu, Yongbing Zhang, Ruiqin Xiong, Jian Zhang 0018. Progressive Content-Aware Coded Hyperspectral Snapshot Compressive Imaging
10831	--	10844	Xiaoqiang Zhou, Chaoyou Fu, Huaibo Huang, Ran He 0001. Dynamic Graph Memory Bank for Video Inpainting
10845	--	10859	Yuanliang Xue, Guodong Jin, Tao Shen, Lining Tan, Nian Wang, Jing Gao, Lianfeng Wang. Consistent Representation Mining for Multi-Drone Single Object Tracking
10860	--	10873	Tao Yan 0001, Xiangjie Zhu, Xianglong Chen, Weijiang He, Chenglong Wang, Yang Yang 0046, YingHui Wang, Xiaojun Chang. GLGFN: Global-Local Grafting Fusion Network for High-Resolution Image Deraining
10874	--	10887	Mingjin He, Bingwen Feng, Yizhi Guo, Jian Weng 0001, Wei Lu 0001. Camera-Shooting Resilient Watermarking on Image Instance Level
10888	--	10902	Lin He, Bingwen Feng, Zecheng Peng, Bing Chen 0004, Zhihua Xia, Wei Lu 0001. Removing Hidden Information by Geometrical Perturbation in Frequency Domain
10903	--	10916	Dongjia Zhao, Lei Qi 0001, Xiao Shi, Yinghuan Shi, Xin Geng 0001. A Novel Cross-Perturbation for Single Domain Generalization
10917	--	10929	Preeti Meena, Himanshu Kumar, Sandeep Kumar Yadav. A Volumetric Saliency Guided Image Summarization for RGB-D Indoor Scene Classification
10930	--	10943	Weidong Zhang 0007, Qingmin Liu, Yikun Feng, Lei Cai, Peixian Zhuang. Underwater Image Enhancement via Principal Component Fusion of Foreground and Background
10944	--	10958	Di Wang 0018, Jinyuan Liu 0001, Long Ma 0002, Risheng Liu, Xin Fan 0001. Improving Misaligned Multi-Modality Image Fusion With One-Stage Progressive Dense Registration
10959	--	10971	Yong Wu, Guang Chen 0001, Linwei Ye, Yuanning Jia, Zhi Liu 0003, Yang Wang 0003. TTAGaze: Self-Supervised Test-Time Adaptation for Personalized Gaze Estimation
10972	--	10986	Zhaobo Qi, Yibo Yuan, Xiaowen Ruan, Shuhui Wang, Weigang Zhang, Qingming Huang. Collaborative Debias Strategy for Temporal Sentence Grounding in Video
10987	--	10999	Lizhi Xiong, Rui Ding, Ching-Nung Yang, Zhangjie Fu. Invertible Secret Image Sharing With Authentication for Embedding Color Palette Image Into True Color Image
11000	--	11012	Asif Raza, Bang Yang, Yuexian Zou. Zero-Shot Temporal Action Detection by Learning Multimodal Prompts and Text-Enhanced Actionness
11013	--	11025	Chunyan Wang, Dong Zhang, Rui Yan. Boosting Weakly-Supervised Image Segmentation via Representation, Transform, and Compensator
11026	--	11039	Duo Qiu, Bei Yang, Xiongjun Zhang. Robust Tensor Completion via Dictionary Learning and Generalized Nonconvex Regularization for Visual Data Recovery
11040	--	11055	Qingxin Sheng, Chong Fu, Ming Tie, Xingwei Wang 0001, Junxin Chen 0001, Chiu-Wing Sham. A Chaos-Based Tunable Selective Encryption Algorithm for H.265/HEVC With Semantic Understanding
11056	--	11069	Meng Liu 0006, Da Li, Yongqiang Li, Xuemeng Song, Liqiang Nie. Audio-Semantic Enhanced Pose-Driven Talking Head Generation
11070	--	11085	Yuxin Feng, Zhuo Su 0001, Long Ma 0002, Xin Li, Risheng Liu, Fan Zhou 0001. Bridging the Gap Between Haze Scenarios: A Unified Image Dehazing Model
11086	--	11100	Linfei Wang, Yibing Zhan, Long Lan, Xu Lin, Dapeng Tao, Xinbo Gao 0001. DeIoU: Toward Distinguishable Box Prediction in Densely Packed Object Detection
11101	--	11114	Rui Guo, Linbin Wang, Chencheng Zhang, Lian Gu, Dianyou Li, Xiaohua Qian. A Causality-Informed Graph Convolutional Network for Video Assessment of Parkinsonian Leg Agility
11115	--	11127	Bokang Wang, Qian Ning, Fangfang Wu, Xin Li 0005, Weisheng Dong, Guangming Shi. Uncertainty Modeling of the Transmission Map for Single Image Dehazing
11128	--	11141	Junhui Li, Xingsong Hou. The Design of an Adaptive Enhanced AMP-Based Image Block Compressed Sensing and Its Application to Image Encryption
11142	--	11155	Chen Yang, Guorong Li, Shuhui Wang, Li Su 0003, Laiyun Qing, Qingming Huang. SpikeODE: Image Reconstruction for Spike Camera With Neural Ordinary Differential Equation
11156	--	11168	Yi-Chen Chen, Wei-Ta Chu. Positive and Negative Set Designs in Contrastive Feature Learning for Temporal Action Segmentation
11169	--	11183	Bolin Ni, Xing Nie, Chenghao Zhang, Shixiong Xu, Xin Zhang 0093, Gaofeng Meng, Shiming Xiang. MoBoo: Memory-Boosted Vision Transformer for Class-Incremental Learning
11184	--	11197	Xiaogang Song 0001, Pengfei Zhang, Xiaofeng Lu, Xinhong Hei 0001, Rongrong Liu. A Universal Multi-View Guided Network for Salient Object and Camouflaged Object Detection
11198	--	11213	Yuqiao Zeng, Tengfei Liang, Yi Jin 0001, Yidong Li. MMI-Det: Exploring Multi-Modal Integration for Visible and Infrared Object Detection
11214	--	11228	Yike Liu, Haipeng Li 0001, Shuaicheng Liu, Bing Zeng. CodingHomo: Bootstrapping Deep Homography With Video Coding
11229	--	11240	Qinghua Sheng, Hongzhao Chen, Changcai Lai, Xiaofang Huang, Yuanyuan Liu, Xiaofeng Huang, Haibing Yin. Fast Linear Equation Solving Algorithm and its Pipelined Hardware Architecture Design for VVC Affine Motion Estimation
11241	--	11255	Jian Wang, Qiang Ling. FDNet: Frequency Decomposition Network for Learned Image Compression
11256	--	11270	Guohao Xu, Leilei Huang, Zhijian Hao, Wei Li, Shiyan Yi, Xiaoyang Zeng, Yibo Fan. A High Compression Efficiency Hardware Encoder for Intra and Inter Coding With 4K@30fps Throughput
11271	--	11285	Siyu Zhou, Fuwei Zhang, Ruomei Wang 0001, Fan Zhou 0001, Zhuo Su 0001. Subtask Prior-Driven Optimized Mechanism on Joint Video Moment Retrieval and Highlight Detection
11286	--	11298	Ming Jin, Wenbo Hu 0001, Lei Zhu 0002, Xiang Wang 0010, Richang Hong. Based on Spatial and Temporal Implicit Semantic Relational Inference for Cross-Modal Retrieval
11299	--	11312	Linshan Hou, Zhongyun Hua, Yuhong Li, Yifeng Zheng, Leo Yu Zhang. M-to-N Backdoor Paradigm: A Multi-Trigger and Multi-Target Attack to Deep Learning Models
11316	--	11339	Wang Xia, Guodao Sun, Tong Li, Baofeng Chang, Jingwei Tang, Gefei Zhang, Ronghua Liang. Video Visualization and Visual Analytics: A Task-Based and Application- Driven Investigation
11340	--	11359	Zehai Niu, Ke Lu 0002, Jian Xue, Xiaoyu Qin, Jinbao Wang, Ling Shao 0001. From Methods to Applications: A Review of Deep 3D Human Motion Capture
11360	--	11372	Jianhan Qi, Yuheng Jia, Hui Liu 0032, Junhui Hou. Superpixel Graph Contrastive Clustering With Semantic-Invariant Augmentations for Hyperspectral Images
11373	--	11385	Bo Miao, Mohammed Bennamoun, Yongsheng Gao 0001, Mubarak Shah, Ajmal Mian. Temporally Consistent Referring Video Object Segmentation With Hybrid Memory
11386	--	11399	Yan Liu 0043, Qingyong Hu, Yulan Guo. BSTS: A Weakly-Supervised Method for Semantic Learning of 3D Point Clouds
11400	--	11412	Yuxi Liu, Guibo Luo, Zhenyu Weng, Yuesheng Zhu. Adaptive Face Recognition for Multi-Type Occlusions
11413	--	11422	Junran Ding, Yunxiang He, Binzhe Yuan, Zhechen Yuan, Pingqiang Zhou, Jingyi Yu, Xin Lou. Ray Reordering for Hardware-Accelerated Neural Volume Rendering
11423	--	11437	Yichen Guo, Mai Xu, Lai Jiang, Xin Deng 0002, Jing Zhou, Gaoxing Chen, Leonid Sigal. Proposal With Alignment: A Bi-Directional Transformer for 360° Video Viewport Proposal
11438	--	11450	Weijia Liu, Shaoming Zhang, Yan Tang, Zhong Wang, Jianmei Wang. Style Reconstruction-Driven Networks for Occlusion-Aware License Plate Recognition
11451	--	11463	De Cheng, Yuxin Zhao, Nannan Wang 0001, Guozhang Li, Dingwen Zhang, Xinbo Gao 0001. Efficient Statistical Sampling Adaptation for Exemplar-Free Class Incremental Learning
11464	--	11477	Xingyu Tong, Yang Xiao 0007, Bo Tan, Jianyu Yang 0002, Zhiguo Cao 0001, Joey Tianyi Zhou, Junsong Yuan 0001. You Will Never Walk Alone: One-Shot 3D Action Recognition With Point Cloud Sequence
11478	--	11492	Yi Shi, Long Qin, Shixuan Zhao 0001, Kaifu Yang, Yuyong Cui, Hongmei Yan. Weakly Supervised Fixated Object Detection in Traffic Videos Based on Driver's Selective Attention Mechanism
11493	--	11506	Peng Zhao, Xiaoming Xi, Qiangchang Wang, Yilong Yin. Characterizing Hierarchical Semantic-Aware Parts With Transformers for Generalized Zero-Shot Learning
11507	--	11520	Ruilin Yao, Yi Rong, Qiangqiang Huang, Shengwu Xiong. CTOD: Cross-Attentive Task-Alignment for One-Stage Object Detection
11521	--	11534	Yizhu Zhang, Jingang Shi, Jiayin Wang, Yuan Zong, Wenming Zheng, Guoying Zhao 0001. MaskFusionNet: A Dual-Stream Fusion Model With Masked Pre-Training Mechanism for rPPG Measurement
11535	--	11550	Sheng Yan, Mengyuan Liu, Yong Wang, Yang Liu 0264, Hong Liu 0008. MLP: Motion Label Prior for Temporal Sentence Localization in Untrimmed 3D Human Motions
11551	--	11563	Xi Yang 0011, Menghui Tian, Nannan Wang 0001, Xinbo Gao 0001. Unleashing the Feature Hierarchy Potential: An Efficient Tri-Hybrid Person Search Model
11564	--	11578	Haihong Xiao, Ying He 0001, Hao Liu, Wenxiong Kang, Yuqiong Li. Point Cloud Completion via Self-Projected View Augmentation and Implicit Field Constraint
11579	--	11591	Xin Liu, Jiamin Wu, Wenfei Yang, Xu Zhou, Tianzhu Zhang. Multi-Modal Attribute Prompting for Vision-Language Models
11592	--	11604	Yue Wang 0038, Lu Zhang 0053, Pingping Zhang, Yunzhi Zhuge, Junfeng Wu, Hong Yu, Huchuan Lu. Learning Local-Global Representation for Scribble-Based RGB-D Salient Object Detection via Transformer
11605	--	11618	Congqi Cao, Ze Sun, Qinyi Lv, Lingtong Min, Yanning Zhang 0001. VS-TransGRU: A Novel Transformer-GRU-Based Framework Enhanced by Visual-Semantic Fusion for Egocentric Action Anticipation
11619	--	11629	Xuxiang Sun 0001, Gong Cheng 0003, Hongda Li, Hongyu Peng, Junwei Han. Task-Specific Importance-Awareness Matters: On Targeted Attacks Against Object Detection
11630	--	11643	Haolin Du, Jingfei He, YuanQing Zhao. CCR: A Counterfactual Causal Reasoning-Based Method for Cross-View Geo-Localization
11644	--	11656	Zhuming Wang, Zun Li 0001, Xianglong Lang, Yihao Zheng, Meng Tian, Lifang Wu, Liang Wang 0001, Changwen Chen. Knowledge Augmented Relation Inference for Group Activity Recognition
11657	--	11667	Ning Xu 0003, Tingting Zhang, Hongshuo Tian, An-An Liu. Rule-Driven News Captioning
11668	--	11681	Jian Wang, Tianhong Dai, Xinqiao Zhao, Ángel F. García-Fernández, Eng Gee Lim, Jimin Xiao. Class Activation Map Calibration for Weakly Supervised Semantic Segmentation
11682	--	11694	Jian Zhu 0006, Hanli Wang, Miaojing Shi. Multi-Modal Large Language Model Enhanced Pseudo 3D Perception Framework for Visual Commonsense Reasoning
11695	--	11708	Zongyi Li, Yuxuan Shi, Hefei Ling, Jiazhong Chen, Runsheng Wang, Chengxin Zhao, Qian Wang 0001, Shijuan Huang. Knowledge Consistency Distillation for Weakly Supervised One Step Person Search
11709	--	11723	Ziheng Jia, Xiongkuo Min, Wei Sun 0029, Guangtao Zhai. Continuous and Overall Quality of Experience Evaluation for Streaming Video Based on Rich Features Exploration and Dual-Stage Attention
11724	--	11738	Liqing Gao, Fan Lyu, Peng Shi, Lei Zhu 0003, Junfu Pu, Liang Wang 0001, Wei Feng 0005. Overcoming Modality Bias in Question-Driven Sign Language Video Translation
11739	--	11750	Xu Yin, Woobin Im, Dongbo Min, Yuchi Huo, Fei Pan, Sung-Eui Yoon. Fine-Grained Background Representation for Weakly Supervised Semantic Segmentation
11751	--	11767	Shuyuan Wang, Qi Li 0005, Huiyuan Luo, Chengkan Lv, Zhengtao Zhang. Produce Once, Utilize Twice for Anomaly Detection
11768	--	11782	Ling Lin 0002, Tao Wang, Hao Liu 0019, Congcong Zhu, Jingrun Chen. Toward Quantifiable Face Age Transformation Under Attribute Unbias
11783	--	11797	Shaocong Long, Qianyu Zhou 0001, Chenhao Ying, Lizhuang Ma, Yuan Luo 0003. Rethinking Domain Generalization: Discriminability and Generalizability
11798	--	11809	Xie Yang, Yuke Wang, Fangjun Huang. CNN-Based Reversible Data Hiding for JPEG Images
11810	--	11824	Quan Chen, Tingyu Wang, Zihao Yang, Haoran Li, Rongfeng Lu, Yaoqi Sun, Bolun Zheng, Chenggang Yan 0001. SDPL: Shifting-Dense Partition Learning for UAV-View Geo-Localization
11825	--	11837	Qianzi Yu, Kai Zhu 0004, Yang Cao 0010, Feijie Xia, Yu Kang 0001. TF²: Few-Shot Text-Free Training-Free Defect Image Generation for Industrial Anomaly Inspection
11838	--	11850	Yichen Chi, Junhao Gu, Jiamiao Zhang, Wenming Yang, Yapeng Tian. EgoVSR: Toward High-Quality Egocentric Video Super-Resolution
11851	--	11873	Junge Peng, Bing Luo, Li Xu, Jun Yang, Chao Zhang 0072, Zheng Pei 0001. Blind Image Deblurring via Minimizing Similarity Between Fuzzy Sets on Image Pixels
11874	--	11885	Yongxian Wei, Zixuan Hu, Li Shen 0008, Zhenyi Wang, Lei Li, Yu Li, Chun Yuan. Meta-Learning Without Data via Unconditional Diffusion Models
11886	--	11899	Haoliang Zhou, Shucheng Huang, Feifei Zhang, Changsheng Xu. CEPrompt: Cross-Modal Emotion-Aware Prompting for Facial Expression Recognition
11900	--	11913	Liya Wang, Haipeng Chen 0002, Yu Liu 0004, Yingda Lyu. Regular Constrained Multimodal Fusion for Image Captioning
11914	--	11928	Chen Feng, Georgios Tzimiropoulos, Ioannis Patras. NoiseBox: Toward More Efficient and Effective Learning With Noisy Labels
11929	--	11941	Hongjun Wu 0003, Chenxi Wang, Luwei Tu, Constantin Patsch, Zhi Jin. CSPN: A Category-Specific Processing Network for Low-Light Image Enhancement
11942	--	11953	Mingfeng Zha, Feiyang Fu, Yunqiang Pei, Guoqing Wang 0001, Tianyu Li, Xiongxin Tang, Yang Yang 0002, Heng Tao Shen. Dual Domain Perception and Progressive Refinement for Mirror Detection
11954	--	11964	Haonan Zhang, Pengpeng Zeng, Lianli Gao, Jingkuan Song, Heng Tao Shen. Ump: Unified Modality-Aware Prompt Tuning for Text-Video Retrieval
11965	--	11979	Feifeng Wang, Liquan Shen, Qi Teng, Zhaoyi Tian. DSCIC: Deep Screen Content Image Compression
11980	--	11992	Yi-Hsin Chen, Hong-Sheng Xie, Cheng-Wei Chen, Zong-Lin Gao, Martin Benjak, Wen-Hsiao Peng, Jörn Ostermann. MaskCRT: Masked Conditional Residual Transformer for Learned Video Compression
11993	--	12005	Tianyi Sun, Yanze Wang, Zhijie Huang, Jun Sun 0012. STRANet: Soft-Target and Restriction-Aware Neural Network for Efficient VVC Intra Coding
12006	--	12018	Chris Henry, Li Song 0001, Zhu Li 0001. Fast Video Deduplication and Localization With Temporal Consistence Re-Ranking
12019	--	12031	Huakai Lai, Wenfei Yang, Tianzhu Zhang, Yongdong Zhang 0001. Reliable Phrase Feature Mining for Hierarchical Video-Text Retrieval
12032	--	12047	Huadong Zhang, Shuli Cheng, Anyu Du. Multi-Stage Auxiliary Learning for Visible-Infrared Person Re-Identification
12048	--	12058	Duc Quang Vu, Trang T. T. Phung, Jia-Ching Wang, Son T. Mai. LCSL: Long-Tailed Classification via Self-Labeling
12059	--	12072	Dengdi Sun, Yajie Pan, Andong Lu, Chenglong Li 0002, Bin Luo 0001. Transformer RGBT Tracking With Spatio-Temporal Multimodal Tokens
12073	--	12085	Xingjie Dai, Ziwen He, Xiang Zhang 0023, Zhangjie Fu. SCGM: Asymmetric Steganographic Embedding Cost Learning With Adaptive Modulation
12086	--	12091	Xi Xie, Meng Wang 0017, Junru Li, Kai Zhang 0007, Li Zhang 0006, Shiqi Wang 0001. Enhanced Motion Compensated Temporal Filter for VVenC
12092	--	12096	Linwei Zhu, Yun Zhang 0002, Na Li 0015, Wenhui Wu, Shiqi Wang 0001, Sam Kwong. Neural Network Based Multi-Level In-Loop Filtering for Versatile Video Coding

8984	--	8996	Keyang Cheng, Honggang Cui, Humaira abdul Ghafoor, Hao Wan, Qirong Mao, Yongzhao Zhan 0001. Tiny Object Detection via Regional Cross Self-Attention Network
8997	--	9009	Baojie Fan, Kexin Zhang, Jiandong Tian. HCPVF: Hierarchical Cascaded Point-Voxel Fusion for 3D Object Detection
9010	--	9023	Xingyue Zhao, Zhongyu Li 0002, Xiangde Luo, Peiqi Li, Peng Huang, Jianwei Zhu, Yang Liu, Jihua Zhu, Meng Yang, Shi Chang, Jun Dong. Ultrasound Nodule Segmentation Using Asymmetric Learning With Simple Clinical Annotation
9024	--	9038	Ye Huang, Di Kang, Liang Chen 0026, Wenjing Jia, Xiangjian He, Lixin Duan, Xuefei Zhe, Linchao Bao. CARD: Semantic Segmentation With Efficient Class-Aware Regularized Decoder
9039	--	9052	Lei Qi 0001, Ziang Liu 0013, Yinghuan Shi, Xin Geng 0001. Generalizable Metric Network for Cross-Domain Person Re-Identification
9053	--	9063	Guangtong Zhang, Bineng Zhong, Qihua Liang, Zhiyi Mo, Ning Li, Shuxiang Song. One-Stream Stepwise Decreasing for Vision-Language Tracking
9064	--	9077	Zixu Wang, Congxuan Zhang, Zhen Chen 0004, Weiming Hu, Ke Lu 0002, Liyue Ge, Zige Wang. ACR-Net: Learning High-Accuracy Optical Flow via Adaptive-Aware Correlation Recurrent Network
9078	--	9089	Lin Zhang, Bo Zhang 0069, Botian Shi, Jiayuan Fan 0001, Tao Chen 0003. Few-Shot Cross-Domain Object Detection With Instance-Level Prototype-Based Meta-Learning
9090	--	9101	Xingyu Chen, Jiaxu Liu, Zeyang Liu, Lipeng Wan 0003, Xuguang Lan, Nanning Zheng 0001. Knowledge Graph Enhancement for Fine-Grained Zero-Shot Learning on ImageNet21K
9102	--	9111	Xiantao Hu, Bineng Zhong, Qihua Liang, Shengping Zhang, Ning Li, Xianxian Li. Toward Modalities Correlation for RGB-T Tracking
9112	--	9124	Yuan-Ming Li, Ling-An Zeng, Jingke Meng, Wei-Shi Zheng 0001. Continual Action Assessment via Task-Consistent Score-Discriminative Feature Distribution Modeling
9125	--	9138	Xiao Lin, Minghao Zhu, Ronghao Dang, Guangliang Zhou, Shaolong Shu, Feng Lin 0001, Chengju Liu, Qijun Chen. CLIPose: Category-Level Object Pose Estimation With Pre-Trained Vision-Language Knowledge
9139	--	9152	Guolong Sun, Zhitong Xiong, Yuan Yuan 0001. Detail-Preserving and Diverse Image Translation for Adverse Visual Object Detection
9153	--	9165	Menghao Tan, Weifeng Gao, Hong Li 0007, Jin Xie 0003, Maoguo Gong. Universal Binary Neural Networks Design by Improved Differentiable Neural Architecture Search
9166	--	9180	Yuming Yan, Huimin Yu, Yubin Wang, Shuyi Song, Weihu Huang, Juncan Jin. Unified Stability and Plasticity for Lifelong Person Re-Identification in Cloth-Changing and Cloth-Consistent Scenarios
9181	--	9194	Hongbin Xu, Weitao Chen, Baigui Sun, Xuansong Xie, Wenxiong Kang. RobustMVS: Single Domain Generalized Deep Multi-View Stereo
9195	--	9208	Huilong Xie, Wenwei Song, Wenxiong Kang. Learning an Augmented RGB Representation for Dynamic Hand Gesture Authentication
9209	--	9222	Xiaoqin Zhang 0002, Yuewang Xu, Tao Wang 0052, Tangfei Liao. Multi-Prior Driven Network for RGB-D Salient Object Detection
9223	--	9236	Qibo Chen, Baozhen Ge, Jianing Quan. Unambiguous Pyramid Cost Volumes Fusion for Stereo Matching
9237	--	9249	Zhen Zhou, Qing Zhu, Mingtao Feng, Yaonan Wang 0001, Jianqiao Luo, Zhiqiang Miao, Lin Chen, Yang Mo. Unsupervised Homography Estimation With Pixel-Level SVDD
9250	--	9263	Zezong Zhang, Jianeng Tang, Feng Zhang, Tingting Huang, Mingsheng Lu. Medical Image Encryption Based on Josephus Scrambling and Dynamic Cross-Diffusion for Patient Privacy Security
9264	--	9280	Chenxi Song, Shigang Wang, Jian Wei, Yan Zhao 0012. FewarNet: An Efficient Few-Shot View Synthesis Network Based on Trend Regularization
9281	--	9297	Yaofo Chen, Yong Guo, Daihai Liao, Fanbing Lv, Hengjie Song, James Tin-Yau Kwok, Mingkui Tan. Automated Dominative Subspace Mining for Efficient Neural Architecture Search
9298	--	9310	Jiwei Shen, Shujing Lyu, Yue Lu 0001. LithoPW: Leveraging Visual Memory Encoding and Defect-Aware Optimization for Precise Determination of the Lithography Process Windows
9311	--	9325	Liuhao Zhu, Yixiang Fang, Yi Zhao, Yi Peng, Junxiang Wang, Jiangqun Ni. Lite Localization Network and DUE-Based Watermarking for Color Image Copyright Protection
9326	--	9340	Zhenlei Dai, Liangchen Hu, HuaiJiang Sun. Block Diagonal Graph Embedded Discriminative Regression for Image Representation
9341	--	9355	Weiqi Li, Bin Chen, Shuai Liu, Shijie Zhao, Bowen Du 0002, Yongbing Zhang, Jian Zhang. 2-Net: Dual-Domain Deep Convolutional Coding Network for Compressive Sensing
9356	--	9370	Yule Duan, Chuang Chen, Maixia Fu, Yinsheng Li, Xiuwen Gong, Fulin Luo. Dimensionality Reduction via Multiple Neighborhood-Aware Nonlinear Collaborative Analysis for Hyperspectral Image Classification
9371	--	9385	Renzhong Qiao, Hongbing Ji, Zhigang Zhu 0002, Wenbo Zhang 0007. Local-to-Global Semantic Learning for Multi-View 3D Object Detection From Point Cloud
9386	--	9399	Dingyi Li, Yu Liu 0023, Zengfu Wang, Jian Yang 0003. Video Rescaling With Recurrent Diffusion
9400	--	9413	Jiaqi Cui, Yan Wang 0015, Luping Zhou, Yuchen Fei, Jiliu Zhou, Dinggang Shen. 3D Point-Based Multi-Modal Context Clusters GAN for Low-Dose PET Image Denoising
9414	--	9427	Shaoqian Wang, Bo Li 0090, Yuchao Dai. Efficient Multi-View Stereo by Dynamic Cost Volume and Cross-Scale Propagation
9428	--	9444	Fan Wang, Xiang Zhang 0023, Zhangjie Fu. An Iterative Two-Stage Probability Adjustment Strategy With Progressive Incremental Searching for Image Steganography
9445	--	9457	Yanan Liu, Yanqiu Li, Hao Zhang 0110, Xuejie Zhang 0002, Dan Xu 0001. Decoupled Knowledge Embedded Graph Convolutional Network for Skeleton-Based Human Action Recognition
9458	--	9471	Hu Gao, Jing Yang, Ying Zhang, Ning Wang, Jingfan Yang, Depeng Dang. Prompt-Based Ingredient-Oriented All-in-One Image Restoration
9472	--	9483	Dong Huang 0001, Xiaozhi Deng, Ding-Hua Chen, Zihao Wen, Weijun Sun, Chang-Dong Wang, Jian-Huang Lai. Deep Clustering With Hybrid-Grained Contrastive and Discriminative Learning
9484	--	9498	Hui Luo, Shuhai Zhang, Zhuangwei Zhuang, Jiajie Mai, Mingkui Tan, Jianlin Zhang 0001. Learning to Generate Diverse Data From a Temporal Perspective for Data-Free Quantization
9499	--	9514	Shalayiding Sirejiding, Bayram Bayramli, Yuxiang Lu, Suizhi Huang, Hongtao Lu, Yue Ding 0001. Adaptive Task-Wise Message Passing for Multi-Task Learning: A Spatial Interaction Perspective
9515	--	9527	Qiuping Jiang, Feiyang Liu, Zhihua Wang, Shiqi Wang 0001, Weisi Lin. Rethinking and Conceptualizing Just Noticeable Difference Estimation by Residual Learning
9528	--	9539	Pan Liu, Yongqiang Zhao 0001, Kai-Feng, Seong G. Kong. Physics-Driven Multispectral Filter Array Pattern Optimization and Hyperspectral Image Reconstruction
9540	--	9549	Siyang Dai, Jun Liu 0036, Ngai-Man Cheung. Uncertainty-Aware Pedestrian Crossing Prediction via Reinforcement Learning
9550	--	9561	Junteng Zhang, Junzhe Zhang, Wenxi Ma, Dandan Ding, Zhan Ma. Content-Aware Rate Control for Geometry-Based Point Cloud Compression
9562	--	9577	Yangke Ying, Jin Wang, Yunhui Shi, Nam Ling, Baocai Yin. Dual-Domain Feature Fusion and Multi-Level Memory-Enhanced Network for Spectral Compressive Imaging
9578	--	9590	Kai Xu 0012, Lichun Wang 0002, Shuang Li, Jianjia Xin, Baocai Yin. Self-Distillation With Augmentation in Feature Space
9591	--	9605	Hengyu Man, Xiaopeng Fan, Riyu Lu, Chang Yu, Debin Zhao. MetaIP: Meta-Network-Based Intra Prediction With Customized Parameters for Video Coding
9606	--	9619	Daxin Li, Yuanchao Bai, Kai Wang, Junjun Jiang, Xianming Liu, Wen Gao 0001. GroupedMixer: An Entropy Model With Group-Wise Token-Mixers for Learned Image Compression
9620	--	9632	Hanyue Tu, Li Li 0040, Wengang Zhou, Houqiang Li. Toward On-Demand Transmission: Joint Feature and Image Coding With Reversible Neural Networks
9633	--	9646	Yiting Shao, Xiaodong Yang, Wei Gao 0003, Shan Liu 0001, Ge Li 0002. 3D Point Cloud Attribute Compression Using Diffusion-Based Texture-Aware Intra Prediction
9647	--	9663	Ziqing Ge, Siwei Ma, Wen Gao 0001, Jingshan Pan, Chuanmin Jia. NLIC: Non-Uniform Quantization-Based Learned Image Compression
9664	--	9677	Fengling Li, Bowen Wang, Lei Zhu 0002, Jingjing Li 0001, Zheng Zhang 0006, Xiaojun Chang. Cross-Domain Transfer Hashing for Efficient Cross-Modal Retrieval
9678	--	9691	Guoxin Xiong, Meng Meng, Tianzhu Zhang, Dongming Zhang, Yongdong Zhang 0001. Reference-Aware Adaptive Network for Image-Text Matching
9692	--	9705	Sheng Fang, Tiantian Dang, Shuhui Wang, Qingming Huang. Linguistic Hallucination for Text-Based Video Retrieval
9706	--	9717	Wenrui Li, Ruiqin Xiong, Xiaopeng Fan. Multi-Layer Probabilistic Association Reasoning Network for Image-Text Retrieval
9718	--	9731	Sheng Liu, Annan Li, Yuwei Zhao, Jiahao Wang, Yunhong Wang. EvCap: Element-Aware Video Captioning
9732	--	9744	Linhao Qu, Yingfan Ma, Xiaoyuan Luo, Qinhao Guo, Manning Wang, Zhijian Song. Rethinking Multiple Instance Learning for Whole Slide Image Classification: A Good Instance Classifier Is All You Need
9745	--	9756	Zhaohuan Zhan, Jinghui Qin, Wei Zhuo 0006, Guang Tan. Enhancing Vision and Language Navigation With Prompt-Based Scene Knowledge
9760	--	9773	Weihong Ren, Jinguo Luo, Weibo Jiang, Liangqiong Qu, Zhi Han, Jiandong Tian, Honghai Liu 0001. Learning Self- and Cross-Triplet Context Clues for Human-Object Interaction Detection
9774	--	9785	Ning Li, Bineng Zhong, Yaozong Zheng, Qihua Liang, Zhiyi Mo, Shuxiang Song. Robust Tracking via Combing Top-Down and Bottom-Up Attention
9786	--	9797	Xun Gong 0002, Xuan Tan, Yang Xiang. Contrastive Mean Teacher for Intra-Camera Supervised Person Re-Identification
9798	--	9807	MingQi Lu, Siyuan Yang, Xiaobo Lu, Jun Liu 0036. Cross-Modal Contrastive Pre-Training for Few-Shot Skeleton Action Recognition
9808	--	9821	Hu Huang, Shuiping Gou, Ruimin Li, Xinbo Gao 0001. Joint-Wise Temporal Self-Similarity Periodic Selection Network for Repetitive Fitness Action Counting
9822	--	9835	KyuJin Shim, Junyoung Byun, Kangwook Ko, Jubi Hwang, Changick Kim. Enhancing Robustness of Multi-Object Trackers With Temporal Feature Mix
9836	--	9851	Zihao Dong, Zizhen Liu, Runmin Cong, Tiyu Fang, Xiuli Shao, Sam Kwong. UAFer: A Unified Model for Class-Agnostic Binary Segmentation With Uncertainty-Aware Feature Reassembly
9852	--	9865	Lorenzo Papa, Paolo Russo 0001, Irene Amerini. D4D: An RGBD Diffusion Model to Boost Monocular Depth Estimation
9866	--	9881	Jiaping Lin, Gang Liang, Rongchuan Zhang. LTTrack: Rethinking the Tracking Framework for Long-Term Multi-Object Tracking
9882	--	9897	Chengxing Lin, Wenju Xu, Jian Zhu 0001, Yongwei Nie, Ruichu Cai, Xuemiao Xu. PatchMixing Masked Autoencoders for 3D Point Cloud Self-Supervised Learning
9898	--	9909	Yi He, Lei Yang, Shilin Wang, Alan Wee-Chung Liew. Lip Feature Disentanglement for Visual Speaker Authentication in Natural Scenes
9910	--	9924	Yijing Dai, Yingjian Li, Dongpeng Chen, Jinxing Li, Guangming Lu. Multimodal Decoupled Distillation Graph Neural Network for Emotion Recognition in Conversation
9925	--	9938	Rui Ding, Meng Yang 0002, Nanning Zheng 0001. Selective Transfer Learning of Cross-Modality Distillation for Monocular 3D Object Detection
9939	--	9953	Shengyu Hou, Mengyin Fu, Rongchuan Wang, Yi Yang 0009, Wenjie Song 0001. Self-Supervised Monocular Depth Estimation for All-Day Images Based on Dual-Axis Transformer
9954	--	9966	Hang Yao, Qiguang Miao, Peipei Zhao, Chaoneng Li, Xin Li, Guanwen Feng, Ruyi Liu. Exploration of Class Center for Fine-Grained Visual Classification
9967	--	9978	Haoran Wang, Qinghua Cheng, Baosheng Yu, Yibing Zhan, Dapeng Tao, Liang Ding 0006, Haibin Ling. Free-Form Composition Networks for Egocentric Action Recognition
9979	--	9996	Qin Yang, Wenxuan Gao, Chenglin Li, Hao Wang 0183, Wenrui Dai, Junni Zou, Hongkai Xiong, Pascal Frossard. 360Spred: Saliency Prediction for 360-Degree Videos Based on 3D Separable Graph Convolutional Networks
9997	--	10010	Zhuo Chen, Xudong Xu, Yichao Yan, Ye Pan, Wenhan Zhu, Wayne Wu, Bo Dai 0002, Xiaokang Yang. HyperStyle3D: Text-Guided 3D Portrait Stylization via Hypernetworks
10011	--	10022	Zhiqin Zhu, Renzhong Zheng, Guanqiu Qi, Shuang Li, Yuanyuan Li, Xinbo Gao 0001. Small Object Detection Method Based on Global Multi-Level Perception and Dynamic Region Aggregation
10023	--	10035	JianXiong Zhou, Ying Wu 0001. Outlier-Probability-Based Feature Adaptation for Robust Unsupervised Anomaly Detection on Contaminated Training Data
10036	--	10049	Xuelin Zhu, Jianshu Li, Jiuxin Cao, Dongqi Tang, Jian Liu, Bo Liu 0004. Semantic-Guided Representation Enhancement for Multi-Label Image Classification
10050	--	10062	Chunlei Peng, Bo Wang, Decheng Liu, Nannan Wang 0001, Ruimin Hu, Xinbo Gao 0001. MRLReID: Unconstrained Cross-Resolution Person Re-Identification With Multi-Task Resolution Learning
10063	--	10076	Wanying Zhang, Mengyuan Liu, Xinshun Wang, Shen Zhao, Can Wang 0006. CHAMP: A Large-Scale Dataset for Skeleton-Based Composite HumAn Motion Prediction
10077	--	10091	Xiaoqin Zhang 0002, Hongqi Yu, Yong Qin, Xiaolong Zhou 0001, Sixian Chan. Video-Based Multi-Camera Vehicle Tracking via Appearance-Parsing Spatio-Temporal Trajectory Matching Network
10092	--	10106	Zhi-Long Han, Ting-Zhu Huang, Xi-Le Zhao, Hao Zhang, Wei-Hao Wu. Nested Fully-Connected Tensor Network Decomposition for Multi-Dimensional Visual Data Recovery
10107	--	10120	Linwei Fan, Jin Cui, Huiyu Li, Xiaoyu Yan, Hui Liu 0016, Caiming Zhang 0001. Complementary Blind-Spot Network for Self-Supervised Real Image Denoising
10121	--	10134	Mingkai Qiu, Yuhuan Lu, Xiying Li, Qiang Lu. Camera-Aware Differentiated Clustering With Focal Contrastive Learning for Unsupervised Vehicle Re-Identification
10135	--	10151	Mohsen Jenadeleh, Raouf Hamzaoui, Ulf-Dietrich Reips, Dietmar Saupe. Crowdsourced Estimation of Collective Just Noticeable Difference for Compressed Video With the Flicker Test and QUEST+
10152	--	10165	Zetao Shi, Yuenan Li 0001, Feiyang Zhang. Reflection Removal via Recurrent Learning Guided by Physics Prior and Focal Perceptual Loss
10166	--	10181	Ling Li, Yan Zhang, Lin Yuan, Xinbo Gao 0001. PLGNet: Prior-Guided Local and Global Interactive Hybrid Network for Face Super-Resolution
10182	--	10193	Can Xu, Le Hui, Yuehui Han, Haobo Jiang, Jiaxin Chen, Jin Xie 0001, Jian Yang 0003. Learning Local Semantic Region Activations for Weakly Supervised Object Localization
10194	--	10207	Zijian Liu, Xiaoheng Deng, Ping Jiang, Conghao Lv, Geyong Min, Xin Wang. Edge Perception Camouflaged Object Detection Under Frequency Domain Reconstruction
10208	--	10222	Wanyun Li, Jack Fan, Pinxue Guo, Lingyi Hong, Wei Zhang. HFVOS: History-Future Integrated Dynamic Memory for Video Object Segmentation
10223	--	10236	Cong Zhang, Honggang Qi, Shuhui Wang, Yuezun Li, Siwei Lyu. COMICS: End-to-End Bi-Grained Contrastive Learning for Multi-Face Forgery Detection
10237	--	10249	Zhiqiang Kou, Jing Wang 0113, Yuheng Jia, Xin Geng 0001. Inaccurate Label Distribution Learning
10250	--	10265	Jiaxi Liu, Jinghao Niu, Weifeng Li, Xin Li, Binbin He, Hao Zhou, Yanjuan Liu, Ding Li, Bo Wang, Wensheng Zhang 0002. XFMP: A Benchmark for Explainable Fine-Grained Abnormal Behavior Recognition on Medical Personal Protective Equipment
10266	--	10280	Wentao Zou, Xiao Lu 0002, Zhilv Yi, Ling Zhang, Gang Fu, Ping Li 0016, Chunxia Xiao. Eyeglass Reflection Removal With Joint Learning of Reflection Elimination and Content Inpainting
10281	--	10298	Deyang Wu, Xinpeng Zhang 0001, Jiayan Wang, Li Li, Guorui Feng. Novel Robust Video Watermarking Scheme Based on Concentric Ring Subband and Visual Cryptography With Piecewise Linear Chaotic Mapping
10299	--	10309	Huasheng Wang, Jiang Liu, Hongchen Tan, Jianxun Lou, Xiaochang Liu, Wei Zhou 0021, Hantao Liu. Blind Image Quality Assessment via Adaptive Graph Attention
10310	--	10325	Xinyi Wu, Santiago López-Tapia, Xijun Wang 0003, Rafael Molina 0001, Aggelos K. Katsaggelos. Real-Time Lightweight Video Super-Resolution With RRED-Based Perceptual Constraint
10326	--	10338	Ziyang Hong, C. Patrick Yue. Real-Time 3D Visual Perception by Cross-Dimensional Refined Learning
10339	--	10352	Wang Liu, Wei Gao 0003, Ge Li 0002, Siwei Ma, Tiesong Zhao, Hui Yuan 0001. Enlarged Motion-Aware and Frequency-Aware Network for Compressed Video Artifact Reduction
10353	--	10367	Daixun Li, Weiying Xie, Zixuan Wang, Yibing Lu, Yunsong Li, Leyuan Fang. FedDiff: Diffusion Model Driven Federated Learning for Multi-Modal and Multi-Clients
10368	--	10384	Jiaxuan Zhao, Licheng Jiao, Chao Wang, Xu Liu 0006, Fang Liu 0001, Lingling Li 0002, Mengru Ma, Shuyuan Yang. Knowledge Guided Evolutionary Transformer for Remote Sensing Scene Classification
10385	--	10398	Chunyan She, Fujun Han, Lidan Wang 0001, Shukai Duan, Tingwen Huang. MPC-Net: Multi-Prior Collaborative Network for Low-Light Image Enhancement
10399	--	10410	Wansen Wu, Meng Cao, Yue Hu, Yong Peng 0006, Long Qin, Quanjun Yin. Visual Grounding With Dual Knowledge Distillation
10411	--	10423	Zhiqi Pang, Lingling Zhao, Yang Liu, Gaurav Sharma 0001, Chunyu Wang. Inter-Modality Similarity Learning for Unsupervised Multi-Modality Person Re-Identification
10424	--	10436	Yue Que, Li Xiong 0018, Weiguo Wan, Xue Xia, Zhiwei Liu. Denoising Diffusion Probabilistic Model for Face Sketch-to-Photo Synthesis
10437	--	10448	Shenghao Li, Zezeng Li, Zhanpeng Wang, Zebin Xu, Na Lei, Zhongxuan Luo. Measure-Driven Neural Solver for Optimal Transport Mapping
10449	--	10463	Xianyao You, Caiyun Liu, Jun Li, Yan Sun, Ximeng Liu. FedMDO: Privacy-Preserving Federated Learning via Mixup Differential Objective
10464	--	10478	Hui Liu 0016, Gongguan Chen, Meng Liu 0006, Liqiang Nie. Pre-Trained Transformer-Based Parallel Multi-Channel Adaptive Image Sequence Interpolation Network
10479	--	10493	Wu Chen, Qiuping Jiang, Wei Zhou 0021, Long Xu, Weisi Lin. Dynamic Hypergraph Convolutional Network for No-Reference Point Cloud Quality Assessment
10494	--	10506	Yahui Xu, Jiwei Wei, Yi Bin, Yang Yang 0002, Zeyu Ma, Heng Tao Shen. Set of Diverse Queries With Uncertainty Regularization for Composed Image Retrieval
10507	--	10520	Yang Liu, Fang Liu 0001, Licheng Jiao, Qianyue Bao, Long Sun, Shuo Li 0010, Lingling Li 0002, Xu Liu 0006. Multi-Grained Gradual Inference Model for Multimedia Event Extraction

2	--	16	Shuo Ye, Yu Wang, Qinmu Peng, Xinge You, C. L. Philip Chen. The Image Data and Backbone in Weakly Supervised Fine-Grained Visual Categorization: A Revisit and Further Thinking
17	--	33	Xuekai Wei, Mingliang Zhou, Heqiang Wang, Haoyan Yang, Lei Chen, Sam Kwong. Recent Advances in Rate Control: From Optimization to Implementation and Beyond
34	--	45	Cong Wu, Xiaojun Wu 0001, Tianyang Xu, Zhongwei Shen, Josef Kittler. Motion Complement and Temporal Multifocusing for Skeleton-Based Action Recognition
46	--	59	Rongtao Xu, Changwei Wang, Shibiao Xu, Weiliang Meng, Yuyang Zhang, Bin Fan 0001, Xiaopeng Zhang 0001. DomainFeat: Learning Local Features With Domain Adaptation
60	--	70	Guoqing Zhang 0002, Wenxuan Fang, Yuhui Zheng, Ruili Wang. SDBAD-Net: A Spatial Dual-Branch Attention Dehazing Network Based on Meta-Former Paradigm
71	--	84	Yuenan Li, Jin Wu, Zetao Shi. Lightweight Neural Network for Enhancing Imaging Performance of Under-Display Camera
85	--	96	Yu Luo 0004, Bijia You, Guanghui Yue 0001, Jie Ling 0002. Pseudo-Supervised Low-Light Image Enhancement With Mutual Learning
97	--	109	Hang Cheng, Xibin Li, Huaxiong Wang, Xinpeng Zhang 0001, Ximeng Liu, Meiqing Wang, Fengyong Li. DeepDIST: A Black-Box Anti-Collusion Framework for Secure Distribution of Deep Models
110	--	123	Zhichao Ye, Chong Bao, Xin Zhou, Haomin Liu, Hujun Bao, Guofeng Zhang 0001. EC-SfM: Efficient Covisibility-Based Structure-From-Motion for Both Sequential and Unordered Images
124	--	139	Da Yu, Mingyi Zhang 0004, Mantian Li, Fusheng Zha, Junge Zhang, Lining Sun, Kaiqi Huang. Contrastive Correlation Preserving Replay for Online Continual Learning
140	--	152	Satoshi Kosugi, Toshihiko Yamasaki. Personalized Image Enhancement Featuring Masked Style Modeling
153	--	167	Xiaoyi Zhou, Kaiyue Hou, Yu-Jian Zhuang, Zhaoxia Yin, Wenbao Han. General Pairwise Modification Framework for Reversible Data Hiding in JPEG Images
168	--	181	Xin Feng, Haobo Ji, Wenjie Pei, Jinxing Li, Guangming Lu, David Zhang 0001. U²-Former: Nested U-Shaped Transformer for Image Restoration via Multi-View Contrastive Learning
182	--	194	Shaochuan Zhao, Tianyang Xu, Xiaojun Wu 0001, Josef Kittler. Distillation, Ensemble and Selection for Building a Better and Faster Siamese Based Tracker
195	--	206	Lin Li 0065, Jun Xiao 0001, Hanrong Shi, Wenxiao Wang 0001, Jian Shao, An-An Liu, Yi Yang, Long Chen 0016. Label Semantic Knowledge Distillation for Unbiased Scene Graph Generation
207	--	220	Yufan Hu, Jie Fu, Mengyuan Chen, Junyu Gao 0002, Jianfeng Dong, Bin Fan 0001, Hongmin Liu 0001. Learning Proposal-Aware Re-Ranking for Weakly-Supervised Temporal Action Localization
221	--	234	Guangqian Guo, Pengfei Chen 0004, Xuehui Yu, Zhenjun Han, Qixiang Ye, Shan Gao 0003. Save the Tiny, Save the All: Hierarchical Activation Network for Tiny Object Detection
235	--	247	HuiHui Yue, Jichang Guo, Xiangjun Yin, Yi Zhang, Bihan Wen, Chongyi Li. Salient Object Detection Toward Single-Pixel Imaging
248	--	259	Binwei Xu, Haoran Liang, Weihua Gong, Ronghua Liang, Peng Chen 0008. A Visual Representation-Guided Framework With Global Affinity for Weakly Supervised Salient Object Detection
260	--	273	Taiyi Su, Hanli Wang, Qiuping Qi, Lei Wang, Bin He 0003. Transductive Learning With Prior Knowledge for Generalized Zero-Shot Action Recognition
274	--	285	Zhihao Jin, Yifan Wang, Qicong Wang, Yehu Shen, Hongying Meng. SSRL: Self-Supervised Spatial-Temporal Representation Learning for 3D Action Recognition
286	--	298	Jiayu Xu, Ailiang Lin, Jinxing Li, Guangming Lu. Text Position-Aware Pixel Aggregation Network With Adaptive Gaussian Threshold: Detecting Text in the Wild
299	--	314	Haifeng Sun 0001, Xiaozheng Zheng, Pengfei Ren, Jingyu Wang 0001, Qi Qi 0001, Jianxin Liao. SMR: Spatial-Guided Model-Based Regression for 3D Hand Pose and Mesh Reconstruction
315	--	328	Fen Fang, Wenyu Liang, Yi Cheng, Qianli Xu, Joo-Hwee Lim. Enhancing Representation Learning With Spatial Transformation and Early Convolution for Reinforcement Learning-Based Small Object Detection
329	--	341	Cheng Feng, Zhen Chen 0004, Congxuan Zhang, Weiming Hu, Bing Li 0001, Feng Lu. IterDepth: Iterative Residual Refinement for Outdoor Self-Supervised Multi-Frame Monocular Depth Estimation
342	--	356	Wei Zhou 0042, Zhijie Zheng, Tao Su, Haifeng Hu 0001. DATran: Dual Attention Transformer for Multi-Label Image Classification
357	--	370	Kaixiang Chen, Tiantian Gong, Liyan Zhang 0001. Camera-Aware Recurrent Learning and Earth Mover's Test-Time Adaption for Generalizable Person Re-Identification
371	--	383	Yuhang Zhang, Shishun Tian, Muxin Liao, Zhengyu Zhang, Wenbin Zou, Chen Xu 0004. Fine-Grained Self-Supervision for Generalizable Semantic Segmentation
384	--	396	Kai Xu, Lichun Wang 0002, Jianjia Xin, Shuang Li, Baocai Yin. Learning From Teacher's Failure: A Reflective Learning Paradigm for Knowledge Distillation
397	--	410	Aixuan Li, Yuxin Mao, Jing Zhang 0052, Yuchao Dai. Mutual Information Regularization for Weakly-Supervised RGB-D Salient Object Detection
411	--	423	Xinwen Fan, Yukang Zhang, Yang Lu 0009, Hanzi Wang. PARFormer: Transformer-Based Multi-Task Network for Pedestrian Attribute Recognition
424	--	437	Li Ding, Xiang Song, Yuhang He, Changxin Wang, Songlin Dong, Xing Wei, Yihong Gong. Domain Incremental Object Detection Based on Feature Space Topology Preserving Strategy
438	--	447	Kexue Fu, Mingzhi Yuan, Shaolei Liu, Manning Wang. Boosting Point-BERT by Multi-Choice Tokens
448	--	460	Yefan Xie, Xuan Hou, Yanwei Guo, Xiuying Wang, Jiangbin Zheng. Joint-Guided Distillation Binary Neural Network via Dynamic Channel-Wise Diversity Enhancement for Object Detection
461	--	474	Wenwei Song, Wenxiong Kang, Liang Lin. Hand Gesture Authentication by Discovering Fine-Grained Spatiotemporal Identity Characteristics
475	--	489	Zhaodong Chen, Hongbing Ji, YongQuan Zhang, Zhigang Zhu, Yifan Li. High-Resolution Feature Pyramid Network for Small Object Detection on Drone View
490	--	503	Chunyang Xie, Dongheng Zhang, Zhi Wu, Cong Yu 0011, Yang Hu 0006, Yan Chen 0007. RPM 2.0: RF-Based Pose Machines for Multi-Person 3D Pose Estimation
504	--	517	Pengcheng Guo, Yonghong Song, Yongbiao Deng, Kangkang Xie, Mingjie Xu, Jiahao Liu, Haijun Ren. DCMAI: A Dynamical Cross-Modal Alignment Interaction Framework for Document Key Information Extraction
518	--	533	Jia Qi, Tengfei Liang, Wu Liu, Yidong Li, Yi Jin 0001. A Generative-Based Image Fusion Strategy for Visible-Infrared Person Re-Identification
534	--	548	Liqian Zhang, Qing Zhang 0004. Salient Object Detection With Edge-Guided Learning and Specific Aggregation
549	--	560	Chengyi Zou, Shuai Wan, Tiannan Ji, Marc Górriz Blanch, Marta Mrak, Luis Herranz. Chroma Intra Prediction With Lightweight Attention-Based Neural Networks
561	--	575	Junhao Feng, Guohua Wang, Changmeng Zheng, Yi Cai 0001, Ze Fu, Yaowei Wang 0001, Xiao-Yong Wei, Qing Li 0001. Towards Bridged Vision and Language: Learning Cross-Modal Knowledge Representation for Relation Extraction
576	--	589	Yadong Huo, Qibing Qin, Jiangyan Dai, Lei Wang, Wenfeng Zhang, Lei Huang 0010, Chengduan Wang. Deep Semantic-Aware Proxy Hashing for Multi-Label Cross-Modal Retrieval
590	--	602	Daiki Okamura, Ryosuke Harakawa, Masahiro Iwahashi. LCNME: Label Correction Using Network Prediction Based on Memorization Effects for Cross-Modal Retrieval With Noisy Labels
603	--	617	Fan Yang 0071, Meng Han, Fumin Ma, Yufeng Liu, Xiaojian Ding, Deyu Tong. Disperse Asymmetric Subspace Relation Hashing for Cross-Modal Retrieval
618	--	631	Yuhong Wu, Runwen Hu, Shijun Xiang. PVO-Based Reversible Data Hiding Using Global Sorting and Fixed 2D Mapping Modification
632	--	646	Xin Cheng, Jinwei Wang, Hao Wang 0060, Xiangyang Luo, Bin Ma 0003. Quantization Step Estimation of Color Images Based on Res2Net-C With Frequency Clustering Prior Knowledge
647	--	660	Yunheng Li, Kai-Yuan Liu, Sheng-lan Liu, Lin Feng 0001, Hong Qiao. Involving Distinguished Temporal Graph Convolutional Networks for Skeleton-Based Temporal Action Segmentation

External Links

Journal: IEEE Trans. Circuits Syst. Video Techn.

Volume 34, Issue 9

Volume 34, Issue 8

Volume 34, Issue 7

Volume 34, Issue 6

Volume 34, Issue 5

Volume 34, Issue 4

Volume 34, Issue 3

Volume 34, Issue 2

Volume 34, Issue 12

Volume 34, Issue 11

Volume 34, Issue 10

Volume 34, Issue 1