IEEE Trans. Circuits Syst. Video Techn.

researchr

You are not signed in
Sign in
Sign up

8436	--	8451	Chenyu Wang, Shuo Yan, Yixuan Chen 0003, Xianwei Wang, Yujiang Wang 0001, Mingzhi Dong, Xiaochen Yang, Dongsheng Li 0002, Rui Zhu 0006, David A. Clifton, Robert P. Dick, Qin Lv, Fan Yang 0001, Tun Lu, Ning Gu, Li Shang. Denoising Reuse: Exploiting Inter-Frame Motion Consistency for Efficient Video Generation
8452	--	8465	Qingsen Yan, Tao Hu, Peng Wu 0015, Duwei Dai, Shuhang Gu, Wei Dong 0010, Yanning Zhang 0001. Efficient Image Enhancement With a Diffusion-Based Frequency Prior
8466	--	8477	Jiaming Liu, Linghe Kong, Yue Wu 0004, Maoguo Gong, Hao Li 0009, Qiguang Miao, Wenping Ma 0001, Can Qin. Triple Point Masking
8478	--	8494	Jiajie Yu, Xing Lu, Lijun Guo, Chong Wang 0001, Guoqi Li, Jiangbo Qian. Event-Based Video Reconstruction Via Spatial-Temporal Heterogeneous Spiking Neural Network
8495	--	8507	Bangzhen Liu, Yangyang Xu, Cheng Xu, Xuemiao Xu, Shengfeng He. Open-Set Mixed Domain Adaptation via Visual-Linguistic Focal Evolving
8508	--	8519	Nuo Chen, Chushu Zhang, Wei An 0003, Longguang Wang, Miao Li, Qiang Ling 0002. Event-Based Motion Deblurring With Blur-Aware Reconstruction Filter
8520	--	8532	Fang-Yi Liang, Yu-Wei Zhan, Jiale Liu, Chong-Yu Zhang, Zhen-Duo Chen 0001, Xin Luo 0006, Xin-Shun Xu. Class-Aware Prompting for Federated Few-Shot Class-Incremental Learning
8533	--	8544	Zhigang Chen, Benjia Zhou, Yiqing Huang, Jun Wan 0001, Yibo Hu 0001, Hailin Shi, Yanyan Liang 0001, Zhen Lei 0001, Du Zhang. 2RL: Content and Context Representation Learning for Gloss-Free Sign Language Translation and Retrieval
8545	--	8558	Pin-Hung Kuo, Jinshan Pan, Shao-Yi Chien, Ming-Hsuan Yang 0001. Efficient Non-Blind Image Deblurring With Discriminative Shrinkage Deep Networks
8559	--	8573	Jun Chen 0013, He Wang, Zhifeng Hao, Zemin Cai, Ling Mei, Tianshu Liu. Flow Visualization for Complex Fluid Flows via a Structure-Enhanced Motion Estimator
8574	--	8585	Keyi Zhou, Li Li 0040, Wengang Zhou 0001, Yonghui Wang, Hao Feng 0009, Houqiang Li. LaneTCA: Enhancing Video Lane Detection With Temporal Context Aggregation
8586	--	8597	Zezeng Li, Zhihui Qi, Weimin Wang 0007, Ziliang Wang, Junyi Duan, Na Lei. Point2Quad: Generating Quad Meshes From Point Clouds via Face Prediction
8598	--	8613	Shuze Geng, Yifan Liu, Zijin Wang, Gang Yan 0001, Yang Yu 0022, Yingchun Guo. Pose-Skeleton Guided Cross-Attention Representation Fusion for Occluded Pedestrian Re-Identification
8614	--	8626	Pengfei Fang, Qiang Xu, Zixuan Lin, Hui Xue 0002. On Modulating Motion-Aware Visual-Language Representation for Few-Shot Action Recognition
8627	--	8638	Quan Wan, Maofa Wang, Weifeng Shan, Bin Wang, Lu Zhang, Zhixiong Leng, Bingchen Yan, Yanlin Xu, Huiling Chen. Meta-Learning With Task-Adaptive Selection
8639	--	8652	Tong Ning, Ke Lu 0002, Xirui Jiang, Hongjuan Pei, Jian Xue 0002. DinoQuery: Promoting Small 3D Object Detection With Textual Prompt
8653	--	8665	Ping Li 0006, Xingchao Ye, Lingfeng He. Coarse-to-Fine Hypergraph Network for Spatiotemporal Action Detection
8666	--	8678	Chao Qu, Zewei Chen, Jingyuan Zhang, Xiaoyu Chen 0003, Jing Han 0009. Self-BSR: Self-Supervised Image Denoising and Destriping Based on Blind-Spot Regularization
8679	--	8691	Mianzhao Wang, Fan Shi 0001, Xu Cheng 0003, Shengyong Chen. Prior Knowledge-Driven Hybrid Prompter Learning for RGB-Event Tracking
8692	--	8706	Wuzhen Shi, Zibang Xue, Yang Wen. Keypoints and Action Units Jointly Drive Talking Head Generation for Video Conferencing
8707	--	8722	Kong Li, Zhe Dai, Hua Cui, Xuan Wang 0021, Huansheng Song. VRAR: Video-Radar Automatic Registration Method Based on Trajectory Spatiotemporal Features and Bidirectional Mapping
8723	--	8737	Ying Zhang 0063, Puhong Duan, Lianhui Liang, Xudong Kang, Jun Li 0009, Antonio Plaza. PFS3F: Probabilistic Fusion of Superpixel-Wise and Semantic-Aware Structural Features for Hyperspectral Image Classification
8738	--	8753	Lei Fan, Qi Yang 0002, Hongqiang Wang 0001, Yuliang Qin, Bin Deng 0002. Sequential Ground Moving Target Imaging Based on Hybrid ViSAR-ISAR Image Formation in Terahertz Band
8754	--	8766	Kangdao Liu, Tianhao Sun, Hao Zeng 0005, Yongshan Zhang, Chi-Man Pun, Chi-Man Vong. Spatial-Aware Conformal Prediction for Trustworthy Hyperspectral Image Classification
8767	--	8779	Dan Song 0006, Xinwei Fu, Ning Liu, Wei-Zhi Nie, Wenhui Li 0001, Lanjun Wang, You Yang, An-An Liu. MV-CLIP: Multi-View CLIP for Zero-Shot 3D Shape Recognition
8780	--	8793	Xiao Cui, Weicai Ye, Yifan Wang, Guofeng Zhang 0001, Wengang Zhou 0001, Tong He 0001, Houqiang Li. StreetSurfGS: Scalable Urban Street Surface Reconstruction With Planar-Based Gaussian Splatting
8794	--	8806	Yun Liu 0009, Sifan Li, Huiyu Duan, Yu Zhou 0009, Daoxin Fan, Guangtao Zhai. Multi-Task Guided No-Reference Omnidirectional Image Quality Assessment With Feature Interaction
8807	--	8818	Qibo Qiu, Honghui Yang, Jian Jiang, Shun Zhang, Haochao Ying, Haiming Gao, Wenxiao Wang 0001, Xiaofei He 0001. 3CS: Multi-Target Masked Point Modeling With Learnable Codebook and Siamese Decoders
8819	--	8834	Yishi Li, Fanhong Zeng, Rui Lai, Tong Wu, Juntao Guan, Anfu Zhu, Zhangming Zhu. TinyFusionDet: Hardware-Efficient LiDAR-Camera Fusion Framework for 3D Object Detection at Edge
8835	--	8848	Tong Jin, Feng Lu, ShuYu Hu, Chun Yuan, Yunpeng Liu 0001. EDTformer: An Efficient Decoder Transformer for Visual Place Recognition
8849	--	8863	Zhangdong Wang, Zhihuang Liu, Yuanjing Luo, Tongqing Zhou, Jiaohua Qin, Zhiping Cai. PPIDM: Privacy-Preserving Inference for Diffusion Model in the Cloud
8864	--	8879	Yakun Ma, Xiuli Chai, Guoqiang Long, Zhihua Gan, Yushu Zhang 0001. TPE for JPEG Images With Dynamic M-Ary Decomposition and Adaptive Threshold Constraints
8880	--	8892	Lizhi Xiong, Rui Ding, Ching-Nung Yang, Zhangjie Fu. Robust Secret Image Sharing Scheme Based on Polynomial k-Consistency
8893	--	8906	Hongfei Xiao, Ying Yang 0019, Tao Xiang 0001. Visual Content Revealing From Perceptually Encrypted Images
8907	--	8916	Jingyuan Jiang, Zichi Wang, Zihan Yuan, Xinpeng Zhang 0001. Generative Image Steganography Based on Text-to-Image Multimodal Generative Model
8917	--	8928	Jingchao Cao, Shuai Zhang, Yutao Liu 0002, Feng Gao 0005, Ke Gu 0001, Guangtao Zhai, Junyu Dong, Sam Kwong. Multi-Scale Local and Global Feature Fusion for Blind Quality Assessment of Enhanced Images
8929	--	8944	Huanjing Yue, Cong Cao 0005, Lei Liao, Jing-Yu Yang 0002. RViDeformer: Efficient Raw Video Denoising Transformer With a Larger Benchmark Dataset
8945	--	8957	Chengxing Xie, Xiaoming Zhang 0008, Linze Li 0001, Yuqian Fu, Biao Gong, Tianrui Li 0001, Kai Zhang. MAT: Multi-Range Attention Transformer for Efficient Image Super-Resolution
8958	--	8972	Jingchao Cao, Wangzhen Peng, Yutao Liu 0002, Junyu Dong, Patrick Le Callet, Sam Kwong. ERD: Encoder-Residual-Decoder Neural Network for Underwater Image Enhancement
8973	--	8988	Jinbao Wei, Gang Yang, Wei Wei 0068, Aiping Liu, Xun Chen 0001. Multi-Contrast MRI Arbitrary-Scale Super-Resolution via Dynamic Implicit Network
8989	--	9002	Patrik Patera, Yie-Tarng Chen, Wen-Hsien Fang. A Multi-Modal Architecture With Spatio-Temporal-Text Adaptation for Video-Based Traffic Accident Anticipation
9003	--	9016	Yixin Qin, Lei Zhao 0017, Lianli Gao, Haonan Zhang, Pengpeng Zeng, Heng Tao Shen. Temporal-Guided Mixture-of-Experts for Zero-Shot Video Question Answering
9017	--	9029	Chunzheng Zhu, Jialin Shao, Jianxin Lin, Yijun Wang 0002, Jing Wang 0113, Jinhui Tang 0001, Kenli Li 0001. fMRI2GES: Co-Speech Gesture Reconstruction From fMRI Signal With Dual Brain Decoding Alignment
9030	--	9045	Yao Wu, Mingwei Xing, Yachao Zhang 0001, Yuan Xie 0006, Yanyun Qu. Fusion-Then-Distillation: Toward Cross-Modal Positive Distillation for Domain Adaptive 3D Semantic Segmentation
9046	--	9059	Zhirui Gao, Renjiao Yi, Chenyang Zhu 0002, Ke Zhuang, Wei Chen 0009, Kai Xu 0004. Generic Objects as Pose Probes for Few-Shot View Synthesis
9060	--	9074	Chengchao Huang, Feng Shao 0001, Hangwei Chen, Baoyang Mu, Long Xu 0001. GADFNet: Geometric Priors Assisted Dual-Projection Fusion Network for Monocular Panoramic Depth Estimation
9075	--	9089	Ce Zhou, Qiang Ling 0001. Dual Geometry Learning and Adaptive Sparse Attention for Point Cloud Analysis
9090	--	9104	Xuzhi Wang, Wei Feng 0005, Lingdong Kong, Liang Wan. NUC-Net: Non-Uniform Cylindrical Partition Network for Efficient LiDAR Semantic Segmentation
9105	--	9118	Mingyue Cui, Yuyang Zhong, Mingjian Feng, Junhua Long, Yehua Ling, Jiahao Xu, Kai Huang 0001. GAEM: Graph-Driven Attention-Based Entropy Model for LiDAR Point Cloud Compression
9119	--	9131	Wan Li, Xiao Pan, Jiaxin Lin, Ping Lu, Daquan Feng, Wenzhe Shi. FRPGS: Fast, Robust, and Photorealistic Monocular Dynamic Scene Reconstruction With Deformable 3D Gaussians
9132	--	9147	Zhenjiang Du, Zhitao Liu, Guan Wang, Jiwei Wei, Sophyani Banaamwini Yussif, Zheng Wang 0044, Ning Xie 0003, Yang Yang 0002. CMNet: Cross-Modal Coarse-to-Fine Network for Point Cloud Completion Based on Patches
9148	--	9160	Le Han, Kai-Xuan Chen 0001, Lei Zhao 0026, Yangbo Jiang, Pengfei Wang, Nenggan Zheng. Cross-Domain Animal Pose Estimation With Skeleton Anomaly-Aware Learning
9161	--	9174	Xiao-dong Xie, Yu-Wei Zhan, Zhen-Xiang Ma, Hong-Mei Liu, Zhen-Duo Chen 0001, Xin Luo 0006, Xin-Shun Xu. Distributed Learning for Privacy-Preserving Semi-Supervised Video Anomaly Detection
9175	--	9189	Chenghu Du, Junyin Wang, Kai Liu, Shengwu Xiong 0001. GLV: Geometric Correlation Distillation for Latent Diffusion-Enhanced Parser-Free Virtual Try-On
9190	--	9204	Yuxuan Luo, Jinpeng Chen 0003, Runmin Cong, Horace Ho-Shing Ip, Sam Kwong. Concept-Level Semantic Transfer and Context-Level Distribution Modeling for Few-Shot Segmentation
9205	--	9217	Ling-An Zeng, Gaojie Wu, Ancong Wu, Jian-Fang Hu, Wei-Shi Zheng 0001. Progressive Human Motion Generation Based on Text and Few Motion Frames
9218	--	9233	Xintao Pang, Fengjuan Yao, YanMing Zhang, Yue Sun, Edmundo Patricio Lopes Lao, Chuan Lin 0003, Patrick Cheong-Iao Pang, Wei Wang 0181, Wei Li, Zhifan Gao, Tao Tan 0002. BLENet: A Bio-Inspired Lightweight and Efficient Network for Left Ventricle Segmentation in Echocardiography
9234	--	9245	Chuang Yang 0003, Xu Han, Tao Han 0002, Han Han, Bingxuan Zhao, Qi Wang 0009. Edge Approximation Text Detector
9246	--	9260	Jiaxin Chen, Jiawen Peng, Yanzuo Lu, Jian-Huang Lai, Andy J. Ma. Vision-Language Adaptive Clustering and Meta-Adaptation for Unsupervised Few-Shot Action Recognition
9261	--	9275	Jiahao Huang, Xiaochen Yuan, Chan-Tong Lam, Sio Kei Im, Fangyuan Lei, Xiuli Bi. TransHFC: Joints Hypergraph Filtering Convolution and Transformer Framework for TemporalForgery Localization
9276	--	9286	Donghai Liao, Xiu Shu, Zhihui Li 0001, Qiao Liu 0001, Di Yuan 0002, Xiaojun Chang, Zhenyu He 0001. Fine-Grained Feature and Template Reconstruction for TIR Object Tracking
9287	--	9299	ChengAo Zong, Jie Zhao 0014, Xin Chen 0032, Huchuan Lu, Dong Wang 0004. Learning Language Prompt for Vision-Language Tracking
9300	--	9311	Liangtao Shi, Bineng Zhong, Qihua Liang, Xiantao Hu, Zhiyi Mo, Shuxiang Song 0001. Mamba Adapter: Efficient Multi-Modal Fusion for Vision-Language Tracking
9312	--	9323	Simiao Lai, Chang Liu 0071, Jiawen Zhu, Ben Kang, Yang Liu 0066, Dong Wang 0004, Huchuan Lu. MambaVT: Spatio-Temporal Contextual Modeling for Robust RGB-T Tracking
9324	--	9336	Tianxu Wu, Zhimeng Xin, Shiming Chen 0002, Yixiong Zou, Xinge You. Adversarial Feature Training for Few-Shot Object Detection
9337	--	9350	Jinpeng Dong, Dingyi Yao, Yufeng Hu, Sanping Zhou, Nanning Zheng 0001. A Novel Dense Object Detector With Scale Balanced Sample Assignment and Refinement
9351	--	9364	Juexiao Feng, Yuhong Yang 0008, Mengyao Lyu, Tianxiang Hao, Yi-Jie Huang, Yanchun Xie, Yaqian Li, Jungong Han, Liuyu Xiang, Guiguang Ding. Toward Realistic Hierarchical Object Detection: Problem, Benchmark, and Solution
9365	--	9383	Jingchun Gao, Lei Zhang 0119, Jingyu Li, Zhendong Mao 0001. Fully Semantic Gap Recovery for End-to-End Image Captioning
9384	--	9397	Yuqing Zhu, Yuan Gao 0015, Tianle Ding, Xiang Liu 0020, Wenfei Yang, Tianzhu Zhang 0001. Spatio-Temporal Pyramid Keypoint Detection With Event Cameras
9398	--	9413	Nanhua Chen, Dongshuo Zhang, Kai Jiang, Meng Yu, Yeqing Zhu, Tai-Shan Lou, Liangyu Zhao. SHAA: Spatial Hybrid Attention Network With Adaptive Cross-Entropy Loss Function for UAV-View Geo-Localization
9414	--	9427	Yingwen Zhang, Meng Wang 0017, Junru Li, Kai Zhang 0007, Li Zhang 0006, Shiqi Wang 0001. A Theoretical and Experimental Study for Dependent Learned Rate-Distortion Optimization
9428	--	9442	Youneng Bao, Wen Tan, Chuanmin Jia, Mu Li 0005, Yongsheng Liang 0001, Yonghong Tian 0001. ShiftLIC: Lightweight Learned Image Compression With Spatial-Channel Shift Operations
9443	--	9459	Maida Cao, Wenrui Dai, Shaohui Li, Chenglin Li, Junni Zou, Weisheng Hu, Hongkai Xiong. Generative Probabilistic Entropy Modeling With Conditional Diffusion for Learned Image Compression
9460	--	9474	Panqi Jia, Fabian Brand, Dequan Yu, Alexander Karabutov, Elena Alshina, André Kaup. Overview of Variable Rate Coding in JPEG AI
9475	--	9486	Yuxuan Wei, Zehan Wang, Tian Guo, Hao Liu 0044, Liquan Shen, Hui Yuan 0001. High Efficiency Wiener Filter-Based Point Cloud Quality Enhancement for MPEG G-PCC
9487	--	9501	Yifei Xu, Zaiqiang Wu, Li Li, Siqi Li, Wenlong Li, Mingqi Li, Yuan Rao, ShuiGuang Deng. Hybrid Siamese Masked Autoencoders as Unsupervised Video Summarizer
9502	--	9516	Pengzhe Wang, Lei Zhang 0119, Zhendong Mao 0001, Nenan Lyu, Yongdong Zhang 0001. Matryoshka Learning With Metric Transfer for Image-Text Matching
9517	--	9529	Mingyang Lei, Jingfan Fan, Long Shao, Hong Song, Deqiang Xiao, Danni Ai, Tianyu Fu 0003, Yucong Lin, Ying Gu, Jian Yang 0009. Structured Light Image Planar-Topography Feature Decomposition for Generalizable 3D Shape Measurement
9530	--	9544	Nishang Xie, Tao Zhang 0027, Lanyu Zhang, Jie Chen, Feiming Wei, Wenxian Yu. VLF-SAR: A Novel Vision-Language Framework for Few-Shot SAR Target Recognition
9545	--	9558	Xiuxian Wang, Lanjun Wang, Yuting Su 0001, Hongshuo Tian, Guoqing Jin, An-An Liu. Few-Shot In-Context Learning for Implicit Semantic Multimodal Content Detection and Interpretation

7326	--	7338	Qin Jiang, Xi-Le Zhao, Wei-Hao Wu, Wen-Jie Zheng, Jie Lin. An Arbitrary Mode-3 Dimensional Tensor-Tensor Product for Tensor Train Decomposition From Interaction Perspective
7339	--	7353	Junwen Xiong, Chuanyue Li, Tianyu Liu, Peng Zhang 0005, Yue Huo, Wei Huang 0013, Yufei Zha. Toward Unifying Saliency Transformer for Video Saliency Prediction and Detection
7354	--	7367	Dong Wei, Xu-Hua Yang 0001, Yiyang Weng, Xuanyu Lin, Hong-xiang Hu, Sheng Liu 0002. Cross-Modal Adaptive Prototype Learning for Continuous Sign Language Recognition
7368	--	7379	Jiaming Liu, Linghe Kong, Jiajie Yan, Guihai Chen. Mesh-Aligned 3D Gaussian Splatting for Multi-Resolution Anti-Aliasing Rendering
7380	--	7394	Ziwei Luo, Haibin Huang, Lei Yu, Youwei Li, Bing Zeng, Shuaicheng Liu. Kernel Reformulation With Deep Constrained Least Squares for Blind Image Super-Resolution
7395	--	7408	Mingliang Zhai, Bing-Kun Bao, Xuezhi Xiang. DMRFlow: 4D Radar Scene Flow Estimation With Decoupled Matching and Refinement
7409	--	7422	Dehua Peng, Zhipeng Gui, Jie Gui, Huayi Wu. A Robust and Efficient Boundary Point Detection Method by Measuring Local Direction Dispersion
7423	--	7438	Long Tang, Yunna Lv, Dengpan Ye, Yiheng He, Ziyi Liu 0009, Caiyun Xie. Toward a Universal, Transferable, and Robust Adversarial Perturbation Framework Against Deep Hashing-Based Facial Image Retrieval
7439	--	7454	Xiaowei Zhao 0002, Jie Fan, Xiaojun Chang, Feiping Nie 0001, Qiang Zhang 0020, Jun Guo. Scalable Multi-View Regression Clustering for Large-Scale Data
7455	--	7470	Nan An, Long Ma 0002, Guangchao Han, Xin Fan 0001, Risheng Liu. Striving for Faster and Better: A One-Layer Architecture With Auto Re-Parameterization for Low-Light Image Enhancement
7471	--	7484	Rui Zhang 0054, Yaosen Chen, Yuegen Liu, Wei Wang 0283, Xuming Wen, Hongxia Wang 0001. TVG: A Training-Free Transition Video Generation Method With Diffusion Models
7485	--	7498	De Cheng, Yusong Hu, Nannan Wang 0001, Dingwen Zhang, Xinbo Gao 0001. Achieving Plasticity-Stability Trade-Off in Continual Learning Through Adaptive Orthogonal Projection
7499	--	7511	Mingyuan Zhao, Hao Sheng 0001, Rongshan Chen, Ruixuan Cong, Zhenglong Cui, Da Yang 0001. UNeLF: Unconstrained Neural Light Field for Self-Supervised Angular Super-Resolution
7512	--	7525	Sijia Zhang, Maoguo Gong, Yi-Ming Lin, Hao Li 0009, Yuan Gao 0019, Yihong Zhang 0008. Dual Distillation Fusion for Weakly Supervised Anomaly Detection in Surveillance Videos
7526	--	7542	Qinghua Wang, Ziwei Li, Shuqi Zhang, Nan Chi, Qionghai Dai. WaveFusion: A Novel Wavelet Vision Transformer With Saliency-Guided Enhancement for Multimodal Image Fusion
7543	--	7553	Yaowei Li, Hang An, Tong Zhang, Xiaoxuan Chen, Bo Jiang 0014, Jinshan Pan. Omni-Deblurring: Capturing Omni-Range Context for Image Deblurring
7554	--	7567	Yuanliang Xue, Bineng Zhong, Guodong Jin, Tao Shen, Lining Tan, Ning Li, Yaozong Zheng. AVLTrack: Dynamic Sparse Learning for Aerial Vision-Language Tracking
7568	--	7578	Ting-Feng Huang, Yu-Hsun Lin. Drop2Sparse: Improving Dataset Distillation via Sparse Model
7579	--	7591	Yukai Shi, Cidan Shi, Zhipeng Weng, Yin Tian, Xiaoyu Xian, Liang Lin. CrossFuse: Learning Infrared and Visible Image Fusion by Cross-Sensor Top-K Vision Alignment and Beyond
7592	--	7604	Zhuo Zhang, Lin Chen, Qiufu Wang, Xiaoliang Sun, Qifeng Yu. Monocular Visual Pose Measurement for Autonomous Landing in Unknown Environments
7605	--	7617	Mingxiang Cao, Weiying Xie, Xin Zhang 0092, Jiaqing Zhang, Kai Jiang, Jie Lei 0001, Yunsong Li. M³amba: CLIP-Driven Mamba Model for Multi-Modal Remote Sensing Classification
7618	--	7630	Zhong Wang 0009, Lin Zhang 0014, Hesheng Wang 0001. S²KAN-SLAM: Elastic Neural LiDAR SLAM With SDF Submaps and Kolmogorov-Arnold Networks
7631	--	7641	Xuzheng Yu, Chen Jiang 0006, Xingning Dong, Tian Gan, Ming Yang 0007, Qingpei Guo. SHE-Net: Syntax-Hierarchy-Enhanced Text-Video Retrieval
7642	--	7654	Huan Zhao 0003, Zeyi Li, Song Wang 0016, Zixing Zhang 0001, Keqin Li 0001. Robust Hashing With Bilinear Drift for Image-Text Retrieval
7655	--	7666	Shengyang Sun, Jiashen Hua, Junyi Feng, Dongxu Wei, Baisheng Lai, Xiaojin Gong. Delving Into Instance Modeling for Weakly Supervised Video Anomaly Detection
7667	--	7682	Mingtao Feng, Chenbo Yan, Zijie Wu, Weisheng Dong, Yaonan Wang 0001, Ajmal Mian. History-Enhanced 3D Scene Graph Reasoning From RGB-D Sequences
7683	--	7696	Bo Yin 0004, Kang Yin. Robust Image Watermarking Using Bidirection-Interactive and Context-Aware Networks
7697	--	7705	Qiang Lai, Lina Ji. A Bidirectional Cross-Scrambling Medical Image Encryption Scheme Incorporates Compressed Sensing and Its Application in IoMT
7706	--	7718	Suo Gao, Herbert Ho-Ching Iu, Ugur Erkan, Cemaleddin Simsek, Abdurrahim Toktas, Yinghong Cao, Rui Wu 0002, Jun Mou, Qi Li 0029, Chunpeng Wang 0001. A 3D Memristive Cubic Map With Dual Discrete Memristors: Design, Implementation, and Application in Image Encryption
7719	--	7731	Dezhi An, Xudong Zhang, Dawei Hao, Ruoyu Zhao, Yushu Zhang 0001. Privacy-Preserving Image Retrieval Based on Thumbnail-Preserving Visual Features
7732	--	7746	Baowei Wang, Jianbo Zhang, Yufeng Wu, Qi Cui. FasterCReW: Performance or Efficiency? A Lightweight Conditional Residual DNN-Based Watermarking Based on FasterNet
7747	--	7761	Zijian Chen 0001, Wei Sun 0029, Jun Jia, Ru Huang 0002, Fangfang Lu, Ying Chen 0011, Xiongkuo Min, Guangtao Zhai, Wenjun Zhang 0001. Joint Luminance-Chrominance Learning for Image Debanding
7762	--	7777	Ziyin Huang, Yui-Lam Chan, Ngai-Wing Kwong, Sik-Ho Tsang, Kin-Man Lam 0001, Wing-kuen Ling. Long Short-Term Fusion by Multi-Scale Distillation for Screen Content Video Quality Enhancement
7778	--	7791	Xiongkuo Min, Yixuan Gao, Yuqin Cao, Guangtao Zhai, Wenjun Zhang 0001, Huifang Sun, Chang Wen Chen. Exploring Rich Subjective Quality Information for Image Quality Assessment in the Wild
7792	--	7806	Haiyan Jin, Jing Wang, Fengyuan Zuo, Haonan Su, Zhaolin Xiao, Bin Wang 0046, Yuanlin Zhang 0003. DCGSD: Low-Light Image Enhancement With Dual-Conditional Guidance Sparse Diffusion Model
7807	--	7820	Weidong Zhang 0007, Qingmin Liu, Huimin Lu 0001, Jianping Wang 0004, Jing Liang. Underwater Image Enhancement via Wavelet Decomposition Fusion of Advantage Contrast
7821	--	7834	Zhongqi Liu, Bolun Zheng, Quan Chen, Qianyu Zhang, Xu Jia 0012, Jiyong Zhang, Chenggang Yan 0001. Pyramid Learnable Bandpass Filters for Ultra-High-Definition Image Demoiréing
7835	--	7849	Pinxian Zeng, Xinyi Zeng, Yan Wang 0015, Luping Zhou, Chen Zu, Xi Wu 0004, Jiliu Zhou, Dinggang Shen. Multi-Modal Long-Short Distance Attention-Based Transformer-GAN for PET Reconstruction With Auxiliary MRI
7850	--	7865	Dandan Zhu 0001, Kaiwei Zhang, Xiongkuo Min, Guangtao Zhai, Xiaokang Yang 0001. ScanDTM: A Novel Dual-Temporal Modulation Scanpath Prediction Model for Omnidirectional Images
7866	--	7881	Han Xiao, Changqiao Xu, Chuxing Fang, Wendong Wang 0003, Shujie Yang, Zhenhui Yuan, Luigi Alfredo Grieco. VAAC-IM: Motion-Aware Viewing Area Adaptive Control in Immersive Media Transmission
7882	--	7895	Lvcheng Chen, Jianing Deng, Xudong Zeng, Liangwei Liu, Yawen Wu, Jingtong Hu, Qi Sun 0002, Zhiguo Shi 0001, Cheng Zhuo. STHVC: Spatial-Temporal Hybrid Video Compression for UAV-Assisted IoV Systems
7896	--	7910	Ying Zou 0015, Zhe Chen 0005, Fuliang Yin. High-Order Multi-Scale Attention and Vertical Discriminator Enhanced CLIP for Monocular Depth Estimation
7911	--	7924	Marko Savic, Guoying Zhao 0001. RS+rPPG: Robust Strongly Self-Supervised Learning for rPPG
7925	--	7939	Peng Ye 0006, Chenyu Huang, Mingzhu Shen, Tao Chen 0003, Yongqi Huang, Wanli Ouyang. Dynamic Model Merging With Mixture of Weights
7940	--	7952	Yanting Zhang 0001, Xia Li, Wenhao Chai, Cairong Yan, Wenhai Wang, Gaoang Wang. Pose-Guided Transformer for Fine-Grained Action Quality Assessment
7953	--	7965	Zhuo Li, He Zhao 0001, Anningzhe Gao, Dandan Guo, Tsung-Hui Chang, Xiang Wan. Prototype-Oriented Clean Subset Extraction for Noisy Long-Tailed Classification
7966	--	7980	Wenyang Luo, Yufan Liu, Bing Li 0001, Weiming Hu, Stephen J. Maybank. Task-Aware Attentional Dynamic Alignment for Few-Shot Compressed Video Classification
7981	--	7990	Jianan Huang, Xuebing Liu, Qing Zhu, Yaonan Wang 0001, Mingtao Feng, Jiaming Zhou, Zhen Zhou, Lin Chen, Danwei Wang. RAMPGrasp: Retentive Attention-Based Multiscale Perception Grasp Detection Network
7991	--	8001	Ruigang Hu, Xuekuan Wang, Yichao Yan, Cairong Zhao. TGAvatar: Reconstructing 3D Gaussian Avatars With Transformer-Based Tri-Plane
8002	--	8015	Jian Chen, Yu Chen 0067, Jieyu Zhao 0002, Chenjun Ma. A Discrete Index Graph Diffusion Model for 3D Meshes Synthesis
8016	--	8030	Minghui Hou, Chuanhao Lyu, Gang Wang, Baorui Ma, Rongtao Xu, Jue Hu, Xiaopeng Fan. PolarBEVU: Multi-Camera 3D Object Detection in Polar Bird's-Eye View via Unprojection
8031	--	8044	Liang Geng, Jianqin Yin, Gang Chen, QingXuan Jia. Pseudo-EV: Enhancing 3D Visual Grounding With Pseudo Embodied Viewpoint
8045	--	8056	Yuandong Li, Qinglei Hu, Fei Dong, Dongyu Li, Zhenchao Ouyang. Uncertainty Neural Surfaces for Space Target 3D Reconstruction Under Constrained Views
8057	--	8070	Jilong Wang 0010, Saihui Hou, Xianda Guo, Yan Huang 0008, Yongzhen Huang, Tianzhu Zhang 0001, Liang Wang 0001. 3I: Robust Cross-Covariate Gait Recognition via Causal Intervention
8071	--	8085	Chenglizhao Chen, Xinyu Liu, Mengke Song, Luming Li, Shaojiang Yuan, Xu Yu 0001, Shanchen Pang. Unveiling Context-Related Anomalies: Knowledge Graph Empowered Decoupling of Scene and Action for Human-Related Video Anomaly Detection
8086	--	8103	Ruiqi Wu 0001, Bingliang Jiao, Meng Liu, Shining Wang, Wenxuan Wang 0003, Peng Wang 0015. Enhancing Visible-Infrared Person Re-Identification With Modality- and Instance-Aware Adaptation Learning
8104	--	8118	Jia Zhang, Bo Peng 0006, Xi Wu 0004. Dual Graph Inference Network for Weakly Supervised Semantic Segmentation
8119	--	8133	Run-Sen Xia, Xue-Yan Wang, Si-Bao Chen 0001, Jin Tang 0001, Bin Luo 0001. Camera-Proxy Enhanced Identity-Recalibration Learning for Unsupervised Visible-Infrared Person Re-Identification
8134	--	8147	Chen-Chen Zong, Penghui Yang 0001, Ming-Kun Xie, Sheng-Jun Huang. A Unified Open Adapter for Open-World Noisy Label Learning: Data-Centric and Learning-Based Insights
8148	--	8160	Long Xu, Yongquan Chen, Shanghong Li, Jun Luo. MST: Adaptive Multi-Scale Tokens Guided Interactive Segmentation
8161	--	8173	Guangyu Gao, Anqi Zhang, Jianbo Jiao, Chi Harold Liu, Yunchao Wei. PRFormer: Matching Proposal and Reference Masks by Semantic and Spatial Similarity for Few-Shot Semantic Segmentation
8174	--	8186	Hongmin Liu 0001, Xueli Li, Bin Fan 0001, Jinglin Xu. BRTAL: Boundary Refinement Temporal Action Localization via Offset-Driven Diffusion Models
8187	--	8196	Xudong Luo, Di Yuan 0002, Xiu Shu, Qiao Liu 0001, Xiaojun Chang, Zhenyu He 0001. Adaptive Trajectory Correction for Underwater Object Tracking
8197	--	8208	Xingxing Xie, Gong Cheng 0003, Wenbo Li, Chunbo Lang, Peng Zhang, Yanqing Yao, Junwei Han. Learning Discriminative Representation for Fine-Grained Object Detection in Remote Sensing Images
8209	--	8224	Lei Cao, Liquan Shen, Meng Yu, Zhengyong Wang, Cheng Shen. Prior-Guided Dual-Reference Contrastive Learning for Underwater Object Detection
8225	--	8239	Junyi Wu 0001, Yan Huang 0023, Min Gao, Yuzhen Niu, Yuzhong Chen, Qiang Wu 0001, Jianqiang Zhao. Learning Comprehensive Representation via Selective Activation and Dual-Level Orthogonality for Pedestrian Attribute Recognition
8240	--	8251	Yilong Lv, Yujie He 0001, Min Li 0030. OAPR: An Offset-Aware Progressive Regression Object Detector
8252	--	8264	Yuqi Yang, Dongliang Chang, Ruoyi Du, Yi-Zhe Song, Zhanyu Ma. Adaptive Multi-Resolution Feature Fusion for Fine-Grained Visual Classification
8265	--	8282	Liuqian Wang, Jiafeng Li, Jing Zhang 0023, Li Zhuo 0001, Qi Tian 0001. Position Guided Dynamic Receptive Field Network: A Small Object Detection Friendly to Optical and SAR Images
8283	--	8298	Xiao Huo, Junhui Hou, Shuai Wan, FuZheng Yang 0001. Rendering-Oriented 3D Point Cloud Attribute Compression Using Sparse Tensor-Based Transformer
8299	--	8313	Da Ai, Jiahao Wang, Ting He, Hui Yuan 0001, Ying Liu 0026, Nam Ling. Temporal and Spatial Perception: A Novel Perceptual Rate-Distortion Optimization Method for H.266/VVC Encoding
8314	--	8329	Shaohui Li, Wenrui Dai, Nuowen Kan, Chenglin Li, Junni Zou, Hongkai Xiong. Learnable Non-Uniform Quantization With Sampling-Based Optimization for Variable-Rate Learned Image Compression
8330	--	8343	Fan Ye, Bojun Liu, Li Li 0040, Dong Liu 0002. Rate-Distortion-Optimized Deep Preprocessing for JPEG Compression
8344	--	8358	Minjie Ren, Xiangdong Huang 0002, Jing Liu 0002, Zan Gao, Yuting Su 0001, An-An Liu. KA-MIN: Knowledge-Aware Multimodal Interaction Network for Emotion Recognition in Conversation
8359	--	8371	Yunfei Chen 0015, Hongyu Lin, Zhan Yang, Jun Long. PFedLAH: Personalized Federated Learning With Lookahead for Adaptive Cross-Modal Hashing
8372	--	8376	Wei Li, Leilei Huang, Chenlong He, Minge Jing, Wei Hu, Yibo Fan. An 8K@120fps Advanced Entropy Coding Hardware Design for AVS3
8377	--	8390	Jiaojiao Li 0001, Zhiyuan Zhang, Rui Song 0003, Haitao Xu, Yunsong Li, Qian Du 0001. Contrastive MLP Network Based on Adjacent Coordinates for Cross-Domain Zero-Shot Hyperspectral Image Classification
8391	--	8405	Xiao Li 0014, Liquan Chen, Tong Fu, Zhangjie Fu, Yuan Gao. Coverless Image Steganography Based on Semantic-Controlled Text-to-Image Generation
8406	--	8420	Liang Ding, Xi Yang, Yang Yang 0059, Weiming Zhang 0001. LOCAT: Localization-Driven Text Watermarking via Large Language Models
8421	--	8432	Shangxi Wu, Qiuyang He, Jian Yu 0001, Jitao Sang. Backdoor for Debias: Mitigating Model Bias With Backdoor Attack-Based Artificial Bias

6214	--	6230	Weidan Yan, Wenze Shao, Dengyin Zhang, Liang Xiao. FaceGCN: Structured Priors Inspired Graph Convolutional Networks for Face Restoration With Unknown Degradations
6231	--	6244	Yuhong Shi, Jianyi Liu, Lihang Sun, Xinhu Zheng. E²BA: Environment Exploration and Backtracking Agent for Visual Language Object Navigation
6245	--	6258	Ruiqi Du, Xu Tang, Jingjing Ma 0001, Xiangrong Zhang, Licheng Jiao. MLMamba: A Mamba-Based Efficient Network for Multi-Label Remote Sensing Scene Classification
6259	--	6272	Yuhong Zhang, Hengsheng Zhang, Zhengxue Cheng, Rong Xie, Li Song 0001, Wenjun Zhang 0001. SSP-IR: Semantic and Structure Priors for Diffusion-Based Realistic Image Restoration
6273	--	6285	Ke Wang 0017, Peng Zhou, Man Hu, Jianbo Lu. Unsupervised 3D Object Detection Domain Adaptation Based on Pseudo-Label Variance Regularization
6286	--	6299	Xu Wang, Yi Jin 0001, Yigang Cen, Yidong Li, Hui Yu 0001. V2PNet: A Voxel-to-Point Network Framework for Task-Oriented Point Cloud Sampling
6300	--	6312	Yongshan Zhang, Xinxin Wang 0003, Xinwei Jiang, Lefei Zhang, Bo Du 0001. Elastic Graph Fusion Subspace Clustering for Large Hyperspectral Image
6313	--	6328	Yuan Chen, Jie Jiang 0005. UAV Visual Localization via Integrated Steerable Semantic Feature Learning and Density-Based Clustering
6329	--	6340	Zenan Lin, Wenwei Song, Wenxiong Kang. Multiscale Super-Images for Dynamic Hand Gesture Authentication
6341	--	6356	Huanan Wang, Xinyu Zhang 0001, Zhengxian Chen, Jun Li 0082, Huaping Liu 0001. PDDepth: Pose Decoupled Monocular Depth Estimation for Roadside Perception System
6357	--	6370	Huilan Luo, Xia Cai, Lik-Kwan Shark. Frame-by-Frame Multi-Object Tracking-Guided Video Captioning
6371	--	6385	Mengke Song, Chenglizhao Chen, Wenfeng Song, Yuming Fang. UNI-IQA: A Unified Approach for Mutual Promotion of Natural and Screen Content Image Quality Assessment
6386	--	6398	Yisu Zhang, Chaohui Yu, Fan Wang 0019, Jianke Zhu. LPM: Efficient 3D Content Creation From Single Image by Large-Scale Partial 3D Modeling
6399	--	6412	Yihui Fan, Dongyu Du, Hongkun Cao, Jiayu Xie, Xin Jin 0002. Atmospheric Scattered Light Field Sampling for Improving Reconstruction Efficiency
6413	--	6423	Yiwei Wei, Hengyang Zhou, Shaozu Yuan, Meng Chen 0006, Haitao Shi, Zhiyang Jia, Longbiao Wang, Xiaodong He. DeepMSD: Advancing Multimodal Sarcasm Detection Through Knowledge-Augmented Graph Reasoning
6424	--	6436	Kunshan Yang, Lin Zuo, Mengmeng Jing, Xianlong Tian, Kunbin He, Yongqi Ding. Flexible ViG: Learning the Self-Saliency for Flexible Object Recognition
6437	--	6451	Qiyuan Dai, Qiang Ling 0001. Hybrid Representation Learning for End-to-End Multi-Person Pose Estimation
6452	--	6465	Titong Jiang, Yuan Ma, Jiaqi Li, Qing Dong, Xuewu Ji, Yahui Liu. LSTS: Periodicity Learning via Long Short-Term Temporal Shift for Remote Physiological Measurement
6466	--	6480	Han Hu 0003, Kaifeng Song, Rongfei Fan, Cheng Zhan, Jie Xu 0002, Jian Yang 0014. Energy-Efficient Image Semantic Communication: Architecture Design and Optimal Joint Allocation of Communication and Computation Resources
6481	--	6493	Ning Lan, Baoshan Ou, Xuemei Xie, Guangming Shi. Visual Environment-Interactive Planning for Embodied Complex-Question Answering
6494	--	6507	Qing Zhou, Ping Wei 0004, Zhenxing Qian, Xinpeng Zhang 0001, Sheng Li 0006. Improved Generative Steganography Based on Diffusion Model
6508	--	6521	Xiwen Fu, Guopu Zhu, Hongli Zhang 0001, Xinpeng Zhang 0001, Anthony T. S. Ho, Sam Kwong. Multi-Level Feature Fusion Network for Shadow Removal Detection
6522	--	6534	Dawei Ding, Dong Xie, Hongwei Zhang, Zongli Yang, Chu'An Liu. Deepface-Based Chaotic Image Encryption Using Key Optimization and Semi-Tensor Product Theory
6535	--	6548	Axi Niu, Kang Zhang 0008, Trung Xuan Pham, Pei Wang, Jinqiu Sun, In-So Kweon, Yanning Zhang 0001. Learning From Multi-Perception Features for Real-Word Image Super-Resolution
6549	--	6560	Lihong Qiao, Rongxuan Wang, Yucheng Shu, Baobin Li, Weisheng Li 0001, Xinbo Gao 0001, Zhanchuan Cai. Fast Sampling of Diffusion Models for Accelerated MRI Using Dual Manifold Constraints
6561	--	6574	Jing Lian, Jibao Zhang, Shiqiang Du, Qidong Liu 0001, Jizhao Liu. Adversarial Diffusion Network for Dunhuang Mural Inpainting
6575	--	6588	Jinliang Han, Xiongkuo Min, Jun Jia, Yixuan Gao, Xiaohong Liu 0001, Guangtao Zhai. Full-Reference and No-Reference Quality Assessment for Video Frame Interpolation
6589	--	6601	Yongwei Mao, Jinjian Wu, Yongxu Liu 0001, Leida Li, Weisheng Dong. Scene-Modulated High-Order Statistical Representation Learning for No-Reference Super-Resolution Image Quality Assessment
6602	--	6615	Mingyu Liu, Yuning Cui 0001, Wenqi Ren, Juxiang Zhou, Alois C. Knoll. LIEDNet: A Lightweight Network for Low-Light Enhancement and Deblurring
6616	--	6627	Zhiyong Su, Bingxu Xie, Zheng Li, Jincan Wu, Weiqing Li. The Worse the Better: Content-Aware Viewpoint Generation Network for Projection-Related Point Cloud Quality Assessment
6628	--	6639	Jiang Liu, Huasheng Wang, Wei Zhou 0021, Katarzyna Stawarz, Padraig Corcoran, Ying Chen 0011, Hantao Liu. Adaptive Spatiotemporal Graph Transformer Network for Action Quality Assessment
6640	--	6655	Zihao Zhou, Liquan Shen, Jun Lei, Zhaoyi Tian, Xiangyu Hu 0003, Shiwei Wang 0005, Yang Chen. Perceptual Quality Assessment of High-Dynamic-Range Image: A Benchmark Dataset and a No Reference Method
6656	--	6670	Xingshuo Jing, Kun Qian 0005, Markus Vincze. CAGT: Sim-to-Real Depth Completion With Interactive Embedding Aggregation and Geometry Awareness for Transparent Objects
6671	--	6683	Haoyu Wang, Fasheng Wang, Mengyin Wang, Fuming Sun, Haojie Li. Rethinking How to Capture Long-Range Dependency in 3D Object Detection
6684	--	6697	Jing Zhang 0041, Kaixuan Zhang, Yingshuai Xie, Zhe Wang. Deep Reciprocal Learning for Image Captioning
6698	--	6711	Yanjie Liang, Luo Xiong, Ying Shan, Hanzi Wang. Learning Multi-Task Target-Specific Correlation Filters for Robust Tracking
6712	--	6725	Muhe Ding, Jianlong Wu, Xue-dong, Xiaojie Li, Pengda Qin, Tian Gan, Liqiang Nie. Preview-Based Category Contrastive Learning for Knowledge Distillation
6726	--	6739	Chen Liang, Shaobing Gao, Liangtian He, Yiguang Liu. Biological Vision Inspired Context-Awareness Network for Various Non-Generic Object Detection
6740	--	6755	Mingyuan Zhao, Xuexin Yu, Xinggang Hu, Fei Wang, Long Xu 0001, Xiangyang Ji. Bidirectional Patch-Based Correlations With Local Rigidity for Global Nonrigid Registration
6756	--	6772	Meiling Wang 0002, Guangyan Chen, Yi Yang 0009, Li Yuan 0007, Yufeng Yue. Point Tree Transformer for Point Cloud Registration
6773	--	6786	Jie Xiao, Yinchao Ma, Wenfei Yang, Tianzhu Zhang. Learning Adaptive Conceptual Prototypes for 3D Single Object Tracking
6787	--	6802	Xuening Zhu, Renjiao Yi, Xin Wen 0005, Chenyang Zhu 0002, Kai Xu 0004. Relighting Scenes With Object Insertions in Neural Radiance Fields
6803	--	6815	Mujtaba Asad, Waqar Azeem, He Jiang, Hafiz Tayyab Mustafa, Jie Yang 0002, Wei Liu 0044. 2M3DF: Advancing 3D Industrial Defect Detection With Multi-Perspective Multimodal Fusion Network
6816	--	6831	Shaobo Zhang 0006, Wanqing Zhao, Ziyu Guan, Wei Zhao 0019, Jinye Peng, Jianping Fan 0001. Learning Cross-View Consistent 3D Keypoints for Object 6D Pose Estimation
6832	--	6852	Yanqi Bao, Tianyu Ding, Jing Huo, Yaoli Liu, Yuxin Li, Wenbin Li 0006, Yang Gao 0001, Jiebo Luo 0001. 3D Gaussian Splatting: Survey, Technologies, Challenges, and Opportunities
6853	--	6866	Ancheng Lin, Yusheng Xiang, Jun Li 0010, Mukesh Prasad. Dynamic Appearance Particle Neural Radiance Field
6867	--	6880	Jingbo Zhang, Xiaoyu Li 0002, Hongliang Zhong, Qi Zhang 0029, Yan-Pei Cao, Ying Shan, Jing Liao 0001. HumanRef-GS: Image-to-3D Human Generation With Reference-Guided Diffusion and 3D Gaussian Splatting
6881	--	6894	Riran Cheng, Xupeng Wang 0001, Ferdous Sohel, Hang Lei. Black-Box Explainability-Guided Adversarial Attack for 3D Object Tracking
6895	--	6909	Jun Zhou, Kai Chen 0024, Mingqiang Wei, Xiao-Ping Zhang 0002, Qi Dou 0001, Harry Qin. Canonical Shape Reconstruction With SE(3) Equivariance Learning for Weakly-Supervised Object Pose Estimation
6910	--	6925	Rui Ma, Yi Hou, Chenxuan Li, Huizhu Jia, Xiaodong Xie. Scene-Adaptive Unsupervised Crowd Counting for Video Surveillance
6926	--	6935	Yihan Xu, Hangyu Li 0001, Mingrui Zhu, Nannan Wang 0001, Xinbo Gao 0001. Boosting Semi-Supervised Facial Attribute Recognition With Dynamic Threshold Pairs
6936	--	6947	Mengzhu Wang, Houcheng Su, Sijia Wang, Shanshan Wang 0008, Nan Yin, Li Shen 0008, Long Lan, Liang Yang 0002, Xiaochun Cao. Graph Convolutional Mixture-of-Experts Learner Network for Long-Tailed Domain Generalization
6948	--	6960	Chang'an Yi, Haotian Chen 0002, Yifan Zhang 0004, Yonghui Xu, Yan Zhou, LiZhen Cui, Han Yu 0001. FDAC: Federated Domain Adaptation via Dual Contrastive Learning
6961	--	6973	Zhiheng Ma, Yaohui Ma, Xiaopeng Hong, Huiyun Li, Shizhou Zhang. Joint Memory Optimization for Continual Learning
6974	--	6978	Zhe Chen 0018, Xiaojun Wu 0001, Tianyang Xu, Hui Li 0037, Josef Kittler. Deep Discriminative Multi-View Clustering
6979	--	6992	Junchi Su, Xin Gao, Heping Lu, Baofeng Li, Feng Zhai, Xiao Fang, Taizhi Wang, Qiangwei Li. A Generalized Few-Shot Object Detection Method via Extraction of Base-Novel Commonality With Memory Distillation of Category Prototypes
6993	--	7004	Guanghui Yue 0001, Shangjie Wu, Gang Li, Cheng Zhao 0003, Yi Hao, Tianwei Zhou, Baoquan Zhao. Boundary-Guided Feature-Aligned Network for Colorectal Polyp Segmentation
7005	--	7019	Lei Ma 0004, Xin Luo, Yu Shi 0004, Fanman Meng, Qingbo Wu 0001, Hanyu Hong. Optimal Transport Quantization Based on Cross-X Semantic Hypergraph Learning for Fine-Grained Image Retrieval
7020	--	7032	Dongfang Wang, Tao Zhou 0002, Yizhe Zhang, Shangbing Gao, Jian Yang 0003. Frequency-Aware Interaction Network for Ultrasound Image Segmentation
7033	--	7046	Liyuan Chen, Wei Liu 0044, Hua Wang 0002, Sang-Woon Jeon, Yunliang Jiang, Zhonglong Zheng. Consistency-Guided Adaptive Alternating Training for Semi-Supervised Salient Object Detection
7047	--	7060	Ruochen Li 0002, Tanqiu Qiao, Stamos Katsigiannis, Zhanxing Zhu, Hubert P. H. Shum. Unified Spatial-Temporal Edge-Enhanced Graph Networks for Pedestrian Trajectory Prediction
7061	--	7074	Jiahao Bao, Kaiqiang Chen, Xian Sun, Liangjin Zhao, Wenhui Diao, Menglong Yan. SiamTHN: Siamese Target Highlight Network for Visual Tracking
7075	--	7089	Mengdi Dong, Ke Xu 0003, Xinghao Jiang, Zeyu Zhao, Tanfeng Sun. Feature-Aware Transferable Adversarial Attacks on Visual Object Tracking
7090	--	7100	Yuxuan Yao, Bo Peng 0007, Tianyi Qin, Yanfeng Gu, Nam Ling, Jianjun Lei. Hypergraph Contrastive Learning for Large-Scale Hyperspectral Image Clustering
7101	--	7115	Ke Hu, Yudong He, Yuan Li, Jiayu Zhao, Song Chen 0001, Yi Kang. EI²Det: Edge-Guided Illumination-Aware Interactive Learning for Visible-Infrared Object Detection
7116	--	7128	Chuankun Li, Shuai Li 0005, Yanbo Gao, Xingyu Gao 0001, Ping Chen 0004, Jian Li, Wanqing Li 0001. Unsupervised Feature Enrichment and Fidelity Preservation Learning Framework for Skeleton-Based Action Recognition
7129	--	7142	Donghua Wang, Wen Yao, Tingsong Jiang, Chao Li 0076, Xiaoqian Chen. Universal Multi-View Black-Box Attack Against Object Detectors via Layout Optimization
7143	--	7154	Junxi Chen, Guangxing Wu, Hongxiang Li, Jiankang Chen, Wentao Zhang, Wei-Shi Zheng, Ruixuan Wang. DAT: Dual-Branch Adapter-Tuning for Few-Shot Recognition
7155	--	7166	Jing Liu 0002, Zhuo He, Weizhi Nie, Zongbing Zhang, Yuting Su 0001. What and Where: Semantic Grasping and Contextual Scanning for Moment Retrieval and Highlight Detection
7167	--	7180	Tianrui Huang, Pu Cao, Lu Yang 0006, Chun Liu 0004, Mengjie Hu, Zhiwei Liu, Qing Song 0006. E4C: Enhance Editability for Text-Based Image Editing by Harnessing Efficient CLIP Guidance
7181	--	7195	Sixian Wang, Jincheng Dai, Xiaoqi Qin, Ke Yang 0006, Kai Niu 0001, Ping Zhang 0003. ResiComp: Loss-Resilient Image Compression via Dual-Functional Masked Visual Token Modeling
7196	--	7209	Zhaolin Wan, Xiao Yan, Zhiyang Li 0001, Xiaopeng Fan, Wangmeng Zuo, Debin Zhao. No-Reference Stereoscopic Omnidirectional Image Quality Assessment via a Binocular Viewport Hypergraph Convolutional Network
7210	--	7221	Junzhe Zhang, Tong Chen 0004, Kang You, Dandan Ding, Zhan Ma. ConPCAC: Conditional Lossless Point Cloud Attribute Compression via Spatial Decomposition
7222	--	7238	Danfu Yuan, Weizhan Zhang, Haiyu Huang 0005, Kai Xiao, Yunfei Ma, Xuan Zeng 0002, Peng Chen, Hongfei Yan, Yubing Qiu, Mingliang Yang, Songlin Li, Jinghui Zhong, Bin Xie. Understanding Operational CDN Live Streaming: A Measurement Study on Performance, Costs, and Enhancements
7239	--	7252	Shaojin Bai, Yalu Li, Rihao Chang, Qi Liang 0004, Weizhi Nie. SCDL: Sketch Causal Disentangled Learning for Sketch-Based 3D Shape Retrieval
7253	--	7265	Xu Lu 0004, Liang Zhang, Li Liu 0031, Huaxiang Zhang 0001. Incomplete Multi-Modal Weakly-Supervised Hashing With Consensus Bipartite Graph
7266	--	7278	Boyu Cai, Huibing Wang, Mingze Yao, XianPing Fu. Focus More on What? Guiding Multi-Task Training for End-to-End Person Search
7279	--	7293	Dayoung Lee, Minseok Song 0002. Optimizing Video Quality in Distributed Storage Systems via Deep Reinforcement Learning (DRL)-Based Adaptive Replication
7294	--	7307	Jiaojiao Li 0001, Ding Zhu, Rui Song 0003, Haitao Xu, Yunsong Li, Qian Du 0001. Multi-Feature Interaction and Degradation Estimation Transformer for Spectral Compressive Imaging
7308	--	7320	Ke-Wei Li, Hang Chen, Jun Du 0002, Hengshun Zhou, Sabato Marco Siniscalchi, Shutong Niu, Shifu Xiong. Lightweight Audio-Visual Wake Word Spotting With Diverse Acoustic Knowledge Distillation
7321	--	0	Fukun Yin, Zilong Huang, Tao Chen 0003, Guozhong Luo, Gang Yu 0002, Bin Fu. Corrections to "DCNet: Large-Scale Point Cloud Semantic Segmentation With Discriminative and Efficient Feature Aggregation"

5126	--	5139	Lin Zhu 0012, Weiquan Yan, Yi Chang 0002, Yonghong Tian 0001, Hua Huang 0001. Simultaneous Learning Intensity and Optical Flow From High-Speed Spike Stream
5140	--	5152	Fangyu Li, Junzhu Duan, Qiyu Zhang, Caifeng Shan, Honggui Han. Bi-Directional and Triangular Circulation Fusion Neural Networks for Small Object Detection
5153	--	5165	Chengyou Jia, Minnan Luo, Zhuohang Dang, Guang Dai, Xiaojun Chang, Jingdong Wang 0001. PSDiff: Diffusion Model for Person Search With Iterative and Collaborative Refinement
5166	--	5181	Cuixin Yang, Rongkang Dong, Jun Xiao 0010, Cong Zhang, Kin-Man Lam 0001, Fei Zhou 0001, Guoping Qiu. Geometric Distortion Guided Transformer for Omnidirectional Image Super-Resolution
5182	--	5194	Zhen Hong, Bowen Wang, Haoran Duan 0001, Yawen Huang, Xiong Li, Zhenyu Wen, Xiang Wu, Wei Xiang 0001, Yefeng Zheng 0001. SP-SLAM: Neural Real-Time Dense SLAM With Scene Priors
5195	--	5207	Linyin Luo, Hanjiang Lai, Yan Pan 0002, Jian Yin 0001. Efficient Multimodal Selection for Retrieval in Knowledge-Based Visual Question Answering
5208	--	5222	Dezhao Zhai, Wei Chen 0148, Yinghao Ding, Ming Yu 0007, Qinwei Li, Hang Wu. Research on Robust Measurement Method of Heart Rate Using Remote Photoplethysmography Based on Adversarial Learning Network With High and Low Frequency Features
5223	--	5235	Qinzhong Tan, Ao Li, Le Dong, Weisheng Dong, Xin Li 0005, Guangming Shi. CDS-Net: Contextual Difference Sensitivity Network for Pixel-Wise Road Crack Detection
5236	--	5250	Chenming Li, Shiguang Liu. TM2SP: A Transformer-Based Multi-Level Spatiotemporal Feature Pyramid Network for Video Saliency Prediction
5251	--	5264	Ziqian Lu, Mushui Liu, Yunlong Yu, Zhao Wang, Xi Li 0001, Jungong Han. Variational Adapter: Improving CLIP in Data-Imbalanced Scenarios
5265	--	5278	Linchun Hu, Wenming Cao 0001, Zhenqi Zhang, Yuchuang Liang. Progressive Feature Reconstruction Network for Zero-Shot Learning
5279	--	5292	Runxin Zhang, Xia Wu 0001, Huimin Chen, Guanxiong He, Zheng Wang 0037, Rong Wang 0001, Feiping Nie 0001. Toward Balance Adaptive Weighted Ensemble Clustering
5293	--	5306	Qiangqiang Shen, Zihou Guo, Hanzhang Wang, Yanhui Xu, Yongyong Chen, Shiqi Wang 0001, Yongsheng Liang 0001. Reliable Entropy-Induced Anchor Learning for Incomplete Multi-View Subspace Clustering
5307	--	5317	Zhidan Ran, Zhiyao Xiao, Xiaobo Lu, Xuan Wei, Wei Liu. Context-Aided Semantic-Aware Self-Alignment for Video-Based Person Re-Identification
5318	--	5330	Shujun Liu, Ling Chang. Conditional Dual Diffusion for Multimodal Clustering of Optical and SAR Images
5331	--	5342	Kaiwen Du, Weirong Ye, Hanyu Guo, Yan Yan 0001, Hanzi Wang. Edge Guided Network With Motion Enhancement for Few-Shot Action Recognition
5343	--	5354	Yuan Gao, Haibo Liu, Xiaohui Wei 0001. Semantic Concept Perception Network With Interactive Prompting for Cross-View Image Geo-Localization
5355	--	5366	Rui Wang, Quanxue Gao, Ming Yang 0024, Qianqian Wang 0001. Tensorized Tri-Factor Decomposition for Multi-View Clustering
5367	--	5379	Zihao He, Qianyu Shu, Jinming Wen, Hing-Cheung So. Efficient Sparse Recovery With Arctangent Regularization: A Novel Iterative Thresholding Algorithm
5380	--	5393	Guanchun Wang, Xiangrong Zhang, Zelin Peng, Shunli Tian, Tianyang Zhang 0002, Xu Tang, Licheng Jiao. OraL: An Observational Learning Paradigm for Unsupervised Hyperspectral Change Detection
5394	--	5406	Zhenkun Zhu 0001, Ruiqin Xiong, Jing Zhao 0011, Rui Zhao 0010, Xiaopeng Fan, Shuyuan Zhu, Tie-Jun Huang 0001. High Dynamic Range Imaging for Dynamic Scenes Based on Multi-Level Spike Camera
5407	--	5418	Yumeng Su, Jiachao Zhang, Rui Yan 0010, Pengpeng Li 0001, Guo-Sen Xie, Xiangbo Shu. STPM: Spatial-Temporal Token Pruning and Merging for Complex Activity Recognition
5419	--	5430	Xiusheng Xu, Lei Qi 0001, Jingyang Zhou, Xin Geng 0001. BatStyler: Advancing Multi-Category Style Generation for Source-Free Domain Generalization
5431	--	5444	Xinran Cao, Liang Luo, Yu Gu 0003, Fuji Ren. Co-Dance With Ambiguity: An Ambiguity-Aware Facial Expression Recognition Framework for More Robustness
5445	--	5460	Hui Lin, Nan Li, Pengjuan Yao, Kexin Dong, Yuhan Guo, Danfeng Hong, Ying Zhang, Congcong Wen. Generalization-Enhanced Few-Shot Object Detection in Remote Sensing
5461	--	5474	Junjie Li, Guanshuo Wang, Yichao Yan, Fufu Yu, Qiong Jia 0004, Jie Qin, Shouhong Ding, Xiaokang Yang 0001. GPS: Generalizable Person Search on Large-Scale User-Generated Video Content
5475	--	5488	Youze Wang, Wenbo Hu 0001, Yinpeng Dong, Jing Liu 0001, Hanwang Zhang, Richang Hong. Align Is Not Enough: Multimodal Universal Jailbreak Attack Against Multimodal Large Language Models
5489	--	5500	Min Long, Zhenyu Liu, Le-Bing Zhang, Fei Peng 0001. LGDF-Net: Local and Global Feature-Based Dual-Branch Fusion Networks for Deepfake Detection
5501	--	5517	Xiaotian Wu, Bofan Song, Jia Fang, Wei Qi Yan 0001, Qing-Yu Peng. CRP2-VCS: Contrast-Oriented Region-Based Progressive Probabilistic Visual Cryptography Schemes
5518	--	5532	Xuan Li, Guomin Zhang, Weiwei Chen, Li Cheng, Yining Xie, Jiayi Ma 0001. An Infrared and Visible Image Fusion Method Based on Semantic-Sensitive Mask Selection and Bidirectional-Collaboration Region Fusion
5533	--	5544	Jinliang Liu, Zongxin Yang. Test-Time Adaptation for Real-World Video Adverse Weather Restoration With Meta Batch Normalization
5545	--	5559	Huicong Zhang, Haozhe Xie, Shengping Zhang, Hongxun Yao. Patch-Based Spatio-Temporal Deformable Attention BiRNN for Video Deblurring
5560	--	5574	Yuan Shi, Bin Xia, Xiaoyu Jin, Xing Wang, Tianyu Zhao, Xin Xia 0014, Xuefeng Xiao 0001, Wenming Yang. VmambaIR: Visual State Space Model for Image Restoration
5575	--	5588	Chaopeng Zhang, Ruiqin Xiong, Xiaopeng Fan, Debin Zhao. Attentive Large Kernel Network With Mixture of Experts for Video Deblurring
5589	--	5601	Haozhi Shi, Weiying Xie, Haonan Qin, Yunsong Li, Leyuan Fang. Visual State Space Model With Graph-Based Feature Aggregation for No-Reference Image Quality Assessment
5602	--	5616	JunJie Zhu, Liquan Shen, Zhengyong Wang, Yihan Yu. Underwater Image Quality Assessment Using Feature Disentanglement and Dynamic Content-Distortion Guidance
5617	--	5632	Xiaolong Liu, Song Qiu, Mei Zhou, Weijie Le, Qingli Li, Yan Wang 0033. WFANet-DDCL: Wavelet-Based Frequency Attention Network and Dual Domain Consistency Learning for 7T MRI Synthesis From 3T MRI
5633	--	5643	Yajie Chen, Shujuan Wang, Boshuai Zhang, Lihua Lin, Qianqian Chai, Jiazheng Yang, Xin Yang 0008, Qian Liu. Multi-Granularity Topology-Aware Cell Localization and Counting in Pathological Images
5644	--	5658	Kun Yang 0010, Zhi Xu, Dingkang Yang, Qiang Fu, Rui Tang, Liang Song, Lihua Zhang. Robust Multi-Agent Collaborative Perception via Spatio-Temporal Awareness
5659	--	5670	Long Zhang, Peipei Song, Zhangling Duan, Shuo Wang 0008, Xiaojun Chang, Xun Yang 0001. Video Corpus Moment Retrieval With Query-Specific Context Learning and Progressive Localization
5671	--	5683	Zhiming Wang, Ning Ge 0001, Jianhua Lu. Motion In-Betweening With Spatial and Temporal Transformers
5684	--	5696	Meng Wang, Yan Ding 0004, Yumeng Liu, Yunchuan Qin, Ruihui Li, Zhuo Tang. MixSSC: Forward-Backward Mixture for Vision-Based 3D Semantic Scene Completion
5697	--	5710	Hao Jing, Anhong Wang, Lijun Zhao 0002, Yakun Yang, Donghan Bu, Jing Zhang, Yifan Zhang, Junhui Hou. Boosting 3D Object Detection With Semantic-Aware Multi-Branch Framework
5711	--	5723	Zhenbo Yu, Junjie Wang, Hang Wang, Zhiyuan Zhang, Jinxian Liu, Zefan Li, Bingbing Ni, Wenjun Zhang 0001. Mesh2Animation: Unsupervised Animating for Quadruped 3D Objects
5724	--	5737	Yufeng Yin 0004, Xiaoyan Liu, Zichao Zhang. SMA-MVS: Segmentation-Guided Multi-Scale Anchor Deformation Patch Multi-View Stereo
5738	--	5748	Junsong Zhang, Zisong Chen, Chunyu Lin, Zhijie Shen, Lang Nie, Kang Liao, Yao Zhao 0001. SGFormer: Spherical Geometry Transformer for 360° Depth Estimation
5749	--	5761	Xin Zhang, Kun Liu 0009, Xinwang Wang, Zhong Zhou, Haiyong Chen. RMGNet: The Progressive Relationship-Mining Graph Neural Network for Text-to-Image Person Re-Identification
5762	--	5775	Changhao Wang, Guanwen Zhang, Zhengyun Cheng, Wei Zhou 0020. KPDepth-VO: Self-Supervised Learning of Scale-Consistent Visual Odometry and Depth With Keypoint Features From Monocular Video
5776	--	5790	Tengfei Liu, Yongli Hu, Mingjie Li 0006, Junfei Yi, Xiaojun Chang, Junbin Gao, Baocai Yin. Tackling Real-World Complexity: Hierarchical Modeling and Dynamic Prompting for Multimodal Long Document Classification
5791	--	5804	Hailun Cheng, Shenjin Huang, Linghan Cai, Yangfan Xu, Runming Wang, Yongbing Zhang 0002. Focus Your Attention: Multiple Instance Learning With Attention Modification for Whole Slide Pathological Image Classification
5805	--	5820	Biqing Qi, Junqi Gao, Xinquan Chen, Dong Li 0016, Jianxing Liu, Ligang Wu 0001, Bowen Zhou 0002. Contrastive Augmented Graph2Graph Memory Interaction for Few Shot Continual Learning
5821	--	5832	Guoqing Zhang 0002, Yan Yang, Yuhui Zheng, Gaven J. Martin, Ruili Wang. Mask-Aware Hierarchical Aggregation Transformer for Occluded Person Re-Identification
5833	--	5843	Guanghui He, Yanli Ren, Xiaoqiu Cai, Guorui Feng, Xinpeng Zhang 0001. Private Sampling of Latent Diffusion Models for Encrypted Prompt
5844	--	5857	Runmin Cong, Ning Yang 0008, Hongyu Liu 0003, Dingwen Zhang, Qingming Huang, Sam Kwong, Wei Zhang 0021. TRNet: Two-Tier Recursion Network for Co-Salient Object Detection
5858	--	5871	Ye Liu 0005, Pengfei Wu, Miaohui Wang, Jun Liu 0036. CPAL: Cross-Prompting Adapter With LoRAs for RGB+X Semantic Segmentation
5872	--	5884	Ning Li, Bineng Zhong, Qihua Liang, Zhiyi Mo, Jian Nong, Shuxiang Song 0001. SIEVL-Track: Exploring Semantic Information Enhancement for Visual-Language Object Tracking
5885	--	5899	Ning Liao, Xiaopeng Zhang 0008, Min Cao, Junchi Yan. M-Tuning: Prompt Tuning With Mitigated Label Bias in Open-Set Scenarios
5900	--	5911	Xu Zhang, Bo Peng 0007, Jianjun Lei, Chao Xue, Yuxuan Yao, Qingming Huang. Adversarially Robust Object Detection via Deviation Calibration and Content Preservation
5912	--	5924	Yijun Pan, Quan Zhao, Yueyi Zhang, Zilei Wang, Xiaoyan Sun 0001, Feng Wu 0005. Semantic-Aware Late-Stage Supervised Contrastive Learning for Fine-Grained Action Recognition
5925	--	5938	Chenting Xu, Ke Xu 0003, Xinghao Jiang, Tanfeng Sun. PLOVAD: Prompting Vision-Language Models for Open Vocabulary Video Anomaly Detection
5939	--	5951	Wenming Cao 0001, Liangxi Qian, Yicha Zhang, Xuelong Li 0001, Xinpeng Yin. Asymmetric Context-Guided Adaptive Alignment Network for Skeleton-Based Action Recognition
5952	--	5965	Fengyu Liu, Yi Cao, Xianghong Cheng, Jianfeng Wu, Wendong Gu, Luhui Liu. Confidence Factor-Based Robust Localization Algorithm With Visual-Inertial-LiDAR Fusion in Underground Space
5966	--	5979	Xiang Yuan, Gong Cheng 0003, Ruixiang Yao, Junwei Han. Semantic Differentiation Aids Oriented Small Object Detection
5980	--	5992	Zixuan Zhao, Shuming Liu 0001, Chengze Zhao, Xu Zhao 0001. Constructing Semantical Structure by Segmentation Integrated Video Embedding for Temporal Action Detection
5993	--	6006	Yueting Huang, Zhenzhe Hechen, Mingliang Zhou, Zhengguo Li, Sam Kwong. An Attention-Locating Algorithm for Eliminating Background Effects in Fine-Grained Visual Classification
6007	--	6020	Xinke Wang, Jingyuan Xu, Xiao Sun 0003, Mingzheng Li, Bin Hu 0001, Wei Qian, Dan Guo 0001, Meng Wang 0001. Facial Depression Estimation via Multi-Cue Contrastive Learning
6021	--	6033	Zeng-Yang Che, Zheng Zhang 0006, Yaping Wu, Meiyun Wang. Disentangle and Then Fuse: A Cross-Modal Network for Synthesizing Gadolinium-Enhanced Brain MR Images
6034	--	6046	Ling Yang 0006, Yikai Zhao 0001, Zhaochen Yu, Bohan Zeng, Minkai Xu, Shenda Hong, Bin Cui 0001. Spatio-Temporal Energy-Guided Diffusion Model for Zero-Shot Video Synthesis and Editing
6047	--	6058	Ruoyu Zhao, Mingrui Zhu, Shiyin Dong, De Cheng, Nannan Wang 0001, Xinbo Gao 0001. CatVersion: Concatenating Embeddings for Diffusion-Based Text-to-Image Personalization
6059	--	6073	Cong Wang 0018, Panwen Hu, Haoyu Zhao, Yuanfan Guo, Jiaxi Gu, Xiao Dong, Jianhua Han, Hang Xu 0004, Xiaodan Liang. UniAdapter: All-in-One Control for Flexible Video Generation
6074	--	6086	Kexiang Feng, Chuanmin Jia, Jingshan Pan, Siwei Ma, Wen Gao 0001. End-to-End Optimized Lossy Compression for Neural-Morphic Spiking Camera Captured Data
6087	--	6100	Lei Luo 0003, Junjie Wu, Zhi Jin, Hongwei Guo 0001, Ce Zhu. Joint Resources Optimization for Soft Video Transmission Over IRS-Assisted SR Network
6101	--	6113	Yifei Wang, Gaozhi Liu, Zhiying Zhu 0001, Xinpeng Zhang 0001, Zhenxing Qian. VivID: A Visually Improved GIF Encoding Network Design
6114	--	6128	Hengyu Man, Hao Wang 0212, Riyu Lu, Zhaolin Wan, Xiaopeng Fan, Debin Zhao. Content-Aware Dynamic In-Loop Filter With Adjustable Complexity for VVC Intra Coding
6129	--	6144	Jinjia Peng, Mengkai Li, Bingyan Wang, Huibing Wang. Omni Contextual Aggregation Networks for High-Fidelity Image Inpainting
6145	--	6157	Junyan Huo, Yanzhuo Ma, Zhenyao Zhang, Hongli Zhang, Hui Yuan 0001, Shuai Wan, FuZheng Yang 0001. Adaptive Enhanced Global Intra Prediction for Efficient Video Coding in Beyond VVC
6158	--	6169	Chang-xing Li, Donglin Zhang, Zhikai Hu, Xiaojun Wu 0001. Modality Fused Class-Proxy With Knowledge Distillation for Zero-Shot Sketch-Based Image Retrieval
6170	--	6183	Jingcheng Ke, Jia Wang, Waikeung Wong, Anne Toomey, Jie Wen 0001. Graph-Based Group Division Network for Referring Expression Comprehension
6184	--	6194	Ming Jin 0007, Wenbo Hu 0001, Richang Hong, Lei Zhu 0002. Revealing Security Flaws in Cross-Modal Retrieval Models Through Video Poisoning
6195	--	6210	Mingyue Niu, Xu Wang, Jibing Gong, Bin Liu 0041, Jianhua Tao 0001, Björn W. Schuller. Depression Scale Dictionary Decomposition Framework for Multimodal Automatic Depression Level Prediction

3924	--	3939	Yafeng Li, Yuehan Chen, Jiqing Zhang, Yudong Li, XianPing Fu. An Underwater Image Restoration Method With Polarization Imaging Optimization Model for Poor Visible Conditions
3940	--	3954	Runhao Zeng, Yishen Zhuo, Jialiang Li, Yunjin Yang, Huisi Wu, Qi Chen 0014, Xiping Hu 0001, Victor C. M. Leung. Improving Video Moment Retrieval by Auxiliary Moment-Query Pairs With Hyper-Interaction
3955	--	3968	Xun Jiang 0001, Liqing Zhu, Xing Xu 0001, Fumin Shen, Yang Yang 0002, Heng Tao Shen. Query as Supervision: Toward Low-Cost and Robust Video Moment and Highlight Retrieval
3969	--	3982	Xinyi Zhang, Haoran Xu 0004, Chenyun Yu, Guang Tan. PCTrack: Accurate Object Tracking for Live Video Analytics on Resource-Constrained Edge Devices
3983	--	3999	Lei Zhu 0005, Runbing Wu, Xinghui Zhu, Chengyuan Zhang 0001, Lin Wu 0001, Shichao Zhang 0001, Xuelong Li 0001. Bi-Direction Label-Guided Semantic Enhancement for Cross-Modal Hashing
4000	--	4010	Yiheng Jiang, Haotian Zhang, Li Li 0040, Dong Liu 0002, Zhu Li 0001. Sparse Point Clouds Assisted Learned Image Compression
4011	--	4025	Xinjian Wei, Yu Qiu, Xiaoxuan Xu, Jing Xu 0008, Jie Mei, Jun Zhang 0003. ECINFusion: A Novel Explicit Channel-Wise Interaction Network for Unified Multi-Modal Medical Image Fusion
4026	--	4038	Jiayi Lyu, Xing Lan, Guohong Hu, Hanyu Jiang, Wei Gan, Jinbao Wang, Jian Xue. Multimodal Emotional Talking Face Generation Based on Action Units
4039	--	4054	Junyu Fan, Jie Xu, Jingchun Zhou, Danling Meng, Yi Lin 0006. See Through Water: Heuristic Modeling Toward Color Correction for Underwater Image Enhancement
4055	--	4071	Qi Zang, Shuang Wang 0001, Dong Zhao, Zhun Zhong, Biao Hou, Licheng Jiao. Joint Style and Layout Synthesizing: Toward Generalizable Remote Sensing Semantic Segmentation
4072	--	4086	Lanhu Wu, Miao Zhang, Yongri Piao, Zhenyan Yao, Weibing Sun, Feng Tian, Huchuan Lu. CNN-Transformer Rectified Collaborative Learning for Medical Image Segmentation
4087	--	4099	Wen Zhang, Zhenshan Tan, Li Zhang, Zhijiang Li. Color Decoupling for Multi-Illumination Color Constancy
4100	--	4115	Xuan Tan, Xun Gong 0002, Yang Xiang. CLIP-Based Camera-Agnostic Feature Learning for Intra-Camera Supervised Person Re-Identification
4116	--	4129	Anwei Luo, Rizhao Cai, Chenqi Kong, Yakun Ju, Xiangui Kang, Jiwu Huang, Alex C. Kot. Forgery-Aware Adaptive Learning With Vision Transformer for Generalized Face Forgery Detection
4130	--	4143	Yanlong Yang, Jianan Liu, Tao Huang 0008, Qing-Long Han, Gang Ma, Bing Zhu 0004. RaLiBEV: Radar and LiDAR BEV Fusion Learning for Anchor Box Free Object Detection Systems
4144	--	4157	Zhaofeng Shi, Heqian Qiu, Lanxiao Wang, Fanman Meng, Qingbo Wu 0001, Hongliang Li 0001. Cognition Transferring and Decoupling for Text-Supervised Egocentric Semantic Segmentation
4158	--	4171	Qiongjie Cui, Zhenyu Lou, Zhenbo Song, Xiangbo Shu. Toward Physically Stable Motion Generation: A New Paradigm of Human Pose Representation
4172	--	4183	Hangwei Chen, Feng Shao 0001, Xiongli Chai, Baoyang Mu, Qiuping Jiang. Art Comes From Life: Artistic Image Aesthetics Assessment via Attribute Knowledge Amalgamation
4184	--	4197	Yuxiang Shao, Feifei Zhang, Changsheng Xu. Text-Video Knowledge Guided Prompting for Weakly Supervised Temporal Action Localization
4198	--	4211	Dewen Qiao, Xiang Ao, Yu Liu 0021, Xuetao Chen, Fuyuan Song, Zheng Qin 0001, Wenqiang Jin. Tri-AFLLM: Resource-Efficient Adaptive Asynchronous Accelerated Federated LLMs
4212	--	4225	Haihong Xiao, Wenxiong Kang, Hao Liu 0061, Yuqiong Li, Ying He 0001. Semantic Scene Completion via Semantic-Aware Guidance and Interactive Refinement Transformer
4226	--	4241	Yuqi Jiang, Jing Li 0010, Yanran Dai, Haidong Qin, Xiaoshi Zhou, Yong Zhang, Hongwei Liu, Kefan Yan, Tao Yang 0006. RT3DHVC: A Real-Time Human Holographic Video Conferencing System With a Consumer RGB-D Camera Array
4242	--	4255	Shibai Yin, Yiwei Shi, Yibin Wang 0001, Yee-Hong Yang. When Aware Haze Density Meets Diffusion Model for Synthetic-to-Real Dehazing
4256	--	4270	Fan Xu 0005, Chuibin Chen, Zhigao Shang, Kai-Kuang Ma, QiHui Wu, Zebin Lin, Jie Zhan, Yizhou Shi. Deep Multi-Modal Ship Detection and Classification Network
4271	--	4286	Yanjie Liang, Qiangqiang Wu, Lin Cheng, Changqun Xia, Jia Li 0003. Progressive Semantic-Visual Alignment and Refinement for Vision-Language Tracking
4287	--	4299	Dan Song 0006, Xuanpu Zhang, Jianhao Zeng, Pengxin Zhan, Qingguo Chen, Weihua Luo, An-An Liu. Better Fit: Accommodate Variations in Clothing Types for Virtual Try-On
4300	--	4313	Yiyao Fan, Jun Lin 0003, Changming Sun, Tianhao Wang 0009, Yuehan Qi, Guanyu Zhang, Yang Liu 0333. An Image Terrain Map Model for Texture Filtering
4314	--	4328	Yuanwei Liu, Nian Liu, Yi Wu, Hisham Cholakkal, Rao Muhammad Anwer, Xiwen Yao, Junwei Han. NTRENet++: Unleashing the Power of Non-Target Knowledge for Few-Shot Semantic Segmentation
4329	--	4340	Rao Fu, Qian Li, Cheng Wen 0001, Ning An 0002, Fulin Tang. A Novel Framework for Learning Bézier Decomposition From 3D Point Clouds
4341	--	4356	Sai Yang, Bin Hu 0023, Fan Liu 0003, Xiaoxin Wu 0004, Weiping Ding 0001, Jun Zhou 0001. IPT-ILR: Image Pyramid Transformer Coupled With Information Loss Regularization for All-in-One Image Restoration
4357	--	4369	Han Zhu 0003, Zhenzhong Chen, Shan Liu 0001. Information Bottleneck Based Self-Distillation: Boosting Lightweight Network for Real-World Super-Resolution
4370	--	4383	Chenyang Shi, Boyi Wei, Xiucheng Wang, Hanxiao Liu, Yibo Zhang, Wenzhuo Li, Ningfang Song, Jing Jin. Polarity-Focused Denoising for Event Cameras
4384	--	4396	Hong Zhu, Pingping Zhang, Lei Xue, Guanglin Yuan. Multi-Modal Understanding and Generation for Object Tracking
4397	--	4408	Guang-yong Chen, Chao-Wei Zheng, Guodong Fan, Jian-Nan Su, Min Gan, C. L. Philip Chen. Real-World Image Reflection Removal: An Ultra-High-Definition Dataset and an Efficient Baseline
4409	--	4422	Xinmiao Ding, Jinming Lou, Wenyang Luo, Yufan Liu, Bing Li 0001, Weiming Hu. iESTA: Instance-Enhanced Spatial-Temporal Alignment for Video Copy Localization
4423	--	4436	Qianyu Zhang, Bolun Zheng, Xingying Chen, Quan Chen, Zunjie Zhu, Canjin Wang, Zongpeng Li, Xu Jia 0012, Chengang Yan. Hierarchical Frequency-Based Upsampling and Refining for HEVC Compressed Video Enhancement
4437	--	4449	Haochen Yu, Weixi Gong, Jiansheng Chen, Huimin Ma 0001. GET3DGS: Generate 3D Gaussians Based on Points Deformation Fields
4450	--	4463	Shuyang Wang, Kang Liu 0014, Ju Huang, Xuelong Li 0001. FLDet: Faster and Lighter Aerial Object Detector
4464	--	4478	Yang Yang 0080, Chao Wang 0003, Lei Gong, Min Wu 0008, Zhenghua Chen, Yingxue Gao, Teng Wang, Xuehai Zhou. Uncertainty-Aware Self-Knowledge Distillation
4479	--	4492	Jie Wang, Xiangji Kong, Nana Yu, Zihao Zhang, Yahong Han. Explicitly Disentangling and Exclusively Fusing for Semi-Supervised Bi-Modal Salient Object Detection
4493	--	4505	Yicong He, George K. Atia. Scalable and Robust Tensor Ring Decomposition for Large-Scale Data With Missing Data and Outliers
4506	--	4520	Hao Zhang, Sicheng Li, Yupeng Gui, Zhiyong Li 0016, Shusong Xu, YanHeng Lu, Dimin Niu, Hongzhong Zheng, Yen-Kuang Chen, Yuan Xie 0001, Yibo Fan. A Tightly Coupled AI-ISP Vision Processor
4521	--	4534	Jie Wang, Nana Yu, Zihao Zhang, Yahong Han. Single-Group Generalized RGB and RGB-D Co-Salient Object Detection
4535	--	4548	Jinzheng Guang, Shichao Wu, Zhengxi Hu, Qianyi Zhang, Peng Wu, Jingtai Liu. DCCLA: Dense Cross Connections With Linear Attention for LiDAR-Based 3D Pedestrian Detection
4549	--	4559	Tong Zhao, Qiang Fang, Xin Xu 0001. Denser Teacher: Rethinking Dense Pseudo-Label for Semi-Supervised Oriented Object Detection
4560	--	4575	Chao You, Licheng Jiao, Lingling Li 0002, Xu Liu 0006, Fang Liu 0001, Wenping Ma 0001, Shuyuan Yang 0001. Contour Knowledge-Aware Perception Learning for Semantic Segmentation
4576	--	4591	Ting Luo 0001, Yuhang Zhou, Zhouyan He, Gangyi Jiang, Haiyong Xu, Shuren Qi, Yushu Zhang 0001. StegMamba: Distortion-Free Immune-Cover for Multi-Image Steganography With State Space Model
4592	--	4607	Zeng You, Zhiquan Wen, Yaofo Chen, Xin Li 0034, Runhao Zeng, Yaowei Wang 0001, Mingkui Tan. Toward Long Video Understanding via Fine-Detailed Video Story Generation
4608	--	4618	Yanfeng Zheng, Zhong Luo, Ying Cao 0001, Xiaosong Yang, Weiwei Xu, Zheng Lin 0005, Nan Yin, Pengjie Wang 0001. Unsupervised Salient Object Detection on Light Field With High-Quality Synthetic Labels
4619	--	4634	Xiaoyan Yu, Shen Zhou, Huafeng Li, Liehuang Zhu. Multi-Expert Adaptive Selection: Task-Balancing for All-in-One Image Restoration
4635	--	4647	Huafeng Chen, Pengxu Wei, Guangqian Guo, Shan Gao 0003. SAM-COD+: SAM-Guided Unified Framework for Weakly-Supervised Camouflaged Object Detection
4648	--	4660	Yue Wu 0004, Jiayi Lei, Yongzhe Yuan, Xiaolong Fan, Maoguo Gong, Wenping Ma 0001, Qiguang Miao, Mingyang Zhang 0002. Equivariance-Based Markov Decision Process for Unsupervised Point Cloud Registration
4661	--	4674	Qiang Qiao, Meixia Qu, Wenyu Wang, Bin Jiang 0011, Qiang Guo 0003. Effective Global Context Integration for Lightweight 3D Medical Image Segmentation
4675	--	4685	Hu Ding, Yan Yan 0001, Yang Lu 0009, Jing-Hao Xue, Hanzi Wang. Uncertainty-Aware Label Refinement on Hypergraphs for Personalized Federated Facial Expression Recognition
4686	--	4697	Zhimao Peng, Enguang Wang, Xialei Liu, Ming-Ming Cheng. Predictive Sample Assignment for Semantically Coherent Out-of-Distribution Detection
4698	--	4712	Lingyun Yu 0002, Tian Xie, Chuanbin Liu 0001, Guoqing Jin, Zhiguo Ding 0006, Hongtao Xie. Distilling Multi-Level Semantic Cues Across Multi-Modalities for Face Forgery Detection
4713	--	4726	Shuhan Dong, Weiying Xie, Danian Yang, Yunsong Li, Jiaqing Zhang, Jiayuan Tian, Jie Lei 0001. SeaDATE: Remedy Dual-Attention Transformer With Semantic Alignment via Contrast Learning for Multimodal Object Detection
4727	--	4739	Wenjie Li, Xiaolong Li 0001, Rongrong Ni, Yao Zhao 0001. Extracting High-Discriminative Features for Detecting Double JPEG Compression With the Same Quantization Matrix
4740	--	4752	Xin Guo, Xi Wang, Xueyang Fu, Zheng-Jun Zha. Deep Unfolding Network for Image Desnowing With Snow Shape Prior
4753	--	4767	Ye Zhang, Yifeng Wang 0001, Zijie Fang, Hao Bian, Linghan Cai, Ziyue Wang 0005, Yongbing Zhang 0002. DAWN: Domain-Adaptive Weakly Supervised Nuclei Segmentation via Cross-Task Interactions
4768	--	4783	Shaohui Li, Shuoyu Ma, Wenrui Dai, Nuowen Kan, Fan Cheng 0002, Chenglin Li, Junni Zou, Hongkai Xiong. Task-Adapted Learnable Embedded Quantization for Scalable Human-Machine Image Compression
4784	--	4800	Xiaojiao Guo, Xuhang Chen 0002, Shuqiang Wang, Chi-Man Pun. Underwater Image Restoration Through a Prior Guided Hybrid Sense Approach and Extensive Benchmark Analysis
4801	--	4815	XiangHai Wang 0001, Liyang Song, Yining Feng, Junheng Zhu. S3F2Net: Spatial-Spectral-Structural Feature Fusion Network for Hyperspectral Image and LiDAR Data Classification
4816	--	4830	Tongbo Wang, Lin Zhu 0012, Hua Huang 0001. Enhancing Real-Time Object Detection With Optical Flow-Guided Streaming Perception
4831	--	4845	Zhenghua Huang, Cheng Lin, Biyun Xu, Menghan Xia, Qian Li 0019, Yansheng Li 0001, Nong Sang. 2EA: Target-Aware Taylor Expansion Approximation Network for Infrared and Visible Image Fusion
4846	--	4856	Li Yu 0004, Hongchao Zhong, Longkun Zou, Ke Chen 0004, Pan Gao 0001. Bridging Domain Gap of Point Cloud Representations via Self-Supervised Geometric Augmentation
4857	--	4869	Ruiheng Zhang, Zhe Cao, Yan Huang 0023, Shuo Yang 0006, Lixin Xu, Min Xu 0001. Visible-Infrared Person Re-Identification With Real-World Label Noise
4870	--	4882	Zelin Liu, Xinggang Wang, Cheng Wang, Wenyu Liu 0001, Xiang Bai. SparseTrack: Multi-Object Tracking by Performing Scene Decomposition Based on Pseudo-Depth
4883	--	4895	Yuan Zhao, Jiayu Sun, Lihe Zhang, Huchuan Lu. FocusCLIP: Focusing on Anomaly Regions by Visual-Text Discrepancies
4896	--	4909	Chunxiao Liu, Zelong Wang, Philip Birch, Xun Wang 0007. Efficient Retinex-Based Framework for Low-Light Image Enhancement Without Additional Networks
4910	--	4922	Sun'ao Liu, Hongtao Xie, Jiannan Ge, Yongdong Zhang 0001. ReferSAM: Unleashing Segment Anything Model for Referring Image Segmentation
4923	--	4936	Chaojun Dong, Chengxuan Wang, Yikui Zhai, Ye Li, Jianhong Zhou, Pasquale Coscia, Angelo Genovese, Vincenzo Piuri, Fabio Scotti. GMTNet: Dense Object Detection via Global Dynamically Matching Transformer Network
4937	--	4948	An-An Liu, Quanhan Wu, Ning Xu 0003, Hongshuo Tian, Lanjun Wang. Enriched Image Captioning Based on Knowledge Divergence and Focus
4949	--	4962	Jian Wang 0113, Fan Li 0003, Lijun He 0001. A Unified Framework for Adversarial Patch Attacks Against Visual 3D Object Detection in Autonomous Driving
4963	--	4975	Yaoye Song, Peng Zhang 0005, Wei Huang 0013, Yufei Zha, Yanning Zhang 0001. Flexible Temperature Parallel Distillation for Dense Object Detection: Make Response-Based Knowledge Distillation Great Again
4976	--	4990	Enki Cho, Jung-Uk Kim, Seong Tae Kim 0001. Spatial Mask-Based Adaptive Robust Training for Video Object Segmentation With Noisy Labels
4991	--	5005	Shuo Li 0010, Fang Liu 0001, Licheng Jiao, Lingling Li 0002, Puhua Chen, Xu Liu 0006, Wenping Ma 0001. Prompt-Based Concept Learning for Few-Shot Class-Incremental Learning
5006	--	5021	Taeheon Kim, Sangyun Chung, Damin Yeom, Youngjoon Yu, Hak Gu Kim, Yong Man Ro. MSCoTDet: Language-Driven Multi-Modal Fusion for Improved Multispectral Pedestrian Detection
5022	--	5036	Zhihao Li, Huaxiang Zhang 0001, Lei Zhu 0002, Jiande Sun 0001, Li Liu 0031. Heterogeneous Generative Tokens and Distance-Aware Recovery Network for Occluded Person Re-Identification
5037	--	5050	Shilin Xu, Xiangtai Li, Size Wu, Wenwei Zhang, Yunhai Tong, Chen Change Loy. DST-Det: Open-Vocabulary Object Detection via Dynamic Self-Training
5051	--	5066	Rongshan Chen, Hao Sheng 0001, Da Yang 0001, Zhenglong Cui, Ruixuan Cong. Surface-Continuous Scene Representation for Light Field Depth Estimation via Planarity Prior
5067	--	5077	Xiangzeng Liu, Jianfeng Guo, Hao Chen, Qiguang Miao, Yue Xi, Ruyi Liu. Adaptive Occlusion-Aware Network for Occluded Person Re-Identification
5078	--	5091	Shangshu Yu, Meiqing Wu, Siew Kei Lam. VFM-Depth: Leveraging Vision Foundation Model for Self-Supervised Monocular Depth Estimation
5092	--	5108	Xi Wang, Wei Liu 0004, Shimin Gong, Zhi Liu 0002, Jing Xu 0005, Yuming Fang. Spatial Quality Oriented Rate Control for Volumetric Video Streaming via Deep Reinforcement Learning
5109	--	5122	Rongyu Zhang, Jiaming Liu 0003, Xiaoqi Li 0009, Xiaowei Chi, Dan Wang 0002, Li Du, Yuan Du, Shanghang Zhang. BEVUDA++: Geometric-Aware Unsupervised Domain Adaptation for Multi-View 3D Object Detection

2947	--	2950	Wenguan Wang, Hengshuang Zhao, Xinggang Wang, Fisher Yu 0001, David Crandall. Guest Editorial Introduction to the Special Issue on Segment Anything for Videos and Beyond
2951	--	2962	Shanghong Li, Yongquan Chen, Long Xu, Jun Luo, Rui Huang 0001, Feng Wu 0001, Yingliang Miao. ClickAdapter: Integrating Details Into Interactive Segmentation Model With Adapter
2963	--	2974	Hao Fang 0010, Tong Zhang, Xiaofei Zhou, Xinxin Zhang 0004. Learning Better Video Query With SAM for Video Instance Segmentation
2975	--	2986	Yuhang Ding, Hongmin Liu 0001. Barely-Supervised Brain Tumor Segmentation via Employing Segment Anything Model
2987	--	2998	Binwei Xu, Qiuping Jiang, Xing Zhao 0001, Chenyang Lu 0002, Haoran Liang 0001, Ronghua Liang. Multidimensional Exploration of Segment Anything Model for Weakly Supervised Video Salient Object Detection
2999	--	3012	Xingyu Gao 0001, Zuolei Li, Hailong Shi, Zhenyu Chen 0003, Peilin Zhao. Scribble-Supervised Video Object Segmentation via Scribble Enhancement
3013	--	3023	Ziqi Zhang, Siduo Pan, Kun Wei, Jiapeng Ji, Xu Yang 0019, Cheng Deng. Few-Shot Generative Model Adaption via Optimal Kernel Modulation
3024	--	3038	Zhengqing Fang, Zhouhang Yuan, Ziyu Li, Jingyuan Chen, Kun Kuang, Yu-Feng Yao, Fei Wu 0001. Cross-Modality Image Interpretation via Concept Decomposition Vector of Visual-Language Models
3039	--	3053	Peng Huang, Xiangbo Shu, Rui Yan 0010, Zhewei Tu, Jinhui Tang 0001. Appearance-Agnostic Representation Learning for Compositional Action Recognition
3054	--	3080	Lingyan Ran, Yali Li, Guoqiang Liang 0001, Yanning Zhang 0001. Pseudo Labeling Methods for Semi-Supervised Semantic Segmentation: A Review and Future Perspectives
3081	--	3093	Zhifan Gao, Saidi Guo, Chenchu Xu, Jinglin Zhang, Mingming Gong, Javier Del Ser, Shuo Li 0001. Multi-Domain Adversarial Variational Bayesian Inference for Domain Generalization
3094	--	3103	Xiaoxu Li, Peiyu Lu, Rui Zhu 0006, Zhanyu Ma, Jie Cao 0014, Jing-Hao Xue. Rise by Lifting Others: Interacting Features to Uplift Few-Shot Fine-Grained Classification
3104	--	3118	Haoran Gao, Fasheng Wang, Mengyin Wang, Fuming Sun, Haojie Li. Highly Efficient RGB-D Salient Object Detection With Adaptive Fusion and Attention Regulation
3119	--	3133	Zhiyang Guo, Wengang Zhou 0001, Li Li 0040, Min Wang 0019, Houqiang Li. Motion-Aware 3D Gaussian Splatting for Efficient Dynamic Scene Reconstruction
3134	--	3145	Luoying Hao, Yan Hu, Yang Yue, Li Wu, Huazhu Fu, Jinming Duan 0001, Jiang Liu 0001. Hierarchical Context Transformer for Multi-Level Semantic Scene Understanding
3146	--	3159	Songlin Dong, Xinyuan Gao, Yuhang He, Zhengdong Zhou, Alex C. Kot, Yihong Gong. CEAT: Continual Expansion and Absorption Transformer for Non-Exemplar Class-Incremental Learning
3160	--	3171	Guoqing Zhang 0002, Jin Li, Yuhui Zheng, Ruili Wang. InfinitePerson: Innovating Synthetic Data Creation for Generalization Person Re-Identification
3172	--	3184	Jiang Xin, Sheng Yue, Jinrui Zhang, Ju Ren 0001, Feng Qian, Yaoxue Zhang. MAML-RAL: Learning Domain-Invariant HOI Rules for Real-Time Video Matting
3185	--	3195	Zicheng Zhang, Wei Ke 0003, Yi Zhu 0004, Xiaodan Liang, Jianzhuang Liu, Qixiang Ye, Tong Zhang 0001. Language-Driven Visual Consensus for Zero-Shot Semantic Segmentation
3196	--	3208	Huan Liu, Jian Sun 0009. UniSTAD: An Unified Triple-Tower Student-Teacher Model for Multi-Class Anomaly Detection and Localization
3209	--	3221	Jingkai Ma, Shuang Bai. SGFNet: Structure-Guided Few-Shot Object Detection
3222	--	3233	Wujie Zhou, Hongping Wu, Qiuping Jiang. MDNet: Mamba-Effective Diffusion-Distillation Network for RGB-Thermal Urban Dense Prediction
3234	--	3249	Mingzhu Xu, Tianxiang Xiao, Yutong Liu, Haoyu Tang, Yupeng Hu, Liqiang Nie. CMIRNet: Cross-Modal Interactive Reasoning Network for Referring Image Segmentation
3250	--	3261	Weiqing Yan, Kanglong Liu, Wujie Zhou, Chang Tang. Deep Incomplete Multi-View Clustering via Dynamic Imputation and Triple Alignment With Dual Optimization
3262	--	3275	Jiaming Li, Lingyun Yu 0002, Runxin Liu, Hongtao Xie. A Detail-Aware Transformer to Generalizable Face Forgery Detection
3276	--	3289	Gang Wang, Chaoran Zhu, Qian Xu, Tongzhou Zhang 0001, Hai Zhang 0003, Xiaopeng Fan, Jue Hu. CCTNet: A Circular Convolutional Transformer Network for LiDAR-Based Place Recognition Handling Movable Objects Occlusion
3290	--	3302	Yanqing Yao, Gong Cheng 0003, Chunbo Lang, Xingxing Xie, Junwei Han. Centric Probability-Based Sample Selection for Oriented Object Detection
3303	--	3314	Liang Zhao 0005, Xiao Wang, Zhenjiao Liu, Ziyue Wang, Zhikui Chen. Learnable Graph Guided Deep Multi-View Representation Learning via Information Bottleneck
3315	--	3327	Yibo Zhao 0001, Zan Gao, Chunjie Ma, Weili Guan, Riwei Wang, Shengyong Chen. Fine-Grained Modality Relation-Aware Network for Video Moment Retrieval
3328	--	3341	Huangxing Lin, Yunlong Lin, Jingyuan Xia, Linyu Fan, Feifei Li, Yingying Wang 0005, Xinghao Ding. Fusion2Void: Unsupervised Multi-Focus Image Fusion Based on Image Inpainting
3342	--	3354	Zhongyang Li, Faming Fang, Tingting Wang, Guixu Zhang. Homography Estimation With Adaptive Query Transformer and Gated Interaction Module
3355	--	3367	Wenhui Jiang, Linxin Liu, Yuming Fang, Yibo Cheng, Yuxin Peng, Yang Liu 0293. Learning Comprehensive Visual Grounding for Video Captioning
3368	--	3382	Yan Gan, Chengqian Wu, Deqiang Ouyang, Song Tang 0001, Mao Ye 0001, Tao Xiang 0001. LESEP: Boosting Adversarial Transferability via Latent Encoding and Semantic Embedding Perturbations
3383	--	3395	Tingting Han 0003, Yaochen Xu, Jun Yu 0002, Zhou Yu 0001, Sicheng Zhao. Action-Driven Semantic Representation and Aggregation for Video Captioning
3396	--	3409	Yan Huang 0031, Xiaoshan Liao, Jinxiu Liang, Boxin Shi, Yong Xu 0007, Patrick Le Callet. Detail-Preserving Diffusion Models for Low-Light Image Enhancement
3410	--	3425	Yulin Wang, Yueming Ma, Yuanyuan Li, Jiqing Zhang, Zetian Mi, XianPing Fu. Underwater Vignetting Image Correction Based on Binary Polynomial Regularization and Latent Low-Rank Representation
3426	--	3437	Siqi Wang, Yehu Shen, Wenming Yang. Touchless Finger Vein and Fingerprint Verification via Exploiting Attention-Based Cross-Domain Fusion
3438	--	3449	Qi Zhang, Long Chen 0001, Wanfeng Shang. Cross Dense Feature Learning With Task Guidance for Few-Shot Classification
3450	--	3461	Xinbo Wu, Jianxun Lou, Yingying Wu, Wan'an Liu, Paul L. Rosin, Gualtiero B. Colombo, Stuart M. Allen, Roger M. Whitaker, Hantao Liu. Image Manipulation Quality Assessment
3462	--	3474	Yu Zhou 0027, Wei Xie, Huisi Wu, Lei Huang 0001, Sam Kwong, Jianmin Jiang. Denoiser-Regulated Deep Unfolding Compressed Sensing With Learnable Fixed-Point Projections
3475	--	3485	Jinyang Liu 0004, Shutao Li, Renwei Dian, Ze Song, Lishan Tan. Asymptotic Spectral Mapping for Hyperspectral Image Fusion
3486	--	3497	Zhefei Cai, Yingle Fan, Minwei Zhu, Tao Fang. Ultra-Lightweight Network for Medical Image Segmentation Inspired by Bio-Visual Interaction
3498	--	3511	Haowen Bai, Zixiang Zhao, Jiangshe Zhang 0001, Baisong Jiang, Lilun Deng, Yukun Cui, Shuang Xu, Chunxia Zhang 0002. Deep Unfolding Multi-Modal Image Fusion Network via Attribution Analysis
3512	--	3526	Ye Yao, Detong Wang, Yanzhao Shen, Dawen Xu 0001, Ching-Chun Chang, Chinchen Chang 0001. PVO-Based Reversible Data Hiding Using Two-Stage Embedding and FPM Mode Selection
3527	--	3540	Yuchao Zheng, Huimin Lu 0001, Jingyi Wang, Weidong Zhang 0007, Mohsen Guizani. High-Turbidity Underwater Image Enhancement via Turbidity Suppression Fusion
3541	--	3556	Qingshan Hou, Yaqi Wang, Linqi Lan, Peng Cao 0001, Jinzhu Yang, Xiaoli Liu 0001, Meng Wang, Yih Chung Tham, Osmar R. Zaïane. A Reference-Free Quality Enhancement Framework for Low-Quality Fundus Images
3557	--	3572	Mingyang Zhang 0002, Xiangyu Wang, Shuang Wu, Zhaoyang Wang, Maoguo Gong, Yu Zhou, Fenlong Jiang, Yue Wu 0004. Spatial-Spectral Aggregation Transformer With Diffusion Prior for Hyperspectral Image Super-Resolution
3573	--	3588	Zijian Chen 0001, Wei Sun 0029, Haoning Wu 0001, Zicheng Zhang, Jun Jia, Ru Huang 0002, Xiongkuo Min, Guangtao Zhai, Wenjun Zhang 0001. Study of Subjective and Objective Naturalness Assessment of AI-Generated Images
3589	--	3602	Mengjiao Shen, Liuyi Wang, Xianyou Zhong, Chengju Liu, Qijun Chen. FoggyDepth: Leveraging Channel Frequency and Non-Local Features for Depth Estimation in Fog
3603	--	3618	Linbo Fu, Xin Liao, Jinlin Guo, Li Dong 0006, Zheng Qin 0001. WaveRecovery: Screen-Shooting Watermarking Based on Wavelet and Recovery
3619	--	3632	Huibin Lin, Chun-Yang Zhang, C. L. Philip Chen. Contextual Distribution Alignment via Correlation Contrasting for Domain Generalization
3633	--	3648	Zhi Yu, Zhiyong Huang 0004, Mingyang Hou, Jiaming Pei, Yan Yan 0022, Yushi Liu 0001, Daming Sun. Representation Selective Coupling via Token Sparsification for Multi-Spectral Object Re-Identification
3649	--	3663	Zhaodi Ge, Hanning Chen, Xiaodan Liang, Lianbo Ma. Gated Mechanism Attention Transformer Based on Wavelet Enhanced Optical Flow Field Estimation for Foreground Detection
3664	--	3678	Shuwei Shao, Zhongcai Pei, Weihai Chen, Dingchi Sun, Peter C. Y. Chen, Zhengguo Li. MonoDiffusion: Self-Supervised Monocular Depth Estimation Using Diffusion Model
3679	--	3692	Zilu Guo, Liuyang Bian, Hu Wei, Jingyu Li, Huasheng Ni, Xuan Huang. DSNet: A Novel Way to Use Atrous Convolutions in Semantic Segmentation
3693	--	3705	Yujie Zhang, Qi Yang 0003, Ziyu Shan, Yiling Xu. Asynchronous Feedback Network for Perceptual Point Cloud Quality Assessment
3706	--	3718	Guang-yong Chen, Wei Dong, Guodong Fan, Jian-Nan Su, Min Gan, C. L. Philip Chen. LPFSformer: Location Prior Guided Frequency and Spatial Interactive Learning for Nighttime Flare Removal
3719	--	3731	Kristian Fischer 0001, Fabian Brand, André Kaup. Boosting Neural Image Compression for Machines Using Latent Space Masking
3732	--	3744	Yangang Cai, Peiyin Xing, Xuesong Gao. High Efficient 3D Convolution Feature Compression
3745	--	3756	Pingping Zhang, Meng Wang 0017, Baoliang Chen, Rongqun Lin, Xu Wang 0006, Shiqi Wang 0001, Sam Kwong. Learning-Based Compression for Noisy Images in the Wild
3757	--	3769	Zhimeng Huang, Chuanmin Jia, Shanshe Wang, Siwei Ma. HMFVC: A Human-Machine Friendly Video Compression Scheme
3770	--	3785	Maida Cao, Wenrui Dai, Shaohui Li, Chenglin Li, Junni Zou, Ying Chen, Hongkai Xiong. End-to-End Optimized Image Compression With Deep Gaussian Process Regression
3786	--	3797	Hadi Amirpour, M. Ghanbari 0001, Christian Timmerer. DeepStream: Video Streaming Enhancements Using Compressed Deep Neural Networks
3798	--	3811	Heming Sun, Lu Yu 0003, Jiro Katto. Q-LIC: Quantizing Learned Image Compression With Channel Splitting
3812	--	3824	Wenhan Yang, Haofeng Huang, Jiaying Liu 0001, Alex C. Kot. Facial Image Compression via Neural Image Manifold Compression
3825	--	3836	Yuefeng Zhang, Chuanmin Jia, Jianhui Chang, Siwei Ma. Machine Perception-Driven Facial Image Compression: A Layered Generative Approach
3837	--	3852	ShuShi Chen, Leilei Huang, Zhao Zan, Zhijian Hao, Hao Zhang, Xiaoxiang Chen, Minge Jing, Xiaoyang Zeng, Yibo Fan. Affine Motion Estimation Hardware Implementation With 51.7%/67.5% Internal Bandwidth Reduction for Versatile Video Coding
3853	--	3866	Congkai An, Huanhuan Zhang, Jingyang Kang, Zhuo Liu, Anfu Zhou, Liang Liu 0001, Huadong Ma. Enhancing QoE of Adaptive Video Streaming by Generating Fine-Grained Throughput
3867	--	3881	Zitong Li, Changqiao Xu, Han Xiao, Chuxing Fang, Lujie Zhong, Shujie Yang, Gabriel-Miro Muntean. Harmony: An Eco-Friendly Adaptive Rate Control Scheme for Video-on-Demand in Low Earth Orbit Satellite Internet
3882	--	3892	Xingyu Gao 0001, Zhenyu Chen 0003, Boshen Zhang, Jianze Wei. Deep Learning to Hash With Application to Cross-View Nearest Neighbor Search
3893	--	3906	Mingyang Lei, Jingfan Fan, Long Shao, Hong Song, Deqiang Xiao, Danni Ai, Tianyu Fu 0003, Yucong Lin, Ying Gu, Jian Yang 0009. Double-Shot 3D Shape Measurement With a Dual-Branch Network for Structured Light Projection Profilometry
3907	--	3920	Bin Ma 0003, Haocheng Wang, Jian Xu, Xiao-Yu Wang 0011, Xiaolong Li 0001, Jian Li 0034. Color Image High-Capacity Differential Steganography Algorithm Based on Multiple Adversarial Networks

1973	--	1986	Yao Wu, Xia Kong, Yuan Xie 0006, Yanyun Qu. RE-GZSL: Relation Extrapolation for Generalized Zero-Shot Learning
1987	--	1998	Chaocan Xue, Bineng Zhong, Qihua Liang, Haiying Xia, Shuxiang Song 0001. Unifying Motion and Appearance Cues for Visual Tracking via Shared Queries
1999	--	2012	Xiaowei Fu, Lina Ma, Lei Zhang 0038. Remove to Regenerate: Boosting Adversarial Generalization With Attack Invariance
2013	--	2025	Ming Ma, Tongzhou Zhang 0001, Ziming Wang, Yue Wang, Taoli Du, Wenhui Li 0002. Global Channel Pruning With Self-Supervised Mask Learning
2026	--	2044	Xinggang Hu, Yanmin Wu, Mingyuan Zhao, Linghao Yang, Xiangkui Zhang, Xiangyang Ji. PAS-SLAM: A Visual SLAM System for Planar-Ambiguous Scenes
2045	--	2056	Li Wang, Yunzhou Zhang, Fawei Ge, Wenjing Bai, Jinpeng Zhang, Yifan Wang. Learning Local Features by Jointly Semantic-Guided and Task Rewards
2057	--	2073	Junduan Huang, Zifeng Li, Sushil Bhattacharjee, Sébastien Marcel, Wenxiong Kang. Mirror-Based Full-View Finger Vein Authentication With Illumination Adaptation
2074	--	2086	Xize Wu, Jiasong Wu, Lei Zhu 0002, Lotfi Senhadji, Huazhong Shu. Collaborative Aware Bidirectional Semantic Reasoning for Video Question Answering
2087	--	2100	Jiayu Ye, Yanhong Yu, Lin Lu, Hao Wang, Yunshao Zheng, Yang Liu, Qingxiang Wang. DEP-Former: Multimodal Depression Recognition Based on Facial Expressions and Audio Features via Emotional Changes
2101	--	2117	Tianming Zhuang, Zhen Qin 0002, Yi Ding 0003, Zhiguang Qin, Ji Geng 0001, Yi Liu, Kim-Kwang Raymond Choo. DSDC-GCN: Decoupled Static-Dynamic Co-Occurrence Graph Convolutional Networks for Skeleton-Based Action Recognition
2118	--	2132	Tian He, Yang Chen, Xu Gao, Ling Wang, Ting Hu, Hong Cheng 0002. Enhancing Skeleton-Based Action Recognition With Language Descriptions From Pre-Trained Large Multimodal Models
2133	--	2146	Naisong Luo, Yuan Wang, Rui Sun 0006, Guoxin Xiong, Tianzhu Zhang, Feng Wu 0005. Exploring the Better Correlation for Few-Shot Video Object Segmentation
2147	--	2160	Jianhui Jin, Qiuping Jiang, Qingyuan Wu, Binwei Xu, Runmin Cong. Underwater Salient Object Detection via Dual-Stage Self-Paced Learning and Depth Emphasis
2161	--	2172	Xinchen Ye, Yuxiang Ou, Biao Wu, Rui Xu 0002, Haojie Li. Self-Supervised Monocular Depth Estimation From Videos via Adaptive Reconstruction Constraints
2173	--	2187	Tianyu Yang, Yeqiang Qian, Weihao Yan, Chunxiang Wang, Ming Yang 0002. AdaptiveOcc: Adaptive Octree-Based Network for Multi-Camera 3D Semantic Occupancy Prediction in Autonomous Driving
2188	--	2201	Yonghao Dong, Le Wang 0003, Sanping Zhou, Gang Hua 0001, Changyin Sun. Recurrent Aligned Network for Generalized Pedestrian Trajectory Prediction
2202	--	2214	Chang Liu 0071, Ziqi Guan, Simiao Lai, Yang Liu 0066, Huchuan Lu, Dong Wang 0004. EMTrack: Efficient Multimodal Object Tracking
2215	--	2229	Xin Lu 0007, Yixuan Pan, Yichao Cao, Xin Zhou, Xiaobo Lu. Variational Feature Imitation Conditioned on Visual Descriptions for Few-Shot Fine-Grained Recognition
2230	--	2243	Qing Liu, Xianlun Tang, Ying Wang, Xingchen Li, Xinyan Jiang, Weisheng Li 0001. Feature Transductive Distribution Optimization for Few-Shot Image Classification
2244	--	2259	Hengbo Qi, Xuechao Chen, Zhangguo Yu, Chao Li, Yongliang Shi, Qingrui Zhao, Qiang Huang 0002. Semantic-Independent Dynamic SLAM Based on Geometric Re-Clustering and Optical Flow Residuals
2260	--	2275	Yunfeng Li, Bo Wang 0015, Jiuran Sun, Xueyi Wu, Ye Li. RGB-Sonar Tracking Benchmark and Spatial Cross-Attention Transformer Tracker
2276	--	2288	Lei Yao, Yi Wang 0068, Moyun Liu, Lap-Pui Chau. SGIFormer: Semantic-Guided and Geometric-Enhanced Interleaving Transformer for 3D Instance Segmentation
2289	--	2300	Jiahao Nie 0001, Anqi Xu, Zhengyi Bao, Zhiwei He 0001, Xudong Lv, Mingyu Gao 0002. Context Matching-Guided Motion Modeling for 3D Point Cloud Object Tracking
2301	--	2314	Liyun Yu, Ziyu Guan, Wei Zhao 0019, Yaming Yang 0002, Jiale Tan. Adaptive Task-Aware Refining Network for Few-Shot Fine-Grained Image Classification
2315	--	2327	Yuping Liang, Guangming Shi, Jinjian Wu. Scene Prior Constrained Self-Paced Learning for Unsupervised Satellite Video Vehicle Detection
2328	--	2340	Guozhu Jiang, Yongshan Zhang, Xinxin Wang, Xinwei Jiang, Lefei Zhang. Structured Anchor Learning for Large-Scale Hyperspectral Image Projected Clustering
2341	--	2354	Chenyang Qian, Lingfei Song, Hua Huang 0001. A Destriping Framework With Arbitrary Bounded Image Denoisers
2355	--	2368	Xiaoqian Huang, Yong Gong, Wenhao Wu, Saike Zhu, Yi Zhao. CSDet: A Compressed Sensing Object Detection Architecture With Lightweight Networks
2369	--	2381	Yong Zhu, Zhenyu Wen, Xiong Li, Xiufang Shi, Xiang Wu, Hui Dong, Jiming Chen 0001. ChatNav: Leveraging LLM to Zero-Shot Semantic Reasoning in Object Navigation
2382	--	2397	Zhengyu Zhang, Shishun Tian, Jinjia Zhou, Luce Morin, Lu Zhang 0037. A New Benchmark Database and Objective Metric for Light Field Image Quality Evaluation
2398	--	2409	Tianxiang Chen, Zhentao Tan, Tao Gong, Qi Chu 0001, Yue Wu, Bin Liu 0016, Nenghai Yu, Le Lu 0001, Jieping Ye. Bootstrapping Audio-Visual Video Segmentation by Strengthening Audio Cues
2410	--	2421	Dechen Kong, Xi Yang 0011, Nannan Wang 0001, Xinbo Gao 0001. Perspectives of Calibrated Adaptation for Few-Shot Cross-Domain Classification
2422	--	2435	Jinhui Qin, Yong Ma 0001, Jun Huang 0008, Zhanchuan Cai, Fan Fan 0001, You Du. An End-to-End Network for Rotary Motion Deblurring in the Polar Coordinate System
2436	--	2449	Kumie Gedamu, Yanli Ji, Yang Yang 0002, Jie Shao 0001, Heng Tao Shen. Visual-Semantic Alignment Temporal Parsing for Action Quality Assessment
2450	--	2460	Feiyan Wu, Zhunga Liu, Zuowei Zhang 0001, Jiaxiang Liu, Longfei Wang. Collaborative Global-Local Structure Network With Knowledge Distillation for Imbalanced Data Classification
2461	--	2473	Xin Lin, Jingtong Yue, Sixian Ding, Chao Ren 0002, Lu Qi, Ming-Hsuan Yang 0001. Dual Degradation Representation for Joint Deraining and Low-Light Enhancement in the Dark
2474	--	2486	Tian-Bao Li, Yu-Ting Su 0001, Dan Song 0006, Wen-Hui Li 0001, Zhiqiang Wei 0002, An-An Liu. Multi-Scale Spatial-Temporal Transformer for Meteorological Variable Forecasting
2487	--	2498	Wenzhe Zhai, Xianglei Xing, Mingliang Gao 0001, Qilei Li. Zero-Shot Object Counting With Vision-Language Prior Guidance Network
2499	--	2512	Hairui Ren, Fan Tang, Huangjie Zheng, He Zhao 0001, Dandan Guo, Yi Chang 0001. Modality-Consistent Prompt Tuning With Optimal Transport
2513	--	2525	Jie Wang, Guoqiang Li, HongJie Yu, Jinwen Xi, Jie Shi, Xueying Wu. Intra-Modality Self-Enhancement Mirror Network for RGB-T Salient Object Detection
2526	--	2540	Qiang Liu 0004, Yanlong Qiu, Tongqing Zhou, Ming Xu 0002, Jiaohua Qin, Wentao Ma, Fan Zhang, Zhiping Cai. Mitigating Cross-Modal Retrieval Violations With Privacy-Preserving Backdoor Learning
2541	--	2555	Ching-Nung Yang, Lizhi Xiong, Shu-Yu Liu, Chih-Yueh Tseng, Xiaodan Tai, Wenbo Wan. RP-ASAF: Anonymous Submission of Application Framework Using RDHSI and Polynomial Interpolation
2556	--	2569	Yamin Han, Mingyu Cai, Jie Wu, Zhixuan Bai, Tao Zhuo, Hongming Zhang 0002, Yanning Zhang 0001. Visual Object Tracking With Multi-Frame Distractor Suppression
2570	--	2585	Jinyu Zhan, Shiyu Zou, Wei Jiang 0016, Youyuan Zhang, Suidi Peng, Ying Wang 0001. Accelerate Point Cloud Structuring for Deep Neural Networks via Fast Spatial-Searching Tree
2586	--	2602	Mengda Xie, Yiling He, Zhan Qin, Meie Fang. RetouchUAA: Unconstrained Adversarial Attack via Realistic Image Retouching
2603	--	2615	Zuoyong Li, Qinghua Lin, Haoyi Fan, Tiesong Zhao, David Zhang 0001. SIAVC: Semi-Supervised Framework for Industrial Accident Video Classification
2616	--	2631	Zihua Zhao, Zhe Cao, Haonan Xin, Rong Wang 0001, Danyang Wu, Zheng Wang 0037, Feiping Nie 0001. Enhancing Clustering Performance With Tensorized High-Order Bipartite Graphs: A Structured Graph Learning Approach
2632	--	2645	Gaochang Wu, Yapeng Zhang, Lan Deng, Jingxin Zhang 0001, Tianyou Chai. Cross-Modal Learning for Anomaly Detection in Complex Industrial Process: Methodology and Benchmark
2646	--	2661	Tianjun Zhang, Lin Zhang 0014, Fengyi Zhang, Shengjie Zhao, Yicong Zhou. I-DACS: Always Maintaining Consistency Between Poses and the Field for Radiance Field Construction Without Pose Prior
2662	--	2674	Zhe Cao, Yihang Lu, Jinghui Yuan, Haonan Xin, Rong Wang 0001, Feiping Nie 0001. Tensorized Graph Learning for Spectral Ensemble Clustering
2675	--	2688	Honglin Liu, Qirong Mao, Ming Dong 0001, Yongzhao Zhan 0001. Infrared-Visible Image Fusion Using Dual-Branch Auto-Encoder With Invertible High-Frequency Encoding
2689	--	2700	Hu Gao, Depeng Dang. Exploring Richer and More Accurate Information via Frequency Selection for Image Restoration
2701	--	2711	Xiang Li, Xiaolong Li 0001, Shaohai Hu, Yao Zhao 0001. Steganography-Enhanced Prediction-Error Expansion: A Novel Reversible Data Hiding Framework
2712	--	2724	Xianlei Long, Xiaxin Zhu, Fangming Guo, Chao Chen 0004, Xiangwei Zhu, Fuqiang Gu, Songyu Yuan, Chunlong Zhang. Spike-BRGNet: Efficient and Accurate Event-Based Semantic Segmentation With Boundary Region-Guided Spiking Neural Networks
2725	--	2739	Weiying Xie, Wenjie Shao, Daixun Li, Yunsong Li, Leyuan Fang. MIFNet: Multi-Scale Interaction Fusion Network for Remote Sensing Image Change Detection
2740	--	2752	Yuanting Fan, Chengxu Liu, Ruhao Tian, Xueming Qian. InstanceSR: Efficient Reconstructing Small Object With Differential Instance-Level Super-Resolution
2753	--	2767	Kaihao Lin, Guoqing Wang 0001, Tianyu Li, Yuhui Wu, Chongyi Li, Yang Yang 0002, Heng Tao Shen. Toward Generalized and Realistic Unpaired Image Dehazing via Region-Aware Physical Constraints
2768	--	2781	Yeming Chen, Siyu Zhang, Yaoru Sun, Jun Yang 0056, Weijian Liang, Haoran Wang. Artificial-Spiking Hierarchical Networks for Vision-Language Representation Learning
2782	--	2793	Jiebin Yan, Jiale Rao, Junjie Chen 0008, Ziwen Tan, Weide Liu, Yuming Fang. Multitask Auxiliary Network for Perceptual Quality Assessment of Non-Uniformly Distorted Omnidirectional Images
2794	--	2805	Jiawei Chen, Qi Song, Wenzhong Guo, Rui Huang 0001. DSC3D: Deformable Sampling Constraints in Stereo 3D Object Detection for Autonomous Driving
2806	--	2819	Longtao Feng, Qian Yin, Siwei Ma. Content-Adaptive Rate Control Method for User-Generated Content Videos
2820	--	2831	Xin Fang, Xiaolin Wu 0001, Fan Li 0003, Yiping Duan, Xiaoming Tao 0001. Group Image Compression for Dual Use of Machine and Human Vision
2832	--	2843	Chang Liu, Leilei Huang, Chenyang Zhang, Wei Li, Zhijian Hao, Yibo Fan. Hardware Implementation of a High-Accuracy and High-Throughput Rate Estimation Unit for VVC Residual Coding
2844	--	2853	Zehan Wang, Yuxuan Wei, Hui Yuan 0001, Wei Zhang 0072, Peng Li. Rate-Distortion Optimized Skip Coding of Region Adaptive Hierarchical Transform Coefficients for MPEG G-PCC
2854	--	2869	Pekka Astola, Alireza Aminlou, Ramin Ghaznavi Youvalari, Jani Lainema. Convolutional Cross-Component Models for Chroma Prediction in Video Coding
2870	--	2880	Binzhe Li, Shurun Wang, Shiqi Wang 0001, Yan Ye. High Efficiency Image Compression for Large Visual-Language Models
2881	--	2893	Shenshen Li, Xing Xu 0001, Chen He, Fumin Shen, Yang Yang 0002, Heng Tao Shen. Cross-Modal Uncertainty Modeling With Diffusion-Based Refinement for Text-Based Person Retrieval
2894	--	2904	Huilin Ge, Xiaolei Liu, Zihang Guo, Zhiwen Qiu. Learning to Diversify for Robust Video Moment Retrieval
2905	--	2917	Mingxin Jin, Cong Wang 0033, Yuan Yuan 0001. Dual Heterogeneous Network for Hyperspectral Image Classification
2918	--	2931	Di-Hua Zhai, Hao Li, Qingyuan Liu, Ke Tian, Yi Yang, Zhenyao Chang, Shuo Wang, Yuanqing Xia. Focus-TransUnet3D: High-Precision Model for 3D Segmentation of Medical Point Targets
2932	--	2944	Yang Yu, Qingxuan Lv, Yuezun Li, Zhiqiang Wei 0002, Junyu Dong. PhyTracker: An Online Tracker for Phytoplankton

988	--	1008	Yiming Li, Yi Wang 0068, Wenqian Wang, Dan Lin, Bingbing Li, Kim-Hui Yap. Open World Object Detection: A Survey
1009	--	1027	Zhihong Sun, Guoheng Wei, Wei Fu, Mang Ye, Kui Jiang, Chao Liang, Tingting Zhu, Tao He, Mithun Mukherjee 0001. Multiple Pedestrian Tracking Under Occlusion: A Survey and Outlook
1028	--	1040	Changlin Li, Yeqiang Qian, Songan Zhang, Chunxiang Wang, Ming Yang 0002. FP-TTC: Fast Prediction of Time-to-Collision Using Monocular Images
1041	--	1054	Yuxin Mao, Jing Zhang 0052, Zhexiong Wan, Xinyu Tian, Aixuan Li, Yunqiu Lv, Yuchao Dai. Generative Transformer for Accurate and Reliable Salient Object Detection
1055	--	1069	Zhiliang Hu, Si Chen 0002, Yang Hua 0001, Da-Han Wang, Shunzhi Zhu, Yan Yan 0001. DHLA: Dynamic Hybrid Label Assignment for End-to-End Object Detection
1070	--	1083	Pinhan Fu, Xinyan Liang, Yuhua Qian, Qian Guo, Yayu Zhang, Qin Huang, Ke Tang 0001. Multi-Scale Features Are Effective for Multi-Modal Classification: An Architecture Search Viewpoint
1084	--	1097	Xinyu Zhang, Peng Zhang 0057, Caifeng Shan. Corruption-Invariant Person Re-Identification via Coarse-to-Fine Feature Alignment
1098	--	1110	Wenqi Zhu, Jiale Cao, Jin Xie 0005, Shuangming Yang, Yanwei Pang. CLIP-VIS: Adapting CLIP for Open-Vocabulary Video Instance Segmentation
1111	--	1122	Huajie Jiang, Zhengxian Li, Yongli Hu, Baocai Yin, Jian Yang 0001, Anton van den Hengel, Ming-Hsuan Yang 0001, Yuankai Qi. Dual Prototype Contrastive Network for Generalized Zero-Shot Learning
1123	--	1135	Wenzhe Zhai, Haomiao Li, Chaoqun Zheng, Xianglei Xing. Multi-View Gait Recognition With Joint Local Multi-Scale and Global Contextual Spatio-Temporal Features
1136	--	1149	Li Liu, Ruijie Zhu 0002, Jiacheng Deng 0002, Ziyang Song, Wenfei Yang, Tianzhu Zhang. Plane2Depth: Hierarchical Adaptive Plane Guidance for Monocular Depth Estimation
1150	--	1164	Haitao Wen, Heqian Qiu, Lanxiao Wang, Haoyang Cheng, Hongliang Li 0001. Class Incremental Learning With Less Forgetting Direction and Equilibrium Point
1165	--	1179	Han Wu, Hao Sun, Kefeng Ji, Gangyao Kuang. Temporal-Spatial Feature Interaction Network for Multi-Drone Multi-Object Tracking
1180	--	1192	Xiaoxu Li, Xiangyang Wang, Rui Zhu 0006, Zhanyu Ma, Jie Cao 0014, Jing-Hao Xue. Selectively Augmented Attention Network for Few-Shot Image Classification
1193	--	1208	Qiyu Chen, Huiyuan Luo, Han Gao, Chengkan Lv, Zhengtao Zhang. Progressive Boundary Guided Anomaly Synthesis for Industrial Anomaly Detection
1209	--	1223	Chenbo Yan, Mingtao Feng, Zijie Wu, Yulan Guo, Weisheng Dong, Yaonan Wang 0001, Ajmal Mian. Discriminative Correspondence Estimation for Unsupervised RGB-D Point Cloud Registration
1224	--	1236	Hongrui Guo, Tianqi Sun, Hongzhi Liu 0001, Zhonghai Wu. Adaptive Ensemble Learning With Category-Aware Attention and Local Contrastive Loss
1237	--	1250	Jie Zhang 0033, Ke Cao, Keyu Yan, Yunlong Lin, Xuanhua He, Yingying Wang 0005, Rui Li 0027, Chengjun Xie, Jun Zhang 0034, Man Zhou. Frequency Decoupled Domain-Irrelevant Feature Learning for Pan-Sharpening
1251	--	1264	Jianqiu Chen, Zikun Zhou, Mingshan Sun, Rui Zhao 0001, Liwei Wu, Tianpeng Bao, Zhenyu He 0001. ZeroPose: CAD-Prompted Zero-Shot Object 6D Pose Estimation in Cluttered Scenes
1265	--	1275	Chongjun Tu, Peng Ye, Weihao Lin 0002, Hancheng Ye, Chong Yu, Tao Chen 0003, Baopu Li, Wanli Ouyang. Efficient Architecture Search via Bi-Level Data Pruning
1276	--	1286	Zhimin Zhang, Dongliang Chang, Rui Zhu 0006, Xiaoxu Li, Zhanyu Ma, Jing-Hao Xue. Query-Aware Cross-Mixup and Cross-Reconstruction for Few-Shot Fine-Grained Image Classification
1287	--	1302	Wei Sun, Yuan Li, Qixiang Ye, Jianbin Jiao, Yanzhao Zhou. Depth-Guided Texture Diffusion for Image Semantic Segmentation
1303	--	1317	Ziqiang Li 0001, Chaoyue Wang, Xue Rui, Chao Xue, Jiaxu Leng, Zhangjie Fu, Bin Li 0025. Peer Is Your Pillar: A Data-Unbalanced Conditional GANs for Few-Shot Image Generation
1318	--	1330	Zhicai Wang, Ouxiang Li, Tan Wang, Longhui Wei, Yanbin Hao, Xiang Wang 0010, Qi Tian 0001. Prior Preserved Text-to-Image Personalization Without Image Regularization
1331	--	1346	Junfei Yi, Jianxu Mao, Hui Zhang 0023, Mingjie Li 0006, Kai Zeng 0010, Mingtao Feng, Xiaojun Chang, Yaonan Wang 0001. FMSD: Focal Multi-Scale Shape-Feature Distillation Network for Small Fasteners Detection in Electric Power Scene
1347	--	1361	Shenlu Zhao, Jingyi Li, Qiang Zhang 0020. C⁴Net: Excavating Cross-Modal Context- and Content-Complementarity for RGB-T Semantic Segmentation
1362	--	1373	Decheng Liu, Rong Sheng, Chunlei Peng, Nannan Wang 0001, Ruimin Hu, Xinbo Gao 0001. Devil in Shadow: Attacking NIR-VIS Heterogeneous Face Recognition via Adversarial Shadow
1374	--	1384	Wenzhe Ouyang, Zenglin Xu, Bin Shen 0002, Jinghua Wang, Yong Xu 0001. LinkOcc: 3D Semantic Occupancy Prediction With Temporal Association
1385	--	1398	Qiuping Jiang, Xiao Yi, Li Ouyang, Jingchun Zhou, Zhihua Wang 0002. Toward Dimension-Enriched Underwater Image Quality Assessment
1399	--	1408	Qi Li 0029, Bin Ma 0003, XianPing Fu, Xiao-Yu Wang 0011, Chunpeng Wang, Xiaolong Li 0001. Robust Image Steganography via Color Conversion
1409	--	1421	Qingsen Yan, Kangzhen Yang, Tao Hu, Genggeng Chen, Kexin Dai, Peng Wu, Wenqi Ren, Yanning Zhang 0001. From Dynamic to Static: Stepwisely Generate HDR Image for Ghost Removal
1422	--	1435	Zhihong Liu, Huanqiang Zeng, Jing Chen 0001, Rui Ding, Yifan Shi, Junhui Hou. A No-Reference Quality Assessment Model for Screen Content Videos via Hierarchical Spatiotemporal Perception
1436	--	1450	Chengyang Li, Fangwei Sun, Heng Zhou 0006, Yongqiang Xie, Zhongbo Li, Liping Zhu. Multi-Weather Restoration: An Efficient Prompt-Guided Convolution Architecture
1451	--	1463	Jian He, ShaoWei Weng, Lifang Yu, Dewang Chen. Steganalysis Network With Two-Branch Preprocessing for Spatial and JPEG Domains
1464	--	1477	Leida Li, Xiangfei Sheng, Pengfei Chen 0003, Jinjian Wu, Weisheng Dong. Towards Explainable Image Aesthetics Assessment With Attribute-Oriented Critiques Generation
1478	--	1491	Jiaxun Song, Detian Huang, Xiaoqian Huang, Miaohua Ruan, Huanqiang Zeng. Torch-Advent-Civilization-Evolution: Accelerating Diffusion Model for Image Restoration
1492	--	1505	Zhilong Shen, Guoquan Li, Ruiyang Xia, Hongying Meng, Zhengwen Huang. A Lightweight Object Counting Network Based on Density Map Knowledge Distillation
1506	--	1518	Zelin Lu, Liang Xie 0003, Xing Zhao, Binwei Xu, Haoran Liang, Ronghua Liang. A Weakly-Supervised Cross-Domain Query Framework for Video Camouflage Object Detection
1519	--	1533	Hongsheng Zheng, Wenju Xu, Zhenyu Wang, Xiao Lu 0002, Chunxia Xiao. Facial Highlight Removal With Cross-Context Attention and Texture Enhancement
1534	--	1547	Yuheng Jia, Jia-Nan Li, Wenhui Wu 0001, Ran Wang 0001. Semi-Supervised Symmetric Non-Negative Matrix Factorization With Low-Rank Tensor Representation
1548	--	1561	Luan Chen, Chengyou Wang, Xiao Zhou 0002, Zhiliang Qin. Robust and Compatible Video Watermarking via Spatio-Temporal Enhancement and Multiscale Pyramid Attention
1562	--	1575	Lin Teng, Pengfei Cao, Yang Liu. Multi-Image Encryption Algorithm Based on Novel Spatiotemporal Chaotic System and Dynamical Chaotic Trajectories
1576	--	1590	Zhengjie Zhu, Xiaogang Yang, Ruitao Lu, Tong Shen, Tao Zhang, Siyu Wang. Ghost Imaging in the Dark: A Multi-Illumination Estimation Network for Low-Light Image Enhancement
1591	--	1601	Yun Chen, Hang Cheng, Haichou Wang, Ximeng Liu, Fei Chen 0012, Fengyong Li, Xinpeng Zhang 0001, Meiqing Wang. EAN: Edge-Aware Network for Image Manipulation Localization
1602	--	1614	Ke Wang, Shaowu Wu, Xiaolin Yin, Wei Lu 0001, Xiangyang Luo, Rui Yang. Robust Image Watermarking With Synchronization Using Template Enhanced-Extracted Network
1615	--	1630	Ting Yu 0002, Kunhao Fu, Shuhui Wang, Qingming Huang, Jun Yu 0002. Prompting Video-Language Foundation Models With Domain-Specific Fine-Grained Heuristics for Video Question Answering
1631	--	1647	Delin Duan, Shuyuan Shen, Songsen Yu, Yibo Yuan, Qidong Zhou, Haojie Lv, Huanjie Lin. DenseJIN: Dense Depth Image Steganography Model With Joint Invertible and Noninvertible Mechanisms
1648	--	1659	Ruochen Zheng, Chuchu Han, Changxin Gao, Nong Sang. Linear Feature Source Prediction and Recombination Network for Noisy Label Learning
1660	--	1672	Jiayu Li 0004, Yuting Su 0001, Dan Song 0006, Wenhui Li 0001, You Yang, An-An Liu. Progressive Contrastive Label Optimization for Source-Free Universal 3D Model Retrieval
1673	--	1685	Sanqian Li, Yizhou Wang, Risa Higashita, Huazhu Fu, Jiang Liu 0001. A Contrast-Aware Edge Enhancement GAN for Unpaired Anterior Segment OCT Image Denoising
1686	--	1699	Cong Liu, Chaobo Zhang, Xiaojun Liang, Zhiming Han, Yiming Li, Chunhua Yang 0001, Weihua Gui 0001, Wen Gao, Xiaohao Wang, Xinghui Li. Attention Mono-Depth: Attention-Enhanced Transformer for Monocular Depth Estimation of Volatile Kiln Burden Surface
1700	--	1714	Huake Wang, Xiaoyang Yan, Xingsong Hou, Kaibing Zhang, Yujie Dun. Extracting Noise and Darkness: Low-Light Image Enhancement via Dual Prior Guidance
1715	--	1727	Pei Zhang, Shuo Zhu, Chutian Wang, Yaping Zhao, Edmund Y. Lam. Neuromorphic Imaging With Super-Resolution
1728	--	1744	Zheng Cheng, Guodong Fan, Jingchun Zhou, Min Gan, C. L. Philip Chen. FDCE-Net: Underwater Image Enhancement With Embedding Frequency and Dual Color Encoder
1745	--	1757	Guangyong Gao, Sitian Yang, Xiangyang Hu, Zhihua Xia, Yun Qing Shi 0001. Reversible Data Hiding-Based Local Contrast Enhancement With Nonuniform Superpixel Blocks for Medical Images
1758	--	1773	Nan Luo, Zhexuan Hu, Yuan Ding, Jiaxu Li, Hui Zhao 0003, Gang Liu 0006, Quan Wang 0006. DFF-VIO: A General Dynamic Feature Fused Monocular Visual-Inertial Odometry
1774	--	1786	Sen Zhang, Xuenan Peng, Xiao-Ping Wang 0001, Chengjie Chen, Zhigang Zeng. A Novel Memristive Multiscroll Multistable Neural Network With Application to Secure Medical Image Communication
1787	--	1800	Linlin Fan, Xuekai Wei, Mingliang Zhou, Jielu Yan, Huayan Pu, Jun Luo 0003, Zhengguo Li. A Semantic-Aware Detail Adaptive Network for Image Enhancement
1801	--	1813	Hengjie Lu, Yilin Gao, Shugong Xu. FLAG: A Framework With Explicit Learning Based on Appearance and Gait for Video-Based Clothes-Changing Person Re-Identification
1814	--	1824	Jian Chen, Shilin Ye, Geng Chen 0001, Meklit Mesfin Atlaw, Li Lin, Yanning Zhang 0001. Lightweight Image Deblurring via Recurrent Gated Attention and Efficient Decoupling
1825	--	1839	You Ma, Lin Chai, Shi Tu, Qingling Wang. Exploring Relational Knowledge for Source-Free Domain Adaptation
1840	--	1854	Yixuan Gao, Xiongkuo Min, Yuqin Cao, Xiaohong Liu 0001, Guangtao Zhai. No-Reference Image Quality Assessment: Obtain MOS From Image Quality Score Distribution
1855	--	1869	Changsheng Gao, Yiheng Jiang, Siqi Wu, Yifan Ma, Li Li 0040, Dong Liu 0002. IMOFC: Identity-Level Metric Optimized Feature Compression for Identification Tasks
1870	--	1883	Mingxuan Li, Wen Ji. Screen Content-Aware Video Coding Through Non-Local Model Embedded With Intra-Inter In-Loop Filtering
1884	--	1896	Lei Zhang, Guanyu Gao, Huaizheng Zhang. Spatial-Temporal Federated Learning for Lifelong Person Re-Identification on Distributed Edges
1897	--	1909	Weilong Chen, Wenhao Hu, Xiaolu Chen, WeiMin Yuan, Yan Wang 0083, Yanru Zhang, Zhu Han 0001. Tri-Modal Transformers With Mixture-of-Modality-Experts for Social Media Prediction
1910	--	1920	Min Meng 0001, Wenhang Chen, Jigang Liu, Jun Yu 0002, Jigang Wu. CoDi: Contrastive Disentanglement Generative Adversarial Networks for Zero-Shot Sketch-Based 3D Shape Retrieval
1921	--	1935	Zheng Li 0014, Caili Guo, Xin Wang, Zerun Feng, Zhongtian Du. Selectively Hard Negative Mining for Alleviating Gradient Vanishing in Image-Text Matching
1936	--	1950	Bocheng Huang, Tao Zhang 0027, Sinong Quan, Wei Wang 0099, Weiwei Guo, Zenghui Zhang. Scattering Enhancement and Feature Fusion Network for Aircraft Detection in SAR Images
1951	--	1960	Yanhao Huo, Shijun Xiang, Xiangyang Luo, Xinpeng Zhang 0001. Image Semantic Steganography: A Way to Hide Information in Semantic Communication
1961	--	1970	Yuanhong Zhong, Ruyue Zhu, Ge Yan, Ping Gan, Xuerui Shen, Dong Zhu. Inter-Clip Feature Similarity Based Weakly Supervised Video Anomaly Detection via Multi-Scale Temporal MLP

11740	--	11753	Wei Feng, Chang Tang, Cheng Zeng, Xinwang Liu 0002, Junjun Jiang, Xianju Li, Xinzhong Zhu. Diversity Learning Guided Dual Graph Autoencoder for Unsupervised Hyperspectral Band Selection
11754	--	11769	Yutang Jin, Shiming Chen 0002, Tianle Tong, Weiping Ding 0001, Yisong Wang. Multi-Modal Prompts With Primitives Enhancement for Compositional Zero-Shot Learning
11770	--	11782	Wenjie Liu 0001, Zhijie Ren. DM-MKGC: Multimodal Knowledge Graph Completion Based on Dynamic Prompt Learning and Multi-Granularity Aggregation
11783	--	11796	Jian Yang, Yuan Rao 0001, Hao Fan 0004, Junyu Dong, Hui Yu 0001. Learning Semantic-Aware Point-Line Features for Localization and Reconstruction
11797	--	11809	Yujia Sun, Weisheng Dong, Shuaibo Wang, Peng Wu 0015, Mingtao Feng, Xin Li 0005, Guangming Shi. Distilling Hierarchical Knowledge From Multimodal Fusion for Unimodal Image Segmentation
11810	--	11821	Haoxing Chen, Yaohui Li, Zizheng Huang, Yan Hong 0001, Zhuoer Xu, Zhangxuan Gu, Jun Lan, Huijia Zhu, Weiqiang Wang 0002. Conditional Prototype Rectification Prompt Learning
11822	--	11833	Zhenglai Li, Yuqi Shi, Xiao He 0010, Chang Tang. Mask-Informed Deep Contrastive Incomplete Multi-View Clustering
11834	--	11848	Anqi Zhao, Ruitao Feng, Xinghua Li 0002. ThiefCloud: A Thickness Fused Thin Cloud Removal Network for Optical Remote Sensing Image With Self-Supervised Learnable Cloud Prior
11849	--	11862	Yangpeng Liu, Junjian Huang, Shiping Wen 0001, Xing He 0001, Wei Zhang 0102, Zhao Feng. CTIGEN-CDM: Controlled Text-to-Image Generation Using Cropped Diffusion Models
11863	--	11876	Shu Jiang, Dong Zhang, Rui Yan 0010, Xiangbo Shu, Pingcheng Dong, Long Chen 0016, Xiaoyu Du 0002. Eliminating Semantic Ambiguity in Human Pose Estimation via Stable Feature Upsampling
11877	--	11892	Guohua Lv, Xiang Gao, Aimei Dong, Zhonghe Wei, Jinyong Cheng. SLFusion: A Structure-Aware Infrared and Visible Image Fusion Network for Low-Light Scenes
11893	--	11907	Shuai Han, Jingwei Xin, Jie Li 0001, Nannan Wang 0001, Xinbo Gao 0001. Unsupervised Face Super-Resolution via Integrating Faithful 3D Facial Priors
11908	--	11921	Qingguo Meng, Andong Lu, Zhe Jin 0001. BR-MoE: Blind Multi-Modal Tracking With Route-Dynamic Mixture of Experts
11922	--	11934	Mingzhu Xu, Zhengyu Sun, Yijun Hu, Haoyu Tang 0002, Yupeng Hu 0003, Xuemeng Song, Liqiang Nie. Superpixel Segmentation With Edge Guided Local-Global Attention Network
11935	--	11949	Dingli Hua, Qingmao Chen, Zhiliang Wu, Yifan Zuo, Wenying Wen, Yuming Fang. Perceptual Transform Fusion of Infrared and Visible Images
11950	--	11964	Kui Liu, Bart Goossens, Tom De Schepper, Wilfried Philips. Improving Post-Training Quantization via Probabilistic Programming
11965	--	11977	Lvwei Zhu, Eric Rigall, Ying Gao 0005, Zongshuai Zhang, Yafei Bai, Junyu Dong. Region-Aware Driven Distribution Optimization for Stereo Matching
11978	--	11992	Zuojie Xie, Hao Ren 0002, Junjian Huang, Zhiquan He, Hong Lu 0001, Yong Liu, Jiawen Lu, Lvfan Yuan, Shulin Liu, Changyong Xie. Low-Light Image Enhancement via Multi-Exposure Progressive Contrastive Regularization
11993	--	12006	Rong Zhou, Simin Yu. Breaking a New Image Cryptosystem From Three Perspectives
12007	--	12022	Shuang Li, Ganggang Dong, Hongwei Liu 0001. ImagingNet: A New Learnable SAR Imaging Method via Hierarchical U-Shaped Network
12023	--	12037	Ying Zhu, Hong Liu 0008, Guoliang Hua, Hao Tang 0005, Yidi Li, Weibo Huang. Dual Attention Guidance Network for Self-Supervised Monocular Depth Estimation
12038	--	12051	Yuxiang Zhang 0005, Wei Li 0032, Wen Jia, Mengmeng Zhang 0005, Ran Tao 0003, Shunlin Liang. Cross-Domain Hyperspectral Image Classification Based on Bi-Directional Domain Adaptation
12052	--	12065	Peng Yang, Ming Liu 0029, Liquan Dong, Lingqin Kong, Yuejin Zhao. Polynomial Fitting-Based Estimation of Spatially Varying Point Spread Function From a Single Image
12066	--	12081	Haoyuan Li, Qi Hu, Binjia Zhou, You Yao, Jiacheng Lin, Kailun Yang 0001, Peng Chen 0008. CFMW: Cross-Modality Fusion Mamba for Robust Object Detection Under Adverse Weather
12082	--	12095	Zhongling Huang, Long Liu, Shuxin Yang, Zhirui Wang 0003, Gong Cheng 0003, Junwei Han 0001. Physics-Guided Detector for SAR Airplanes
12096	--	12108	Xu Han, Qi Wang. Compensating for the Incomplete With the Complete: An Efficient Scene Text Detector
12109	--	12124	Kunpeng Wang 0005, Zhengzheng Tu, Chenglong Li 0002, Zhengyi Liu, Bin Luo 0001. Unified-Modal Salient Object Detection via Adaptive Prompt Learning
12125	--	12137	Yu Liu 0021, Chun Luo, Wanglong Wan, Wenqiang Jin, Zheng Qin 0001. A Secure Medical Image Encryption Scheme Based on Cross-Ring Josephus Scrambling and Two-Dimensional Cellular Automata
12138	--	12151	Na Zheng, Xuemeng Song, Wai Teng Tang, See-Kiong Ng, Liqiang Nie, Roger Zimmermann. Unsupervised Few-Shot Food Recognition With Intra-Class Variation and Inter-Class Similarity Modeling
12152	--	12166	Mingyue Chen, Xin Liao 0001, Han Fang, Jinlin Guo, Yanxiang Chen, Xiaoshuai Wu. Flexible Partial Screen-Shooting Watermarking With Provable Robustness
12167	--	12181	Meng Li, Bo Ma 0012, Yulin Zhang. Lightweight Image Super-Resolution With Pyramid Clustering Transformer
12182	--	12195	Jia Wang 0054, Zhiguo Qu, Lingshuang Kong, Wentao Yuan, Encai Liu, Rui Zhang, Ruigang Fu. Learning a Perspective-Invariant Descriptor for Remote Sensing Image Matching
12196	--	12211	Piotr Kopa Ostrowski, Daniel Wesierski, Anna Jezierska, Tomasz P. Stefanski. Lifting Deep Image Denoisers to Video With Frame Interpolation Pre-Training
12212	--	12226	Hengyue Bi, Long Chen 0019, Jingchao Cao, Jingyang Wang, Jinghao Sun, Yuan Rao 0001, Junyu Dong. SeaDiff: Underwater Image Enhancement With Degradation-Aware Diffusion Model
12227	--	12237	Bo Hu 0008, Wei Wang, Leida Li, Lihuo He, Wen Lu 0004, Xinbo Gao 0001. Blind Quality Assessment of Wide-Angle Videos Based on Deformation Representation Learning and Multi-Dimensional Feature Fusion
12238	--	12250	Yunnan Wang, Ziqiang Li, Wenyao Zhang, Lexiang Lv, Zequn Zhang, Xiaoyu Shen, Xin Jin 0014, Wenjun Zeng 0001. Canvas: Compositional Generation for Art Painting With Seamless Subject-Driven Infusion
12251	--	12264	Dongshuai Duan, Honglei Su, Qi Liu 0029, Hui Yuan 0001, Zhou Wang 0001. DQP-PCQA: Deep Quantization Parameters Bring New Insight to Point Cloud Quality Assessment
12265	--	12277	Ting Zhou, Siyuan Chen, Siyao Wan, Hanyun Lv, Zheng Luo, Jianhui Wu 0002. GEDR: Gaussian-Enhanced Detail Reconstruction for Real-Time High-Fidelity 3D Scene Reconstruction
12278	--	12291	Xiao Xu 0005, Libo Qin 0001, Wanxiang Che, Min-Yen Kan. Manager: Aggregating Insights From Unimodal Experts in Two-Tower VLMs and MLLMs
12292	--	12305	Runhao Zeng, Qi Deng, Ronghao Zhang, Shuaicheng Niu, Jian Chen 0011, Xiping Hu, Victor C. M. Leung. Exploring Audio Cues for Enhanced Test-Time Video Model Adaptation
12306	--	12316	Guangsheng Xu, Guoyi Zhang, Lejia Ye, Shuwei Gan, Xiaohu Zhang, Xia Yang. Optimizing Local-Global Dependencies for Accurate 3D Human Pose Estimation
12317	--	12328	Shanshan Han, Shuang Li, Shuodi Wang, Lin Yuan 0002, Yan Zhang 0108, Xinbo Gao 0001. Deepfake Detection Leveraging Self-Blended Artifacts Guided by Facial Embedding Discrepancy
12329	--	12340	Yongqi Huang, Peng Ye 0006, Chongjun Tu, Tao Chen 0003, Tong He 0001, Wanli Ouyang. Sparse-to-Dense Training: A Novel Training Scheme to Enhance Vision Transformers
12341	--	12354	Cheng Lin, Hong Hu, Jie Zou 0001, Lujun Li, Jun Liu, Yipeng Gao, Yang Yang 0002, Heng Tao Shen. Distilling Grounding DINO for an Edge-Cloud Collaborative Advanced Driver Assistance System
12355	--	12368	Zhifeng Wang 0004, Qixuan Zhang, Peter Zhang, Wenjia Niu, Kaihao Zhang, Ramesh S. Sankaranarayana, Sabrina B. Caldwell, Tom Gedeon. Visual and Textual Prompts in VLLMs for Enhancing Emotion Recognition
12369	--	12381	Jianing Wang 0003, Shengjia Hao, Zheng Hua, Yuqiong Yao, Qiong Xu, Bo Liu 0009, Maoguo Gong. TBGA-Net: Trigonometric Bilinear Attention and Global-Aware Aggregation Network for Large-Scale 3D Point Cloud Segmentation
12382	--	12395	Bo Pang, Deming Zhai, Jianan Zhen, Long Wang, Xu Han, Guofeng Zhang 0001, Xianming Liu 0005. Zero6DOT: Zero-Shot 6D Object Pose Tracking With Monocular RGB Video
12396	--	12409	Kehua Chen, Zhenlong Yuan, Haihong Xiao, Tianlu Mao, Zhaoqi Wang. Learning Multi-View Stereo With Geometry-Aware Prior
12410	--	12425	Jianping Zhong, Zhaobo Qi, Kaiwen Duan, Yuanrong Xu, Weigang Zhang, Qingming Huang. VPA: Multi-Modal Virtual Point Augmentation for 3D Object Detection
12426	--	12440	Yanbo Gao, Huibin Bai, Huasong Zhou, Xingyu Gao 0001, Shuai Li 0005, Xun Cai, Hui Yuan 0001, Wei Hua 0002, Tian Xie 0011. Adaptive Depth-Converted-Scale Convolution for Self-Supervised Monocular Depth Estimation
12441	--	12454	Zijian Zhang, Muqing Wu, Honghao Qi, Min Zhao 0002. EFMK: Extrinsic Parameters-Free Multi-View 3D Human Skeleton Estimation
12455	--	12466	Yiqiang Wu, Yu Qin, Jiacheng Sun, Chang Liu 0082, Yunfei Bai, Chenghai Mao, Xiaomao Li. SampleDet3D: Sample Enhanced 3D Object Detection
12467	--	12476	Junyi Hou, Zihao Pan, Changjun Xu, Lei Yu 0007. Low Texture 3D Reconstruction System Based on Manhattan Axis and 2D/3D Line Features
12477	--	12491	Baoyang Mu, Feng Shao 0001, Hangwei Chen, Xuejin Wang, Qiuping Jiang. A Mutual Head Knowledge Distillation Framework for Lightweight RGB-T Crowd Counting
12492	--	12507	Aihua Mao, Shuyi Wen, Feng Chen, Ran Yi 0002, Yong-Jin Liu 0001. Robust 3D Visual Question Answering via Bias Learning
12508	--	12523	Shengjun Zhu, Jiaxin Cai, Runqing Xiong, Liping Zheng, Duo Ma. Singular Pooling: A Spectral Pooling Paradigm for Second-Trimester Prenatal Level II Ultrasound Standard Fetal Plane Identification
12524	--	12537	Tianshi Luo, Hao Li 0009, Maoguo Gong, Yu Zhou 0051, A. Kai Qin. STEAM: Style Transfer Enabled Adversarial Attack With Attention Mechanism on Remote Sensing Image Scene Classification
12538	--	12549	Yang Liu 0069, Jiale Du, Xinbo Gao 0001, Jungong Han, Ling Shao 0001. Relation-Aware Meta-Learning for Zero-Shot Sketch-Based Image Retrieval
12550	--	12563	Xuecheng Li, Yuanjie Zheng. Inpaint-Outpaint Synergy: Mask Refinement for Trimap-Free Matting
12564	--	12578	Lei Song 0010, Huaibo Song, Bo Jiang 0017. Adaptive Clustering and Frequency Division Network for Efficient Monocular Depth Estimation
12579	--	12591	Gee-Sern Jison Hsu, Wei-Jun Lin, Wei-Chun Hsieh, Wei-Zhe Jian, Sheng-Luen Chung, Marina L. Gavrilova. Style-Preserving Generator for Synthetic License Plate Recognition
12592	--	12606	Wenbin Yan, Hua Chen 0008, Qingwei Wu, Xiaogang Zhang, Qiu Fang, Shengjie Hu, Yaonan Wang 0001. LFSSMam: Efficient Aggregation of Multi-Spatial-Angular-Modal Information Using Selective SSM for Light Field Semantic Segmentation
12607	--	12621	Yang Li, Songlin Yang, Wei Wang 0025, Jing Dong 0003. Beyond Inserting: Learning Subject Embedding for Semantic-Fidelity Personalized Diffusion Generation
12622	--	12635	Wenjia Meng, Huimin Han, Xiankai Lu, Yilong Yin, Gang Pan 0001, Qian Zheng. LAC-PS: A Light Direction Selection Policy Under the Accuracy Constraint for Photometric Stereo
12636	--	12651	Gang He 0002, Long Gao, Langkun Chen, Yan Jiang, Weiying Xie, Yunsong Li 0001. Hyperspectral Object Tracking With Spectral Information Prompt
12652	--	12665	Yao Chen, Guancheng Jia, Yufei Zha, Peng Zhang 0005, Yanning Zhang 0001. LINR: A Plug-and-Play Local Implicit Neural Representation Module for Visual Object Tracking
12666	--	12679	Ye Wang 0020, Mingyang Ma 0004, Ge Zhang 0006, Yuheng Liu, Tao Gao 0001, Shaohui Mei. Hyperspectral Tracker With Constrained Object Adaptive Learning and Trajectory Construction
12680	--	12691	Shou Feng, Jinghe Zhang, Yuanze Fan, Xinyao Liu, Chunhui Zhao 0003, Wei Li 0032, Ran Tao 0003. Cross-Domain Few-Shot Learning Method Based on Fractional Domain Information for Hyperspectral Image Multi-Class Change Detection
12692	--	12706	Xuting Lan, Weizhi Xian, Mingliang Zhou 0001, Jielu Yan, Xuekai Wei, Jun Luo 0006, Weijia Jia 0001, Sam Kwong. No-Reference Image Quality Assessment: Exploring Intrinsic Distortion Characteristics via Generative Noise Estimation With Mamba
12707	--	12718	Jinglin Xu, Yaqi Zhang, Wenhao Zhou, Hongmin Liu 0001. BFSTAL: Bidirectional Feature Splitting With Cross-Layer Fusion for Temporal Action Localization
12719	--	12733	Guanqi Ding, Xinzhe Han, Shuhui Wang, Xin Jin 0004, Qingming Huang. Stable Attribute Group Editing for Reliable Few-Shot Image Generation
12734	--	12746	Jingqian Wu, Shuo Zhu, Chutian Wang, Boxin Shi, Edmund Y. Lam. SweepEvGS: Event-Based 3D Gaussian Splatting for Macro and Micro Radiance Field Rendering From a Single Sweep
12747	--	12759	Honglin Guo, Ruidong Chen, Weizhi Nie, Lanjun Wang, Anan Liu. CompCraft: Foreground-Driven Image Synthesis With Customized Layouts
12760	--	12771	Yiqian Wu, Hao Xu 0049, Xiangjun Tang, Yue Shangguan, Hongbo Fu 0001, Xiaogang Jin 0001. 3DPortraitGAN: Learning One-Quarter Headshot 3D GANs From a Single-View Portrait Dataset With Diverse Body Poses
12772	--	12787	Alessandro Gnutti, Fabrizio Guerrini, Riccardo Leonardi, Antonio Ortega. Variable-Size Symmetry-Based Graph Fourier Transforms for Image Compression
12788	--	12801	Shiwei Wang 0005, Liquan Shen, Peiying Wu, Zhaoyi Tian, Feifeng Wang. DRLN: Disparity-Aware Rescaling Learning Network for Multi-View Video Coding Optimization
12802	--	12815	Jian Xiong 0005, Junhao Wu, Wang Luo, Jiucheng Xie, Hui Yuan 0001, Hao Gao 0005. Multi-Task Learning Model for V-PCC Geometry Compression Artifact Removal
12816	--	12829	Jie Li 0015, Zhixin Li, Zhi Liu 0002, Peng Yuan Zhou, Richang Hong, Qiyue Li 0001, Han Hu 0003. Viewport Prediction for Volumetric Video Streaming by Exploring Video Saliency and User Trajectory Information
12830	--	12845	Guquan Jing, Peng Gao, Yujian Lee, Yiyang Hu, Hui Zhang 0062. 3D-Aided Pedestrian Representation Learning for Video-Based Person Re-Identification
12846	--	12860	Lingchen Gu, Xiaojuan Shen, Jiande Sun 0001, Yan Liu, Jing Li 0046, Zhihui Li, Sen-Ching S. Cheung, Wenbo Wan. Dual Prototypes-Based Personalized Federated Adversarial Cross-Modal Hashing
12861	--	12873	Fengling Li 0001, Zequn Wang, Tianshi Wang 0001, Lei Zhu 0002, Xiaojun Chang. Generative Augmentation Hashing for Few-Shot Cross-Modal Retrieval
12874	--	12889	Yating Liu, Yaowei Li 0001, Xiangyuan Lan, Wenming Yang, Zimo Liu, Qingmin Liao. UP-Person: Unified Parameter-Efficient Transfer Learning for Text-Based Person Retrieval
12890	--	12903	Pujun Zhou, Guanchao Qiao, Qi Yu 0002, M. Chen, Y. C. Wang, Y.-C. Chen, J. J. Wang, Ning Ning 0002, Y. Liu, Shaogang Hu. A 0.96 pJ/SOP Heterogeneous Neuromorphic Chip Toward Energy-Efficient Edge Visual Applications
12904	--	12917	Lixin Zhang, Qian Wang 0046. Synergistic Fusion Network of Microscopic Hyperspectral and RGB Images for Multi-Perspective Segmentation
12918	--	12924	Ziwen He, Xingjie Dai, Xiang Zhang 0023, Zhangjie Fu. MMDStegNet: An Adversarial Steganography Framework With Maximum Mean Discrepancy Regularization

10616	--	10631	Yu Quan, Dong Zhang, Jinhui Tang 0001. Generalized Concordant Vision Transformer With Masked Image Tokens for Object Detection
10632	--	10648	Wenjin Guo, Donglai Liu, Weiying Xie, Yunsong Li 0001, Xuefei Ning, Zihan Meng, Shulin Zeng, Jie Lei 0001, Zhenman Fang, Yu Wang 0002. ShiftQuant: Toward Accurate and Efficient Sub-8-bit Integer Training
10649	--	10664	Hang Sun, Qingfei Zhong, Bo Du 0001, Zhigang Tu 0001, Jun Wan 0005, Wenbin Wang 0001, Dong Ren. Bidirectional-Modulation Frequency-Heterogeneous Network for Remote Sensing Image Dehazing
10665	--	10678	Yang Wei 0002, Haowei Liu, Xiaochen Yuan, Xiuli Bi, Bin Xiao 0002. Let Images Speak More: An Efficient Method for Detecting Image Manipulation History
10679	--	10692	Penglei Wang, Danyang Wu, Jin Xu 0014, Feiping Nie 0001. Comprehensive Information Extraction With Separable Representation Learning for Multi-View Clustering
10693	--	10704	Yeongje Im, Jione Pak, Songju Na, Jinhong Park, Jihyung Ryu, Seounghyun Moon, Beomjun Koo, Suk-Ju Kang. Supervised Denoising for Extreme Low-Light Raw Videos
10705	--	10715	Junkai Fan, Xiang Li 0041, Jianjun Qian, Jun Li 0027, Jian Yang 0003. Non-Aligned Supervision for Real Image Dehazing
10716	--	10727	Xinxin Wang 0003, Yongshan Zhang, Jie Zhang, Yicong Zhou. Incomplete Multiview Clustering Using Discriminative Feature Recovery and Tensorized Matrix Factorization
10728	--	10741	Jahoon Jeong, Joonkyo Shim, Hyunsoo Yoon. TANet: Tri-Aspects Network for Camouflaged Object Detection
10742	--	10755	Feilong Cao, Qijin Xu, Hailiang Ye. Adaptive Prior and Long-Range Dependency-Based Learners for Image Inpainting
10756	--	10771	Meijun Fu, Xiaomin Wang, Jun Wang 0002, Zhang Yi 0001. Synthetic Gradient Optimization-Based Implicit Amortized Bayesian Meta-Learning for Few-Shot Pumi Spectrographic Image Recognition
10772	--	10786	Wenrui Li 0001, Penghong Wang, Xingtao Wang, Wangmeng Zuo, Xiaopeng Fan 0001, Yonghong Tian 0001. Multi-Timescale Motion-Decoupled Spiking Transformer for Audio-Visual Zero-Shot Learning
10787	--	10800	Jie Zhou 0031, Yongxiang Liu, Bowen Peng, Li Liu 0002, Xiang Li 0014. MaDiNet: Mamba Diffusion Network for SAR Target Detection
10801	--	10814	Zhaojie Chu, Kailing Guo, Xiaofen Xing, Bolun Cai, Shan He, Xiangmin Xu. Alleviating One-to-Many Mapping in Talking Head Synthesis With Dynamic Adaptation Context and Style Adapter
10815	--	10827	Yunfei Bai, Yiqiang Wu, Bin Zhu, Xiaomao Li. Contrastive-Domain Mean Teacher for Domain Adaptive Object Detection
10828	--	10843	Yingge Liu, Dawei Dai, Guoyin Wang 0001, Shuyin Xia. Multivariate Feedback-Based Image-Text Joint Learning for Sketch-Less Facial Image Retrieval
10844	--	10861	Shuai Liu, Yuchao Zheng 0001, Jianru Li, Huimin Lu 0001, Dong An, Zhengxiang Shen, Zhanshan Wang. Turbid Underwater Image Enhancement With Illumination-Constrained and Structure-Preserved Retinex Model
10862	--	10874	Ting-Wei Zhou, Xi-Le Zhao, Wei-Hao Wu, Jian Li Wang, Yi-Si Luo. Frequency-Aware Implicit Neural Representation for Multi-Dimensional Data Recovery
10875	--	10890	Zenghui Wang 0009, Songlin Du, Yaping Yan, Guobao Xiao, Xiaobo Lu. Tex2Sem: Learning From Textures to Semantics for Robust Semantic Correspondence
10891	--	10905	Zhipu Liu, Lei Zhang 0038. Multi-Model Synergy Perception for Open-World Person Re-Identification
10906	--	10917	Yu Bai, Liang Bai 0001, Xian Yang 0001, Jiye Liang. Label-Semantic-Based Prompt Tuning for Vision Transformer Adaptation in Medical Image Analysis
10918	--	10929	Qing Tian 0001, Xiang Liu, JiaZhong Zhou, Yuhui Zheng, Jun Wan 0001, Zhen Lei 0001. Cross-Attention With Conditional Matching for Multi-Target Domain Adaptation
10930	--	10943	Liyuan Guo, Lianghai Jin, Enmin Song. Queue-Augmented Correlation-Biased Orthogonality Loss and Implicit Selective Transformer for Facial Expression Recognition in the Wild
10944	--	10958	Pengyu Jie, Wanquan Liu, Chenqiang Gao, Yihui Wen, Rui He, Weiping Wen, Pengcheng Li, Jintao Zhang, Deyu Meng. A Point-Neighborhood Learning Framework for Nasal Endoscopic Image Segmentation
10959	--	10972	Yunsong Li 0001, Xin Zhang 0092, Weiying Xie, Xiaoyu Chen, Daixun Li, Hangyu Ye, Leyuan Fang. Dual-Depth Unified Joint Optimization: Adaptive Curvature-Based Compression
10973	--	10985	Quanbo Ge, Bingtao Zhu, Mengmeng Wang 0009, Bingjun Zhang, Yanjun Huang. Airborne Camera Dynamic Target Detection Based on Background Prediction and Semantic Compensation in Surface Environment
10986	--	11000	Haidong Qin, Tao Yang 0006, Xiaoshi Zhou, Dongdong Li, Yanran Dai, Jing Li 0010. ECC-NeRF: Anti-Aliasing Neural Radiance Fields With Elliptic Cone-Casting for Diverse Camera Models
11001	--	11012	Yuhao Li, Jiale Cao, Muzammal Naseer, Yu Zhu 0004, Jinqiu Sun, Yanning Zhang 0001, Fahad Shahbaz Khan. Multi-Granularity Language-Guided Training for Multi-Object Tracking
11013	--	11027	Biao Xiang, Hongmei Chen 0001, Yong Mi, Binbin Sang, Shi-Jinn Horng, Tianrui Li 0001. Class-Specific Discriminability and Multiscale Information-Based Multiview Feature Selection
11028	--	11040	Weihao Jiang, Chang Liu, Kun He 0001. Intra-Task Mutual Attention-Based Vision Transformer for Few-Shot Learning
11041	--	11053	Yu Wang 0006, Shikui Wei, Sen Xu, Ying Qin, Yao Zhao 0001. Confidence-Driven Unimodal Interference Removal for Enhanced Multimodal Object Detection
11054	--	11067	Daidou Guo, Chuan Qin 0001, Xiangyang Luo 0001, Guorui Feng, Xinpeng Zhang 0001. Shields for Digital Images: A Watermarking Method With KAN Block and Simulation-Enhanced Noise Pool to Resist Screen-Camera Attacks
11068	--	11082	Heng Wang 0014, Hongxia Wang 0001, Mingze He, Fei Zhang 0015, Jinghong Xia. Robust Video Watermarking Against Digital Editing and Camcording
11083	--	11096	Qihang Ge, Wei Sun 0029, Yu Zhang 0133, Yunhao Li, Zhongpeng Ji, Fengyu Sun, Shangling Jui, Xiongkuo Min, Guangtao Zhai. LMM-VQA: Advancing Video Quality Assessment With Large Multimodal Models
11097	--	11112	Yimei Liu, Jingchao Cao, Hao Fan 0004, Junyu Dong, Sheng Chen 0001. Real-World Multi-View Stereo via Learning RGB-D Structural Consistency From Depth Super-Resolution
11113	--	11128	Bosen Lin, Junyu Dong, Xinghui Dong. Perception-Aware Underwater Image Quality Assessment: Dataset, Perceptual Quality Scores, and Assessment Network
11129	--	11143	Linhan Huang, Yutao Chen, Liu Liu 0014, Jianqing Zhu, Huanqiang Zeng. Harmonizing Metric Discrepancy for Cross-Modal Object Re-Identification
11144	--	11157	Qianhan Feng, Wenshuo Li, Tong Lin 0002, Xinghao Chen 0001. Full-Stage Pseudo Label Quality Enhancement for Weakly-Supervised Temporal Action Localization
11158	--	11171	Zhaobo Qi, Shuhui Wang, Weigang Zhang, Qingming Huang. Uncertainty-Aware Mixture of Experts for Video Action Anticipation
11172	--	11185	Chengyang Fang, Wenhui Jiang, Yuming Fang, Yuxin Peng 0001, Yang Liu 0293. Separate, Locate, and Align: Determine Context Relation of Scene Text From Multiple Perspectives in TextVQA
11186	--	11199	Xiaohuan Lu, Jiang Long, Haitao Zhang, Wulin Xie, Lian Zhao, Yinghao Ye, Jie Wen 0001. Partial Multi-View Incomplete Multi-Label Learning Network With Quality-Aware Representation Fusion
11200	--	11215	Xinggang Hu, Yanmin Wu, Mingyuan Zhao, Zhenzhong Cao, Xiangkui Zhang, Xiangyang Ji. DYO-SLAM: Visual Localization and Object Mapping in Dynamic Scenes
11216	--	11228	Qingxuan Lv, Junyu Dong, Yuezun Li, Sheng Chen 0001, Hui Yu 0001, Shu Zhang 0002, Wenhan Wang. UWStereo: A Large Synthetic Dataset for Underwater Stereo Matching
11229	--	11243	Changping Hu, Jing Xu 0011, Chifai Pun, Fei Chen 0007, Rui Chen 0019. GlassMolder: Transparent Object Reconstruction With Silhouette-Guided Object-Centric Diffusion
11244	--	11257	Zhenlong Yuan, Zhidong Yang, Yujun Cai, Kuangxin Wu, Mufan Liu, Dapeng Zhang, Hao Jiang 0013, Zhaoxin Li, Zhaoqi Wang. SED-MVS: Segmentation-Driven and Edge-Aligned Deformation Multi-View Stereo With Depth Restoration and Occlusion Constraint
11258	--	11270	Sigeng Chen, Jingfan Fan, Danni Ai, Deqiang Xiao, Yucong Lin, Hong Song 0003, Hongli Liu, Wenyuan Yu, Yang Yu, Jian Yang 0009. Multidomain Dependency-Aware Guided Unified-Stage Coronary Artery Branch Recognition Network
11271	--	11281	Xueyuan Gong, Zhiquan Liu, Yain-Whar Si, Xiaochen Yuan, Ke Wang, Xiaoxiang Liu, Cong Lin, Xinyuan Zhang. FastFace: Fast-Converging Scheduler for Large-Scale Face Recognition Training With One GPU
11282	--	11296	Qian Feng, Hanbin Zhao, Chao Zhang 0001, Jiahua Dong 0001, Henghui Ding, Yu-Gang Jiang 0001, Hui Qian 0001. PECTP: Parameter-Efficient Cross-Task Prompts for Incremental Vision Transformer
11297	--	11308	An-An Liu, Hao-Chen Li, Wenhui Li 0001, Dan Song 0006, Hongshuo Tian, Lanjun Wang. ClipMix for Domain Generalization
11309	--	11322	Kuiyun Huang, Menglong Chen, Hong Zheng, Baihong Lin, Shicai Fan. Soft Cluster-Aware Equivariant Contrastive Learning for Unsupervised Out-of-Distribution Detection
11323	--	11336	Runzhong Zhang, Yueqi Duan, Yang Chen, Weipeng Hu, Chen Cai, Suchen Wang, Yap-Peng Tan. Boundary Voting Network for Ambiguity-Aware Timestamp-Supervised Action Segmentation
11337	--	11349	Siping Zhuang, Guangyao Li, Qiangqiang Wu, Yang Lu 0009, Hai-Miao Hu, Hanzi Wang. CGATracker: Correlation-Aware Graph Alignment for Referring Multi-Object Tracking
11350	--	11361	Yujin Zheng, Chu He, Xiaohan Chen, Huan Zhang, Tao Qu, Dingwen Wang. DFA-MOT: A Dynamic Field-Aware Multi-Object Tracking Framework for Uncrewed Aerial Vehicles
11362	--	11376	Jun Wang 0131, Bingfei Chai, Lingtao Zhou, Yuanyun Wang. Robust Object Tracking via Long-Range Spatial Representation and Local Feature Enhancement
11377	--	11389	Yuanhong Zhong, Ge Yan, Yongting Hu, Dong Zhu, Ruyue Zhu. A Two-Stage Framework With Memory for Anomaly Detection via Video Decomposition and Bidirectional Consistency
11390	--	11403	Yunan Li 0001, Xi Geng, Zhuoqi Ma, Qiguang Miao, Chi-Man Pun. Boundary-Aware Sentence-Gloss Alignment With Semantic Similarity Measurement for Continuous Sign Language Recognition
11404	--	11415	Zhehao Zhu, Yifei Huang 0002, Mingfang Zhang 0002, Liangyang Ouyang, Yoichi Sato 0001. Prompt-Augmented Boundary Attentive Learning for Weakly Supervised Temporal Sentence Grounding
11416	--	11431	Kun Dai, Zilong Zhou, Zhiqiang Jiang, Qihao Sun, Tao Xie 0010, Hongbo Gao 0008, Tao An, Ruifeng Li, Lijun Zhao 0003. VD-Matcher: A Very Deep Local Feature Matcher With Weight Recycling and Keypoint Detection
11432	--	11447	Jinyi Fang, Bingke Zhu, Jingling Yuan, Yingying Chen 0003, Ming Tang 0001, Jinqiao Wang. AMITA: Attribute-Guided Masked Image-Text Alignment for Multi-Label Image Representation
11448	--	11461	Hao Wang 0073, Tong Jia 0001, Qilong Wang 0001, Wangmeng Zuo. Automatic Label Assignment for Object Detection
11462	--	11473	Zhen-Xiang Ma, Zhen-Duo Chen 0001, Tai Zheng, Xin Luo 0006, Xin-Shun Xu. BTG-Net++: Enhanced Bi-Directional Task-Guided Network for Few-Shot Fine-Grained Image Classification
11474	--	11487	Kaixun Jiang, Zhaoyu Chen 0001, Jiyuan Fu, Lingyi Hong, Jinglun Li, Wenqiang Zhang. VideoPure: Diffusion-Based Adversarial Purification for Video Recognition
11488	--	11501	Tieyuan Chen, Huabin Liu 0001, Chern Hong Lim, John See, Xing Gao 0005, Junhui Hou, Weiyao Lin. CSTA: Spatial-Temporal Causal Adaptive Learning for Exemplar-Free Video Class-Incremental Learning
11502	--	11513	Hua Yu 0006, Yaqing Hou, Xu Gui 0001, Shanshan Feng 0001, Dongsheng Zhou, Qiang Zhang 0008. A Spatio-Temporal Continuous Network for Stochastic 3D Human Motion Prediction
11514	--	11526	Hao Liu 0044, Hui Yuan 0001, Raouf Hamzaoui, Weiqing Yan. PU-GSM: A Latent Geometry-Guided Self-Similarity Model for Point Cloud Upsampling
11527	--	11539	Tengyao Cui, Yongfang Wang, Yihan Wang 0008, Zhijun Fang. Semantic and Saliency-Aware Scalable Image Coding Toward Human-Machine Collaboration
11540	--	11552	Zhiyuan Li, Yanhui Zhou, Hao Wei 0005, Chenyang Ge, Ajmal Mian. RDEIC: Accelerating Diffusion-Based Extreme Image Compression With Relay Residual Diffusion
11553	--	11566	Ziqing Ge, Zhimeng Huang, Chuanmin Jia, Siwei Ma 0001, Wen Gao 0001. Rethinking the Functionality of Latent Representation: A Logarithmic Rate-Distortion Model for Learned Image Compression
11567	--	11582	Haotian Zhang, Yuqi Li, Li Li 0040, Dong Liu 0002. Learning Switchable Priors for Neural Image Compression
11583	--	11597	Han Xiao, Changqiao Xu, Hongye Jiang, Wendong Wang 0003, Shujie Yang, Lujie Zhong, Xiaofeng Tao 0001, Gabriel-Miro Muntean. Bilateral Bargaining-Based Adaptive Video Transmission: A Frame Rate Perspective
11598	--	11612	Penggang Qin, Tong Xu 0001, Chao Zhang 0096, Heda Wang, Yao Hu 0002, Enhong Chen. Scenario-Aware Multimodal Chain-of-Thought Prompting for Rationales of VideoSocial Relations
11613	--	11626	Huakai Lai, Xi Wei, Rui Sun 0006, Tianzhu Zhang 0001. Agent-Based Control Prompt Tuning for Video-Text Retrieval
11627	--	11640	Linlin Ji, Li Liu 0031. Multi-Scale Feature Fusion Based on Piecewise Polynomial Activation Function for Image-Text Matching
11641	--	11654	Ran Ran 0001, Jiwei Wei, Shiyuan He, Yuyang Zhou, Peng Wang 0023, Yang Yang 0002, Heng Tao Shen. Fine-Grained Alignment and Interaction for Video Grounding With Cross-Modal Semantic Hierarchical Graph
11655	--	11666	Ming Jin 0007, Lei Zhu 0002, Richang Hong. BiSeR-LMA: A Bidirectional Semantic Reasoning and Large Model Enhancement Approach for Text-Video Cross-Modal Retrieval
11667	--	11684	Dazhi Xu, Ming Li 0004, Yan Wu 0003, Peng Zhang 0003, Xinyue Xin. Statistic-Guided Difference Enhancement Graph Transformer for Unsupervised Change Detection in PolSAR Images
11685	--	11697	Yong Chen 0013, Feiwang Yuan, Wenzhen Lai, Jinshan Zeng, Wei He 0003, Qing Huang. Low-Rank Tensor Meets Deep Prior: Coupling Model-Driven and Data-Driven Methods for Hyperspectral Image Reconstruction
11698	--	11707	Xinxin Li, Zichi Wang, Xinpeng Zhang 0001. Black-Box Steganography for Large Language Models
11708	--	11722	Shuai Yuan, Guangyong Gao, Yimin Yu, Zhihua Xia. Reversible Data Hiding in Encrypted Images With Adaptive Multi-Directional MED and Huffman Code Based on Interval-Wise Dynamic Prediction Axes
11723	--	11736	Dingcheng Gao, Yanjun Qin, Xiaoming Tao 0001, Jianhua Lu. Diversifying Latent Flows for Safety-Critical Scenarios Generation With CARLA Simulator

9562	--	9574	Jun Liu, Ziqian Lu, Hao Luo 0001, Zheming Lu 0001, Yangming Zheng. Progressive Multi-Prompt Learning for Vision-Language Models
9575	--	9591	Jiaqi Xu, Xiaowei Hu 0001, Lei Zhu 0003, Pheng-Ann Heng. Unifying Physically-Informed Weather Priors in a Single Model for Image Restoration Across Multiple Adverse Weather Conditions
9592	--	9607	Gang Wang 0051, Yisheng Zou, Songlin He, Yakun Wang, Ruihong Dai. Anomaly Detection and Localization via Reverse Distillation With Latent Anomaly Suppression
9608	--	9622	Wenhui Wu 0001, Jia Pang, Shuaibo Gao, Pingping Zhang, Zhe Chen, Guoping Qiu. Low-Light Image Enhancement Through Learning a Simplified Inverse Rendering Model
9623	--	9635	Enlong Wang, Jiawei Li 0016, Tiantian Yan, Jia Lei, Shihua Zhou, Bin Wang 0005, Jinyuan Liu 0001, Nikola K. Kasabov. LarTap: A Luminance-Aware Framework With Text-Correlation Priors for Multi-Exposure Image Fusion
9636	--	9649	Hu Qiang, Yuzhong Zhong, Yiwei Liao, Xingxing You, Yuqi Zhu, Songyi Dian. GWRetinex-Net: Gray World Retinex Network for Low-Light Image Enhancement
9650	--	9664	Duo Liu, Linglan Zhao, Zhongqiang Zhang, Fan Lyu, Xiangzhong Fang, Liang Wang 0001. Few-Shot Class-Incremental Learning via Asymmetric Supervised Contrastive Learning
9665	--	9680	Md. Imtiaz Hossain, Sharmen Akhter, Choong Seon Hong, Eui-nam Huh. Complexity-Aware Dynamic Gradient Shifting: A Novel Soft Supervision Training Strategy for 3D Pose Estimation and Regression Learning
9681	--	9694	Zherui Zhang, Rongtao Xu, Changwei Wang 0001, Wenhao Xu, Shunpeng Chen, Shibiao Xu, Guangyuan Xu, Li Guo 0004. DFMC: Feature-Driven Data-Free Knowledge Distillation
9695	--	9707	Dongdong Zhao, Tiancheng Cai, Peng Chen 0008, Weibo Mao, Yingtian Hu, Yilong Zhang 0001, Yuanjie Dang, Ronghua Liang, Xiang Tian 0002. SonarPoint: Weak-Heterogeneity Awareness Object Detection Network for 3D Sonar Point Cloud
9708	--	9722	Shihao Zou, Yuxuan Mu, Wei Ji 0011, Zi-An Wang, Xinxin Zuo, Sen Wang 0003, Weixin Si, Li Cheng 0001. Highly Efficient 3D Human Pose Tracking From Events With Spiking Spatiotemporal Transformer
9723	--	9735	Yingbo Wang, Kun He, Qiang Qu, Xiaogang Du, Tongfei Liu, Tao Lei 0005, Asoke K. Nandi. Adaptive Double-Branch Fusion Conditional Diffusion Model for Underwater Image Restoration
9736	--	9747	Xianjing Han, Wenmiao Hu, Xuemeng Song, Hannes Kruppa, See-Kiong Ng, Roger Zimmermann. Traffic Sign Localization and Orientation Classification for Automated Map Updating
9748	--	9762	Ang Li, Dexin Zuo, Anning Hu, Wenxian Yu, Danping Zou. Sparse-to-Dense Hint Guided Stereo-LiDAR Fusion
9763	--	9774	Yuehan Chen, Jiqing Zhang, Yafeng Li, Yudong Li, Haoming Tang, Huibing Wang, XianPing Fu. Fusion-Based Channel-Wise Isotropic Convergent Real-Time Underwater Image Enhancement
9775	--	9788	Bowei Xie, Geyuan Liu, Fang Deng, Maobin Lu. AITEPose: Learning an End-to-End Monocular 3D Human Pose Estimator via Auxiliary-Information-Driven Training Enhancement
9789	--	9803	Mingyu Zhao, Feiping Nie 0001, Cong Wang 0033, Xuelong Li 0001. Balanced and Discrete Multi-View Clustering With Adaptive Graph Learning
9804	--	9808	Wenbiao Yan, Jihua Zhu, Jinqian Chen, Haozhe Cheng, Qinghai Zheng. Graph Variational Multi-View Clustering
9809	--	9822	Jian Wang 0066, Chenglong Wang, Lin Guo, Shuchang Zhao, Dandan Wang, Shiqing Zhang, Xiaoming Zhao 0002, Jun Yu 0002, Yaowei Wang 0001, Yi Yang 0001, Siwei Ma, Qi Tian 0001. MDKAT: Multimodal Decoupling With Knowledge Aggregation and Transfer for Video Emotion Recognition
9823	--	9836	Wenhui Ji, Xu Cheng 0003, Yan Jiang, Zhaodong Sun, Guoying Zhao 0001. Learning From Yourself to Others for Unsupervised Visible-Infrared Re-Identification
9837	--	9849	Yunsong Li 0001, Daixun Li, Weiying Xie, Jitao Ma, Sibo He, Leyuan Fang. Semi-Mamba: Mamba-Driven Semi-Supervised Multimodal Remote Sensing Feature Classification
9850	--	9864	Yiming Li, Weikang Chen, Zinan Li, Chaobo Zhang, Xiaohao Wang, Weihua Gui 0001, Wen Gao, Xiaojun Liang, Xinghui Li. SL3D-BF: A Real-World Structured Light 3D Dataset With Background-to-Foreground Enhancement
9865	--	9877	Yiji Cheng, Fei Yin, Xiaoke Huang, Xintong Yu, Jiaxiang Liu 0004, Shikun Feng, Yujiu Yang, Yansong Tang. Efficient Text-Guided 3D-Aware Generation With Score Distillation on 3D Distribution
9878	--	9888	Jie Guo, Liangyun Sun, Lishan Qiao, Xiushan Nie, Jixin Yang, Weicui Li, Ying Guo, Xiaoming Xi, Xinjian Chen 0001, Yilong Yin. Dual Difficulty-Aware Adaptive Pseudo Labeling for Semi-Supervised CNV Segmentation
9889	--	9894	Shasha Guo 0001, Chenyang Shi, Lei Wang 0011, Jing Jin, Yuliang Lu. EBF: An Event-Based Bilateral Filter for Effective Neuromorphic Vision Sensor Denoising
9895	--	9908	Lizhi Xiong, Cheng Xu, Xiang Zhang 0023, Zhangjie Fu. EFCA-DIH: Edge Features and Coordinate Attention-Based Invertible Network for Deep Image Hiding
9909	--	9921	Chenyi Xu, Lin Huang, Chuan Qin 0001, Guorui Feng, Xinpeng Zhang 0001. Steganography With Constructing Neural Networks
9922	--	9935	Jiaxing Liao, Jiaohua Qin, Yuanjing Luo, Wenyan Pan, Xuyu Xiang, Yun Tan. CLME: Robust Screen-Shooting Watermarking With Contrastive Learning and Mask-Guided Embedding
9936	--	9949	Xin Li, Hongxia Wang 0001, Jinhe Li, Fei Zhang 0015. Lightweight Scale-Free Steganalysis Mining Dispersed Clues in Downward JPEG-Resistant Steganography
9950	--	9963	Mian Zou, Baosheng Yu, Yibing Zhan, Siwei Lyu, Kede Ma. Semantics-Oriented Multitask Learning for DeepFake Detection: A Joint Embedding Approach
9964	--	9978	Tao Li, Yun Liu 0002, Wenqi Ren, Babak Shiri, Weisi Lin. Single Image Dehazing Using Fuzzy Region Segmentation and Haze Density Decomposition
9979	--	9985	Yujia Liu 0005, Chenxi Yang, Zhaofei Yu, Tie-Jun Huang 0001. Enhancing NR-IQA Model Robustness Through Simple Image Compression Techniques
9986	--	9999	Chenxi Feng, Xiongkuo Min, Long Ye, Yinghao Yang. LCIQA: A Lightweight Contrastive-Learning Framework for Image Quality Assessment via Cross-Scale Consistency Minimization
10000	--	10016	Congcong Li, Xinze Zheng, Fengqi Xiao, Fei Yuan 0001. BRIUIE: A Bio-Retina Inspired Underwater Image Enhancement Framework
10017	--	10031	Tianheng Zheng, Guanglu Dong, Pingping Zhang, Xiaohai He, Chao Ren 0002. Plug-and-Play General Image Registration for Misaligned Multi-Modal Image Fusion
10032	--	10046	Mingyuan Lin, Chi Zhang 0027, Chu He, Lei Yu 0006. Learning Parallax for Stereo Event-Based Motion Deblurring
10047	--	10058	Yingjie Zhou 0003, Zicheng Zhang, Jun Jia, Yanwei Jiang, Xiaohong Liu 0001, Xiongkuo Min, Guangtao Zhai. Who Is a Better Imitator: Subjective and Objective Quality Assessment of Animated Humans
10059	--	10069	Satoshi Kosugi. Leveraging the Powerful Attention of a Pre-Trained Diffusion Model for Exemplar-Based Image Colorization
10070	--	10082	Yuan Wang 0078, Yakun Chang, Ying Qin, Yao Zhao 0001, Shikui Wei. Unbiased Sample Selection and Label Improvement for Mitigating Noisy Labels in Class-Imbalanced Datasets
10083	--	10098	Binghao Liu, Qi Zhao, Chunlei Wang, Meng Li, Lijiang Chen. A Voronoi Density-Based Locally Unique Network for Fine-Grained Multi-Label Classification
10099	--	10109	Zhiwen Shao, Rui Chen, Xuehuai Shi, Bing Liu 0016, Canlin Li, Lizhuang Ma, Dit-Yan Yeung. Mirror Detection via Multi-Directional Similarity Perception and Spectral Saliency Enhancement
10110	--	10121	Yunlong Ran, Yanxu Li, Qi Ye, Yuchi Huo, Zhaopeng Cui, Zechun Bai, Jiahao Sun, Jiming Chen 0001. CT-NeRF: Incremental Optimization of Neural Radiance Field and Camera Poses With Complex Trajectory
10122	--	10133	Tianyu Liu, Hao Zhao 0002, Bohuan Xue, Guyue Zhou, Ming Liu 0001. Masked PaCONet: Self-Supervised Part-Aware Implicit Shape Reconstruction Scalability, Flexibility, Multi-scale and Semantic Consistency
10134	--	10147	Xinrun Liu, Linqing Zhao, Bin Fan 0001, Jiwen Lu, Hongmin Liu 0001. Dynamic Learnable Label Assignment for Indoor 3D Object Detection
10148	--	10161	Yifei Yang, Jingfan Fan, Long Shao, Mingyang Lei, Tianyu Fu 0003, Danni Ai, Deqiang Xiao, Hong Song, Yucong Lin, Jian Yang 0009. Landmark and Pose Prediction in Occluded Facial Point Cloud via Explicit Joint Feature Fusion Network
10162	--	10174	Zhenyu He, Jianxu Mao, Yaonan Wang 0001, Junlong Yu, Ziming Tao, Junfei Yi, Hui Zhang 0023, Shaoyuan Wang. LDFCDet: Boosting 3D Object Detectors With Low-High Level Feature Crosses Using Laplace Distribution
10175	--	10187	Jincai Song, Haipeng Chen 0002, Yingda Lyu, Weizhi Nie, An-An Liu. Causality-Inspired Unsupervised Domain Adaptation With Target Style Imitation for Medical Image Segmentation
10188	--	10198	Shuang Gao, Qiang Wang 0001, Yuxiang Sun. Boundary-Aware Semantic Bird-Eye-View Map Generation Based on Conditional Diffusion Models
10199	--	10212	Yuchen Zhou 0002, Chao Gou, Zipeng Guo, Yihua Cheng, Hyung Jin Chang. Behavior-Aware Knowledge-Embedded Model for Driver Attention Prediction
10213	--	10224	Man-Sheng Chen, Pei-Yuan Lai, De-Zhang Liao, Chang-Dong Wang 0001, Jian-Huang Lai. Homophily Induced Contrastive Attributed Graph Clustering
10225	--	10237	Yangyang Li 0001, GuanLong Liu, Ronghua Shang, Licheng Jiao. Meta Knowledge Assisted Evolutionary Neural Architecture Search
10238	--	10249	Hao Guo 0015, Wei Fan, Baichun Wei, Jianfei Zhu, Jin Tian, Chunzhi Yi, Feng Jiang 0001. AD-DINO: Attention-Dynamic DINO for Distance-Aware Embodied Reference Understanding
10250	--	10263	Hang Gao, Cheng Liu, Zuosong Cai, Hongming Sun, Gaoyang Li, Ying Li 0004, Wei Du 0002. A Novel Approach for Effective Partially View-Aligned Clustering With Triple-Consistency
10264	--	10277	Qixin Wang, Ziyu Li, Xiuxing Li, Tianyuan Jia, Qing Li 0027, Li Yao 0002, Xia Wu 0001. BrainyHGNN: Brain-Inspired Memory Retrieval and Cross-Modal Interaction for Emotion Recognition in Conversations
10278	--	10292	Suhwan Cho, Minhyeok Lee, Jungho Lee, MyeongAh Cho, Seungwook Park, Jaeyeob Kim, Hyunsung Jang, Sangyoun Lee. Treating Motion as Option With Output Selection for Unsupervised Video Object Segmentation
10293	--	10304	Yijun Yang, Zhaohu Xing, Lequan Yu, Huazhu Fu, Chunwang Huang, Lei Zhu 0003. Vivim: A Video Vision Mamba for Ultrasound Video Segmentation
10305	--	10315	Mao Zhen Liu 0002, Xiaoguang Di, Ming Liao. Image Inpainting Detection via Dual Guidance of Uncertainty and Precise Boundary Information
10316	--	10329	Zhuoyan Liu, Bo Wang 0015, Lizhi Wang, Chenyu Mao, Ye Li. ShareCMP: Polarization-Aware RGB-P Semantic Segmentation
10330	--	10338	Zhiruo Zhu, Bineng Zhong, Qihua Liang, Hongtao Yang, Yaozong Zheng, Ning Li 0044. Adaptive Expert Decision for RGB-T Tracking
10339	--	10352	Yuyang Tang 0001, Yinchao Ma, Tianzhu Zhang 0001. Semantic-Aware Network for Natural Language Tracking
10353	--	10366	Wuwei Wang, Meibo Lv, Lin Zhu 0012, Tuo Han, Yi Zhang, Yuanqing Li. Siamese Visual Tracking With Multi-Parallel Interactive Transformers
10367	--	10381	Cheng Huang, Shoudong Han, Mengyu He, Wenbo Zheng, Yuhao Wei. DfTrack: Deconfused Data Association Framework for Multi-Object Tracking
10382	--	10395	Haomiao Yuan, Yi Chen 0023, Zheyan Ji, Zhichao Zheng 0006, Yanhui Gu, Junsheng Zhou. Throughout Procedural Transformer for Online Action Detection and Anticipation
10396	--	10409	Lu Dong, Haiyu Zhang, Hongjie Zhang 0002, Yifei Huang 0002, Zhen-Hua Ling, Yu Qiao 0001, Limin Wang 0002, Yali Wang 0001. Weakly Supervised Temporal Sentence Grounding via Positive Sample Mining
10410	--	10422	Xiangyue Zhang, Yifan Jia 0007, Jiaxu Zhang, Yijie Yang, Zhigang Tu 0001. Robust 2D Skeleton Action Recognition via Decoupling and Distilling 3D Latent Features
10423	--	10436	Ziyi Chen, Xinru Zhao, Congyan Lang, Lili Wei, Tao Wang 0011, Yidong Li. Learning Diversified Primitive Prompts for Compositional Zero-Shot Learning
10437	--	10449	De Cheng, Lei Wei, Chaowei Fang, Lingfeng He, Nannan Wang 0001, Xinbo Gao 0001. Progressive Feature-Attribute Matching via Bi-Directional Generation for Transductive Zero-Shot Learning
10450	--	10464	Tong Shao, Zhuotao Tian, Jinghua Wang, Jingyong Su. BFRA: A Bi-Level Feature Relation Alignment Method for Cross-Domain Few-Shot Learning
10465	--	10479	Lei Li 0008, Quan Zhou, Dong Huang 0003, Zhaoqiang Xia. 3Former: A Cross-Image Information Interaction Network for Kinship Verification
10480	--	10492	Zhanglei Yang, Haipeng Li 0001, Shen Cheng, Mingbo Hong, Bing Zeng, Shuaicheng Liu. Multi-Frame Rolling Shutter Correction With Diffusion Models
10493	--	10499	Jiancong Chen, Meng Wang 0017, Peilin Chen 0001, Shiqi Wang 0001. Learning Spatio-Temporal Resolutions for Deep Video Compression
10500	--	10515	Linfeng Qi, Zhaoyang Jia, Jiahao Li 0001, Bin Li 0012, Houqiang Li, Yan Lu 0001. Generative Latent Coding for Ultra-Low Bitrate Image and Video Compression
10516	--	10529	Yao Li 0016, Zhuoyuan Li 0001, Dong Liu 0002, Li Li 0040. Frequency Domain Intra Pattern Copy for JPEG XS Screen Content Coding
10530	--	10543	Junwei Zhou 0002, Zhuang Ye, XiangBo Yi, Weijian Zhang, Qiuzhen Lin, Jianwen Xiang. DDVC: Deep Distributed Video Coding Using Quality Enhancement Network
10544	--	10556	Qian Yin 0002, Ruoke Yan, Xinfeng Zhang 0001, Siwei Ma. Prediction Enhancement for Point Cloud Attribute Compression Using Smoothing Filter
10557	--	10570	Qibing Qin, Yadong Huo, Wenfeng Zhang, Lei Huang 0010, Jie Nie. Deep Discriminative Boundary Hashing for Cross-Modal Retrieval
10571	--	10585	Xiangbo Yin, Jiangming Shi, Zhizhong Zhang 0001, Yuan Xie 0006, Yanyun Qu. Adaptive Pseudo-Label Purification and Debiasing for Unsupervised Visible-Infrared Person Re-Identification
10586	--	10598	Xuanang Yang, Jing Chen 0003, Yuqing Li, Kun He 0008, Xiaojie Huang, Zikuan Jiang, RuiYing Du, Hao Bai. Efficient Single-Server Private Inference Outsourcing for Convolutional Neural Networks
10599	--	10611	Le Mao, Yun Tan, Jiaohua Qin, Xuyu Xiang. CamStegNet: A Robust Image Steganography Method Based on Camouflage Model
10612	--	0	Yi Xiao 0003, Qiangqiang Yuan. Errata to "Local-Global Temporal Difference Learning for Satellite Video Super-Resolution"

3	--	18	Xijie Cheng, Xiaohui He 0001, Mengjia Qiao, Panle Li, Peng Chang, Tianhao Zhang, Xiaoyu Guo, Jinyong Wang, Zhihui Tian, Guangsheng Zhou. Multi-View Graph Convolutional Network With Spectral Component Decompose for Remote Sensing Images Classification
19	--	32	Junbin Zhuang 0001, Yan Zheng, Baolong Guo 0001, Yunyi Yan. Globally Deformable Information Selection Transformer for Underwater Image Enhancement
33	--	44	Jianan Li 0001, Xiaoying Yuan, Haolin Qin, Ying Wang 0064, Xincong Liu, Tingfa Xu. CVT-Track: Concentrating on Valid Tokens for One-Stream Tracking
45	--	61	Minglei Li 0002, Wushuang Gong, Pengfei Yan, Xiang Li 0084, Yuchen Jiang, Hao Luo 0003, Hang Zhou, Shen Yin. Joint Lesion Detection and Classification of Breast Ultrasound Video via a Clinical Knowledge-Aware Framework
62	--	74	Yihui Liang, Qian Fu, Kun Zou, Guisong Liu, Han Huang 0002. Enhancing Transparent Object Matting Using Predicted Definite Foreground and Background
75	--	90	Chunlei Wang, Wenquan Feng, Shuchang Lyu, Guangliang Cheng, Xiangtai Li, Binghao Liu, Qi Zhao 0001. A Masked Reference Token Supervision-Based Iterative Visual-Language Framework for Robust Visual Grounding
91	--	102	Jianjie Luo, Yehao Li, Yingwei Pan, Ting Yao, Jianlin Feng, Hongyang Chao, Tao Mei 0001. Exploring Vision-Language Foundation Model for Novel Object Captioning
103	--	117	Jiabing Xiong, Qiang Ling 0001. Mask-Guided Siamese Tracking With a Frequency-Spatial Hybrid Network
118	--	133	Qinglei Li, Qi Wang, Yongbin Qin, Xinyu Dong, Xingcai Wu, Shiming Chen 0002, Wu Liu, Yong-Jin Liu 0001, Jiebo Luo 0001. DRC: Discrete Representation Classifier With Salient Features via Fixed-Prototype
134	--	147	Pengxiang Li 0002, Chengtang Yao, Yunde Jia, Yuwei Wu 0001. Inter-Scale Similarity Guided Cost Aggregation for Stereo Matching
148	--	161	Xiao Wang 0014, Jiandong Jin, Chenglong Li 0002, Jin Tang 0001, Cheng Zhang 0010, Wei Wang 0115. Pedestrian Attribute Recognition via CLIP-Based Prompt Vision-Language Fusion
162	--	177	Zongyang Zhao, Jiehu Kang, Luyuan Feng, Jian Liang, Yuqi Ren, Bin Wu. LFA-Net: Enhanced PointNet and Assignable Weights Transformer Network for Partial-to-Partial Point Cloud Registration
178	--	194	Jiehua Zhang, Liang Li 0003, Chenggang Yan 0001, Wei Ke 0003, Yihong Gong. Monocular Depth Estimation on Adverse Weathers With Curriculum Domain Distribution Alignment
195	--	206	Junrui Xiao, Zhikai Li, Jianquan Li, Lianwei Yang, Qingyi Gu. BinaryViT: Toward Efficient and Accurate Binary Vision Transformers
207	--	218	Minjun Shen, Guobao Xiao, Changcai Yang, Junwen Guo, Lei Zhu 0002. CLG-Net: Rethinking Local and Global Perception in Lightweight Two-View Correspondence Learning
219	--	231	Zhuomin Liang, Liang Bai, Jinyu Fan, Xian Yang 0001, Jiye Liang. Contrastive Learning With Enhancing Detailed Information for Pre-Training Vision Transformer
232	--	244	Bo Liu, Chengrong Yang, Jing Guo, Yun Yang 0003. A Novel Semi-Supervised Object Detection Approach via Scale Rebalancing and Global Proposal Contrast Consistency
245	--	258	Yijin Yang, Xiaodong Gu 0001. Attention-Based Gating Network for Robust Segmentation Tracking
259	--	272	Zhuang Luo, Yang Xiao 0007, Feng Yang 0012, Joey Tianyi Zhou, Zhiwen Fang. Rhythmer: Ranking-Based Skill Assessment With Rhythm-Aware Transformer
273	--	286	Anjun Chen, Xiangyu Wang, Kun Shi 0003, Yuchi Huo, Jiming Chen 0001, Qi Ye. Toward Weather-Robust 3D Human Body Reconstruction: Millimeter-Wave Radar-Based Dataset, Benchmark, and Multi-Modal Fusion
287	--	299	Fei Wu 0001, Jun Yin, Xiaochuan Li, Jianfeng Wu, Da Jin, Jiamin Yang. CoNet: A Consistency-Oriented Network for Camouflaged Object Segmentation
300	--	314	Tongtong Yuan, Xuange Zhang, Bo Liu 0011, Kun Liu, Jian Jin, Zhenzhen Jiao. Surveillance Video-and-Language Understanding: From Small to Large Multimodal Models
315	--	328	Hao Liu, Yong Zhou 0003, Bing Liu 0016, Ming Yan 0007, Joey Tianyi Zhou. L2A: Learning Affinity From Attention for Weakly Supervised Continual Semantic Segmentation
329	--	342	Min Xie, Jieyu Zhao, Kedi Shen. A Novel SO(3) Rotational Equivariant Masked Autoencoder for 3D Mesh Object Analysis
343	--	356	Yuwen Pan, Rui Sun 0006, Yuan Wang, Wenfei Yang, Tianzhu Zhang, Yongdong Zhang 0001. Purify Then Guide: A Bi-Directional Bridge Network for Open-Vocabulary Semantic Segmentation
357	--	366	Shanaka Ramesh Gunasekara, Wanqing Li 0001, Jack Yang 0003, Philip O. Ogunbona. Asynchronous Joint-Based Temporal Pooling for Skeleton-Based Action Recognition
367	--	379	Peiyu Guan, Zhiqiang Cao, Shengxuan Fan, Yuequan Yang, Junzhi Yu, Shuo Wang 0001. Hardness-Aware Metric Learning With Cluster-Guided Attention for Visual Place Recognition
380	--	393	Jinfan Liu, Yichao Yan, Junjie Li, Weiming Zhao, Pengzhi Chu, Xingdong Sheng, Yunhui Liu 0006, Xiaokang Yang. IPAD: Industrial Process Anomaly Detection Dataset
394	--	404	Tianyu Sun, Dingchang Hu, Yixiang Dai, Guijin Wang. Diffusion-Based Depth Inpainting for Transparent and Reflective Objects
405	--	417	Xiaomin Li, Qinghe Wang, Dezhuang Li, Mengmeng Ge, Xu Jia 0012, You He, Huchuan Lu. MoBox: Enhancing Video Object Segmentation With Motion-Augmented Box Supervision
418	--	430	Kexing Ding, Ting Lu 0002, Wei Fu 0003, Leyuan Fang. Cross-Scene Hyperspectral Image Classification With Consistency-Aware Customized Learning
431	--	444	Pan Liu, Yuanyang Bu, Yong-Qiang Zhao 0001, Seong G. Kong. Enhancing Visual Data Completion With Pseudo Side Information Regularization
445	--	460	Fan Yang 0032, Sosuke Yamao, Ikuo Kusajima, Atsunori Moteki, Shoichi Masui, Shan Jiang 0006. YOWO: You Only Walk Once to Jointly Map an Indoor Scene and Register Ceiling-Mounted Cameras
461	--	476	HuaQing Hao, Weibin Liu, Weiwei Xing. Prior-Structure Driven Weakly-Supervised Learning for Fine-Grained Human Parsing
477	--	491	Ke Gu 0001, Hongyan Liu 0004, Yuchen Liu, Junfei Qiao 0001, Guangtao Zhai, Wenjun Zhang 0001. Perceptual Information Fidelity for Quality Estimation of Industrial Images
492	--	507	Linfeng Ma, Han Fang, Zehua Ma, Zhaoyang Jia, Weiming Zhang 0001, Nenghai Yu. C³shartMark: A Chart Watermarking Scheme With Consecutive-Encoding and Concurrent-Decoding
508	--	519	Jiawei Mao, Guangyi Zhao, Xuesong Yin, Yuanqi Chang. SwinStyleformer is a Favorable Choice for Image Inversion
520	--	533	Wenhao Xu, Changwei Wang 0001, Xuxiang Feng, Rongtao Xu, Longzhao Huang, Zherui Zhang, Li Guo 0004, Shibiao Xu. Generalization Boosted Adapter for Open-Vocabulary Segmentation
534	--	546	Weijia Wu 0001, Zhuang Li, Yuanqiang Cai, Hong Zhou, Mike Zheng Shou. A Bilingual, Open World Video Text Dataset and Real-Time Video Text Spotting With Contrastive Learning
547	--	560	Fan Yang, Binbin Liang, Wei Li 0075, Jianwei Zhang 0013. Multidimensional Fusion Network for Multispectral Object Detection
561	--	576	Yuxuan Gu, Yi Jin 0002, Ben Wang 0005, Zhixiang Wei, Xiaoxiao Ma 0006, Haoxuan Wang, Pengyang Ling, Huaian Chen, Enhong Chen. Seed Optimization With Frozen Generator for Superior Zero-Shot Low-Light Image Enhancement
577	--	588	Jiacheng Hou, Zhong Ji, Jinyu Yang, Feng Zheng. Bidirectional Error-Aware Fusion Network for Video Inpainting
589	--	600	Yongkang Zhang 0001, Han Zhang, Jun Li 0072, Zhiping Shi 0002, Jian Yang 0030, Kaixin Yang, Shuo Yin, Qiuyan Liang, Xianglong Liu 0001. Bullet-Screen-Emoji Attack With Temporal Difference Noise for Video Action Recognition
601	--	616	Yuanyuan Li, Zetian Mi, Yulin Wang, Shuaiyong Jiang, XianPing Fu. TAFormer: A Transmission-Aware Transformer for Underwater Image Enhancement
617	--	631	Junfei Shi, Shanshan Ji, Haiyan Jin, Junhuai Li, Maoguo Gong, Weisi Lin. Content-Adaptive Multi-Region Deep Network for Polarimetric SAR Image Classification
632	--	642	Kaihui Cheng, Chule Yang, Xiao Liu, Naiyang Guan, Zhiyuan Wang. LPN: Language-Guided Prototypical Network for Few-Shot Classification
643	--	656	Yu Xie, Lianhang Luo, Tianpei Cao, Bin Yu 0011, A. Kai Qin. Contrastive Learning Network for Unsupervised Graph Matching
657	--	669	Chen Yang 0020, Junxiao Wang, Huixiao Meng, Shuyuan Yang, Zhixi Feng. Negative Class Guided Spatial Consistency Network for Sparsely Supervised Semantic Segmentation of Remote Sensing Images
670	--	683	Chang Wan, Ming-Hsuan Yang 0001, Minglu Li 0001, Yunliang Jiang, Zhonglong Zheng. Nested Annealed Training Scheme for Generative Adversarial Networks
684	--	697	Xiao Jiang, Yiyuan Xie, Yushu Zhang 0001, Yichen Ye, Fang Xu, Lili Li, Ye Su, Zhuang Chen. Reversible Data Hiding in Encrypted Images Using Reservoir Computing-Based Data Fusion Strategy
698	--	712	Xueli Geng, Lingling Li 0002, Licheng Jiao, Xu Liu 0006, Fang Liu 0001, Shuyuan Yang. Knowledge-Aware Geometric Contourlet Semantic Learning for Hyperspectral Image Classification
713	--	727	Yaowu Fan, Jia Wan 0001, Andy J. Ma. Learning Crowd Scale and Distribution for Weakly Supervised Crowd Counting and Localization
728	--	740	Zhishe Wang, Zhuoqun Zhang, Wuqiang Qi, Fengbao Yang, Jiawei Xu 0004. FreqGAN: Infrared and Visible Image Fusion via Unified Frequency Adversarial Learning
741	--	753	Shi Chen, Lefei Zhang, Liangpei Zhang 0001. Cyclic Cross-Modality Interaction for Hyperspectral and Multispectral Image Fusion
754	--	768	Heqian Qiu, Lanxiao Wang, Taijin Zhao, Fanman Meng, Qingbo Wu 0001, Hongliang Li 0001. MCCE-REC: MLLM-Driven Cross-Modal Contrastive Entropy Model for Zero-Shot Referring Expression Comprehension
769	--	782	Bin Fan 0002, Ying Guo, Yuchao Dai, Chao Xu 0006, Boxin Shi. Self-Supervised Learning for Rolling Shutter Temporal Super-Resolution
783	--	799	Guanbo Wang, Haiyan Li, Victor S. Sheng, Yujun Ma, Hongwei Ding, Hongzhi Zhao. DPMNet: A Remote Sensing Forest Fire Real-Time Detection Network Driven by Dual Pathways and Multidimensional Interactions of Features
800	--	810	Lei Qi 0001, Dongjia Zhao, Yinghuan Shi, Xin Geng 0001. Patch-Aware Batch Normalization for Improving Cross-Domain Robustness
811	--	822	Yusong Hu, Zichen Liang, Xialei Liu, Qibin Hou, Ming-Ming Cheng. Reformulating Classification as Image-Class Matching for Class Incremental Learning
823	--	837	Wanyu Wu, Wei Wang 0170, Zheng Wang 0007, Kui Jiang, Zhengguo Li. For Overall Nighttime Visibility: Integrate Irregular Glow Removal With Glow-Aware Enhancement
838	--	856	Mingye Ju, Chunming He, Can Ding, Wenqi Ren, Lin Zhang 0014, Kai-Kuang Ma. All-Inclusive Image Enhancement for Degraded Images Exhibiting Low-Frequency Corruption
857	--	873	Yuxin Kong, Peng Yang 0004, Yan Cheng. Adaptive On-Device Model Update for Responsive Video Analytics in Adverse Environments
874	--	887	Bobiao Guo, Ping Ping, Junyuan Huo. CRDH: Compatible Reversible Data Hiding With High Capacity and Generalization
888	--	899	Zhiyuan Li, Yanhui Zhou, Hao Wei 0005, Chenyang Ge, Jingwen Jiang. Toward Extreme Image Compression With Latent Feature Guidance and Diffusion Prior
900	--	910	Yili Jin 0001, Xize Duan, Kaiyuan Hu, Fangxin Wang 0001, Xue Liu 0001. 3D Video Conferencing via On-Hand Devices
911	--	921	Wenhui Li 0001, Chao Pang, Weizhi Nie, Hongshuo Tian, An-An Liu. Bidirectional Mask Selection for Zero-Shot Referring Image Segmentation
922	--	937	Laijin Meng, Fan Li, Xinghao Jiang, Qiang Xu 0007. A Universal Framework for Improving the Robustness of Coverless Image Steganography Based on Image Restoration
938	--	952	Jia-Run Du, Jia-Chang Feng, Kun-Yu Lin, Fa-Ting Hong, Zhongang Qi, Ying Shan, Jian-Fang Hu, Wei-Shi Zheng 0001. Weakly-Supervised Temporal Action Localization by Progressive Complementary Learning
953	--	966	Kuiyuan Zhang, Zeming Hou, Zhongyun Hua, Yifeng Zheng, Leo Yu Zhang. Boosting Deepfake Detection Generalizability via Expansive Learning and Confidence Judgement
967	--	980	Jing Lian, Zhenghao Wang, Dongfang Yang, Wen Zheng, Linhui Li, Yibin Zhang. Pedestrian Facial Attention Detection Using Deep Fusion and Multi-Modal Fusion Classifier
981	--	985	Yaning Zhang, Yingqian Wang 0002, Tianhao Wu, Jungang Yang 0001, Wei An. Fixed Relative Pose Prior for Camera Array Self-Calibration

External Links

Journal: IEEE Trans. Circuits Syst. Video Techn.

Volume 35, Issue 9

Volume 35, Issue 8

Volume 35, Issue 7

Volume 35, Issue 6

Volume 35, Issue 5

Volume 35, Issue 4

Volume 35, Issue 3

Volume 35, Issue 2

Volume 35, Issue 12

Volume 35, Issue 11

Volume 35, Issue 10

Volume 35, Issue 1