IEEE International Conference on Multimedia and Expo, ICME 2023, Brisbane, Australia, July 10-14, 2023 - researchr publication

researchr

You are not signed in
Sign in
Sign up

IEEE International Conference on Multimedia and Expo, ICME 2023, Brisbane, Australia, July 10-14, 2023. IEEE, 2023. [doi]

Conference: icmcs2023

Abstract is missing.

Weakly Supervised Few-Shot and Zero-Shot Semantic Segmentation with Mean Instance Aware Prompt LearningPrashant Pandey 0002, Mustafa Chasmai, Monish Natarajan, Brejesh Lall. 1-6 [doi]

Ada-SwinBERT: Adaptive Token Selection for Efficient Video Captioning with Online Self-DistillationQianwen Cao, Heyan Huang, Minpeng Liao, Xianling Mao. 7-12 [doi]

A Retriever-Reader Framework with Visual Entity Linking for Knowledge-Based Visual Question AnsweringJiuxiang You, Zhenguo Yang, Qing Li 0001, Wenyin Liu. 13-18 [doi]

2S-DFN: Dual-semantic Decoding Fusion Networks for Fine-grained Image RecognitionPufen Zhang, Peng Shi, Song Zhang. 19-24 [doi]

MuDPT: Multi-modal Deep-symphysis Prompt Tuning for Large Pre-trained Vision-Language ModelsYongzhu Miao, Shasha Li, Jintao Tang, Ting Wang 0009. 25-30 [doi]

Action-GPT: Leveraging Large-scale Language Models for Improved and Generalized Action GenerationSai Shashank Kalakonda, Shubh Maheshwari, Ravi Kiran Sarvadevabhatla. 31-36 [doi]

Protecting Intellectual Property of EEG-based Model with WatermarkingTianhua Xu, Sheng-hua Zhong, Zhijiao Xiao. 37-42 [doi]

Making Adversarial Attack Imperceptible in Frequency Domain: A Watermark-based FrameworkHanxiu Zhang, Guitao Cao, Xinyue Zhang, Jing Xiang, Chunwei Wu. 43-48 [doi]

Content-adaptive Adversarial Embedding for Image Steganography Using Deep Reinforcement LearningJie Luo, Peisong He, Jiayong Liu, Hongxia Wang 0001, Chunwang Wu, Yijing Chen, Wanjie Li, Jiangchuan Li. 49-54 [doi]

A Robust Generative Image Steganography Method based on Guidance Features in Image SynthesisYouqiang Sun, Jianyi Liu, Ru Zhang. 55-60 [doi]

Adversarial Audio Watermarking: Embedding Watermark into Deep FeatureShiqiang Wu, Jie Liu 0028, Ying Huang, Hu Guan, Shuwu Zhang. 61-66 [doi]

Deniable Diffusion Generative SteganographyTengjun Liu, Ying Chen, Wanxuan Gu. 67-71 [doi]

Sea Surface Object Detection Based on Background Dynamic Perception and Cross-Layer Semantic InteractionSongbin Li, Xiangzhi Yang, Jingang Wang. 72-77 [doi]

Addressing Predicate Overlap in Scene Graph Generation with Semantic Granularity ControllerGuikun Chen, Lin Li, Yawei Luo, Jun Xiao. 78-83 [doi]

Towards Discriminative Semantic Relationship for Fine-grained Crowd CountingShiqi Ren, Chao Zhu 0003, Mengyin Liu, Xu-Cheng Yin. 84-89 [doi]

Region-Aware Semantic Consistency for Unsupervised Domain-Adaptive Semantic SegmentationJun Xie, Yixuan Zhou, Xing Xu 0001, Guoqing Wang, Fumin Shen, Yang Yang 0002. 90-95 [doi]

Deep Unsupervised Hashing with Selective Semantic MiningChuang Zhao, Hefei Ling, Yuxuan Shi, Chengxin Zhao, Jiazhong Chen, Qiang Cao. 96-101 [doi]

Boosting Interactive Image Segmentation by Exploiting Semantic CluesQiaoqiao Wei, Hui Zhang 0013, Jun-Hai Yong. 102-107 [doi]

Visual-Linguistic Alignment and Composition for Image Retrieval with Text FeedbackDafeng Li, Yingying Zhu. 108-113 [doi]

Scene Text Involved "Text"-to-Image Retrieval through Logically Hierarchical MatchingXinyu Zhou, Anna Zhu, Huen Chen, Wei Pan. 114-119 [doi]

Federating Hashing Networks Adaptively for Privacy-Preserving RetrievalYi Li, Meihua Yu, Xin Xie, Haiyan Fu, Hao He, Yanqing Guo. 120-125 [doi]

Deep Unsupervised Momentum Contrastive Hashing for Cross-modal RetrievalKangkang Lu, Yanhua Yu, MeiYu Liang, Min Zhang, Xiaowen Cao, Zehua Zhao, Mengran Yin, Zhe Xue. 126-131 [doi]

Uncertainty-Aware Cross-Modal Transfer Network for Sketch-Based 3D Shape RetrievalYiyang Cai, Jiaming Lu, Jiewen Wang, Shuang Liang. 132-137 [doi]

Scene Graph based Fusion Network for Image-Text RetrievalGuoliang Wang, Yanlei Shang, Yong Chen, Chaoqi Zhen, Dequan Cheng. 138-143 [doi]

Compact Intertemporal Coupling Network for Remote Sensing Change DetectionYuchao Feng, Honghui Xu, Jiawei Jiang, Jianwei Zheng 0001. 144-149 [doi]

Boundary-aware Shadow Detection via Mask Decoupling and Feature CorrectionJueyu Chen, Guanyu Xing, Jingwei Liao, Housheng Wei, Yanli Liu 0002. 150-155 [doi]

Explore Faster Localization Learning For Scene Text DetectionYuZhong Zhao, Yuanqiang Cai, Weijia Wu, Weiqiang Wang. 156-161 [doi]

Counterfactual Inference for Visual Relationship Detection in VideosXiaofeng Ji, Jin Chen, Xinxiao Wu. 162-167 [doi]

Body-Part Joint Detection and Association via Extended Object RepresentationHuayi Zhou, Fei Jiang, Hongtao Lu. 168-173 [doi]

Be-or-Not Prompt Enhanced Hard Negatives Generating For Memes Category DetectionJian Cui, Lin Li, Xiaohui Tao. 174-179 [doi]

Automatic Retinal Nerve Fiber Trajectory Simulation and Quasi-polar Transformation for Detecting Retinal Nerve Fiber Layer Defect in Fundus ImagesYanni Wang, Gang Yang 0001, Dayong Ding, Jianchun Zhao. 180-185 [doi]

GA-HQS: MRI reconstruction via a generically accelerated unfolding approachJiawei Jiang, Jiacheng Chen, Honghui Xu, Yuchao Feng, Jianwei Zheng 0001. 186-191 [doi]

Early Diagnosis of Alzheimer's Disease Based on Multimodal Hypergraph Attention NetworkYi Li, Baoyao Yang, Dan Pan 0001, An Zeng, Long Wu, Yang Yang. 192-197 [doi]

Score-based causal feature selection for cancer risk predictionShanshan Huang, Qingsong Li, Lei Wang 0001, Yuanhao Wang 0008, Li Liu 0002. 198-203 [doi]

A Dual-Path Supplemental Information Learning Architecture for Breast Cancer Ki-67 Status Prediction in T2w MRIWentian Cai, Yulin Cheng, Ying Gao 0004, Weixiao Liu, Xinyan Xie, Xiongwen Luo 0001, Weixian Yang, Zaiyi Liu, Changhong Liang. 210-215 [doi]

Expression-Guided Attention GAN for Fine-Grained Facial Expression EditingHui Zhang, Shiqi Shen, Jinhua Xu. 216-221 [doi]

RMES: Real-Time Micro-Expression Spotting Using Phase From Riesz PyramidYini Fang, Didan Deng, Liang Wu, Frederic Jumelle, Bertram E. Shi. 222-227 [doi]

AU-aware graph convolutional network for Macroand Micro-expression spottingShukang Yin, Shiwei Wu, Tong Xu 0001, Shifeng Liu, Sirui Zhao, Enhong Chen. 228-233 [doi]

Semi-Supervised Facial Expression Recognition by Exploring False Pseudo-LabelsHao Sun, Chenchen Pi, Wei Xie. 234-239 [doi]

CPNet: Exploiting CLIP-based Attention Condenser and Probability Map Guidance for High-fidelity Talking Face GenerationJingning Xu, Benlai Tang, Mingjie Wang, Minghao Li, Meirong Ma. 240-245 [doi]

ANYRES: Generating High-Resolution visible-face images from Low-Resolution thermal-face imagesDavid Anghelone, Sarah Lannes, Antitza Dantcheva. 246-251 [doi]

A Visually Interpretable Convolutional-Transformer Model for Assessing Depression from Facial ImagesYutong Li, Zhenyu Liu 0006, Gang Li, Qiongqiong Chen, Zhijie Ding, Xiping Hu 0001, Bin Hu 0001. 252-257 [doi]

FreConv: Frequency Branch-and-Integration Convolutional NetworksZhaowen Li, Xu Zhao, Peigeng Ding, Zongxing Gao, Yuting Yang, Ming Tang 0001, Jinqiao Wang. 258-263 [doi]

Class-aware Variational Auto-encoder for Open Set RecognitionRuofan Wang, Jiayu Guo, Rui-Wei Zhao, Ling Su, Yingzi Ye, Xiaobo Zhang, Yuejie Zhang, Rui Feng. 264-269 [doi]

Repnas: Searching for Efficient Re-Parameterizing BlocksMingyang Zhang 0007, Xinyi Yu, Jingtao Rong, Linlin Ou. 270-275 [doi]

Difference-Aware Iterative Reasoning Network for Key Relation DetectionBowen Zhao, Weidong Chen, Bo Hu, Hongtao Xie, Zhendong Mao. 276-281 [doi]

Injecting-Diffusion: Inject Domain-Independent Contents into Diffusion Models for Unpaired Image-to-Image TranslationLuying Li, Lizhuang Ma. 282-287 [doi]

Semi-Supervised Top-k Feature Selection with a General Optimization FrameworkLei Xu 0028, Rong Wang 0001, Feiping Nie 0001, Jun Wu, Xuelong Li 0001. 288-293 [doi]

Towards Boosting Black-Box Attack Via Sharpness-AwareYukun Zhang, Shengming Yuan, Jingkuan Song, Yixuan Zhou, Lin Zhang, Yulan He 0001. 294-299 [doi]

*Xiaolin Zhai, Zhengxi Hu, Dingye Yang, Shichao Wu, Jingtai Liu. 300-305 [doi]

SAFE: Simultaneous Alignment of Features and Predictions for Dense Object DetectorsXuesong Guo, Shuo Wang, Jiahao Chang, Zehui Chen, Feng Zhao 0004. 306-311 [doi]

MSG-CAM:Multi-scale inputs make a better visual interpretation of CNN networksXiaohong Xiang, Fuyuan Zhang, Xin Deng 0003, Ke Hu. 312-317 [doi]

Personalization Disentanglement for Federated LearningPeng Yan, Guodong Long. 318-323 [doi]

Fairness-Aware Client Selection for Federated LearningYuxin Shi, Zelei Liu, Zhuan Shi, Han Yu 0001. 324-329 [doi]

Utility-Maximizing Bidding Strategy for Data Consumers in Auction-Based Federated LearningXiaoli Tang, Han Yu. 330-335 [doi]

Federated Learning for Personalized Image Aesthetics AssessmentZhiwei Xiong, Han Yu 0001, Zhiqi Shen 0001. 336-341 [doi]

Decentralized Federated Learning Via Mutual Knowledge DistillationYue Huang, Lanju Kong, Qingzhong Li, Baochen Zhang. 342-347 [doi]

Fedward: Flexible Federated Backdoor Defense Framework with Non-IID DataZekai Chen, Fuyi Wang, Zhiwei Zheng, Ximeng Liu, Yujie Lin. 348-353 [doi]

Contrastive Fusion Representation: Mitigating Adversarial Attacks on VQA ModelsJialing He, Zhen Qin, Hangcheng Liu, Shangwei Guo, Biwen Chen, Ning Wang, Tao Xiang. 354-359 [doi]

Improving Point Cloud Quality Metrics with Noticeable Possibility MapsZhengyu Wang, Yujie Zhang, Qi Yang, Yiling Xu, Yifei Zhou, Jun Sun 0005, Shan Liu 0001. 360-365 [doi]

Exploring Opinion-Unaware Video Quality Assessment with Semantic Affinity CriterionHaoning Wu, Liang Liao, Jingwen Hou, Chaofeng Chen, Erli Zhang, Annan Wang, Wenxiu Sun, Qiong Yan, Weisi Lin. 366-371 [doi]

Just Noticeable Difference Estimation for Screen Content Images: A Content Uncertainty-guided ApproachLirong Huang, Rong Zhang, Miaohui Wang. 372-377 [doi]

Intermediate-Task Learning with Pretrained Model for Synthesized Speech MOS PredictionHui Wang, Xiguang Zheng, Yong Qin. 378-383 [doi]

Cross-Modal-Aware Representation Learning with Syntactic Hypergraph Convolutional Network for VideoQAZenan Xu, Wanjun Zhong, Qinliang Su, Fuwei Zhang. 384-389 [doi]

SASFormer: Transformers for Sparsely Annotated Semantic SegmentationHui Su, Yue Ye, Wei Hua, Lechao Cheng, Mingli Song. 390-395 [doi]

Holistic Weighted Distillation for Semantic SegmentationWujie Sun, Defang Chen 0001, Can Wang 0001, Deshi Ye, Yan Feng, Chun Chen 0001. 396-401 [doi]

Knowledge Distillation from 3D to Bird's-Eye-View for LiDAR Semantic SegmentationFeng Jiang, Heng Gao, Shoumeng Qiu, Haiqiang Zhang, Ru Wan, Jian Pu. 402-407 [doi]

A Pseudo-Dual Self-Rectification Framework for Semantic SegmentationHuazheng Hao, Hui Xiao, Li Dong 0006, Diqun Yan, Dongtai Liang, Jiayan Zhuang, Chengbin Peng. 408-413 [doi]

Dual-level Consistency Learning for Unsupervised Domain Adaptive Night-time Semantic SegmentationFeifei Ding, Jianjun Li, Wanyong Tian. 420-425 [doi]

Modality-Fusion Spiking Transformer Network for Audio-Visual Zero-Shot LearningWenrui Li, Zhengyu Ma, Liang-Jian Deng, Hengyu Man, Xiaopeng Fan. 426-431 [doi]

Privacy-Enhanced Zero-Shot Learning via Data-Free Knowledge TransferRui Gao, Fan Wan, Daniel Organisciak, Jiyao Pu, Haoran Duan, Peng Zhang 0058, Xingsong Hou, Yang Long 0001. 432-437 [doi]

Swap-Reconstruction Autoencoder for Compositional Zero-Shot LearningTing Guo, Jiye Liang, Guo-Sen Xie. 438-443 [doi]

Synthetic Feature Assessment for Zero-Shot Object DetectionXinmiao Dai, Chong Wang, Haohe Li, Sunqi Lin, Li Dong, Jiafei Wu, Jun Wang. 444-449 [doi]

Audio-Visual Generalized Zero-Shot Learning Based on Variational Information BottleneckYapeng Li, Yong Luo 0002, Bo Du 0001. 450-455 [doi]

Fine-grained Primitive Representation Learning for Compositional Zero-shot ClassificationHan Jiang, Xiaoshan Yang, Chaofan Chen, Changsheng Xu. 456-461 [doi]

Medical Image Super-Resolution via Diagnosis-Guided AttentionJingwei Wang, Peng Zhou 0006, Xianjun Han, Yanming Chen 0002. 462-467 [doi]

Denser is Better:cost distribution super-resolution network for more accurate sub-pixel disparityHong Zhang, Shenglun Chen, Zhihui Wang, Haojie Li, Wanli Ouyang. 468-473 [doi]

DSP-Net: Diverse Structure Prior Network for Image InpaintingLin Sun, Chao Yang, Bin Jiang 0006. 474-479 [doi]

Joint Feature Aggregation for Stereo Image Super-resolutionZekun Ai, Xiaotong Luo, Yanyun Qu. 480-485 [doi]

Joint Super-Resolution and Classification Based on Bidirectional Mapping and Multiple ConstraintsZijian Yuan, Kan Chang, Zhiquan Liu, Xinjie Wei, Boning Chen. 486-491 [doi]

Inpainting of Remote Sensing Sea Surface Temperature image with Multi-scale Physical ConstraintsQichen Wei, Zijie Zuo, Jie Nie, Jiahao Du, Yaning Diao, Min Ye, Xinyue Liang. 492-497 [doi]

ICANet: A Lightweight Increasing Context Aided Network for Real-Time Image Semantic SegmentationLei Chen, Huhe Dai, Yuan Zheng. 492-497 [doi]

Generalized Compressed Video Restoration by Multi-Scale Temporal Fusion and Hierarchical Quality Score EstimationZhijie Huang, Tianyi Sun, Xiaopeng Guo, Yanze Wang, Jun Sun 0012. 498-503 [doi]

Edgeformer: Edge-Enhanced Transformer for High-Quality Image DeblurringYuan Zou, Yinyao Ma. 504-509 [doi]

Generative Iris Prior Embedded Transformer for Iris RestorationYubo Huang, Jia Wang, Peipei Li, Liuyu Xiang, Peigang Li, Zhaofeng He. 510-515 [doi]

MBDFNet: Multi-scale Bidirectional Dynamic Feature Fusion Network for Efficient Image DeblurringZhongbao Yang, Jinshan Pan. 522-527 [doi]

Multiple degraded image restoration via degradation history estimationMinhua Liu, Yuanman Li, Rongqin Liang, Jiaxiang You, Xia Li. 528-533 [doi]

Gradual Migration and Style Consistency for Unsupervised Domain AdaptationJintao Zhang, Guangyi Xiao. 534-539 [doi]

Adapt then Generalize: A Simple Two-Stage Framework for Semi-Supervised Domain GeneralizationHan Xie, Zhifeng Shen, Shicai Yang, Weijie Chen, Luojun Lin. 540-545 [doi]

Rethinking Overfitting of Multiple Instance Learning for Whole Slide Image ClassificationHongjian Song, Jie Tang 0002, Hongzhao Xiao, Juncheng Hu. 546-551 [doi]

A Unified MRC Framework with Multi-Query for Multi-modal Relation Triplets ExtractionQiang Chen, Dong Zhang, Shoushan Li, Guodong Zhou. 552-557 [doi]

Feature Bias Correction: A Feature Augmentation Method for Long-tailed RecognitionJiaxin Yang, Xiaofei Li, Jun Zhang, Shuohao Li. 558-563 [doi]

Recombination Samples Training for Robust Natural Language Visual ReasoningYuling Jiang, Yingyuan Zhao, Bing-Kun Bao. 564-569 [doi]

SG-NeRF: Semantic-guided Point-based Neural Radiance FieldsYansong Qu, Yuze Wang, Yue Qi. 570-575 [doi]

RTMC: A Rubost Trusted Multi-View Classification FrameworkHai Zhou, Zhe Xue, Ying Liu, Boang Li, Junping Du, MeiYu Liang. 576-581 [doi]

DF-CLIP: Towards Disentangled and Fine-grained Image Editing from TextXinjiao Zhou, Bin Jiang, Chao Yang, Haotian Hu, Xiaofei Huo. 582-587 [doi]

Letter Embedding Guidance Diffusion Model for Scene Text EditingChangshuo Wang, Lei Wu 0002, Xu Chen, Xiang Li, Lei Meng, Xiangxu Meng. 588-593 [doi]

Cluster-driven GNN-based Federated Recommendation with Biased Message DropoutRongyu Zhang, Yun Chen, Chenrui Wu, Fangxin Wang 0001. 594-599 [doi]

SQT: Debiased Visual Question Answering via Shuffling Question TypesTianyu Huai, Shuwen Yang, Junhang Zhang, Guoan Wang, Xinru Yu, Tianlong Ma, Liang He 0001. 600-605 [doi]

Fast Personalized Human Activity Recognition on Heuristic Parameter EstimationShizhuo Deng, Chuangui Yang, Zhubao Guo, Boqian Lin, Dongyue Chen, Tong Jia, Botao Wang. 606-611 [doi]

Improving Automatic Singing Skill Evaluation with Timbral Features, Attention, and Singing Voice SeparationYaolong Ju, Chunyang Xu, Yichen Guo, Jinhu Li, Simon Lui. 612-617 [doi]

Learning High Frequency Surface Functions In ShellsHan Guo, Yuanlong Yu, Yujie Wang, Xuelin Chen, Yixin Zhuang. 618-623 [doi]

Multi-template Tracker Driven by Cache Manager Algorithm, Towards Multi-distractor ScenariosEli Lei, Jia Shao, Youfa Liu, Bo Du 0001. 624-629 [doi]

Material-Aware Self-Supervised Network for Dynamic 3D Garment SimulationAoran Liu, Kun Hu, Wenxi Yue, Qiuxia Wu, Zhiyong Wang. 630-635 [doi]

Multi-speaker Direction of Arrival Estimation Using Audio and Visual Modalities with Convolutional Neural NetworkYulin Wu, Ruimin Hu, Xiaochen Wang. 636-641 [doi]

Multi-Scale Hybrid Fusion Network for Mandarin Audio-Visual Speech RecognitionJinxin Wang, Zhongwen Guo, Chao Yang, Xiaomei Li, Ziyuan Cui. 642-647 [doi]

Cross-Training with Prototypical Distillation for improving the generalization of Federated LearningTianhan Liu, Zhuang Qi, Zitan Chen, Xiangxu Meng, Lei Meng. 648-653 [doi]

A Content-based Viewport Prediction Framework for 360° Video Using Personalized Federated Learning and Fusion TechniquesMehdi Setayesh, Vincent W. S. Wong 0001. 654-659 [doi]

Learning Cautiously in Federated Learning with Noisy and Heterogeneous ClientsChenrui Wu, Zexi Li, Fangxin Wang 0001, Chao Wu. 660-665 [doi]

Multi-Tier Client Selection for Mobile Federated Learning NetworksYulan Gao, Yansong Zhao, Han Yu 0001. 666-671 [doi]

SWATM: Contribution-Aware Adaptive Federated Learning Framework Based on Augmented Shapley ValuesChengyi Yang, Zhaoxiang Hou, Sheng Guo, Hui Chen, Zengxiang Li. 672-677 [doi]

FedDBM: Federated Digital Biomarker for Detecting Parkinson's Disease ProgressYiqiang Chen, Xiaodong Yang 0005, Yuting He, Chunyan Miao, Piu Chan. 678-683 [doi]

MIXLIC: Mixing Global and Local Context Model for learned Image CompressionHaihang Ruan, Feng Wang, Tongda Xu, Zhiyong Tan, Yan Wang. 684-689 [doi]

Model-Driven Compression for Digital Human Using Multi-Granularity RepresentationsRuoke Yan, Qian Yin, Xinfeng Zhang 0001, Siwei Ma. 690-695 [doi]

Meta-ILF: In-Loop Filter with Customized Weights For VVC Intra CodingHengyu Man, Xingtao Wang, Riyu Lu, Xiaopeng Fan. 696-701 [doi]

Variable-Rate Neural Image Compression with Joint Content-Channel Features and Accurate R-λ ModelYunhui Shi, Pengquan Wang, Jin Wang, Baocai Yin, Nam Ling. 702-707 [doi]

Peer Upsampled Transform Domain Prediction for G-PCCWenyi Wang, Yingzhan Xu, Kai Zhang 0007, Li Zhang. 708-713 [doi]

Optimizing DNN based quality assessment metric for image compression: A novel rate control methodQiuyue Fang, Tao Xu, Lai Jiang, Shengxi Li, Mai Xu, Yunjin Chen, Leonid Sigal. 714-719 [doi]

Dual-Expert Distillation Network for Few-Shot SegmentationJunhang Zhang, Zisong Zhuang, Luwei Xiao, Xingjiao Wu, Tianlong Ma, Liang He 0001. 720-725 [doi]

Rethinking Self-Supervision for Few-Shot Class-Incremental LearningLinglan Zhao, Jing Lu 0004, Zhanzhan Cheng, Duo Liu, Xiangzhong Fang. 726-731 [doi]

Learning Component-Level and Inter-Class Glyph Representation for few-shot Font GenerationYongliang Su, Xu Chen, Lei Wu 0002, Xiangxu Meng. 738-743 [doi]

Masked Cross-image Encoding for Few-shot SegmentationWenbo Xu 0004, Huaxi Huang, Ming Cheng, Litao Yu, Qiang Wu 0001, Jian Zhang. 744-749 [doi]

Frame-Level Embedding Learning for Few-shot Bioacoustic Event DetectionXueyang Zhang, Shuxian Wang, Jun Du, Genwei Yan, Jigang Tang, Tian Gao, Xin Fang, Jia Pan, Jianqing Gao. 750-755 [doi]

End-To-End Part-Level Action Parsing With TransformerXiaojia Chen, Xuanhan Wang, Beitao Chen, Lianli Gao. 756-761 [doi]

Leveraging Attribute Knowledge for Open-set Action RecognitionKaixiang Yang, Junyu Gao, Yangbo Feng, Changsheng Xu. 762-767 [doi]

ConCAP: Contrastive Context-Aware Prompt for Resource-hungry Action RecognitionHailun Zhang, Ziyun Zeng, Qijun Zhao, Zhen Zhai. 768-773 [doi]

Is Really Correlation Information Represented Well in Self-Attention for Skeleton-based Action Recognition?Wentian Xin, Hongkai Lin, Ruyi Liu, Yi Liu, Qiguang Miao. 780-785 [doi]

DD-GCN: Directed Diffusion Graph Convolutional Network for Skeleton-based Human Action RecognitionChang Li, Qian Huang, Yingchi Mao. 786-791 [doi]

Improving CTC-based Handwritten Chinese Text Recognition with Cross-Modality Knowledge Distillation and Feature AggregationShilian Wu, Yongrui Li, Zengfu Wang. 792-797 [doi]

Decoupled Mutual Distillation for Incremental Object DetectionGao-Dong Liu, Wan-Lei Zhao, Jie Zhao. 798-803 [doi]

Accelerating Diffusion Sampling with Classifier-based Feature DistillationWujie Sun, Defang Chen 0001, Can Wang 0001, Deshi Ye, Yan Feng, Chun Chen 0001. 810-815 [doi]

Semantic Stage-Wise Learning for Knowledge DistillationDongqin Liu, Wentao Li, Wei Zhou 0019, Zhaoxing Li, Jiao Dai, Jizhong Han, Ruixuan Li 0001, Songlin Hu. 816-821 [doi]

Discriminative Gradient Adjustment with Coupled Knowledge Distillation for Class Incremental LearningHao Zhang, Yanxu Hu, Jiawen Peng, Andy J. Ma. 822-827 [doi]

SACANet: scene-aware class attention network for semantic segmentation of remote sensing imagesXiaowen Ma, Rui Che, Tingfeng Hong, Mengting Ma, Ziyan Zhao, Tian Feng, Wei Zhang. 828-833 [doi]

Few-shot Semantic Segmentation by Exploiting Dynamic and Regional ContextsHongyu Gu, Yunzhi Zhuge, Lu Zhang, Jinqing Qi, Huchuan Lu. 834-839 [doi]

DiST-GAN: Distillation-based Semantic Transfer for Text-Guided Face GenerationGuoxing Yang, Feifei Fu, Nanyi Fei, Haoran Wu, Ruitao Ma, Zhiwu Lu 0001. 840-845 [doi]

Self-Attention Prediction Correction with Channel Suppression for Weakly-Supervised Semantic SegmentationGuoying Sun, Meng Yang 0001. 846-851 [doi]

Semi-Supervised Semantic Segmentation With Region RelevanceRui Chen, Tao Chen 0012, Qiong Wang 0003, Yazhou Yao. 852-857 [doi]

Who, What and Where: Composite-semantic Instance Search for Story VideosJiahao Guo, Chao Liang, Zhongyuan Wang 0001. 858-863 [doi]

Semantic Embedding Uncertainty Learning for Image and Text MatchingYan Wang, Yu-Ting Su 0001, Wenhui Li 0001, Chenggang Yan 0001, Bolun Zheng, Xuanya Li, An-An Liu. 864-869 [doi]

Multi-view Network Embedding with Structure and Semantic Contrastive LearningYifan Shang, Xiucai Ye, Tetsuya Sakurai. 870-875 [doi]

A Self-Training Framework Based on Multi-Scale Attention Fusion for Weakly Supervised Semantic SegmentationGuoqing Yang, Chuang Zhu, Yu Zhang. 876-881 [doi]

Depth and DOF Cues Make A Better Defocus Blur DetectorYuxin Jin, Ming Qian, Jincheng Xiong, Nan Xue 0001, Gui-Song Xia. 882-887 [doi]

Explainable Unfolding Network For Joint Edge-Preserving Depth Map Super-ResolutionJialong Zhang, Lijun Zhao 0002, Jinjing Zhang, Ke Wang, Anhong Wang. 888-893 [doi]

Robust 3D Craniofacial Landmarks Localization by An End-to-End Regression NetworkXianhe Jiao, Junli Zhao, Chenlei Lv, Fuqing Duan, Zhenkuan Pan 0001, Xin Li 0003. 900-905 [doi]

Twins-Mix: Self Mixing in Latent Space for Reasonable Data Augmentation of 3D Computer-Aided Design Generative ModelingXueyang Li, Minyang Xu, Xiangdong Zhou. 906-911 [doi]

Rendering and Reconstruction Based 3D Portrait StylizationShaoxu Li, Ye Pan. 912-917 [doi]

GT-Net: Variational Autoencoder Networks based on Graph Transformer for 3D Shape LearningZhenjiang Du, Yi Lu, Guan Wang, Ning Xie 0003, Yang Yang. 918-923 [doi]

M-GCN: Multi-scale Graph Convolutional Network for 3D Point Cloud ClassificationJing Hu, Xincheng Wang, Ziheng Liao, Tingsong Xiao. 924-929 [doi]

A Lightweight Grouped Low-rank Tensor Approximation Network for 3D Mesh Reconstruction From VideosBoyang Zhang, Suping Wu, Leyang Yang, Bin Wang, Wenlong Lu. 930-935 [doi]

Hierarchical Attention Learning for Multimodal ClassificationXin Zou, Chang Tang, Wei Zhang 0049, Kun Sun 0002, Liangxiao Jiang. 936-941 [doi]

An End-to-End Food Portion Estimation Framework Based on Shape Reconstruction from Monocular ImageZeman Shao, Gautham Vinod, Jiangpeng He, Fengqing Zhu 0001. 942-947 [doi]

Unsupervised Domain Adaptation for Neuron Membrane Segmentation based on Structural FeaturesYuxiang An, Dongnan Liu, Weidong Cai 0001. 948-953 [doi]

Latent Feature Regularization based Adversarial Network for Brain Tumor Anomaly DetectionNan Wang, Chengwei Chen, Lizhuang Ma, Shaohui Lin. 954-959 [doi]

Development of Deep Learning Algorithms for Automated Scoliosis and Abnormal Posture Screening Using 2D Back ImageZhenda Xu, Jiahao Hu, Qiang Gao, Donghua Hang, Qihua Zhou, Song Guo 0001, Aiqian Gan. 960-965 [doi]

LACL: Lesion-Aware Contrastive Learning Framework for Medical Image ClassificationYu Tang, Gang Yang 0001, Jianchun Zhao, Dayong Ding, Jun Wu. 966-971 [doi]

Collaborative Edge Caching: a Meta Reinforcement Learning Approach with Edge SamplingYinan Mao, Bowei He, Shiji Zhou, Chen Ma 0001, Zhi Wang 0001. 972-977 [doi]

PACC: Perception Aware Congestion Control for Real-time CommunicationFeng Peng, Bingcong Lu, Li Song 0001, Rong Xie, Yanmei Liu, Ying Chen. 978-983 [doi]

Label-Semantic-Enhanced Online Hashing for Efficient Cross-modal RetrievalXueting Jiang, Xin Liu 0011, Yiu-ming Cheung, Xing Xu 0001, Shu-Kai Zheng, Taihao Li. 984-989 [doi]

QoE Maximization for Aerial Video Streaming with Multiple Cellular Connected UAVsCheng Zhan, Huan Yan, Han Hu 0003, LiYue Zhu, Shubin Xu. 990-995 [doi]

Multi-stream Adaptive Offloading of Joint Compressed Video Streams, Feature Streams, and Semantic Streams in Edge Computing SystemsDieli Hu, Wen Ji, Zhi Wang. 996-1001 [doi]

L4S Congestion Control Algorithm for Interactive Low Latency Applications over 5GJangWoo Son, Yago Sanchez, Christian Hampe, Dominik Schnieders, Thomas Schierl, Cornelius Hellge. 1002-1007 [doi]

Weakly-supervised Temporal Action Localization with Adaptive Clustering and Refining NetworkHao Ren, Wu Ran, Xingson Liu, Haoran Ren, Hong Lu 0001, Rui Zhang, Cheng Jin. 1008-1013 [doi]

Do We Really Need Temporal Convolutions in Action Segmentation?Dazhao Du, Bing Su, Yu Li 0003, Zhongang Qi, Lingyu Si, Ying Shan. 1014-1019 [doi]

ELAN: Enhancing Temporal Action Detection with Location AwarenessGuo Chen, Yin-Dong Zheng, Zhe Chen, Jiahao Wang, Tong Lu. 1020-1025 [doi]

MRSN: Multi-Relation Support Network for Video Action DetectionYin-Dong Zheng, Guo Chen, Minglei Yuan, Tong Lu. 1026-1031 [doi]

Unleashing the Potential of Adjacent Snippets for Weakly-supervised Temporal Action LocalizationQinying Liu, Zilei Wang, Ruoxi Chen, Zhilin Li. 1032-1037 [doi]

Compositional Learning in Transformer-Based Human-Object Interaction DetectionZikun Zhuang, Ruihao Qian, Chi Xie, Shuang Liang. 1038-1043 [doi]

Self-supervised Cross-stage Regional Contrastive Learning for Object DetectionJunkai Yan, Lingxiao Yang, Yipeng Gao, Wei-Shi Zheng 0001. 1044-1049 [doi]

Hierarchical and Contrastive Representation Learning for Knowledge-Aware RecommendationBingchao Wu, Yangyuxuan Kang, Daoguang Zan, Bei Guan, Yongji Wang 0002. 1050-1055 [doi]

Colo-SCRL: Self-Supervised Contrastive Representation Learning for Colonoscopic Video RetrievalQingzhong Chen, Shilun Cai, Crystal Cai, Zefang Yu, Dahong Qian, Suncheng Xiang. 1056-1061 [doi]

Establishing a Stronger Baseline for Lightweight Contrastive ModelsWenye Lin, Yifeng Ding, Zhixiong Cao, Hai-Tao Zheng 0002. 1062-1067 [doi]

Graph Information Interaction on Feature and Structure via Cross-modal Contrastive LearningJinyong Wen, Yuhu Wang, Chunxia Zhang 0001, Shiming Xiang, Chunhong Pan. 1068-1073 [doi]

Discriminative and Contrastive Consistency for Semi-supervised Domain Adaptive Image ClassificationYidan Fan, Wenhuan Lu, Yahong Han. 1074-1079 [doi]

CoverHunter: Cover Song Identification with Refined Attention and AlignmentsFeng Liu, Deyi Tuo, Yinan Xu, Xintong Han. 1080-1085 [doi]

Exploring Pre-Trained Neural Audio Representations for Audio Topic SegmentationIacopo Ghinassi, Matthew Purver, Huy Phan, Chris Newell. 1086-1091 [doi]

A High-Quality Melody-Aware Peking Opera Synthesizer Using Data AugmentationXun Zhou, Wujin Sun, Xiaodong Shi. 1092-1097 [doi]

LC-Beating: An Online System for Beat and Downbeat Tracking using Latency-Controlled MechanismXinlu Liu, Jiale Qian, Qiqi He, Yi Yu 0001, Wei Li 0012. 1098-1103 [doi]

Improving Domain Generalization for Sound Classification with Sparse Frequency-Regularized TransformerHonglin Mu, Wentian Xia, Wanxiang Che. 1104-1108 [doi]

MFAE: Masked frame-level autoencoder with hybrid-supervision for low-resource music transcriptionYulun Wu, Jiahao Zhao, Yi Yu 0001, Wei Li 0012. 1109-1114 [doi]

Self-Supervised Implicit 3D Reconstruction via RGB-D ScansHongji Yang, Jiao Liu, Shaoping Lu, Bo Ren. 1115-1120 [doi]

Object-Aware Calibrated Depth-Guided Transformer for RGB-D Co-Salient Object DetectionYang Wu, Lingyan Liang, Yaqian Zhao, Kaihua Zhang. 1121-1126 [doi]

A Two-stage hybrid CNN-Transformer Network for RGB Guided Indoor Depth CompletionYufan Deng, Xin Deng 0002, Mai Xu. 1127-1132 [doi]

Feature Decoupling and Uncertainty Estimation for 3D Object DetectionPeiyuan Zhi, Kaiyue Zhou, Yali Li 0001, Shengjin Wang. 1133-1138 [doi]

Scene Graph Generation using Depth-based Multimodal NetworkLianggangxu Chen, Jiale Lu, Changbo Wang, Gaoqi He. 1139-1144 [doi]

Multi-View Token Clustering and Fusion for 3D Object Recognition and RetrievalLinlong Fan, Yanqi Ge, Wen Li, Lixin Duan. 1145-1150 [doi]

Local Consensus Transformer for Correspondence LearningGang Wang 0008, Yufei Chen. 1151-1156 [doi]

Preserving Locality in Vision Transformers for Class Incremental LearningBowen Zheng, Da-Wei Zhou 0001, Han-Jia Ye, De-Chuan Zhan. 1157-1162 [doi]

MTNet: Learning Modality-aware Representation with Transformer for RGBT TrackingRuichao Hou, Boyue Xu, Tongwei Ren, Gangshan Wu. 1163-1168 [doi]

Adaptive Split-Fusion TransformerZixuan Su, Jingjing Chen, Lei Pang, Chong-Wah Ngo, Yu-Gang Jiang. 1169-1174 [doi]

GSFormer: Geometric-Spatial Transformer on Point Cloud CompletionYijun Long, Zhaoyu Chen, Hong Lu 0001, Wenqiang Zhang. 1175-1180 [doi]

SDGFormer: An Efficient Convolution Network Structurally Similar to TransformerChaohao Wen, Xun Gong. 1181-1186 [doi]

General GAN-generated Image Detection by Data Augmentation in Fingerprint DomainHuaming Wang, Jianwei Fei, Yunshu Dai, Lingyun Leng, Zhihua Xia. 1187-1192 [doi]

Image Protection for Robust Cropping Localization and RecoveryQichao Ying, Hang Zhou 0007, Xiaoxiao Hu, Zhenxing Qian, Sheng Li 0006, Xinpeng Zhang 0001. 1193-1198 [doi]

Towards Diverse Liveness Feature Representation and Domain Expansion for Cross-Domain Face Anti-SpoofingPei-Kai Huang, Jun-Xiong Chong, Hui-Yu Ni, Tzu-Hsien Chen, Chiou-Ting Hsu. 1199-1204 [doi]

Joint Statistical and Causal Feature Modulated Face Anti-SpoofingXin Dong, Tao Wang, Zhendong Li, Hao Liu. 1205-1210 [doi]

Watermarks for Generative Adversarial Network Based on Steganographic Invisible BackdoorYuwei Zeng, Jingxuan Tan, Zhengxin You, Zhenxing Qian, Xinpeng Zhang 0001. 1211-1216 [doi]

Promoting adversarial transferability with enhanced loss flatnessYan Fang, Zhongyuan Wang 0001, Jikang Cheng, Ruoxi Wang, Chao Liang. 1217-1222 [doi]

Face Poison: Obstructing DeepFakes by Disrupting Face DetectionYuezun Li, Jiaran Zhou, Siwei Lyu. 1223-1228 [doi]

ABTD-Net: Autonomous Baggage Threat Detection Networks for X-ray ImagesWen Liu, Degang Sun, Yan Wang, Zhongyuan Chen, Xinbo Han, Haitian Yang. 1229-1234 [doi]

An Explainable Multi-view Semantic Fusion Model for Multimodal Fake News DetectionZhi Zeng, Mingmin Wu, Guodong Li, Xiang Li, Zhongqiang Huang, Ying Sha. 1235-1240 [doi]

Improving CoatNet for Spatial and JPEG Domain SteganalysisHao Li, Xiangyang Luo, Yi Zhang. 1241-1246 [doi]

Image Super-Resolution with Implicit Texture Pattern ModulationShuai Hao, Jialin Yang, Xu Jia, You He, Huchuan Lu. 1247-1252 [doi]

Towards Efficient Large Mask Inpainting via Knowledge TransferFeihong Qin, Liyan Zhang. 1253-1258 [doi]

Structure First Detail Next: Image Inpainting with Pyramid GeneratorShuyi Qu, Zhenxing Niu, Jianke Zhu, Bin Dong, Kaizhu Huang. 1265-1270 [doi]

Learning a Multilevel Cooperative View Reconstruction Network for Light Field Angular Super-ResolutionDeyang Liu, Yifan Mao, Xiaofei Zhou, Ping An, Yuming Fang. 1271-1276 [doi]

NLCUnet: Single-Image Super-Resolution Network with Hairline DetailsJiancong Feng, Yuan-Gen Wang, Fengchuang Xing. 1277-1282 [doi]

An Order-Complexity Model for Aesthetic Quality Assessment of Symbolic Homophony Music ScoresXin Jin, Wu Zhou, Jinyu Wang, Duo Xu, Yiqing Rong, Shuai Cui. 1289-1294 [doi]

Collaborative Auto-encoding for Blind Image Quality AssessmentZehong Zhou, Fei Zhou 0001, Guoping Qiu. 1295-1300 [doi]

No Reference Image Quality Assessment Via Quality Difference LearningJiaMing Xie, Yu Luo 0004, Jie Ling 0002, Guanghui Yue 0001. 1301-1306 [doi]

Low-Light Image Enhancement by Learning Contrastive Representations in Spatial and Frequency DomainsYi Huang, Xiaoguang Tu, Gui Fu, Tingting Liu, Bokai Liu, Ming Yang, Ziliang Feng. 1307-1312 [doi]

*Lanxin Zhao, Dengshi Li, Jing Xiao 0004, Chenyi Zhu. 1313-1318 [doi]

Image Template Matching via Dense and Consistent Contrastive LearningBo Li, Lin Yuanbo Wu, Deyin Liu, Hongyang Chen, Yuanxin Ye, Xianghua Xie. 1319-1324 [doi]

Deep Reinforcement Learning with semi-expert distillation for autonomous UAV cinematographyAndreas Sochopoulos, Ioannis Mademlis, Evangelos Charalampakis, Sotirios Papadopoulos, Ioannis Pitas. 1325-1330 [doi]

Learning Disentangled Representation with Mutual Information Maximization for Real-Time UAV TrackingXucheng Wang, Xiangyang Yang, Hengzhou Ye, Shuiwang Li. 1331-1336 [doi]

Transmission and Color-guided Network for Underwater Image EnhancementPan Mu, Jing Fang, Haotian Qian, Cong Bai. 1337-1342 [doi]

Towards Discriminative Representations with Contrastive Instances for Real-Time UAV TrackingDan Zeng 0002, Mingliang Zou, Xucheng Wang, Shuiwang Li. 1349-1354 [doi]

Underwater Image Enhancement with an Adaptive Self Supervised NetworkRizwan Khan, Atif Mehmood, Saeed Akbar, Zhonglong Zheng. 1355-1360 [doi]

Privacy-Protected Facial Expression Recognition Augmented by High-Resolution Facial ImagesCong Liang 0002, Shangfei Wang, Xiaoping Chen. 1361-1366 [doi]

Multimodal Sentiment Analysis with Preferential Fusion and Distance-aware Contrastive LearningFeipeng Ma, Yueyi Zhang, Xiaoyan Sun 0001. 1367-1372 [doi]

A Multi-View Co-Learning Method for Multimodal Sentiment AnalysisWenxiu Geng, Yulong Bian, Xiangxian Li. 1373-1378 [doi]

Multimodal Aspect-Based Sentiment Classification with Knowledge-Injected TransformerZenan Xu, Qinliang Su, Junxi Xiao. 1379-1384 [doi]

STA-GCN:Spatial Temporal Adaptive Graph Convolutional Network for Gait Emotion RecognitionChuang Chen, Xiao Sun. 1385-1390 [doi]

Adaptive Graph Attention Network with Temporal Fusion for Micro-Expressions RecognitionYiming Zhang, Hao Wang 0076, Yifan Xu, Xinglong Mao, Tong Xu 0001, Sirui Zhao, Enhong Chen. 1391-1396 [doi]

Deep Homography Estimation With Feature Correlation TransformerHaoyu Zhou, Wei Hu, Ying Li, Chu He, Xi Chen. 1397-1402 [doi]

ADATS: Adaptive RoI-Align based Transformer for End-to-End Text SpottingZepeng Huang, Qi Wan, Junliang Chen, Xiaodong Zhao, Kai Ye 0004, LinLin Shen. 1403-1408 [doi]

Trajectory Alignment based Multi-Scaled Temporal Attention for Efficient Video TransformerZao Zhang, Dong Yuan, Yu Zhang, Wei Bao. 1409-1414 [doi]

Swin-ASNet: An Adaptive RGB-selection Network with Swin Transformer for Retinal Vessel SegmentationQunchao Jin, Hongyu Hou, Guixu Zhang, Haoan Wang, Zhi Li. 1415-1420 [doi]

OAFormer: Occlusion Aware Transformer for Camouflaged Object DetectionXin Yang, Hengliang Zhu, Guojun Mao, Shuli Xing. 1421-1426 [doi]

Know Who You Are: Learning Target-Aware Transformer for Object TrackingZhuojun Zou, Xuexin Liu, Yuanpei Zhang, Lin Shu, Jie Hao. 1427-1432 [doi]

A Novel Channel Pruning Approach based on Local Attention and Global Ranking for CNN Model CompressionWei Lu, Yang Jiang, Peiguang Jing, Jinghui Chu, Fugui Fan. 1433-1438 [doi]

Splittable Pattern-Specific Weight Pruning for Deep Neural NetworksYiding Liu, Yinglei Teng, Tao Niu. 1439-1444 [doi]

Dynamic Dense-Sparse Representations for Real-Time Question AnsweringMinyu Sun, Bin Jiang 0006, Chao Yang 0015. 1445-1446 [doi]

DynaSlim: Dynamic Slimming for Vision TransformersDa Shi, Jingsheng Gao, Ting Liu 0016, Yuzhuo Fu. 1451-1456 [doi]

Post-Training Quantization for Vision Transformer in Transformed DomainKai-Feng, Zhuo Chen, Fei Gao, Zhe Wang, Long Xu, Weisi Lin. 1457-1462 [doi]

Residual based hierarchical feature compression for multi-task machine visionChaoran Chen, Mai Xu, Shengxi Li, Tie Liu, Minglang Qiao, Zhuoyi Lv. 1463-1468 [doi]

Cross-domain Federated Object DetectionShangchao Su, Bin Li 0015, Chengzhi Zhang, Mingzhao Yang, Xiangyang Xue. 1469-1474 [doi]

Cross-Modality Fourier Feature for Medical Image SynthesisMei Ma, Ling Lin, Heng Wang, Zhendong Li, Hao Liu. 1475-1480 [doi]

Point-Syn2Real: Semi-Supervised Synthetic-to-Real Cross-Domain Learning for Object Classification in 3D Point CloudsZiwei Wang 0003, Reza Arablouei, Jiajun Liu, Paulo Borges, Greg Bishop-Hurley, Nicholas Heaney. 1481-1486 [doi]

Temporal-enhanced Cross-modality Fusion Network for Video Sentence GroundingZezhong Lv, Bing Su 0001. 1487-1492 [doi]

A Cross-direction Task Decoupling Network for Small Logo DetectionSujuan Hou, Xingzhuo Li, Weiqing Min, Jiacheng Li, Jing Wang, Yuanjie Zheng, Shuqiang Jiang. 1493-1498 [doi]

CHAN: Cross-Modal Hybrid Attention Network for Temporal Language Grounding in VideosWen Wang, Ling Zhong, Guang Gao, Minhong Wan, Jason Gu. 1499-1504 [doi]

DMRL-Net: Differentiable Multi-view Representation Learning NetworkZihan Fang, Shide Du, Yaqing Chen, Shiping Wang. 1505-1510 [doi]

Conditional Video-Text Reconstruction Network with Cauchy Mask for Weakly Supervised Temporal Sentence GroundingJueqi Wei, Yuanwu Xu, MoHan Chen, Yuejie Zhang, Rui Feng, Shang Gao 0003. 1511-1516 [doi]

FlowText: Synthesizing Realistic Scene Text Video with Optical Flow EstimationYuZhong Zhao, Weijia Wu, Zhuang Li, Jiahong Li, Weiqiang Wang. 1517-1522 [doi]

Atomic-action-based Contrastive Network for Weakly Supervised Temporal Language GroundingHongzhou Wu, Yifan Lyu, Xingyu Shen, Xuechen Zhao, Mengzhu Wang, Xiang Zhang 0008, Zhigang Luo. 1523-1528 [doi]

Mandari: Multi-Modal Temporal Knowledge Graph-aware Sub-graph Embedding for Next-POI RecommendationXiaoqian Liu, Xiuyun Li, Yuan Cao 0003, Fan Zhang, Xiongnan Jin, Jinpeng Chen. 1529-1534 [doi]

Movie Box Office Prediction With Self-Supervised and Visually Grounded PretrainingQin Chao, Eunsoo Kim, Boyang Li. 1535-1540 [doi]

Need a dog for seeing eye? A Walk Viewpoint Dataset for Freespace Detection in Unstructured EnvironmentsWenbin Zou, Guoguang Hua, Guangxu Chen, Zaiyue He, Guangli Liu, Pengfei Chen, Yuyang Li, Huakun Li, Lei Zheng, Shishun Tian. 1541-1546 [doi]

Intensifying The Consistency of Pseudo Label Refinement for Unsupervised Domain Adaptation Person Re-IdentificationLinfan Zha, Yanming Chen 0002, Peng Zhou 0006, Yiwen Zhang. 1547-1552 [doi]

Noisy-to-Clean Label Learning for Medical Image SegmentationZihao Bu, Xiaoxiao Wang, Chengjian Qiu, Zhixuan Wang, Kai Han, Xiuhong Shan, Zhe Liu. 1553-1558 [doi]

Learning Discrimination from Contaminated Data: Multi-Instance Learning for Unsupervised Anomaly DetectionWenhao Hu, Yingying Liu, Jiazhen Xu, Xuanyu Chen, Gaoang Wang. 1559-1564 [doi]

Rethinking Video Error Concealment: A Benchmark DatasetBin Zheng, Miaohui Wang. 1565-1570 [doi]

Visual Place Recognition Datasets for Indoor SpacesZemian Guo, Yingying Zhu. 1571-1576 [doi]

AutoKary2022: A Large-Scale Densely Annotated Dataset for Chromosome Instance SegmentationDan You, Pengcheng Xia, Qiuzhu Chen, Minghui Wu, Suncheng Xiang, Jun Wang. 1577-1582 [doi]

Designing Optics and Algorithm for Ultra-Thin, High-Speed Lensless CamerasSalman Siddique Khan, Vivek Boominathan, Ashok Veeraraghavan, Kaushik Mitra. 1583-1588 [doi]

Dual-Domain Feature Learning and Memory-Enhanced Unfolding Network for Spectral Compressive ImagingYangke Ying, Jin Wang, Yunhui Shi, Baocai Yin. 1589-1594 [doi]

Image Compressed Sensing Using Multi-Scale Characteristic Residual LearningShumian Yang, Xinxin Xiang, Fenghua Tong, Dawei Zhao, Xin Li. 1595-1600 [doi]

LKD-Net: Large Kernel Convolution Network for Single Image DehazingPinjun Luo, Guoqiang Xiao, Xinbo Gao 0001, Song Wu. 1601-1606 [doi]

Video Noise Removal Using Progressive Decomposition With Conditional InvertibilityHaoran Huang, Yuhui Quan, Zhenghua Lei, Jinlong Hu, Yan Huang 0031. 1607-1612 [doi]

DocMAE: Document Image Rectification via Self-supervised Representation LearningShaokai Liu, Hao Feng, Wengang Zhou, Houqiang Li, Cong Liu, Feng Wu. 1613-1618 [doi]

Information-density Masking Strategy for Masked Image ModelingHe Zhu, Yang Chen, Guyue Hu 0001, Shan Yu. 1619-1624 [doi]

Histogram-guided Video Colorization Structure with Spatial-Temporal ConnectionZheyuan Liu 0009, Pan Mu, Hanning Xu, Cong Bai. 1625-1630 [doi]

Mask-Guided Stamp Erasure for Real Document ImageXinye Yang, Dongbao Yang, Yu Zhou 0015, Youhui Guo, Weiping Wang 0005. 1631-1636 [doi]

Attention-Aware Anime Line Drawing ColorizationYu Cao, Hao Tian, P. Y. Mok. 1637-1642 [doi]

Edge-aware Neural Implicit Surface ReconstructionXinghui Li, Yikang Ding, Jia Guo, Xiansong Lai, Shihao Ren, WenSen Feng, Long Zeng. 1643-1648 [doi]

Handwriting Curve Interpolation Using Gradient Graph Laplacian RegularizerYinhe Lin, Fei Chen 0012, Hang Cheng, Meiqing Wang. 1649-1654 [doi]

Comparison of HDR quality metrics in Per-Clip Lagrangian multiplier optimisation with AV1Vibhoothi, François Pitié, Angeliki Katsenou, Yeping Su, Balu Adsumilli, Anil C. Kokaram. 1655-1660 [doi]

A Real-Time Blind Quality-of-Experience Assessment Metric for HTTP Adaptive StreamingChunyi Li, May Lim, Abdelhak Bentaleb, Roger Zimmermann. 1661-1666 [doi]

Towards Guidelines for Subjective Haptic Quality Assessment: A Case Study on Quality Assessment of Compressed Haptic SignalsAndréas Pastor, Patrick Le Callet. 1667-1672 [doi]

Just Noticeable Difference-Aware Per-Scene Bitrate-Laddering for Adaptive Video StreamingVignesh V. Menon, Jingwen Zhu, Prajit T. Rajendran, Hadi Amirpour, Patrick Le Callet, Christian Timmerer. 1673-1678 [doi]

Optimizing Video Streaming for Sustainability and Quality: The Role of Preset Selection in Per-Title EncodingHadi Amirpour, Vignesh V. Menon, Samira Afzal, Radu Prodan, Christian Timmerer. 1679-1684 [doi]

Anableps: Adapting Bitrate for Real-Time Communication Using VBR-encoded VideoZicheng Zhang, Hao Chen 0036, Xun Cao, Zhan Ma. 1685-1690 [doi]

Adversarial Speaker Disentanglement Using Unannotated External Data for Self-supervised Representation-based Voice ConversionXintao Zhao, Shuai Wang, Yang Chao, Zhiyong Wu 0001, Helen Meng. 1691-1696 [doi]

A Disentangled Recurrent Variational Autoencoder for Speech EnhancementHegen Yan, Zhihua Lu. 1697-1702 [doi]

SnakeGAN: A Universal Vocoder Leveraging DDSP Prior Knowledge and Periodic Inductive BiasSipan Li, Songxiang Liu, Luwen Zhang, Xiang Li, Yanyao Bian, Chao Weng, Zhiyong Wu 0001, Helen Meng. 1703-1708 [doi]

CRA-DIFFUSE: Improved Cross-Domain Speech Enhancement Based on Diffusion Model with T-F Domain Pre-DenoisingZhibin Qiu, Yachao Guo, Mengfan Fu, Hao Huang, Ying Hu, Liang He 0003, Fuchun Sun 0001. 1709-1714 [doi]

A Joint Network Based on Interactive Attention for Speech Emotion RecognitionYing Hu, Shijing Hou, Huamin Yang, Hao Huang, Liang He 0003. 1715-1720 [doi]

Speech Topic Classification Based on Pre-trained and Graph NetworksFangjing Niu, Tengfei Cao, Ying Hu, Hao Huang, Liang He 0003. 1721-1726 [doi]

Unsupervised 3D Face Reconstruction with Reprogramming Skip ConnectionsZhuoming Dong, Huajun Zhou, Jianhuang Lai. 1727-1732 [doi]

EvenFace: Deep Face Recognition with Uniform Distribution of IdentitiesPengfei Hu, Yingfan Tao, Qiqi Bao, Guijin Wang, Wenming Yang. 1733-1738 [doi]

Large Pose Friendly Face Reenactment using subtle motionsXiaomeng Fu, Xi Wang, Jin Liu 0020, Jiao Dai, Jizhong Han. 1739-1744 [doi]

MSAbox: A spatially stable face detectorWei Xu, Kangkang Wang, Ziliang Chen, Bin He, Bi Li 0005, Haocheng Feng, Gang Zhang, Jingtuo Liu, Junyu Han, Errui Ding. 1745-1750 [doi]

DR-Net: A Multi-View Face Synthesis Network Driven by Dual RepresentationXianliang Huang, Yining Lang, Ying Guo, Yuan He 0011, Hui Xue 0001, Li Zhao, Shuigeng Zhou. 1751-1756 [doi]

MA-NeRF: Motion-Assisted Neural Radiance Fields for Face Synthesis from Sparse ImagesWeichen Zhang, Xiang Zhou, Yukang Cao, WenSen Feng, Chun Yuan. 1757-1762 [doi]

Enhancing Robustness of Deep Networks Against Noisy Labels Based on A Two-Phase Formulation of Their Learning BehaviorYaoru Luo, Ge Yang. 1763-1768 [doi]

Robust and Efficient Memory Network for Video Object SegmentationYadang Chen, Dingwei Zhang, Zhi-Xin Yang 0001, Enhua Wu. 1769-1774 [doi]

Weight-based Regularization for Improving Robustness in Image ClassificationHao Yang, Min Wang, Zhengfei Yu, Yun Zhou 0001. 1775-1780 [doi]

Robust Structured Sparse Subspace Clustering with Neighborhood Preserving ProjectionWenyi Feng, Wei Guo, Ting Xiao, Zhe Wang 0002. 1781-1786 [doi]

Improving robustness of learning-based adaptive video streaming in wildly fluctuating networksJiawei Lin, Shuoyao Wang. 1787-1792 [doi]

Robust Person Re-Identification with Wireless SignalsDong Xi, Wengang Zhou, Houqiang Li. 1793-1798 [doi]

GradSalMix: Gradient Saliency-Based Mix for Image Data AugmentationTao Hong, Ya Wang, Xingwu Sun, Fengzong Lian, Zhanhui Kang, Jinwen Ma. 1799-1804 [doi]

Get a Head Start: Targeted Labeling at Source with Limited Annotation Overhead for Semi-Supervised LearningHui Zhu, Yongchun Lü, Qin Ma 0001, Xunyi Zhou, Fen Xia, Guoqing Zhao, Ning Jiang, Xiaofang Zhao. 1805-1810 [doi]

Partial multi-label learning: exploration of binary ground-truth labelsYan Hu, Xiaozhao Fang, Weijun Lv, Peipei Kang. 1811-1816 [doi]

Customizing Synthetic Data for Data-Free Student LearningShiya Luo, Defang Chen 0001, Can Wang 0001. 1817-1822 [doi]

A Geometrical Characterization on Feature Density of Image DatasetsZhen Liang, Changyuan Zhao, Wanwei Liu, Bai Xue 0001, Wenjing Yang 0002. 1823-1828 [doi]

Federated Domain Adaptation via Pseudo-label RefinementGang Li, Qifei Zhang, Peizheng Wang, Jie Zhang, Chao Wu 0001. 1829-1834 [doi]

Learning continuous piecewise non-linear activation functions for deep neural networksXinchen Gao, Yawei Li, Wen Li 0001, Lixin Duan, Luc Van Gool, Luca Benini, Michele Magno. 1835-1840 [doi]

Discriminative Spatiotemporal Alignment for Self-Supervised Video Correspondence LearningQiaoqiao Wei, Hui Zhang 0013, Jun-Hai Yong. 1841-1846 [doi]

Unsupervised Fashion Style Learning by Solving Fashion Jigsaw PuzzlesJia Chen, Haidongqing Yuan, Fei Fang, Tao Peng 0006, Xinrong Hu. 1847-1852 [doi]

Anchor-Free Action Proposal Network with Uncertainty EstimationSelen Pehlivan, Jorma Laaksonen. 1853-1858 [doi]

Scale-Aware Task Message Transferring for Multi-Task LearningShalayiding Sirejiding, Yuxiang Lu, Hongtao Lu, Yue Ding 0001. 1859-1864 [doi]

Improving the Homophily of Heterophilic Graphs for Semi-Supervised Node ClassificationYuhu Wang, Shiming Xiang, Chunhong Pan. 1865-1870 [doi]

Sitpose: A Siamese Convolutional Transformer for Relative Camera Pose EstimationKai Leng, Cong Yang, Wei Sui, Jie Liu, Zhijun Li. 1871-1876 [doi]

TextFormer: Component-aware Text Segmentation with TransformerXiaocong Wang, Chaoyue Wu, Haiyang Yu, Bin Li 0015, Xiangyang Xue. 1877-1882 [doi]

SCFormer: Integrating hybrid Features in Vision TransformersHui Lu, Ronald Poppe, Albert Ali Salah. 1883-1888 [doi]

Image Deraining Transformer with Sparsity and Frequency GuidanceTianyu Song, Pengpeng Li 0001, Guiyue Jin, Jiyu Jin, Shumin Fan, Xiang Chen 0015. 1889-1894 [doi]

ShiftFormer: Spatial-Temporal Shift Operation in Video TransformerBeiying Yang, Guibo Zhu, Guojing Ge, Jinzhao Luo, Jinqiao Wang. 1895-1900 [doi]

ABMNet: Coupling Transformer with CNN Based on Adams-Bashforth-Moulton Method for Infrared Small Target DetectionTianxiang Chen, Qi Chu 0001, Zhentao Tan, Bin Liu 0016, Nenghai Yu. 1901-1906 [doi]

ART: An Efficient Transformer with Atrous Residual Learning for Medical ImagesYue He, Yufan Wang, Linlong He, Guangyao Pan, He Ma. 1907-1912 [doi]

MedFCT: A Frequency Domain Joint CNN-Transformer Network for Semi-supervised Medical Image SegmentationShiao Xie, Huimin Huang, Ziwei Niu, Lanfen Lin, Yen-Wei Chen 0001. 1913-1918 [doi]

Cross-cycle Transformer-based Stitching Method for Low-resolution Borehole ImagesJia Chen, Zhenpeng Fu, Fei Fang, Mingfu Xiong, Xinrong Hu, Tao Peng 0006. 1919-1924 [doi]

Improving Vision Transformers with Nested Multi-head AttentionsJiquan Peng, Chaozhuo Li, Yi Zhao, Yuting Lin, Xiaohan Fang, Jibing Gong. 1925-1930 [doi]

Collaborative Spatial-Temporal Distillation for Efficient Video DerainingYuzhang Hu, Minghao Liu, Wenhan Yang, Jiaying Liu 0001, Zongming Guo. 1937-1942 [doi]

Adaptive Multi-Teacher Knowledge Distillation with Meta-LearningHailin Zhang, Defang Chen 0001, Can Wang 0001. 1943-1948 [doi]

Towards General and Fast Video Derain via Knowledge DistillationDefang Cai, Pan Mu, Sixian Chan, Zhanpeng Shao, Cong Bai. 1949-1954 [doi]

Deep Metric Multi-View Hashing for Multimedia RetrievalJian Zhu, Xiaohu Ruan, Yongli Cheng, Zhangmin Huang, Yu Cui, Lingfang Zeng. 1955-1960 [doi]

MIM: Lightweight Multi-Modal Interaction Model for Joint Video Moment Retrieval and Highlight DetectionJinyu Li, Fuwei Zhang, Shujin Lin, Fan Zhou 0001, Ruomei Wang 0001. 1961-1966 [doi]

Image-text Retrieval via Preserving Main Semantics of VisionXu Zhang, Xinzheng Niu, Philippe Fournier-Viger, Xudong Dai. 1967-1972 [doi]

Progressive Event Alignment Network for Partial Relevant Video RetrievalXun Jiang, Zhiguo Chen, Xing Xu 0001, Fumin Shen, Zuo Cao, Xunliang Cai. 1973-1978 [doi]

Understanding and Improving Perceptual Quality of Volumetric Video StreamingMengyu Yang, Di Wu 0001, Zelong Wang, Miao Hu, Yipeng Zhou. 1979-1984 [doi]

Adaptive Geometry Reconstruction for Geometry-based Point Cloud CompressionLei Wei, Shuai Wan, Xiaobin Ding, FuZheng Yang 0001, Zhecheng Wang. 1985-1990 [doi]

CAS-Net: Cascade Attention-Based Sampling Neural Network for Point Cloud SimplificationChen Chen, Hui Yuan 0001, Hao Liu 0044, Junhui Hou, Raouf Hamzaoui. 1991-1996 [doi]

PCHM-Net: A New Point Cloud Compression Framework for Both Human Vision and Machine VisionLei Liu, Zhihao Hu, Jing Zhang. 1997-2002 [doi]

Large-Scale Spatio-Temporal Attention Based Entropy Model for Point Cloud CompressionRui Song, Chunyang Fu, Shan Liu 0001, Ge Li 0002. 2003-2008 [doi]

Edge-FVV: Free Viewpoint Video Streaming by Learning at the EdgeHaipeng Zhang, Jie Zhang, Weimiao Feng, Kaigui Bian, Hu Tuo. 2009-2014 [doi]

Weighted Point Cloud Normal EstimationWeijia Wang, Xuequan Lu, Di Shao, Xiao Liu 0004, Richard Dazeley, Antonio Robles-Kelly, Wei Pan. 2015-2020 [doi]

HybridPoint: Point Cloud Registration Based on Hybrid Point Sampling and MatchingYiheng Li, Canhui Tang, Runzhao Yao, Aixue Ye, Feng Wen, Shaoyi Du. 2021-2026 [doi]

Learning Deep Photometric Stereo Network with Reflectance PriorsYakun Ju, Cong Zhang, Songsong Huang, Yuan Rao, Kin-Man Lam 0001. 2027-2032 [doi]

SST: Real-time End-to-end Monocular 3D Reconstruction via Sparse Spatial-Temporal GuidanceChenyangguang Zhang, Zhiqiang Lou, Yan Di, Federico Tombari, Xiangyang Ji. 2033-2038 [doi]

Implicit Neural Distance Optimization for Mesh Neural SubdivisionKe Liu, Ning Ma, Zhihua Wang, Jingjun Gu, Jiajun Bu, Haishuai Wang. 2039-2044 [doi]

MRRA-GAN: Multi-Resolution Relation-Aware GAN for Point Cloud CompletionKe Ren, Zhenjiang Du, Qifeng He, Ning Xie 0003, Guan Wang. 2045-2050 [doi]

LSAS: Lightweight Sub-attention Strategy for Alleviating Attention Bias ProblemShanShan Zhong, Wushao Wen, Jinghui Qin, Qiangpu Chen, Zhongzhan Huang. 2051-2056 [doi]

LA-layer: General local attention layer for full attention networksHui Lu, Ronald Poppe, Albert Ali Salah. 2057-2062 [doi]

A Progressive Gated Attention Model for Fine-Grained Visual ClassificationQiangxi Zhu, Zhixin Li. 2063-2068 [doi]

Flow-Guided Attention Deformation for Person Image GenerationYubo Wu, Yurui Ren, Yuanqi Chen, Ge Li. 2069-2074 [doi]

Explicit Attention Modeling for Pedestrian Attribute RecognitionJinyi Fang, Bingke Zhu, Yingying Chen, Jinqiao Wang, Ming Tang 0001. 2075-2080 [doi]

Hidden Follower Detection via Refined Gaze and Walking State EstimationYaxi Chen, Ruimin Hu, Danni Xu, Zheng Wang 0007, Linbo Luo, Dengshi Li. 2081-2086 [doi]

SketchScene: Scene Sketch To Image Generation With Diffusion ModelsZhenbei Wu, Haoge Deng, Qiang Wang, Di Kong, Jie Yang 0023, Yonggang Qi. 2087-2092 [doi]

DanceU: motion-and-music-based automatic effect generation for dance videosYanjie Pan, Yaru Du, Shandong Wang, Yun Ye, Yong Jiang, Zhen Zhou, Li Xu, Ming Lu, Yunbiao Lin, Jiehui Lu. 2093-2098 [doi]

FONT: Flow-guided One-shot Talking Head Generation with Natural Head MotionsJin Liu 0020, Xi Wang, Xiaomeng Fu, Yesheng Chai, Cai Yu, Jiao Dai, Jizhong Han. 2099-2104 [doi]

UFS-Net: Unsupervised Network For Fashion Style Editing And GenerationWanqing Wu, Aihua Mao, Wenwei Yan, Qing Liu. 2105-2110 [doi]

Graph Convolutional GRU for Music-Oriented Dance Choreography GenerationYuxin Hou, Hongxun Yao, Haoran Li. 2111-2116 [doi]

CCLAP: Controllable Chinese Landscape Painting Generation Via Latent Diffusion ModelZhongqi Wang, Jie Zhang, Zhilong Ji, Jinfeng Bai, Shiguang Shan. 2117-2122 [doi]

Prototype calibration for long tailed recognitionZhongan Wang, Shuai Shi, Yingna Wu, Rui Yang. 2123-2128 [doi]

Open-Vocabulary Multi-label Image Classification with Pretrained Vision-Language ModelSon Duy Dao, Dat Huynh, He Zhao, Dinh Phung 0001, Jianfei Cai 0001. 2135-2140 [doi]

RASNet: A Reinforcement Assistant Network for Frame Selection in Video-based Posture RecognitionRuotong Hu, Xianzhi Wang 0001, Xiaojun Chang, Yeqi Hu, Xiaowei Xin, Xiangqian Ding, Baoqi Guo. 2141-2146 [doi]

Dynamic Spatial-temporal Hypergraph Convolutional Network for Skeleton-based Action RecognitionShengqin Wang, Yongji Zhang, Hong Qi, Minghao Zhao 0003, Yu Jiang 0006. 2147-2152 [doi]

A Token-wise Graph-based Framework for Multimodal Named Entity RecognitionZhengxuan Zhang, Weixing Mai, Haoliang Xiong, Chuhan Wu, Yun Xue. 2153-2158 [doi]

Multi-focus image fusion via gradient guidance progressive networkZhao Duan, Xiaoliu Luo, Taiping Zhang. 2159-2164 [doi]

Efficient Video Matting on Human Video Clips for Real-Time ApplicationChao-Liang Yu, I-Chen Lin. 2165-2170 [doi]

Render-and-Compare: Cross-view 6-DoF Localization from Noisy PriorShen Yan, Xiaoya Cheng, Yuxiang Liu, Juelin Zhu, Rouwan Wu, Yu Liu, Maojun Zhang. 2171-2176 [doi]

Video Snapshot Compressive Imaging via Optical FlowZan Chen, Ran Li, Yongqiang Li, Yuanjing Feng. 2177-2182 [doi]

CasTensoRF: Cascaded Tensorial Radiance Fields for Novel View SynthesisWenpeng Xing, Jie Chen 0026. 2183-2188 [doi]

Compact Real-Time Radiance Fields with Neural CodebookLingzhi Li 0002, Zhongshu Wang, Zhen Shen, Li Shen 0003, Ping Tan. 2189-2194 [doi]

STNet: Spatial and Temporal feature fusion network for change detection in remote sensing imagesXiaowen Ma, Jiawei Yang, Tingfeng Hong, Mengting Ma, Ziyan Zhao, Tian Feng, Wei Zhang. 2195-2200 [doi]

Social Bot Detection Based on Window StrategyBoyu Qiao, Kun Li, Wei Zhou 0019, Zhou Yan, Shilong Li, Songlin Hu. 2201-2206 [doi]

A Semantics-Aware Normalizing Flow Model for Anomaly DetectionWei Ma, Shiyong Lan, Weikang Huang, Wenwu Wang 0001, Hongyu Yang, Yitong Ma, Yongjie Ma. 2207-2212 [doi]

Online Action Detection with Learning Future Representations by Contrastive LearningHaitao Leng, Xiaoming Shi, Wei Zhou, Kuncai Zhang, Qiankun Shi, Pengcheng Zhu. 2213-2218 [doi]

HOD: Human-Object Decoupling Network for HOI DetectionHantao Zhang, Shouhong Wan, Weidong Guo, Peiquan Jin, Mingguang Zheng. 2219-2224 [doi]

Fixing Domain Bias for Generalized Deepfake DetectionYuzhe Mao, Weike You, Linna Zhou, Zhigao Lu. 2225-2230 [doi]

Variational Information Bottleneck for Cross Domain Object DetectionJiangming Chen, Wanxia Deng, Bo Peng, Tianpeng Liu, Yingmei Wei, Li Liu 0002. 2231-2236 [doi]

Attention Based Network with DA-Loss for X-ray Contraband Automatic DetectionPeiwen Li, Lijun Zhang, Xiang-Dong Zhou, Yu Shi 0003, Xiaohu Shao. 2237-2242 [doi]

Cross-Level Attention Based Adaptive Feature Alignment Network for Arbitrary-Shaped Text DetectionHaiyan Zhang, Sumei Li. 2243-2248 [doi]

Multi-object Video Generation from Single Frame LayoutsYang Wu, Zhibin Liu, Hefeng Wu, Liang Lin. 2249-2254 [doi]

Towards Confidence-Aware Commonsense Knowledge Integration for Scene Graph GenerationHongshuo Tian, Ning Xu, Yanhui Wang, Chenggang Yan 0001, Bolun Zheng, Xuanya Li, An-An Liu. 2255-2260 [doi]

Image Layer Modeling for Complex Document Layout GenerationTianlong Ma, Xingjiao Wu, Xiangcheng Du, Yanlong Wang, Cheng Jin. 2261-2266 [doi]

Knowledge Enhanced Model for Live Video Comment GenerationJieting Chen, Junkai Ding, Wenping Chen, Qin Jin. 2267-2272 [doi]

Mutual Query Network for Multi-Modal Product Image SegmentationYun Guo, Wei Feng, Zheng Zhang, Xiancong Ren, Yaoyu Li, Jingjing Lv, Xin Zhu, Zhangang Lin, JingPing Shao. 2273-2278 [doi]

ATENet: Adaptive Tiny-Object Enhanced Network for Polyp SegmentationXiaogang Du, Yinghao Wu, Tao Lei, Dongxin Gu, Yinyin Nie, Asoke K. Nandi. 2279-2284 [doi]

Adaptive-Masking Policy with Deep Reinforcement Learning for Self-Supervised Medical Image SegmentationGang Xu, Shengxin Wang, Thomas Lukasiewicz, Zhenghua Xu. 2285-2290 [doi]

MSAANet: Multi-scale Axial Attention Network for medical image segmentationHao Zeng, Xinxin Shan, Yu Feng, Ying Wen. 2291-2296 [doi]

A Simple Stochastic Neural Network for Improving Adversarial RobustnessHao Yang, Min Wang, Zhengfei Yu, Yun Zhou 0001. 2297-2302 [doi]

DFCP: Few-Shot DeepFake Detection via Contrastive PretrainingBo Zou, Chao Yang, Jiazhi Guan, Chengbin Quan, Youjian Zhao. 2303-2308 [doi]

Forensics Forest: Multi-scale Hierarchical Cascade Forest for Detecting GAN-generated FacesJiucui Lu, Yuezun Li, Jiaran Zhou, Bin Li, Siwei Lyu. 2309-2314 [doi]

Transferable Waveform-level Adversarial Attack against Speech Anti-spoofing ModelsBingyuan Huang, Sanshuai Cui, Xiangui Kang, Enping Li. 2315-2320 [doi]

Domain-Invariant Feature Learning for General Face Forgery DetectionJian Zhang, Jiangqun Ni. 2321-2326 [doi]

Image Copy-Move Forgery Detection via Deep Cross-Scale PatchMatchYingjie He, Yuanman Li, Changsheng Chen, Xia Li 0006. 2327-2332 [doi]

BAProto: Boundary-Aware Prototype for High-quality Instance SegmentationYuxuan Zhang, Wei Yang 0011, Rong Hu. 2333-2338 [doi]

PMDA: Domain Alignment with Prototype Matching for Cross-Domain Adaptive SegmentationWeiwei Li, Yuanyuan Ren, Junzhuo Liu, Chenyang Wang, Yuchen Zheng. 2339-2344 [doi]

Cross-slice Context Consistency for Semi-supervised 3D Left Atrium SegmentationYongchao Wang, Bin Xiao 0002, Xiuli Bi, Weisheng Li 0001, Xinbo Gao 0001. 2343-2350 [doi]

CTSSeg: Consistent Teacher-Student model for magnetic resonance image SegmentationChenbin Zhang, Qingyuan He, Kun Yan, Meng Ma, Defeng Liu, Ping Wang 0003. 2351-2356 [doi]

Adaptive Non-local Affinity Graph for Unsupervised Image SegmentationXin Lv, Zhenming Su, Taiyi Zhang, Wenxiang Cheng, Xiaoqiong Qi. 2357-2362 [doi]

Fine-grained Domain Adaptive Crowd Counting via Point-derived SegmentationYongtuo Liu, Dan Xu 0002, Sucheng Ren, Hanjie Wu, Hongmin Cai, Shengfeng He. 2363-2368 [doi]

Scribble-Supervised RGB-T Salient Object DetectionZhengyi Liu, Xiaoshen Huang, Guanghui Zhang, Xianyong Fang, Linbo Wang, Bin Tang. 2369-2374 [doi]

CA-GAN: Object Placement via Coalescing Attention based Generative Adversarial NetworkYibin Wang, Yuchao Feng, Jie Wu, Honghui Xu, Jianwei Zheng 0001. 2375-2380 [doi]

ABC: Attention with Bilinear Correlation for Infrared Small Target DetectionPeiwen Pan, Huan Wang, Chenyi Wang, Chang Nie. 2381-2386 [doi]

Guided Focal Stack Refinement Network for Light Field Salient Object DetectionBo Yuan, Yao Jiang 0002, Keren Fu, Qijun Zhao. 2387-2392 [doi]

Triplet Spatiotemporal Aggregation Network for Video Saliency DetectionZhenshan Tan, Cheng Chen, Xiaodong Gu 0001. 2393-2398 [doi]

GFNet: Gaze Focus Network using Attention for Gaze EstimationDaosong Hu, Kai Huang. 2399-2404 [doi]

Feature Mixing and Disentangling for Occluded Person Re-IdentificationZepeng Wang 0002, Ke Xu 0003, Yuting Mou, Xinghao Jiang. 2405-2410 [doi]

Multi-Scale Query-Adaptive Convolution for Generalizable Person Re-IdentificationKaixiang Chen, Tiantian Gong, Liyan Zhang. 2411-2416 [doi]

Fine-grained Learning for Visible-Infrared Person Re-identificationMengzan Qi, Sixian Chan, Chen Hang, Guixu Zhang, Zhi Li. 2417-2422 [doi]

Camera Proxy based Contrastive Learning with Hard Sampling for Unsupervised Person Re-identificationYimin Liu, Meibin Qi, Qiang Wu 0001, Yanfang Yang, Xiaohong Li, Jian Zhang. 2423-2428 [doi]

Inter-Intra Camera Identity Learning for Person Re-Identification with Training in Single CameraGuoqing Zhang 0002, Zhiyuan Luo 0003, Weisi Lin, Xuan Jing. 2429-2434 [doi]

Dynamically Adaptive Instance Normalization and Attention-Aware Incremental Meta-Learning for Generalizable Person Re-identificationTiantian Gong, Kaixiang Chen, Junsheng Wang, Liyan Zhang. 2435-2440 [doi]

CFANet: A Cross-layer Feature Aggregation Network for Camouflaged Object DetectionQing Zhang, Weiqi Yan. 2441-2446 [doi]

Multibox Sample Selection for Active Object DetectionJiaxiang Dong, Li Zhang. 2447-2452 [doi]

Run and Chase: Towards Accurate Source-Free Domain Adaptive Object DetectionLuojun Lin, Zhifeng Yang, Qipeng Liu 0004, Yuanlong Yu, Qifeng Lin. 2453-2458 [doi]

Camouflaged Object Detection with Feature Grafting and Distractor AwareYuxuan Song, Xinyue Li, Lin Qi. 2459-2464 [doi]

Edge-Aware Mirror Network for Camouflaged Object DetectionDongyue Sun, Shiyao Jiang, Lin Qi. 2465-2470 [doi]

'Skimming-Perusal' Detection: A Simple Object Detection Baseline in GigaPixel-level ImagesZhibin Zhang, Wanli Xue, Kaihua Zhang, Shengyong Chen. 2471-2476 [doi]

Attribute-assisted Multimodal Network for Image Aesthetics AssessmentTong Zhu, Leida Li, Pengfei Chen, Jinjian Wu, Yuzhe Yang, Yaqian Li, Yandong Guo. 2477-2482 [doi]

EEP-3DQA: Efficient and Effective Projection-Based 3D Model Quality AssessmentZicheng Zhang, Wei Sun 0029, Yingjie Zhou, Wei Lu 0021, Yucheng Zhu, Xiongkuo Min, Guangtao Zhai. 2483-2488 [doi]

Exploring the Influence of View and Camera Path Selection for Dynamic Mesh Quality AssessmentKaifa Yang, Qi Yang 0003, Joel Jung, Yiling Xu, Xiaozhong Xu, Shan Liu. 2489-2494 [doi]

HandGCAT: Occlusion-Robust 3D Hand Mesh Reconstruction from Monocular ImagesShuaibing Wang, Shunli Wang, Dingkang Yang, Mingcheng Li, Ziyun Qian, Liuzhen Su, Lihua Zhang. 2495-2500 [doi]

BH-VQA: Blind High Frame Rate Video Quality AssessmentWei Lu 0021, Wei Sun 0029, Zicheng Zhang, Danyang Tu, Xiongkuo Min, Guangtao Zhai. 2501-2506 [doi]

Multi-Level Feature-Guided Stereoscopic Video Quality Assessment Based on Transformer and Convolutional Neural NetworkYuan Chen, Sumei Li. 2513-2518 [doi]

DDH-QA: A Dynamic Digital Humans Quality Assessment DatabaseZicheng Zhang, Yingjie Zhou, Wei Sun 0029, Wei Lu 0021, Xiongkuo Min, Yu Wang, Guangtao Zhai. 2519-2524 [doi]

Improving Multi-generation Robustness of Learned Image CompressionLitian Li, Zheng Yang, Yongqi Zhai, Jiayu Yang, Ronggang Wang. 2525-2530 [doi]

Code Verification Hashing for Image RetrievalYinqi Chen, Zhiyi Lu, Ya Lu, Yangting Zheng, Peiwen Li, Shuo Kang. 2531-2536 [doi]

Low-complexity Deep Video Compression with A Distributed Coding ArchitectureXinjie Zhang, Jiawei Shao, Jun Zhang. 2537-2542 [doi]

Perceptual Audio Object Coding Using Adaptive Subband Grouping with CNN and Residual BlockYulin Wu, Ruimin Hu, Xiaochen Wang. 2543-2548 [doi]

Learning Lossless Compression for High Bit-Depth Medical ImagingKai Wang, Yuanchao Bai, Deming Zhai, Daxin Li, Junjun Jiang, Xianming Liu. 2549-2554 [doi]

Sparse Representation based Deep Residual Geometry Compression Network for Large-scale Point CloudsPengpeng Yu, Dian Zuo, Yueer Huang, Ruishan Huang, Hanyun Wang, Yulan Guo, Fan Liang. 2555-2560 [doi]

An Efficient Real-Time Hardware Architecture for Deblocking Filter in AVS3Shaokang Wang, Xiaofeng Huang, Guoqing Xiang, Xizhong Zhu, Jiaojiao Yang, Peng Zhang 0007, Huizhu Jia, Xiaodong Xie. 2561-2566 [doi]

Microimage-based Two-step Search For Plenoptic 2.0 Video CodingYuQing Yang, Xin Jin 0002, Kedeng Tong, Chen Wang, Haitian Huang. 2567-2572 [doi]

Low Complexity Transcoding from HEVC to VVCXi Xie, Kai Zhang, Li Zhang, Meng Wang 0017, Junru Li, Shiqi Wang 0001. 2573-2578 [doi]

Visible-Xray Cross-Modality Package Re-IdentificationSixian Chan, Jiaao Cui, Yonggan Wu, Hongqiang Wang, Cong Bai. 2579-2584 [doi]

Aerial-Ground Person Re-IDHuy Nguyen, Kien Nguyen 0001, Sridha Sridharan, Clinton Fookes. 2585-2590 [doi]

Meta Perturbed Re-Id DefenseAstha Verma, A. Venkata Subramanyam, Mohammad Ali Jauhar, Divij Gera, Rajiv Ratn Shah. 2597-2602 [doi]

EFT: Expert Fusion Transformer for Voice-Face Association LearningGuangyu Chen, Deyuan Zhang, Tao Liu 0001, Xiaoyong Du 0001. 2603-2608 [doi]

Social Context-aware GCN for Video Character Search via Scene-prior EnhancementWenjun Peng, Weidong He, Derong Xu, Tong Xu 0001, Chen Zhu, Enhong Chen. 2609-2614 [doi]

MRCap: Multi-modal and Multi-level Relationship-based Dense Video CaptioningWei Chen 0109, Jianwei Niu 0002, Xuefeng Liu 0001. 2615-2620 [doi]

Auxiliary Fine-grained Alignment Constraints for Vision-and-Language NavigationYibo Cui, Ruqiang Huang, Yakun Zhang, Yingjie Cen, Liang Xie, Ye Yan, Erwei Yin. 2621-2626 [doi]

Improving Audio-Visual Speech Recognition by Lip-Subword Correlation Based Visual Pre-training and Cross-Modal Fusion EncoderYusheng Dai, Hang Chen, Jun Du, Xiaofei Ding, Ning Ding, Feijun Jiang, Chin-Hui Lee. 2627-2632 [doi]

Detection Of Public Speaking Anxiety: A New Dataset And AlgorithmWei Song, Bin Wu 0001, Chunping Zheng, Huayang Zhang. 2633-2638 [doi]

EANet: Towards Lightweight Human Pose Estimation With Effective Aggregation NetworkBeitao Chen, Xuanhan Wang, Xiaojia Chen, Yulan He 0001, Jingkuan Song. 2639-2644 [doi]

Effective Occlusion Suppression Network via Grouped Pose Estimation for Occluded Person Re-IdentificationZhihao Li, Huaxiang Zhang 0001, Lei Zhu 0002, Jiande Sun 0001, Li Liu 0031. 2645-2650 [doi]

Structural Equivariance Self-Supervised Learning for Facial Pose EstimationYaoxing Wang, Heng Zhou, Zhendong Li, Xian Mo, Hao Liu. 2651-2656 [doi]

ActionPrompt: Action-Guided 3D Human Pose Estimation With Text and Pose PromptingHongwei Zheng 0006, Han Li, Bowen Shi, Wenrui Dai, Botao Wang, Yu Sun, Min Guo, Hongkai Xiong. 2657-2662 [doi]

Hierarchical Graph Neural Network for Human Pose EstimationGuanghua Zheng, Zhongqiu Zhao, Zhao Zhang 0001, Yi Yang. 2663-2668 [doi]

RF-based Multi-view Pose Machine for Multi-Person 3D Pose EstimationChunyang Xie, Dongheng Zhang, Zhi Wu, Cong Yu 0011, Yang Hu 0006, Qibin Sun, Yan Chen 0007. 2669-2674 [doi]

Coarse Helps Fine: A Multi-Granularity Discriminative Adversarial Network for Fine-Grained Open-Set Domain AdaptationJing Li, Liu Yang, Qilong Wang, Qinghua Hu. 2675-2680 [doi]

Adversarially Robust Source-free Domain Adaptation with Relaxed Adversarial TrainingYao Xiao, Pengxu Wei, Cong Liu 0001, Liang Lin. 2681-2686 [doi]

A Compact Transformer for Adaptive Style TransferYi Li 0018, Xin Xie, Haiyan Fu, Xiangyang Luo, Yanqing Guo. 2687-2692 [doi]

Fine-Grained Alignment for Boundary Samples under Open Set Domain AdaptationJianglin Wei, Guangyi Xiao, Shun Peng, Hao Chen 0051, Jingzhi Guo, Zhiguo Gong. 2693-2698 [doi]

Information Selection-based Domain Adaptation from Black-box PredictorsKai Wang, Xing Xu 0001, Jialin Tian, Zuo Cao, Gong Zhang. 2699-2704 [doi]

2: Entropy Discrimination and Energy Optimization for Source-free Universal Domain AdaptationMeng Shen, Andy J. Ma, Pong C. Yuen. 2705-2710 [doi]

Long-Short Temporal Co-Teaching for Weakly Supervised Video Anomaly DetectionShengyang Sun, Xiaojin Gong. 2711-2716 [doi]

Multi-Level Memory-Augmented Appearance-Motion Correspondence Framework for Video Anomaly DetectionXiangyu Huang, Caidan Zhao, Jinhui Yu, Chenxing Gao, Zhiqiang Wu 0001. 2717-2722 [doi]

Weakly Supervised Video Anomaly Detection Based on Cross-Batch Clustering GuidanceCongqi Cao, Xin Zhang, Shizhou Zhang, Peng Wang 0015, Yanning Zhang. 2723-2728 [doi]

Pose-Motion Video Anomaly Detection via Memory-Augmented Reconstruction and Conditional Variational PredictionWeilin Wan 0002, Weizhong Zhang, Cheng Jin. 2729-2734 [doi]

Rethinking graph anomaly detection: A self-supervised Group Discrimination paradigm with Structure-AwareJunyi Yan, Enguang Zuo, Chen Chen, Cheng Chen, Jie Zhong, Tianle Li, Xiaoyi Lv. 2735-2740 [doi]

A Masked Attention Network with Query Sparsity Measurement for Time Series Anomaly DetectionJie Zhong, Enguang Zuo, Chen Chen, Cheng Chen, Junyi Yan, Tianle Li, Xiaoyi Lv. 2741-2746 [doi]

HPCNet: A Hybrid Progressive Coupled Network for Image DerainingQiong Wang, Kui Jiang, Jinyi Lai, Zheng Wang, Jianhui Zhang. 2747-2752 [doi]

Iterative Refinement Network for Hyperspectral Image DenoisingFengchao Xiong, Jun Zhou 0001, Zhuang Zhao, Yuntao Qian. 2753-2758 [doi]

CS-PCN: Context-Space Progressive Collaborative Network for Image DenoisingYuqi Jiang, Chune Zhang, Jiao Liu. 2759-2764 [doi]

DDT: Dual-branch Deformable Transformer for Image DenoisingKangliang Liu, Xiangcheng Du, Sijie Liu, Yingbin Zheng, Xingjiao Wu, Cheng Jin. 2765-2770 [doi]

Adaptively Hashing 3DLUTs for Lightweight Real-time Image EnhancementFengyi Zhang, Lin Zhang, Tianjun Zhang, Dongqing Wang. 2771-2776 [doi]

Frequency-Assisted Adaptive Sharpening Scheme Considering Bitrate and Quality TradeoffYingxue Pang, Shijie Zhao, Haiqiang Wang, Gen Zhan, Junlin Li, Li Zhang 0006. 2777-2782 [doi]

Text-Guided Mask-Free Local Image RetouchingZerun Liu, Fan Zhang, Jingxuan He, Jin Wang, Zhangye Wang, Lechao Cheng. 2783-2788 [doi]

3O: Transferring Visual Representations for Reinforcement Learning via PromptingGuoliang You, Xiaomeng Chu, Yifan Duan, Jie Peng, Jianmin Ji, Yu Zhang 0086, Yanyong Zhang. 2789-2794 [doi]

Accurate and Complete Captions for Question-controlled Text-aware Image CaptioningYehuan Wang, Jian Hu, Lin Shang 0001. 2795-2800 [doi]

Multi-level Part-aware Feature Disentangling for Text-based Person SearchYuhao Chen, Guoqing Zhang 0002, Hongwei Zhang, Yuhui Zheng, Weisi Lin. 2801-2806 [doi]

SPTNET: Span-based Prompt Tuning for Video GroundingYiren Zhang, Yuanwu Xu, MoHan Chen, Yuejie Zhang, Rui Feng, Shang Gao 0003. 2807-2812 [doi]

ERPG: Enhancing Entity Representations with Prompt Guidance for Complex Named Entity RecognitionXingyu Zhu 0017, Feifei Dai, Xiaoyan Gu, Haihui Fan, Bo Li 0063, Weiping Wang 0005. 2813-2818 [doi]

DBIA: Data-Free Backdoor Attack Against Transformer NetworksPeizhuo Lv, Hualong Ma, Jiachen Zhou, Ruigang Liang, Kai Chen 0012, Shengzhi Zhang, Yunfei Yang. 2819-2824 [doi]

Multimodal Fake News Detection via CLIP-Guided LearningYangming Zhou, Yuzhou Yang, Qichao Ying, Zhenxing Qian, Xinpeng Zhang 0001. 2825-2830 [doi]

Downstream Task-agnostic Transferable Attacks on Language-Image Pre-training ModelsYiqiang Lv, Jingjing Chen, Zhipeng Wei, Kai Chen 0027, Zuxuan Wu, Yu-Gang Jiang. 2831-2836 [doi]

Multimodal Stacked Cross Attention Network for Fine-Grained Fake News DetectionZhongqiang Huang, Yuxue Hu, Zhi Zeng, Xiang Li, Ying Sha. 2837-2842 [doi]

Adaptive and Robust Fourier-Mellin-Based Image Watermarking for Social Networking PlatformsJinghong Xia, Hongxia Wang 0001, Sani M. Abdullahi, Heng Wang, Fei Zhang, Bingling Luo. 2843-2848 [doi]

Adversarial Attacks on Generated Text DetectorsPengcheng Su, Rongxin Tu, Hongmei Liu 0001, Yue Qing, Xiangui Kang. 2849-2854 [doi]

Automated Software Vulnerability Detection via Curriculum LearningQianjin Du, Wei Kun, Xiaohui Kuang, Xiang Li 0078, Gang Zhao. 2855-2860 [doi]

Correcting the Bias: Mitigating Multimodal Inconsistency Contrastive Learning for Multimodal Fake News DetectionZhi Zeng, Mingmin Wu, Guodong Li, Xiang Li, Zhongqiang Huang, Ying Sha. 2861-2866 [doi]

Meaningful ciphertext image encryption based on histogram shift and ND-ICM hyperchaosShiwei Jing, Jianjun Li, Wanyong Tian. 2867-2872 [doi]

Hierarchical Class Level Attribute Guided Generative Meta Learning for Pest Image Zero-shot LearningShansong Wang, Qingtian Zeng, Weijian Ni, Xue Zhang, Cheng Cheng. 2873-2878 [doi]

Semantic-visual Guided Transformer for Few-shot Class-incremental LearningWenhao Qiu, Sichao Fu, Jingyi Zhang, Chengxiang Lei, Qinmu Peng. 2885-2890 [doi]

Dual Episodic Sampling and Momentum Consistency Regularization for Unsupervised Few-shot LearningJiaxin Chen, Yanxu Hu, Meng Shen, Andy J. Ma. 2891-2896 [doi]

Cross-domain Prototype Contrastive loss for Few-shot 2D Image-Based 3D Model RetrievalYaqian Zhou, Yu Liu, Dan Song, Jiayu Li, Xuanya Li, An-An Liu. 2897-2902 [doi]

Few-Shot Object Detection via Back Propagation and Dynamic LearningDianlong You, Peng Wang, Yi Zhang, Ling Wang, Shunfu Jin. 2903-2908 [doi]

Multi-Level Correlation Network For Few-Shot Image ClassificationYunkai Dang, Meijun Sun, Min Zhang, Zhengyu Chen, Xinliang Zhang, Zheng Wang, Donglin Wang. 2909-2914 [doi]

Irecut+MM: Data Generalization and Metric Improvement for Few-shot LearningXixiang Lin, Zhenghao Li, Liangchen Liu, Jun Wu, Lijun Zhang, Xiang-Dong Zhou. 2915-2920 [doi]

Counting and Locating Anything: Class-agnostic Few-shot Object Counting and LocalizationYiwen Zhang, Hailun Zhang, Qijun Zhao. 2921-2926 [doi]

Knowledge Prompt Makes Composed Pre-Trained Models Zero-Shot News CaptionerYanhui Wang, Ning Xu 0003, Hongshuo Tian, Bo Lv, Yulong Duan, Xuanya Li, An-An Liu. 28779-2884 [doi]

runs on WebDSL