ICMR '22: International Conference on Multimedia Retrieval, Newark, NJ, USA, June 27 - 30, 2022 - researchr publication

researchr

You are not signed in
Sign in
Sign up

Vincent Oria, Maria Luisa Sapino, Shin'ichi Satoh 0001, Brigitte Kerhervé, Wen-Huang Cheng, Ichiro Ide, Vivek K. Singh 0001, editors, ICMR '22: International Conference on Multimedia Retrieval, Newark, NJ, USA, June 27 - 30, 2022. ACM, 2022. [doi]

Conference: mir2022

Abstract is missing.

TransPCC: Towards Deep Point Cloud Compression via TransformersZujie Liang, Fan Liang. 1-5 [doi]

The Impact of Dataset Splits on Classification Performance in Medical VideosMarkus Fox, Klaus Schoeffmann. 6-10 [doi]

OSCARS: An Outlier-Sensitive Content-Based Radiography Retrieval SystemXiaoyuan Guo, Jiali Duan, Saptarshi Purkayastha, Hari Trivedi, Judy Wawira Gichoya, Imon Banerjee. 11-18 [doi]

Unseen Food SegmentationYuma Honbu, Keiji Yanai. 19-23 [doi]

DMPCANet: A Low Dimensional Aggregation Network for Visual Place RecognitionYinghao Wang, Haonan Chen, Jiong Wang, Yingying Zhu 0001. 24-28 [doi]

VideoCLIP: A Cross-Attention Model for Fast Video-Text Retrieval Task with Image CLIPYikang Li, Jenhao Hsiao, Chiuman Ho. 29-33 [doi]

Music-to-Dance Generation with Multiple ConformerMingao Zhang, Changhong Liu, Yong Chen, Zhenchun Lei, Mingwen Wang. 34-38 [doi]

OCR-oriented Master Object for Text Image CaptioningWenliang Tang, Zhenzhen Hu, Zijie Song, Richang Hong. 39-43 [doi]

Supervised Contrastive Vehicle Quantization for Efficient Vehicle RetrievalYongbiao Chen, Kaicheng Guo, Fangxin Liu, Yusheng Huang, Zhengwei Qi. 44-48 [doi]

Fashion Style-Aware Embeddings for Clothing Image RetrievalRino Naka, Marie Katsurai, Keisuke Yanagi, Ryosuke Goto. 49-53 [doi]

Multiple Biological Granularities Network for Person Re-IdentificationShuyuan Tu, Tianzhen Guan, Li Kuang. 54-62 [doi]

TriReID: Towards Multi-Modal Person Re-Identification via Descriptive Fusion ModelYajing Zhai, Yawen Zeng, Da Cao, Shaofei Lu. 63-71 [doi]

Temporal-Consistent Visual Clue Attentive Network for Video-Based Person Re-IdentificationBingliang Jiao, Liying Gao, Peng Wang. 72-80 [doi]

Pluggable Weakly-Supervised Cross-View Learning for Accurate Vehicle Re-IdentificationLu Yang, Hongbang Liu, Lingqiao Liu, Jinghao Zhou, Lei Zhang, Peng Wang, Yanning Zhang. 81-89 [doi]

An Effective Two-way Metapath Encoder over Heterogeneous Information Network for RecommendationYanbin Jiang, Huifang Ma, Xiaohui Zhang, Zhixin Li, Liang Chang. 90-98 [doi]

Multi-Modal Contrastive Pre-training for RecommendationZhuang Liu, Yunpu Ma, Matthias Schubert, Yuanxin Ouyang, Zhang Xiong 0001. 99-108 [doi]

Flexible Order Aware Sequential RecommendationMingda Qian, Xiaoyan Gu, Lingyang Chu, Feifei Dai, Haihui Fan, Bo Li 0063. 109-117 [doi]

Sequential Intention-aware Recommender based on User Interaction GraphJinpeng Chen, Yuan Cao 0003, Fan Zhang, Pengfei Sun, Kaimin Wei. 118-126 [doi]

TransHash: Transformer-based Hamming Hashing for Efficient Image RetrievalYongbiao Chen, Sheng Zhang, Fangxin Liu, Zhigang Chang, Mang Ye, Zhengwei Qi. 127-136 [doi]

Constructing Phrase-level Semantic Labels to Form Multi-Grained Supervision for Image-Text RetrievalZhihao Fan, Zhongyu Wei, Zejun Li, Siyuan Wang, Haijun Shan, Xuanjing Huang, Jianqing Fan. 137-145 [doi]

Relevance-based Margin for Contrastively-trained Video Retrieval ModelsAlex Falcon, Swathikiran Sudhakaran, Giuseppe Serra 0001, Sergio Escalera, Oswald Lanz. 146-157 [doi]

CLIP4Hashing: Unsupervised Deep Hashing for Cross-Modal Video-Text RetrievalYaoxin Zhuo, Yikang Li, Jenhao Hsiao, Chiuman Ho, Baoxin Li. 158-166 [doi]

Nearest Neighbor Search with Compact Codes: A Decoder PerspectiveKenza Amara, Matthijs Douze, Alexandre Sablayrolles, Hervé Jégou. 167-175 [doi]

Teaching a New Dog Old Tricks: Contrastive Random Walks in Videos with Unsupervised PriorsJan Schutte, Pascal Mettes. 176-184 [doi]

FedNKD: A Dependable Federated Learning Using Fine-tuned Random Noise and Knowledge DistillationShaoxiong Zhu, Qi Qi 0001, Zirui Zhuang, Jingyu Wang 0001, Haifeng Sun, Jianxin Liao. 185-193 [doi]

Weakly Supervised Fine-grained Recognition based on Combined Learning for Small Data and Coarse LabelAnqi Hu, Zhengxing Sun, Qian Li. 194-201 [doi]

Real-Time Deepfake System for Live StreamingYifei Fan, Modan Xie, Peihan Wu, Gang Yang. 202-205 [doi]

EmoMTB: Emotion-aware Music Tower BlocksAlessandro B. Melchiorre, David Penz, Christian Ganhör, Oleg Lesota, Vasco Fragoso, Florian Friztl, Emilia Parada-Cabaleiro, Franz Schubert, Markus Schedl. 206-210 [doi]

ViRMA: Virtual Reality Multimedia AnalyticsAaron Duane, Björn Pór Jónsson. 211-214 [doi]

Person Search by Uncertain AttributesTingting Dong, Jianquan Liu. 215-218 [doi]

Dual-Level Decoupled Transformer for Video CaptioningYiqi Gao, Xinglin Hou, Wei Suo, Mengyang Sun, Tiezheng Ge, Yuning Jiang, Peng Wang. 219-228 [doi]

Cross-Modal Retrieval between Event-Dense Text and ImageZhongwei Xie, Lin Li, Luo Zhong, Jianquan Liu, Ling Liu. 229-238 [doi]

Learning Hierarchical Semantic Correspondences for Cross-Modal Image-Text RetrievalSheng Zeng, Changhong Liu, Jun Zhou 0001, Yong Chen, Aiwen Jiang, Hanxi Li. 239-248 [doi]

Ingredient-enriched Recipe Generation from Cooking VideosJianlong Wu, Liangming Pan, Jingjing Chen, Yu-Gang Jiang. 249-257 [doi]

Cross-lingual Adaptation for Recipe Retrieval with MixupBin Zhu, Chong-Wah Ngo, Jingjing Chen, Wing Kwong Chan. 258-267 [doi]

Disentangled Representations and Hierarchical Refinement of Multi-Granularity Features for Text-to-Image SynthesisPei-Dong, Lei Wu 0002, Lei Meng, Xiangxu Meng. 268-276 [doi]

Style-woven Attention Network for Zero-shot Ink Wash Painting Style TransferHaochen Sun, Lei Wu, Xiang Li, Xiangxu Meng. 277-285 [doi]

Automatic Visual Recognition of Unexploded Ordnances Using Supervised Deep LearningGeorgios Begkas, Panagiotis Giannakeris, Konstantinos Ioannidis, Georgios Kalpakis, Theodora Tsikrika, Stefanos Vrochidis, Ioannis Kompatsiaris. 286-294 [doi]

Generating Topological Structure of Floorplans from Room AttributesYu Yin, Will Hutchcroft, Naji Khosravan, Ivaylo Boyadzhiev, Yun Fu, Sing Bing Kang. 295-303 [doi]

MultiCLU: Multi-stage Context Learning and Utilization for Storefront Accessibility Detection and EvaluationXuan Wang, Jiajun Chen, Hao Tang, Zhigang Zhu. 304-312 [doi]

UF-VTON: Toward User-Friendly Virtual Try-On NetworkYuan Chang, Tao Peng 0006, Ruhan He, Xinrong Hu, Junping Liu, Zili Zhang, Minghua Jiang. 313-321 [doi]

Learning Sample Importance for Cross-Scenario Video Temporal GroundingPeijun Bao, Yadong Mu. 322-329 [doi]

Efficient Linear Attention for Fast and Accurate Keypoint MatchingSuwichaya Suwanwimolkul, Satoshi Komorita. 330-341 [doi]

Video2Subtitle: Matching Weakly-Synchronized Sequences via Dynamic Temporal AlignmentBen Xue, Chenchen Liu, Yadong Mu. 342-350 [doi]

Dual-Channel Localization Networks for Moment Retrieval with Natural LanguageBolin Zhang, Bin Jiang 0006, Chao Yang, Liang Pang. 351-359 [doi]

Phrase-level Prediction for Video Temporal LocalizationSizhe Li, Chang Li, Minghang Zheng, Yang Liu. 360-368 [doi]

Joint Modality Synergy and Spatio-temporal Cue Purification for Moment LocalizationXingyu Shen, Long Lan, Huibin Tan, Xiang Zhang, Xurui Ma, Zhigang Luo. 369-379 [doi]

HybridVocab: Towards Multi-Modal Machine Translation via Multi-Aspect AlignmentRu Peng, Yawen Zeng, Junbo Zhao. 380-388 [doi]

Improving Image Captioning via Enhancing Dual-Side Context AwarenessYiqi Gao, Ning Wang, Wei Suo, Mengyang Sun, Peng Wang. 389-397 [doi]

Improve Image Captioning by Modeling Dynamic Scene Graph ExtensionMinghao Geng, Qingjie Zhao. 398-406 [doi]

Summarizing Videos using Concentrated Attention and Considering the Uniqueness and Diversity of the Video FramesEvlampios E. Apostolidis, Georgios Balaouras, Vasileios Mezaris, Ioannis Patras. 407-415 [doi]

Fashion Image Search via Anchor-Free DetectorShanchuan Gao, Fankai Zeng, Lu Cheng, Jicong Fan, Mingbo Zhao. 416-425 [doi]

Unsupervised Contrastive Masking for Visual Haze ClassificationJingyu Li, Haokai Ma, Xiangxian Li, Zhuang Qi, Lei Meng, Xiangxu Meng. 426-434 [doi]

MuLER: Multiplet-Loss for Emotion RecognitionAnwer Slimi, Mounir Zrigui, Henri Nicolas. 435-442 [doi]

STAFNet: Swin Transformer Based Anchor-Free Network for Detection of Forward-looking Sonar ImageryXingyu Zhu, Yingshuo Liang, Jianlei Zhang, Zengqiang Chen 0001. 443-450 [doi]

Camouflaged Poisoning Attack on Graph Neural NetworksChao Jiang, Yi He, Richard Chapman, Hongyi Wu. 451-461 [doi]

Accelerated Sign Hunter: A Sign-based Black-box Attack via Branch-Prune Strategy and Stabilized Hierarchical SearchSiyuan Li, Guangji Huang, Xing Xu 0001, Yang Yang 0002, Fumin Shen. 462-470 [doi]

DiGAN: Directional Generative Adversarial Network for Object TransfigurationZhen Luo, Yingfang Zhang, Peihao Zhong, Jingjing Chen, Donglong Chen. 471-479 [doi]

GIO: A Timbre-informed Approach for Pitch Tracking in Highly Noisy EnvironmentsXiaoheng Sun, Xia Liang, Qiqi He, Bilei Zhu, Zejun Ma. 480-488 [doi]

Source-free Temporal Attentive Domain Adaptation for Video Action RecognitionPeipeng Chen, Andy J. Ma. 489-497 [doi]

Review of Deep Learning Models for Spine SegmentationNeng Zhou, Hairu Wen, Yi Wang, Yang Liu, Longfei Zhou. 498-507 [doi]

3D-Augmented Contrastive Knowledge Distillation for Image-based Object Pose EstimationZhidan Liu 0004, Zhen Xing, Xiangdong Zhou, Yijiang Chen, Guichun Zhou. 508-517 [doi]

Selective Hypergraph Convolutional Networks for Skeleton-based Action RecognitionYiran Zhu, Guangji Huang, Xing Xu 0001, Yanli Ji, Fumin Shen. 518-526 [doi]

Self-Lifting: A Novel Framework for Unsupervised Voice-Face Association LearningGuangyu Chen, Deyuan Zhang, Tao Liu 0001, Xiaoyong Du 0001. 527-535 [doi]

Revisiting Performance Measures for Cross-Modal HashingHongya Wang, Shunxin Dai, Ming Du, Bo Xu 0023, Mingyong Li. 536-544 [doi]

Local Slot Attention for Vision and Language NavigationYifeng Zhuang, Qiang Sun, Yanwei Fu, Lifeng Chen, Xiangyang Xue. 545-553 [doi]

Cross-Pixel Dependency with Boundary-Feature Transformation for Weakly Supervised Semantic SegmentationYuhui Guo, Xun Liang 0001, Tang Hui, Bo Wu, Xiangping Zheng. 554-561 [doi]

Mobile Emotion Recognition via Multiple Physiological Signals using Convolution-augmented TransformerKangning Yang, Benjamin Tag, Yue Gu, Chaofan Wang, Tilman Dingler, Greg Wadley, Jorge Gonçalves 0001. 562-570 [doi]

VAC-Net: Visual Attention Consistency Network for Person Re-identificationWeidong Shi, Yunzhou Zhang, Shangdong Zhu, Yixiu Liu, Sonya Coleman, Dermot Kerr. 571-578 [doi]

MFGAN: A Lightweight Fast Multi-task Multi-scale Feature-fusion Model based on GANLijia Deng, Yu-Dong Zhang. 579-586 [doi]

Adaptive Temporal Grouping for Black-box Adversarial Attacks on VideosZhipeng Wei, Jingjing Chen, Hao Zhang, Linxi Jiang, Yu-Gang Jiang. 587-593 [doi]

Parallelism Network with Partial-aware and Cross-correlated Transformer for Vehicle Re-identificationGuangqi Jiang, Huibing Wang, Jinjia Peng, XianPing Fu. 594-600 [doi]

Motor Learning based on Presentation of a Tentative GoalSiqi Sun, Yongqing Sun, Mitsuhiro Goto, Shigekuni Kondo, Dan Mikami, Susumu Yamamoto. 601-607 [doi]

Extracting Precedence Relations between Video Lectures in MOOCsKui Xiao, Youheng Bai, Yan Zhang. 608-614 [doi]

M2TR: Multi-modal Multi-scale Transformers for Deepfake DetectionJunke Wang, Zuxuan Wu, Wenhao Ouyang, Xintong Han, Jingjing Chen, Yu-Gang Jiang, Ser-Nam Li. 615-623 [doi]

Blindfold Attention: Novel Mask Strategy for Facial Expression RecognitionBo Fu, Yuanxin Mao, Shilin Fu, Yonggong Ren, Zhongxuan Luo. 624-630 [doi]

MSSPQ: Multiple Semantic Structure-Preserving Quantization for Cross-Modal RetrievalLei Zhu, Liewu Cai, Jiayu Song, Xinghui Zhu, Chengyuan Zhang, Shichao Zhang. 631-638 [doi]

Lesion Localization in OCT by Semi-Supervised Object DetectionYue Wu, Yang Zhou, Jianchun Zhao, Jingyuan Yang, Weihong Yu, Youxin Chen, Xirong Li 0001. 639-646 [doi]

Weakly Supervised Pediatric Bone Age Assessment Using Ultrasonic Images via Automatic Anatomical RoI DetectionYunyan Yan, Chuanbin Liu, Hongtao Xie, Sicheng Zhang, Zhendong Mao. 647-653 [doi]

I2-Net: Intra- and Inter-scale Collaborative Learning Network for Abdominal Multi-organ SegmentationChao Suo, Xuanya Li, Donghui Tan, Yuan Zhang, Xieping Gao. 654-660 [doi]

SA-NAS-BFNR: Spatiotemporal Attention Neural Architecture Search for Task-based Brain Functional Network RepresentationFenxia Duan, Chunhong Cao, Xieping Gao. 661-667 [doi]

Weakly-supervised Cerebrovascular Segmentation Network with Shape Prior and Model IndicatorQian Wu, Yufei Chen, Ning Huang, Xiaodong Yue. 668-676 [doi]

FreqCAM: Frequent Class Activation Map for Weakly Supervised Object LocalizationRunsheng Zhang. 677-680 [doi]

Reproducibility Companion Paper: Human Object Interaction Detection via Multi-level Conditioned NetworkYunqing He, Xu Sun, Hui Jiang, Tongwei Ren, Gangshan Wu, Maria Sinziana Astefanoaei, Andreas Leibetseder. 681-684 [doi]

Introduction to the Fifth Annual Lifelog Search Challenge, LSC'22Cathal Gurrin, Liting Zhou, Graham Healy, Björn Þór Jónsson 0001, Duc-Tien Dang-Nguyen, Jakub Lokoc, Minh-Triet Tran, Wolfgang Hürst, Luca Rossetto, Klaus Schöffmann. 685-687 [doi]

MAD '22 Workshop: Multimedia AI against DisinformationBogdan Ionescu, Giorgos Kordopatis-Zilos, Adrian Popescu 0001, Luca Cuccovillo, Symeon Papadopoulos. 688-689 [doi]

ICDAR'22: Intelligent Cross-Data Analysis and RetrievalMinh-Son Dao, Michael Alexander Riegler, Duc-Tien Dang-Nguyen, Cathal Gurrin, Yuta Nakashima, Mianxiong Dong. 690-691 [doi]

MMArt-ACM 2022: 5th Joint Workshop on Multimedia Artworks Analysis and Attractiveness Computing in MultimediaNaoko Nitta, Anita Min-Chun Hu, Kensuke Tobitani. 692-693 [doi]

runs on WebDSL