MultiMedia Modeling - 26th International Conference, MMM 2020, Daejeon, South Korea, January 5-8, 2020, Proceedings, Part II - researchr publication

researchr

You are not signed in
Sign in
Sign up

Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui 0001, Jung-Woo Choi, Min-Chun Hu, Wesley De Neve, editors, MultiMedia Modeling - 26th International Conference, MMM 2020, Daejeon, South Korea, January 5-8, 2020, Proceedings, Part II. Volume 11962 of Lecture Notes in Computer Science, Springer, 2020. [doi]

Conference: mmm2020

Abstract is missing.

Multi-scale Comparison Network for Few-Shot LearningPengfei Chen, Minglei Yuan, Tong Lu. 3-13 [doi]

Semantic and Morphological Information Guided Chinese Text ClassificationJiayu Song, QingHua Xu, Wei Liu, Yueran Zu, Mengdong Chen. 14-26 [doi]

A Delay-Aware Adaptation Framework for Cloud Gaming Under the Computation Constraint of User DevicesDuc V. Nguyen, Huyen T. T. Tran, Truong Cong Thang. 27-38 [doi]

Efficient Edge Caching for High-Quality 360-Degree Video DeliveryDongbiao He, Jinlei Jiang, Cédric Westphal, Guangwen Yang. 39-51 [doi]

Inferring Emphasis for Real Voice Data: An Attentive Multimodal Neural Network ApproachSuping Zhou, Jia Jia 0001, Long Zhang, Yanfeng Wang, Wei Chen, Fanbo Meng, Fei Yu, Jialie Shen. 52-62 [doi]

PRIME: Block-Wise Missingness Handling for Multi-modalities in Intelligent Tutoring SystemsXi Yang, Yeo-Jin Kim, Michelle Taub, Roger Azevedo, Min Chi. 63-75 [doi]

A New Local Transformation Module for Few-Shot SegmentationYuwei Yang, Fanman Meng, Hongliang Li, Qingbo Wu, Xiaolong Xu, Shuai Chen. 76-87 [doi]

Background Segmentation for Vehicle Re-identificationMingjie Wu, Yongfei Zhang, Tianyu Zhang, Wenqi Zhang. 88-99 [doi]

Face Tells Detailed Expression: Generating Comprehensive Facial Expression Sentence Through Facial Action UnitsJoanna Hong, Hong Joo Lee, Yelin Kim, Yong Man Ro. 100-111 [doi]

A Deep Convolutional Deblurring and Detection Neural Network for Localizing Text in VideosYang Wang, Ye Qian, Jiahao Shi, Feng Su. 112-124 [doi]

Generate Images with Obfuscated Attributes for Private Image ClassificationWei Hou, Dakui Wang, Xiaojun Chen 0004. 125-135 [doi]

Context-Aware Residual Network with Promotion Gates for Single Image Super-ResolutionXiaozhong Ji, Yirui Wu, Tong Lu. 136-147 [doi]

A Compact Deep Neural Network for Single Image Super-ResolutionXiaoyu Xu, Jian Qian, Li Yu 0003, Shengju Yu, Hao Tao, Ran Zhu. 148-160 [doi]

An Efficient Algorithm of Facial Expression Recognition by TSG-RNN NetworkKai Huang, Jianjun Li, Shichao Cheng, Jie Yu 0007, Wanyong Tian, Lulu Zhao, Junfeng Hu, Chin-Chen Chang 0001. 161-174 [doi]

Structured Neural Motifs: Scene Graph Parsing via Enhanced ContextYiming Li, Xiaoshan Yang, Changsheng Xu. 175-188 [doi]

Perceptual Localization of Virtual Sound Source Based on Loudspeaker TripletDuanzheng Guan, Dengshi Li, Xuebei Cai, Xiaochen Wang, Ruimin Hu. 189-200 [doi]

TK-Text: Multi-shaped Scene Text Detection via Instance SegmentationXiaoge Song, Yirui Wu, Wenhai Wang, Tong Lu. 201-213 [doi]

More-Natural Mimetic Words Generation for Fine-Grained Gait DescriptionHirotaka Kato, Takatsugu Hirayama, Ichiro Ide, Keisuke Doman, Yasutomo Kawanishi, Daisuke Deguchi, Hiroshi Murase. 214-225 [doi]

Lite Hourglass Network for Multi-person Pose EstimationYing Zhao, Zhiwei Luo, Changqin Quan, Dianchao Liu, Gang Wang. 226-238 [doi]

Single View Depth Estimation via Dense Convolution Network with Self-supervisionYunhan Sun, Jinlong Shi, Suqin Bai, Qiang Qian, Zhengxing Sun. 241-253 [doi]

Multi-data UAV Images for Large Scale Reconstruction of BuildingsMenghan Zhang, Yunbo Rao, Jiansu Pu, Xun Luo, Qifei Wang. 254-266 [doi]

Deformed Phase Prediction Using SVM for Structured Light Depth GenerationSen Xiang, Qiong Liu 0001, Huiping Deng, Jin Wu, Li Yu 0003. 267-278 [doi]

Extraction of Multi-class Multi-instance Geometric Primitives from Point Clouds Using Energy MinimizationLiang Wang, Biying Yan, Fuqing Duan, Ke Lu. 279-290 [doi]

Similarity Graph Convolutional Construction Network for Interactive Action RecognitionXiangyu Sun, Qiong Liu 0001, You Yang. 291-303 [doi]

Content-Aware Cubemap Projection for Panoramic Image via Deep Q-LearningZihao Chen, Xu Wang 0006, Yu Zhou, Longhao Zou, Jianmin Jiang. 304-315 [doi]

Robust RGB-D Data Registration Based on Correntropy and Bi-directional DistanceTeng Wan, Shaoyi Du, Wenting Cui, Qixing Xie, Yuying Liu, Zuoyong Li. 316-326 [doi]

InSphereNet: A Concise Representation and Classification Method for 3D ObjectHui Cao, Haikuan Du, Siyu Zhang, Shen Cai. 327-339 [doi]

3-D Oral Shape Retrieval Using Registration AlgorithmWenting Cui, Shaoyi Du, Teng Wan, Yan Liu, Yuying Liu, Yang Yang 0025, Qingnan Mou, Mengqi Han, Yu-Cheng Guo. 340-349 [doi]

Face Super-Resolution by Learning Multi-view Texture CompensationYu Wang, Tao Lu 0001, Ruobo Xu, Yanduo Zhang. 350-360 [doi]

Light Field Salient Object Detection via Hybrid PriorsJunlin Zhang, Xu Wang. 361-372 [doi]

Multimedia Analytics Challenges and Opportunities for Creating Interactive Radio ContentWerner Bailer, Maarten Wijnants 0001, Hendrik Lievens, Sandy Claes. 375-387 [doi]

Interactive Search and Exploration in Discussion Forums Using Multimodal EmbeddingsIva Gornishka, Stevan Rudinac, Marcel Worring. 388-399 [doi]

An Inverse Mapping with Manifold Alignment for Zero-Shot LearningXixun Wu, Binheng Song, Zhixiang Wang, Chun Yuan. 400-411 [doi]

Baseline Analysis of a Conventional and Virtual Reality Lifelog Retrieval SystemAaron Duane, Cathal Gurrin. 412-423 [doi]

An Extensible Framework for Interactive Real-Time Visualizations of Large-Scale Heterogeneous Multimedia Information from Online SourcesAikaterini Katmada, George Kalpakis, Theodora Tsikrika, Stelios Andreadis, Stefanos Vrochidis, Ioannis Kompatsiaris. 424-435 [doi]

GLENDA: Gynecologic Laparoscopy Endometriosis DatasetAndreas Leibetseder, Sabrina Kletz, Klaus Schoeffmann, Simon Keckstein, Jörg Keckstein. 439-450 [doi]

Kvasir-SEG: A Segmented Polyp DatasetDebesh Jha, Pia H. Smedsrud, Michael A. Riegler, Pål Halvorsen, Thomas de Lange, Dag Johansen, Håvard D. Johansen. 451-462 [doi]

Rethinking the Test Collection Methodology for Personal Self-tracking DataFrank Hopfgartner, Cathal Gurrin, Hideo Joho. 463-474 [doi]

Experiences and Insights from the Collection of a Novel Multimedia EEG DatasetGraham Healy, Zhengwei Wang, Tomás Ward, Alan F. Smeaton, Cathal Gurrin. 475-486 [doi]

Relation Modeling with Graph Convolutional Networks for Facial Action Unit DetectionZhilei Liu, Jiahui Dong, Cuicui Zhang, Longbiao Wang, Jianwu Dang. 489-501 [doi]

Enhanced Gaze Following via Object Detection and Human Pose EstimationJian Guan, Liming Yin, Jianguo Sun, Shuhan Qi, Xuan Wang, Qing Liao 0001. 502-513 [doi]

Region Based Adversarial Synthesis of Facial Action UnitsZhilei Liu, Diyi Liu, Yunpeng Wu. 514-526 [doi]

Facial Expression Restoration Based on Improved Graph Convolutional NetworksZhilei Liu, Le Li, Yunpeng Wu, Cuicui Zhang. 527-539 [doi]

Global Affective Video Content Regression Based on Complementary Audio-Visual FeaturesXiaona Guo, Wei Zhong, Long Ye, Li Fang, Yan Heng, Qin Zhang 0009. 540-550 [doi]

Studying Public Medical Images from the Open Access Literature and Social Networks for Model Training and Knowledge ExtractionHenning Müller, Vincent Andrearczyk, Oscar Alfonso Jiménez del Toro, Anjani Dhrangadhariya, Roger Schaer, Manfredo Atzori. 553-564 [doi]

AttenNet: Deep Attention Based Retinal Disease Classification in OCT ImagesJun Wu, Yao Zhang, Jie Wang, Jianchun Zhao, Dayong Ding, Ningjiang Chen, Lingling Wang, Xuan Chen, Chunhui Jiang, Xuan Zou, Xing Liu, Hui Xiao, Yuan Tian, Zongjiang Shang, Kaiwei Wang, Xirong Li, Gang Yang 0001, Jianping Fan 0001. 565-576 [doi]

NOVA: A Tool for Explanatory Multimodal Behavior Analysis and Its Application to PsychotherapyTobias Baur, Sina Clausen, Alexander Heimerl, Florian Lingenfelser, Wolfgang Lutz, Elisabeth André. 577-588 [doi]

Instrument Recognition in Laparoscopy for Technical Skill AssessmentSabrina Kletz, Klaus Schoeffmann, Andreas Leibetseder, Jenny Benois-Pineau, Heinrich Husslein. 589-600 [doi]

Real-Time Recognition of Daily Actions Based on 3D Joint Movements and Fisher EncodingPanagiotis Giannakeris, Georgios Meditskos, Konstantinos Avgerinakis, Stefanos Vrochidis, Ioannis Kompatsiaris. 601-613 [doi]

Model-Based and Class-Based Fusion of Multisensor DataAthina Tsanousa, Angelos Chatzimichail, Georgios Meditskos, Stefanos Vrochidis, Ioannis Kompatsiaris. 614-625 [doi]

Evaluating the Generalization Performance of Instrument Classification in Cataract Surgery VideosNatalia Sokolova, Klaus Schoeffmann, Mario Taschwer, Doris Putzgruber-Adamitsch, Yosuf El-Shabrawi. 626-636 [doi]

Compact Position-Aware Attention Network for Image Semantic SegmentationYajun Xu, Zhendong Mao, Peng Zhang, Bin Wang. 639-650 [doi]

Law Is Order: Protecting Multimedia Network Transmission by Game Theory and Mechanism DesignChuanbin Liu, Youliang Tian, Hongtao Xie. 651-668 [doi]

Rational Delegation Computing Using Information Theory and Game Theory ApproachQiuxian Li, Youliang Tian. 669-680 [doi]

Multi-hop Interactive Cross-Modal RetrievalXuecheng Ning, Xiaoshan Yang, Changsheng Xu. 681-693 [doi]

Browsing Visual Sentiment Datasets Using Psycholinguistic GroundingsMarc A. Kastner, Ichiro Ide, Yasutomo Kawanishi, Takatsugu Hirayama, Daisuke Deguchi, Hiroshi Murase. 697-702 [doi]

Framework Design for Multiplayer Motion Sensing Game in Mixture RealityChih-Yao Chang, Bo-I Chuang, Chi-Chun Hsia, Wen-Cheng Chen, Min-Chun Hu. 703-708 [doi]

Lyrics-Conditioned Neural Melody GenerationYi Yu 0001, Florian Harscoët, Simon Canales, Gurunath Reddy M, Suhua Tang, Junjun Jiang. 709-714 [doi]

A Web-Based Visualization Tool for 3D Spatial Coverage Measurement of Aerial ImagesAbdullah Alfarrarjeh, Zeyu Ma, Seon Ho Kim, Yeonsoo Park, Cyrus Shahabi. 715-721 [doi]

An Attention Based Speaker-Independent Audio-Visual Deep Learning Model for Speech EnhancementZhongbo Sun, Yannan Wang, Li Cao. 722-728 [doi]

DIME: An Online Tool for the Visual Comparison of Cross-modal Retrieval ModelsTony Zhao, Jaeyoung Choi, Gerald Friedland. 729-733 [doi]

Real-Time Demonstration of Personal Audio and 3D Audio Rendering Using Line Array SystemsJung-Woo Choi. 734-738 [doi]

A CNN-Based Multi-scale Super-Resolution Architecture on FPGA for 4K/8K UHD ApplicationsYongwoo Kim, Jae-Seok Choi, Jaehyup Lee, Munchurl Kim. 739-744 [doi]

Effective Utilization of Hybrid Residual Modules in Deep Neural Networks for Super ResolutionAbdul Muqeet, Sung-Ho Bae. 745-750 [doi]

diveXplore 4.0: The ITEC Deep Interactive Video Exploration System at VBS2020Andreas Leibetseder, Bernd Münzer, Jürgen Primus, Sabrina Kletz, Klaus Schoeffmann. 753-759 [doi]

Combining Boolean and Multimedia Retrieval in vitrivr for Large-Scale Video SearchLoris Sauter, Mahnaz Amiri Parian, Ralph Gasser, Silvan Heller, Luca Rossetto, Heiko Schuldt. 760-765 [doi]

An Interactive Video Search Platform for Multi-modal Retrieval with Advanced ConceptsNguyen-Khang Le, Dieu-Hien Nguyen, Minh-Triet Tran. 766-771 [doi]

VIREO @ Video Browser Showdown 2020Phuong Anh Nguyen, Jiaxin Wu, Chong-Wah Ngo, Danny Francis, Benoit Huet. 772-777 [doi]

VERGE in VBS 2020Stelios Andreadis, Anastasia Moumtzidou, Konstantinos Apostolidis, Konstantinos Gkountakos, Damianos Galanopoulos, Emmanouil Michail, Ilias Gialampoukidis, Stefanos Vrochidis, Vasileios Mezaris, Ioannis Kompatsiaris. 778-783 [doi]

VIRET at Video Browser Showdown 2020Jakub Lokoc, Gregor Kovalcík, Tomás Soucek. 784-789 [doi]

SOM-Hunter: Video Browsing with Relevance-to-SOM Feedback LoopMiroslav Kratochvíl, Patrik Veselý, Frantisek Mejzlík, Jakub Lokoc. 790-795 [doi]

Exquisitor at the Video Browser Showdown 2020Björn Þór Jónsson 0001, Omar Shahbaz Khan, Dennis C. Koelma, Stevan Rudinac, Marcel Worring, Jan Zahálka. 796-802 [doi]

Deep Learning-Based Video Retrieval Using Object Relationships and Associated Audio ClassesByoungjun Kim, Ji Yea Shim, Minho Park, Yong Man Ro. 803-808 [doi]

IVIST: Interactive VIdeo Search Tool in VBS 2020Sungjune Park, Jaeyub Song, Minho Park, Yong Man Ro. 809-814 [doi]

runs on WebDSL