Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2021, Tokyo, Japan, December 14-17, 2021

researchr

You are not signed in
Sign in
Sign up

Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2021, Tokyo, Japan, December 14-17, 2021. IEEE, 2021. [doi]

Conference: apsipa2021

Abstract is missing.

Measuring Attractiveness of Tourism Resources by Focusing on Kansei Value Structure: Possibility of Inviting Visitors Using the Japanese Heritage "Ako Salt."Tomomi Hatano, Tomomi Takezawa, Masashi Sugimoto, Kuangzhe Xu, Takashi Morikawa, Yasuhiro Azuma, Kazuo Shibuta, Noriko Nagata. 1-7 [doi]

Coprime Microphone Arrays for Estimating Speech Direction of Arrival Using Deep LearningJiahong Zhao, Christian Ritz 0001. 1-8 [doi]

Fast-Parallel Singular Value Thresholding for Many Small Matrices based on Geometric Feature of Singular ValuesTakayuki Sasaki, Ryuichi Tanida, Masaki Kitahara, Hideaki Kimata. 1-8 [doi]

End-to-End Speaker Age and Height Estimation using Attention Mechanism and Triplet LossManav Kaushik, Van Tung Pham, Tran The Anh, Eng Siong Chng. 1-8 [doi]

Binaural Adaptive Feedback Cancellation Based on Prediction Error Method Using Interaural Level Differences in Hearing DeviceYuto Ueda, Hidetoshi Nakashima, Yuuki Yuno, Nobuhiko Hiruma. 9-16 [doi]

Dual-channel Drum Separation for Low-cost Drum Recording Using Non-negative Matrix FactorizationCheng-Yu Cai, Yu-Hui Su, Li Su. 17-22 [doi]

Mask-based Beamforming Using Complex-valued Neural Network for Recognition of Spatial Target SpeechDaichi Hayakawa, Takehiko Kagoshima, Hiroshi Fujimura. 23-29 [doi]

Moving Sound Source Tracking in Wide Space by Multiple Microphone ArraysToru Takahashi, Takuma Ekawa, Masato Nakayama. 30-35 [doi]

Study on Simultaneous Estimation of Glottal Source and Vocal Tract Parameters by ARMAX-LF Model for Speech Analysis/SynthesisKai Li, Masashi Unoki, Yongwei Li, Jianwu Dang, Masato Akagi. 36-43 [doi]

Low-Power Booth Multiplication without Dynamic Range Detection in FFTs for FMCW Radar Signal ProcessingOguz Meteer, Marco Jan Gerrit Bekooij. 44-48 [doi]

Kronecker Product Adaptive Beamforming for Microphone ArraysXuehan Wang, Gongping Huang, Israel Cohen, Jacob Benesty, Jingdong Chen. 49-54 [doi]

An Optimal Variable-Latency Architecture for Deterministic Approaches to Stochastic Computing with Unary Bit Stream Preserving PropertiesOguz Meteer, Marco Jan Gerrit Bekooij. 55-62 [doi]

Domain Specific Description in Halide for Randomized Image ConvolutionHiroyasu Takagi, Norishige Fukushima. 63-69 [doi]

Fast Still Picture Coding for VVCKei Kawamura, Kyohei Unno, Yoshitaka Kidani. 70-73 [doi]

Accelerating Finite Impulse Response Filtering Using Tensor CoresTakumi Kondo, Yoshihiro Maeda, Norishige Fukushima. 74-79 [doi]

Hisui: an Image and Video Processing Framework with Auto-optimizerIppei Okuda, Masahiro Takaoka, Tomoaki Tsumura. 80-87 [doi]

Color Transformation for Compressive Computing in Image FilteringYoshihiro Maeda, Norishige Fukushima, Takayuki Hamamoto. 88-92 [doi]

Imbalanced sample feature enhancement of hyperspectral imagery classificationXumin Yu, Yan Feng, Yanlong Gao. 93-99 [doi]

Improved Fruit Fly Optimization Algorithm Based on Simulated Annealing in Neural NetworkJin Wu, Wei Dai, Yu Wang, Bo Zhao. 100-105 [doi]

An Implementation Method of HEVC Dataflow Graph Based on Reconfigurable ProcesserYun Zhu, Chuanzhan Hu, Lin Jiang, XuBang Shen. 106-112 [doi]

An improved naive bayes model for air temperature predictionBinghong Jiang. 113-120 [doi]

An IDE for Reconfigurable Video Array ProcessorRong Yang, Xiaoyan Xie, Miaomiao Chai, Lin Fang, Wanqi He, Jingtao Sun. 121-126 [doi]

A Reconfigurable Parallelization of Generative Adversarial Networks based on Array ProcessorXiaoyan Xie, Miaomiao Chai, Zhuolin Du, Kun Yang, Shaorun Yin. 127-132 [doi]

Performance Characterization of Rasterization Algorithms for Reconfigurable Graphics ProcessorJunyong Deng, Qingqing Ma, Zekun Ye. 133-140 [doi]

Non-parallel Voice Conversion with Generative Attentional NetworksTse Wei Chiu, You-Sheng Guo, Pao-Chi Chang. 141-145 [doi]

Unpaired Image Demoiréing Based on Cyclic Moiré LearningHyunkook Park, Vien Gia An, Yeong Jun Koh, Chul Lee. 146-150 [doi]

Residual Dilated U-Net with Spatially Adaptive Normalization for the Restoration of Under Display Camera ImagesYoungjin Oh, Gu Yong Park, Haesoo Chung, Sunwoo Cho, Nam Ik Cho. 151-157 [doi]

Lossless Image Compression Based on Image Decomposition and Progressive Prediction Using Convolutional Neural NetworksJae Hoon Shim, Hochang Rhee, Yeong Il Jang, Geonsu Lee, Seyun Kim, Nam Ik Cho. 158-163 [doi]

Facial Video Frame Interpolation Combining Symmetric and Asymmetric MotionsJintae Kim, Junheum Park, Whan Choi, Chang-Su Kim 0001. 164-169 [doi]

Face Anti-Spoofing Using Multi-Branch CNNCong Tin Nguyen, Bach-Tung Pham, Thi-Phuong Le, Tzu-Chiang Tai, Jia-Ching Wang. 170-173 [doi]

Generalization characteristics of complex-valued reservoir computing for interferometric synthetic aperture radar applicationsBungo Konishi, Akira Hirose, Ryo Natsuaki. 174-178 [doi]

A Hypercomplex Tensor-SVD and Its ApplicationTakehiko Mizoguchi, Isao Yamada. 179-186 [doi]

Learning Properties of Feedforward Neural Networks Using Dual NumbersYuto Okawa, Tohru Nitta. 187-192 [doi]

Adaptive Subsurface Imaging based on Peak Phase-Profile: The Significance in Separation of Scattering Phase from Propagation PhaseAkira Hirose, Soshi Shimomura. 193-199 [doi]

Discussion on the Origin of the Strength of Phasor Quaternion Self-Organizing MapYicheng Song, Akira Hirose. 200-204 [doi]

Learning the Statistical Model of the NMF Using the Deep Multiplicative Update Algorithm with ApplicationsHiroki Tanji, Takahiro Murakami. 205-211 [doi]

An Improved Parameter Free Genetic Algorithm for CSD-FIR Filter designRyota Kato, Kenji Suyama. 212-217 [doi]

A Proposal toward Standardization of Design Examples for IIR Filter Design MethodsYuta Harigae, Kazuki Matumoto, Kenji Suyama. 218-221 [doi]

On Optimal Realizations for All-Pass Fractional Delay Digital FiltersShunsuke Koshita. 222-225 [doi]

Low-pass maximally flat IIR digital differentiator design with arbitrary flatness degreeTakashi Yoshida. 226-231 [doi]

On Sparse Graph Estimation Under Statistical and Laplacian ConstraintsJitendra K. Tugnait. 232-239 [doi]

Ordering Principal Components of Multivariate Fractional Brownian Motion for Solving Inverse ProblemsMarisa Mohr, Ralf Möller 0001. 240-247 [doi]

Spatial Normalization to Reduce Positional Complexity in Direction-aided Supervised Binaural Sound Source SeparationRyu Takeda, Kazuhiro Nakadai, Kazunori Komatani. 248-253 [doi]

Phase-aware Audio Inpainting Based on Instantaneous FrequencyTomoro Tanaka, Kohei Yatabe, Yasuhiro Oikawa. 254-258 [doi]

Statistical-Mechanical Analysis of Adaptive Volterra Filter for Time-Varying Unknown SystemKoyo Kugiyama, Kimiko Motonaka, Yoshinobu Kajikawa, Seiji Miyoshi. 259-263 [doi]

High-accuracy reconstruction of periodic signals based on compressive sensingDailys Arronde Pérez, Hubert Zangl. 264-268 [doi]

Semi-Supervised Sound Event Detection Using Self-Attention and Multiple Techniques of Consistency TrainingYih-Wen Wang, Chia-Ping Chen, Chung-Li Lu, Bo-Cheng Chan. 269-274 [doi]

Nonlinear SVM-Type Automatic Dicision Algorithm in Noisy Environment for Hammering Test SystemKouki Hori, Nari Tanabe, Masaya Fujisawa. 275-281 [doi]

Nearby-person Occlusion Data Augmentation for Human Pose Estimation with Non-extra AnnotationsYucheng Chen, Mingyi He, Yuchao Dai. 282-287 [doi]

Dense Depthmap Prediction from Ultrasonic SensorsKoki Yasui, Fumihiko Sakaue, Jun Sato, Yu Koyama, Mitsuyasu Matsuura. 288-294 [doi]

Feedback Quantization and Bit Allocation for Networked Control Systems with Rate Limited ChannelsKazuya Hanamoto, Shuichi Ohno. 295-298 [doi]

Enhanced Loop-weakened Belief Propagation Algorithm for Performance Enhanced Polar Code DecodersArvid B. Van Den Brink, Marco Jan Gerrit Bekooij. 299-304 [doi]

Positional-Spectral-Temporal Attention in 3D Convolutional Neural Networks for EEG Emotion RecognitionJiyao Liu, Yanxi Zhao, Hao Wu, Dongmei Jiang. 305-312 [doi]

Integrated spectral kurtosis analysisArvid Trapp, Peter Wolfsteiner. 313-317 [doi]

Computational Complexity Reduced Belief Propagation Algorithm for Polar Code DecodersArvid B. Van Den Brink, Marco Jan Gerrit Bekooij. 318-323 [doi]

Node Clustering of Time-Varying Graphs Based on Temporal Label SmoothnessKatsuki Fukumoto, Koki Yamada, Yuichi Tanaka. 324-329 [doi]

Recovery of Time Series of Graph Signals Over Dynamic TopologyEisuke Yamagata, Shunsuke Ono. 330-336 [doi]

An Empirical Study on Compressed Decentralized Stochastic Gradient Algorithms with Overparameterized ModelsArjun Ashok Rao, Hoi-To Wai. 337-343 [doi]

Model Selection-inspired Coefficients Optimization for Polynomial-Kernel Graph LearningCheng Yang 0003, Fen Wang, Minxiang Ye, Guangtao Zhai, Xiao-Ping Zhang 0002, Vladimir Stankovic 0001, Lina Stankovic. 344-350 [doi]

Channel-Wise Early Stopping without a Validation Set via NNK Polytope InterpolationDavid Bonet, Antonio Ortega, Javier Ruiz Hidalgo, Sarath Shekkizhar. 351-358 [doi]

Modeling the dynamics of observational behaviors base on observers' personality traits using hidden Markov ModelsKuangzhe Xu, Noriko Nagata, Toshihiko Matsuka. 359-365 [doi]

Estimating Beverage Preference Based on Subjective Emotional Reactions and EEG ActivityKuangzhe Xu, Kenji Katahira, Yoichi Yamazaki, Fan Zhang, Naoki Nishida, Yuichiro Tamai, Naoyuki Matsuzaki, Noriko Nagata. 366-372 [doi]

Aizuchi as a sign of internal information processing and its interpretations by listenersYoshiko Kawabata, Toshihiko Matsuka. 380-385 [doi]

Internal state estimation by thermal image and identification of face and nose positionYuta Watanabe, Yoshitsugu Manabe, Noriko Yata. 386-391 [doi]

On Improving the Accuracy of Object Detection for High Resolution Images Based on SSDKei Irie, Yicheng Qiu, Kiyoshi Nishikawa. 392-399 [doi]

Detection of Note Onsets From EEG While Listening to MusicYuiko Kumagai, Toshihisa Tanaka. 400-405 [doi]

Speech Enhancement Network with Unsupervised Attention using Invariant Information ClusteringYosuke Sugiura, Shunta Nagamori, Tetsuya Shimamura. 406-409 [doi]

Event-Related Spectrogram Representation of EEG for CNN-Based P300 SpellerAyana Mussabayeva, Zangar Ermaganbet, Prashant Kumar Jamwal, Muhammad Tahir Akhtar. 410-415 [doi]

Cost-Effective Proportionate Affine Projection Algorithm with Variable Parameters for Acoustic Feedback CancellationTimur Okhassov, Prashant Kumar Jamwal, Muhammad Tahir Akhtar. 416-422 [doi]

Self-supervised Visual Transformers for Breast Cancer DiagnosisNurbek Saidnassim, Beibit Abdikenov, Rauan Kelesbekov, Muhammad Tahir Akhtar, Prashant Kumar Jamwal. 423-427 [doi]

Pitch and Volume Stability in the Communicative Response of Adults with AutismKeiko Ochi, Masaki Kojima, Keiho Owada, Nobutaka Ono, Shigeki Sagayama, Hidenori Yamasue. 428-432 [doi]

On the Use of Speaker Information for Automatic Speech Recognition in Speaker-imbalanced CorporaSoky Kak, Sheng Li 0010, Masato Mimura, Chenhui Chu, Tatsuya Kawahara. 433-437 [doi]

Spectrograms Fusion-based End-to-end Robust Automatic Speech RecognitionHao Shi, Longbiao Wang, Sheng Li 0010, Cunhang Fan, Jianwu Dang, Tatsuya Kawahara. 438-442 [doi]

Conformer-based End-to-end Speech Recognition With Rotary Position EmbeddingShengqiang Li, Menglong Xu, Xiao-lei Zhang. 443-447 [doi]

Efficient conformer-based speech recognition with linear attentionShengqiang Li, Menglong Xu, Xiao-lei Zhang. 448-453 [doi]

One In A Hundred: Selecting the Best Predicted Sequence from Numerous Candidates for Speech RecognitionZhengkun Tian, Jiangyan Yi, Ye Bai, Jianhua Tao, Shuai Zhang 0014, Zhengqi Wen. 454-459 [doi]

Large-Context Automatic Speech Recognition Based on RNN TransducerAtsushi Kojima. 460-464 [doi]

An End-To-End Model from Speech to Clean Transcript for Parliamentary MeetingsMasato Mimura, Shinsuke Sakai, Tatsuya Kawahara. 465-470 [doi]

Data Augmentation Based on Frequency Warping for Recognition of Cleft Palate SpeechKento Fujiwara, Ryoichi Takashima, Chihiro Sugiyama, Nobukazu Tanaka, Kanji Nohara, Kazunori Nozaki, Tetsuya Takiguchi. 471-476 [doi]

An Investigation of Enhancing CTC Model for Triggered Attention-based Streaming ASRHuaibo Zhao, Yosuke Higuchi, Tetsuji Ogawa, Tetsunori Kobayashi. 477-483 [doi]

Significance of Data Augmentation for Improving Cleft Lip and Palate Speech RecognitionProtima Nomo Sudro, Rohan Kumar Das, Rohit Sinha 0003, S. R. Mahadeva Prasanna. 484-490 [doi]

Teager Energy Subband Filtered Features for Near and Far-Field Automatic Speech RecognitionMadhu R. Kamble, Shekhar Nayak, M. Ali Basha Shaik, Shakti P. Rath, Vikram Vij, Hemant A. Patil. 491-496 [doi]

Multitask-based joint learning approach to robust ASR for radio communication speechDuo Ma, Nana Hou, Van Tung Pham, Haihua Xu, Eng Siong Chng. 497-502 [doi]

Advanced language model fusion method for encoder-decoder model in Japanese speech recognitionDaiki Mori, Kengo Ohta, Ryota Nishimura, Atsunori Ogawa, Norihide Kitaoka. 503-510 [doi]

CSTD-Telugu Corpus: Crowd-Sourced Approach for Large-Scale Speech data collectionMirishkar Sai Ganesh, Vishnu Vidyadhara Raju Vegesna, Meher Dinesh Naroju, Sudhamay Maity, Prakash Yalla, Anil Kumar Vuppala. 511-517 [doi]

An Empirical Study on Transformer-Based End-to-End Speech Recognition with Novel Decoder MaskingShi-Yan Weng, Hsuan-Sheng Chiu, Berlin Chen. 518-522 [doi]

CycleGAN-based Non-parallel Speech Enhancement with an Adaptive Attention-in-attention MechanismGuochen Yu, Yutian Wang, Chengshi Zheng, Hui Wang, Qin Zhang. 523-529 [doi]

A Robust Maximum Likelihood Distortionless Response Beamformer based on a Complex Generalized Gaussian DistributionWeixin Meng, Chengshi Zheng, Xiaodong Li 0002. 530-535 [doi]

Speech Enhancement Based on Masking Approach Considering Speech Quality and Acoustic Confidence for Noisy Speech RecognitionShih-Chuan Chu, Chung-Hsien Wu, Yun-Wen Lin. 536-540 [doi]

DNN-Based Linear Prediction Residual Enhancement for Speech DereverberationXinyang Feng, Nuo Li, Zunwen He, Yan Zhang 0041, Wancheng Zhang. 541-545 [doi]

Mandarin Electro-Laryngeal Speech Enhancement based on Statistical Voice Conversion and Manual Tone ControlZhaopeng Qian, Haijun Niu, Li Wang, Kazuhiro Kobayashi, Shaochuan Zhang, Tomoki Toda. 546-552 [doi]

Incorporating Multi-Target in Multi-Stage Speech Enhancement Model for Better GeneralizationLu Zhang, Mingjiang Wang, Andong Li, Zehua Zhang, Xuyi Zhuang. 553-558 [doi]

Low-Power Convolutional Recurrent Neural Network For Monaural Speech EnhancementFei Gao, Haixin Guan. 559-563 [doi]

Multi-Channel Speech Enhancement with 2-D Convolutional Time-Frequency Domain Features and a Pre-Trained Acoustic ModelQuandong Wang, Junnan Wu, Zhao Yan, Sichong Qian, Liyong Guo, Lichun Fan, Weiji Zhuang, Peng Gao, Yujun Wang. 564-570 [doi]

Processing Phoneme Specific Segments for Cleft Lip and Palate Speech EnhancementProtima Nomo Sudro, Rohit Sinha 0003, S. R. Mahadeva Prasanna. 571-577 [doi]

Speech Enhancement by Noise Self-Supervised Rank-Constrained Spatial Covariance Matrix Estimation via Independent Deeply Learned Matrix AnalysisSota Misawa, Norihiro Takamune, Tomohiko Nakamura, Daichi Kitamura, Hiroshi Saruwatari, Masakazu Une, Shoji Makino. 578-584 [doi]

Causal Distortionless Response Beamforming by Alternating Direction Method of MultipliersYoshiki Masuyama, Kouei Yamaoka, Yuma Kinoshita, Nobutaka Ono. 585-590 [doi]

Stacked U-Net with High-Level Feature Transfer for Parameter Efficient Speech EnhancementJinyoung Lee, Hong-Goo Kang. 591-595 [doi]

Extension of virtual microphone technique to multiple real microphones and investigation of the impact of phase and amplitude interpolation on speech enhancementHanako Segawa, Li Li 0063, Shoji Makino, Takeshi Yamada. 597-602 [doi]

Comparative Study on DNN-based Minimum Variance Beamforming Robust to Small Movements of Sound SourcesKohei Saijo, Kazuhiro Katagiri, Masaru Fujieda, Tetsunori Kobayashi, Tetsuji Ogawa. 603-607 [doi]

Improvements to Non-Intrusive Intelligibility Prediction for Reverberant SpeechKazushi Nakazawa, Kazuhiro Kondo. 608-613 [doi]

A Target Speaker Separation Neural Network with Joint-TrainingWenjing Yang, Jing Wang, Hongfeng Li, Na Xu, Fei Xiang, Kai Qian, Shenghua Hu. 614-618 [doi]

Improvement of Spatial Ambiguity in Multi-Channel Speech Separation Using Channel AttentionQian-Bei Hong, Chung-Hsien Wu, Thanh Binh Nguyen, Hsin-Min Wang. 619-623 [doi]

Noise-Tolerant Time-Domain Speech Separation with Noise BasesKohei Ozamoto, Kuniaki Uto, Koji Iwano, Koichi Shinoda. 624-629 [doi]

Minimum-volume regularized ILRMA for blind audio source separationJianyu Wang, Shanzheng Guan, Xiao-lei Zhang. 630-634 [doi]

A comparison of handcrafted, parameterized, and learnable features for speech separationWenbo Zhu, Mou Wang, Xiao-lei Zhang, Susanto Rahardja. 635-639 [doi]

Over-Determined Semi-Blind Speech Source SeparationMasahito Togami, Robin Scheibler. 640-645 [doi]

Group Multi-Scale convolutional Network for Monaural Speech Enhancement in Time-domainJuntao Yu, Ting Jiang, JiaCheng Yu. 646-650 [doi]

Prior Distribution Design for Music Bleeding-Sound Reduction Based on Nonnegative Matrix FactorizationYusaku Mizobuchi, Daichi Kitamura, Tomohiko Nakamura, Hiroshi Saruwatari, Yu Takahashi, Kazunobu Kondo. 651-658 [doi]

A Study on Speech Enhancement Based on Diffusion Probabilistic ModelYen-Ju Lu, Yu Tsao 0001, Shinji Watanabe 0001. 659-666 [doi]

A Deep Analysis of Speech Separation Guided Diarization Under Realistic ConditionsXin Fang, Zhen-Hua Ling, Lei Sun, Shutong Niu, Jun Du, Cong Liu 0006, Zhi-Chao Sheng. 667-671 [doi]

Target Speaker Extraction for Customizable Query-by-Example Keyword SpottingQijie Shao, Jingyong Hou, Yanxin Hu, Qing Wang, Lei Xie 0001, Xin Lei. 672-678 [doi]

Time Domain Speech Enhancement With Attentive Multi-scale ApproachChen Chen, Nana Hou, Duo Ma, Eng Siong Chng. 679-683 [doi]

On Speech Sparsity for Computational Efficiency and Noise Reduction in Hearing AidsAdrien Llave, Simon Leglaive. 684-688 [doi]

Sparsely Overlapped Speech Training in the Time Domain: Joint Learning of Target Speech Separation and Personal VAD BenefitsQingjian Lin, Lin Yang, Xuyang Wang, Luyuan Xie, Chen Jia, Junjie Wang. 689-693 [doi]

Integration of Annotator-wise Estimations for Emotion Recognition by Using Group SoftmaxYuuki Tachioka. 694-699 [doi]

Hierarchical Prosody Analysis Improves Categorical and Dimensional Emotion RecognitionXingfeng Li, Taiyang Guo, Xinhui Hu, Xinkang Xu, Jianwu Dang, Masato Akagi. 700-704 [doi]

A Study of Salient Modulation Domain Features for Speaker IdentificationSimon W. McKnight, Aidan O. T. Hogg, Vincent W. Neo, Patrick A. Naylor. 705-712 [doi]

A Study on Decoupled Probabilistic Linear Discriminant AnalysisDi Wang, Lantian Li, Hongzhi Yu, Dong Wang. 713-718 [doi]

Generation of Speaker Representations Using Heterogeneous Training Batch AssemblyYu-Huai Peng, Hung-Shin Lee, Pin-Tuan Huang, Hsin-Min Wang. 719-724 [doi]

Speech Emotion Recognition with Fusion of Acoustic- and Linguistic-Feature-Based DecisionsRyotaro Nagase, Takahiro Fukumori, Yoichi Yamashita. 725-730 [doi]

Automatic Naturalness Recognition from Acted Speech Using Neural NetworksBagus Tris Atmaja, Akira Sasou, Masato Akagi. 731-736 [doi]

Comparative Study of Filter Banks to Improve the Performance of Voice Disorder Assessment Systems using LTAS FeaturesPurva Barche, Krishna Gurugubelli, Anil Kumar Vuppala. 737-742 [doi]

Dual Dropout Ranking of Linguistic Features for Alzheimer's Disease RecognitionXiaoquan Ke, Man-Wai Mak, Jinchao Li, Helen M. Meng. 743-749 [doi]

A Multilingual Framework Based on Pre-training Model for Speech Emotion RecognitionZhaohang Zhang, Xiaohui Zhang, Min Guo, Wei-Qiang Zhang, Ke Li, Yukai Huang. 750-755 [doi]

Filters Know How You Feel: Explaining Intermediate Speech Emotion Classification RepresentationsAnubhav Anand, Shubham Negi, N. Narendra. 756-761 [doi]

Detecting Multiple Disfluencies from Speech using Pre-linguistic Automatic Syllabification with Acoustic and Prosody FeaturesUtkarsh Mehrotra, Sparsh Garg, Krishna Gurugubelli, Anil Kumar Vuppala. 761-768 [doi]

Siamese Neural Network with Joint Bayesian Model Structure for Speaker VerificationXugang Lu, Peng Shen, Yu Tsao 0001, Hisashi Kawai. 769-774 [doi]

Deep Convolutional Neural Network for Voice Liveness DetectionSiddhant Gupta, Kuldeep Khoria, Ankur T. Patil, Hemant A. Patil. 775-779 [doi]

How Speech is Recognized to Be Emotional - A Study Based on Information DecompositionHaoran Sun, Lantian Li, Thomas Fang Zheng, Dong Wang 0013. 780-785 [doi]

Emotion-Controllable Speech Synthesis Using Emotion Soft Labels and Fine-Grained Prosody FactorsXuan Luo, Shinnosuke Takamichi, Tomoki Koriyama, Yuki Saito, Hiroshi Saruwatari. 794-799 [doi]

CA-VC: A Novel Zero-Shot Voice Conversion Method With Channel AttentionRuitong Xiao, Xiaofen Xing, Jichen Yang, Xiangmin Xu. 800-807 [doi]

Conditional Deep Hierarchical Variational Autoencoder for Voice ConversionKei Akuzawa, Kotaro Onishi, Keisuke Takiguchi, Kohki Mametani, Koichiro Mori. 808-813 [doi]

Noisy-to-Noisy Voice Conversion Framework with Denoising ModelChao Xie, Yi-Chiao Wu, Patrick Lumban Tobing, Wen-Chin Huang, Tomoki Toda. 814-820 [doi]

Acoustic Simulation of Body-conducted Speech and Its Use to Convert One's Recorded Voices to One's Own VoicesRuiyan Chen, Tazuko Nishimura, Nobuaki Minematsu, Daisuke Saito. 821-828 [doi]

Speech Reconstruction from The Larynx Vibration Feature Captured by Laser-Doppler Vibrometer SensorYi-Chieh Lin, Ji Yan Han, Yu-Min Lin, Wei-Zhong Zheng, Shuenn-Tsong Young, Ying-Hui Lai. 829-835 [doi]

StarGAN-based Emotional Voice Conversion for Japanese PhrasesAsuka Moritani, Shoki Sakamoto, Ryo Ozaki, Hirokazu Kameoka, Tadahiro Taniguchi. 836-840 [doi]

Understanding the Tradeoffs in Client-side Privacy for Downstream Speech TasksPeter Wu, Paul Pu Liang, Jiatong Shi, Ruslan Salakhutdinov, Shinji Watanabe 0001, Louis-Philippe Morency. 841-848 [doi]

Multi-speaker TTS system for low-resource language using cross-lingual transfer learning and data augmentationZolzaya Byambadorj, Ryota Nishimura, Altangerel Ayush, Kengo Ohta, Norihide Kitaoka. 849-853 [doi]

Towards Unseen Speakers Zero-Shot Voice Conversion with Generative Adversarial NetworksWeirui Lu, Xiaofen Xing, Xiangmin Xu, Weibin Zhang. 854-858 [doi]

Low-Resource Mandarin Prosodic Structure Prediction Using Self-TrainingXingrui Wang, Bowen Zhang, Takahiro Shinozaki. 859-863 [doi]

SPTTS: Parallel Speech Synthesis without Extra Aligner ModelZeqing Zhao, Xi Chen, Hui Liu, Xuyang Wang, Lin Yang, Junjie Wang. 864-869 [doi]

Investigation of Text-to-Speech-based Synthetic Parallel Data for Sequence-to-Sequence Non-Parallel Voice ConversionDing Ma, Wen-Chin Huang, Tomoki Toda. 870-877 [doi]

End-to-End Mandarin Tone Classification with Short Term Context InformationJiyang Tang, Ming Li. 878-883 [doi]

Rethinking Singing Voice Separation With Spectral- Temporal TransformerShuai Yu, Chenxing Li, Feng Deng, Xiaorui Wang. 884-889 [doi]

Investigating Time-Frequency Representations for Audio Feature Extraction in Singing Technique ClassificationYuya Yamamoto, Juhan Nam, Hiroko Terasawa, Yuzuru Hiraga. 890-896 [doi]

Implementation of Interactive Tools for Investigating Fundamental Frequency Response of Voiced Sounds to Auditory StimulationHideki Kawahara, Toshie Matsui, Kohei Yatabe, Ken-Ichi Sakakibara, Minoru Tsuzaki, Masanori Morise, Toshio Irino. 897-903 [doi]

Training Explainable Singing Quality Assessment Network with Augmented DataJinhu Li, Chitralekha Gupta, Haizhou Li 0001. 904-911 [doi]

Towards Reference-Independent Rhythm Assessment of Solo SingingChitralekha Gupta, Jinhu Li, Haizhou Li 0001. 912-919 [doi]

Pitch Estimation Algorithm for Narrowband Speech Signal using Phase Differences between HarmonicsYuya Hosoda, Arata Kawamura, Youji Iiguni. 920-925 [doi]

SVM-based evaluation of Thai tone imitations by Thai-naïve Mandarin and Vietnamese speakersJuqiang Chen, Tianyi Ni, Benjawan Kasisopa, Mark Antoniou, Catherine T. Best. 926-931 [doi]

On an Improved F0 Estimation Based on ℓ2-Norm Regularized TV-CAR Speech AnalysisKeiichi Funaki. 932-938 [doi]

CNN-based Discriminative Training for Domain Compensation in Acoustic Event Detection with Frame-wise ClassifierTiantian Tang, Xinyuan Zhou, Yanhua Long, Yijie Li, Jiaen Liang. 939-944 [doi]

Frequency Axis Pooling Method for Weakly Labeled Sound Event Detection and ClassificationMiao Liu, Jing Wang, Yujun Wang, Lidong Yang. 945-949 [doi]

A multi-source localization method based on clustering and outlier removalShang Gao, Maoshen Jia, Changchun Bao. 950-955 [doi]

Impulsive Timing Detection Based on Multi-Frame Phase Voting for Acoustic Event DetectionSakiko Mishima, Reishi Kondo. 956-960 [doi]

Multiple-Embedding Separation Networks: Sound Class-Specific Feature Extraction for Universal Sound SeparationHokuto Munakata, Ryu Takeda, Kazunori Komatani. 961-967 [doi]

Narrow-edged Beamforming Using Masked Parametric Array LoudspeakersYuting Geng, Haonan Wang, Masato Nakayama, Takanobu Nishiura. 968-973 [doi]

A Strongly-Labelled Polyphonic Dataset of Urban Sounds with Spatiotemporal ContextKenneth Ooi, Karn N. Watcharasupat, Santi Peksi, Furi Andi Karnapi, Zhen-Ting Ong, Danny Chua, Hui-Wen Leow, Li-Long Kwok, Xin-Lei Ng, Zhen-Ann Loh, Woon-Seng Gan. 982-988 [doi]

Formulation of Multidimensional Frequency Characteristics of Second-Order Nonlinear IIR FilterKenta Iwai, Yoshinobu Kajikawa, Takanobu Nishiura. 989-994 [doi]

Two-stage phase reconstruction using DNN and von Mises distribution-based maximum likelihoodNguyen Binh Thien, Yukoh Wakabayashi, Kenta Iwai, Takanobu Nishiura. 995-999 [doi]

Sharp-sound-image Construction Method Using Multichannel Sound System with Optimal Parametric Loudspeaker ArrangementYuna Harada, Naoto Shimada, Haonan Wang, Kenta Iwai, Masato Nakayama, Takanobu Nishiura. 1000-1007 [doi]

Virtual Sound Source Rendering Based on Distance Control to Penetrate Listeners Using Surround Parametric-array and Electrodynamic LoudspeakersTakuma Ekawa, Masato Nakayama, Toru Takahashi. 1008-1015 [doi]

Self-rotation angle estimation of circular microphone array based on sound field interpolationGuansan Lian, Yukoh Wakabayashi, Taishi Nakashima, Nobutaka Ono. 1016-1020 [doi]

Enriching Under-Represented Named Entities for Improved Speech RecognitionTingzhi Mao, Yerbolat Khassanov, Van Tung Pham, Haihua Xu, Hao Huang, Aishan Wumaier, Eng Siong Chng. 1021-1025 [doi]

Ensemble of One Model: Creating Model Variations for Transformer with Layer PermutationAndrew Liaw, Jia-Hao Hsu, Chung-Hsien Wu. 1026-1030 [doi]

Uncertainty estimation in automatic pronunciation assessment with pseudo samples based on deep kernel learningBinghuai Lin, Liyuan Wang. 1031-1036 [doi]

Retrieval-oriented E2E ASR Modeling for Improved Query-by-example Spoken Term DetectionTakumi Kurokawa, Atsuhiko Kai. 1037-1042 [doi]

Multilingual Approach to Joint Speech and Accent Recognition with DNN-HMM FrameworkYizhou Peng, Jicheng Zhang, Haobo Zhang, Haihua Xu, Hao Huang, Sheng Li 0010, Eng Siong Chng. 1043-1048 [doi]

Improving End-To-End Modeling for Mispronunciation Detection with Effective Augmentation MechanismsTien-Hong Lo, Yao-Ting Sung, Berlin Chen. 1049-1055 [doi]

Zero-shot Domain Adaptation with Inference Relation Paths for Spoken Language UnderstandingSixia Li, Jianwu Dang. 1056-1061 [doi]

End to End Spoken Language Understanding Using Partial Disentangled Slot EmbeddingTan Liu, Wu Guo. 1062-1066 [doi]

Multiple Deep Learning Models and Architectures with Different Numbers of States Used to Improve Retrieval Accuracy of Query-by-ExampleKazuki Hatakeyama, Masahiro Nishino, Kazunori Kojima, Shi-wook Lee, Yoshiaki Itoh 0001. 1067-1071 [doi]

Separable Temporal Convolution plus Temporally Pooled Attention for Lightweight High-Performance Keyword SpottingShenghua Hu, Jing Wang, Yujun Wang, Wenjing Yang. 1072-1076 [doi]

End-to-End Spontaneous Speech Recognition Using Hesitation LabelingKoharu Horii, Meiko Fukuda, Kengo Ohta, Ryota Nishimura, Atsunori Ogawa, Norihide Kitaoka. 1077-1081 [doi]

Unsupervised Spoken Term Discovery Using wav2vec 2.0Yu Iwamoto, Takahiro Shinozaki. 1082-1086 [doi]

Effect of Perceptual Training with Noise on Chinese Learners' English Consonant Reception ThresholdsJian Gong, Yameng Yu, William Bellamy, Feng Wang, Xiaoli Ji. 1087-1091 [doi]

Multi-view Convolution for LipreadingTsubasa Maeda, Satoshi Tamura. 1092-1096 [doi]

OLR 2021 Challenge: Datasets, Rules and BaselinesBinling Wang, Wenxuan Hu, Jing Li, Yiming Zhi, Zheng Li, Qingyang Hong, Lin Li 0032, Dong Wang, Liming Song, Cheng Yang. 1097-1103 [doi]

Cross-utterance Reranking Models with BERT and Graph Convolutional Networks for Conversational Speech RecognitionShih-Hsuan Chiu, Tien-Hong Lo, Fu-An Chao, Berlin Chen. 1104-1110 [doi]

Attention-based multi-channel speaker verification with ad-hoc microphone arraysChengdong Liang, Junqi Chen, Shanzheng Guan, Xiao-lei Zhang. 1111-1115 [doi]

Libri-adhoc40: A dataset collected from synchronized ad-hoc microphone arraysShanzheng Guan, Shupei Liu, Junqi Chen, Wenbo Zhu, Shengqiang Li, Xu Tan, Ziye Yang, Menglong Xu, Yijiang Chen, Chengdong Liang, Jianyu Wang, Xiao-lei Zhang. 1116-1120 [doi]

An MAP Estimation for Between-Class VarianceJiao Han, Yunqi Cai, Lantian Li, Guanyu Li, Dong Wang 0013. 1121-1126 [doi]

Mixing or Extracting? Further Exploring Necessity of Music Separation for Singer IdentificationYuxin Zhang, Yatong Xiao, Wei-Qiang Zhang, Xu Tan, Ling Lei, Shengjin Wang. 1127-1132 [doi]

A Unified Deep Speaker Embedding Framework for Mixed-Bandwidth Speech DataWeicheng Cai, Ming Li. 1133-1138 [doi]

Comparison of Low Complexity Self-Attention Mechanisms for Acoustic Event DetectionTatsuya Komatsu, Robin Scheibler. 1139-1143 [doi]

Dual-Path Transformer For Machine Condition MonitoringJisheng Bai, Mou Wang, Jianfeng Chen. 1144-1148 [doi]

Speaker count: A new building block for speaker diarizationThanh Thi Hien Duong, Phi-Le Nguyen, Hong Son Nguyen, Duc-Chien Nguyen, Huy Phan, Ngoc Q. K. Duong. 1149-1155 [doi]

Multitask Learning of Acoustic Scenes and Events Using Dynamic Weight Adaptation Based on Multi-focal LossKayo Nada, Keisuke Imoto, Reina Iwamae, Takao Tsuchiya. 1156-1160 [doi]

Investigation on Spatial and Frequency-Based Features for Asynchronous Acoustic Scene AnalysisYuki Shiroma, Keisuke Imoto, Sayaka Shiota, Nobutaka Ono, Hitoshi Kiya. 1161-1166 [doi]

Analysis on Roles of DNNs in End-to-End Acoustic Scene Analysis Framework with Distributed Sound-to-Light Conversion DevicesYuma Kinoshita, Nobutaka Ono. 1167-1172 [doi]

A Study on Optimal Filter of Feedforward Active Noise Control System Based on Analysis of Frequency ResponseKenta Iwai, Takanobu Nishiura. 1173-1179 [doi]

Design and Evaluation of Active Noise Control on Machinery NoiseShulin Wen, Nguyen Duy Hai, Miqing Wang, Woon-Seng Gan. 1180-1186 [doi]

A Subband Active Noise Control System with Automatic Tap Assignment in Consideration of Psychoacoustic PropertiesSatoshi Yamanouchi, Yoshinobu Kajikawa. 1187-1191 [doi]

A True Digital Feedforward Active Noise Control System with no Analog-to-Digital and Digital-to-Analog ConvertersMingzhe Li, Chuang Shi, Yue Wang. 1192-1196 [doi]

Development of Active Hear-Through Equalization Algorithm for EarphonesChong-Rui Huang, Cheng-Yuan Chang, Sen M. Kuo. 1197-1201 [doi]

Development of a Synthetic Database for Compact Neural Network Classification of Acoustic Scenes in Dementia Care EnvironmentsAbigail Copiaco, Christian Ritz 0001, Stefano Fasciani, Nidhal Abdulaziz. 1202-1209 [doi]

Reducing algorithmic delay using low-overlap window for online Wave-U-NetSotaro Nakaoka, Li Li 0063, Shoji Makino, Takeshi Yamada. 1210-1214 [doi]

Framewise Finite Impulse Response Filtering Based on Time-Frequency Mask for Low-Latency Speech EnhancementChiho Haruta, Nobutaka Ono, Yuma Kinoshita. 1215-1220 [doi]

Constrained Maximum Directivity Beamformers Based on Uniform Linear Acoustic Vector Sensor ArraysXueqin Luo, Jilu Jin, Gongping Huang, Jingdong Chen, Jacob Benesty, Israel Cohen, Wen Zhang. 1221-1225 [doi]

Multichannel Audio Source Separation with Independent Deeply Learned Matrix Analysis Using Product of Source ModelsTakuya Hasumi, Tomohiko Nakamura, Norihiro Takarnune, Hiroshi Saruwatari, Daichi Kitamura, Yu Takahashi, Kazunobu Kondo. 1226-1233 [doi]

Time Alignment using Lip Images for Frame-based Electrolaryngeal Voice ConversionYi-Syuan Liou, Wen-Chin Huang, Ming-Chi Yen, Shu-Wei Tsai, Yu-Huai Peng, Tomoki Toda, Yu Tsao 0001, Hsin-Min Wang. 1234-1238 [doi]

Estimation and Correction of Relative Transfer Function for Binaural Speech Separation Networks to Preserve Spatial CuesZicheng Feng, Yu Tsao 0001, Fei Chen 0011. 1239-1244 [doi]

MIMO Speech Compression and Enhancement Based on Convolutional Denoising AutoencoderYou-Jin Li, Syu-Siang Wang, Yu Tsao 0001, Borching Su. 1245-1250 [doi]

Predicting Patient's Choices of Hospital Levels Using Deep Learning and Representation ImprovementsLichin Chen, Ji-Tian Sheu, Yuh-Jue Chuang. 1251-1257 [doi]

Instrumented Romberg Test of Postural Stability in Patients with Vestibular Disorders using Inertial Measurement UnitsYu-Chieh Lin, Chia-Tai Chan, Kuan-Chung Ting, Kai-Chun Liu, Chia-Yeh Hsieh. 1258-1261 [doi]

A Self-attention-based Ensemble Convolution Neural Network Approach for Sleep Stage Classification with Merged SpectrogramChih-En Kuo, Po-Yu Liao, Yu-Syuan Lin. 1262-1268 [doi]

Seizure Classification of EEG based on Wavelet Signal Denoising Using a Novel Channel Selection AlgorithmNiamh McCallan, Scot Davidson, Kok Yew Ng, Pardis Biglarbeigi, Dewar D. Finlay, Boon Leong Lan, James McLaughlin 0001. 1269-1276 [doi]

A Recommendation Systems Approach for Detecting Epistasis in Genomic SignalsMario Banuelos, Marissa Hernandez. 1277-1280 [doi]

Understanding Structure Induced Functional Connectivity in Brain using EEGShefali Gupta, Tapan Kumar Gandhi, Pawan Sinha. 1281-1288 [doi]

Effect of Visual Attention and Driving Experiences on the Event-Related Potential P300 in the Perception of Traffic ScenesKota Yamamoto, Sou Nobukawa, Nobuhiko Wagatsuma, Keiichiro Inagaki. 1289-1293 [doi]

Toward Estimation of Abnormal Brake in Autonomous Vehicles from Electroencephalogram and Heart Rate IntervalErika Sekiguchi, Ken Kubota, Shun Nakamura, Kenichi Makita, Toshihisa Tanaka. 1294-1298 [doi]

Speaker Turn Aware Similarity Scoring for Diarization of Speech-Based Cognitive AssessmentsSean Shensheng Xu, Man-Wai Mak, Ka-Ho Wong, Helen Meng, Timothy C. Y. Kwok. 1299-1304 [doi]

Microphone Array Speech Separation Algorithm based on DNNChaoyan Wu, Lin Zhou, Xijin Chen, Liyuan Chen. 1305-1310 [doi]

Exploring Artifact Rejection for High-pulse Rate Electrically Evoked Auditory Steady State Responses in Cochlear Implants UsersHongmei Hu, Stephan Dieter Ewert. 1311-1316 [doi]

Depression Severity Level Classification Using Multitask Learning of Gender RecognitionYang Liu, Xiaoyong Lu, Daimin Shi, Jingyi Yuan. 1317-1322 [doi]

Multi-feature Fusion for Epileptic Focus Localization Based on Tensor RepresentationXuyang Zhao, Jordi Solé-Casals, Qibin Zhao, Jianting Cao, Toshihisa Tanaka. 1323-1327 [doi]

ADHD classification via auto-encoding network with non-imaging data fusionYibin Tang, Junping Jiang, Min Li, Ying Chen, Xiaojin Meng. 1328-1332 [doi]

Arrhythmia Classification Algorithm based on Sparse AutoencoderMengnan Liang, Aimin Jiang, Xiaofeng Liu 0006, Hon Keung Kwan, Yanping Zhu. 1333-1337 [doi]

Real-Time Monitoring System to Evaluate Exercise Load, Hypoxic Load, and Safety in a Normobaric Hypoxic roomKazuki Hisatsune, Aoi Noguchi, Toshitaka Yamakawa. 1338-1342 [doi]

Preoperative Monitoring Using Implantable, Multimodal, Multichannel ProbeManami Wakuya, Takao Inoue, Hirochika Imoto, Sadahiro Nomura, Michiyasu Suzuki, Toshitaka Yamakawa. 1343-1347 [doi]

Preliminary Study Using Autoencoder for Early Detection of Heat Illness from Heart Rate Variability Obtained with Wearable DeviceNao Inatsu, Aoi Noguchi, Koshi Ota, Koichi Fujiwara, Takatomi Kubo, Toshitaka Yamakawa. 1348-1352 [doi]

Mathematical Model of a Horse and the Rider during a JumpAsahi Tsuruo, Monamie Ringhofer, Shinya Yamamoto, Kazushi Ikeda. 1353-1356 [doi]

Evaluation of the Effect of Transfer Learning to Multi-Instance Detection of MonkeysRiza Rae Pineda, Takatomi Kubo, Masaki Shimada, Kazushi Ikeda. 1357-1362 [doi]

Semi-Supervised Estimation of Driving Behaviors Using Robust Time-Contrastive LearningTakuma Kuroki, Osamu Shouno, Junichiro Yoshimoto. 1363-1366 [doi]

Snapshot Multispectral Image Completion and Unmixing with Total Variation Regularization on Abundance MapsKeisuke Ozawa, Shinichi Sumiyoshi, Yuki Tachioka. 1367-1374 [doi]

Underwater Image Dehazing Based on Disparity Estimation and Color ConstraintYan Liu, Qingwu Li, Guanying Huo, Yan Zhou 0004, Dabin Yu. 1375-1380 [doi]

High Reflection Removal Using CNN with Detection and EstimationIsana Funahashi, Naoki Yamashita, Taichi Yoshida, Masaaki Ikehara. 1381-1385 [doi]

Intra Coding Tool Pruning for Reducing Complexity of VVC Screen Content CodingTong Tang, Shun Hu, Linfeng Cui, Zhiyang Yin. 1386-1390 [doi]

Image Compression Architecture with Built-in Lightweight ModelTien-Ying Kuo, Yu-Jen Wei, Jhih-Jhou Lin. 1391-1394 [doi]

Denoising Hyperspectral Images Using Interband CorrelationShuhei Takehisa, Masahiro Okuda. 1395-1399 [doi]

A Consensus Framework for Convolutional Dictionary Learning based on L1 Norm ErrorMizuki Takanashi, Yoshimitsu Kuroki. 1400-1404 [doi]

Noise Removal for Dynamic Mode Decomposition Based on Plug-and-Play ADMMShunki Anami, Ryo Matsuoka. 1405-1409 [doi]

New End-to-end Network for Stereo High Dynamic Range ImagingLifei Zhong, Jiantao Zhou. 1410-1415 [doi]

Moving Object Detection in HEVC VideoLieLin Pang, KokSheik Wong. 1416-1421 [doi]

Spatial Information Refinement for Chroma Intra Prediction in Video CodingChengyi Zou, Shuai Wan, Tiannan Ji, Marta Mrak, Marc Górriz Blanch, Luis Herranz. 1422-1427 [doi]

High-Quality Single Image 3D Facial Shape Reconstruction via Robust Albedo EstimationSuwoong Heo, Hyewon Song, Jiwoo Kang, Sanghoon Lee 0001. 1428-1432 [doi]

Speaker Independent and Multilingual/Mixlingual Speech-Driven Talking Head Generation Using Phonetic PosteriorgramsHuirong Huang, Zhiyong Wu 0001, Shiyin Kang, Dongyang Dai, Jia Jia 0001, Tianxiao Fu, Deyi Tuo, Guangzhi Lei, Peng Liu, Dan Su 0002, Dong Yu 0001, Helen Meng. 1433-1437 [doi]

HMM-based Lip Reading with Stingy Residual 3D ConvolutionQifeng Zeng, Jun Du, Zirui Wang. 1438-1443 [doi]

Deep Siamese network for low-resolution face recognitionShun-Cheung Lai, Kin-Man Lam 0001. 1444-1449 [doi]

Learn to Sketch: A fast approach for universal photo sketchZhi-Song Liu, Wan-Chi Siu, H. Anthony Chan. 1450-1457 [doi]

Head Movement Prediction using FCNNRabia Shafi, Wan Shuai, Hao Gong, Muhammad Usman Younus. 1458-1464 [doi]

A Study on Virtual Reality Sickness and Visual AttentionJeonghaeng Lee, Woojae Kim, Jinwoo Kim, Sanghoon Lee 0001. 1465-1469 [doi]

Quality of Interaction Arising from Augmented Reality Content: A Comprehensive StudySeongjean Kim, Jinwoo Kim, Sanghoon Lee 0001. 1470-1474 [doi]

E-PixelHop: An Enhanced PixelHop Method for Object ClassificationYijing Yang, Vasileios Magoulianitis, C. C. Jay Kuo. 1475-1482 [doi]

Real-Time Edge Attention-Based Learning for Low-Light One-Stage Object DetectionYen-Yu Pu, Ching-Te Chiu, Shu-Yun Wu. 1483-1487 [doi]

Checkerboard Corner Localization Accelerated with Deep False Detection for Multi-camera CalibrationJiwoo Kang, Hyunse Yoon, Seongmin Lee 0002, Sanghoon Lee 0001. 1488-1493 [doi]

Strategies of Traditional Chinese Character Recognition in Streetscape Based on Deep Learning NetworksSin-Wun Syu, Po-Chyi Su. 1494-1498 [doi]

An Efficient Image Processing and Machine Learning based Technique for Skin Lesion Segmentation and ClassificationIzbaila Imtiaz, Imran Ahmed 0002, Gwanggil Jeon, Shogo Muramatsu. 1499-1505 [doi]

Distributed Arithmetic Coding for Sources with Hidden Markov CorrelationYan Zhang, Nan Yang, Yong Fang 0001. 1506-1510 [doi]

Multi-Residual Feature Fusion Network for lightweight Single Image Super-ResolutionJiayi Qin, Zheng He, Binyu Yan, Gwanggil Jeon, Xiaomin Yang. 1511-1518 [doi]

Automotive Engine Cylinder Head Crack Detection: Canny Edge Detection With Morphological DilationMichael Abebe Berwo, Yong Fang, Jabar Mahmood, Ephrem Afele Retta. 1519-1527 [doi]

Acceleration of PDS-Based High-Dimensional Signal RestorationGai Yamamoto, Yuya Kodama, Shogo Muramatsu, Samuel Choi, Gwanggil Jeon. 1528-1535 [doi]

Product Quantization to Reduce Entropy of Labels for Fast and Accurate Image RetrievalFuga Nakamura, Ryosuke Harakawa, Masahiro Iwahashi. 1536-1540 [doi]

Deep Learning Analysis Models for Speech and Emotional RecognitionJun Wu, Tianliang Zhu, Chengtian Yu, Chunzhi Wang, Xianjing Zhou, Hu Liu. 1541-1545 [doi]

Infant Posture Assessment Based on Rotational Keypoint DetectionXuyang Zhao, Shogo Takata, Kosuke Fukumori, Toshihisa Tanaka. 1546-1550 [doi]

Text Description Generation from Videos via Deep Semantic ModelsLin Li, Kaixi Hu. 1551-1555 [doi]

View-invariant Feature using Pose Information and Flexible Matching Algorithm for Action RetrievalNoboru Yoshida, Jianquan Liu. 1556-1562 [doi]

Video-Based Sports Activity Recognition for ChildrenFeyisayo Olalere, Vincent Brouwers, Metehan Doyran, Ronald Poppe, Albert Ali Salah. 1563-1570 [doi]

Spatially varying white balancing for mixed and non-uniform illuminantsTeruaki Akazawa, Yuma Kinoshita, Hitoshi Kiya. 1571-1575 [doi]

Semantically Relevant Scene Detection Using Deep LearningDipanita Chakraborty, Werapon Chiracharit, Kosin Chamnongthai. 1576-1579 [doi]

Digital Halftone Classification using Simplified CNN and Stochastic StatisticsJing-Ming Guo, Sankarasrinivasan S. 1580-1584 [doi]

Implementation of AVS3 Multicast System Based on eMBMSLingfeng Fang, Chunhao Li, Songlin Sun. 1585-1589 [doi]

Robustness against adversary models on MNIST by Deep-Q Reinforcement Learning based Parallel-GANsRong Zhang, Pao-Chi Chang. 1590-1597 [doi]

Rate-Distortion Optimized Temporal Segmentation Using Reinforcement Learning for Video CodingJung Kyung Lee, Na-young Kim, Je-Won Kang. 1598-1601 [doi]

A Fusion Methodology of AKAZE and Neural Network for Fingerprint RecognitionFarchan Hakim Raswa, Agus Harjoko, Chrisantonius, Jia-Ching Wang. 1602-1606 [doi]

Context-based Matching Refinement for Person SearchByeong-Ju Han, Jae-Won Yang, Oggyu Lee, Jae-Young Sim. 1607-1610 [doi]

Partial Fingerprint on Combined Evaluation using Deep Learning and Feature DescriptorChrisantonius, Tri Kuntoro Priyambodo, Farchan Hakim Raswa, Jia-Ching Wang. 1611-1614 [doi]

Environment Adaptive 3D Pose Estimation Model and Learning StrategyYeseung Park, Kyoungoh Lee, Sanghoon Lee 0001. 1615-1620 [doi]

Tampering Detection for Speech Signals Using Synchronization Code and LSF-based WatermarksShengbei Wang, WeiTao Yuan, Zhen Zhang, Jianming Wang, Masashi Unoki. 1621-1626 [doi]

Improving Security in McAdams Coefficient-Based Speaker Anonymization by Watermarking MethodCandy Olivia Mawalim, Masashi Unoki. 1627-1633 [doi]

Hybridization of speech information hiding and encryption for double-layer security in speech communicationKasorn Galajit, Jessada Karnjana, Pakinee Aimmanee, Masashi Unoki. 1634-1639 [doi]

BSS-Based Extraction For Additive Video WatermarkingAkane Yokota, Masaki Kawamura. 1640-1646 [doi]

Detection of Periodic Pilot Signal in Image WatermarkingRinka Kawano, Masaki Kawamura. 1647-1652 [doi]

An Acoustic Communication Technique Based on Audio Data Hiding Utilizing Artificial Flowing Water SoundsTetsuya Kojima, Naoyuki Muraoka, Raito Matsuzaki. 1653-1657 [doi]

Semi-Supervised Learning for Facial Landmarks with Confidence and Augmentation Sifting MechanismsHao-Wen Chia, Jian-Jiun Ding. 1658-1661 [doi]

Deepfake Algorithm Using Multiple Noise Modalities with Two-Branch Prediction NetworkHsuan-Wei Hsu, Jian-Jiun Ding. 1662-1669 [doi]

Digital Multitone Image Reconstruction using Deep Generative Adversarial NetsJing-Ming Guo, S. Sankarasrinivasan. 1670-1673 [doi]

Smart Facial Skincare Products Using Computer Vision TechnologiesHung-Tse Chan, Ting-Yu Lin, Shih-Chun Deng, Chih-Hsien Hsia, Chin-Feng Lai. 1674-1677 [doi]

An Attention based Expert Inspection System for Smart ScalpSin-Ye Jhong, Po-Yen Yang, Chih-Hsien Hsia. 1678-1681 [doi]

Multi-Band NIR Colorization Using Structure-Aware NetworkMinje Park, Ju Han Lee, Sang Ho Lee, Jong-Ok Kim. 1682-1686 [doi]

Proximal Gradient-Based Loop Unrolling with Interscale ThresholdingRuiki Kobayashi, Shogo Muramatsu, Shunsuke Ono. 1687-1692 [doi]

Edge Map-guided Scale-iterative Image DeblurringSung-Jun Min, Suk-Ju Kang. 1693-1697 [doi]

Super-Resolution Imaging Using a Focus Pixel SensorSung-Min Woo, Jeong-Won Ha, Jong-Ok Kim. 1698-1702 [doi]

Multi-View Variational Autoencoder for Robust Classification against Irrelevant DataDaichi Nishikawa, Ryosuke Harakawa, Masahiro Iwahashi. 1703-1707 [doi]

Cross-Domain Recaptured Document Detection with Texture and Reflectance CharacteristicsJiabin Yan, Changsheng Chen. 1708-1715 [doi]

Joint estimation of image rotation angle and scaling factorKun Yu, Rongsong Yang, Hui Zeng, Anjie Peng. 1716-1721 [doi]

Undetectable JPEG Image Batch Reversible Data Hiding with Content-adaptive Payload AllocationYangguang Wang, Jinwei Li, Yuanzhi Yao, Nenghai Yu. 1722-1728 [doi]

Workload Based Model of Large Scale 1: N Biometrics Multi-Step Narrowing Down ProcessTakahiro Aoki. 1729-1735 [doi]

Evaluation on palm vein recognition of children in growingSoichi Hama. 1736-1740 [doi]

An Overloaded MU-MIMO Signal Detection Method Using Piecewise Continuous Nonconvex Sparse RegularizerAtsuya Hirayama, Kazunori Hayashi. 1741-1747 [doi]

Received Signal Power based Sensor Zone Estimation with Maximum Likelihood ApproachHiroki Honda, Kazunori Hayashi, Gurusanthosh Pabbisetty, Hiroki Mori. 1748-1755 [doi]

Anomaly Detection for Wireless Communication Links via Data Integrity ModelingMahyar Nemati, Jihong Park, Moongu Jeon, Jinho Choi 0001. 1756-1761 [doi]

A Comprehensive Study of Face Recognition Using Deep LearningKoichi Ito, Hiroya Kawai, Takafumi Aoki. 1762-1768 [doi]

Continuous biometric authentication for smartphones considering usage environmentsYuka Watanabe, Yasushi Yamazaki. 1769-1774 [doi]

Examining of Shallow Autoencoder on Black-box Attack against Face RecognitionVo Ngoc Khoi Nguyen, Takamichi Terada, Masakatsu Nishigaki, Tetsushi Ohki. 1775-1780 [doi]

Comparative Study of Feature Extraction Method for Emotional Classification by Micro-expressionsKoki Kato, Hironobu Takano, Masahiro Saiko, Masahiro Kubo, Hitoshi Imaoka. 1781-1785 [doi]

Detecting Deepfake Videos using Digital WatermarkingAmna Qureshi, David Megías, Minoru Kuribayashi. 1786-1793 [doi]

A Flexible Reversible Data Hiding Method in Compressible Encrypted ImagesRyota Motomura, Shoko Imaizumi, Hitoshi Kiya. 1794-1799 [doi]

Model Inversion Attack against a Face Recognition System in a Black-Box SettingShunsuke Yoshimura, Kazuaki Nakamura, Naoko Nitta, Noboru Babaguchi. 1800-1807 [doi]

Feature Extraction Suitable for Double JPEG Compression Analysis Based on Statistical Bias Observation of DCT CoefficientsDaichi Takeshita, Minoru Kuribayashi, Nobuo Funabiki. 1808-1814 [doi]

Feature Extraction Based on Denoising Auto Encoder for Classification of Adversarial ExamplesYuma Yamasaki, Minoru Kuribayashi, Nobuo Funabiki, Huy H. Nguyen, Isao Echizen. 1815-1820 [doi]

An Extended Reversible Data Hiding Method for HDR Images Using Edge EstimationMinagi Ueda, Shoko Imaizumi, KokSheik Wong. 1821-1827 [doi]

Image Watermarking based on Non-Newtonian Effect and Interpolated SWT-DWTAhmed-Khan, KokSheik Wong. 1828-1832 [doi]

Access Control Using Spatially Invariant Permutation of Feature Maps for Semantic Segmentation ModelsHiroki Ito, MaungMaung AprilPyone, Hitoshi Kiya. 1833-1838 [doi]

End-to-end Learning for Encrypted Image RetrievalQihua Feng, Peiya Li, ZhiXun Lu, Guan Liu, Feiran Huang. 1839-1845 [doi]

A Privacy-Preserving Image Retrieval Scheme Using A Codebook Generated from Independent Plain-Image DatasetKenta Iida, Hitoshi Kiya. 1846-1850 [doi]

A Protection Method of Trained CNN Model Using Feature Maps Transformed With Secret Key From Unauthorized AccessMaungMaung AprilPyone, Hitoshi Kiya. 1851-1857 [doi]

Deriving a Compact Analytical Model for Camera Response Functions with Application to Chartless Radiometric CalibrationZhenhua Qu, Ziqiang He, Xiangui Kang. 1858-1864 [doi]

A Study of Privacy Protection of Photos Taken by a Wide-angle Surveillance CameraKoki Nakai, Minoru Kuribayashi, Nobuo Funabiki. 1865-1871 [doi]

A Pilot Exploration of Industrial Video Scene Data Embedding using Real-Time MV-HEVCYik Siang Pang, Yiqi Tew. 1872-1876 [doi]

Relabel, Scramble, Synthesize: A Novel Coverless Steganography Approach via Collage ImageKoi Yee Ng, Simying Ong, Yuen Peng Loh, Chee Seng Chan. 1877-1882 [doi]

Deep Reinforcement Learning for NPDCCH Period Adjustment in NB-IoT NetworksYa-Ju Yu, Ching-Chih Chuang, Yu-Wei Cheng. 1883-1888 [doi]

A Threshold-based Scheduling and Power Control Design on IMT-2020 EvaluationTing-Yu Yeh, Wei-Chen Pao, Wei-Hung Chou, Chun-Chia Tsai, Jen-Yi Pan. 1889-1894 [doi]

Implementation of a fast failure recovery method considering load distribution for network slicingTakeru Misugi, Kouji Hirata, Takuji Tachibana. 1895-1898 [doi]

Multi-Armed Bandit-based Routing Method for In-network CachingGen Tabei, Yusuke Ito, Tomotaka Kimura, Kouji Hirata. 1899-1902 [doi]

Generalized Classification of DNS over HTTPS Traffic with Deep LearningLionel F. Gonzalez Casanova, Po-Chiang Lin. 1903-1907 [doi]

Inhibition modeling of future malware diffusion with an evolutionary game theoryHideyoshi Miura, Tomotaka Kimura, Kouji Hirata. 1908-1911 [doi]

An Adaptive Rank Selection Method in 3GPP 5G NR SystemsWei-Hung Chou, Wei-Chen Pao, Chun-Chia Tsai, Ting-Yu Yeh, Jen-Yi Pan. 1912-1916 [doi]

A Low Complexity PMI Selection Scheme for 3GPP 5G NR FDD SystemsChun-Chia Tsai, Ting-Yu Yeh, Wei-Hung Chou, Wei-Chen Pao, Jen-Yi Pan. 1917-1922 [doi]

Realizing 5G Network Slicing Provisioning with Open Source SoftwareKuan-Lin Lee, Chung-Nan Lee, Ming-Feng Lee. 1923-1930 [doi]

A Parking Monitoring System Using FMCW RadarsYao-Chiang Kan, Kuan-Tzu Chen, Hsueh-Chun Lin, Junghsi Lee. 1931-1934 [doi]

A Semi-Empirical Data-Rate Estimation Method of 5G RAN SlicingWen-Ping Lai, Ming-Jay Lai, Hong-Lun Lai. 1935-1941 [doi]

An Entropy-based DDoS attack Detection and Classification with Hierarchical Temporal MemoryManh-Hung Nguyen, Yu-Kuen Lai, Kai-Po Chang. 1942-1948 [doi]

Measurement of CO2 in Outdoor Environments Using LPWAN Based WSN and Its Time Correlation CharacteristicsKoki Kitazumi, Ryoma Yasutani, Shusuke Narieda, Hiroshi Naruse. 1949-1952 [doi]

Fundamental Investigation of Backoff Control Method for Fair Communication Opportunity of mmW WBAN in Overcrowded EnvironmentTsukasa Chida, Suguru Kameda, Noriharu Suematsu. 1953-1957 [doi]

Intra-System Interference Avoidance for Packet-Level Index Modulation in Internet of ThingsMai Ohta, Takeo Fujii. 1958-1962 [doi]

Offloading Selection with Unequal Timeslot in Mobile Edge ComputingNaotaka Hirayama, Takuya Kobayashi, Koichi Adachi. 1963-1968 [doi]

Highly Efficient Data Gathering with Tendency Prediction based on Position Information of Event in Wireless Sensor NetworksOsamu Takyu, Ryota Sugimoto. 1969-1974 [doi]

Mandarin Singing Voice Synthesis with a Phonology-based Duration ModelFu-Rong Yang, Yin-Ping Cho, Yi-Hsuan Yang, Da-Yi Wu, Shan-Hung Wu, Yi-Wen Liu. 1975-1981 [doi]

Task-Aware BERT-based Sentiment Analysis from Multiple Essences of the TextJia-Hao Hsu, Chung-Hsien Wu, Tsung-Hsien Yang. 1982-1986 [doi]

Convolutional Autoencoder based Deep Learning Model for Identification of Red Palm Weevil SignalsS. R. Parvathy, Deepak P. Jayan, Nimmy Pathrose, K. R. Rajesh. 1987-1992 [doi]

Augmentation-Agnostic Regularization for Unsupervised Contrastive Learning with Its Application to Speaker VerificationNakamasa Inoue, Tsubasa Maruyama, Keita Goto. 1993-1998 [doi]

Deep Learning Evaluation of a Steganographic AlgorithmPeter U. Eze, Udaya Parampalli. 1999-2005 [doi]

FAQ Retrieval using Question-Aware Graph Convolutional Network and Contextualized Language ModelWan-Ting Tseng, Chin-Ying Wu, Yung-Chang Hsu, Berlin Chen. 2006-2012 [doi]

3D-GFE: a Three-Dimensional Geometric-Feature Extractor for Point Cloud DataYu-Chen Chou, Yen-Po Lin, Yang-Ming Yeh, Yi-Chang Lu. 2013-2017 [doi]

Attention EdgeConv For 3D Point Cloud ClassificationYen-Po Lin, Yang-Ming Yeh, Yu-Chen Chou, Yi-Chang Lu. 2018-2022 [doi]

The Effect of Density and Placement of BLE Beacons on Indoor Location and Motion Direction Estimation AccuracyKaito Echizenya, Kazuhiro Kondo. 2023-2027 [doi]

Model-Based Soft Actor-CriticJen-Tzung Chien, Shu-Hsiang Yang. 2028-2035 [doi]

Self-Supervised Learning for Online Speaker DiarizationJen-Tzung Chien, Sixun Luo. 2036-2042 [doi]

Multi-Resolution Convolutional Recurrent NetworksJen-Tzung Chien, Yu-Min Huang. 2043-2048 [doi]

Network Intrusion Detection with Improved Feature RepresentationGeonsu Lee, Hochang Rhee, Jae Hoon Shim, Hyung il Koo, Nam Ik Cho. 2049-2054 [doi]

3D Landmark-based Face Detection and Recognition System for Large PosesChing-Tung Tang, Ching-Te Chiu, Wei-Jyun Chen. 2055-2059 [doi]

Entailment Method Based on Template Selection for Chinese Text Few-shot LearningZeyuan Wang, Zhiyu Wei, Lihui Zhang, Ruifan Li, Zhanyu Ma. 2060-2065 [doi]

Image Captioning Based on An Improved Transformer with IoU Position EncodingYazhou Li, Yihui Shi, Yun Liu, Ruifan Li, Zhanyu Ma. 2066-2071 [doi]

Graph Kernel Recursive Least-Squares AlgorithmsVinay Chakravarthi Gogineni, Valeriya Naumova, Stefan Werner 0001, Yih-Fang Huang. 2072-2076 [doi]

A Hilbertian Projection Approach with Dictionary Dividing Strategy: Accelerating Nonlinear Estimation Algorithm with Multiscale GaussiansMasa-aki Takizawa, Masahiro Yukawa. 2077-2084 [doi]

Personalized Learning using Multiple Kernel ModelsAnthony Kuh, Shuai Huang, Cynthia Chen. 2085-2088 [doi]

Real Time Kernel Learning for Sensor Networks using Principles of Federated LearningAnthony Kuh. 2089-2093 [doi]

External Links

Cite Key

Statistics

PDF

Researchr

Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2021, Tokyo, Japan, December 14-17, 2021

Abstract

Table of Contents