11th International Symposium on Chinese Spoken Language Processing, ISCSLP 2018, Taipei City, Taiwan, November 26-29, 2018 - researchr publication

researchr

You are not signed in
Sign in
Sign up

11th International Symposium on Chinese Spoken Language Processing, ISCSLP 2018, Taipei City, Taiwan, November 26-29, 2018. IEEE, 2018. [doi]

Conference: iscslp2018

Abstract is missing.

GTDNN-Based Voice Conversion Using DAEs with Binary Distributed Hidden UnitsYi-Yang Ding, Ya-Jun Hu, Zhen-Hua Ling. 1-5 [doi]

A Front-End Speech Enhancement System for Robust Automotive Speech RecognitionHaikun Wang, Zhongfu Ye, Jingdong Chen. 1-5 [doi]

Unsupervised query by example spoken term detection using features concatenated with Self-Organizing Map distancesHaiwei Wu, Ming Li, Zexin Cai, Haibin Zhong. 1-5 [doi]

Speech Enhancement using Convolutional Neural Network with Skip ConnectionsYupeng Shi, Weicong Rong, Nengheng Zheng. 6-10 [doi]

A Novel Unified Framework for Speech Enhancement and Bandwidth Extension Based on Jointly Trained Neural NetworksBin Liu, Jianhua Tao, Yibin Zheng. 11-15 [doi]

Speech Enhancement Based on Reducing the Detail Portion of Speech Spectrograms in Modulation Domain via DiscreteWavelet TransformShih-Kuang Lee, Syu-Siang Wang, Yu Tsao, Jeih-Weih Hung. 16-20 [doi]

Two-Stage Enhancement of Noisy and Reverberant Microphone Array Speech for Automatic Speech Recognition Systems Trained with Only Clean SpeechQuandong Wang, Sicheng Wang, Fengpei Ge, Chang Woo Han, Jaewon Lee, Lianghao Guo, Chin-Hui Lee. 21-25 [doi]

Utterance-level Permutation Invariant Training with Discriminative Learning for Single Channel Speech SeparationCunhang Fan, Bin Liu, Jianhua Tao, Zhengqi Wen, Jiangyan Yi, Ye Bai. 26-30 [doi]

A Method for Emotional Speech Synthesis Based on Speaker Adaptive TrainingXiaoyong Lu, Yanqin Li, Hongwu Yang. 31-35 [doi]

Investigation of Stacked Deep Neural Networks and Mixture Density Networks for Acoustic-to-Articulatory InversionXurong Xie, Xunying Liu, Tan Lee, Lan Wang. 36-40 [doi]

Emotional speech synthesis based on DNN and PAD emotional state modelWeizhao Zhang, Hongwu Yang, Pengpeng Zhi. 41-45 [doi]

Research on Dungan speech synthesis based on Deep Neural NetworkLijia Chen, Hongwu Yang, Hui Wang. 46-50 [doi]

Voice Conversion Based on Cross-Domain Features Using Variational Auto EncodersWen-Chin Huang, Hsin-Te Hwang, Yu-Huai Peng, Yu Tsao, Hsin-Min Wang. 51-55 [doi]

Frame Selection in SI-DNN Phonetic Space with WaveNet Vocoder for Voice Conversion without Parallel Training DataFeng-Long Xie, Frank K. Soong, Xi Wang, Lei He, Haifeng Li. 56-60 [doi]

Disordered Speech Assessment Using Kullback-Leibler Divergence Features with Multi-Task Acoustic ModelingYuanyuan Liu, Ying Qin, Siyuan Feng, Tan Lee, P. C. Ching. 61-65 [doi]

An End-to-End Approach to Automatic Speech Assessment for People with AphasiaYing Qin, Tan Lee, Yuzhong Wu, Anthony Pak-Hin Kong. 66-70 [doi]

Non-intrusive Speech Quality Assessment Using Deep Belief Network and Backpropagation Neural NetworkYahui Shan, Jing Wang, Xiang Xie, Liuchen Meng, Jingming Kuang. 71-75 [doi]

A Progressive Deep Learning Approach to Child Speech SeparationXin Wang, Jun Du, Lei Sun, Qing Wang 0008, Chin-Hui Lee. 76-80 [doi]

Convolutional Neural Turing Machine for Speech SeparationJen-Tzung Chien, Kai-Wei Tsou. 81-85 [doi]

Multilingual Speech Recognition Training and Adaptation with Language-Specific Gate UnitsDanyang Liu, Xinxin Wan, Ji Xu, Pengyuan Zhang. 86-90 [doi]

Acquisition of English Tense-lax Vowels by Chinese EFL Learners from Different Dialectal RegionsYuan Jia, Cuiping Li. 91-95 [doi]

An Acoustic Study of English Monophthongs Acquisition by Chinese EFL Learners from Northeast RegionYuan Jia, Huimin Zhang. 96-100 [doi]

Chinese EFL Learners' Acquisition of English Monophthongs-A Typological Study of Fuzhou, Ningbo, and BeijingYuan Jia, Xinyin Sun. 101-105 [doi]

An Empirical Study of English Vowels Acquisition of EFL Learners in Tianjin and ZiboBin Li, Yuan Jia. 106-110 [doi]

A Refined Query-by-Example Approach to Spoken-Term-Detection on ESL learners' SpeechJingyong Hou, Wenping Hu, Frank K. Soong, Lei Xie. 111-115 [doi]

Improve the Accuracy of Non-native Speech Annotation with a Semi-automatic ApproachWei Wang, Wei Wei, Yanlu Xie, Minghao Guo, Jinsong Zhang. 116-120 [doi]

Data Augmentation using Conditional Generative Adversarial Networks for Robust Speech RecognitionPeiyao Sheng, Zhuolin Yang, Hu Hu, Tian Tan 0002, Yanmin Qian. 121-125 [doi]

Improving Gated Recurrent Unit Based Acoustic Modeling with Batch Normalization and Enlarged ContextJie Li, Yahui Shan, Xiaorui Wang, Yan Li. 126-130 [doi]

Gated Module Neural Network for Multilingual Speech RecognitionYuan-Fu Liao, Matús Pleva, Daniel Hládek, Ján Stas, Peter Viszlay, Martin Lojka, Jozef Juhár. 131-135 [doi]

Subspace Based Sequence Discriminative Training of LSTM Acoustic Models with Feed-Forward LayersLahiru Samarakoon, Brian Mak, Albert Y. S. Lam. 136-140 [doi]

WaveNet MH-SRU: Deep and Wide Multiple-history Simple Recurrent Unit for Speech RecognitionHengguan Huang, Brian Mak. 141-145 [doi]

Hybrid CTC-Attention based End-to-End Speech Recognition using Subword UnitsZhangyu Xiao, Zhijian Ou, Wei Chu, Hui Lin 0001. 146-150 [doi]

Combining Phase-based Features for Replay Spoof Detection SystemSrinivas Kantheti, Rohan Kumar Das, Hemant A. Patil. 151-155 [doi]

Pitch Synchronized Relative Phase with Peak Error Detection For Noise-robust Speaker RecognitionMeng Ge, Longbiao Wang, Seiichi Nakagawa, Yuta Kawakami, Jianwu Dang, Xiangang Li. 156-160 [doi]

Visual Information Affects Auditory Frequency Discrimination with Random Stimulus Sequences: Evidence from ERPsLei Wang, Fei Chen. 161-164 [doi]

Investigation of the Comprehension Process during Silent Reading based on Eye MovementsDi Zhou, Jinfeng Huang, Jianwu Dang. 165-169 [doi]

A Multi-modal Soft Targets Approach for Pronunciation Erroneous Tendency DetectionJu Lin, Wei Zhang, Linxuan Wei, Yanlu Xie, Jinsong Zhang. 170-174 [doi]

A Study on Landmark Verification of Mandarin Alveolar-palatal ConsonantsZhenyu Wang, Qi Zhang, Shuang Zheng, Jinsong Zhang, Yanlu Xie. 175-179 [doi]

DNN i-vector based Fishervoice and PLDA SVM scoring for NIST SRE 2016Jinghua Zhong, Helen Meng. 180-184 [doi]

Novel Amplitude Weighted Frequency Modulation Features for Replay Spoof DetectionMadhu R. Kamble, Hemant A. Patil. 185-189 [doi]

Angular Softmax Loss for End-to-end Speaker VerificationYutian Li, Feng Gao, Zhijian Ou, Jiasong Sun. 190-194 [doi]

Deep Discriminant Analysis for i-vector Based Robust Speaker RecognitionShuai Wang, Zili Huang, Yanmin Qian, Kai Yu 0004. 195-199 [doi]

Exploring a Unified Attention-Based Pooling Framework for Speaker VerificationYi Liu, Liang He, Weiwei Liu, Jia Liu. 200-204 [doi]

Generative Adversarial Networks based X-vector Augmentation for Robust Probabilistic Linear Discriminant Analysis in Speaker VerificationYexin Yang, Shuai Wang, Man Sun, Yanmin Qian, Kai Yu 0004. 205-209 [doi]

Emphasis Detection for Voice Dialogue Applications Using Multi-channel Convolutional Bidirectional Long Short-Term Memory NetworkLong Zhang, Jia Jia, Fanbo Meng, Suping Zhou, Wei Chen, Cunjun Zhang, Runnan Li. 210-214 [doi]

Topic and Prosody Interaction in Chinese DiscourseYueheng Li, Biao Luo. 215-219 [doi]

Measuring Prosodic Transfer in Vector Space by Weighted Tonal EventsXuanda Chen, Yuan Jia, Ziyu Xiong. 220-224 [doi]

An ERP Study to Evaluate the Quality of Speech Processed by Wiener FilteringFang Yu, Chin Tuan Tan, Fei Chen. 225-229 [doi]

Estimation of glottal source waveforms and vocal tract shapes from speech signals based on ARX-LF modelYongwei Li, Ken-Ichi Sakakibara, Masato Akagi. 230-234 [doi]

The DKU-JNU-EMA Electromagnetic Articulography Database on Mandarin and Chinese Dialects with Tandem Feature based Acoustic-to-Articulatory InversionZexin Cai, Xiaoyi Qin, Danwei Cai, Ming Li, Xinzhong Liu, Haibin Zhong. 235-239 [doi]

Multi-Head Attention for End-to-End Neural Machine TranslationIvan Fung, Brian Mak. 250-254 [doi]

Unusable Spoken Response Detection with BLSTM Neural NetworksZhaoheng Ni, Rutuja Ubale, Yao Qian, Michael I. Mandel, Su-Youn Yoon, Abhinav Misra, David Suendermann-Oeft. 255-259 [doi]

Speech Super-Resolution Using Parallel WaveNetMu Wang, Zhiyong Wu, Shiyin Kang, Xixin Wu, Jia Jia 0001, Dan Su, Dong Yu, Helen Meng. 260-264 [doi]

Speech Emotion Recognition using Convolutional Neural Network with Audio Word-based EmbeddingKun-Yi Huang, Chung-Hsien Wu, Qian-Bei Hong, Ming-Hsiang Su, Yuan-Rong Zeng. 265-269 [doi]

Formosa Speech Recognition Challenge 2018: Data, Plan and BaselinesYuan-Fu Liao, Wu-Hua Hsu, Yu-Chen Lin, Yung-Hsiang Shawn Chang, Matús Pleva, Jozef Juhár, Guang-Feng Deng. 270-274 [doi]

CLMAD: A Chinese Language Model Adaptation DatasetYe Bai, Jianhua Tao, Jiangyan Yi, Zhengqi Wen, Cunhang Fan. 275-279 [doi]

From Speech Signals to Semantics - Tagging Performance at Acoustic, Phonetic and Word LevelsYao Qian, Rutuja Ubale, Patrick L. Lange, Keelan Evanini, Frank K. Soong. 280-284 [doi]

Using Dempster-Shafer Evidence Theory for Dialog State TrackingMinglu Liu, Miao Li, Ji Wu, Xiangling Fu, Ji Gao. 285-289 [doi]

Prediction of Voice Disorder Severity: Contributions from Sustained Vowels and Continuous SpeechYuanyuan Liu, Tan Lee, Thomas K. T. Law, Kathy Y. S. Lee, P. C. Ching. 290-294 [doi]

A Maximum Likelihood Approach to Masking-based Speech Enhancement Using Deep Neural NetworkQing Wang 0008, Jun Du, Li Chai, Li-Rong Dai, Chin-Hui Lee. 295-299 [doi]

Manifold-based incremental community detection method for online speaker identificationHongcui Wang, Dongxiao He, Jianwu Dang, Xi Liang. 300-303 [doi]

Max Margin Cosine Loss for Speaker Identification on Short UtterancesRuifang Ji, Junhua Cao, Xinyuan Cai, Bo Xu. 304-308 [doi]

Automatic Personality Perception from Speech in MandarinMinxian Zhu, Xiang Xie, Liqiang Zhang, Jing Wang. 309-313 [doi]

Text-dependent Speaker Verification Using Word-based ScoringShengyu Yao, Houjun Huang, Ruohua Zhou, Yonghong Yan 0002. 314-318 [doi]

End-to-end Language Identification using NetFV and NetVLADJinkun Chen, Weicheng Cai, Danwei Cai, Zexin Cai, Haibin Zhong, Ming Li. 319-323 [doi]

Robust Front-End Processing For Emotion Recognition In Noisy SpeechMeghna Pandharipande, Rupayan Chakraborty, Ashish Panda, Sunil Kumar Kopparapu. 324-328 [doi]

Replay Attacks Detection Using Phase and Magnitude Features with Various Frequency ResolutionsMeng Liu, Longbiao Wang, Zeyan Oo, Jianwu Dang, Dongbo Li, Seiichi Nakagawa. 329-333 [doi]

Novel Demodulation-Based Features using Classifier-level Fusion of GMM and CNN for Replay DetectionMadhu R. Kamble, Hemlata Tak, Maddala Venkata Siva Krishna, Hemant A. Patil. 334-338 [doi]

Chinese Causal Relation: Conjunction, Order and Focus-to-Stress AssignmentLiang Zhang, Aijun Li, Yingyi Luo. 339-343 [doi]

Parallel Double Audio FingerprintingTianyu Liang, Xianhong Chen, Can Xu, Liang He. 344-348 [doi]

LSTM-Based Pitch Range Estimation from Spectral Information of Brief Speech InputWei Zhang, Qi Zhang, Yanlu Xie, Jinsong Zhang. 349-353 [doi]

Acoustic and Kinematic Examination of Dysarthria in Cantonese Patients of Parkinson's DiseaseYue Sun, Manwa L. Ng, Chongyuan Lian, Lan Wang, Feng Yang, Nan Yan. 354-358 [doi]

Enhanced Denoising Auto-Encoder for Robust Speech Recognition in Unseen Noise ConditionsSonal Joshi, Ashish Panda, Biswajit Das. 359-363 [doi]

Bidirectional LSTM with Extended Input ContextGaofeng Cheng, Lu Huang, Jiasong Sun, Yonghong Yan 0002. 364-368 [doi]

Comparable Study Of Modeling Units For End-To-End Mandarin Speech RecognitionWei Zou, Dongwei Jiang, Shuaijiang Zhao, Guilin Yang, Xiangang Li. 369-373 [doi]

Keyword Spotting Based On CTC and RNN For Mandarin Chinese SpeechYiyan Wang, Yanhua Long. 374-378 [doi]

Space-Time Residual LSTM Architechture for Distant Speech RecognitionLong Wu, Li Wang, Pengyuan Zhang, Ta Li, Yonghong Yan 0002. 379-383 [doi]

An Analysis of Decoding for Attention-Based End-to-End Mandarin Speech RecognitionDongwei Jiang, Wei Zou, Shuaijiang Zhao, Guilin Yang, Xiangang Li. 384-388 [doi]

A Study on Acoustic Modeling for Child Speech Based on Multi-Task LearningJiarui Wang, Si Ioi Ng, Dehua Tao, Wing Yee Ng, Tan Lee. 389-393 [doi]

Distant-talking Speech Recognition Based on Multi-objective Learning using Phase and Magnitude-based FeatureDongbo Li, Longbiao Wang, Jianwu Dang, Meng Ge, Haotian Guan. 394-398 [doi]

Speech Enhancement Based on A New Architecture of Wasserstein Generative Adversarial NetworksShuaishuai Ye, Ting Jiang, Shan Qin, Weixia Zou, Chengyun Deng. 399-403 [doi]

An Investigation of Transfer Learning Mechanism for Acoustic Scene ClassificationHengshun Zhou, Xue Bai, Jun Du. 404-408 [doi]

Microphone Array Acoustic Source Localization system based on Deep LearningJunhao Ding, Bin Ren, Nengheng Zheng. 409-413 [doi]

Evaluating Modeling Units and Sub-word Features in Language Models for Turkish ASRChang Liu, Yike Zhang, Pengyuan Zhang, Yaofeng Wang. 414-418 [doi]

Chinese Poetry Generation with Flexible StylesJiyuan Zhang, Dong Wang. 419-423 [doi]

Perceivable information structure in discourse prosody-Detecting prominent prosodic words in spoken discourse using F0 contourChao-yu Su, Chiu-yu Tseng. 424-428 [doi]

Declination and boundary effect in Cantonese declarative sentenceChunyu Ge, Aijun Li. 429-433 [doi]

Interaction of Syntax, Semantics and Pragmatics on Discourse Prosody in Standard ChineseXinyi Wen, Yuan Jia, Aijun Li. 434-438 [doi]

A Preliminary Study on Quantitative Calculation of Prosodic Strength in Mandarin SpeechWei Zhang, Yanlu Xie, Jinsong Zhang. 439-443 [doi]

L2 Mispronunciation Verification Based on Acoustic Phone Embedding and Siamese NetworksZhenyu Wang, Jinsong Zhang, Yanlu Xie. 444-448 [doi]

Comparing Mandarin Lexical Stress Produced by Native Speakers and L2 Learners in Hong KongLei Liu, Xuemei Zhai, Wentao Gu. 449-453 [doi]

A study on the pitch realization of focus in ChineseZiyu Xiong, Maolin Wang. 454-457 [doi]

Effect of Anticipatory Vowel-to-Vowel Coarticulation at Different Prosodic Boundaries in ChineseZiyu Xiong, Maolin Wang. 458-462 [doi]

Co-articulation between Consonant and Vowel in Cantonese and Taiwanese CVC SyllablesWai-Sum Lee, Yueh-Chin Chang, Feng-fan Hsieh. 463-467 [doi]

Cross-Dialectal Perception of the Third-Tone Sandhi in Standard Chinese - Evidence from Eye MovementsQian Li, Yingyi Luo, Aijun Li. 468-472 [doi]

An Acoustic Comparison between Two Pairs of Assimilatory and Dissimilatory Tone Sandhi Processes in Nanjing Mandarin in Categoricalness/GradienceXin Li, Rene Kager. 473-477 [doi]

Response Acts in Chinese Conversation: the Coding Scheme and AnalysisAijun Li. 478-482 [doi]

End-to-End Mongolian Text-to-Speech SystemJingdong Li, Hui Zhang, Rui Liu, Xueliang Zhang, Feilong Bao. 483-487 [doi]

Syntactic Structure and Communicative Function of Echo Questions in Chinese DialoguesGan Huang, Lin Zhu, Aijun Li. 488-492 [doi]

An Automated Assessment Tool for Child Speech DisordersSi Ioi Ng, Dehua Tao, Jiarui Wang, Yi Jiang, Wing Yee Ng, Tan Lee. 493-494 [doi]

Hearing aids APP design based on deep learning technologyJi Yan Han, Wei-Zhong Zheng, Ren-Jie Huang, Yu Tsao, Ying-Hui Lai. 495-496 [doi]

IOS-based Ear Scale application for Clinical Audiology and Otology UsageWen-Huei Liao, Pei-Chun Li, Shuenn-Tsong Young, Ying-Hui Lai, Yu Tsao. 497-498 [doi]

runs on WebDSL