10th International Symposium on Chinese Spoken Language Processing, ISCSLP 2016, Tianjin, China, October 17-20, 2016

researchr

You are not signed in
Sign in
Sign up

10th International Symposium on Chinese Spoken Language Processing, ISCSLP 2016, Tianjin, China, October 17-20, 2016. IEEE, 2016. [doi]

Conference: iscslp2016

Abstract is missing.

Microphone array speech denoising modeled by tensor filteringJing Wang, Yahui Shan, Shequan Jiang, Xiang Xie. 1-5 [doi]

A multi-channel/multi-speaker interactive 3D audio-visual speech corpus in MandarinJun Yu, Rongfeng Su, Lan Wang, Wenpeng Zhou. 1-5 [doi]

The preliminary study of influence on tone perception from segmentsChong Cao, Yanlu Xie, Ju Lin, Qian Li, Jinsong Zhang. 1-5 [doi]

Confidence estimation for speech recognition systems using conditional random fields trained with partially annotated dataSheng Li, Xugang Lu, Shinsuke Mori, Yuya Akita, Tatsuya Kawahara. 1-5 [doi]

A regression approach to binaural speech segregation via deep neural networkNana Fan, Jun Du, Li-Rong Dai. 1-5 [doi]

DNN-based unit selection using frame-sized speech segmentsZhi-Ping Zhou, Zhen-Hua Ling. 1-5 [doi]

Prosodic cues in polite and rude Mandarin speechPing Fan, Wentao Gu. 1-4 [doi]

Multi-channel feature adaptation for robust speech recognitionZhaofeng Zhang, Xiong Xiao, Longbiao Wang, Jianwu Dang, Masahiro Iwahashi, Eng Siong Chng, Haizhou Li. 1-5 [doi]

Cantonese spoken word retention by speakers with and without congenital amusia: Implications from phonological similarity and cognitive load effectsXiao Wang, Gang Peng. 1-5 [doi]

Advance prosodic indexing - Acoustic realization of prompted information projection in continuous speeches and discoursesHelen Kai-Yun Chen, Wei-Te Fang, Chiu-yu Tseng. 1-5 [doi]

Comparison of DCT and autoencoder-based features for DNN-HMM multimodal silent speech recognitionLicheng Liu, Yan Ji, Hongcui Wang, Bruce Denby. 1-5 [doi]

Spatial co-variation of lip and tongue at strong and weak syllablesJu Zhang, Kiyoshi Honda, Jianguo Wei, Jianrong Wang, Jianwu Dang. 1-5 [doi]

Directed automatic speech transcription error correction using bidirectional LSTMDa Zheng, Zhehuai Chen, Yue Wu, Kai Yu. 1-5 [doi]

Phone recognition for Lhasa-Tibetan based on articulatory features augmentation learningYue Zhao, Rui Zhao, Xiaona Xu, Licheng Wu, Qiang Ji. 1-4 [doi]

Tongue shape variation model for simulating Mandarin Chinese articulationJinguang Zhang, Xiyu Wu, Jiangping Kong. 1-5 [doi]

Investigating deep neural network adaptation for generating exclamatory and interrogative speech in MandarinYibin Zheng, Ya Li, Zhengqi Wen, Bin Liu, Jianhua Tao. 1-5 [doi]

THear: Development of a mobile multimodal audiometry application on a cross-platform frameworkWai-Kim Leung, Jia Jia, Yu-Hao Wu, Jiayu Long, Lianhong Cai. 1-5 [doi]

Unsatisfied customer call detection with deep learningPengyu Cong, Chaomin Wang, Zhijie Ren, Huixin Wang, Yanmeng Wang, Junlan Feng. 1-5 [doi]

On training bi-directional neural network language model with noise contrastive estimationTianxing He, Yu Zhang, Jasha Droppo, Kai Yu. 1-5 [doi]

Contributions of the piriform fossa of female speakers to vowel spectraCongcong Zhang, Kiyoshi Honda, Ju Zhang, Jianguo Wei. 1-5 [doi]

Multi-task joint-learning for robust voice activity detectionYimeng Zhuang, Sibo Tong, Maofan Yin, Yanmin Qian, Kai Yu. 1-5 [doi]

L1/L2 difference in phonological sensitivity and information planning - Evidence from F0 patternsChao-yu Su, Chiu-yu Tseng. 1-5 [doi]

Improvements on punctuation generation inspired linguistic features for Mandarin prosody generationChen-Yu Chiang, Yu-Ping Hung, Guan-Ting Liou, Yih-Ru Wang. 1-5 [doi]

The effects of tone categories on the perception of Mandarin vowelsHao Zhang, Fei Chen, Nan Yan, Lan Wang, Yu Chen, Feng Shi. 1-5 [doi]

An interface research on rhetorical structure and prosody features in Chinese reading textsLiang Zhang, Yuan Jia, Aijun Li. 1-5 [doi]

Study on the relation of fundamental and formant frequencies for affective speech synthesisBogu Li, Zhilei Liu, Jianwu Dang. 1-5 [doi]

A study on functional load of Chinese prosodic boundaries under reduction of syllable informationYue Chen, Yanlu Xie, Bin Wu, Jinsong Zhang. 1-5 [doi]

Investigation of the spatiotemporal dynamics of the brain during perceiving wordsYuke Si, Jianwu Dang, Gaoyan Zhang. 1-5 [doi]

A study of variational method for text-independent speaker recognitionLiang He, Yao Tian, Yi Liu, Fang Dong, Weiqiang Zhang, Jia Liu. 1-5 [doi]

Exploiting noisy web data by OOV ranking for low-resource keyword searchZhipeng Chen, Ji Wu. 1-5 [doi]

Robust front-end for speech recognition by human and machine in noisy reverberant environments: The effect of phase informationYang Liu, Naushin Nower, Shota Morita, Masashi Unoki. 1-5 [doi]

Mismatched training data enhancement for automatic recognition of children's speech using DNN-HMMMengjie Qian, Ian McLaughlin, Wu Quo, Li-Rong Dai. 1-5 [doi]

Acoustic correlates and gender effects in production and perception of Japanese polite speechShuju Shi, Chiharu Tsurutani, Xiaoli Feng, Jinsong Zhang, Nobuaki Minematsu. 1-5 [doi]

Individual difference and acoustic effect of female laryngeal cavitiesJing Li, Kiyoshi Honda, Ju Zhang, Jianguo Wei. 1-5 [doi]

DBLSTM-based multi-task learning for pitch transformation in voice conversionRunnan Li, Zhiyong Wu, Helen M. Meng, Lianhong Cai. 1-5 [doi]

Evaluation of a multimodal 3-D pronunciation tutor for learning Mandarin as a second language: An eye-tracking studyYing Zhou, Fei Chen, Hui Chen, Lan Wang, Nan Yan. 1-5 [doi]

Speech enhancement based on nonparametric factor analysisLin Li, Jiawen Wu, Xinghao Ding, Qingyang Hong, Delu Zeng. 1-5 [doi]

Gender and prosodic entrainment in Mandarin conversationsZhihua Xia, Qiu Wu Ma. 1-4 [doi]

Detection of mood disorder using speech emotion profiles and LSTMTsung-Hsien Yang, Chung-Hsien Wu, Kun-Yi Huang, Ming-Hsiang Su. 1-5 [doi]

Voice activity detection based on sequential Gaussian mixture model with maximum likelihood criterionZhan Shen, Jianguo Wei, Wenhuan Lu, Jianwu Dang. 1-5 [doi]

Prosodic strength intrinsic to lexical items: A corpus study on tone reduction in Tone4+Tone4 words in Mandarin ChineseWei Lai, Mark Liberman, Jiahong Yuan, Xiaoying Xu. 1-5 [doi]

A linguistic annotation scheme of Chinese discourse structures and study of prosodic interactionsYuan Jia, Aijun Li. 1-5 [doi]

A sparse representation of the excitation source characteristics of nonnormal speech soundsVinay Kumar Mittal, B. Yegnanarayana. 1-5 [doi]

Cognitive representation of phonological categories: The evidence from Mandarin speakers' learning of cantonese tonesKaile Zhang, Yonghong Li, Gang Peng. 1-5 [doi]

The correlation between signal distance and consonant pronunciation in Mandarin wordsHuijun Ding, Chenxi Xie, Lei Zeng, Yang Xu, Guo Dan. 1-5 [doi]

The effect of gain thresholds on speech intelligibility for statistical model based noise reduction for cochlear implants: A simulation based verificationWenzhi He, Nengheng Zheng, Qinglin Meng. 1-4 [doi]

End-to-end keywords spotting based on connectionist temporal classification for MandarinYe Bai, Jiangyan Yi, Hao Ni, Zhengqi Wen, Bin Liu, Ya Li, Jianhua Tao. 1-5 [doi]

Towards automatic assessment of aphasia speech using automatic speech recognition techniquesYing Qin, Tan Lee, Anthony Pak-Hin Kong, Sam-Po Law. 1-4 [doi]

Robust multiple speech source localization based on phase difference regressionZhaoqiong Huang, Ge Zhan, Dongwen Ying, Ruohua Zhou, Jielin Pan, Yonghong Yan 0002. 1-5 [doi]

Prosodic annotation enriched statistical machine translationPeidong Guo, Heyan Huang, Ping Jian, Yuhang Guo. 1-5 [doi]

Automatic detection of rhythmic patterns in native and L2 speech: Chinese, Japanese, and Japanese L2 ChineseShuju Shi, Yanlu Xie, Xiaoli Feng, Jinsong Zhang. 1-4 [doi]

Deep long short-term memory networks for speech recognitionJen-Tzung Chien, Alim Misbullah. 1-5 [doi]

Effects of preceding vocabulary context on the perception of Mandarin vowelsXunan Huang, Caicai Zhang, Fei Chen, Jonathan Sieg, Lan Wang, Feng Shi. 1-5 [doi]

A bi-directional LSTM approach for polyphone disambiguation in Mandarin ChineseChanghao Shan, Lei Xie, Kaisheng Yao. 1-5 [doi]

Exploratory data analysis on nuclei in cantonese dysarthric speechKa-Ho Wong, Hoi Kiu Kristy Mok, Helen Meng. 1-5 [doi]

The perception of the English alveolar-velar nasal coda contrast by monolingual versus bilingual Chinese speakersMinghui Wu, Marjoleine Sloos, Jeroen van de Weijer. 1-5 [doi]

Investigating gated recurrent neural networks for acoustic modelingYuanyuan Zhao, Jie Li, Shuang Xu, Bo Xu. 1-5 [doi]

Dialog state tracking for interview coaching using two-level LSTMMing-Hsiang Su, Chung-Hsien Wu, Kun-Yi Huang, Tsung-Hsien Yang, Tsui-Ching Huang. 1-5 [doi]

Relationship between perception and production of English vowels by Chinese English learnersAihui Zhang, Hui Feng, Siyu Wang, Jianwu Dang. 1-5 [doi]

Significance of automatic detection of vowel regions for automatic shout detection in continuous speechVinay Kumar Mittal, Anil Kumar Vuppala. 1-5 [doi]

Automatic Mandarin prosody boundary detecting based on tone nucleus features and DNN modelJu Lin, Yanlu Xie, Wei Zhang, Jinsong Zhang. 1-5 [doi]

Production and perception of focus in L2 Mandarin of Qiang speakersXiaxia Zhang, Bei Wang. 1-5 [doi]

F0 estimation of speech based on IRAPT using WLP-based TV-CAR analysisWei Shan, Keiichi Funaki. 1-4 [doi]

Dictionary update for NMF-based voice conversion using an encoder-decoder networkChin-Cheng Hsu, Hsin-Te Hwang, Yi-Chiao Wu, Yu Tsao, Hsin-Min Wang. 1-5 [doi]

Discourse prosody and its application to speech synthesisNa Hu, Pengfei Shao, Yiqing Zu, Zuyan Wang, Wei Huang, Shijin Wang. 1-5 [doi]

Pronunciation error detection using DNN articulatory model based on multi-lingual and multi-task learningRicheng Duan, Tatsuya Kawahara, Masatake Dantsuji, Jinsong Zhang. 1-5 [doi]

First investigation of universal speech attributes for speaker verificationSheng Zhang, Wu Guo, Guoping Hu. 1-5 [doi]

A speaker-dependent deep learning approach to joint speech separation and acoustic modeling for multi-talker automatic speech recognitionYanhui Tu, Jun Du, Li-Rong Dai, Chin-Hui Lee. 1-5 [doi]

Automatic acoustic segmentation in N-best list rescoring for lecture speech recognitionPeng Shen, Xugang Lu, Hisashi Kawai. 1-5 [doi]

Investigating neural network based query-by-example keyword spotting approach for personalized wake-up word detection in Mandarin ChineseJingyong Hou, Lei Xie, Zhonghua Fu. 1-5 [doi]

Exploiting language-mismatched phoneme recognizers for unsupervised acoustic modelingSiyuan Feng, Tan Lee, Haipeng Wang. 1-5 [doi]

PVD: A new pathological voice dataset for intra-speaker recognition research interestDongdong Li, Jianyu Wang, Yingchun Yang. 1-5 [doi]

Realizing speech to gesture conversion by keyword spottingNa Zhao, Hongwu Yang. 1-5 [doi]

Senone log-likelihood ratios based articulatory features in pronunciation erroneous tendency detectingLeyuan Qu, Yanlu Xie, Jinsong Zhang. 1-5 [doi]

The design and implementation of HMM-based Dai speech synthesisZhan Wang, Jian Yang, Xin Yang. 1-5 [doi]

Max-margin metric learning for speaker recognitionLantian Li, Dong Wang, Chao Xing, Thomas Fang Zheng. 1-4 [doi]

An adaptive filter with gain and time-shift parameters for echo cancellationZhiping Zhang, Zhiqiang Wu 0001. 1-5 [doi]

Perceptual evaluation of natural and synthesized speech with prosodic focus in Mandarin production of American learnersYing Chen, Li Liu, Xueqin Zhao. 1-5 [doi]

Senone I-vectors for robust speaker verificationZhili Tan, Yingke Zhu, Man-Wai Mak, Brian Kan-Wing Mak. 1-5 [doi]

Gated recurrent units based hybrid acoustic models for robust speech recognitionJian Kang, Wei-Qiang Zhang, Jia Liu. 1-5 [doi]

Learning auxiliary categorical information for speech synthesis based on deep and recurrent neural networksZhengqi Wen, Kehuang Li, Zhen Huang, Jianhua Tao, Chin-Hui Lee. 1-5 [doi]

Classification between normal and adventitious lung sounds using deep neural networkLin Li, Wenhao Xu, Qingyang Hong, Feng Tong, Jinzhun Wu. 1-5 [doi]

Tongue performance in articulating Mandarin apical syllables by prelingual deaf adults using ultrasonic technology: Two case studiesQuan Zhou, Yu Chen, Yanting Chen, Hao Zhang, Jianguo Wei, Jianwu Dang. 1-5 [doi]

Spatial dispersion constrained NMF for monaural source separationViet-Hang Duong, Yuan-Shan Lee, Bach-Tung Pham, Seksan Mathulaprangsan, Pham The Bao, Jia-Ching Wang. 1-4 [doi]

Speech intelligibility enhancement in noisy reverberant conditionsJunfeng Li, Risheng Xia, Qiang Fang, Aijun Li, Yonghong Yan 0002. 1-5 [doi]

Discriminating features of infant cry acoustic signal for automated detection of cause of cryingVinay Kumar Mittal. 1-5 [doi]

Unsupervised speaker adaptation of BLSTM-RNN for LVCSR based on speaker codeZhiying Huang, Shaofei Xue, Zhijie Yan, Li-Rong Dai. 1-5 [doi]

A study on perceptual training of Japanese CSL learners to discriminate Mandarin lexical tonesFeiya Li, Yanlu Xie, Xiaomin Yu, Jinsong Zhang. 1-5 [doi]

Interaural coherence induced ideal binary mask for binaural speech separation and dereverberationYi-Ting Chen, Tzu-Hao Chen, Mao-Chang Huang, Tai-Shih Chi. 1-5 [doi]

The effect of information structure on the distribution of stress degree in Chinese reading textsYuan Jia. 1-7 [doi]

Text-based sentential stress prediction using continuous lexical embedding for Mandarin speech synthesisYibin Zheng, Ya Li, Zhengqi Wen, Bin Liu, Jianhua Tao. 1-5 [doi]

Lattice based transcription loss for end-to-end speech recognitionJian Kang, Wei-Qiang Zhang, Jia Liu. 1-5 [doi]

Speech enhancement with binaural cues derived from a priori codebookNan Chen, Changchun Bao, Feng Deng. 1-5 [doi]

Long short-term memory recurrent neural network based segment features for music genre classificationJia Dai, Shan Liang, Wei Xue, Chongjia Ni, Wenju Liu. 1-5 [doi]

Neural networks based channel compensation for i-vector speaker verificationWei Rao, Xiong Xiao, Chenglin Xu, Haihua Xu, Kong-Aik Lee, Eng Siong Chng, Haizhou Li. 1-5 [doi]

Investigation of the effects of automatic scoring technology on human raters' performances in L2 speech proficiency assessmentDean Luo, Wentao Gu, Ruxin Luo, Lixin Wang. 1-5 [doi]

Rich prosodic information exploration on spontaneous Mandarin speechCheng-Hsien Lin, Chung-Long You, Chen-Yu Chiang, Yih-Ru Wang, Sin-Horng Chen. 1-5 [doi]

Rapid speaker adaptation based on D-code extracted from BLSTM-RNN in LVCSRShaofei Xue, Zhijie Yan, Zhiying Huang, Li-Rong Dai. 1-5 [doi]

Learning FOFE based FNN-LMs with noise contrastive estimation and part-of-speech featuresJunfeng Hou, Shiliang Zhang, Li-Rong Dai. 1-5 [doi]

Rich punctuations prediction using large-scale deep learningXueyang Wu, Su Zhu, Yue Wu, Kai Yu. 1-5 [doi]

The singing voice before and after vocal warm-up by students of Chinese national singingYu Chen, Weifeng Kong, Yujie Chi, Yanting Chen, Jianguo Wei, Jianwu Dang. 1-5 [doi]

Recognition of spoken words in L2 speech using L1 probabilistic phonotactics: Evidence from Cantonese-English bilingualsMichael C. W. Yip. 1-4 [doi]

English stress acquisition by native speakers of TibetanDan Hu, Hui Feng, Tongyu Wu. 1-5 [doi]

An investigation of adaptation techniques for building acoustic models for hearing-impaired children in a CAPT applicationYingke Zhu, Brian Mak. 1-5 [doi]

The influence of syllable structure and prosodic strengthening on consonant production in Shanghai ChineseBijun Ling, Jie Liang. 1-5 [doi]

Comparison of regularization constraints in deep neural network based speaker adaptationPeng Shen, Xugang Lu, Hisashi Kawai. 1-5 [doi]

Improving accented Mandarin speech recognition by using recurrent neural network based language model adaptationHao Ni, Jiangyan Yi, Zhengqi Wen, Bin Liu, Jianhua Tao. 1-5 [doi]

Categorical perception in two pairs of Mandarin tones among bimodal cochlear implanted childrenWentao Gu Jiao Yin, James J. Mahshie. 1-5 [doi]

A pseudo-task design in multi-task learning deep neural network for speaker recognitionXugang Lu, Peng Shen, Yu Tsao, Hisashi Kawai. 1-5 [doi]

A post-thyroidectomy voice quality study in patients suffering or not from Recurrent laryngeal paralysisMing Xiu, Camille Fauth, Béatrice Vaxelaire, Jean-Frangois Rodier, Pierre-Philippe Volkmar, Rudolph Sock. 1-4 [doi]

EEG evidence for a three-phase recurrent process during spoken word processingBin Zhao, Jianwu Dang, Gaoyan Zhang. 1-5 [doi]

Employing median filtering to enhance the complex-valued acoustic spectrograms in modulation domain for noise-robust speech recognitionHsin-Ju Hsieh, Berlin Chen, Jeih-Weih Hung. 1-5 [doi]

Effects of background noise and tonal target stimulus on human auditory evoked potentialLei Wang, Fei Chen. 1-4 [doi]

Applying connectionist temporal classification objective function to Chinese Mandarin speech recognitionPengrui Wang, Jie Li, Bo Xu. 1-5 [doi]

Speaker diarization system for autism children's real-life audio dataTianyan Zhou, Weicheng Cai, Xiaoyan Chen, Xiaobing Zou, Shilei Zhang, Ming Li. 1-5 [doi]

Evaluation of the deep nonlinear metric learning based speaker identification on the large scale of voiceprint corpusFeng Yong, Cai Xinyuan, Ji Ruifang. 1-4 [doi]

Vowels as acoustic cues for sub-dialect identification in ChineseHuangmei Liu, Jie Liang. 1-5 [doi]

Improving the performance of speech perception in noisy environment based on an FAME strategyYing-Hui Lai, Syu-Siang Wang, Yu-Ting Su, Cheng Han-Che, Fan Kang Fu, Yu Tsao. 1-5 [doi]

HMM-based cue parameters estimation for speech enhancementFeng Deng, Changchun Bao, Mao-shen Jia. 1-4 [doi]

CTC regularized model adaptation for improving LSTM RNN based multi-accent Mandarin speech recognitionJiangyan Yi, Hao Ni, Zhengqi Wen, Bin Liu, Jianhua Tao. 1-5 [doi]

Interferences suppression using two closely-spaced microphonesZhong-Hua Fu. 1-5 [doi]

Binary speaker embeddingLantian Li, Chao Xing, Dong Wang, Kaimin Yu, Thomas Fang Zheng. 1-4 [doi]

Exploring tonal information for Lhasa dialect acoustic modelingJian Li, Hongcui Wang, Longbiao Wang, Jianwu Dang, Kuntharrgyal Khyuru, Gyaltsen Lobsang. 1-5 [doi]

The perceptual cues for nasal finals in standard ChineseYanping Li, Yanlu Xie, Luoduo Feng, Jinsong Zhang. 1-5 [doi]

Cluster-based senone selection for the efficient calculation of deep neural network acoustic modelsJun-Hua Liu, Zhen-Hua Ling, Si Wei, Guoping Hu, Li-Rong Dai. 1-5 [doi]

Incorporating local environment information with ensemble neural networks to robust automatic speech recognitionChia-Yung Hsu, Ryandhimas E. Zezario, Jia-Ching Wang, Chin-Wen Ho, Xugang Lu, Yu Tsao. 1-5 [doi]

Cross-corpus speech emotion recognition using transfer semi-supervised discriminant analysisPeng Song, Xinran Zhang, Shifeng Ou, Jingjing Liu, Yanwei Yu, Wenming Zheng. 1-5 [doi]

Investigating LSTM for punctuation predictionKaituo Xu, Lei Xie, Kaisheng Yao. 1-5 [doi]

Improvement of mask-based speech source separation using DNNGe Zhan, Zhaoqiong Huang, Dongwen Ying, Jielin Pan, Yonghong Yan 0002. 1-5 [doi]

Improving Mandarin tone recognition based on DNN by combining acoustic and articulatory featuresJu Lin, Yanlu Xie, Yingming Gao, Jinsong Zhang. 1-5 [doi]

Digit-dependent local i-vector for text-prompted speaker verification with random digit sequencesPeixin Chen, Wu Quo, Guoping Hu. 1-5 [doi]

Vector taylor series expansion with auditory masking for noise robust speech recognitionBiswajit Das, Ashish Panda. 1-5 [doi]

Deep neural network for robust speech recognition with auxiliary features from laser-Doppler vibrometer sensorZhipeng Xie, Jun Du, Ian Vince McLoughlin, Yong Xu, Feng Ma, Haikun Wang. 1-5 [doi]

The examination of the relationship between perception and production of Mandarin tone of Kazak studentsYali Liu, Zihou Meng. 1-5 [doi]

Mandarin neutral tone by native speakers and Cantonese L2 learnersLei Liu, Nan Huang, Wentao Gu. 1-5 [doi]

External Links

Cite Key

Statistics

PDF

Researchr

10th International Symposium on Chinese Spoken Language Processing, ISCSLP 2016, Tianjin, China, October 17-20, 2016

Abstract

Table of Contents