7th International Symposium on Chinese Spoken Language Processing, ISCSLP 2010, November 29 2010-December 3, 2010, Tainan & Sun Moon Lake, Taiwan - researchr publication

researchr

You are not signed in
Sign in
Sign up

7th International Symposium on Chinese Spoken Language Processing, ISCSLP 2010, November 29 2010-December 3, 2010, Tainan & Sun Moon Lake, Taiwan. IEEE, 2010. [doi]

Conference: iscslp2010

Abstract is missing.

Automatic transcription of parliamentary meetings and classroom lectures - A sustainable approach and real system evaluations -Tatsuya Kawahara. 1-6 [doi]

Intelligibility investigation of single-channel noise reduction algorithms for Chinese and JapaneseJunfeng Li, Lin Yang, YongHong Yan, Duc Thanh Chau, Masato Akagi. 7-11 [doi]

DCT-based processing of dynamic features for robust speech recognitionWen-Chi Lin, Hao-Teng Fan, Jeih-Weih Hung. 12-17 [doi]

Speech enhancement as a functional approximation and generalizationXugang Lu, Masashi Unoki, Ryosuke Isotani, Hisashi Kawai, Satoshi Nakamura. 18-22 [doi]

Spectral trajectory estimation using nonnegative matrix factorization for model-based monaural speech separationChun-Man Mak, Tan Lee, Siu Wa Lee. 23-28 [doi]

An environment structuring framework to facilitating suitable prior density estimation for MAPLR on robust speech recognitionYu Tsao, Ryosuke Isotani, Hisashi Kawai, Satoshi Nakamura. 29-32 [doi]

Dual-microphone noise reduction based on semi-blind DUETZhong-Hua Fu, Lei Xie, Dong-mei Jiang. 33-37 [doi]

Acoustic and articulatory analysis on Mandarin Chinese vowels in emotional speechAijun Li, Qiang Fang, Fang Hu, Lu Zheng, Hong Wang, Jianwu Dang. 38-43 [doi]

Effect of speech rate on inter-segmental coarticulation in Standard ChineseYing-hao Li, Jiang-ping Kong. 44-49 [doi]

Discrimination between natural and unnatural articulations based on articulatory structureAkikazu Nishikido, Shin'ichi Kawamoto, Jianwu Dang. 50-54 [doi]

An initial investigation of L1 and L2 discourse speech planning in EnglishChiu-yu Tseng, Zhao-yu Su, Chi-Feng Huang, Tanya Visceglia. 55-59 [doi]

Effects of syllable positions on Taiwanese Mandarin sibilant perceptionChenhao Chiu, Molly Babel. 60-64 [doi]

Toward a comprehensive vowel space for whispered speechHamid R. Sharifzadeh, Ian Vince McLoughlin, Martin J. Russell. 65-68 [doi]

Detection of intonation in L2 English speech of native Mandarin learnersKun Li, Shuang Zhang, Mingxing Li, Wai Kit Lo, Helen M. Meng. 69-74 [doi]

Improving the informativeness of verbose queries using summarization techniques for spoken document retrievalShih-Hsiang Lin, Berlin Chen, Ea-Ee Jan. 75-79 [doi]

Forward optimal measures for automatic mispronunciation detectionChangliang Liu, Fuping Pan, Fengpei Ge, Bin Dong, YongHong Yan. 80-83 [doi]

Capturing L2 segmental mispronunciations with joint-sequence models in Computer-Aided Pronunciation Training (CAPT)Xiaojun Qian, Helen M. Meng, Frank K. Soong. 84-88 [doi]

A novel approach for proper name transliteration verificationEa-Ee Jan, Niyu Ge, Shih-Hsiang Lin, Salim Roukos, Jeffrey S. Sorensen. 89-94 [doi]

Aligning singing voice with MIDI melody using synthesized audio signalMinghui Dong, Paul Y. Chan, Ling Cen, Haizhou Li. 95-98 [doi]

Minimum generation error training for HMM-based prediction of articulatory movementsTian-Yi Zhao, Zhen-Hua Ling, Ming Lei, Li-Rong Dai, Qingfeng Liu. 99-102 [doi]

Mandarin-English bilingual phone modeling and combining MPE based Discriminative training for cross-language speech recognitionYanmin Qian, Jia Liu. 103-108 [doi]

Subvector-quantized high-density discrete hidden Markov model and its re-estimationGuoli Ye, Brian Mak. 109-113 [doi]

Problems of modeling phone deletion in conversational speech for speech recognitionBrian Mak, Tom Ko. 114-118 [doi]

Speaker adaptation of stochastic segment models using Maximum Likelihood Linear RegressionHao Chao, Wenju Liu. 119-122 [doi]

A study of large vocabulary speech recognition decoding using finite-state graphsZhijian Ou, Ji Xiao. 123-128 [doi]

Rendering a personalized photo-real talking head from short video footageLijuan Wang, Wei Han, Xiaojun Qian, Frank K. Soong. 129-134 [doi]

Automatic prosody prediction and detection with Conditional Random Field (CRF) modelsYao Qian, Zhizheng Wu, Xuezhe Ma, Frank K. Soong. 135-138 [doi]

Development of an articulatory visual-speech synthesizer to support language learningKa-Ho Wong, Wai-Kim Leung, Wai Kit Lo, Helen M. Meng. 139-143 [doi]

Statistical modeling of syllable-level F0 features for HMM-based unit selection speech synthesisZhen-Hua Ling, Zhi-Guo Wang, Li-Rong Dai. 144-147 [doi]

Modeling prosody patterns for Chinese expressive text-to-speech synthesisZhiyong Wu, Lianhong Cai, Helen M. Meng. 148-152 [doi]

A method for modeling and generating Mandarin tone contour with phrase intonation based on the generation process modelMiaomiao Wang, Miaomiao Wen, Keikichi Hirose, Nobuaki Minematsu. 153-156 [doi]

The description of iFlyTek Speech Lab system for NIST2009 Language Recognition EvaluationYing Xu, Yan Song, Yanhua Long, Hai-Bing Zhong, Li-Rong Dai. 157-161 [doi]

UBM data selection for effective speaker modelingChien-Lin Huang, Haizhou Li. 162-165 [doi]

Factor analysis based spatial correlation modeling for speaker verificationEryu Wang, Wu Guo, Li-Rong Dai, Kong-Aik Lee, Bin Ma, Haizhou Li. 166-170 [doi]

Dialect-based speaker classification using speaker-invariant dialect featuresXuebin Ma, Ruiyuan Xu, Nobuaki Minematsu, Yu Qiao, Keikichi Hirose, Aijun Li. 171-176 [doi]

Using cepstral and prosodic features for Chinese accent identificationJue Hou, Yi Liu, Thomas Fang Zheng, Jesper Olsen, Jilei Tian. 177-181 [doi]

Speaker verification using support vector machine with LLR-based sequence kernelsYi-Hsiang Chao, Wei-Ho Tsai, Hsin-Min Wang. 182-185 [doi]

Phonetic clustering based confidence measure for embedded speech recognitionZhiguo Wang, Cong Liu, Hai-Kun Wang, Yu Hu, Li-Rong Dai. 186-189 [doi]

Audio visual speech recognition based on multi-stream DBN models with Articulatory FeaturesDongmei Jiang, Peng Wu, Fengna Wang, Hichem Sahli, Werner Verhelst. 190-193 [doi]

A study on Functional Loads of phonetic contrasts under context based on Mutual Information of Chinese text and phonemesJinsong Zhang, Wei Li, Yuxia Hou, Wen Cao, Ziyu Xiong. 194-198 [doi]

A study on Hakka and mixed Hakka-Mandarin speech recognitionTsai-Lu Tsai, Chen-Yu Chiang, Hsiu-Min Yu, Lieh-Shih Lo, Yih-Ru Wang, Sin-Horng Chen. 199-204 [doi]

Auditory front-ends for noise-robust automatic speech recognitionJa-Zang Yeh, Chia-Ping Chen. 205-208 [doi]

Robust speaker localization in a disturbance noise environment using a distributed microphone systemKook Cho, Takanobu Nishiura, Yoichi Yamashita. 209-213 [doi]

An integrated framework for transcribing Mandarin-English code-mixed lectures with improved acoustic and language modelingChing-feng Yeh, Chao-Yu Huang, Liang-Che Sun, Lin-Shan Lee. 214-219 [doi]

Large vocabulary Uyghur continuous speech recognition based on stems and suffixesXin Li, Shang Cai, Jielin Pan, YongHong Yan, Yafei Yang. 220-223 [doi]

Topic-weak-correlated Latent Dirichlet allocationYimin Tan, Zhijian Ou. 224-228 [doi]

Building topic mixture language models using the document soft classification notion of topic modelsShuanhu Bai, Cheung Chi Leung, Chien-Lin Huang, Bin Ma, Haizhou Li. 229-232 [doi]

Data-driven lexicon refinement using local and web resources for Chinese speech recognitionHua Zhang, Xuan Zhu, Teng-Rong Su, Ki-Wan Eom, Jae-Won Lee. 233-237 [doi]

The psychoacoustic approach towards enhancing speech intelligibility in noisePaul Yaozhu Chan, Minghui Dong, Ling Cen, Haizhou Li. 238-241 [doi]

Improving Mandarin Chinese STT system with Random Forests language modelsIlya Oparin, Lori Lamel, Jean-Luc Gauvain. 242-245 [doi]

Semantics-based language modeling for Cantonese-English code-mixing speech recognitionHouwei Cao, P. C. Ching, Tan Lee, Yu Ting Yeung. 246-250 [doi]

Web-based keyword adapted Language Modeling for Keyword SpottingWenzhu Shen, Ji Wu, Wei Li. 251-255 [doi]

Spontaneous Mandarin speech understanding using Utterance Classification: A case studyYun-Cheng Ju, Jasha Droppo. 256-260 [doi]

Adaptive segment model for spoken document retrievalChuang-Hua Chueh, Jen-Tzung Chien. 261-264 [doi]

Sentence Decomplexification using holistic aspect-based clause detection for long sentence understandingChao-Hong Liu, Chung-Hsien Wu. 265-270 [doi]

SURE-MSE speech enhancement for robust speech recognitionNengheng Zheng, Xia Li, Thierry Blu, Tan Lee. 271-274 [doi]

A novel subspace speech enhancement approach based on test of hypothesis and masking propertiesWenju Liu, Ning Cheng, Chao Li. 275-280 [doi]

A speedup method for the separation of speech signals in frequency domainShih-Hsun Chen, Hsiao-Chuan Wang. 281-285 [doi]

A novel algorithm of seeking FrFT order for speech enhancementDuo-jia Ma, Xiang Xie, Jingming Kuang. 286-290 [doi]

Non-negative matrix factorization based discriminative features for speaker verificationYanhua Long, Li-Rong Dai, Eryu Wang, Bin Ma, Wu Guo. 291-295 [doi]

Multidimensional scaling for fast speaker clusteringChi-Chun Hsia, Kuo-Yuan Lee, Chih-Chieh Chuang, Yu-Hsien Chiu. 296-299 [doi]

An enhanced Fishervoice subspace framework for text-independent speaker verificationWeiwu Jiang, Helen M. Meng, Zhifeng Li. 300-304 [doi]

Frame selection of interview channel for NIST speaker recognition evaluationHanwu Sun, Bin Ma, Haizhou Li. 305-308 [doi]

Speaker verification against synthetic speechLianWu Chen, Wu Guo, Li-Rong Dai. 309-312 [doi]

Spectro-temporal smoothed auditory spectra for robust speaker identificationTing-Han Lin, Chung-Chien Hsu, Tai-Shih Chi. 313-317 [doi]

Multi-feature combination for speaker recognitionZhiyi Li, Liang He, Wei-Qiang Zhang, Jia Liu. 318-321 [doi]

Effects of F0 dimensions in perception of Mandarin tonesBin Li, Caicai Zhang. 322-325 [doi]

Investigation of the relation between acoustic features and articulation - An application to emotional speech analysisYongxin Wang, Jianwu Dang, Lianhong Cai. 326-329 [doi]

Investigation of muscle activation in speech production based on an articulatory modelXiyu Wu, Qiang Fang, Jianwu Dang. 330-334 [doi]

The relation between larynx height and F0 during the four tones of Mandarin in X-ray movieGaowu Wang, Jiangping Kong. 335-338 [doi]

Does semantic stress have effect on duration and pitch patterns of prosodic words in presenters' speech?Yu Zou, Wei He, Min Hou, Yonglin Teng. 339-343 [doi]

Downstep in high-low sequences in ChineseMao-Lin Wang, Hua Wu, Ai-jun Li. 344-347 [doi]

Relation between focus and accent in Standard ChineseYuan Jia, Aijun Li. 348-352 [doi]

Mandarin prosodic break detection based on complementary modelChong-Jia Ni, Wenju Liu, Bo Xu. 353-357 [doi]

Acoustic development of vowels in children's speechWai-Sum Lee, Eric Zee. 358-363 [doi]

GMM-based voice conversion with explicit modelling on feature transformLing-Hui Chen, Zhen-Hua Ling, Wu Guo, Li-Rong Dai. 364-368 [doi]

Study on attenuated tone for Mandarin Text-To-SpeechXiaoyan Lou, Jian Li. 369-373 [doi]

Automatic phrase boundary labeling for Mandarin TTS corpus using context-dependent HMMChen-Yu Yang, Zhen-Hua Ling, Heng Lu 0002, Wu Guo, Li-Rong Dai. 374-377 [doi]

Hierarchical pitch target model for Mandarin speechZhiping Zhang, Xinhao Wang, Yansuo Yu, Xihong Wu. 378-382 [doi]

Generating emotional speech from neutral speechLing Cen, Paul Y. Chan, Minghui Dong, Haizhou Li. 383-386 [doi]

Mandarin to Lanzhou dialect conversion based on Five Degree Tone ModelHong-wu Yang, Wei-Tong Guo, Dong Pei, Qing-Qing Liang. 387-391 [doi]

Improving GMM-based spectral conversion with optimal conversion function selectionHsin-Te Hwang, Wen-Liang Wu, Sin-Horng Chen. 392-396 [doi]

Prosody phrase boundary prediction with ensemble learningLifu Yi, Jian Li, Lei He, Jie Hao, Rui Zhao. 397-400 [doi]

Error diagnosis using penalized probabilistic FOIL for Chinese as a Second Language learnerRu-Yng Chang, Chung-Hsien Wu, Philips Kokoh Prasetyo. 401-406 [doi]

Automatic lexical stress detection for Chinese learners' of EnglishJin-Yu Chen, Lan Wang. 407-411 [doi]

Robust pronunciation evaluation in adverse environmentsSi Wei, Qianyong Gao, Guoping Hu, Yu Hu. 412-415 [doi]

A distinctive feature based method for evaluating the phonetic transcription of a non-native speech databaseJinsong Zhang, Dongning Wang, Wen Cao, Ziyu Xiong. 416-419 [doi]

Multi-modal feature integration for story boundary detection in broadcast newsMimi Lu, Lei Xie, Zhong-Hua Fu, Dong-mei Jiang, Yanning Zhang. 420-425 [doi]

Confidence estimation for spoken language translation based on Round Trip TranslationDong Yu, Wei Wei, Lei Jia, Bo Xu. 426-429 [doi]

High performance Chinese Spoken Term Detection based on term expansionWei Li, Ji Wu, Ping Lv. 430-434 [doi]

Perception and analysis of linearly approximated F0 contours in Cantonese speechYujia Li, Tan Lee. 435-439 [doi]

The duration analysis of the checked tones in Cantonese speechXiaoying Xu, Jianhua Tao, Ling Zhang, Yingchao Lu. 440-445 [doi]

Constructing online audio dictionaries for bilingual Mandarin-Taiwan dialects based on Web 2.0 conceptNeng-Huang Pan, Feng-Long Huang, Chun-Hsien Ho, Xin-Wei Lin, Shu-Hau Shiu. 446-450 [doi]

Combining HMM spectrum models and ANN prosody models for speech synthesis of syllable prominent languagesHung-Yan Gu, Ming-Yen Lai, Sung-Feng Tsai. 451-454 [doi]

A combined approach to the polysemy problems in a Chinese to Taiwanese TTS systemYih-Jeng Lin, Ming-Shing Yu, Chin-Yu Lin. 455-459 [doi]

Language identification in code-switching speech using word-based lexical modelDau-Cheng Lyu, Cing-Lei Zhu, Ren-Yuan Lyu, Ming-Tat Ko. 460-464 [doi]

A survey on recent progress in the ASAT/SIRKUS paradigmSabato Marco Siniscalchi, Torbjørn Svendsen, Chin-Hui Lee. 465-470 [doi]

Automatic voice onset time estimation of stops in continuous speechChi-Yueh Lin, Hsiao-Chuan Wang. 471-476 [doi]

Human speech model based on information separation and its application to speech processingNobuaki Minematsu. 477-482 [doi]

Robust speaker verification using phase information of speechNing Wang, P. C. Ching, Tan Lee. 483-487 [doi]

Phone boundary refinement using ranking methodsHung-Yi Lo, Hsin-Min Wang. 488-492 [doi]

runs on WebDSL