26th Conference of the Oriental COCOSDA International Committee for the Co-ordination and Standardisation of Speech Databases and Assessment Techniques, O-COCOSDA 2023, Delhi, India, December 4-6, 2023

researchr

You are not signed in
Sign in
Sign up

26th Conference of the Oriental COCOSDA International Committee for the Co-ordination and Standardisation of Speech Databases and Assessment Techniques, O-COCOSDA 2023, Delhi, India, December 4-6, 2023. IEEE, 2023. [doi]

Conference: ococosda2023

Abstract is missing.

Automated Diagnosis of Parkinson's Disease using Speech Signals with Machine LearningParul Mann, Anmol Jha, Ritu Rani, Garima Jaiswal, Arun Sharma 0002, Amita Dev. 1-6 [doi]

An Isolated Words Balanced Corpus for Native and Non-Native Urdu Speakers in Automatic Speech RecognitionShalini V. Sathe, Ratnadeep R. Deshmukh, Santosh K. Maher, Swapnil Waghmare. 1-5 [doi]

Design and Validation of HindiSER: Speech Emotion Recognition Dataset for Hindi LanguageAshwini S. Shinde, Vaishali V. Patil, Albaab Shaikh, Pratik More, Kajal Salve. 1-5 [doi]

E2E Refined DatasetKeisuke Toyama 0004, Katsuhito Sudoh, Satoshi Nakamura 0001. 1-5 [doi]

Real-time Hate Speech Detection in Live Streaming Platforms using Quantum Machine LearningGeetika Gupta, Karuna Kadian, Raksha Jain, Vimal Dwivedi, Arun Sharma. 1-6 [doi]

*Jingwen Huang, Aijun Li. 1-7 [doi]

Speech Watermarking for Tampering Detection Using Singular Spectrum Analysis with a Psychoacoustic ModelPhondanai Khanti, Pannathorn Sathirasattayanon, Patthranit Kaewcharuay, Nanthayod Termkoh, Ekachai Phaisangittisagul, Kasorn Galajit, Jessada Karnjana. 1-7 [doi]

End-to-End Cross-Lingual Voice Conversion using CycleGAN for Low Resource Indian LanguagesParth Sanjay Khadse, Sabyasachi Chandra, Sankar Mukherjee, Puja Bharati, Debolina Pramanik, Aniket Aitawade, Shyamal Kumar Das Mandal. 1-6 [doi]

Duration Properties and Contrast Preservation in Taifeng Tone SandhiXiaoyan Zhang, Aijun Li, Zhiqiang Li. 1-6 [doi]

Enhancing Sanskrit Isolated Word Recognition: A Comparative Analysis of MFCC and SVM Feature IntegrationAshwini S. Ganakwar, Santosh K. Maher, R. R. Deshmukh. 1-6 [doi]

The Development of a Thai Telephone Conversational Speech CorpusSumonmas Thatphithakkul, Kwanchiva Thangthai, Sahatsawat Sriphol, Vataya Chunwijitra. 1-6 [doi]

IIITH MM2 Speech-Text: A preliminary data for automatic spoken data validation with matched and mismatched speech-text contentNayan Anand, Meenakshi Sirigiraju, Chiranjeevi Yarra. 1-6 [doi]

Convolutional Recurrent Neural Network with Attention Mechanism and Feature Aggregation for Voice Activity DetectionYingWei Tan, XueFeng Ding 0001. 1-5 [doi]

Generating Speech with Prosodic Prominence based on SSL-Visually Grounded ModelsBella Septina Ika Hartanti, Dipta Tanaya, Kurniawati Azizah, Dessi Puji Lestari, Ayu Purwarianti, Sakriani Sakti. 1-6 [doi]

Taiwanese Hakka Across Taiwan Corpus and Formosa Speech Recognition Challenge 2023 - Hakka ASRYuan-Fu Liao, Shaw-Hwa Hwang, You-Shuo Chen, Han-Chun Lai, Yao-Hsing Chung, Li-Te Shen, Yen-Chun Huang, Chi-Jung Huang, Hsu Wen Han, Li-Wei Chen, Pei-Chung Su, Chao-Shih Huang. 1-6 [doi]

"The Potential of Speech Technology to Enhance the Quality of Life in Historic Cities"Shivani Goel, Rashmi Ashtt, Monali Wankar, Prasoon Gupta. 1-7 [doi]

Feature Comparison for Speech Emotion Recognition on Hindi LanguageSurbhi Khurana, Amita Dev, Poonam Bansal. 1-6 [doi]

Analysis of Non-Matching Reference Approach to Predict Speech IntelligibilityA. K. Punnoose. 1-4 [doi]

Beamforming using Different Window Techniques for Near-Field Speech in Anechoic and Reverberant EnvironmentAmruth Ashok Gadag, Rajib Sharma, Deepak K. T.. 1-5 [doi]

INTO_CASS_HEFEI: A Speech Corpus for Intonation and Prosody Study of Hefei ChineseAijun Li, Yuan Ye, Ziyu Xiong. 1-6 [doi]

Acoustic Development of Vowel Production by Prelingually Deaf Chinese Mandarin-speaking Children with Cochlear ImplantsJue Yu, Kexin Zhang. 1-6 [doi]

NITK-KLESC: Kannada Language Emotional Speech Corpus for Speaker RecognitionShalini Tomar, Pragya Gupta, Shashidhar G. Koolagudi. 1-6 [doi]

Comparative Analysis of Direct Speech-to-Speech Translation and Voice Conversion Using Bi-LSTMLalaram Arya, Sai Naga Venu Gopal Bhamidi, Shashi Prabha, S. R. Mahadeva Prasanna. 1-6 [doi]

Transforming Shahjahanabad into a Smart Heritage City Integrating Good Governance, Speech, and IoT Technologies for Sustainable Urban DevelopmentRashmi Ashtt, Mayank Mathur. 1-6 [doi]

Investigation of Validity of Paradigmatic Diagnosis for Downstep in JapaneseKei Furukawa, Satoshi Nakamura 0001. 1-6 [doi]

Few-shot meta multilabel classifier for low resource accented code-switched speechSreeja Manghat, Sreeram Manghat, Tanja Schultz. 1-6 [doi]

Construction and analysis of Tibetan Khampa dialect corpus for speech synthesisYi Zhu 0009, Wenhuan Lu, Yangzom, Mengfei Hu, Kuntharrgyal Khysru, Jianguo Wei. 1-6 [doi]

Zero-shot Mispronunciation Detection by Knowledge-based Data AugmentationZhenghai You, Mewlude Nijat, Ying Shi 0001, Chen Chen, Wenqiang Du, Askar Hamdulla, Dong Wang 0013. 1-6 [doi]

Investigating Activation Functions to Enhance Speaker Identification with LSTM NetworksPooja Gambhir, Amita Dev, Poonam Bansal. 1-7 [doi]

Efficiently Transferring Pre-trained Language Model RoBERTa Base English to Hindi Using WECHSELRamesh K. Bhukya, Anjali Chaturvedi, Hardik Bajaj, Udgam Shah, Sumit Singh, Uma Shanker Tiwary. 1-6 [doi]

The Effects of Aging on Electroglottographic and Acoustic Parameters of Voices and the Detection of Change Points in Vocal AgingYifan Mou, Lei Zhu. 1-6 [doi]

ASHI: A Database of Assamese Accented HindiJoyshree Chakraborty, Rohit Sinha 0003, Priyankoo Sarmah. 1-6 [doi]

Spoken Language Identification Using Convolutional Neural Network In Nepalese ContextShiva Sagar Sapkota, Aman Shakya, Basanta Joshi. 1-6 [doi]

ViQG: Web Tool for Automatic Question Generation from Code for Viva PreparationHunny Gaur, Devendra K. Tayal, Amita Jain. 1-6 [doi]

Empirical Analysis of Machine Learning Models on Parkinson's Speech DatasetBhavika Sachdeva, Harshita Rathee, Pooja Gambhir, Poonam Bansal. 1-5 [doi]

Leveraging Cross Lingual Speech Representations To Build ASR For Under-resourced LanguagesSougata Mukherjee, Prashant Bannulmath, Deepak K. T., S. R. Mahadeva Prasanna. 1-6 [doi]

Second Language Accent Perception and Language Attitude by Mandarin and Cantonese Speakers in Mainland ChinaYizhou Lan, Tongtong Xie, Jingbai Sun, Yuenan Zhu, Albert Lee. 1-5 [doi]

Leveraging Speech Recognition for Smart Urban Last Mile Connectivity EnhancementKanwar Dimple Singh, Rashmi Ashtt. 1-26 [doi]

An Ensemble Approach for Speaker Recognition using Deep Neural NetworksSakshi Mittal, Aiman Shaikh, Pooja Gambhir, Amita Dev, Poonam Bansal. 1-7 [doi]

Fine-tuning the Wav2Vec2 Model for Automatic Speech Emotion Recognition SystemDevendra Kayande, Indra Ballav Sonowal, Ramesh K. Bhukya. 1-6 [doi]

A Research on Uygur Primary Teachers' Production Characteristics and Hierarchy of Difficulty in Acquiring Vowels of Standard ChineseLinjiao Pan, Yuan Jia. 1-5 [doi]

NayanCom - A Smart Patient Communication SystemAryaman Sharma, Harshit Gupta, Tabishi Singh, Gaurav Singal, Riti Kushwaha. 1-8 [doi]

Evaluation of Assamese Speech Data Transcriptions by Levenshtein DistanceRajesha N., Rejitha K. S., Narayan Kumar Choudhary. 1-4 [doi]

ChatterBot - An AI Conversational EntityAashi Gupta, Priya Sharma, Kiran Malik, Ritika Kumari, Poonam Bansal. 1-6 [doi]

Telugu Vakyalu: Spoken Telugu Sentences for IoT ApplicationsParabattina Bhagath, Vanga Lasya, Pulapaka Dhyeya, Pradip K. Das. 1-5 [doi]

CTC-Based End-to-End Speech Recognition for Low Resource Language SanskritSuhani, Amita Dev, Poonam Bansal. 1-5 [doi]

Empirical Analysis of Phonological and Prosodic Features of Native and Non-Native Hindi SpeakersShambhu Sharan, Shweta Bansal, Poonam Bansal, Amita Dev, Shyam S. Agrawal. 1-7 [doi]

M-Diarization: A Myanmar Speaker Diarization using Multi-scale dynamic weightsMyat Aye Aye Aung, Win Pa Pa, Hay Mar Soe Naing. 1-5 [doi]

Advancing Transfer Learning Paradigms for Myanmar (Burmese) to Wa (Austroasiatic Language Family) Language TranslationFlorance Yune, Khin Mar Soe. 1-6 [doi]

A Novel Approach for Bootstrapping and Automatic Transcription of Low Resourced Language Speech CorpusMukund Kumar Roy, Karunesh Kumar Arora, Joyanta Basu, Saikat Basu, Sunita Arora, Shyam S. Agarwal. 1-5 [doi]

Optimizing Direct Speech-to-Text Translation for un-orthographic low-resource tribal languages using source transliterationsTonmoy Rajkhowa, Amartya Chowdhury, Prashant Bannulmath, Deepak K. T., S. R. Mahadeva Prasanna. 1-6 [doi]

Speech Enhancement And Noise Reduction In Forensic ApplicationsSurbhi Bharti, Prerna Jha, Medha Arora, Ashwni Kumar. 1-5 [doi]

Type-Token Analysis on LDC-IL Text CorpusRejitha K. S., Rajesha N., Narayan Kumar Choudhary. 1-6 [doi]

Exploring Difficulties Encountered by Professional Interpreters in Japanese-to-English and English-to-Japanese Simultaneous TranslationHang Xi, Sakriani Sakti. 1-6 [doi]

Heterogeneous Network Framework with Attention Mechanism of Speech Enhancement for Car Intelligent Cockpit Speech RecognitionYingWei Tan, XueFeng Ding 0001. 1-5 [doi]

Acoustic Features and Patterns of Chinese sibilants and English Fricatives by Native Uyghur SpeakersXintong Zuo, Yuan Jia, Hui Feng. 1-5 [doi]

Yangru Tone in Southern Min: Variation across ContextsYishan Huang. 1-6 [doi]

Exploration of Speech Rhythm in Deori L1 and L2Krisangi Saikia, Shakuntala Mahanta. 1-8 [doi]

SPIRE-SIES: A Spontaneous Indian English Speech CorpusAbhayjeet Singh, Charu Shah, Rajashri Varadaraj, Sonakshi Chauhan, Prasanta Kumar Ghosh. 1-6 [doi]

Designing an IVR-based Speech Data Collection Framework for building Realistic Speech Corpus on Forensic Automatic Speaker RecognitionSoma Khan, Joyanta Basu, Milton Samirakshma Bepari, Madhab Pal, Rajib Roy. 1-6 [doi]

Emotion Prediction Using Multi-source Biosignals During Cognitive Behavior Therapy with Conversational Virtual AgentsKana Miyamoto, Hiroki Tanaka, Kazuhiro Shidara, Satoshi Nakamura 0001. 1-6 [doi]

VoiceBank-2023: A Multi-Speaker Mandarin Speech Corpus for Constructing Personalized TTS Systems for the Speech ImpairedJia-Jyu Su, Pang-Chen Liao, Yen-Ting Lin, Wu-Hao Li, Guan-Ting Liou, Cheng-Che Kao, Wei-Cheng Chen, Jen-Chieh Chiang, Wen-Yang Chang, Pin-Han Lin, Chen-Yu Chiang. 1-6 [doi]

Focus and Intonation in DimasaShakuntala Mahanta, Bibungshri Boro, Priti Raychoudhury. 1-6 [doi]

Analysis and Classification of Dysarthric SpeechVartika Tyagi, Amita Dev, Poonam Bansal. 1-6 [doi]

Data augmentation strategies for low resource conversational code-switchingSreeja Manghat, Sreeram Manghat, Tanja Schultz. 1-7 [doi]

Automatic Syllabification of Bengali in SPPASMoumita Pakrashi, Brigitte Bigi, Shakuntala Mahanta. 1-6 [doi]

Designing and Developing a Marathi Speech Database for Native and Non-Native Emotional Speech in the Marathi LanguageBharati D. Borade, Ratnadeep R. Deshmukh, Santosh K. Maher, Swapnil Waghmare. 1-6 [doi]

Prosody in Everyday Japanese Conversation at the Clause FinalYasuyuki Usuda. 1-5 [doi]

Speech Dataset Development for a Low-Resource Tibeto-Burman Tonal LanguageThiyam Susma Devi, Pradip K. Das. 1-6 [doi]

Perception Of Long And Short Vowel Contrast In MongolianAomin, Dahu Baiyila, Aijun Li. 1-4 [doi]

"Enhancing Efficiency and Conservation via Speech Processing in Lutyens's Delhi Residential Revitalization"Shweta Sharma, Rashmi Ashtt, Monali Wankar. 1-7 [doi]

Prosodic Encoding of Focus and Interrogative mood in Tianjin DialectBinbin Sun, Hui Feng, Tianqi Geng. 1-6 [doi]

Speech Recognition Applications in Enhancing Safety for Women in Built EnvironmentMani Gupta, Rashmi Ashtt, Monali Wankar, Ajay Monga. 1-15 [doi]

External Links

Cite Key

Statistics

PDF

Researchr

26th Conference of the Oriental COCOSDA International Committee for the Co-ordination and Standardisation of Speech Databases and Assessment Techniques, O-COCOSDA 2023, Delhi, India, December 4-6, 2023

Abstract

Table of Contents