Asia Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2023, Taipei, Taiwan, October 31 - Nov. 3, 2023

researchr

You are not signed in
Sign in
Sign up

Asia Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2023, Taipei, Taiwan, October 31 - Nov. 3, 2023. IEEE, 2023. [doi]

Conference: apsipa2023

Abstract is missing.

Cognitive Assessment of Autism Spectrum Disorder Using an EEG-based Social Interaction PlatformYi-Li Tseng, Yi-Ling Chien, Tse-Min Chuang, Yen-Nan Chiu, Wen-Che Tsai. [doi]

Mixed Emotion Recognition Based on EEG SignalsGuanxiong Pei, Bingjie Li, Taihao Li, Cunhang Fan, Chao Zhang, Zhao Lv. 1-7 [doi]

Attention-based CNN and Relative Phase Feature Modeling for Improved Imagined Speech RecognitionYoshiki Niimura, Jun Takemoto, Atsuhiko Kai, Seiichi Nakagawa. 8-14 [doi]

Manipulation of Neuronal Network Firing Patterns using Temporal Deep Unfolding-based MPCJumpei Aizawa, Masaki Ogura 0001, Masanori Shimono, Naoki Wakamiya. 15-21 [doi]

Goodness of Fit to the Convolution Model of fMRI Data and Determination of the Regularization ParameterWakako Nakamura. 22-26 [doi]

Detection model of sister chromatid cohesion defects based on Vision TransformerShinya Matsumoto, Kan Okubo, Takuya Abe, Kiyoshi Nishikawa. 27-31 [doi]

GRALA: modeling social information for microblog sentiment analysis from the view of balancing sparsity and smoothness of social contextsXiaomei Zou, Shiyong Hu, Taihao Li. 32-37 [doi]

Adopting Neural Translation Model in Data Generation for Inverse Text NormalizationYufei Jiang, Thi-Nga Ho, Eng Siong Chng. 38-45 [doi]

Mismatched Semi-supervised Learning with Feature Similarity ConsistencyZechen Liang, Qiaosong Fan, Yuan-Gen Wang. 46-50 [doi]

Collaborative Pseudo Labeling for Prompt-Based LearningJen-Tzung Chien, Chien-Ching Chen. 51-56 [doi]

Learning Meta Soft Prompt for Few-Shot Language ModelsJen-Tzung Chien, Ming-Yen Chen, Jing-Hao Xue. 57-62 [doi]

MSDF-Net: A Multi-Scale Deep Fusion Network with Dilated Convolutions for Cloud Removal from Sentinel-2 ImageryA. Jayakrishnan, Venkatesan Meenakshi Sundaram, Prabhavathy Panneer, Alkha Mohan. 63-70 [doi]

Instance Implant-Aided Non-uniformly Cropping for Person Detection in Aerial ImagesXiangqing Zhang, Yan Feng, Shun Zhang, Yuning Wang. 71-78 [doi]

A Futuristic Proposed Solution to a Global Challenge: The Promise of AI for Social Distancing ComplianceYi Pei Ng, Chi Wee Tan, Yiqi Tew. 79-83 [doi]

Unbiased Decision-Making Framework in Long-Video Macro & Micro-Expression SpottingPei-Sze Tan, Sailaja Rajanala, Arghya Pal, Raphaël C.-W. Phan, Huey Fang Ong. 84-89 [doi]

Adaptive Beamforming Based on Interference-Plus-Noise Covariance Matrix Reconstruction for Speech SeparationYongxiong Xiao, Shiqiang Zhu, Te Li, Minhong Wan, Wei Song 0008, Jason Gu, Qiang Fu. 90-95 [doi]

Correlated Multi-Level Speech Enhancement for Robust Real-World ASR Applications Using Mask-Waveform-Feature OptimizationHang Chen, Jun Du, Zhe Wang, Chenxi Wang, Yuling Ren, Qinglong Li, Ruibo Liu, Chin-Hui Lee 0001. 96-101 [doi]

CASA-Net: Cross-attention and Self-attention for End-to-End Audio-visual Speaker DiarizationHaodong Zhou, Tao Li, Jie Wang, Lin Li, Qingyang Hong. 102-106 [doi]

Enhanced Neural Beamformer with Spatial Information for Target Speech ExtractionAoqi Guo, Junnan Wu, Peng Gao, Wenbo Zhu, Qinwen Guo, Dazhi Gao, Yujun Wang. 107-113 [doi]

Low-complexity Multi-Channel Speaker Extraction with Pure Speech CuesBang Zeng, Hongbin Suo, Yulong Wan, Ming Li. 114-118 [doi]

Modeling Suprasegmental Information Using Finite Difference Network for End-to-End Speaker VerificationJin Li, Man-Wai Mak, Nan Yan, Lan Wang. 119-124 [doi]

Relevance of Quadrature Phase For Replay Detection in Voice Assistants (VAs)Priyanka Gupta, Piyushkumar K. Chodingala, Hemant A. Patil. 125-130 [doi]

Exploring Residual Cepstral Features for Spoken Language IdentificationBaveet Singh Hora, Krishna Parmar, Shrey Machhar, Hemant A. Patil, Kiran Praveen, Balaji Radhakrishnan. 131-138 [doi]

Consideration of Varying Training Lengths for Short-Duration Speaker VerificationWooSeok Ko, Se-Yun Um, Zhenyu Piao, Hong-Goo Kang. 139-144 [doi]

Adversarial Robustness of Mel Based Speaker Recognition SystemsRitu Srivastava, Saiteja Kosgi, Sarath Sivaprasad, Neha Sahipjohn, Vineet Gandhi. 145-150 [doi]

Joint Drum Transcription and Metrical Analysis Based on Periodicity-Aware Multi-Task LearningDaichi Kamakura, Eita Nanamura, Takehisa Oyama, Kazuyoshi Yoshii. 151-157 [doi]

CTC2: End-to-End Drum Transcription Based on Connectionist Temporal Classification With Constant Tempo ConstraintDaichi Kamakura, Eita Nakamura, Kazuyoshi Yoshii. 158-164 [doi]

Learning Multifaceted Self-Similarity for Musical Structure AnalysisTsung-Ping Chen, Li Su 0004, Kazuyoshi Yoshii. 165-172 [doi]

Simultaneous Measurement of Multiple Acoustic Attributes Using Structured Periodic Test Signals Including Music and Other Sound MaterialsHideki Kawahara, Kohei Yatabe, Ken-Ichi Sakakibara, Mitsunori Mizumachi, Tatsuya Kitamura. 173-180 [doi]

Gait Analysis in Powered Exoskeleton-Assisted Walking in Patients with Stroke: A Case Series CohortJian-Jia Huang, Shih-Chieh Chang, Cheng-Hsu Cheng, Timothy Wan, Yu-Cheng Pei. 187-194 [doi]

Prediction Model of Postoperative Pain Exacerbation Using a Wearable Electrocardiogram SensorToshiyuki Nakanishi, Koichi Fujiwara, Kazuya Sobue. 195-198 [doi]

Directional Neural Connectivity during Robot Mirror Therapy in Patients with StrokeYuma Kanaizuka, Takahiro Manabe, Jian-Jia Huang, Jen-Wen Hung, Yumie Ono. 199-205 [doi]

Evaluation of neural response recorded using scalp EEG in virtual reality environmentNoriaki Kanayama, Makoto Miyakoshi, Maro G. Machizawa. 206-210 [doi]

Machine Learning Based Action Recognition with Modular CNNShi-Zong Huang, Ching-Te Chiu, Yu-Jen Chang. 211-216 [doi]

Real-Time Processing for Weighted Pulse Decomposition of Photoplethysmography Signals Based on Interior Point Method in Wearable Devices for Hemodynamic StateTing-Jui Wong, Pei-Yun Tsai. 217-221 [doi]

QoS-Aware Downlink Beamforming for Joint Transmission in Multi-Cell NetworksChen-Yen Lin, Kuang-Hao Stanley Liu. 222-229 [doi]

Deep-Learning-Based Lattice Reduction Preprocessing for Time-Correlated MIMO SystemsYi-Mei Li, Jung-Chun Chi, Yuan-Hao Huang. 230-237 [doi]

Utilizing Unlabeled Data and Synthetic Data for Bird Sound Detection: Consistency Training, Mean Teacher, and Domain Adaptation TechniquesFang-Ching Chen, Yi-Wen Liu. 238-242 [doi]

A Comparative Evaluation of Video Codecs for rPPG-based Heart Rate EstimationMuhammad H. Hyanda, Nur Ahmadi, Peter H. Charlton, Timothy G. Constandinou, Ayu Purwarianti, Trio Adiono. 243-247 [doi]

Human Activity Recognition Based on FMCW Radar Using CNN and Transfer LearningListi Restu Triani, Nur Ahmadi, Trio Adiono. 248-253 [doi]

DQN Algorithm Design for Fast Efficient Shortest Path SystemA. Sumarudin, Nana Sutisna, Infall Syafalni, Bambang Riyanto Trilaksono, Trio Adiono. 254-260 [doi]

Comparison of MPPT based on Deep Reinforcement Learning by DQN, DDPG and TD3Jayandi Panggabean, Nana Sutisna, Infall Syafalni, Trio Adiono. 261-266 [doi]

Signal Quality Assessment for Wearable Multichannel Photoplethysmography SignalsMuhammad Dzaky Prihatmoko, Nur Ahmadi, Peter H. Charlton, Trio Adiono. 267-271 [doi]

After-Fatigue Condition: A Novel Analysis Based on Surface EMG SignalsVan Hieu Nguyen, Gia Thien Luu, Thien Van Luong, Mai Xuan Trang, Philippe Ravier, Olivier Buttelli. 272-277 [doi]

On the Semi-Blind Mutually Referenced Equalizers for MIMO SystemsDo Hai Son, Karim Abed-Meraim, Tran Trong Duy, Nguyen Linh-Trung, Tran Thi Thuy Quynh. 278-283 [doi]

Accurate continuous action and gesture recognition method based on skeleton and sliding windows techniquesViet-Duc Le, Thi-Lich Nghiem, Thi-Lan Le. 284-290 [doi]

Transformer-Based Deep Learning Detector for Dual-Mode Index Modulation 3D-OFDMToan Gian, Tien-Hoa Nguyen, Trung Tan Nguyen, Van-Cuong Pham, Thien Van Luong. 291-296 [doi]

GAFormer: Wearable IMU-Based Human Activity Recognition with Gramian Angular Field and TransformerTrung-Hieu Le, Thai-Khanh Nguyen, Trung-Kien Tran, Thanh-Hai Tran 0001, Cuong Pham 0001. 297-303 [doi]

Fatigue Classification and Onset estimation using Surface EMG Signals during Strength TrainingEswar Adapa, Anish C. Turlapaty, Surya Naidu. 304-310 [doi]

P300 Event-Related Potential in Perception of Multiple Traffic Objects During Vehicle DrivingYuki Yamamoto, Sou Nobukawa, Nobuhiko Wagatsuma, Keiichiro Inagaki. 311-316 [doi]

Kernel Random Projection Depth for Outlier DetectionAkira Tamamori. 317-324 [doi]

Soft-Sensor Construction Method Based on Adaptive Modeling and Transfer Learning for Manufacturing Process Including Maintenance PeriodsKaito Katayama, Koichi Fujiwara, Kazuki Yamamoto. 325-328 [doi]

Detecting Wire Bonding Defects in Point Clouds on Self-Generated DatasetShang Li Yuen, Phooi-Yee Lau, Chin Wee Wong, Muhammad Hafiz Samsuri, Zarina Hussin, Nur Afiqah Kamarudin, Muhammad Syukri Mohd Talib, Hock Woon Hon. 329-335 [doi]

Predicting Outcomes of Cognitive Behavioral Therapy for Depression Using Data Driven ApproachesLily Tyszczuk, Liat Levita, Jaime Delgadillo, Haihong Zhang, Mahnaz Arvaneh. 336-343 [doi]

Learning Adapters for Code-Switching Speech RecognitionChun-Yi He, Jen-Tzung Chien. 344-349 [doi]

FID-RPRGAN-VC: Fréchet Inception Distance Loss based Region-wise Position Normalized Relativistic GAN for Non-Parallel Voice ConversionSandipan Dhar, MD. Tousin Akhter, Padmanabha Banerjee, Nanda Dulal Jana, Swagatam Das. 350-356 [doi]

Deformable Aligned Fusion for Video Super ResolutionSin-Hong Lee, Chih-Hung Kuo, Tsai-Chun Yu. 357-364 [doi]

Learning Single Image Rain Streak Removal Based on Deep Attention MechanismKuan-Hua Huang, Li-Wei Kang. 365-372 [doi]

A Transformer-Based Framework for Tiny Object DetectionYi-Kai Liao, Gong-Si Lin, Mei-Chen Yeh. 373-377 [doi]

Lightweight Models Distillation with Learnable Teaching Material: An Application for Smart Table Tennis SystemDuan-Yu Chen, Yu-Hsuan Chen. 378-383 [doi]

Selecting Suitable Data Input for Deep-Learning Sign-Language Recognition with a Small DatasetYu-Jen Chen, Po-Chyi Su. 384-391 [doi]

Analysis of the Interaction Effect on Pruning and Transfer Learning in Model TrainingYu-Jen Wei, Jia Hong Chen, Tien-Ying Kuo. 392-395 [doi]

Old Damaged Photo Recovery with Style Transfer-Based Data AugmentationChih-Hao Wang, Yu-Jen Wei, Ching-Hsiang Chang, Tien-Ying Kuo. 396-400 [doi]

A Deep Learning based Sustainable Energy Scheduling SystemKun-Lin Tsai, Yan Hao Chen, Choa-Ting Huang, Guo-Wei Huang, Shih-Ting Tseng. 401-407 [doi]

A Computational Efficient Direct Position Determination Approach of Narrow-band EmitterYuan Zhao, Hanmin Sheng, Jinliang Shao. 408-413 [doi]

Modeling and Analysis of the Epidemic-Behavior Co-evolution Dynamics with User IrrationalityWenxiang Dong, H. Vicky Zhao. 414-421 [doi]

Noise-robust Pitch Detection Based on Super-Resolution HarmonicsDongjie Zhu, Weibin Zhu, Tianrui Wang, Yingying Gao, Junlan Feng, Shilei Zhang. 422-426 [doi]

A Subband Approach to Personal Sound Zone with Joint Optimization of Sound Pressure and Particle VelocityYingke Zhao, Wen Zhang, Jingdong Chen. 427-431 [doi]

An Multi-evidence Fusion Based on C-Distance with Uncertain Reasoning for ClassificationCuiping Cheng, Pengcheng Yue, Taihao Li. 432-437 [doi]

On Uncertainty Principles for Lowband Graph SignalsNa Li, Linbo Shang, Zhichao Zhang. 438-442 [doi]

CoA-DLinkNet: Connectivity-Enhanced Dual-Branch Road Extraction Network Based on D-LinkNetLinghan Li, Heliu Chen, Renjie He, Yuchao Dai, Mingyi He. 443-449 [doi]

Black-box Lossless Fragile Watermarking Based on Hidden Space Search for DNN Integrity AuthenticationGejian Zhao, Chuan Qin 0001. 450-455 [doi]

Hiding patient information in medical images:A high-capacity and reversible hiding algorithm for E-healthcareXiaoyi Zhou, Shuai Lee. 456-461 [doi]

A Visually Meaningful Image Encryption Algorithm with Attention Mechanism and Artificial Bee Colony OptimizationJiarong Mao, Yuting An, Xiaoyi Zhou. 462-467 [doi]

High-Quality Triggers Based Fragile Watermarking for Optical Character Recognition ModelYujie Yin, Heng Yin, Zhaoxia Yin, Wanli Lyu, Sha Wei. 468-475 [doi]

Coupled Transformed Induced Tensor Nuclear Norm for Robust Tensor CompletionMengjie Qin, Zheyuan Lin, Minhong Wan, Chunlong Zhang, Jason Gu, Te Li. 476-483 [doi]

Multi-Frequency Feature Enhancement for Multi-Granularity Visual ClassificationMeijiang Fu, Yixiao Zheng, Dongliang Chang, Wenpan Li, Zhanyu Ma. 484-489 [doi]

Improving Aspect Sentiment Classification via Retrieving from Training DataTongtao Ling, Lei Chen, Chen Liao, Shilei Huang, ZhiPeng Yu, Yi Liu. 490-497 [doi]

CH-MEAD: A Chinese Multimodal Conversational Emotion Analysis Dataset with Fine-Grained Emotion TaxonomyYu-Ping Ruan, Shu-Kai Zheng, Jiantao Huang, Xiaoning Zhang, Yulong Liu, Taihao Li. 498-505 [doi]

Evolutionary Analysis and Cultural Transmission Models of Color Style Distributions in Painting ArtsEita Nakamura, Yasuyuki Saito. 506-513 [doi]

Ultimatelink Between Characters Having a Certain Meaning in Physical Space to URL in Cyberspace with Robust Print and ScanKeiji Yamadera, Michiharu Niimi. 514-518 [doi]

Human Flow Measurement System Using Floor Estimation of Depth Images for Low-End IoT DevicesTakuya Nagatoshi, Michiharu Niimi. 519-522 [doi]

Holo-QoI: A Human Factor-Based Dataset and Prediction Framework for Assessing Quality of Interaction in Augmented RealitySeongjean Kim, Seonghwa Choi, Sanghoon Lee. 523-528 [doi]

Supervised Single-channel EEG Decomposition using Detector-kernel Networks for Noise ReductionHiroshi Higashi. 529-534 [doi]

Cross-Subject Classification of Spoken Mandarin Vowels and Tones with EEG Signals: A Study of End-to-End CNN with Fine-TuningXinyu Wang, Mingtao Li, Hao Li, Sio-Hang Pun, Fei Chen 0011. 535-539 [doi]

Decoding time-course of saliency network of fMRI signals by EEG signals using optimized forward variable selection: a concurrent EEG-fMRI studyTung Dang, Kentaro Ono, Takafumi Sasaoka, Shigeto Yamawaki, Maro G. Machizawa. 540-545 [doi]

Multimodal recognition of speech and electrocorticogramMitali Ahuja, Shuji Komeiji, Takumi Mitsuhashi, Yasushi Iimura, Hiroharu Suzuki, Hidenori Sugano, Koichi Shinoda, Toshihisa Tanaka. 546-550 [doi]

Enhancing Real-Time Semantic Segmentation with Textual Knowledge of Pre-Trained Vision-Language Model: A Lightweight ApproachChia-Yi Lin, Jun-Cheng Chen, Ja-Ling Wu. 551-558 [doi]

EEG study on anticipation of difficulty for upcoming auditory taskZichen Song, Hiroshi Higashi, Shin Ishii. 559-566 [doi]

Event-Related Potential in Rapid Serial Visual Presentation-based Partial Face Cognition Depends on Visible Face ComponentsIngon Chanpornpakdi, Toshihisa Tanaka. 567-574 [doi]

Residual, Mixer, and Attention: The Three-way Combination for Streaming Wake Word Detection FrameworkSattaya Singkul, Theerat Sakdejayont, Tawunrat Chalothorn. 575-582 [doi]

Audio-to-Score Singing Transcription Based on Joint Estimation of Pitches, Onsets, and Metrical Positions With Tatum-Level CTC LossTengyu Deng, Eita Nakamura, Kazuyoshi Yoshii. 583-590 [doi]

Mask2Hand: Learning to Predict the 3D Hand Pose and Shape from ShadowLi-Jen Chang, Yu-Cheng Liao, Chia-Hui Lin, Shih-Fang Yang-Mao, Hwann-Tzong Chen. 591-598 [doi]

A Reversible Image Processing Method for Color Tone Control Using Data HidingDaichi Nakaya, Shoko Imaizumi. 599-604 [doi]

Image-Text Out-Of-Context Detection Using Synthetic Multimodal MisinformationFatma Shalabi, Huy H. Nguyen, Hichem Felouat, Ching-Chun Chang, Isao Echizen. 605-612 [doi]

Gait Recognition Scheme Focusing on Operating Characteristics at Feature Points Detected by OpenPoseChinatsu Tanaka, Minoru Kuribayashi, Nobuo Funabiki. 613-619 [doi]

A Study on Eliminating Biased Node in Federated LearningReon Akai, Minoru Kuribayashi, Nobuo Funabiki. 620-627 [doi]

Can StArtGAN withstand Image Processing Attacks?Koi Yee Ng, Simying Ong, Yuen Peng Loh. 628-634 [doi]

Enhancing Privacy Preservation with Quantum Computing for Word-Level Audio-Visual Speech RecognitionChang Wang, Jun Du, Hang Chen, Ruoyu Wang 0029, Chao-Han Huck Yang, Jiangjiang Zhao, Yuling Ren, Qinglong Li, Chin-Hui Lee 0001. 635-642 [doi]

Interpretable Image Recognition in Hyperbolic SpaceIrina Lebedeva, Mohamed Jaward Bah, Taihao Li. 643-650 [doi]

Low-light is More Than Darkness: An Empirical Study on Illumination Types and Enhancement MethodsHui Sze Liew, Yuen Peng Loh, Simying Ong. 651-658 [doi]

MoMo Strategy: Learn More from More MistakesSophia Chulif, Sue Han Lee, Yang Loong Chang, Mark Tee Kit Tsun, Kok Chin Chai, Yi Lung Then. 659-665 [doi]

Unveiling Robust Feature Spaces: Image vs. Embedding-Oriented Approaches for Plant Disease IdentificationHamza Ahmed Ishrat, Abel Yu Hao Chai, Sue Han Lee, Patrick Hang Hui Then. 666-673 [doi]

Facial Expression Recognition as markers of DepressionJia Xuan Gue, Chun Yong Chong, Mei Kuan Lim. 674-680 [doi]

How Transferable are Herbarium-Field Features in Few-Shot Plant Identification with Triplet Loss?Sophia Chulif, Sue Han Lee, Yang Loong Chang, Mark Tee Kit Tsun, Kok Chin Chai, Yi Lung Then. 681-687 [doi]

Resolution-Adaptive Lossless Image Compression Using Frequency Decomposition NetworkHochang Rhee, Nam Ik Cho. 688-695 [doi]

Implementation and Analysis on Backpropagating Refinement Scheme for Interactive Image SegmentationChaewon Lee, Won-Dong Jang, Chang-Su Kim 0001. 696-702 [doi]

Implicit Neural Representation for Video Coding Through Progressive Feature ExtractionJihoo Lee, Je-Won Kang. 703-708 [doi]

Deep Unfolded Underwater Image Enhancement Based on Extreme Channels PriorThuy Thi Pham, Truong Thanh Nhat Mai, Chul Lee. 709-713 [doi]

Low-Light Image Enhancement via Distillation of NIR-to-RGB Conversion KnowledgeYoung-Min Jeong, Tae Sung Park, Jeong-Hyeok Park, Jong-Ok Kim. 714-718 [doi]

3D Human Skeleton Estimation from Single RGB Image Based on Fusion of Predicted Depths from Multiple Virtual-ViewpointsWen-Nung Lie, Veasna Vann. 719-725 [doi]

GNN-Based Small-Data Learning with Area-Control Mechanism for Hyperspectral Satellite Change DetectionTzu-Hsuan Lin, Chia-Hsiang Lin, Si-Sheng Young. 726-732 [doi]

Efficient Constraint-Aware Neural Architecture Search for Object DetectionEgor Poliakov, Wei-Jie Hung, Ching-Chun Huang. 733-740 [doi]

A Reliable Feature-Based Framework for Vehicle Tracking in Advanced Driver Assistance SystemsNgoc-Quan Ha-Phan, Thanh Nguyen Truong, Vu-Hoang Tran, Ching-Chun Huang. 741-747 [doi]

Light-weight Zero-Reference-based Image Enhancement for Low-Light ImagesJie-Fan Chang, Kuan-Ting Lai, Cheng-Xuan Zhuang, Guo-Shiang Lin, Ku-Yaw Chang. 748-752 [doi]

Classwise Self-Paced Self-Training for Semi-Supervised Image ClassificationCheng-Yu Lu, Heng-Cheng Hsu, Chen-Kuo Chiang. 753-758 [doi]

CapFormer: A Space-Time Video Description Model using Joint-Attention TransformerMahamat Moussa, Chern Hong Lim, KokSheik Wong. 759-764 [doi]

Local Contrast Enhancement with Multiscale FilteringKohei Hayashi, Yoshihiro Maeda, Norishige Fukushima. 765-770 [doi]

Marine Snow Removal Benchmarking DatasetReina Kaneko, Yuya Sato, Takumi Ueda, Hiroshi Higashi, Yuichi Tanaka 0001. 771-778 [doi]

Cross-Frame Foreground Structural Similarity Modeling by Convolutional Sparse RepresentationKazuki Naganuma, Shunsuke Ono. 779-783 [doi]

JPEG Artifact Removal for Hyperspectral Images Based on Spatial-Spectral RegularizationRyunosuke Eguchi, Iori Kobayashi, Shunsuke Ono, Ryo Matsuoka. 784-787 [doi]

Data Driven Multiband Image Fusion That Preserves Wavelength-Specific Image FeaturesHsuan Lin, Keigo Hirakawa. 788-794 [doi]

Shot-Noise-Aware Image Signal Restoration for Photoelectronic Charge-Based SensorsSeishi Takamura. 795-799 [doi]

Generative Adversarial Network-Based Frame Interpolation with Multi-Perspective DiscriminationQuang Nhat Tran, Shih-Hsuan Yang. 800-805 [doi]

ArtHDR-Net: Perceptually Realistic and Accurate HDR Content CreationHrishav Bakul Barua, Ganesh Krishnasamy, KokSheik Wong, Kalin Stefanov, Abhinav Dhall. 806-812 [doi]

LSR++: An Efficient and Tiny Model for Image Super-ResolutionWei Wang 0352, Xuejing Lei, Yueru Chen, Ming-Sui Lee, C. C. Jay Kuo. 813-819 [doi]

High-Quality Font Generation Based on StyleGAN2 and FSFont Font Generation ModelYuki Shimamura, Michiharu Niimi. 820-825 [doi]

Enhanced Residual Fourier Transformation Network for Lightweight Image Super-resolutionYunming Yang, Masaaki Ikehara. 826-832 [doi]

ELEGANT: End-to-end Language Grounded Speech Denoiser for Efficient Generation of Talking FaceAi-Fang Chai, Sailaja Rajanala, Arghya Pal, Raphaël C.-W. Phan, Chee-Ming Ting. 833-838 [doi]

Segmentation Enhancement for Iris Recognition Using Unit Gradient VectorsLimhourlaurent Meam, Suradej Duangpummet, Waree Kongprawechnon. 839-845 [doi]

FactLLaMA: Optimizing Instruction-Following Language Models with External Knowledge for Automated Fact-CheckingTsun-hin Cheung, Kin-Man Lam 0001. 846-853 [doi]

Auditory Representation Effective for Estimating Vocal Tract InformationToshio Irino, Shintaro Doan. 854-861 [doi]

Accurate and Practical Query-by-Example Using Multiple Deep Learning Models and Frame Compression MethodsHikaru Yamaga, Kazuki Hatakeyama, Kazunori Kojima, Shi-wook Lee, Yoshiaki Itoh 0001. 862-867 [doi]

Fundamental Frequency Estimation Based on Finite-Order Harmonic Constraint Differential EquationKenta Yamada, Yoshiki Masuyama, Kouei Yamaoka, Nobutaka Ono. 868-872 [doi]

Tone Labeling by Deep Learning-based Tone Recognizer for Mandarin SpeechWu-Hao Li, Chen-Yu Chiang, Te-Hsin Liu. 873-880 [doi]

Learning to Enhance the Position Embedding and CoherenceTing-Jia Shu, Jen-Tzung Chien. 881-886 [doi]

VLSI Design of Near-Lossless Image Compression using Improved LZWYao-zhong Zhang, Chiung-An Chen, Jia-sheng Zhang, Jia-Wen Wang. 887-891 [doi]

The color demosaicing and image scaling based on improve Hamilton-AdamsYu-Wen Peng, Chia-Yu Hu, Yen-Ju Chin, He-Sheng Chou, Yuan-Jin Lin, Yu-lin Liu, Shih-Lun Chen, Tsung-Yi Chen, Kuo-Chen Li, Chiung-An Chen. 892-897 [doi]

Improving Regularization of Deep Learning Models in Fundus AnalysisWei-Wen Hsu, Yao-Chung Chang, Wei-Min Lee, Yu-Chuan Huang, Da-Wen Lu. 898-901 [doi]

Design of Interactive System for Acupoint Analysis Based on Augmented RealityChung-Yen Wei, Bo-Yuan Xu, Yu-Xiang Zhao. 902-909 [doi]

Dental Positioning Medical Assistance System for BW Radiograph Based on YOLOV4Mu-Feng Lin, Yi-Qian Li, Tsung-Yi Chen, Yu-lin Liu, Yuan-Jin Lin, Mei-Ling Chan, Chiung-An Chen, Kuo-Chen Li, Shih-Lun Chen. 910-917 [doi]

The Development of an AI-assisted Diagnosis System for Adult Glioma Subtyping PredictionWei-Wen Hsu, Jia-Yi Lin, Hsin-Hung Lai, Wan-Lin Hsu, Jeng-Ting Jiang, Yao-Chung Chang, Yao-Feng Li. 918-921 [doi]

Poisoning Attacks against Gait-based Identity RecognitionJianmin Dong, Datian Peng, Guanxiong Pei, Taihao Li. 922-926 [doi]

STrack: Velocity Estimation Using Single Antenna WiFi DevicesJian Xu, Dongheng Zhang, Jiamu Li, Qibin Sun, Yan Chen 0007. 927-933 [doi]

SEformer: Dual-Path Conformer Neural Network is a Good Speech DenoiserKai Wang, Dimitrios Hatzinakos. 934-940 [doi]

Complex Feature Information Enhanced Speech Emotion RecognitionPengcheng Yue, Shu-Kai Zheng, Taihao Li. 941-946 [doi]

Incorporating Pinyin into Pipeline Named Entity Recognition from Chinese SpeechMin Zhang 0005, Xiaosong Qiao, Yanqing Zhao, Chang Su 0001, Yinglu Li, Ming Zhu, Junhao Zhu, Yuang Li, Xiaofeng Zhao, Yilun Liu, Wenbing Ma, Mengyao Piao, Jiawei Yu, Xinglin Lv, Song Peng, Shimin Tao, Hao Yang 0006, Yanfei Jiang. 947-953 [doi]

Learning Semantic Information from Machine Translation to Improve Speech-to-Text TranslationPan Deng, Jie Zhang, Xinyuan Zhou, Zhongyi Ye, Weitai Zhang, Jianwei Cui, Lirong Dai. 954-959 [doi]

Effective Fine-tuning Method for Tibetan Low-resource Dialect Speech RecognitionJiahao Yang, Jianguo Wei, Kuntharrgyal Khysru, Junhai Xu, Wenhuan Lu, Wenjun Ke, Xiaokang Yang. 960-965 [doi]

Multi-task Piano Transcription with Local Relative Time AttentionQi Wang, Mingkuan Liu, Xianhong Chen, Mengwen Xiong. 966-971 [doi]

Real and imaginary part interaction network for monaural speech enhancement and de-reverberationZehua Zhang, Changjun He, Shiyun Xu, Mingjiang Wang. 972-977 [doi]

Progressive Multi-scale Self-supervised Learning for Speech RecognitionGenshun Wan, Hang Chen, Tan Liu, Chenxi Wang, Jia Pan, Zhongfu Ye. 978-982 [doi]

Improved Data2vec with Soft Supervised Hidden Unit for Mandarin Speech RecognitionGenshun Wan, Hang Chen, Pengcheng Li, Jia Pan, Zhongfu Ye. 983-987 [doi]

Investigation of Ensemble of Self-Supervised Models for Speech Emotion RecognitionYanfeng Wu, Pengcheng Yue, Cuiping Cheng, Taihao Li. 988-995 [doi]

Single Source Zone Detection in the Spherical Harmonic Domain for Multisource LocalizationLiang Tao, Maoshen Jia, Bing Bu, Dingding Yao. 996-1001 [doi]

Robust Representation Learning for Speech Emotion Recognition with Moment ExchangeYunrui Cai, Changhe Song, Boshi Tang, Dongyang Dai, Zhiyong Wu 0001, Helen Meng. 1002-1007 [doi]

Few Shot Learning Guided by Emotion Distance for Cross-corpus Speech Emotion RecognitionPengcheng Yue, Yanfeng Wu, Leyuan Qu, Shukai Zheng, Shuyuan Zhao, Taihao Li. 1008-1012 [doi]

Speech Emotion Recognition by Late Fusion of Linguistic and Acoustic Features using Deep Learning ModelsKiyohide Sato, Keita Kishi, Tetsuo Kosaka. 1013-1018 [doi]

Multilingual, Cross-lingual, and Monolingual Speech Emotion Recognition on EmoFilm DatasetBagus Tris Atmaja, Akira Sasou. 1019-1025 [doi]

Ensembling Multilingual Pre-Trained Models for Predicting Multi-Label Regression Emotion Share from SpeechBagus Tris Atmaja, Akira Sasou. 1026-1029 [doi]

An Automatic Pipeline For Building Emotional Speech DatasetNgoc Anh Nguyen Thi, Bao Thang Ta, Nhat Minh Le, Van Hai Do. 1030-1035 [doi]

Analysis of Emotions in Speech using AESDDS. Uthiraa, Hemant A. Patil. 1036-1041 [doi]

Modified Parametric Multichannel Wiener Filter for Low-latency Enhancement of Speech Mixtures with Unknown Number of SpeakersNing Guo, Tomohiro Nakatani, Shoko Araki, Takehiro Moriya. 1042-1049 [doi]

Blind Source Separation Using Independent Low-Rank Matrix Analysis with Spectrogram-Consistency RegularizationSota Misawa, Norihiro Takamune, Kohei Yatabe, Daichi Kitamura, Hiroshi Saruwatari. 1050-1057 [doi]

Moving Interference Speaker removal using Geometrically Constrained Independent Vector AnalysisShinya Furunaga, Tetsuya Ueda, Shoji Makino. 1058-1063 [doi]

A Dual-Channel Three-Stage Model for DoA and Speech EnhancementMeng-Hsuan Wu, Yih-Liang Shen, Hsuan-Cheng Chou, Bo-Wun Shih, Tai-Shih Chi. 1064-1068 [doi]

A Weighted Binary Cross-Entropy for Sound Event Representation Learning and Few-Shot ClassificationZhongxin Bai, Chao Pan 0001, Gong Chen, Jingdong Chen, Jacob Benesty. 1069-1074 [doi]

A Reconfigurable Hardware Architecture for Graph Convolution Network in Action RecognitionTsung-Han Tsai 0001, Tzu-Chieh Chen. 1075-1078 [doi]

Automated Carina Detection in Chest X-ray Images Using Non-Overlapping and Cross-Squeeze Convolutional Neural NetworksChung-Chian Hsu, Chi-Yuan Chen, S. M. Salahuddin Morsalin, Arthur Chang, Wen-Lin Fan. 1079-1084 [doi]

Identifying the Style of ChattingManman Zhang, Yuchen Ma, Ge Luo 0003, Sheng Li 0006, Zhenxing Qian, Xinpeng Zhang 0001. 1085-1092 [doi]

Pose-Based Visual Servoing with Lightweight Deep-Learning Binarization for Autonomous Mobile Robot ApplicationChian C. Ho, Cian-Duo Lin. 1093-1099 [doi]

Real-Time Noise Suppression Using Harmonic/Percussive Separation with Morphological Operations for Hammering TestRyugo Uchiyama, Nari Tanabe. 1100-1106 [doi]

ΔΣ Modulators for Discrete-time Closed Loop Control Systems with Quantization and SaturationShuichi Ohno, Shenjian Wang, Kiyotsugu Takaba. 1107-1111 [doi]

Asymptotic Estimation Performance of Linear Regression Model with Sparse Bayesian Learning as Both Samples and Signals Approach InfinityKazuaki Murayama. 1112-1118 [doi]

Convolutional Multidimensional Amplitude Spectrum Nuclear Norm for Frequency-domain Robust Principal Component AnalysisRyoya Harashima, Ryunosuke Eguchi, Seisuke Kyochi. 1119-1125 [doi]

Moreau Envelope ADMM for Decentralized Weakly Convex OptimizationReza Mirzaeifard, Naveen K. D. Venkategowda, Alexander Jung, Stefan Werner 0001. 1126-1130 [doi]

An Audio-Visual Speech Enhancement System Based on 3D Image Features: An Application in Hearing AidsYu-Ching Chung, Ji Yan Han, Bo-Sin Wang, Wei-Zhong Zheng, Kung-Yao Shen, Ying-Hui Lai. 1131-1137 [doi]

On Joint Dereverberation and Source Separation with Geometrical Constraints and Iterative Source SteeringKaien Mo, Xianrui Wang, Yichen Yang 0010, Tetsuya Ueda, Shoji Makino, Jingdong Chen. 1138-1142 [doi]

Study of Generative Adversarial Networks for Noisy Speech Simulation from Clean SpeechLeander Melroy Maben, Zixun Guo, Chen Chen, Utkarsh Chudiwal, Chng Eng Siong. 1143-1149 [doi]

Step Size Control of Shared-error Normalized Least Mean Square Algorithm for Acoustic Echo and Noise CancellerKenta Iwai, Takanobu Nishiura. 1150-1154 [doi]

Enhancing Spectrogram for Audio Classification Using Time-Frequency EnhancerHaoran Xing, ShiQi Zhang, Daiki Takeuchi, Daisuke Niizumi, Noboru Harada, Shoji Makino. 1155-1160 [doi]

Evaluating Methods for Ground-Truth-Free Foreign Accent ConversionWen-Chin Huang, Tomoki Toda. 1161-1166 [doi]

DisC-VC: Disentangled and F0-Controllable Neural Voice ConversionChihiro Watanabe, Hirokazu Kameoka. 1167-1171 [doi]

Speech Synthesis Using Ambiguous Inputs From Wearable KeyboardsMatsuri Iwasaki, Sunao Hara, Masanobu Abe. 1172-1178 [doi]

Accent-Preserving Voice Conversion between Native-Nonnative Speakers for Second Language LearningIago Lourenço Correa, Sei Ueno, Akinobu Lee. 1179-1186 [doi]

Increasing Speech Intelligibility by Mimicking Professional Announcers' Voices and Its Physical CorrelatesDung Kim Tran, Masato Akagi, Masashi Unoki. 1187-1192 [doi]

Robust Networked Federated Learning for LocalizationReza Mirzaeifard, Naveen K. D. Venkategowda, Stefan Werner 0001. 1193-1198 [doi]

Continual Local Updates for Federated Learning with Enhanced Robustness to Link NoiseEhsan Lari, Vinay Chakravarthi Gogineni, Reza Arablouei, Stefan Werner 0001. 1199-1203 [doi]

Gaussian Process Learning for Location-Based Service DataEkin Ugurel, Shuai Huang, Cynthia Chen. 1204-1207 [doi]

Distributed on-line anomaly detection using kernel methodsAnthony Kuh, Tyler Baguio. 1208-1213 [doi]

Communication-Efficient Design of Learning System for Energy Demand Forecasting of Electrical VehiclesJiacong Xu, Riley Kilfoyle, Zixiang Xiong, Ligang Lu. 1214-1220 [doi]

Radiated Sound Field Reproduction for Surrounding Loudspeaker Array Based on Higher-order AmbisonicsShota Naiki, Shumpei Miura, Kenta Iwai, Takanobu Nishiura, Yoshiharu Soeta. 1221-1225 [doi]

Multichannel learning-based spatially extended active noise control via model matching and sensor transfer function interpolationPei-Lin Zhong, You-Siang Chen, Mingsian R. Bai. 1226-1233 [doi]

A Study of the Microphone Protection of Active Noise Control for Axial FanYi-Tsung Shen, Cheng-Yuan Chang. 1234-1239 [doi]

SFANC with Compensation Filter Based on MEFxDCTLMS AlgorithmKenya Doi, Yoshinobu Kajikawa. 1240-1244 [doi]

Practical Active Noise Control: Restriction of Maximum Output PowerWoon-Seng Gan, Dongyuan Shi, Xiaoyi Shen. 1245-1249 [doi]

A QoS Throughput Performance Measurement Comparison between UGS and BE Services of a Real-time FPGA Based OFDM Multi-user System Design ImplementationTrio Adiono, Michael Jonathan, Erwin Setiawan, Nana Sutisna, Rahmat Mulyawan, Infall Syafalni. 1250-1256 [doi]

Algorithm Development for Stepwise Valve Deflation Method in Blood Pressure MeasurementTrio Adiono, Reina Puteri Ramadhani, Clarance Amadeus, Sindy Novaria Cicilya Sinaga. 1257-1262 [doi]

SUMO Based Hardware/Software Co-simulation for Two-Intersection Adaptive and Collaborative Traffic Signal ControllerKendrik Emkel Ginting, Nana Sutisna, Infall Syafalni, Trio Adiono. 1263-1270 [doi]

Sparsity Exploration for Structured and Unstructured Weight Formations in CNN ArchitectureDevi Noor Endrawati, Infall Syafalni, Nana Sutisna, Trio Adiono. 1271-1278 [doi]

1M parameters are enough? A lightweight CNN-based model for medical image segmentationBinh-Duong Dinh, Thanh-Thu Nguyen, Thi-Thao Tran, Van-Truong Pham. 1279-1284 [doi]

Imaging Ultrasound Scattering Targets using Density-Enhanced Chaotic Compressive SamplingLuong Thi Theu, Tran Quang Huy, Tran Thi Thuy Quynh, Duc-Tan Tran 0001. 1285-1290 [doi]

Segmentation and observation of hand rehabilitation exercises by supporting of acceleration signalsSinh-Huy Nguyen, Thi-Thu-Hong Le, Hoang-Bach Nguyen, Ngoc-Bach Duong, Hung Cuong Nguyen, Chi Thanh Nguyen, Van Loi Nguyen, Hai Vu. 1291-1295 [doi]

Investigating the Role of Human Action Detector in Visual-guide Audio Source Separation SystemThanh Thi Hien Duong, Trung Hieu Nguyen, The Thanh-Dat Le, Thi-Lich Nghiem, Duc-Huy Pham, Thi-Lan Le. 1296-1303 [doi]

A combination of time and frequency synchronization with Doppler compensation for coded OFDM-based UWA systemsThi Hoai Linh Nguyen, Quoc Khuong Nguyen, Van-Duc Nguyen. 1304-1309 [doi]

Classification of Normal vs. Pathological Infant Cries Using Morse WaveletsPriyanka Gupta, Aastha Kachhi, Hemant A. Patil. 1310-1316 [doi]

Compressive Sensing Based Algorithms for Limited-View PAT Image ReconstructionMary Josy John, Imad Barhumi. 1317-1322 [doi]

Towards AST-LLDs for the Analysis of Depression in Speech SignalsSidharrth Nagappan, Chern Hong Lim, Anuja Thimali Dharmaratne. 1323-1328 [doi]

ecVoice: Audio Text Extraction Optimization of Video Based on Idioms Similarity ReplacementJinwei Lin. 1329-1336 [doi]

Heart Rate Acquisition and Processing Techniques for a Miniature Wearable Microphone SensorYi Yang Ang, Kirish Boodhoo, Wee Ser, Rex Xiao Tan. 1337-1342 [doi]

Detection and Correction of Defective Relative Humidity Data Collected from the Greenhouse Environment Using Nested Kalman Filters with Standard Deviation AnalysisKraithep Sirisanwannakul, Nutchanon Siripool, Kenji Suzuki, Waree Kongprawechnon, Jessada Karnjana. 1343-1348 [doi]

Pedestrian Crossing Intention Prediction with Multi-Modal Transformer-Based ModelTing-Wei Wang, Shang-Hong Lai. 1349-1356 [doi]

Revolutionizing Formative Assessment in STEM Fields: Leveraging AI and NLP TechniquesChi Wee Tan, Khai Yin Lim. 1357-1364 [doi]

A Biased Mixed-Precision Convolution Engine for Hardware-Efficient Computational Imaging CNNHao-Jiun Tu, Yu-Feng Ou, Yong-Tai Chen, Chao-Tsung Huang. 1365-1371 [doi]

A Lightweight Speaker Verification Model For Edge DeviceTing-Wei Chen, Chia-Ping Chen, Chung-Li Lu, Bo-Cheng Chan, Yu-Han Cheng, Hsiang-Feng Chuang, Wei-Yu Chen. 1372-1377 [doi]

Efficient Dictionary and Grid-Based Framework for Answering Durable k-Nearest Neighbor Queries on Time Series DataBagus Jati Santoso, Dwi Prasetya Armunanta, Baskoro Adi Pratomo, Hudan Studiawan. 1378-1385 [doi]

Dual-Path Residual Attention Convolution Networks for Color-Embedded-Grayscale ImageHeri Prasetyo, Abid Ammar Mahdy, Abrar Dwi Fairuz Nadhif, Taufiqurrakhman Nur Hidayat, Rudi Hartono. 1386-1391 [doi]

DOC: A Novel DOuble-Contour-Based Macro Placement Framework for Mixed-Size DesignsYin-Rong Zhuo, Hui-Lin Chen, Yu-Guang Chen. 1392-1397 [doi]

Hindering Adversarial Attacks with Multiple Encrypted Patch EmbeddingsAprilPyone MaungMaung, Isao Echizen, Hitoshi Kiya. 1398-1404 [doi]

Implementation of PLIM on 429MHz LoRa/FSK with improved conversion tableKeita Takeda, Ryuji Miyamoto, Osamu Takyu. 1405-1409 [doi]

Numerical Performance Evaluation of ℓ1 - ℓ2 Sparse Reconstruction Using Optical Analog CircuitSoma Furusawa, Kazunori Hayashi, Kaito Kameda, Ryo Hayakawa. 1410-1416 [doi]

Assessing the Effects of Filtering Processing on Pulse Wave Transit Time Measured by Photoplethysmography from EarlobeShangdi Liao, Haipeng Liu, Dingchang Zheng, Fei Chen 0011. 1417-1421 [doi]

Efficient Incremental Text-to-Speech on GPUsMuyang Du, Chuan Liu, Jiaxing Qi, Junjie Lai. 1422-1428 [doi]

Retinex-based Low-Light Image EnhancementRui Luo, Yan Feng, Mingxin He, Yuliang Zhang. 1429-1434 [doi]

Fine-grained Face Anti-Spoofing based on Recursive Self-Attention and Multi-Scale FusionShichuang Xie, Jiasheng Wu, Yanli Chen, Meng Han, Ting Wu 0001, Tong Qiao. 1435-1442 [doi]

StyleStegan: Leak-free Style Transfer Based on Feature SteganographyXiujian Liang, Bingshan Liu, Qichao Ying, Zhenxing Qian, Hsunfang Cho, Xinpeng Zhang 0001. 1443-1450 [doi]

Robust Watermark Imaging via Graph-signal OptimizationRuiguo Yang, Xinhui Han, Wenfa Qi, Wei Hu 0003. 1451-1457 [doi]

A print-scan-resilient watermarking scheme for trademark imagesWenfa Qi, Jiameng Wang, Zichen Yuan, Xiaolong Li. 1458-1462 [doi]

AI-Generated Image Detection using a Cross-Attention Enhanced Dual-Stream NetworkZiyi Xi, Wenmin Huang, Kangkang Wei, Weiqi Luo 0001, Peijia Zheng. 1463-1470 [doi]

ResNet-Based Camera Model Identification with Adaptive Preprocessing Module and Weight Fusion of Global InformationBoru Chen, Waleed Abdulla. 1471-1478 [doi]

Structural Quality Assured Global Optimization for CTU-Level Rate Control of Screen Content CodingTong Tang, yuan Tan, Shihang Ding, Zhidu Li. 1479-1483 [doi]

Multimodal Emotion Recognition based on 2D Kernel Density Estimation for Multiple Labels FusionZhaojie Luo, Kazunori Komatani. 1484-1491 [doi]

RobustL2S: Speaker-Specific Lip-to-Speech Synthesis exploiting Self-Supervised RepresentationsNeha Sahipjohn, Neil Kumar Shah, Vishal Tambrahalli, Vineet Gandhi. 1492-1499 [doi]

Realizing Nipple in Profile Recognition and Nipple Detection Using a Single ClassificationYi-Chong Zeng. 1500-1505 [doi]

Exploring a CLIP-Enhanced Automated Approach for Video Description GenerationSiang-Ling Zhang, Huai-Hsun Cheng, Yen-Hsin Chen, Mei-Chen Yeh. 1506-1511 [doi]

3D Point Cloud Denoising Based on Color AttributeWei-Chi Lin, Ming-Zhan Lee, He-Sheng Chou, Yuan-Jin Lin, Kuo-Chen Li, Ting-Lan Lin, Shin-Lun Chen. 1512-1516 [doi]

The DSP and DDR4 VLSI Design for Multi-Sensor in Biomedical SystemJia-sheng Zhang, Chiung-An Chen, Shih-Lun Chen, Yao-zhong Zhang. 1517-1520 [doi]

Identification of Victims Wearing Vibrant Clothing using MATLABHao-Cheng Lu, Chiung-An Chen, Jia-sheng Zhang, Yao-zhong Zhang. 1521-1524 [doi]

Point Cloud Inpainting Based on Delaunay TriangulationYu-lin Liu, He-Sheng Chou, Ming-Zhan Lee, Mei-Ling Chan, Ting-Lan Lin, Chiung-An Chen, Shin-Lun Chen. 1525-1529 [doi]

Dense Three-Dimensional Color Reconstruction for Large-Scale Outdoor ScenesZixiao Liu, Sheng Guo, Man-On Pun. 1530-1535 [doi]

Safety Enhancement for Mobility Scooter with Rule-Based Danger PreventionYan-Ru Chen, Shih-Wei-Chen Tseng, Yu-Chi Chen, Yeong-Hwa Chang. 1536-1541 [doi]

Dictionary-driven Chinese ASR Entity Correction with Controllable DecodingRongjun Li, Wei Peng. 1542-1548 [doi]

A Method of Efficient Synthesizing Post-disaster Remote Sensing Image with Diffusion Model and LLMRuizhe Ou, Haotian Yan, Ming Wu 0001, Chuang Zhang. 1549-1555 [doi]

Privacy-oriented Coded Caching in Mobile Information-centric NetworkingBinchen Yang, Yu Guo, Xingyan Chen. 1556-1563 [doi]

MKTformer: Fine-grained Meter Classification Based on Multi-modal Knowledge TransferZhaoye Zheng, Ke Zhang 0005, Chaojun Shi, Fei Zheng. 1564-1570 [doi]

Feature Augmentation Reconstruction Network for Few-Shot Image ClassificationZhen Li, Lang Wang, Wenjuan An, Song Qi, Xiaoxu Li, Xuezhi Fei. 1571-1578 [doi]

Dual Feature Reconstruction Network For Few-shot Image ClassificationXiaowei Guo, Jijie Wu, Kai Ren, Qi Song, Xiaoxu Li. 1579-1584 [doi]

A Cloud-based Data Platform for Efficient EEG Data Management, Collaboration, and AnalysisQi Tian, Wen Wu, Qin Zhu, Tao Cai, Siyi Jiang, Yaqing Li, Jinrun Zhou, Nan Zhu, Yina Wei, Tao Tang, Kedi Xu, Feng Lin, Linqing Feng. 1585-1592 [doi]

Incorporating the Digit Triplet Test in A Lightweight Speech Intelligibility Prediction for Hearing AidsXiajie Zhou, Candy Olivia Mawalim, Benita Angela Titalim, Masashi Unoki. 1593-1600 [doi]

Deep Learning-based MRI Super-Resolution Using Non-uniform Segmented Phase-Scrambling Fourier Transform SignalsKazuki Yamato, Shuntaro Fujisawa, Satoshi Ito. 1601-1606 [doi]

An Extreme Gradient Boosting-based Prediction for DepressionAhmed Ibrahum, Kwang-Ho Park, Jang-Eui Hong, Van-Huy Pham 0001, Keun Ho Ryu. 1607-1613 [doi]

An Improved Check Digit-based Participant Identification System for Human BiorepositoriesMinseok Chu, Gilwon Kang, Keun Ho Ryu. 1614-1621 [doi]

Enhancing Snoring Detection with Statistical Analysis of Audio FeaturesSuphachok Buaruk, Somrudee Deepaisarn. 1622-1627 [doi]

Un-Rectifying in ReLU Networks and ApplicationsShih-Shuo Tung, Ming-Yu Chung, Jinn Ho, Wen-Liang Hwang. 1628-1635 [doi]

OpenPose Based Yoga Poses Difficulty Estimation for Dynamic and Static Yoga ExercisesWan-Chia Huang, Cheng-Liang Shih, Irin Tri Anggraini, Yanqi Xiao, Nobuo Funabiki, Chih-Peng Fan. 1636-1640 [doi]

Multimodal Multifaceted Music Emotion Recognition Based on Self-Attentive Fusion of Psychology-Inspired Symbolic and Acoustic FeaturesJiahao Zhao, Kazuyoshi Yoshii. 1641-1645 [doi]

Learned String Quartet Music with Variational Auto EncoderYoung-Long Chen, Hsin-I Huang, Tzu-Te Yen. 1646-1651 [doi]

SOAda-YOLOR: Small Object Adaptive YOLOR Algorithm for Road Object DetectionYu-Fang Huang, Tsung-Jung Liu, Chun-An Lin, Kuan-Hsien Liu. 1652-1658 [doi]

Badminton Self-Training System Based on Virtual RealityWei-Shen Tai, Kuan-Hsien Liu. 1659-1663 [doi]

Rotation Angle Detection Using a Pilot Signal from Rotated Stego-ImageRinka Kawano, Masaki Kawamura. 1664-1669 [doi]

Application for generating re-accessible screenshots of web pages using histogram shrinkageAyaka Sakamoto, Rinka Kawano, Masaki Kawamura. 1670-1676 [doi]

Domain Adaptation for Efficiently Fine-tuning Vision Transformer with Encrypted ImagesTeru Nagamori, Sayaka Shiota, Hitoshi Kiya. 1677-1683 [doi]

Study on Face Landmark-based Analysis for Synthetic Media Identification Generated by Adversarial Generative NetworksAkinobu Ura, Minoru Kuribayashi, Nobuo Funabiki. 1684-1690 [doi]

HDR Image Watermarking based on Saliency Detection and Quantization Index ModulationAhmed-Khan, Minoru Kuribayashi, KokSheik Wong, Vishnu Monn Baskaran. 1691-1696 [doi]

Quick Response (QR) codes embedding in VVC using Quantisation Parameter ManipulationHau Joan, Li Peng Tan, Yiqi Tew. 1697-1704 [doi]

CPIPS: Learning to Preserve Perceptual Distances in End-to-End Image CompressionChen-Hsiu Huang, Ja-Ling Wu. 1705-1711 [doi]

Task-Specific Pruning: Efficient Parameter Reduction in Multi-task Object Detection ModelsWei-Hsun Ke, Yu-Wen Tseng, Wen-Huang Cheng. 1712-1717 [doi]

Transformer-based Image Compression with Variable Image Quality ObjectivesChia-Hao Kao, Yi-Hsin Chen, Cheng Chien, Wei-chen Chiu, Wen-Hsiao Peng. 1718-1725 [doi]

From Synthetic To Real: Enhancing Deep Learning Models With Generative Adversarial Networks For Efficient Data Utilization In Automatic Retail StoresCong-Ty Dang, Vu-Hoang Tran, Ngoc-Hoang-Lam Le, Ching-Chun Huang. 1726-1731 [doi]

Virtual Garment Fitting Through Parsing and Context-Aware Generative Adversarial Networks with Discriminator GroupWei-Hong Su, Sze-Ann Chen, Chen-I Chin, Hsu-Feng Hsiao. 1732-1738 [doi]

Sparse Tensor-based point cloud attribute compression using Augmented Normalizing FlowsTzu-Po Lin, Monyneath Yim, Jui-Chiu Chiang, Wen-Hsiao Peng, Wen-Nung Lie. 1739-1744 [doi]

Toward Leveraging Pre-Trained Self-Supervised Frontends for Automatic Singing Voice Understanding Tasks: Three Case StudiesYuya Yamamoto. 1745-1752 [doi]

Out-of-Vocabulary Word Detection in Spoken Dialogues Based on Joint Decoding with User Response PatternsMiki Oshio, Hokuto Munakata, Ryu Takeda, Kazunori Komatani. 1753-1759 [doi]

Synthetic Data Augmentation for ASR with Domain FilteringTuan Vu Ho, Shota Horiguchi, Shinji Watanabe 0001, Paola García 0001, Takashi Sumiyoshi. 1760-1765 [doi]

Multi-Self-Supervised Learning Model-Based Throat Microphone Speech RecognitionKohta Masuda, Jun Ogata, Masafumi Nishida, Masafumi Nishimura. 1766-1770 [doi]

ASR Model Adaptation for Rare Words Using Synthetic Data Generated by Multiple Text-To-Speech SystemsKwok Chin Yuen, Haoyang Li, Chng Eng Siong. 1771-1778 [doi]

Streaming End-to-End ASR Using CTC Decoder and DRA for Linguistic Information SubstitutionTatsunari Takagi, Atsunori Ogawa, Norihide Kitaoka, Yukoh Wakabayashi. 1779-1783 [doi]

A Biometric Signature Scheme with Template Protection and Authenticated Sample RecoverabilityWataru Nakamura, Kenta Takahashi. 1784-1791 [doi]

IPFed: Identity protected federated learning for user authenticationYosuke Kaga, Yusei Suzuki, Kenta Takahashi. 1792-1797 [doi]

Privacy-Preserving Image Transformation Method for Person Detection and Re-IDYumo Ouchi, Hidetsugu Uchida, Narishige Abe. 1798-1803 [doi]

Eye Biometrics Combined with Periocular and Iris Recognition Using CNNTaito Tonosaki, Shokei Kawakami, Koichi Ito, Takafumi Aoki, Yoshiko Yasumura, Masakazu Fujio, Yosuke Kaga, Kenta Takahashi. 1804-1810 [doi]

Development of a Robust Ear Recognition Algorithm using Planar ApproximationTakahiko Arakawa, Yuya Sato, Hitoshi Sakano, Tetsushi Ohki. 1811-1815 [doi]

Word encoding for word-looking DGA-based Botnet classificationSea Ran Cleon Liew, Ngai-Fong Law. 1816-1821 [doi]

Analysis of Spectro-Temporal Modulation Representation for Deep-Fake Speech DetectionHaowei Cheng, Candy Olivia Mawalim, Kai Li 0018, Lijun Wang, Masashi Unoki. 1822-1829 [doi]

Flexible Evidence Model to Reduce Uncertainty Mismatch Between Speech Enhancement and ASR Based on Encoder-Decoder ArchitectureRyu Takeda, Yui Sudo, Kazunori Komatani. 1830-1837 [doi]

Investigating the Effectiveness of Speaker Embeddings for Shout Intensity PredictionTakahiro Fukumori, Taito Ishida, Yoichi Yamashita. 1838-1842 [doi]

Is the Ideal Ratio Mask Really the Best? - Exploring the Best Extraction Performance and Optimal Mask of Mask-based BeamformersAtsuo Hiroe, Katsutoshi Itoyama, Kazuhiro Nakadai. 1843-1850 [doi]

Language modeling for spontaneous speech recognition based on disfluency labeling and generation of disfluent textKoharu Horii, Kengo Ohta, Ryota Nishimura, Atsunori Ogawa, Norihide Kitaoka. 1851-1856 [doi]

Transformer-based Automatic Speech Recognition of Simultaneous Interpretation with Auxiliary Input of Source Language TextShuta Taniguchi, Tsuneo Kato, Akihiro Tamura, Keiji Yasuda. 1857-1861 [doi]

An Analysis of Personalized Speech Recognition System Development for the Deaf and Hard-of-HearingLester Phillip Violeta, Tomoki Toda. 1862-1867 [doi]

Classification of Vocal Cord Disorders: Comparison Across Voice Datasets, Speech Tasks, and Machine Learning MethodsChing-Chieh Chen, Wei-Cheng Hsu, Tzu-Han Lin, Kuan-Dar Chen, Yung-An Tsou, Yi-Wen Liu. 1868-1873 [doi]

Application of Deep Learning Techniques for Thermal Imagery Analysis in Abnormal Identification of Floor Tiles in Heritage EnvironmentsChen-Xin Yu, Wu-Pei Chen, Chin-Yen Ju, Tsung-Yi Chen, Kuo-Chen Li, Chiung-An Chen, Mei-Ling Chan, Shih-Lun Chen. 1878-1884 [doi]

Wavelet and Cutout in YOLO Architecture for Road Pothole DetectionShao Hua Lu, Jia-Teng Lu, Szu-Yin Lin, Chih-Hsien Hsia. 1885-1891 [doi]

Robust Finger Vein Recognition Based on Lightweight Attention Convolutional Neural NetworksMing-Yi Wei, Yu-Chi Wang, Liang-Ying Ke, Chih-Hsien Hsia. 1892-1895 [doi]

Lightweight CNN and Image Enhancement Using in Palm Vein RecognitionPing-Han Chen, Yung-Sheng Hung, Chih-Hsien Hsia. 1896-1902 [doi]

Breast Cancer Detection Auxiliary System Leveraging Deep Learning and Mixed RealitySzu-Yin Lin, Ming-Chun Chien, Edwin Tiong Kwong Meng, Yu-Chien Wang, Yu-Yi Kuo, Che-Hsuan Lin. 1903-1906 [doi]

Efficient Reversible Data Hiding for 3D Mesh Models Based on Multi-LSB Substitution and Ring-predictionWanli Lyu, Lulu Cheng, Zhaoxia Yin, Bin Luo 0001. 1907-1914 [doi]

MAEDefense: An Effective Masked AutoEncoder Defense against Adversarial AttacksWanli Lyu, Mengjiang Wu, Zhaoxia Yin, Bin Luo 0001. 1915-1922 [doi]

Preemptive Image Protection against SteganographyYusheng Guo, Nan Zhong, Zhenxing Qian, Xinpeng Zhang 0001, Hsunfang Cho. 1923-1930 [doi]

Zero-shot multi-speaker accent TTS with limited accent dataMingyang Zhang 0003, Yi Zhou 0020, Zhizheng Wu 0001, Haizhou Li 0001. 1931-1936 [doi]

Speech Enhancement with Multi-granularity Vector QuantizationXiao-Ying Zhao, Qiushi Zhu, Jie Zhang, Yeping Zhou, Peiqi Liu. 1937-1942 [doi]

A Comparative Study on Multichannel Speaker-Attributed Automatic Speech Recognition in Multi-party MeetingsMohan Shi, Jie Zhang, Zhihao Du, Fan Yu, Qian Chen, Shiliang Zhang, Li-Rong Dai. 1943-1948 [doi]

Hybrid Syllable and Character Representations for Mandarin ASRFengrun Zhang, Chengfei Li, Shuhao Deng, Yaoping Wang, Jinfeng Bai. 1949-1954 [doi]

Enhancing Whisper Model for Pronunciation Assessment with Multi-AdaptersJing Li, Rui Li, Shen Guo, Aishan Wumaier. 1955-1959 [doi]

DoA Estimation of Room Reflections Using NN-Based MUSIC AlgorithmHaowen Li, Wen Zhang, Lijun Zhang. 1960-1965 [doi]

Hybrid Multi-Task Learning for End-To-End Multimodal Emotion RecognitionJunjie Chen, Yongwei Li, Ziping Zhao, Xuefei Liu, Zhengqi Wen, Jianhua Tao. 1966-1971 [doi]

It's What You Say and How You Say It: Exploring Audio and Textual Features for Podcast DataNeil Kumar Shah, Vivek Srivastava, Mohit Bhardwaj, Satej Kadlay, Dharmeshkumar Agrawal, Savita Bhat, Niranjan Pedanekar. 1972-1977 [doi]

Improved One-class Learning for Voice Spoofing DetectionLixiang Li 0001, Xiaopeng Xue, Haipeng Peng, Yeqing Ren, Mengmeng Zhao. 1978-1983 [doi]

Sound Field Estimation around a Rigid Sphere with Physics-informed Neural NetworkXingyu Chen, Fei Ma, Amy Bastine, Prasanga N. Samarasinghe, Huiyuan Sun. 1984-1989 [doi]

A Controlled Noise Reduction Wiener Filter Based on the Quadratic Eigenvalue ProblemNingning Pan, Jacob Benesty, Jingdong Chen. 1990-1994 [doi]

Target Speaker Extraction with Attention Enhancement and Gated Fusion MechanismSijie Wang, Askar Hamdulla, Mijit Ablimit. 1995-2001 [doi]

Analysis of Speech Separation Performance Degradation on Emotional Speech MixturesJia Qi Yip, Dianwen Ng, Bin Ma 0001, Chng Eng Siong. 2002-2007 [doi]

Geometrically Constrained Blind Moving Source Extraction based on Constant Separation Vector and Auxiliary Function TechniqueRuifeng Zhang, Tetsuya Ueda, Shoji Makino. 2008-2012 [doi]

Universal Sound Separation Using Replay-based Data Sampling in Incremental LearningKanta Shimonishi, Takahiro Fukumori, Yoichi Yamashita. 2013-2018 [doi]

Multiple Sound Source Tracking Based on Generative Modeling and Recursive Bayesian Filtering of Spatial Gradient SpectraKeisuke Takazawa, Hirokazu Kameoka, Masahiro Yukawa. 2019-2023 [doi]

Spatially-Regularized Switching Independent Vector AnalysisTetsuya Ueda, Tomohiro Nakatani, Rintaro Ikeshita, Shoko Araki, Shoji Makino. 2024-2030 [doi]

ASF-LLRDA: Locality-regularized Linear Regression Discriminant Analysis with Approximately Symmetrical Face Preprocessing for Face RecognitionArya Widyadhana, Shintami Chusnul Hidayati, Dini Adni Navastara, Yeni Anistyasari. 2031-2036 [doi]

Joint Optimization Algorithm for Adaptive Bit Allocation Based on Temporal-Spatial InformationShaokang Wang, Songlin Sun. 2037-2042 [doi]

Maximization of 2D Cross-Correlation Based on Auxiliary Function Method for Image AlignmentYuma Kinoshita, Kouei Yamaoka, Hitoshi Kiya. 2043-2047 [doi]

Multitask Record for Badminton MatchJing-Ming Guo, Yu-Shun Huang, Ting-Yu Chang, Tai-Cyuan Ciou, Yun-Ching Yeh, Jeffrey Chen. 2048-2052 [doi]

Deep Residual and Classified Neural Networks for Inverse HalftoningJing-Ming Guo, S. Sankarasrinivasan, Let Viet Hung, Wei Liu. 2053-2060 [doi]

DOA-Aware Audio-Visual Self-Supervised Learning for Sound Event Localization and DetectionYoto Fujita, Yoshiaki Bando, Keisuke Imoto, Masaki Onishi, Kazuyoshi Yoshii. 2061-2067 [doi]

Improving Sound Event Localization and Detection with Class-Dependent Sound Separation for Real-World ScenariosShi Cheng, Jun Du, Qing Wang 0008, Ya Jiang, Zhaoxu Nian, Shutong Niu, Chin-Hui Lee 0001, Yu Gao, Wenbin Zhang. 2068-2073 [doi]

Joint Analysis of Acoustic Scenes and Sound Events Based on Semi-Supervised ApproachAmi Igarashi, Shunsuke Tsubaki, Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada, Keisuke Imoto. 2074-2080 [doi]

Cross-domain Sound Recognition for Efficient Underwater Data AnalysisJeongsoo Park 0001, Dong-Gyun Han, Hyoung Sul La, Sangmin Lee, Yoonchang Han, Eun-Jin Yang. 2081-2086 [doi]

Augmentation of Various Speed Data by Controlling Frame Overlap for Acoustic Traffic MonitoringTomohiro Takahashi, Yuma Kinoshita, Natsuki Ueno, Yukoh Wakabayashi, Nobutaka Ono, Jun Honda, Seishi Fukuma, Aoi Kitamori, Hiroshi Nakagawa. 2087-2091 [doi]

Distributed Computation of Heat Kernel Smoothing Using Series Expansion MethodChien-Cheng Tseng, Su-Ling Lee. 2092-2098 [doi]

In-Air Handwriting for Chinese Character Recognition from Monocular Camera: A Deep Learning based Approach with Fingertip Detection and Virtual Strokes EliminationChih-Chang Yu, Zi-Hang Huang, Hsu-Yung Cheng. 2099-2103 [doi]

EffSegmentNet: Efficient Design for Real-time Semantic SegmentationCyun-Bo Wang, Jian-Jiun Ding. 2104-2111 [doi]

Universal Optimal Parameters of the Closed-Form Linear Canonical Wigner DistributionZhichao Zhang. 2112-2117 [doi]

Autoencoder-Enhanced Federated Learning with Reduced Overhead and Lower LatencyChi-Kai Hsieh, Feng-Tsun Chien, Min-Kuan Chang. 2118-2123 [doi]

Deep Unfolding-based Distributed MIMO DetectionMasaya Kumagai, Ayano Nakai-Kasai, Tadashi Wadayama. 2124-2130 [doi]

A Comparative Analysis of the Yolo Models for Intelligent Lobster Surveillance CameraFityanul Akhyar, Ledya Novamizanti, Koredianto Usman, Ghanes Mahesa Aditya, Farhan Nur Hakim, Mukhamad Zidni Ilman, Ferdi Ramdhon, Chih-Yang Lin. 2131-2136 [doi]

A UAV Indoor Obstacle Avoidance System Based on Deep Reinforcement LearningChun-Huang Lo, Chung-Nan Lee. 2137-2143 [doi]

Approximate modeling of malware diffusion on wireless mobile devicesHideyoshi Miura, Shoya Abukawa, Tomotaka Kimura, Kouji Hirata. 2144-2148 [doi]

Impacts of 5G-TDD Time Slot Configurations on the Downlink and Uplink Data RatesWen-Ping Lai, Wen-Ru Chen, Hong-Lun Lai, Hong Yi Li. 2149-2154 [doi]

Bearing Fault Diagnosis and Interpretation Based on 2D Images and Convolutional Neural NetworkZhenzhen Tian, Xinyu Zhang, Wei Yan, Jihua Wang. 2155-2162 [doi]

Study on Reduction of Background Fringes for Defect Detection of Specular SurfaceAn-Chi Wei, Yi-Cheng Chang, Jyh-Rou Sze. 2163-2167 [doi]

On the Optimal Self-Supervised Multi-Fault Detector for Temperature Sensor DataLatifa Nabila Harfiya, Yan-Cheng Hsu, Yung-hui Li, Jia-Ching Wang. 2168-2172 [doi]

Application of Wafer Defect Pattern Classification Model in the Semiconductor IndustryChin-Wei Lee, Daniel Hládek, Matús Pleva, Yuan-Fu Liao, Ming-Hsiang Su. 2173-2177 [doi]

Question Answering System Based on Pre-Training Model and Retrieval Reranking for Industry 4.0Ta-Fu Chen, Yi-Xing Lin, Ming-Hsiang Su, Po-Kai Chen, Tzu-Chiang Tai, Jia-Ching Wang. 2178-2181 [doi]

Deepfake-speech Detection with Pathological Features and Multilayer Perceptron Neural NetworkAnuwat Chaiwongyen, Suradej Duangpummet, Jessada Karnjana, Waree Kongprawechnon, Masashi Unoki. 2182-2188 [doi]

Temporal and Type Correlation in Digital Phenotyping for Bipolar Disorder State Prediction Using Multitask Self-Supervised LearningJia-Hao Hsu, Hua-Wei Tseng, Chung-Hsien Wu, Esther Ching-Lan Lin, Po See Chen. 2189-2195 [doi]

Data Selection Based on Phoneme Affinity Matrix for Electrolarynx Speech RecognitionI-Ting Hsieh, Chung-Hsien Wu, Shu-Wei Tsai. 2196-2202 [doi]

Reduction of Annotation Effort in Medical Image Analysis Based on Self-supervised LearningKai-Hsuan Chan, Yi-Chong Zeng. 2203-2208 [doi]

STUA-Net: A Fingerprint Reconstruction with Swin Transformer and Soft Collective AttentionFarchan Raswa Hakim, Prabowo Yoga Wicaksana, Wenny Ramadha Putri, Agus Harjoko, Jia-Ching Wang. 2209-2212 [doi]

Coarse-Age Loss: A New Training Method Using Coarse-Age Labeled Data for Speaker Age EstimationYuki Kitagishi, Hosana Kamiyama, Naohiro Tawara, Atsunori Ogawa, Noboru Miyazaki, Taichi Asami. 2213-2220 [doi]

Contribution of modulation spectral features for cross-lingual speech emotion recognition under noisy reverberant conditionsTaiyang Guo, Sixia Li, Shunsuke Kidani, Shogo Okada, Masashi Unoki. 2221-2227 [doi]

Vocal Tract Length Perturbation-based Pseudo-Speaker Augmentation for Speaker Embedding LearningTomoka Wakamatsu, Sayaka Shiota, Hitoshi Kiya. 2228-2232 [doi]

Automatic Call Classification of Autism Model Marmosets by Deep Learning and Analysis of Their Vocal DevelopmentMinato Uesaka, Hideto Kawauchi, Kouei Yamaoka, Yukoh Wakabayashi, Yuma Kinoshita, Nobutaka Ono, Jun Noguchi, Satoshi Watanabe, Noritaka Ichinohe, Seico Benner, Hidenori Yamasue. 2233-2237 [doi]

Cross-Domain adaptation in Distance Space for Speaker VerificationLu Yi, Man-Wai Mak. 2238-2243 [doi]

Urban Noise Monitoring using Edge Computing with CNN-LSTM on Jetson NanoBo Peng, Waleed H. Abdulla, Kevin I-Kai Wang. 2244-2250 [doi]

Random forest of Classification and Regression Tree (CART) in the estimation of SWC based on meteorological inputs and hydrodynamics behindTsung-Hsi Wu, Pei-Yuan Chen, Chien-Chih Chen, Meng-Ju Chung, Zheng-Kai Ye, Ming-Hsu Li. 2251-2255 [doi]

A Framework for Reusing Earth Science Data on Data and Model MarketplacesChung-I Huang, Jih-Sheng Chang, Chen-Kai Sun, Taichi Wang, Wei-Yu Chen, Hui Hung Yu, Wen-Yi Chang, Fang-Pang Lin. 2256-2260 [doi]

Impact of the weighted loss function on the innovative CMAQ-CNN PM2.5 forecasting modelYi-Ju Lee, Fang-Yi Cheng, Chih-Yung Feng, Zhih-Min Yang. 2261-2266 [doi]

Jointly Modelling Transcriptions and Phonemes with Optimal Features to Detect Dementia from Spontaneous CantoneseXiaoquan Ke, Man-Wai Mak, Helen M. Meng. 2267-2273 [doi]

Combining multiple end-to-end speech recognition models based on density ratio approachKeigo Hojo, Daiki Mori, Yukoh Wakabayashi, Kengo Ohta, Atsunori Ogawa, Norihide Kitaoka. 2274-2279 [doi]

Speech-Emotion Control for Text-to-Speech in Spoken Dialogue Systems Using Voice Conversion and x-vector EmbeddingShunichi Kohara, Masanobu Abe, Sunao Hara. 2280-2286 [doi]

Narrow-edged Acoustical Beamforming Utilizing Phase Inversion for Frequency Modulation-based Parametric Array LoudspeakerYuting Geng, Masato Nakayama, Takanobu Nishiura. 2287-2293 [doi]

Corpus Construction for Deaf Speakers and Analysis by Automatic Speech RecognitionAkio Kobayashi, Keiichi Yasu. 2294-2298 [doi]

Ensemble of Transformer and Convolutional Recurrent Neural Network for Improving Discrimination Accuracy in Automatic Chord RecognitionHikaru Yamaga, Toshifumi Momma, Kazunori Kojima, Yoshiaki Itoh 0001. 2299-2305 [doi]

Construction of Automatic Speech Recognition Model that Recognizes Linguistic Information and Verbal/Non-verbal PhenomenaNagito Shione, Yukoh Wakabayashi, Norihide Kitaoka. 2306-2311 [doi]

Exploring Isolated Musical Notes as Pre-training Data for Predominant Instrument Recognition in Polyphonic MusicLifan Zhong, Erica Cooper, Junichi Yamagishi, Nobuaki Minematsu. 2312-2319 [doi]

Speech Quality Improvement Utilizing Out-of-Focus Areas in Rolling-Shutter Video on Speech ExtractionHayata Nakano, Tsubasa Yoshizawa, Yuting Geng, Kenta Iwai, Takanobu Nishiura. 2320-2325 [doi]

Personalized Audio Quality Preference PredictionChung-Che Wang, Yu-Chun Lin, Yu-Teng Hsu, Jyh-Shing Roger Jang. 2326-2330 [doi]

AVATAR: Robust Voice Search Engine Leveraging Autoregressive Document Retrieval and Contrastive LearningYi-Cheng Wang, Tzu-Ting Yang, Hsin-Wei Wang, Bi-Cheng Yan, Berlin Chen. 2331-2335 [doi]

Regression-based Sound Event Detection with Semi-supervised LearningChia-Chuan Liu, Chia-Ping Chen, Chung-Li Lu, Bo-Cheng Chan, Yu-Han Cheng, Hsiang-Feng Chuang, Wei-Yu Chen. 2336-2342 [doi]

Proportionate NLMS with Variable Step-Size for Adaptive Feedback Cancellation in Hearing AidsLinh Thi Thuc Tran, Felix Albu, Hieu Trung Nguyen, Sven Nordholm. 2343-2348 [doi]

Residual Echo Suppression using Spatial Feature for Stereo Acoustic Echo CancellationHsuan-Cheng Chou, Yih-Liang Shen, Meng-Hsuan Wu, Bo-Wun Shih, Tai-Shih Chi. 2349-2353 [doi]

Multitaper Adaptive Time-Frequency Windowed Fourier Transform Based on the Reliable Region of Window WidthsJen-Chieh Cheng, Jian-Jiun Ding. 2354-2361 [doi]

Enhancing Retinal Disease Classification with Dual Scale Twin Vision Transformers using OCT ImagingPrakash Kumar Karn, Waleed H. Abdulla. 2362-2369 [doi]

Classification of Infant Sleep/Wake States: Cross-Attention among Large Scale Pretrained Transformer Networks using Audio, ECG, and IMU DataKai-Chieh Chang, Mark Hasegawa-Johnson, Nancy L. McElwain, Bashima Islam. 2370-2377 [doi]

Dynamic Characteristics of Electroencephalogram Reflecting Driving-Experience-Dependent Performance Using MicrostatesYuta Iinuma, Takuto Ozawa, Sou Nobukawa, Nobuhiko Wagatsuma, Keiichiro Inagaki. 2378-2383 [doi]

Quefrency Domain Features with Residual Networks for Spoof Speech DetectionMadhu R. Kamble. 2384-2389 [doi]

PDF-NET: Pitch-adaptive Dynamic Filter Network for Intra-gender Speaker VerificationZhenyu Piao, Hyungseob Lim, Miseul Kim, Hong-Goo Kang. 2390-2394 [doi]

Subjective Evaluation of a Focused Sound Source Reproducing at the positions of a Listener's Moving HandMiho Hirohashi, Yoichi Haneda. 2395-2401 [doi]

Time Sensitive Hash and Adaptive Image Recovery based Self-embedding Fragile Watermarking Scheme in Encrypted ImagesXin Wang, HongJie He, Fan Chen 0003. 2402-2408 [doi]

Multi-granularity Semantic and Acoustic Stress Prediction for Expressive TTSWenjiang Chi, Xiaoqin Feng, Liumeng Xue, Yunlin Chen, Lei Xie, Zhifei Li. 2409-2415 [doi]

NADiffuSE: Noise-aware Diffusion-based Model for Speech EnhancementWen Wang, Dongchao Yang, Qichen Ye, Bowen Cao, Yuexian Zou. 2416-2423 [doi]

Multi-accent pronunciation assessment based on domain adversarial trainingBinghuai Lin, Liyuan Wang. 2424-2428 [doi]

GAN-Based Time-Domain Packet Loss Concealment Method with Consistent Mapping ApproachYunHao Zhao, Changchun Bao, Xue Yang, Jing Zhou. 2429-2435 [doi]

Feature Selection Based on Clonal Selection Algorithm for Image SteganalysisYu Liu, Hongxia Wang. 2441-2447 [doi]

ScaleFormer: Transformer-based speech enhancement in the multi-scale time domainTianci Wu, Shulin He, Hui Zhang 0031, Xueliang Zhang 0001. 2448-2453 [doi]

UniVR: A Unified Framework for Pitch-Shifted Voice Restoration in Speaker IdentificationYangfu Li, Xiaodan Lin. 2454-2460 [doi]

External Links

Cite Key

Statistics

PDF

Researchr

Asia Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2023, Taipei, Taiwan, October 31 - Nov. 3, 2023

Abstract

Table of Contents