IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2021, Toronto, ON, Canada, June 6-11, 2021

researchr

You are not signed in
Sign in
Sign up

IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2021, Toronto, ON, Canada, June 6-11, 2021. IEEE, 2021. [doi]

Conference: icassp2021

Abstract is missing.

Rethinking The Separation Layers In Speech Separation NetworksYi Luo, Zhuo Chen, Cong Han, Chenda Li, Tianyan Zhou, Nima Mesgarani. 1-5 [doi]

Acoustic Reflectors Localization from Stereo Recordings Using Neural NetworksGiovanni Bologni, Richard Heusdens, Jorge Martinez. 1-5 [doi]

On Permutation Invariant Training For Speech Source SeparationXiaoyu Liu, Jordi Pons. 6-10 [doi]

Count And Separate: Incorporating Speaker Counting For Continuous Speaker SeparationZhong-qiu Wang, DeLiang Wang. 11-15 [doi]

Ultra-Lightweight Speech Separation Via Group CommunicationYi Luo, Cong Han, Nima Mesgarani. 16-20 [doi]

Attention Is All You Need In Speech SeparationCem Subakan, Mirco Ravanelli, Samuele Cornell, Mirko Bronzi, Jianyuan Zhong. 21-25 [doi]

Multichannel Overlapping Speaker Segmentation Using Multiple Hypothesis Tracking Of Acoustic And Spatial FeaturesAidan O. T. Hogg, Christine Evers, Patrick A. Naylor. 26-30 [doi]

Semi-Supervised Singing Voice Separation With Noisy Self-TrainingZhepei Wang, Ritwik Giri, Umut Isik, Jean-Marc Valin, Arvindh Krishnaswamy. 31-35 [doi]

Neuro-Steered Music Source Separation With EEG-Based Auditory Attention Decoding And Contrastive-NMFGiorgia Cantisani, Slim Essid, Gaël Richard. 36-40 [doi]

Complex Ratio Masking For Singing Voice SeparationYixuan Zhang, Yuzhou Liu, DeLiang Wang. 41-45 [doi]

Transcription Is All You Need: Learning To Separate Musical Mixtures With Score As SupervisionYun-Ning Hung, Gordon Wichern, Jonathan Le Roux. 46-50 [doi]

All For One And One For All: Improving Music Separation By Bridging NetworksRyosuke Sawata, Stefan Uhlich, Shusuke Takahashi, Yuki Mitsufuji. 51-55 [doi]

An Hrnet-Blstm Model With Two-Stage Training For Singing Melody ExtractionYongwei Gao, Xingjian Du, Bilei Zhu, Xiaoheng Sun, Wei Li, Zejun Ma. 56-60 [doi]

DeepF0: End-To-End Fundamental Frequency Estimation for Music and Speech SignalsSatwinder Singh, Ruili Wang, Yuanhang Qiu. 61-65 [doi]

Differentiable Signal Processing With Black-Box Audio EffectsMarco A. Martínez Ramírez, Oliver Wang, Paris Smaragdis, Nicholas J. Bryan. 66-70 [doi]

Automatic Multitrack Mixing With A Differentiable Mixing Console Of Neural Audio EffectsChristian J. Steinmetz, Jordi Pons, Santiago Pascual, Joan Serrà. 71-75 [doi]

Sequence-To-Sequence Singing Voice Synthesis With Perceptual Entropy LossJiatong Shi, Shuai Guo, Nan Huo, Yuekai Zhang, Qin Jin. 76-80 [doi]

Reverb Conversion Of Mixed Vocal Tracks Using An End-To-End Convolutional Deep Neural NetworkJunghyun Koo, Seungryeol Paik, Kyogu Lee. 81-85 [doi]

Extending Music Based On Emotion And Tonality Via Generative Adversarial NetworkBo-Wei Tseng, Yih-Liang Shen, Tai-Shih Chi. 86-90 [doi]

Improving The Robustness Of Right Whale Detection In Noisy Conditions Using Denoising Autoencoders And Augmented TrainingWilliam Vickers, B. Milner, R. Lee. 91-95 [doi]

Self-Supervised VQ-VAE for One-Shot Music Style TransferOndrej Cífka, Alexey Ozerov, Umut Simsekli, Gaël Richard. 96-100 [doi]

Capturing Temporal Dependencies Through Future Prediction for CNN-Based Audio ClassifiersHongwei Song, Jiqing Han, Shiwen Deng, Zhihao Du. 101-105 [doi]

Segmental Dtw: A Parallelizable Alternative to Dynamic Time WarpingT. J. Tsai 0001. 106-110 [doi]

Pitch-Timbre Disentanglement Of Musical Instrument Sounds Based On Vae-Based Metric LearningKeitaro Tanaka, Ryo Nishikimi, Yoshiaki Bando, Kazuyoshi Yoshii, Shigeo Morishima. 111-115 [doi]

Asynchronous Acoustic Echo Cancellation Over Wireless ChannelsRobert Ayrapetian, Philip Hilmes, Mohamed Mansour, Trausti Kristjansson, Carlo Murgia. 116-120 [doi]

Combining Adaptive Filtering And Complex-Valued Deep Postfiltering For Acoustic Echo CancellationMhd Modar Halimeh, Thomas Haubner, Annika Briegleb, Alexander Schmidt 0004, Walter Kellermann. 121-125 [doi]

Deep Residual Echo Suppression With A Tunable Tradeoff Between Signal Distortion And Echo SuppressionAmir Ivry, Israel Cohen, Baruch Berdugo. 126-130 [doi]

Robust STFT Domain Multi-Channel Acoustic Echo Cancellation with Adaptive Decorrelation of the Reference SignalsSaeed Bagheri, Daniele Giacobello. 131-135 [doi]

A Method for Determining Periodically Time-Varying Bias and Its Applications in Acoustic Feedback CancellationMeng Guo. 136-140 [doi]

Weighted Recursive Least Square Filter and Neural Network Based Residual ECHO Suppression for the AEC-ChallengeZiteng Wang, Yueyue Na, Zhang Liu, Biao Tian, Qiang Fu 0001. 141-145 [doi]

ICASSP 2021 Acoustic Echo Cancellation Challenge: Integrated Adaptive Echo Cancellation with Time Alignment and Deep Learning-Based Residual Echo Plus Noise SuppressionRenhua Peng, Linjuan Cheng, Chengshi Zheng, Xiaodong Li 0002. 146-150 [doi]

ICASSP 2021 Acoustic Echo Cancellation Challenge: Datasets, Testing Framework, and ResultsKusha Sridhar, Ross Cutler, Ando Saabas, Tanel Pärnamaa, Markus Loide, Hannes Gamper, Sebastian Braun, Robert Aichner, Sriram Srinivasan 0003. 151-155 [doi]

AEC in A Netshell: on Target and Topology Choices for FCRN Acoustic Echo CancellationJan Franzen, Ernst Seidel, Tim Fingscheidt. 156-160 [doi]

Kernel-Interpolation-Based Filtered-X Least Mean Square for Spatial Active Noise Control In Time DomainJesper Brunnström, Shoichi Koyama. 161-165 [doi]

Wave-Domain Optimization of Secondary Source Placement Free From Information of Error Sensor PositionsJian Xu, Kean Chen, Yunhe Li. 166-170 [doi]

Lasaft: Latent Source Attentive Frequency Transformation For Conditioned Source SeparationWoo-Sung Choi 0001, Minseok Kim 0003, JaeHwa Chung, Soonyoung Jung. 171-175 [doi]

Surrogate Source Model Learning for Determined Source SeparationRobin Scheibler, Masahito Togami. 176-180 [doi]

Auditory Filterbanks Benefit Universal Sound Source SeparationHan Li, Kean Chen, Bernhard U. Seeber. 181-185 [doi]

What's all the Fuss about Free Universal Sound Separation Data?Scott Wisdom, Hakan Erdogan, Daniel P. W. Ellis, Romain Serizel, Nicolas Turpault, Eduardo Fonseca, Justin Salamon, Prem Seetharaman, John R. Hershey. 186-190 [doi]

SepNet: A Deep Separation Matrix Prediction Network for Multichannel Audio Source SeparationShota Inoue, Hirokazu Kameoka, Li Li 0063, Shoji Makino. 191-195 [doi]

CDPAM: Contrastive Learning for Perceptual Audio SimilarityPranay Manocha, Zeyu Jin, Richard Zhang, Adam Finkelstein. 196-200 [doi]

Linear Multichannel Blind Source Separation based on Time-Frequency Mask Obtained by Harmonic/Percussive Sound SeparationSoichiro Oyabu, Daichi Kitamura, Kohei Yatabe. 201-205 [doi]

Multichannel-based Learning for Audio Object ExtractionDaniel Arteaga, Jordi Pons. 206-210 [doi]

DBnet: Doa-Driven Beamforming Network for end-to-end Reverberant Sound Source SeparationAli Aroudi, Sebastian Braun. 211-215 [doi]

Joint Dereverberation and Separation With Iterative Source SteeringTaishi Nakashima, Robin Scheibler, Masahito Togami, Nobutaka Ono. 216-220 [doi]

Exploiting Non-Negative Matrix Factorization for Binaural Sound Localization in the Presence of Directional InterferenceIngvi Örnolfsson, Torsten Dau, Ning Ma 0002, Tobias May. 221-225 [doi]

Blind Extraction of Moving Audio Source in a Challenging Environment Supported by Speaker Identification Via X-VectorsJirí Málek, Jakub Janský, Tomás Kounovský, Zbynek Koldovský, Jindrich Zdánský. 226-230 [doi]

Mind the Beat: Detecting Audio Onsets from EEG Recordings of Music ListeningAshvala Vinay, Alexander Lerch 0001, Grace Leslie. 231-235 [doi]

Don't Look Back: An Online Beat Tracking Method Using RNN and Enhanced Particle FilteringMojtaba Heydari, Zhiyao Duan. 236-240 [doi]

Singing Melody Extraction from Polyphonic Music based on Spectral Correlation ModelingXingjian Du, Bilei Zhu, Qiuqiang Kong, Zejun Ma. 241-245 [doi]

Improving Automatic Drum Transcription Using Large-Scale Audio-to-Midi Aligned DataI-Chieh Wei, Chih-Wei Wu, Li Su 0004. 246-250 [doi]

Frequency-Temporal Attention Network for Singing Melody ExtractionShuai Yu, Xiaoheng Sun, Yi Yu 0001, Wei Li 0012. 251-255 [doi]

Statistical Correction of Transcribed Melody Notes Based on Probabilistic Integration of a Music Language Model and a Transcription Error ModelYuki Hiramatsu, Go Shibata, Ryo Nishikimi, Eita Nakamura, Kazuyoshi Yoshii. 256-260 [doi]

Reliability Assessment of Singing Voice F0-Estimates Using Multiple AlgorithmsSebastian Rosenzweig, Frank Scherbaum, Meinard Müller. 261-265 [doi]

End-to-End Lyrics Recognition with Voice to Singing Style TransferSakya Basak, Shrutina Agarwal, Sriram Ganapathy, Naoya Takahashi. 266-270 [doi]

Singing Language Identification Using a Deep Phonotactic ApproachLenny Renault, Andrea Vaglio, Romain Hennequin. 271-275 [doi]

On the Preparation and Validation of a Large-Scale Dataset of Singing TranscriptionJun-You Wang, Jyh-Shing Roger Jang. 276-280 [doi]

Joint Multi-Pitch Detection and Score Transcription for Polyphonic Piano MusicLele Liu, Veronica Morfi, Emmanouil Benetos. 281-285 [doi]

Karaoke Key Recommendation Via Personalized Competence-Based Rating PredictionYuan Wang, Shigeki Tanaka, Keita Yokoyama, Hsin-Tai Wu, Yi Fang. 286-290 [doi]

A Closed-Loop Gain-Control Feedback Model for The Medial Efferent System of The Descending Auditory PathwayAfagh Farhadi, Skyler G. Jennings, Elizabeth A. Strickland, Laurel H. Carney. 291-295 [doi]

DHASP: Differentiable Hearing Aid Speech ProcessingZehai Tu, Ning Ma 0002, Jon Barker. 296-300 [doi]

Computationally Efficient DNN-Based Approximation of an Auditory Model for Applications in Speech ProcessingAnil Nagathil, Florian Göbel, Alexandru Nelus, Ian C. Bruce. 301-305 [doi]

Cascaded All-Pass Filters with Randomized Center Frequencies and Phase Polarity for Acoustic and Speech Measurement and Data AugmentationHideki Kawahara, Kohei Yatabe. 306-310 [doi]

Probing Acoustic Representations for Phonetic PropertiesDanni Ma, Neville Ryant, Mark Liberman. 311-315 [doi]

An End-To-End Non-Intrusive Model for Subjective and Objective Real-World Speech Assessment Using a Multi-Task FrameworkZhuohuang Zhang, Piyush Vyas, Xuan Dong 0004, Donald S. Williamson. 316-320 [doi]

Few-Shot Continual Learning for Audio ClassificationYu Wang 0105, Nicholas J. Bryan, Mark Cartwright, Juan Pablo Bello, Justin Salamon. 321-325 [doi]

Zero-Shot Audio Classification with Factored Linear and Nonlinear Acoustic-Semantic ProjectionsHuang Xie, Okko Räsänen, Tuomas Virtanen. 326-330 [doi]

Unsupervised and Semi-Supervised Few-Shot Acoustic Event ClassificationHsin-Ping Huang, Krishna C. Puvvada, Ming Sun, Chao Wang. 331-335 [doi]

Flow-Based Self-Supervised Density Estimation for Anomalous Sound DetectionKota Dohi, Takashi Endo, Harsh Purohit, Ryo Tanabe, Yohei Kawaguchi. 336-340 [doi]

Self-Training for Sound Event Detection in Audio MixturesSangwook Park, Ashwin Bellur, David K. Han, Mounya Elhilali. 341-345 [doi]

Prototypical Networks for Domain Adaptation in Acoustic Scene ClassificationShubhr Singh, Helen L. Bear, Emmanouil Benetos. 346-350 [doi]

A Global-Local Attention Framework for Weakly Labelled Audio TaggingHelin Wang, Yuexian Zou, Wenwu Wang. 351-355 [doi]

An Improved Mean Teacher Based Method for Large Scale Weakly Labeled Semi-Supervised Sound Event DetectionXu Zheng, Yan Song, Ian Vince McLoughlin, Lin Liu, Li-Rong Dai 0001. 356-360 [doi]

Comparison of Deep Co-Training and Mean-Teacher Approaches for Semi-Supervised Audio TaggingLéo Cances, Thomas Pellegrini. 361-365 [doi]

The Benefit of Temporally-Strong Labels in Audio Event ClassificationShawn Hershey, Daniel P. W. Ellis, Eduardo Fonseca, Aren Jansen, Caroline Liu, R. Channing Moore, Manoj Plakal. 366-370 [doi]

Unsupervised Contrastive Learning of Sound Event RepresentationsEduardo Fonseca, Diego Ortego, Kevin McGuinness, Noel E. O'Connor, Xavier Serra. 371-375 [doi]

Sound Event Detection by Consistency Training and Pseudo-Labeling With Feature-Pyramid Convolutional Recurrent Neural NetworksChih-Yuan Koh, You-Siang Chen, Yi-Wen Liu, Mingsian R. Bai. 376-380 [doi]

SESQA: Semi-Supervised Learning for Speech Quality AssessmentJoan Serrà, Jordi Pons, Santiago Pascual. 381-385 [doi]

Detecting Signal Corruptions in Voice Recordings For Speech TherapyHelmer Nylén, Saikat Chatterjee, Sten Ternström. 386-390 [doi]

MBNET: MOS Prediction for Synthesized Speech with Mean-Bias NetworkYichong Leng, Xu Tan 0003, Sheng Zhao, Frank K. Soong, Xiang-Yang Li 0001, Tao Qin. 391-395 [doi]

Non-Intrusive Binaural Prediction of Speech Intelligibility Based on Phoneme ClassificationJana Roßbach, Saskia Röttges, Christopher F. Hauth, Thomas Brand, Bernd T. Meyer. 396-400 [doi]

Warp-Q: Quality Prediction for Generative Neural Speech CodecsWissam A. Jassim, Jan Skoglund, Michael Chinen, Andrew Hines. 401-405 [doi]

Crowdsourcing Approach for Subjective Evaluation of Echo ImpairmentRoss Cutler, Babak Nadari, Markus Loide, Sten Sootla, Ando Saabas. 406-410 [doi]

Amplitude Matching: Majorization-Minimization Algorithm for Sound Field Control Only with Amplitude ConstraintShoichi Koyama, Takashi Amakasu, Natsuki Ueno, Hiroshi Saruwatari. 411-415 [doi]

3D Multizone Soundfield Reproduction in a Reverberant Environment Using Intensity Matching MethodHuanyu Zuo, Thushara D. Abhayapala, Prasanga N. Samarasinghe. 416-420 [doi]

The Far-Field Equatorial Array for Binaural RenderingJens Ahrens, Hannes Helmholz, David Lou Alon, Sebastià V. Amengual Garí. 421-425 [doi]

Spherical Harmonic Representation for Dynamic Sound-Field MeasurementsFabrice Katzberg, Marco Maaß, Alfred Mertins. 426-430 [doi]

Direction Preserving Wind Noise Reduction Of B-Format SignalsAdrian Herzog, Daniele Mirabilii, Emanuel A. P. Habets. 431-435 [doi]

Refinement of Direction of Arrival Estimators by Majorization-Minimization Optimization on the Array ManifoldRobin Scheibler, Masahito Togami. 436-440 [doi]

On the Predictability of Hrtfs from Ear Shapes Using Deep NetworksYaxuan Zhou, Hao Jiang, Vamsi Krishna Ithapu. 441-445 [doi]

Applied Methods for Sparse Sampling of Head-Related Transfer FunctionsLior Arbel, Zamir Ben-Hur, David Lou Alon, Boaz Rafaely. 446-450 [doi]

Personalized HRTF Modeling Using DNN-Augmented BEMMengfan Zhang, Jui-Hsien Wang, Doug L. James. 451-455 [doi]

Efficient Training Data Generation for Phase-Based DOA EstimationFabian Hübner, Wolfgang Mack, Emanuel A. P. Habets. 456-460 [doi]

Detecting Acoustic Reflectors Using A Robot's Ego-NoiseUsama Saqib, Antoine Deleforge, Jesper Rindom Jensen. 466-470 [doi]

Prediction of Object Geometry from Acoustic Scattering Using Convolutional Neural NetworksZiqi Fan, Vibhav Vineet, Chenshen Lu, T. W. Wu, Kyla McMullen. 471-475 [doi]

Blind Amplitude Estimation of Early Room Reflections Using Alternating Least SquaresTom Shlomo, Boaz Rafaely. 476-480 [doi]

Acoustic Analysis and Dataset of Transitions Between Coupled RoomsThomas McKenzie, Sebastian J. Schlecht, Ville Pulkki. 481-485 [doi]

On Loss Functions for Deep-Learning Based T60 EstimationYuying Li, Yuchen Liu, Donald S. Williamson. 486-490 [doi]

Towards Listening to 10 People Simultaneously: An Efficient Permutation Invariant Training of Audio Source Separation Using Sinkhorn's AlgorithmHideyuki Tachibana. 491-495 [doi]

Accelerating Auxiliary Function-Based Independent Vector AnalysisAndreas Brendel, Walter Kellermann. 496-500 [doi]

One-Shot Conditional Audio Filtering of Arbitrary SoundsBeat Gfeller, Dominik Roblek, Marco Tagliasacchi. 501-505 [doi]

Low Latency Online Blind Source Separation Based on Joint Optimization with Blind DereverberationTetsuya Ueda, Tomohiro Nakatani, Rintaro Ikeshita, Keisuke Kinoshita, Shoko Araki, Shoji Makino. 506-510 [doi]

Autoregressive Fast Multichannel Nonnegative Matrix Factorization For Joint Blind Source Separation And DereverberationKouhei Sekiguchi, Yoshiaki Bando, Aditya Arie Nugraha, Mathieu Fontaine 0002, Kazuyoshi Yoshii. 511-515 [doi]

Phase Recovery with Bregman Divergences for Audio Source SeparationPaul Magron, Pierre-Hugo Vial, Thomas Oberlin, Cédric Févotte. 516-520 [doi]

Adversarial Attacks on Audio Source SeparationNaoya Takahashi, Shota Inoue, Yuki Mitsufuji. 521-525 [doi]

Maximum a Posteriori Estimator for Convolutive Sound Source Separation with Sub-Source Based NTF Model and the Localization Probabilistic Prior on the Mixing MatrixMieszko Fras, Konrad Kowalczyk. 526-530 [doi]

Unified Gradient Reweighting for Model Biasing with Applications to Source SeparationEfthymios Tzinis, Dimitrios Bralios, Paris Smaragdis. 531-535 [doi]

Melon Playlist Dataset: A Public Dataset for Audio-Based Playlist Generation and Music TaggingAndres Ferraro, Yuntae Kim, Soohyeon Lee, Biho Kim, Namjun Jo, Semi Lim, Suyon Lim, Jungtaek Jang, Sehwan Kim, Xavier Serra, Dmitry Bogdanov. 536-540 [doi]

Investigating the Efficacy of Music Version Retrieval Systems for Setlist IdentificationFurkan Yesiler, Emilio Molina, Joan Serrà, Emilia Gómez. 541-545 [doi]

Instrument Classification of Solo Sheet Music ImagesKevin Ji, Daniel Yang, T. J. Tsai 0001. 546-550 [doi]

Bytecover: Cover Song Identification Via Multi-Loss TrainingXingjian Du, Zhesong Yu, Bilei Zhu, Xiaoou Chen, Zejun Ma. 551-555 [doi]

Multi-Task Self-Supervised Pre-Training for Music ClassificationHo-Hsiang Wu, Chieh-Chi Kao, Qingming Tang, Ming Sun, Brian McFee, Juan Pablo Bello, Chao Wang. 556-560 [doi]

Towards Explaining Expressive Qualities in Piano Recordings: Transfer of Explanatory Features Via Acoustic Domain AdaptationShreyan Chowdhury, Gerhard Widmer. 561-565 [doi]

Supervised Chorus Detection for Popular Music Using Convolutional Neural Network and Multi-Task LearningJu-Chiang Wang, Jordan B. L. Smith, Jitong Chen, Xuchen Song, Yuxuan Wang. 566-570 [doi]

Structure-Aware Audio-to-Score Alignment Using Progressively Dilated Convolutional Neural NetworksRuchit Agrawal, Daniel Wolff, Simon Dixon. 571-575 [doi]

Language-Sensitive Music Emotion Recognition Models: are We Really There Yet?Juan Sebastián Gómez Cañón, Estefanía Cano, Ana Gabriela Pandrea, Perfecto Herrera, Emilia Gómez. 576-580 [doi]

Leveraging the Structure of Musical Preference in Content-Aware Music RecommendationPaul Magron, Cédric Févotte. 581-585 [doi]

Low Resource Audio-To-Lyrics Alignment from Polyphonic Music RecordingsEmir Demirel, Sven Ahlbäck, Simon Dixon. 586-590 [doi]

Multimodal Metric Learning for Tag-Based Music RetrievalMinz Won, Sergio Oramas, Oriol Nieto, Fabien Gouyon, Xavier Serra. 591-595 [doi]

Learning Contextual Tag Embeddings for Cross-Modal Alignment of Audio and TagsXavier Favory, Konstantinos Drossos, Tuomas Virtanen, Xavier Serra. 596-600 [doi]

Efficient End-to-End Audio Embeddings Generation for Audio Classification on Target ApplicationsPaulo Lopez-Meyer, Juan A. del Hoyo Ontiveros, Hong Lu 0006, Georg Stemmer. 601-605 [doi]

Text-to-Audio Grounding: Building Correspondence Between Captions and Sound EventsXuenan Xu, Heinrich Dinkel, Mengyue Wu, Kai Yu 0004. 606-610 [doi]

Multi-View Audio And Music ClassificationHuy Phan, Huy Le Nguyen, Oliver Y. Chén, Lam Dang Pham, Philipp Koch, Ian Vince McLoughlin, Alfred Mertins. 611-615 [doi]

Audio-Visual Event Recognition Through the Lens of AdversaryJuncheng B. Li, Kaixin Ma, Shuhui Qu, Po-Yao Huang 0001, Florian Metze. 616-620 [doi]

DCASENET: An Integrated Pretrained Deep Neural Network for Detecting and Classifying Acoustic Scenes and EventsJee-weon Jung, Hye-jin Shim, Ju-ho Kim, Ha-Jin Yu. 621-625 [doi]

A Curated Dataset of Urban Scenes for Audio-Visual Scene AnalysisShanshan Wang, Annamaria Mesaros, Toni Heittola, Tuomas Virtanen. 626-630 [doi]

Improving Sound Event Detection Metrics: Insights from DCASE 2020Giacomo Ferroni, Nicolas Turpault, Juan Azcarreta, Francesco Tuveri, Romain Serizel, Çagdas Bilen, Sacha Krstulovic. 631-635 [doi]

Artificially Synthesising Data for Audio Classification and Segmentation to Improve Speech and Music Detection in Radio BroadcastSatvik Venkatesh, David Moffat, Alexis Kirke, Gözel Shakeri, Stephen A. Brewster, Jörg Fachner, Helen Odell-Miller, Alex Street, Nicolas Farina, Sube Banerjee, Eduardo Reck Miranda. 636-640 [doi]

LSSED: A Large-Scale Dataset and Benchmark for Speech Emotion RecognitionWeiquan Fan, Xiangmin Xu, Xiaofen Xing, Weidong Chen, Dongyan Huang. 641-645 [doi]

Enhancing Audio Augmentation Methods with Consistency LearningTurab Iqbal, Karim Helwani, Arvindh Krishnaswamy, Wenwu Wang. 646-650 [doi]

Fast Threshold Optimization for Multi-Label Audio Tagging Using Surrogate Gradient LearningThomas Pellegrini, Timothée Masquelier. 651-655 [doi]

Towards Efficient Models for Real-Time Deep Noise SuppressionSebastian Braun, Hannes Gamper, Chandan K. A. Reddy, Ivan Tashev. 656-660 [doi]

Teacher-Student Learning for Low-Latency Online Speech Enhancement Using Wave-U-NetSotaro Nakaoka, Li Li 0063, Shota Inoue, Shoji Makino. 661-665 [doi]

Learning Disentangled Feature Representations for Speech Enhancement Via Adversarial TrainingNana Hou, Chenglin Xu, Eng Siong Chng, Haizhou Li 0001. 666-670 [doi]

Speech Enhancement Autoencoder with Hierarchical Latent StructureKoen Oostermeijer, Jun Du, Qing Wang 0008, Chin-Hui Lee. 671-675 [doi]

Variational Autoencoder for Speech Enhancement with a Noise-Aware EncoderHuajian Fang, Guillaume Carbajal, Stefan Wermter, Timo Gerkmann. 676-680 [doi]

Guided Variational Autoencoder for Speech Enhancement with a Supervised ClassifierGuillaume Carbajal, Julius Richter, Timo Gerkmann. 681-685 [doi]

An Extension of Sparse Audio Declipper to Multiple Measurement VectorsSatoru Emura, Noboru Harada. 686-690 [doi]

Real-Time Speech Frequency Bandwidth ExtensionYunpeng Li, Marco Tagliasacchi, Oleg Rybakov, Victor Ungureanu, Dominik Roblek. 691-695 [doi]

Bandwidth Extension is All You NeedJiaqi Su, Yunyun Wang, Adam Finkelstein, Zeyu Jin. 696-700 [doi]

Audio Dequantization Using (Co)Sparse (Non)Convex MethodsPavel Záviska, Pavel Rajmic, Ondrej Mokrý. 701-705 [doi]

Source-Aware Neural Speech Coding for Noisy Speech CompressionHaici Yang, Kai Zhen, Seungkwon Beack, Minje Kim. 706-710 [doi]

Enhancing into the Codec: Noise Robust Speech Coding with Vector-Quantized AutoencodersJonah Casebeer, Vinjai Vale, Umut Isik, Jean-Marc Valin, Ritwik Giri, Arvindh Krishnaswamy. 711-715 [doi]

Speech Enhancement with Mixture of Deep Experts with Clean Clustering Pre-TrainingShlomo E. Chazan, Jacob Goldberger, Sharon Gannot. 716-720 [doi]

A Novel NMF-HMM Speech Enhancement Algorithm Based on Poisson Mixture ModelYang Xiang, Liming Shi, Jesper Lisby Højvang, Morten Højfeldt Rasmussen, Mads Græsbøll Christensen. 721-725 [doi]

Phoneme-Based Distribution Regularization for Speech EnhancementYajing Liu, Xiulian Peng, Zhiwei Xiong, Yan Lu. 726-730 [doi]

Compressed Representation of Cepstral Coefficients via Recurrent Neural Networks for Informed Speech EnhancementCarol Chermaz, Dario Leuchtmann, Simon Tanner, Roger Wattenhofer. 731-735 [doi]

Optimizing Short-Time Fourier Transform Parameters via Gradient DescentAn Zhao, Krishna Subramani, Paris Smaragdis. 736-740 [doi]

Iterative Geometry Calibration from Distance Estimates for Wireless Acoustic Sensor NetworksTobias Gburrek, Joerg Schmalenstroeer, Reinhold Haeb-Umbach. 741-745 [doi]

On the Design of Square Differential Microphone Arrays with a Multistage StructureXudong Zhao, Gongping Huang, Jacob Benesty, Jingdong Chen, Israel Cohen. 746-750 [doi]

Arrays of First-Order Steerable Differential MicrophonesFederico Borra, Alberto Bernardini, Ivan Bertuletti, Fabio Antonacci, Augusto Sarti. 751-755 [doi]

Planar Array Geometry Optimization for Region Sound AcquisitionXi Chen, Chao Pan, Jingdong Chen, Jacob Benesty. 756-760 [doi]

Estimation of Microphone Clusters in Acoustic Sensor Networks Using Unsupervised Federated LearningAlexandru Nelus, Rene Glitza, Rainer Martin 0001. 761-765 [doi]

Misalignment Recognition in Acoustic Sensor Networks Using a Semi-Supervised Source Estimation Method and Markov Random FieldsGabriel F. Miller, Andreas Brendel, Walter Kellermann, Sharon Gannot. 766-770 [doi]

Rotation-Robust Beamforming Based on Sound Field Interpolation with Regularly Circular Microphone ArrayYukoh Wakabayashi, Kouei Yamaoka, Nobutaka Ono. 771-775 [doi]

Sparse Recovery Beamforming and Upscaling in the Ray SpaceS. Yu, C. Jin, Fabio Antonacci, Augusto Sarti. 776-780 [doi]

Combined Differential Beamforming With Uniform Linear Microphone ArraysGongping Huang, Yuzhu Wang, Jacob Benesty, Israel Cohen, Jingdong Chen. 781-785 [doi]

Polynomial Matrix Eigenvalue Decomposition of Spherical Harmonics for Speech EnhancementVincent W. Neo, Christine Evers, Patrick A. Naylor. 786-790 [doi]

A Parametric Unconstrained Binaural Beamformer Based Noise Reduction and Spatial Cue Preservation for Hearing-Assistive DevicesJie Zhang. 791-795 [doi]

A Simplified Wiener Beamformer Based on Covariance Matrix ModellingFan Zhang, Chao Pan, Jacob Benesty, Jingdong Chen. 796-800 [doi]

Control Architecture of the Double-Cross-Correlation Processor for Sampling-Rate-Offset Estimation in Acoustic Sensor NetworksAleksej Chinaev, Sven Wienand, Gerald Enzner. 801-805 [doi]

Deficient Basis Estimation of Noise Spatial Covariance Matrix for Rank-Constrained Spatial Covariance Matrix Estimation Method in Blind Speech ExtractionYuto Kondo, Yuki Kubo, Norihiro Takamune, Daichi Kitamura, Hiroshi Saruwatari. 806-810 [doi]

Reducing Modal Error Propagation through Correcting Mismatched Microphone Gains Using RapidNoman Akbar, Glenn Dickins, Mark R. P. Thomas, Prasanga N. Samarasinghe, Thushara D. Abhayapala. 811-814 [doi]

Evaluation and Comparison of Three Source Direction-of-Arrival Estimators Using Relative Harmonic CoefficientsYonggang Hu, Prasanga N. Samarasinghe, Sharon Gannot, Thushara D. Abhayapala. 815-819 [doi]

Network-Aware Optimal Microphone Channel Selection in Wireless Acoustic Sensor NetworksMichael Günther 0003, Haitham Afifi, Andreas Brendel, Holger Karl, Walter Kellermann. 820-824 [doi]

Supervised Direct-Path Relative Transfer Function Learning for Binaural Sound Source LocalizationBing Yang, Xiaofei Li, Hong Liu 0008. 825-829 [doi]

Cross-Modal Spectrum Transformation Network for Acoustic Scene ClassificationYang Liu, Alexandros Neophytou, Sunando Sengupta, Eric Sommerlade. 830-834 [doi]

Domestic Activities Clustering From Audio Recordings Using Convolutional Capsule Autoencoder NetworkZiheng Lin, Yanxiong Li, Zhangjin Huang, Wenhao Zhang, Yufeng Tan, Yichun Chen, Qianhua He. 835-839 [doi]

Sound Event Detection and Separation: A Benchmark on Desed Synthetic SoundscapesNicolas Turpault, Romain Serizel, Scott Wisdom, Hakan Erdogan, John R. Hershey, Eduardo Fonseca, Prem Seetharaman, Justin Salamon. 840-844 [doi]

A Two-Stage Approach to Device-Robust Acoustic Scene ClassificationHu Hu, Chao-Han Huck Yang, Xianjun Xia, Xue Bai, Xin Tang, Yajian Wang, Shutong Niu, Li Chai 0002, Juanjuan Li, Hongning Zhu, Feng Bao, Yuanjun Zhao, Sabato Marco Siniscalchi, Yannan Wang, Jun Du, Chin-Hui Lee. 845-849 [doi]

Subspectral Normalization for Neural Audio Data ProcessingSimyung Chang, Hyoungwoo Park, Janghoon Cho, Hyunsin Park, Sungrack Yun, Kyuwoong Hwang. 850-854 [doi]

Slow-Fast Auditory Streams for Audio RecognitionEvangelos Kazakos, Arsha Nagrani, Andrew Zisserman, Dima Damen. 855-859 [doi]

Impact of Sound Duration and Inactive Frames on Sound Event Detection PerformanceKeisuke Imoto, Sakiko Mishima, Yumi Arai, Reishi Kondo. 860-864 [doi]

A New DCASE 2017 Rare Sound Event Detection Benchmark Under Equal Training Data: CRNN With Multi-Width KernelsJan Baumann, Patrick Meyer, Timo Lohrenz, Alexander Roy, Michael Papendieck, Tim Fingscheidt. 865-869 [doi]

Room Adaptive Conditioning Method for Sound Event Classification in Reverberant EnvironmentsJaejun Lee, Donmoon Lee, Hyeong-Seok Choi, Kyogu Lee. 870-874 [doi]

Sound Event Detection Based on Curriculum Learning Considering Learning Difficulty of EventsNoriyuki Tonami, Keisuke Imoto, Yuki Okamoto, Takahiro Fukumori, Yoichi Yamashita. 875-879 [doi]

Sound Event Detection in Urban Audio with Single and Multi-Rate PcenChristopher Ick, Brian McFee. 880-884 [doi]

An Improved Event-Independent Network for Polyphonic Sound Event Localization and DetectionYin Cao, Turab Iqbal, Qiuqiang Kong, Fengyan An, Wenwu Wang, Mark D. Plumbley. 885-889 [doi]

Lightweight and Interpretable Neural Modeling of an Audio Distortion Effect Using Hyperconditioned Differentiable BiquadsShahan Nercessian, Andy Sarroff, Kurt James Werner. 890-894 [doi]

Attacking and Defending Behind A Psychoacoustics-Based CaptchaChih-Hsiang Huang, Po-Hao Wu, Yi-Wen Liu, Shan-Hung Wu. 895-899 [doi]

Double-DCCCAE: Estimation of Body Gestures From Speech WaveformJinHong Lu, Tianhang Liu, Shuzhuang Xu, Hiroshi Shimodaira. 900-904 [doi]

Investigating Local and Global Information for Automated Audio Captioning with Transfer LearningXuenan Xu, Heinrich Dinkel, Mengyue Wu, Zeyu Xie, Kai Yu 0004. 905-909 [doi]

Unidirectional Memory-Self-Attention Transducer for Online Speech RecognitionJian Luo, Jianzong Wang, Ning Cheng, Jing Xiao. 910-914 [doi]

Accdoa: Activity-Coupled Cartesian Direction of Arrival Representation for Sound Event Localization And DetectionKazuki Shimada, Yuichiro Koyama, Naoya Takahashi, Shusuke Takahashi, Yuki Mitsufuji. 915-919 [doi]

Seen and Unseen Emotional Style Transfer for Voice Conversion with A New Emotional Speech DatasetKun Zhou, Berrak Sisman, Rui Liu 0008, Haizhou Li 0001. 920-924 [doi]

U-Convolution Based Residual Echo Suppression with Multiple EncodersEesung Kim, Jae-Jin Jeon, Hyeji Seo. 925-929 [doi]

A Multi-Channel Temporal Attention Convolutional Neural Network Model for Environmental Sound ClassificationYou Wang, Chuyao Feng, David V. Anderson. 930-934 [doi]

A General Network Architecture for Sound Event Localization and Detection Using Transfer Learning and Recurrent Neural NetworkThi Ngoc Tho Nguyen, Ngoc Khanh Nguyen 0003, Huy Phan, Lam Pham, Kenneth Ooi, Douglas L. Jones, Woon-Seng Gan. 935-939 [doi]

Robust Recursive Least M-Estimate Adaptive Filter for the Identification of Low-Rank Acoustic SystemsHongsen He, Jingdong Chen, Jacob Benesty, Yi Yu 0002. 940-944 [doi]

Noise-Robust Adaptation Control for Supervised Acoustic System Identification Exploiting a Noise DictionaryThomas Haubner, Andreas Brendel, Mohamed Elminshawi, Walter Kellermann. 945-949 [doi]

Interpolation of Irregularly Sampled Frequency Response Functions Using Convolutional Neural NetworksM. Acerbi, R. Malvermi, Mirco Pezzoli, Fabio Antonacci, Augusto Sarti, R. Corradi. 950-954 [doi]

Effective Rank-Based Estimation of the Coherent-to-Diffuse Power RatioHeinrich W. Löllmann, Andreas Brendel, Walter Kellermann. 955-959 [doi]

Room Impulse Response Interpolation from a Sparse Set of Measurements Using a Modal ArchitectureOrchisama Das, Paul Calamia, Sebastià V. Amengual Garí. 960-964 [doi]

Processing Pipelines for Efficient, Physically-Accurate Simulation of Microphone Array Signals in Dynamic Sound ScenesAlastair H. Moore, Rebecca R. Vos, Patrick A. Naylor, Mike Brookes. 965-969 [doi]

A Classifier for Improving Cause and Effect in SSVEP-based BCIs for Individuals with Complex Communication DisordersHadi Habibzadeh, Olivia Zhou, James J. S. Norton, Theresa M. Vaughan, Daphney-Stavroula Zois. 970-974 [doi]

Saga: Sparse Adversarial Attack on EEG-Based Brain Computer InterfaceBoyuan Feng, Yuke Wang, Yufei Ding. 975-979 [doi]

Riemannian Geometry on Connectivity for Clinical BCIMarie-Constance Corsi, Florian Yger, Sylvain Chevallier, Camille Noûs. 980-984 [doi]

Decoding Music Attention from "EEG Headphones": A User-Friendly Auditory Brain-Computer InterfaceWinko W. An, Barbara G. Shinn-Cunningham, Hannes Gamper, Dimitra Emmanouilidou, David Johnston, Mihai Jalobeanu, Edward Cutrell, Andrew D. Wilson, Kuan-Jung Chiang, Ivan Tashev. 985-989 [doi]

Mitigating Inter-Subject Brain Signal Variability FOR EEG-Based Driver Fatigue State ClassificationSunhee Hwang, Sungho Park, Dohyung Kim 0004, Jewook Lee, Hyeran Byun. 990-994 [doi]

A Deep Spatio-Temporal Model for EEG-Based Imagined Speech RecognitionPradeep Kumar 0002, Erik J. Scheme. 995-999 [doi]

Incorporating Uncertainty In Data Labeling Into Detection of Brain Interictal Epileptiform Discharges From EEG Using Weighted optimizationBahman Abdi-Sargezeh, Antonio Valentín, Gonzalo Alarcón, Saeid Sanei. 1000-1004 [doi]

Multi-Level Reversible Encryption for ECG Signals Using Compressive SensingMikko Impiö, Mehmet Yamaç, Jenni Raitoharju. 1005-1009 [doi]

Validating the Inspired Sinewave Technique to Measure Lung Heterogeneity Compared to Atelectasis & Over-Distended Volume in Computed Tomography ImagesMinh C. Tran, Phi Anh Phan, Douglas C. Crockett, Federico Formenti, John N. Cronin, Stephen J. Payne, Andrew D. Farmery. 1010-1014 [doi]

A Patient-Invariant Model for Freezing of Gait Detection Aided by Wavelet DecompositionNasimuddin Ahmed, Shivam Singhal, Varsha Sharma, Sakyajit Bhattacharya, Aniruddha Sinha, Avik Ghose. 1015-1019 [doi]

Identification of Uterine Contractions by An Ensemble of Gaussian ProcessesLiu Yang, Cassandra Heiselman, J. Gerald Quirk, Petar M. Djuric. 1020-1024 [doi]

Arrhythmia Classification with Heartbeat-Aware TransformerBin Wang, Chang Liu, Chuanyan Hu, Xudong Liu, Jun Cao. 1025-1029 [doi]

Multi-Level Group Testing with Application to One-Shot Pooled COVID-19 TestsAlejandro Cohen, Nir Shlezinger, Amit Solomon, Yonina C. Eldar, Muriel Médard. 1030-1034 [doi]

Detection of Covid-19 Through the Analysis of Vocal Fold OscillationsMahmoud Al Ismail, Soham Deshmukh, Rita Singh. 1035-1039 [doi]

Ct-Caps: Feature Extraction-Based Automated Framework for Covid-19 Disease Identification From Chest Ct Scans Using Capsule NetworksShahin Heidarian, Parnian Afshar, Arash Mohammadi 0001, Moezedin Javad Rafiee, Anastasia Oikonomou, Konstantinos N. Plataniotis, Farnoosh Naderkhani. 1040-1044 [doi]

Few-Shot Learning for Ct Scan Based Covid-19 DiagnosisYifan Jiang, Han Chen, Hanseok Ko, David K. Han. 1045-1049 [doi]

Graph-Based Pyramid Global Context Reasoning With a Saliency- Aware Projection for Covid-19 Lung Infections SegmentationHuimin Huang, Ming Cai, Lanfen Lin, Jing Zheng, Xiongwei Mao, Xiaohan Qian, Zhiyi Peng, Jianying Zhou 0006, Yutaro Iwamoto, Xian-Hua Han, Yen-Wei Chen 0001, Ruofeng Tong 0001. 1050-1054 [doi]

Interpreting Glottal Flow Dynamics for Detecting Covid-19 From VoiceSoham Deshmukh, Mahmoud Al Ismail, Rita Singh. 1055-1059 [doi]

Cycle Generative Adversarial Network Approaches to Produce Novel Portable Chest X-Rays Images for Covid-19 DiagnosisDaniel I. Morís, Joaquim de Moura, Jorge Novo, Marcos Ortega. 1060-1064 [doi]

EEG-Based Emotion Classification Using Graph Signal ProcessingSeyed Saman Saboksayr, Gonzalo Mateos, Müjdat Çetin. 1065-1069 [doi]

Granger Causality Based Directional Phase-Amplitude Coupling MeasureTamanna T. K. Munia, Selin Aviyente. 1070-1074 [doi]

REPAC: Reliable Estimation of Phase-Amplitude Coupling in Brain NetworksGiulia Cisotto. 1075-1079 [doi]

Subspace Oddity - Optimization on Product of Stiefel Manifolds for EEG DataMaria Sayu Yamamoto, Florian Yger, Sylvain Chevallier. 1080-1084 [doi]

Decentralized Motion Inference and Registration of Neuropixel DataErdem Varol, Julien Boussard, Nishchal Dethe, Olivier Winter, Anne Urai, International Brain Laboratory, Anne Churchland, Nick Steinmetz, Liam Paninski. 1085-1089 [doi]

Dynamic Graph Learning Based on Graph LaplacianBo Jiang, Yiyi Yu, Hamid Krim, Spencer L. Smith. 1090-1094 [doi]

Mutual Information Flows in a Bivariate Point ProcessSyed Ahmed Pasha, Victor Solo. 1095-1099 [doi]

Uncertainty-Based Biological Age Estimation of Brain MRI ScansKarim Armanious, Sherif Abdulatif, Wenbin Shi, Tobias Hepp, Sergios Gatidis, Bin Yang. 1100-1104 [doi]

Sparse Representation of Complex-Valued fMRI Data Based on Hard Thresholding of Spatial Source PhaseJia-Yang Song, Miao-Ying Qi, Dun-Pei Lv, Chao-Ying Zhang, Qiu-Hua Lin, Vince D. Calhoun. 1105-1109 [doi]

Tucker Decomposition for Extracting Shared and Individual Spatial Maps from Multi-Subject Resting-State fMRI DataYue Han, Qiu-Hua Lin, Li-Dan Kuang, Xiao-Feng Gong, Fengyu Cong, Vince D. Calhoun. 1110-1114 [doi]

Riemannian Geometry-Based Decoding of the Directional Focus of Auditory Attention Using EEGSimon Geirnaert, Tom Francart, Alexander Bertrand. 1115-1119 [doi]

DFDM: A Deep Feature Decoupling Module for Lung Nodule SegmentationWei Chen, Qiuli Wang 0001, Sheng Huang, Xiaohong Zhang, Yucong Li, Chen Liu. 1120-1124 [doi]

Pyramid U-Net for Retinal Vessel SegmentationJiawei Zhang, Yanchun Zhang, Xiaowei Xu. 1125-1129 [doi]

A Probabilistic Model for Segmentation of Ambiguous 3D Lung NoduleXiaojiang Long, Wei Chen, Qiuli Wang 0001, Xiaohong Zhang, Chen Liu, Yucong Li, Jiuquan Zhang. 1130-1134 [doi]

Semi-Supervised Skin Lesion Segmentation with Learning Model ConfidenceZhiqiang Xie, Enmei Tu, Hao Zheng, Yun Gu, Jie Yang 0002. 1135-1139 [doi]

A Hybrid Feature Enhancement Method for Gl And Segmentation In Histopathology ImagesXiangjiang Wu, Xuanya Li, Kai Hu 0002, Zhineng Chen, Xieping Gao. 1140-1144 [doi]

Automated Multi-Organ Segmentation in Pet Images Using Cascaded Training of a 3d U-Net and Convolutional AutoencoderAnnika Liebgott, Charlotte Lorenz, Sergios Gatidis, Viet Chau Vu, Konstantin Nikolaou, Bin Yang. 1145-1149 [doi]

Improved Supervised Training of Physics-Guided Deep Learning Image Reconstruction with Multi-MaskingBurhaneddin Yaman, Seyed Amir Hossein Hosseini, Steen Moeller, Mehmet Akçakaya. 1150-1154 [doi]

Fine-Grained Mri Reconstruction Using Attentive Selection Generative Adversarial NetworksJingshuai Liu, Mehrdad Yaghoobi. 1155-1159 [doi]

Ensure: Ensemble Stein's Unbiased Risk Estimator for Unsupervised LearningHemant Kumar Aggarwal, Aniket Pramanik, Mathews Jacob. 1160-1164 [doi]

Ultrasound Elasticity Imaging Using Physics-Based Models and Learning-Based Plug-and-Play PriorsNarges Mohammadi, Marvin M. Doyley, Müjdat Çetin. 1165-1169 [doi]

A Periodic Frame Learning Approach for Accurate Landmark Localization in M-Mode EchocardiographyYinbing Tian, Shibiao Xu, Li Guo, Fu'ze Cong. 1170-1174 [doi]

A Bias-Reducing Loss Function for CT Image DenoisingMadhuri Nagare, Roman Melnyk, Obaidullah Rahman, Ken D. Sauer, Charles A. Bouman. 1175-1179 [doi]

Learning Binary Semantic Embedding for Breast Histology Image Classification and RetrievalXiao Kang, Xingbo Liu, Xiushan Nie, Yilong Yin. 1180-1184 [doi]

Channel Attention Residual U-Net for Retinal Vessel SegmentationChanglu Guo, Márton Szemenyei, Yangtao Hu, Wenle Wang, Wei Zhou, Yugen Yi. 1185-1189 [doi]

CMIM: Cross-Modal Information Maximization For Medical ImagingTristan Sylvain, Francis Dutil, Tess Berthier, Lisa Di-Jorio, Margaux Luck, R. Devon Hjelm, Yoshua Bengio. 1190-1194 [doi]

Structure-Enhanced Attentive Learning For Spine Segmentation From Ultrasound Volume Projection ImagesRui Zhao, Zixun Huang, Tianshan Liu, Frank H. F. Leung, Sai-Ho Ling, De Yang, Timothy Tin-Yan Lee, Daniel Pak-Kong Lun, Yong-Ping Zheng, Kin-Man Lam 0001. 1195-1199 [doi]

Foveal Avascular Zone Segmentation of Octa Images Using Deep Learning Approach with Unsupervised Vessel SegmentationZhijin Liang, Junkang Zhang, Cheolhong An. 1200-1204 [doi]

Acute Lymphoblastic Leukemia Detection Based on Adaptive Unsharpening and Deep LearningAngelo Genovese, Mahdi S. Hosseini, Vincenzo Piuri, Konstantinos N. Plataniotis, Fabio Scotti. 1205-1209 [doi]

Meta Ordinal Weighting Net For Improving Lung Nodule ClassificationYiming Lei, Hongming Shan, Junping Zhang. 1210-1214 [doi]

Deepnodule: Multi-Task Learning of Segmentation Bootstrap for Pulmonary Nodule DetectionJingqin Li, Kun Wang, Dan Yang, Xiaohong Zhang, Chen Liu. 1215-1219 [doi]

Dense Attention Module for Accurate Pulmonary Nodule DetectionJiannan Liu, Jie Li, Fanyong Xue, Chentao Wu. 1220-1224 [doi]

Unsupervised Multimodal Image Registration with Adaptative Gradient GuidanceZhe Xu, Jiangpeng Yan, Jie Luo, Xiu Li, Jayender Jagadeesan. 1225-1229 [doi]

Improving Intraoperative Liver Registration in Image-Guided Surgery with Learning-Based ReconstructionMeng Jia, Matthew Kyan. 1230-1234 [doi]

A New Framework Based on Transfer Learning for Cross-Database Pneumonia DetectionXinxin Shan, Ying Wen. 1235-1239 [doi]

Hierarchical Attention-Based Temporal Convolutional Networks for Eeg-Based Emotion RecognitionChao Li, Boyang Chen, Ziping Zhao, Nicholas Cummins, Björn W. Schuller. 1240-1244 [doi]

Deep Multiway Canonical Correlation Analysis For Multi-Subject Eeg NormalizationJaswanth Reddy Katthi, Sriram Ganapathy. 1245-1249 [doi]

Dynamic Graph Modeling Of Simultaneous EEG And Eye-Tracking Data For Reading Task IdentificationPuneet Mathur, Trisha Mittal, Dinesh Manocha. 1250-1254 [doi]

Learning From Heterogeneous Eeg Signals with Differentiable Channel ReorderingAaqib Saeed, David Grangier, Olivier Pietquin, Neil Zeghidour. 1255-1259 [doi]

Enhancing Multi-Channel Eeg Classification with Gramian Temporal Generative Adversarial NetworksChi Nok Enoch Kan, Richard J. Povinelli, Dong Hye Ye. 1260-1264 [doi]

A Novel Convolutional Neural Network Model to Remove Muscle Artifacts from EEGHaoming Zhang, Chen Wei, Mingqi Zhao, Quanying Liu, Haiyan Wu. 1265-1269 [doi]

Multilabel 12-Lead Electrocardiogram Classification Using Beat to Sequence AutoencodersAlexander William Wong, Amir Salimi, Abram Hindle, Sunil Vasu Kalmady, Padma Kaul. 1270-1274 [doi]

Contrastive Embeddind Learning Method for Respiratory Sound ClassificationWenjie Song 0003, Jiqing Han, Hongwei Song. 1275-1279 [doi]

Decoding Neural Representations of Rhythmic Sounds From MagnetoencephalographyPei-Chun Chang, Jia-Ren Chang, Po-Yu Chen, Li-Kai Cheng, Jen-Chuen Hsieh, Hsin-Yen Yu, Li-Fen Chen, Yong-Sheng Chen. 1280-1284 [doi]

Low-Dimensional Denoising Embedding Transformer for ECG ClassificationJian Guan, Wenbo Wang, Pengming Feng, Xinxin Wang, Wenwu Wang. 1285-1289 [doi]

Self-Supervised Learning for Sleep Stage Classification with Predictive and Discriminative Contrastive CodingQinfeng Xiao, Jing Wang, Jianan Ye, Hongjun Zhang, Yuyan Bu, Yiqiong Zhang, Hao Wu. 1290-1294 [doi]

Length No Longer Matters: A Real Length Adaptive Arrhythmia Classification Model with Multi-Scale ConvolutionChuanqi Han, Fang Yu, Peng Wang, Ruoran Huang, Xi Huang, Li Cui. 1295-1299 [doi]

Few-Shot Learning for Decoding Surface Electromyography for Hand Gesture RecognitionElahe Rahimian, Soheil Zabihi, Amir Asif, Seyed Farokh Atashzar, Arash Mohammadi 0001. 1300-1304 [doi]

Deep Lung Auscultation Using Acoustic Biomarkers for Abnormal Respiratory Sound Event DetectionUpasana Tiwari, Swapnil Bhosale, Rupayan Chakraborty, Sunil Kumar Kopparapu. 1305-1309 [doi]

Speaker-Independent Brain Enhanced Speech DenoisingMaryam Hosseini, Luca Celotti, Eric Plourde. 1310-1314 [doi]

Shapelet Based Visual Assessment of Cluster Tendency in Analyzing Complex Upper Limb MotionShreyasi Datta, Chandan K. Karmakar, Punit Rathore, Marimuthu Palaniswami. 1315-1319 [doi]

Human-Centered Favorite Music Classification Using EEG-Based Individual Music Preference Via Deep Time-Series CCARyosuke Sawata, Takahiro Ogawa, Miki Haseyama. 1320-1324 [doi]

Multi-Scale and Multi-Region Facial Discriminative Representation for Automatic Depression Level PredictionMingyue Niu, Jianhua Tao, Bin Liu. 1325-1329 [doi]

ECG Heart-Beat Classification Using Multimodal Image FusionZeeshan Ahmad, Anika Tabassum, Ling Guan, Naimul Khan. 1330-1334 [doi]

Estimation of Visual Features of Viewed Image From Individual and Shared Brain Information Based on FMRI Data Using Probabilistic Generative ModelTakaaki Higashi, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama. 1335-1339 [doi]

Hierarchical Pose Classification for Infant Action Analysis and Mental Development AssessmentJianXiong Zhou, Zhongyu Jiang, Jang-Hee Yoo, Jenq-Neng Hwang. 1340-1344 [doi]

On The Relationship Between Speech-Based Breathing Signal Prediction Evaluation Measures and Breathing Parameters EstimationZohreh Mostaani, Venkata Srikanth Nallanthighal, Aki Härmä, Helmer Strik, Mathew Magimai-Doss. 1345-1349 [doi]

Prediction of Egfr Mutation Status in Lung Adenocarcinoma Using Multi-Source Feature RepresentationsJianhong Cheng, Jin Liu, Meilin Jiang, Hailin Yue, Lin Wu, Jianxin Wang 0001. 1350-1354 [doi]

Training Neural Networks with Domain Pattern-Aware Auxiliary Task for Sleep StagingTaeheon Lee, Jeonghwan Hwang, Honggu Lee. 1355-1359 [doi]

Classification of Expert-Novice Level Using Eye Tracking And Motion Data via Conditional Multimodal Variational AutoencoderYusuke Akamatsu, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama. 1360-1364 [doi]

Gate Trimming: One-Shot Channel Pruning for Efficient Convolutional Neural NetworksFang Yu, Chuanqi Han, Pengcheng Wang, Xi Huang, Li Cui. 1365-1369 [doi]

3PR: Simultaneous Source Separation and Phase Retrieval Using Deep Generative ModelsChristopher A. Metzler, Gordon Wetzstein. 1370-1374 [doi]

Adversarial Attacks on Object Detectors with Limited PerturbationsZhenbo Shi, Wei Yang 0011, Zhenbo Xu, Zhi Chen, Yingjie Li, Haoran Zhu, Liusheng Huang. 1375-1379 [doi]

A Consensus Equilibrium Solution For Deep Image Prior Powered By RedRakib Hyder, Hassan Mansour, Yanting Ma, Petros T. Boufounos, Pu Wang. 1380-1384 [doi]

Suremap: Predicting Uncertainty in Cnn-Based Image Reconstructions Using Stein's Unbiased Risk EstimateRuangrawee Kitichotkul, Christopher A. Metzler, Frank Ong, Gordon Wetzstein. 1385-1389 [doi]

Multi-Initialization Meta-Learning with Domain AdaptationZhengyu Chen, Donglin Wang. 1390-1394 [doi]

Stochastic Deep Unfolding for Imaging Inverse ProblemsJiaming Liu, Yu Sun 0022, Weijie Gan, Xiaojian Xu, Brendt Wohlberg, Ulugbek S. Kamilov. 1395-1399 [doi]

Fusion-Based Digital Image Correlation Framework for Strain MeasurementLaixi Shi, Dehong Liu, Masaki Umeda, Norihiko Hana. 1400-1404 [doi]

Learning Sparsifying Transforms for Image Reconstruction in Electrical Impedance TomographyKaiyi Yang, Narong Borijindargoon, Boon Poh Ng, Saiprasad Ravishankar, Bihan Wen. 1405-1409 [doi]

D-VDAMP: Denoising-Based Approximate Message Passing for Compressive MRIChristopher A. Metzler, Gordon Wetzstein. 1410-1414 [doi]

Empirically Accelerating Scaled Gradient Projection Using Deep Neural Network for Inverse Problems in Image ProcessingByung-Hyun Lee, Se Young Chun. 1415-1419 [doi]

Synthetic Aperture Acoustic Imaging with Deep Generative Model Based Source Distribution PriorBoqiang Fan, Samarjit Das. 1420-1424 [doi]

Non-Local Single Image DE-Raining Without DecompositionChaobing Zheng, Zhengguo Li, Yuwen Li, Shiqian Wu. 1425-1429 [doi]

Frame-Rate-Aware Aggregation for Efficient Video Super-ResolutionTakashi Isobe, Fang Zhu, Shengjin Wang. 1430-1434 [doi]

Measurement Coding Framework with Adjacent Pixels Based Measurement Matrix for Compressively Sensed ImagesRentao Wan, Jinjia Zhou, Bowen Huang, Hui Zeng, Yibo Fan. 1435-1439 [doi]

Multiview Sensing with Unknown Permutations: an Optimal Transport ApproachYanting Ma, Petros T. Boufounos, Hassan Mansour, Shuchin Aeron. 1440-1444 [doi]

A High-Frame-Rate Eye-Tracking Framework for Mobile DevicesYuhu Chang, Changyang He, Yingying Zhao, Tun Lu, Ning Gu. 1445-1449 [doi]

Catiloc: Camera Image Transformer for Indoor LocalizationAli Ghofrani, Rahil Mahdian Toroghi, Seyed Mojtaba Tabatabaie. 1450-1454 [doi]

Sar Image Autofocusing Using Wirtinger Calculus and Cauchy RegularizationZi-Yao Zhang, Odysseas A. Pappas, Alin Achim. 1455-1459 [doi]

A Homogeneity-Based Multiscale Hyperspectral Image Representation for Sparse Spectral UnmixingLuciano C. Ayres, Sérgio J. M. de Almeida, José C. M. Bermudez, Ricardo Augusto Borsoi. 1460-1464 [doi]

Learning to Estimate Kernel Scale and Orientation of Defocus Blur with Asymmetric Coded ApertureJiSheng Li, Qi Dai, Jiangtao Wen. 1465-1469 [doi]

Transmittance Regularizer for Binary coded Aperture Design in a Computational Imaging end-to-end ApproachJorge Bacca, Tatiana Gelvez, Henry Arguello. 1470-1474 [doi]

Fourier Transformation Autoencoders for Anomaly DetectionDemetris Lappas, Vasileios Argyriou, Dimitrios Makris 0001. 1475-1479 [doi]

Zero-Gradient Constraints for Destriping of Remote-Sensing DataKazuki Naganuma, Saori Takeyama, Shunsuke Ono. 1480-1484 [doi]

Selection Based on Statistical Characteristics for Object DetectionZhiguo Li, Yuan Yuan 0001, Dandan Ma. 1485-1489 [doi]

CSPN: Multi-Scale Cascade Spatial Pyramid Network for Object DetectionTianyuan Wang, Can Ma, Haoshan Su, Weiping Wang 0005. 1490-1494 [doi]

Dual-Stream Network Based On Global Guidance for Salient Object DetectionShuyong Gao, Qianyu Guo, Wei Zhang, Wenqiang Zhang, Zhongwei Ji. 1495-1499 [doi]

SSFENet: Spatial and Semantic Feature Enhancement Network for Object DetectionTianyuan Wang, Can Ma, Haoshan Su, Weiping Wang 0005. 1500-1504 [doi]

Saliency-Driven Versatile Video Coding for Neural Object DetectionKristian Fischer, Felix Fleckenstein, Christian Herglotz, André Kaup. 1505-1509 [doi]

Object-Oriented Relational Distillation for Object DetectionShuyu Miao, Rui Feng. 1510-1514 [doi]

Ensembling Object Detectors for Image and Video Data AnalysisKateryna Chumachenko, Jenni Raitoharju, Alexandros Iosifidis, Moncef Gabbouj. 1515-1519 [doi]

Training Real-Time Panoramic Object Detectors with Virtual DatasetQing-Yang Shen, Tian-Guo Huang, Peng-Xin Ding, Jia He. 1520-1524 [doi]

Fast: Feature Aggregation for Detecting Salient Object in Real-TimeLv Tang, Bo Li, Yanliang Wu, Bo Xiao, Shouhong Ding. 1525-1529 [doi]

Exploiting the Dual-Tree Complex Wavelet Transform for Ship Wake Detection in SAR ImageryWanli Ma, Alin Achim, Oktay Karakus. 1530-1534 [doi]

Task-Related Self-Supervised Learning For Remote Sensing Image Change DetectionZhinan Cai, Zhiyu Jiang, Yuan Yuan 0001. 1535-1539 [doi]

Unsupervised Common Particular Object Discovery and Localization by Analyzing a Match GraphMakoto Okuda, Shin'ichi Satoh, Yoichi Sato, Yutaka Kidawara. 1540-1544 [doi]

Predictive Coding for Lossless Dataset CompressionMadeleine Barowsky, Alexander Mariona, Flávio P. Calmon. 1545-1549 [doi]

Adaptive Dual Tree Structure For Screen Content CodingWeijia Zhu, Jizheng Xu, Li Zhang 0006, Yue Wang. 1550-1554 [doi]

SNR-Adaptive Deep Joint Source-Channel Coding for Wireless Image TransmissionMingze Ding, Jiahui Li, Mengyao Ma, Xiaopeng Fan. 1555-1559 [doi]

Relying on a Rate Constraint to Reduce Motion Estimation ComplexityGabriel B. Sant'Anna, Luiz Henrique Cancellier, Ismael Seidel, Mateus Grellert, José Luís Güntzel. 1560-1564 [doi]

A Novel Viewport-Adaptive Motion Compensation Technique for Fisheye VideoAndy Regensky, Christian Herglotz, André Kaup. 1565-1569 [doi]

Rate-Distortion Optimized Motion Estimation for on-the-Sphere Compression of 360 VideosAlban Marie, Navid Mahmoudian Bidgoli, Thomas Maugey, Aline Roumy. 1570-1574 [doi]

Adaptive GOP Size Decision for Multi-Pass Video Coding Based on Hidden Markov ModelBohan Li, Jingning Han, Yaowu Xu. 1575-1579 [doi]

Improved Intra Mode Coding Beyond Av1Yize Jin, Liang Zhao, Xin Zhao, Shan Liu 0001, Alan C. Bovik. 1580-1584 [doi]

Decision Tree Based Inter Partition Termination For Av1 EncodingXinyao Chen, YiWei Zhang, Yanghao Li, Jiangtao Wen. 1585-1589 [doi]

Image Coding For Machines: an End-To-End Learned ApproachNam Le, Honglei Zhang, Francesco Cricri, Ramin Ghaznavi Youvalari, Esa Rahtu. 1590-1594 [doi]

Sparse Flow Adversarial Model For Robust Image CompressionShihui Zhao, Shuyuan Yang, Zhi Liu, Zhixi Feng, Xu Liu 0006. 1595-1599 [doi]

HVS-Based Perceptual Color Compression of Image DataLee Prangnell, Victor Sanchez. 1600-1604 [doi]

HOCA: Higher-Order Channel Attention for Single Image Super-ResolutionYalei Lv, Tao Dai, Bin Chen, Jian Lu, Shu-Tao Xia, Jingchao Cao. 1605-1609 [doi]

Image Super-Resolution Using Multi-Resolution Attention NetworkAnqi Liu, Sumei Li, Yongli Chang. 1610-1614 [doi]

Real Image Super-Resolution Using Token Based Contextual AttentionZhihong Pan, Baopu Li. 1615-1619 [doi]

Feature Redundancy Mining: Deep Light-Weight Image Super-Resolution ModelJun Xiao, Wenqi Jia, Kin-Man Lam 0001. 1620-1624 [doi]

Lightweight Non-Local Network for Image Super-ResolutionRisheng Wang, Tao Lei, Wenzheng Zhou, Qi Wang, Hongying Meng, Asoke K. Nandi. 1625-1629 [doi]

Lightweight and Accurate Single Image Super-Resolution with Channel Segregation NetworkZhonghan Niu, Xi-Peng Lin, An-Ni Yu, Yang-Hao Zhou, Yu-Bin Yang. 1630-1634 [doi]

Deep Learning Architectural Designs for Super-Resolution Of Noisy ImagesAngel Villar-Corrales, Franziska Schirrmacher, Christian Riess. 1635-1639 [doi]

Joint Coupled Transform Learning Framework for Multimodal Image Super-ResolutionAndrew Gigie, Achanna Anil Kumar, Angshul Majumdar, Kriti Kumar, M. Girish Chandra. 1640-1644 [doi]

Hyperspectral Image Super-Resolution Via Adjacent Spectral Fusion StrategyQiang Li, Qi Wang 0009, Xuelong Li. 1645-1649 [doi]

Raw Data Processing for Practical Time-of-Flight Super-ResolutionMiguel Heredia Conde. 1650-1654 [doi]

Edge-Aware Multi-Scale Progressive ColorizationJun Xia, Guanghua Tan, Yi Xiao, Fangqiang Xu, Chi-Sing Leung. 1655-1659 [doi]

Learning Representation of Multi-Scale Object for Fine-Grained Image RetrievalKangbo Sun, Jie Zhu. 1660-1664 [doi]

Super-Resolution and Infection Edge Detection Co-Guided Learning for Covid-19 Ct SegmentationYu Sang, Jinguang Sun, Si-Miao Wang, Heng Qi, Keqiu Li. 1665-1669 [doi]

Gating Feature Dense Network for Single Anisotropic Mr Image Super-ResolutionWeidong He, Yangjinan Hu, Lulu Wang, Zhongshi He, Jinglong Du. 1670-1674 [doi]

Adaptable Ensemble DistillationYankai Wang, Dawei Yang, Wei Zhang, Zhe Jiang 0004, Wenqiang Zhang. 1675-1679 [doi]

A Scale Invariant Measure of Flatness for Deep Network MinimaAkshay Rangamani, Nam H. Nguyen, Abhishek Kumar, Dzung T. Phan, Sang Peter Chin, Trac D. Tran. 1680-1684 [doi]

Multi-Order Adversarial Representation Learning for Composed Query Image RetrievalZhixiao Fu, Xinyuan Chen, Jianfeng Dong, Shouling Ji. 1685-1689 [doi]

Deep Neural Networks with Flexible Complexity While Training Based on Neural Ordinary Differential EquationsZhengbo Luo, Sei-ichiro Kamata, Zitang Sun, Weilian Zhou. 1690-1694 [doi]

Improving Memory Banks for Unsupervised Learning with Large Mini-Batch, Consistency and Hard Negative MiningAdrian Bulat, Enrique Sánchez-Lozano, Georgios Tzimiropoulos. 1695-1699 [doi]

Robust Binary Loss for Multi-Category Classification with Label NoiseDefu Liu 0001, Guowu Yang, Jinzhao Wu, Jiayi Zhao, Fengmao Lv. 1700-1704 [doi]

A Plug and Play Fast Intersection Over Union Loss for Boundary Box RegressionZengsheng Kuang, Xian Fang, Ruixun Zhang, Xiuli Shao, Hongpeng Wang. 1705-1709 [doi]

Attribute Decomposition for Flow-Based Domain MappingSheng-Jhe Huang, Jen-Tzung Chien. 1710-1714 [doi]

Ada-Sise: Adaptive Semantic Input Sampling for Efficient Explanation of Convolutional Neural NetworksMahesh Sudhakar, Sam Sattarzadeh, Konstantinos N. Plataniotis, Jongseong Jang, Yeonjeong Jeong, Hyunwoo Kim. 1715-1719 [doi]

Network Pruning Using Linear Dependency Analysis on Feature MapsHao Pan, Zhongdi Chao, Jiang Qian, BoJin Zhuang, Shaojun Wang, Jing Xiao. 1720-1724 [doi]

Multiple-Input Multiple-Output Fusion Network for Generalized Zero-Shot LearningFangming Zhong, Guangze Wang, Zhikui Chen, Xu Yuan, Feng Xia 0001. 1725-1729 [doi]

Representative Local Feature Mining for Few-Shot LearningKun Yan, Lingbo Liu, Jun Hou, Ping Wang 0003. 1730-1734 [doi]

KAN: Knowledge-Augmented Networks for Few-Shot LearningZeyang Zhu, Xin Lin. 1735-1739 [doi]

Few-Shot Image Classification with Multi-Facet PrototypesKun Yan, Zied Bouraoui, Ping Wang, Shoaib Jameel, Steven Schockaert. 1740-1744 [doi]

Self-Supervised Learning for Few-Shot Image ClassificationDa Chen, Yuefeng Chen, Yuhong Li, Feng Mao, Yuan He, Hui Xue. 1745-1749 [doi]

Domain Adaptation for Learning Generator From Paired Few-Shot DataChun-Chih Teng, Pin-Yu Chen, Wei-chen Chiu. 1750-1754 [doi]

Deep Semi-Supervised Metric Learning Via Identification of Manifold MembershipsFuren Zhuang, Pierre Moulin. 1755-1759 [doi]

A Ranked Similarity Loss Function with pair Weighting for Deep Metric LearningJian Wang, Zhichao Zhang, Dongmei Huang, Wei Song, Quanmiao Wei, Xinyue Li. 1760-1764 [doi]

Statistical Distance Metric Learning for Image Set RetrievalTing-Yao Hu, Alexander G. Hauptmann. 1765-1769 [doi]

Distribution-Aware Hierarchical Weighting Method for Deep Metric LearningYinong Zhu, Yong Feng 0002, Mingliang Zhou, Baohua Qiang, Leong Hou U, Jiajie Zhu. 1770-1774 [doi]

Integrated Grad-Cam: Sensitivity-Aware Visual Explanation of Deep Convolutional Networks Via Integrated Gradient-Based ScoringSam Sattarzadeh, Mahesh Sudhakar, Konstantinos N. Plataniotis, Jongseong Jang, Yeonjeong Jeong, Hyunwoo Kim. 1775-1779 [doi]

Visualizing Association in Exemplar-Based ClassificationTaiga Kashima, Ryuichiro Hataya, Hideki Nakayama. 1780-1784 [doi]

HFGCNET: High-Frequency Graph Reasoning for Finer Semantic Image SegmentationZitang Sun, Ruojing Wang, Zhengbo Luo, Weili Chen. 1785-1789 [doi]

Unsupervised Image Segmentation with Spatial Triplet Markov TreesHugo Gangloff, Jean-Baptiste Courbot, Emmanuel Monfrini, Christophe Collet 0001. 1790-1794 [doi]

Cross Scene Video Foreground Segmentation Via Co-Occurrence Probability Oriented Supervised and Unsupervised Model InteractionDong Liang, Bin Kang, Xinyu Liu, Han Sun, Liyan Zhang, Ningzhong Liu. 1795-1799 [doi]

Instance Segmentation with the Number of Clusters Incorporated in Embedding LearningJianfeng Cao, Hong Yan 0001. 1800-1804 [doi]

Decouple the High-Frequency and Low-Frequency Information of Images for Semantic SegmentationLianlei Shan, Xiaobin Li 0006, Weiqiang Wang. 1805-1809 [doi]

MPDNet: A 3D Missing Part Detection Network Based on Point Cloud SegmentationZhaoxin Fan, Hongyan Liu, Jun He 0008, Min Zhang, Xiaoyong Du 0001. 1810-1814 [doi]

SM+: Refined Scale Match for Tiny Person DetectionNan Jiang, Xuehui Yu, Xiaoke Peng, Yuqi Gong, Zhenjun Han. 1815-1819 [doi]

Sub-Band Grouping Spectral Feature-Attention Block for Hyperspectral Image ClassificationWeilian Zhou, Sei-ichiro Kamata, Zhengbo Luo. 1820-1824 [doi]

Unsupervised Stacked Capsule Autoencoder for Hyperspectral Image ClassificationErting Pan, Yong Ma 0001, Xiaoguang Mei, Fan Fan 0001, Jiayi Ma 0001. 1825-1829 [doi]

Robust Graph Autoencoder for Hyperspectral Anomaly DetectionGanghui Fan, Yong Ma 0001, Jun Huang 0008, Xiaoguang Mei, Jiayi Ma 0001. 1830-1834 [doi]

Reflectance-Oriented Probabilistic Equalization for Image EnhancementXiaomeng Wu, Yongqing Sun, Akisato Kimura, Kunio Kashino. 1835-1839 [doi]

PD-GAN: Perceptual-Details GAN for Extremely Noisy Low Light Image EnhancementYijun Liu, Zhengning Wang, Yi Zeng, Hao Zeng, Deming Zhao. 1840-1844 [doi]

Heterogeneous two-Stream Network with Hierarchical Feature Prefusion for Multispectral Pan-SharpeningDong Wang, Yunpeng Bai, Bendu Bai, Chanyue Wu, Ying Li. 1845-1849 [doi]

Synergic Feature Attention for Image RestorationChong Mou, Jian Zhang. 1850-1854 [doi]

Efficient Multi-Objective GANs for Image RestorationJingwen Su, Hujun Yin. 1855-1859 [doi]

Self-Convolution: A Highly-Efficient Operator for Non-Local Image RestorationLanqing Guo, Zhiyuan Zha, Saiprasad Ravishankar, Bihan Wen. 1860-1864 [doi]

NMF-SAE: An Interpretable Sparse Autoencoder for Hyperspectral UnmixingFengchao Xiong, Jun Zhou 0001, Minchao Ye, Jianfeng Lu 0003, Yuntao Qian. 1865-1869 [doi]

An ADMM Based Network for Hyperspectral Unmixing TasksChao Zhou, Miguel R. D. Rodrigues. 1870-1874 [doi]

Variational Autoencoders for Hyperspectral Unmixing with Endmember VariabilityShuaikai Shi, Min Zhao, Lijun Zhang, Jie Chen. 1875-1879 [doi]

Augmented Gaussian Linear Mixture Model for Spectral Variability in Hyperspectral UnmixingYaser Esmaeili Salehani, Ehsan Arabnejad, Saeed Gazor. 1880-1884 [doi]

UTDN: An Unsupervised Two-Stream Dirichlet-Net for Hyperspectral UnmixingQiwen Jin, Yong Ma 0001, Xiaoguang Mei, Hao Li 0034, Jiayi Ma 0001. 1885-1889 [doi]

Laplacian Regularized Tensor Low-Rank Minimization for Hyperspectral Snapshot Compressive ImagingYi Yang, Fei Jiang, Hongtao Lu. 1890-1894 [doi]

Compressing Local Descriptor Models for Mobile ApplicationsRoy Miles, Krystian Mikolajczyk. 1895-1899 [doi]

VK-Net: Category-Level Point Cloud Registration with Unsupervised Rotation Invariant KeypointsZhi Chen, Wei Yang, Zhenbo Xu, Zhenbo Shi, Liusheng Huang. 1900-1904 [doi]

Matching as Color Images: Thermal Image Local Feature Detection and DescriptionBhavesh Deshpande, Sourabh Hanamsheth, Yawen Lu, Guoyu Lu. 1905-1909 [doi]

Frame Rate Up-Conversion Using Key Point Agnostic Frequency-Selective Mesh-to-Grid ResamplingViktoria Heimann, Andreas Spruck, André Kaup. 1910-1914 [doi]

Efficient Real-Time Video Stabilization with a Novel Least Squares FormulationJianwei Ke, Alex J. Watras, Jae-Jun Kim, Hewei Liu, Hongrui Jiang, Yu Hen Hu. 1915-1919 [doi]

Decomposing Textures using Exponential AnalysisYuan Hou, Annie A. M. Cuyt, Wen-shin Lee, Deepayan Bhowmik. 1920-1924 [doi]

G-Arrays: Geometric Arrays for Efficient Point Cloud ProcessingHoda Roodaki, Masoud Dehyadegari, Mahdi Nazm Bojnordi. 1925-1929 [doi]

QoE-Driven and Tile-Based Adaptive Streaming for Point CloudsLisha Wang, Chenglin Li, Wenrui Dai, Junni Zou, Hongkai Xiong. 1930-1934 [doi]

Dynamic Point Cloud Compression Using A Cuboid Oriented Discrete Cosine Based Motion ModelAshek Ahmmed, Manoranjan Paul, M. Manzur Murshed, David Taubman. 1935-1939 [doi]

An Adaptive Pyramid Single-View Depth Lookup Table Coding MethodYangang Cai, Ronggang Wang, Song Gu, Jian Zhang 0018, Wen Gao 0001. 1940-1944 [doi]

Patch Decoder-Side Depth Estimation In Mpeg Immersive VideoMarta Milovanovic, Félix Henry, Marco Cagnazzo, Joël Jung. 1945-1949 [doi]

Geometry Consistency Of Augmented Reality Based On SemanticsHongyan Quan, Mingwei Yao, Xiaoxiao Qian. 1950-1954 [doi]

What And Where To Focus In Person SearchTong Zhou, Kun Tian. 1955-1959 [doi]

Stable and Effective One-Step Method for Person SearchNing Lv, Xuezhi Xiang, Xinyao Wang, Jie Yang, Rokia Abdeen, Abdulmotaleb El-Saddik. 1960-1964 [doi]

An Adaptive Part-Based Model For Person Re-IdentificationXi-Peng Lin, Yu-Bin Yang. 1965-1969 [doi]

Crowd Counting Via Multi-Level Regression With Latent Gaussian MapsYukang Gao, Hua Yang. 1970-1974 [doi]

Lightweight Dual-Task Networks For Crowd Counting In Aerial ImagesYe Tian, Chengzhen Duan, Ruilin Zhang, Zhiwei Wei, Hongpeng Wang. 1975-1979 [doi]

SANet++: Enhanced Scale Aggregation with Densely Connected Feature Fusion for Crowd CountingSiyang Pan, Yanyun Zhao, Fei Su, Zhicheng Zhao. 1980-1984 [doi]

Attentive Semantic Exploring for Manipulated Face DetectionZehao Chen, Hua Yang. 1985-1989 [doi]

Efficient Face Manipulation Via Deep Feature Disentanglement And Reintegration NetBin Cheng, Tao Dai, Bin Chen, Shutao Xia, Xiu Li. 1990-1994 [doi]

Continuous Face Aging Generative Adversarial NetworksSeogkyu Jeon, Pilhyeon Lee, Kibeom Hong, Hyeran Byun. 1995-1999 [doi]

Fast Inverse Mapping of Face GANsNicky Bayat, Vahid Reza Khazaie, Yalda Mohsenzadeh. 2000-2004 [doi]

Multi-Level Adaptive Region of Interest and Graph Learning for Facial Action Unit RecognitionJingwei Yan, Boyuan Jiang, Jingjing Wang 0005, Qiang Li, Chunmao Wang, Shiliang Pu. 2005-2009 [doi]

Bridging Unpaired Facial Photos and Sketches by Line-DrawingsMeimei Shang, Fei Gao, Xiang Li, Jingjie Zhu, Lingna Dai. 2010-2014 [doi]

Temporal Rain Decomposition with Spatial Structure Guidance for Video DerainingXinwei Xue, Ying Ding, Long Ma 0002, Yi Wang, Risheng Liu, Xin Fan 0001. 2015-2019 [doi]

GTA-Net: Gradual Temporal Aggregation Network for Fast Video DerainingXinwei Xue, Xiangyu Meng, Long Ma 0002, Risheng Liu, Xin Fan 0001. 2020-2024 [doi]

Dense Feature Pyramid Grids Network for Single Image DerainingZhen Wang, Cong Wang 0018, Zhixun Su, Junyang Chen. 2025-2029 [doi]

A Fast and Efficient Network for Single Image DerainingYouzhao Yang, Hong Lu 0001. 2030-2034 [doi]

DNANet: Dense Nested Attention Network for Single Image DehazingDongdong Ren, Jinbao Li, Meng Han, Minglei Shu. 2035-2039 [doi]

FWB-Net: Front White Balance Network for Color Shift Correction in Single Image Dehazing Via Atmospheric Light EstimationCong Wang, Yan Huang, Yuexian Zou, Yong Xu. 2040-2044 [doi]

Learning Integrodifferential Models for Image DenoisingTobias Alt, Joachim Weickert. 2045-2049 [doi]

Unrolling of Deep Graph Total Variation for Image DenoisingHuy Vu, Gene Cheung, Yonina C. Eldar. 2050-2054 [doi]

Learning Model-Blind Temporal Denoisers without Ground TruthsYanghao Li, Bichuan Guo, Jiangtao Wen, Zhen Xia, Shan Liu, Yuxing Han. 2055-2059 [doi]

Image Denoising Based on Correlation Adaptive Sparse ModelingHangfan Liu, Jian Zhang, Chong Mou. 2060-2064 [doi]

NASA: A Noise-Adaptive and Structure-Aware Learning Framework for Image DeblurringXiaokun Liu, Long Ma 0002, Risheng Liu, Wei Zhong, Xin Fan, Zhongxuan Luo. 2065-2069 [doi]

Multiple Auxiliary Networks for Single Blind Image DeblurringChen Li, Qi Wang, Shaoteng Liu, Xuelong Li. 2070-2074 [doi]

Joint Learning of Image Aesthetic Quality Assessment and Semantic Recognition Based on Feature EnhancementXiangfei Liu, Xiushan Nie, Zhen Shen, Yilong Yin. 2075-2079 [doi]

Nested Error Map Generation Network for No-Reference Image Quality AssessmentJunming Chen, Haiqiang Wang, Ge Li 0002, Shan Liu 0001. 2080-2084 [doi]

Regression or classification? New methods to evaluate no-reference picture and video quality modelsZhengzhong Tu, Chia-Ju Chen, Li-Heng Chen, Yilin Wang, Neil Birkbeck, Balu Adsumilli, Alan C. Bovik. 2085-2089 [doi]

Blind Image Quality Evaluator with Scale RobustnessCi Wang, Mei Li. 2090-2094 [doi]

Multi-Scale Feature-Guided Stereoscopic Video Quality Assessment Based on 3d Convolutional Neural NetworkYingjie Feng, Sumei Li, Yongli Chang. 2095-2099 [doi]

No-Reference Stereoscopic Image Quality Assessment Based on the Human Visual SystemFan Meng, Sumei Li, Yongli Chang. 2100-2104 [doi]

Stereo Rectification Based on Epipolar Constrained Neural NetworkYuxing Wang, Yawen Lu, Guoyu Lu. 2105-2109 [doi]

Multi-Scale Cascade Disparity Refinement Stereo NetworkXiaogang Jia, Wei Chen 0009, Zhengfa Liang, Xin Luo, Mingfei Wu, Yusong Tan, Libo Huang. 2110-2114 [doi]

Hierarchical Context Guided Aggregation Network for Stereo MatchingJun Peng, Wangduo Xie, Zijing Huang, Wei Chen, Yong Zhao. 2115-2119 [doi]

Cost Affinity Learning Network for Stereo MatchingShenglun Chen, Baopu Li, Wei Wang, Hong Zhang, Haojie Li, Zhihui Wang. 2120-2124 [doi]

Video Quality Prediction Using Voxel-Wise fMRI Models of the Visual CortexNaga Sailaja Mahankali, Sumohana S. Channappayya. 2125-2129 [doi]

Tensor Decomposition Via Core Tensor NetworksJianfu Zhang 0003, Zerui Tao, Liqing Zhang 0001, Qibin Zhao. 2130-2134 [doi]

Sign Language Segmentation with Temporal Convolutional NetworksKatrin Renz, Nicolaj C. Stache, Samuel Albanie, Gül Varol. 2135-2139 [doi]

An Adaptive Discriminant and Sparsity Feature Descriptor for Finger Vein RecognitionShuyi Li, Bob Zhang. 2140-2144 [doi]

Routinggan: Routing Age Progression and Regression with Disentangled LearningZhizhong Huang, Junping Zhang, Hongming Shan. 2145-2149 [doi]

Semantic-Aware Unpaired Image-to-Image Translation for Urban Scene ImagesZongyao Li, Ren Togo, Takahiro Ogawa, Miki Haseyama. 2150-2154 [doi]

Fontnet: On-Device Font Understanding and Prediction PipelineRakshith S, Rishabh Khurana, Vibhav Agarwal, Jayesh Rajkumar Vachhani, Bhanodai Guggilla. 2155-2159 [doi]

Agent-Environment Network for Temporal Action Proposal GenerationViet-Khoa Vo-Ho, Ngan Le, Kashu Kamazaki, Akihiro Sugimoto, Minh-Triet Tran. 2160-2164 [doi]

Adaptive Multi-Domain Learning for Outdoor 3d Human Pose and Shape EstimationZhaoyang Gui, Shanshan Zhang, Kangkan Wang, Jian Yang, PongChi Yuen. 2165-2169 [doi]

Lightweight Human Pose Estimation under Resource-Limited ScenesZhe Zhang, Jie Tang 0006, Gangshan Wu. 2170-2174 [doi]

Absolute 3d Pose Estimation and Length Measurement of Severely Deformed Fish from Monocular Videos in Longline FishingJie Mei, Jenq-Neng Hwang, Suzanne Romain, Craig S. Rose, Braden Moore, Kelsey Magrane. 2175-2179 [doi]

Camera Calibration with Pose GuidanceYuzhuo Ren, Feng Hu. 2180-2184 [doi]

Real Versus Fake 4k - Authentic Resolution AssessmentRishi Rajesh Shah, Vyas Anirudh Akundy, Zhou Wang. 2185-2189 [doi]

Perceptual Quality Assessment for Recognizing True and Pseudo 4k ContentWenhan Zhu, Guangtao Zhai, Xiongkuo Min, Xiaokang Yang, Xiao-Ping Zhang 0002. 2190-2194 [doi]

A New Tubular Structure Tracking Algorithm Based On Curvature-Penalized Perceptual GroupingLi Liu, Da Chen 0002, Minglei Shu, Huazhong Shu, Laurent D. Cohen. 2195-2199 [doi]

Multiple Human Tracking in Non-Specific Coverage with Wearable CamerasSibo Wang, Ruize Han, Wei Feng 0005, Song Wang 0002. 2200-2204 [doi]

Fine-Grained Pose Temporal Memory Module for Video Pose Estimation and TrackingChaoyi Wang, Yang Hua, Tao Song, Zhengui Xue, Ruhui Ma, Neil Robertson, Haibing Guan. 2205-2209 [doi]

Drawing Order Recovery from Trajectory ComponentsMinghao Yang, Xukang Zhou, Yangchang Sun, Jinglong Chen, Baohua Qiang. 2210-2214 [doi]

Deep Hashing for Motion Capture Data RetrievalNa Lv, Ying Wang, Zhiquan Feng, Jingliang Peng. 2215-2219 [doi]

Hierarchical Attention Fusion for Geo-LocalizationLiqi Yan, Yiming Cui, Yingjie Chen, Dongfang Liu. 2220-2224 [doi]

AttentionLite: Towards Efficient Self-Attention Models for VisionSouvik Kundu 0002, Sairam Sundaresan. 2225-2229 [doi]

Attention-Guided Second-Order Pooling Convolutional NetworksShannan Chen, Qiule Sun, Cunhua Li, Jianxin Zhang, Qiang Zhang 0008. 2230-2234 [doi]

SA-Net: Shuffle Attention for Deep Convolutional Neural NetworksQing-Long Zhang, Yu-Bin Yang. 2235-2239 [doi]

An Attention Based Wavelet Convolutional Model for Visual Saliency DetectionReshmi S. Bhooshan, Suresh K. 2240-2244 [doi]

Cascade Attention Fusion for Fine-Grained Image Captioning Based on Multi-Layer LSTMShuang Wang, Yun Meng, Yu Gu, Lei Zhang, Xiutiao Ye, Jingxian Tian, Licheng Jiao. 2245-2249 [doi]

Webly Supervised Deep Attentive QuantizationJinpeng Wang, Bin Chen 0001, Tao Dai, Shu-Tao Xia. 2250-2254 [doi]

Unsupervised Audio-Visual Subspace Alignment for High-Stakes Deception DetectionLeena Mathur, Maja J. Mataric. 2255-2259 [doi]

Violence Detection in Videos Based on Fusing Visual and Audio InformationWen-Feng Pang, Qian-Hua He, Yongjian Hu, Yan-Xiong Li. 2260-2264 [doi]

QUERYD: A Video Dataset with High-Quality Text and Audio NarrationsAndreea-Maria Oncescu, João F. Henriques, Yang Liu, Andrew Zisserman, Samuel Albanie. 2265-2269 [doi]

Generating Natural Questions from Images for Multimodal AssistantsAlkesh Patel, Akanksha Bindal, Hadas Kotek, Christopher Klein, Jason Williams. 2270-2274 [doi]

An Adaptive Multi-Scale and Multi-Level Features Fusion Network with Perceptual Loss for Change DetectionJialang Xu, Yang Luo, Xinyue Chen, Chunbo Luo. 2275-2279 [doi]

SeeHear: Signer Diarisation and a New DatasetSamuel Albanie, Gül Varol, Liliane Momeni, Triantafyllos Afouras, Andrew Brown 0006, Chuhan Zhang, Ernesto Coto, Necati Cihan Camgöz, Ben Saunders, Abhishek Dutta, Neil Fox, Richard Bowden, Bencie Woll, Andrew Zisserman. 2280-2284 [doi]

Semantic Image Synthesis from Inaccurate and Coarse MasksKai Katsumata, Hideki Nakayama. 2285-2289 [doi]

Range Guided Depth Refinement and Uncertainty-Aware Aggregation for View SynthesisYuan Chang, Yisong Chen, Guoping Wang. 2290-2294 [doi]

DP-VTON: Toward Detail-Preserving Image-Based Virtual Try-on NetworkYuan Chang, Tao Peng, Ruhan He, Xinrong Hu, Junping Liu, Zili Zhang, Minghua Jiang. 2295-2299 [doi]

Light Field Style Transfer with Local Angular ConsistencyDónal Egan, Martin Alain, Aljosa Smolic. 2300-2304 [doi]

Skip Attention GAN for Remote Sensing Image SynthesisKai Deng, Kun Zhang, Ping Yao, Siyuan Cheng, Peng He. 2305-2309 [doi]

Image Generation Based on Texture Guided VAE-AGAN for Regions of Interest Detection in Remote Sensing ImagesLibao Zhang, Yanan Liu. 2310-2314 [doi]

EADNet: Efficient Asymmetric Dilated Network For Semantic SegmentationQihang Yang, Tao Chen, Jiayuan Fan, Ye Lu, Chongyan Zuo, Qinghua Chi. 2315-2319 [doi]

Ltaf-Net: Learning Task-Aware Adaptive Features and Refining Mask for Few-Shot Semantic SegmentationBinjie Mao, Lingfeng Wang, Shiming Xiang, Chunhong Pan. 2320-2324 [doi]

Cgan-Net: Class-Guided Asymmetric Non-Local Network for Real-Time Semantic SegmentationHanlin Chen, Qingyong Hu, Jungang Yang, Jing Wu, Yulan Guo. 2325-2329 [doi]

Aggregation Architecture and all-to-one Network for Real-Time Semantic SegmentationKuntao Cao, Xi Huang, Jie Shao. 2330-2334 [doi]

Nlkd: Using Coarse Annotations For Semantic Segmentation Based on Knowledge DistillationDong Liang, Yun Du, Han Sun, Liyan Zhang, Ningzhong Liu, Mingqiang Wei. 2335-2339 [doi]

Knowledge Reasoning for Semantic SegmentationShengjia Chen, Zhixin Li, Xiwei Yang. 2340-2344 [doi]

Non-Convex Sparse Deviation Modeling Via Generative ModelsYaxi Yang, Hailin Wang, Haiquan Qiu, Jianjun Wang, Yao Wang 0003. 2345-2349 [doi]

Imrnet: An Iterative Motion Compensation and Residual Reconstruction Network for Video Compressed SensingXin Yang, Chunling Yang. 2350-2354 [doi]

Deep Color Constancy Using Temporal Gradient Under Ac Light SourcesJeong-Won Ha, Jun-Sang Yoo, Jong-Ok Kim. 2355-2359 [doi]

End-to-End Learning of Variational Models and Solvers for the Resolution of Interpolation ProblemsRonan Fablet, Lucas Drumetz, François Rousseau 0002. 2360-2364 [doi]

Multi-Models Fusion for Light Field Angular Super-ResolutionFengyin Cao, Ping An, Xinpeng Huang, Chao Yang, Qiang Wu 0001. 2365-2369 [doi]

Hide Chopin in the Music: Efficient Information Steganography Via Random ShufflingZhun Sun, Chao Li, Qibin Zhao. 2370-2374 [doi]

Pointer Networks for Arbitrary-Shaped Text SpottingYi Zhang, Wei Yang, Zhenbo Xu, Yingjie Li, Zhi Chen, Liusheng Huang. 2375-2379 [doi]

Rotation Invariance Analysis of Local Convolutional Features in Image RetrievalLongjiao Zhao, Yu Wang 0018, Jien Kato. 2380-2384 [doi]

Signature Feature Marking Enhanced IRM Framework for Drone Image Analysis in Precision AgricultureAtharva Kadethankar, Neelam Sinha, Vinayaka Hegde, Abhishek Burman. 2385-2389 [doi]

Vehicle 3d Localization in Road Scenes VIA a Monocular Moving CameraYanting Zhang 0001, Aotian Zheng, Ke Han, Yizhou Wang 0005, Jenq-Neng Hwang. 2390-2394 [doi]

Gps-Denied Navigation Using Sar Images And Neural NetworksTeresa White, Jesse Wheeler, Colton Lindstrom, Randall Christensen, Kevin R. Moon. 2395-2399 [doi]

Attention-Embedded Decomposed Network with Unpaired CT Images Prior for Metal Artifact ReductionBinyu Zhao, Qianqian Ren, Jinbao Li, Yafeng Zhao. 2400-2404 [doi]

Partial Feature Aggregation Network for Real-Time Object CountingHoushun Yu, Li Zhang 0004. 2405-2409 [doi]

A Bayesian Inference Approach for Location-Based Micro Motions using Radio Frequency SensingDavid A. Maluf, Amr Elnakeeb, Matt Silverman. 2410-2414 [doi]

Robust Spatial-Temporal Correlation Model for Background Initialization in Severe SceneYuheng Deng, Wenjun Zhou, Bo Peng, Dong Liang 0008, Shun'ichi Kaneko. 2415-2419 [doi]

2D-FRFT Based Frequency Shift-Invariant Digital Image EncryptionLei Gao 0001, Lin Qi, Ling Guan. 2420-2424 [doi]

Capturing Banding in Images: Database Construction and Objective AssessmentAkshay Kapoor, Jatin Sapra, Zhou Wang. 2425-2429 [doi]

On The Camera Position Dithering In Visual 3d ReconstructionQier An, Yuan Shen. 2430-2434 [doi]

Long-Short Temporal Modeling for Efficient Action RecognitionLiyu Wu, Yuexian Zou, Can Zhang. 2435-2439 [doi]

Multi-Directional Convolution Networks with Spatial-Temporal Feature Pyramid Module for Action RecognitionBohong Yang, Zijian Wang, Wu Ran, Hong Lu, Yi-Ping Phoebe Chen. 2440-2444 [doi]

Unsupervised Motion Representation Enhanced Network for Action RecognitionXiaohang Yang, Lingtong Kong, Jie Yang. 2445-2449 [doi]

An Improved Deep Relation Network for Action Recognition in Still ImagesWei Wu 0032, Jiale Yu. 2450-2454 [doi]

Human-Aware Coarse-to-Fine Online Action DetectionZichen Yang, Di Huang 0001, Jie Qin, Yunhong Wang. 2455-2459 [doi]

SRF-Net: Selective Receptive Field Network for Anchor-Free Temporal Action DetectionRanyu Ning, Can Zhang, Yuexian Zou. 2460-2464 [doi]

Semantic-Aware Context Aggregation for Image InpaintingZhilin Huang, Chujun Qin, Ruixin Liu, Zhenyu Weng, Yuesheng Zhu. 2465-2469 [doi]

Bishift-Net for Image InpaintingXue Zhou, Tao Dai, Yong Jiang, Shu-Tao Xia. 2470-2474 [doi]

OAS-Net: Occlusion Aware Sampling Network for Accurate Optical FlowLingtong Kong, Xiaohang Yang, Jie Yang. 2475-2479 [doi]

Mask4D: 4D Convolution Network for Light Field Occlusion RemovalYingjie Li, Wei Yang, Zhenbo Xu, Zhi Chen, Zhenbo Shi, Yi Zhang, Liusheng Huang. 2480-2484 [doi]

Self-Supervised Depth Estimation Via Implicit Cues from VideosJianrong Wang, Ge Zhang, Zhenyu Wu, Xuewei Li, Li Liu. 2485-2489 [doi]

Scene Completeness-Aware Lidar Depth Completion for Driving ScenarioCho-Ying Wu, Ulrich Neumann. 2490-2494 [doi]

Semi-Supervised Feature Embedding for Data Sanitization in Real-World EventsBahram Lavi, José Nascimento, Anderson Rocha 0001. 2495-2499 [doi]

Exposing GAN-Generated Faces Using Inconsistent Corneal Specular HighlightsShu Hu, Yuezun Li, Siwei Lyu. 2500-2504 [doi]

A Features Decoupling Method for Multiple Manipulations Identification in Image Operation ChainsJiaxin Chen, Xin Liao, Wei Wang, Zheng Qin. 2505-2509 [doi]

Subjective and Objective Evaluation of Deepfake VideosPavel Korshunov, Sébastien Marcel. 2510-2514 [doi]

Forensicability of Deep Neural Network Inference PipelinesAlexander Schlögl, Tobias Kupek, Rainer Böhme. 2515-2519 [doi]

SERN: Stance Extraction and Reasoning Network for Fake News DetectionJianhui Xie, Song Liu, Ruixin Liu, Yinghong Zhang, Yuesheng Zhu. 2520-2524 [doi]

An Efficient Paper Anti-Counterfeiting Method Based on Microstructure Orientation EstimationYuhao Sun, Xin Liao, Jianfeng Liu. 2525-2529 [doi]

Learning Double-Compression Video Fingerprints Left From Social-Media PlatformsIrene Amerini, Aris Anagnostopoulos, Luca Maiano, Lorenzo Ricciardi Celsi. 2530-2534 [doi]

Checking PRNU Usability on Modern DevicesC. Albisani, Massimo Iuliani, Alessandro Piva. 2535-2539 [doi]

Handwritten Digits Reconstruction from Unlabelled EmbeddingsThomas Thebaud, Gaël Le Lan, Anthony Larcher. 2540-2544 [doi]

Effect of Video Pixel-Binning on Source Attribution of Mixed MediaSamet Taspinar, Manoranjan Mohanty, Nasir D. Memon. 2545-2549 [doi]

Combining Dynamic Image and Prediction Ensemble for Cross-Domain Face Anti-SpoofingLingling Lv, Youjun Xiang, Xianfeng Li, Hanye Huang, Rongju Ruan, Xiaoyan Xu, Yuli Fu 0001. 2550-2554 [doi]

Label-Guided Dictionary Pair Learning for ECG Biometric RecognitionMingzhu Ma, Gongping Yang, Kuikui Wang, Yuwen Huang, Yilong Yin. 2555-2559 [doi]

Backdoor Attack Against Speaker VerificationTongqing Zhai, Yiming Li, Ziqi Zhang, Baoyuan Wu, Yong Jiang, Shu-Tao Xia. 2560-2564 [doi]

Class-Conditional Defense GAN Against End-To-End Speech AttacksMohammad Esmaeilpour, Patrick Cardinal, Alessandro Lameiras Koerich. 2565-2569 [doi]

Selfgait: A Spatiotemporal Representation Learning Method for Self-Supervised Gait RecognitionYiqun Liu 0009, Yi Zeng, Jian Pu, Hongming Shan, Peiyang He, Junping Zhang. 2570-2574 [doi]

Attack on Practical Speaker Verification System Using Universal Adversarial PerturbationsWeiyi Zhang, Shuning Zhao, Le Liu, Jianmin Li 0001, Xingliang Cheng, Thomas Fang Zheng, Xiaolin Hu. 2575-2579 [doi]

Highly Efficient Protection of Biometric Face Samples with Selective JPEG2000 EncryptionHeinz Hofbauer, Yoanna Martínez-Díaz, Simon Kirchgasser, Heydi Méndez-Vázquez, Andreas Uhl. 2580-2584 [doi]

Deep Auto-Encoding and Biohashing for Secure Finger Vein RecognitionHatef Otroshi-Shahreza, Sébastien Marcel. 2585-2589 [doi]

Topic Sequence Embedding for User Identity Linkage from Heterogeneous Behavior DataJinzhu Yang, Wei Zhou, Wanhui Qian, Jizhong Han, Songlin Hu. 2590-2594 [doi]

Looking Through Walls: Inferring Scenes from Video-Surveillance Encrypted TrafficDaniele Mari, Samuele Giuliano Piazzetta, Sara Bordin, Luca Pajola, Sebastiano Verde, Simone Milani, Mauro Conti. 2595-2599 [doi]

Optimal Attacking Strategy Against Online Reputation Systems with Consideration of the Message-Based Persuasion PhenomenonZhanjiang Chen, H. Vicky Zhao. 2600-2604 [doi]

STEP-GAN: A One-Class Anomaly Detection Model with Applications to Power System SecurityMohammad Adiban, Arash Safari, Giampiero Salvi. 2605-2609 [doi]

Application-Layer DDOS Attacks with Multiple Emulation DictionariesMichele Cirillo, Mario Di Mauro, Vincenzo Matta, Marco Tambasco. 2610-2614 [doi]

Secret Key Generation Over Wireless Channels using short Blocklength Multilevel Source Polar CodingHenri Hentilä, Yanina Y. Shkel, Visa Koivunen. 2615-2619 [doi]

Efficient Network Protection Games Against Multiple Types Of Strategic AttackersZhifan Xu, Melike Baykal-Gürsoy. 2620-2624 [doi]

Detection Of Malicious DNS and Web Servers using Graph-Based ApproachesJinyuan Jia, Zheng Dong, Jie Li, Jack W. Stokes. 2625-2629 [doi]

Low Complexity Secure P-Tensor Product Compressed Sensing Reconstruction Outsourcing and Identity Authentication in CloudMengdi Wang, Di Xiao, Jia Liang. 2630-2634 [doi]

Privacy-Preserving near Neighbor Search via Sparse Coding with AmbiguationBehrooz Razeghi, Sohrab Ferdowsi, Dimche Kostadinov, Flávio P. Calmon, Slava Voloshynovskiy. 2635-2639 [doi]

Privacy-Preserving Optimal Insulin Dosing DecisionZuobin Ying, Shuanglong Cao, Shengmin Xu, Ximeng Liu, Lingjuan Lyu, Cen Chen, Li Wang. 2640-2644 [doi]

Privacy-Accuracy Trade-Off of Inference as ServiceYulu Jin, Lifeng Lai. 2645-2649 [doi]

Federated Learning with Local Differential Privacy: Trade-Offs Between Privacy, Utility, and CommunicationMuah Kim, Onur Günlü, Rafael F. Schaefer. 2650-2654 [doi]

Scalable Privacy-Preserving Distributed Extremely Randomized Trees for Structured Data With Multiple Colluding PartiesAmin Aminifar, Fazle Rabbi 0001, Yngve Lamo. 2655-2659 [doi]

Active Privacy-Utility Trade-Off Against A Hypothesis Testing AdversaryEcenaz Erdemir, Pier Luigi Dragotti, Deniz Gündüz. 2660-2664 [doi]

Baitradar: A Multi-Model Clickbait Detection Algorithm Using Deep LearningBhanuka Gamage, Adnan Labib, Aisha Joomun, Chern Hong Lim, KokSheik Wong. 2665-2669 [doi]

Enabling Efficient and Expressive Spatial Keyword Queries On Encrypted DataXiangyu Wang, Jianfeng Ma 0001, Ximeng Liu. 2670-2674 [doi]

Privacy-Preserving Cloud-Based DNN InferenceShangyu Xie, Bingyu Liu, Yuan Hong. 2675-2679 [doi]

Crypto-Oriented Neural Architecture DesignAvital Shafran, Gil Segev 0001, Shmuel Peleg, Yedid Hoshen. 2680-2684 [doi]

Integrating Deep Learning with First-Order Logic Programmed Constraints for Zero-Day Phishing Attack DetectionSeok-Jun Bu, Sung-Bae Cho. 2685-2689 [doi]

Improved Probabilistic Context-Free Grammars for Passwords Using Word ExtractionHaibo Cheng, Wenting Li, Ping Wang, Kaitai Liang. 2690-2694 [doi]

Enhancing Image Steganography Via Stego Generation And SelectionTingting Song, Minglin Liu, Weiqi Luo, Peijia Zheng. 2695-2699 [doi]

Synchronous Multi-Bit Audio Watermarking Based on Phase ShiftingShengbei Wang, WeiTao Yuan, Zhen Zhang, Jianming Wang, Masashi Unoki. 2700-2704 [doi]

Image Steganography Based on Iterative Adversarial Perturbations Onto a Synchronized-Directions Sub-ImageXinghong Qin, Shunquan Tan, Weixuan Tang, Bin Li 0011, Jiwu Huang. 2705-2709 [doi]

Extending the Reverse JPEG Compatibility Attack to Double Compressed ImagesJan Butora, Jessica Fridrich. 2710-2714 [doi]

Reversible Data Hiding in Jpeg Images for Privacy ProtectionYuxuan Huang, Xin Cao, Hao-Tian Wu, Yiu-ming Cheung. 2715-2719 [doi]

A Layered Embedding-Based Scheme to Cope with Intra-Frame Distortion Drift In IPM-Based HEVC SteganographyXiaoqing Jia, Jie Wang 0031, Yongliang Liu, Xiangui Kang, Yun Qing Shi 0001. 2720-2724 [doi]

Meta-Learning with Attention for Improved Few-Shot LearningZejiang Hou, Anwar Walid, Sun-Yuan Kung. 2725-2729 [doi]

B-Small: A Bayesian Neural Network Approach to Sparse Model-Agnostic Meta-LearningAnish Madan, Ranjitha Prasad. 2730-2734 [doi]

Deep Transform and Metric Learning NetworksWen Tang, Émilie Chouzenoux, Jean-Christophe Pesquet, Hamid Krim. 2735-2739 [doi]

Robustness and Diversity Seeking Data-Free Knowledge DistillationPengchao Han, Jihong Park, Shiqiang Wang, Yejun Liu. 2740-2744 [doi]

Ensemble Distillation Approaches for Grammatical Error CorrectionYassir Fathullah, M. J. F. Gales, Andrey Malinin. 2745-2749 [doi]

Train Your Classifier First: Cascade Neural Networks Training from Upper Layers to Lower LayersShucong Zhang, Cong-Thanh Do, Rama Doddipatla, Erfan Loweimi, Peter Bell 0001, Steve Renals. 2750-2754 [doi]

How Convolutional Neural Networks Deal with AliasingAntônio H. Ribeiro, Thomas B. Schön. 2755-2759 [doi]

Canet: Context-Aware Loss for Descriptor LearningTianyou Chen, Xiaoguang Hu, Jin Xiao, Guofeng Zhang 0002, Hui Ruan. 2760-2764 [doi]

Progressive Multi-Stage Feature Mix for Person Re-IdentificationYan Zhang, Binyu He, Li Sun, Qingli Li. 2765-2769 [doi]

Using Deep Image Priors to Generate Counterfactual ExplanationsVivek Sivaraman Narayanaswamy, Jayaraman J. Thiagarajan, Andreas Spanias. 2770-2774 [doi]

Elliptical Shape Recovery from Blurred Pixels Using Deep LearningHojatollah Zamani, Peyman Rostami, Arash Amini, Farokh Marvasti. 2775-2779 [doi]

Factorized CRF with Batch Normalization Based on the Entire Training DataEran Goldman, Jacob Goldberger. 2780-2784 [doi]

Evolutionary Quantization of Neural Networks with Mixed-PrecisionZhenhua Liu, Xinfeng Zhang, Shanshe Wang, Siwei Ma, Wen Gao 0001. 2785-2789 [doi]

Evolving Quantized Neural Networks for Image Classification Using A Multi-Objective Genetic AlgorithmYong Wang, Xiaojing Wang, Xiaoyu He. 2790-2794 [doi]

Spectral Domain Convolutional Neural NetworkBochen Guan, Jinnian Zhang, William A. Sethares, Richard Kijowski, Fang Liu 0005. 2795-2799 [doi]

Parametric Spectral Filters for Fast Converging, Scalable Convolutional Neural NetworksLuke Wood, Eric C. Larson. 2800-2804 [doi]

Feature Reuse for a Randomization Based Neural NetworkXinyue Liang, Mikael Skoglund, Saikat Chatterjee. 2805-2809 [doi]

A ReLU Dense Layer to Improve the Performance of Neural NetworksAlireza M. Javid, Sandipan Das, Mikael Skoglund, Saikat Chatterjee. 2810-2814 [doi]

Nested Learning for Multi-Level ClassificationRaphaël Achddou, J. Matías Di Martino, Guillermo Sapiro. 2815-2819 [doi]

Cross-Modal Representation Reconstruction for Zero-Shot ClassificationYu Wang, Shenjie Zhao. 2820-2824 [doi]

HIGCNN: Hierarchical Interleaved Group Convolutional Neural Networks for Point Clouds AnalysisJisheng Dang, Jun Yang. 2825-2829 [doi]

AutoKWS: Keyword Spotting with Differentiable Architecture SearchBo Zhang, Wenfeng Li, Qingyuan Li, Weiji Zhuang, Xiangxiang Chu, Yujun Wang. 2830-2834 [doi]

Embedding Semantic Hierarchy in Discrete Optimal Transport for Risk MinimizationYubin Ge, Site Li, Xuyang Li, Fangfang Fan, Wanqing Xie, Jane You, Xiaofeng Liu. 2835-2839 [doi]

Identifying Spammers to Boost Crowdsourced ClassificationPanagiotis A. Traganitis, Georgios B. Giannakis. 2840-2844 [doi]

A Rank-Constrained Clustering Algorithm with Adaptive EmbeddingShenfei Pei, Feiping Nie 0001, Rong Wang 0001, Xuelong Li. 2845-2849 [doi]

Towards Efficient Age Estimation by Embedding Potential Gender FeaturesYulan Deng, Lunke Fei, Shaohua Teng, Wei Zhang 0005, Dongning Liu, Yan Hou. 2850-2854 [doi]

Adversarial Attacks on Coarse-to-Fine ClassifiersIsmail R. Alkhouri, George K. Atia. 2855-2859 [doi]

GDTW: A Novel Differentiable DTW Loss for Time Series TasksXiang Liu, Naiqi Li, Shu-Tao Xia. 2860-2864 [doi]

Hierarchical Recurrent Neural Network for Handwritten Strokes ClassificationIllya Degtyarenko, Ivan Deriuga, Andrii Grygoriev, Serhii Polotskyi, Volodymyr Melnyk, Dmytro Zakharchuk, Olga Radyvonenko. 2865-2869 [doi]

Robust Domain-Free Domain Generalization with Class-Aware AlignmentWenyu Zhang, Mohamed Ragab 0002, Ramón Sagarna. 2870-2874 [doi]

One-Bit Compressed Sensing Using Untrained Network PriorSwatantra Kafle, Geethu Joseph, Pramod K. Varshney. 2875-2879 [doi]

Deep Unfolding Network for Block-Sparse Signal RecoveryRong Fu, Vincent Monardo, Tianyao Huang, Yimin Liu. 2880-2884 [doi]

REST: Robust lEarned Shrinkage-Thresholding Network Taming Inverse Problems with Model MismatchWei Pu, Chao Zhou, Yonina C. Eldar, Miguel R. D. Rodrigues. 2885-2889 [doi]

Unfolding Neural Networks for Compressive Multichannel Blind DeconvolutionBahareh Tolooshams, Satish Mulleti, Demba E. Ba, Yonina C. Eldar. 2890-2894 [doi]

Sparsity Driven Latent Space Sampling for Generative Prior Based Compressive SensingVinayak Killedar, Praveen Kumar Pokala, Chandra Sekhar Seelamantula. 2895-2899 [doi]

A Sparse Coding Approach to Automatic Diet Monitoring with Continuous Glucose MonitorsAnurag Das, Seyedhooman Sajjadi, Bobak Mortazavi, Theodora Chaspari, Projna Paromita, Laura Ruebush, Nicolaas E. P. Deutz, Ricardo Gutierrez-Osuna. 2900-2904 [doi]

Speeding Up of Kernel-Based Learning for High-Order TensorsOuafae Karmouda, Jérémie Boulanger, Rémy Boyer. 2905-2909 [doi]

A Fast Randomized Adaptive CP Decomposition For Streaming TensorsLe Trung Thanh, Karim Abed-Meraim, Nguyen Link Trung, Adel Hafiane. 2910-2914 [doi]

Rank-Revealing Block-Term Decomposition for Tensor CompletionAthanasios A. Rontogiannis, Paris V. Giampouras, Eleftherios Kofidis. 2915-2919 [doi]

Kernel Learning with Tensor NetworksKriton Konstantinidis, Shengxi Li, Danilo P. Mandic. 2920-2924 [doi]

Fiber-Sampled Stochastic Mirror Descent for Tensor Decomposition with β-DivergenceWenqiang Pu, Shahana Ibrahim, Xiao Fu 0001, Mingyi Hong. 2925-2929 [doi]

Regularized Recovery by Multi-Order Partial Hypergraph Total VariationRuyuan Qu, Jiaqi He, Hui Feng 0001, Chongbin Xu, Bo Hu. 2930-2934 [doi]

Learning Discriminative Features for Semi-Supervised Anomaly DetectionZhe Feng, Jie Tang 0006, Yishun Dou, Gangshan Wu. 2935-2939 [doi]

RGLN: Robust Residual Graph Learning Networks via Similarity-Preserving Mapping on GraphsJiaxiang Tang, Xiang Gao, Wei Hu. 2940-2944 [doi]

Sequence-Level Self-Teaching RegularizationEric Sun, Liang Lu, Zhong Meng, Yifan Gong 0001. 2945-2949 [doi]

Wearing A Mask: Compressed Representations of Variable-Length Sequences Using Recurrent Neural Tangent KernelsSina Alemohammad, Hossein Babaei, Randall Balestriero, Matt Y. Cheung, Ahmed Imtiaz Humayun, Daniel LeJeune, Naiming Liu, Lorenzo Luzi, Jasper Tan, Zichao Wang 0001, Richard G. Baraniuk. 2950-2954 [doi]

H-GPR: A Hybrid Strategy for Large-Scale Gaussian Process RegressionNaiqi Li, Yinghua Gao, Wenjie Li, Yong Jiang, Shu-Tao Xia. 2955-2959 [doi]

Learning Optimal Lattice Codes for MIMO CommunicationsLaia Amorós, Mikko Pitkänen. 2960-2964 [doi]

A Bayesian Interpretation of the Light Gated Recurrent UnitAlexandre Bittar, Philip N. Garner. 2965-2969 [doi]

A Large-Dimensional Analysis of Symmetric SNECharles Séjourné, Romain Couillet, Pierre Comon. 2970-2974 [doi]

A Dynamical Systems Perspective on Online Bayesian Nonparametric Estimators with Adaptive HyperparametersAlec Koppel, Amrit S. Bedi, Vikram Krishnamurthy. 2975-2979 [doi]

Online Multi-Hop Information Based Kernel Learning Over GraphsZixiao Zong, Yanning Shen. 2980-2984 [doi]

Sparsity in Max-Plus Algebra and Applications in Multivariate Convex RegressionNikos Tsilivis, Anastasios Tsiamis, Petros Maragos. 2985-2989 [doi]

Complex-Valued Vs. Real-Valued Neural Networks for Classification Perspectives: An Example on Non-Circular DataJose Agustin Barrachina, C. Ren, Christèle Morisseau, Gilles Vieillard, Jean Philippe Ovarlez. 2990-2994 [doi]

High-Frequency Adversarial Defense for Speech and AudioR. Olivier, B. Raj, M. Shah. 2995-2999 [doi]

Learning Separable Time-Frequency Filterbanks for Audio ClassificationJie Pu, Yannis Panagakis, Maja Pantic. 3000-3004 [doi]

Upsampling Artifacts in Neural Audio SynthesisJordi Pons, Santiago Pascual, Giulio Cengarle, Joan Serrà. 3005-3009 [doi]

Deep Convolutional and Recurrent Networks for Polyphonic Instrument Classification from Monophonic Raw Audio WaveformsKleanthis Avramidis, Agelos Kratimenos, Christos Garoufis, Athanasia Zlatintsi, Petros Maragos. 3010-3014 [doi]

Learning Audio Embeddings with User Listening Data for Content-Based Music RecommendationKe Chen 0021, Beici Liang, Xiaoshuan Ma, Minwei Gu. 3015-3019 [doi]

Efficient Speech Emotion Recognition Using Multi-Scale CNN and AttentionZixuan Peng, Yu Lu, Shengfeng Pan, Yunfeng Liu. 3020-3024 [doi]

Neural Audio Fingerprint for High-Specific Audio Retrieval Based on Contrastive LearningSungkyun Chang, Donmoon Lee, Jeongsoo Park 0001, Hyungui Lim, Kyogu Lee, Karam Ko, Yoonchang Han. 3025-3029 [doi]

Self-Training and Pre-Training are Complementary for Speech RecognitionQiantong Xu, Alexei Baevski, Tatiana Likhomanenko, Paden Tomasello, Alexis Conneau, Ronan Collobert, Gabriel Synnaeve, Michael Auli. 3030-3034 [doi]

Unsupervised Discriminative Learning of Sounds for Audio Event ClassificationSascha Hornauer, Ke Li, Stella X. Yu, Shabnam Ghaffarzadegan, Liu Ren. 3035-3039 [doi]

Similarity Analysis of Self-Supervised Speech RepresentationsYu-An Chung, Yonatan Belinkov, James R. Glass. 3040-3044 [doi]

Joint Masked CPC And CTC Training For ASRChaitanya Talnikar, Tatiana Likhomanenko, Ronan Collobert, Gabriel Synnaeve. 3045-3049 [doi]

A Comparison of Discrete Latent Variable Models for Speech Representation LearningHenry Zhou, Alexei Baevski, Michael Auli. 3050-3054 [doi]

Federated Learning from Big Data Over NetworksYasmin SarcheshmehPour, M. Leinonen, Alexander Jung. 3055-3059 [doi]

Efficient Client Contribution Evaluation for Horizontal Federated LearningJie Zhao, Xinghua Zhu, Jianzong Wang, Jing Xiao. 3060-3064 [doi]

A Quantitative Metric for Privacy Leakage in Federated LearningYong Liu, Xinghua Zhu, Jianzong Wang, Jing Xiao. 3065-3069 [doi]

DP-SIGNSGD: When Efficiency Meets Privacy and RobustnessLingjuan Lyu. 3070-3074 [doi]

Federated Algorithm with Bayesian Approach: Omni-FedgeSai Anuroop Kesanapalli, B. N. Bharath. 3075-3079 [doi]

Training Speech Recognition Models with Federated Learning: A Quality/Cost FrameworkDhruv Guliani, Françoise Beaufays, Giovanni Motta. 3080-3084 [doi]

Cross-Silo Federated Training in the Cloud with Diversity Scaling and Semi-Supervised LearningKishore Nandury, Anand Mohan, Frederick Weber. 3085-3089 [doi]

Gradual Federated Learning Using Simulated AnnealingLuong Trung Nguyen, Byonghyo Shim. 3090-3094 [doi]

Optimal Importance Sampling for Federated LearningElsa Rizk, Stefan Vlaski, Ali H. Sayed. 3095-3099 [doi]

Multi-Tier Federated Learning for Vertically Partitioned DataAnirban Das, Stacy Patterson. 3100-3104 [doi]

Energy Minimization for Federated Learning with IRS-Assisted Over-the-Air ComputationYuntao Hu, Ming Chen 0001, Mingzhe Chen, Zhaohui Yang 0001, Mohammad Shikh-Bahaei, H. Vincent Poor, Shuguang Cui. 3105-3109 [doi]

Adaptive Quantization of Model Updates for Communication-Efficient Federated LearningDivyansh Jhunjhunwala, Advait Gadhikar, Gauri Joshi, Yonina C. Eldar. 3110-3114 [doi]

HebbNet: A Simplified Hebbian Learning Framework to do Biologically Plausible LearningManas Gupta, ArulMurugan Ambikapathi, Savitha Ramasamy. 3115-3119 [doi]

t-k-means: A ROBUST AND STABLE k-means VARIANTYiming Li, Yang Zhang, Qingtao Tang, Weipeng Huang, Yong Jiang, Shu-Tao Xia. 3120-3124 [doi]

Adaptive Feature Weight Learning For Robust Clustering Problem with Sparse ConstraintFeiping Nie 0001, Wei Chang, Xuelong Li, Jin Xu, Gongfu Li. 3125-3129 [doi]

Assisted Learning: Cooperative AI with AutonomyJiaying Zhou, Xun Xian, Na Li, Jie Ding 0002. 3130-3134 [doi]

Geom-Spider-EM: Faster Variance Reduced Stochastic Expectation Maximization for Nonconvex Finite-Sum OptimizationGersende Fort, Eric Moulines, Hoi-To Wai. 3135-3139 [doi]

Learning a Tree of Neural NetsArman Zharmagambetov, Miguel Á. Carreira-Perpiñán. 3140-3144 [doi]

Corrupted Contextual Bandits: Online Learning with Corrupted ContextDjallel Bouneffouf 0001. 3145-3149 [doi]

Training a Bank of Wiener Models with a Novel Quadratic Mutual Information Cost FunctionBo Hu, José C. Príncipe. 3150-3154 [doi]

Information and Regularization in Restricted Boltzmann MachinesMatías Vera, Leonardo Rey Vega, Pablo Piantanida. 3155-3159 [doi]

Deep Deterministic Information Bottleneck with Matrix-Based Entropy FunctionalXi Yu, Shujian Yu, José C. Príncipe. 3160-3164 [doi]

Transitive Transfer Sparse Coding for Distant DomainLingtian Feng, Feng Qian, Xin He, Yuqi Fan, Hanpeng Cai, Guangmin Hu. 3165-3169 [doi]

Fast Local Representation Learning with Adaptive Anchor GraphCanyu Zhang, Feiping Nie 0001, Zheng Wang, Rong Wang 0001, Xuelong Li. 3170-3174 [doi]

Learning On Heterogeneous Graphs Using High-Order RelationsSee Hian Lee, Feng Ji, Wee-Peng Tay. 3175-3179 [doi]

Incomplete Multi-View Subspace Clustering with Low-Rank TensorJianlun Liu, Shaohua Teng, Wei Zhang, Xiaozhao Fang, Lunke Fei, Zhuxiu Zhang. 3180-3184 [doi]

Channel-Wise Mix-Fusion Deep Neural Networks for Zero-Shot LearningGuowei Wang, Naiyang Guan, Hanjia Ye, Xiaodong Yi 0002, Hang Cheng, JunJie Zhu. 3185-3189 [doi]

Online Unsupervised Learning Using Ensemble Gaussian Processes with Random FeaturesGeorgios Vasileios Karanikolas, Qin Lu 0002, Georgios B. Giannakis. 3190-3194 [doi]

Dimension Selected Subspace ClusteringShuoyang Li, Yuhui Luo, Jonathon A. Chambers, Wenwu Wang. 3195-3199 [doi]

Deep Ensemble Siamese Network For Incremental Signal ClassificationChen Yang 0020, Shuyuan Yang. 3200-3204 [doi]

Non-Recursive Graph Convolutional NetworksHao Chen, Zengde Deng, Yue Xu, Zhoujun Li. 3205-3209 [doi]

Ego-Based Entropy Measures for Structural Representations on GraphsGeorge Dasoulas, Giannis Nikolentzos, Kevin Scaman, Aladin Virmaux, Michalis Vazirgiannis. 3210-3214 [doi]

Symmetric Sub-graph Spatio-Temporal Graph Convolution and its application in Complex Activity RecognitionPratyusha Das, Antonio Ortega. 3215-3219 [doi]

Progressive Spatio-Temporal Graph Convolutional Network for Skeleton-Based Human Action RecognitionNegar Heidari, Alexandros Iosifidis. 3220-3224 [doi]

Sparse-Coded Dynamic Mode Decomposition on Graph for Prediction of River Water Level DistributionYusuke Arai, Shogo Muramatsu, Hiroyasu Yasuda, Kiyoshi Hayasaka, Yu Otake. 3225-3229 [doi]

Graph Frequency Analysis of COVID-19 Incidence to Identify County-Level Contagion Patterns in the United StatesYang Li, Gonzalo Mateos. 3230-3234 [doi]

Generalized Polytopic Matrix FactorizationGokcan Tatli, Alper T. Erdogan. 3235-3239 [doi]

Exact Linear Convergence Rate Analysis for Low-Rank Symmetric Matrix Completion via Gradient DescentTrung Vu, Raviv Raich. 3240-3244 [doi]

Structured Support Exploration for Multilayer Sparse Matrix FactorizationQuoc-Tung Le, Rémi Gribonval. 3245-3249 [doi]

Optimal Selection of Matrix Shape and Decomposition Scheme for Neural Network CompressionYerlan Idelbayev, Miguel Á. Carreira-Perpiñán. 3250-3254 [doi]

Sparse Graph Based Sketching for Fast Numerical Linear AlgebraDong Hu, Shashanka Ubaru, Alex Gittens, Kenneth L. Clarkson, Lior Horesh, Vassilis Kalantzis. 3255-3259 [doi]

Cold Start Revisited: A Deep Hybrid Recommender with Cold-Warm Item HarmonizationOren Barkan, Roy Hirsch, Ori Katz, Avi Caciularu, Yoni Weill, Noam Koenigstein. 3260-3264 [doi]

On a Guided Nonnegative Matrix FactorizationJoshua Vendrow, Jamie Haddock, Elizaveta Rebrova, Deanna Needell. 3265-32369 [doi]

Nonnegative Unimodal Matrix FactorizationAndersen Man Shun Ang, Nicolas Gillis, Arnaud Vandaele, Hans De Sterck. 3270-3274 [doi]

Kernel Orthogonal Nonnegative Matrix Factorization: Application to Multispectral Document Image DecompositionAbderrahmane Rahiche, Mohamed Cheriet. 3275-3279 [doi]

Random Projection Streams for (Weighted) Nonnegative Matrix FactorizationFarouk Yahaya, Matthieu Puigt, Gilles Delmaire, Gilles Roussel 0001. 3280-3284 [doi]

Multivariate Non-Negative Matrix Factorization with Application to Energy DisaggregationPascal A. Schirmer, Iosif Mporas. 3285-3289 [doi]

Continuous-Time Self-Attention in Neural Differential EquationJen-Tzung Chien, Yi-Hsiang Chen. 3290-3294 [doi]

Blind Deinterleaving of Signals in Time Series with Self-Attention Based Soft Min-Cost Flow LearningOgul Can, Yeti Ziya Gürbüz, Berkin Yildirim, A. Aydin Alatan. 3295-3299 [doi]

Attention on Attention Sparse Dense Convolutional Network for Financial Signal ProcessingTianlei Zhu, Jiawei Li 0006, Xinji Liu, Yong Jiang, Shu-Tao Xia. 3300-3304 [doi]

Stock Movement Prediction and Portfolio Management via Multimodal Learning with TransformerDivyanshu Daiya, Che Lin. 3305-3309 [doi]

A Quaternion-Valued Variational AutoencoderEleonora Grassucci, Danilo Comminiello, Aurelio Uncini. 3310-3314 [doi]

Learning a Sparse Generative Non-Parametric Supervised AutoencoderMichel Barlaud, Frédéric Guyard. 3315-3319 [doi]

DAG-GAN: Causal Structure Learning with Generative Adversarial NetsYinghua Gao, Li Shen, Shu-Tao Xia. 3320-3324 [doi]

Relaxed Wasserstein with Applications to GANsXin Guo, Johnny Hong, Tianyi Lin, Nan Yang. 3325-3329 [doi]

Environment-Independent Wi-Fi Human Activity Recognition with Adversarial NetworkZhengyang Wang, Sheng Chen, Wei Yang, Yang Xu. 3330-3334 [doi]

A Robust to Noise Adversarial Recurrent Model for Non-Intrusive Load MonitoringMaria Kaselimi, Athanasios Voulodimos, Nikolaos Doulamis, Anastasios Doulamis, Eftychios Protopapadakis. 3335-3339 [doi]

Enhancing Data-Free Adversarial Distillation with Activation Regularization and Virtual InterpolationXiaoyang Qu, Jianzong Wang, Jing Xiao. 3340-3344 [doi]

Sequential Adversarial Anomaly Detection with Deep Fourier KernelShixiang Zhu, Henry Shaowu Yuchi, Minghe Zhang, Yao Xie 0002. 3345-3349 [doi]

Incorporate Maximum Mean Discrepancy in Recurrent Latent Space for Sequential Generative ModelYuchi Zhang, Yongliang Wang, Yang Dong. 3350-3354 [doi]

FMA-ETA: Estimating Travel Time Entirely Based on FFN with AttentionYiwen Sun, Yulu Wang, Kun Fu, Zheng Wang 0010, Ziang Yan, Changshui Zhang, Jieping Ye. 3355-3359 [doi]

A Unified Approach to Translate Classical Bandit Algorithms to Structured BanditsSamarth Gupta, Shreyas Chaudhari, Subhojyoti Mukherjee, Gauri Joshi, Osman Yagan. 3360-3364 [doi]

Near-Optimal Algorithms for Piecewise-Stationary Cascading BanditsLingda Wang, Huozhi Zhou, Bingcong Li, Lav R. Varshney, Zhizhen Zhao. 3365-3369 [doi]

Optimum Feature Ordering for Dynamic Instance-Wise Joint Feature Selection and ClassificationYasitha Warahena Liyanage, Daphney-Stavroula Zois. 3370-3374 [doi]

POLA: Online Time Series Prediction by Adaptive Learning RatesWenyu Zhang. 3375-3379 [doi]

Singer Identification Using Deep Timbre Feature Learning with KNN-NETXulong Zhang, Jiale Qian, Yi Yu, Yifu Sun, Wei Li. 3380-3384 [doi]

Implicit HRTF Modeling Using Temporal Convolutional NetworksIsrael D. Gebru, Dejan Markovic, Alexander Richard, Steven Krenn, Gladstone Alexander Butler, Fernando De la Torre, Yaser Sheikh. 3385-3389 [doi]

Improving the Classification of Rare Chords With Unlabeled DataMarcelo Bortolozzo, Rodrigo Schramm, Cláudio R. Jung. 3390-3394 [doi]

Loopnet: Musical Loop Synthesis Conditioned on Intuitive Musical ParametersPritish Chandna, António Ramires, Xavier Serra, Emilia Gómez. 3395-3399 [doi]

Micaugment: One-Shot Microphone Style TransferZalán Borsos, Yunpeng Li, Beat Gfeller, Marco Tagliasacchi. 3400-3404 [doi]

Wasserstein Barycenter Transport for Acoustic AdaptationEduardo Fernandes Montesuma, Fred Maurice Ngolè Mboula. 3405-3409 [doi]

Efficient Adversarial Audio Synthesis VIA Progressive UpsamplingYoungwoo Cho, Minwook Chang, Sanghyeon Lee, Hyoungwoo Lee, Gerard Jounghyun Kim, Jaegul Choo. 3410-3414 [doi]

Multi-Channel Speech Enhancement Using Graph Neural NetworksPanagiotis Tzirakis, Anurag Kumar, Jacob Donley. 3415-3419 [doi]

Multi-Decoder Dprnn: Source Separation for Variable Number of SpeakersJunzhe Zhu, Raymond A. Yeh, Mark Hasegawa-Johnson. 3420-3424 [doi]

Data-Efficient Framework for Real-World Multiple Sound Source 2d LocalizationGuillaume Le Moing, Phongtharin Vinayavekhin, Don Joven Agravante, Tadanobu Inoue, Jayakorn Vongkulbhisal, Asim Munawar, Ryuki Tachibana. 3425-3429 [doi]

Fusing Information Streams in End-to-End Audio-Visual Speech RecognitionWentao Yu, Steffen Zeiler, Dorothea Kolossa. 3430-3434 [doi]

Cooperative Scenarios for Multi-Agent Reinforcement Learning in Wireless Edge CachingNavneet Garg, Tharmalingam Ratnarajah. 3435-3439 [doi]

Robust Deep Reinforcement Learning for Underwater Navigation with Unknown DisturbancesJuan Parras, Santiago Zazo. 3440-3444 [doi]

Online Hyper-Parameter Tuning for the Contextual BanditDjallel Bouneffouf 0001, Emmanuelle Claeys. 3445-3449 [doi]

Double-Linear Thompson Sampling for Context-Attentive BanditsDjallel Bouneffouf 0001, Raphaël Féraud, Sohini Upadhyay, Yasaman Khazaeni, Irina Rish. 3450-3454 [doi]

On the Marginal Benefit of Active Learning: Does Self-Supervision Eat its Cake?Yao-Chun Chan, Mingchen Li, Samet Oymak. 3455-3459 [doi]

Robust Maml: Prioritization Task Buffer with Adaptive Learning Process for Model-Agnostic Meta-LearningThanh Nguyen, Tung M. Luu, Trung X. Pham, Sanzhar Rakhimkul, Chang D. Yoo. 3460-3464 [doi]

Introducing Deep Reinforcement Learning to Nlu Ranking TasksGe Yu, Emre Barut, Chengwei Su. 3465-3469 [doi]

Temporal Link Prediction Via Reinforcement LearningYe Tao, Ying Li, Zhonghai Wu. 3470-3474 [doi]

A Deep Reinforcement Learning Approach To Audio-Based Navigation In A Multi-Speaker EnvironmentPetros Giannakopoulos, Aggelos Pikrakis, Yannis Cotronis. 3475-3479 [doi]

Global-Localized Agent Graph Convolution for Multi-Agent Reinforcement LearningYuntao Liu, Yong Dou, Siqi Shen, Peng Qiao. 3480-3484 [doi]

Gaussian Process Temporal-Difference Learning with Scalability and Worst-Case Performance GuaranteesQin Lu 0002, Georgios B. Giannakis. 3485-3489 [doi]

Self-Inference Of Others' Policies For Homogeneous Agents In Cooperative Multi-Agent Reinforcement LearningQifeng Lin, Qing Ling. 3490-3494 [doi]

Semi-Supervised Batch Active Learning Via Bilevel OptimizationZalán Borsos, Marco Tagliasacchi, Andreas Krause 0001. 3495-3499 [doi]

Kernearl-Based Lifelong Policy Gradient Reinforcement LearningRami Mowakeaa, Seung-Jun Kim, Darren K. Emge. 3500-3504 [doi]

Policy Augmentation: An Exploration Strategy For Faster Convergence of Deep Reinforcement Learning AlgorithmsArash Mahyari. 3505-3509 [doi]

Graphcomm: A Graph Neural Network Based Method for Multi-Agent Reinforcement LearningSiqi Shen, Yongquan Fu, Huayou Su, Hengyue Pan, Peng Qiao, Yong Dou, Cheng Wang. 3510-3514 [doi]

In Situ Calibration of Cross-Sensitive Sensors in Mobile Sensor Arrays Using Fast Informed Non-Negative Matrix FactorizationOlivier Vu-Thanh, Matthieu Puigt, Farouk Yahaya, Gilles Delmaire, Gilles Roussel 0002. 3515-3519 [doi]

Multiphish: Multi-Modal Features Fusion Networks for Phishing DetectionLei Zhang, Peng Zhang, Luchen Liu, Jianlong Tan. 3520-3524 [doi]

Failure Prediction by Confidence Estimation of Uncertainty-Aware Dirichlet NetworksTheodoros Tsiligkaridis. 3525-3529 [doi]

Two-Stage Framework for Seasonal Time Series ForecastingQingyang Xu, Qingsong Wen, Liang Sun 0001. 3530-3534 [doi]

Recursive Input and State Estimation: a General Framework for Learning from Time Series With Missing DataAlberto García-Durán, Robert West 0001. 3535-3539 [doi]

On the Performance-Complexity Tradeoff in Stochastic Greedy Weak Submodular OptimizationAbolfazl Hashemi, Haris Vikalo, Gustavo de Veciana. 3540-3544 [doi]

Semi-Supervised Time Series Classification by Temporal Relation PredictionHaoyi Fan, Fengbin Zhang, Ruidong Wang, Xunhua Huang, Zuoyong Li. 3545-3549 [doi]

Continuous Cnn For Nonuniform Time SeriesHui Shi, Yang Zhang, Hao Wu, Shiyu Chang, Kaizhi Qian, Mark Hasegawa-Johnson, Jishen Zhao. 3550-3554 [doi]

2net: Blended Representation Space by Transformation of Residual Mapping with Restrained Learning for Time Series ClassificationArijit Ukil, Antonio J. Jara, Leandro Marín. 3555-3559 [doi]

Spatiotemporal Attention for Multivariate Time Series Prediction and InterpretationTryambak Gangopadhyay, Sin Yong Tan, Zhanhong Jiang, Rui Meng, Soumik Sarkar. 3560-3564 [doi]

Tabular Transformers for Modeling Multivariate Time SeriesInkit Padhi, Yair Schiff, Igor Melnyk, Mattia Rigotti, Youssef Mroueh, Pierre L. Dognin, Jerret Ross, Ravi Nair, Erik Altman. 3565-3569 [doi]

Real-Time Synchronization in Neural Networks for Multivariate Time Series Anomaly DetectionAhmed Abdulaal, Tomer Lancewicki. 3570-3574 [doi]

Fast Graph Kernel with Optical Random FeaturesHashem Ghanem, Nicolas Keriven, Nicolas Tremblay. 3575-3579 [doi]

Fast Hierarchy Preserving Graph Embedding via Subspace ConstraintsXu Chen, Lun Du, Mengyuan Chen, Yun Wang, Qingqing Long, Kunqing Xie. 3580-3584 [doi]

Graph Embedding using Multi-Layer Adjacent Point Merging ModelJianming Huang, Hiroyuki Kasai. 3585-3589 [doi]

Node Attribute Completion in Knowledge Graphs with Multi-Relational PropagationEda Bayram, Alberto García-Durán, Robert West 0001. 3590-3594 [doi]

UserReg: A Simple but Strong Model for Rating PredictionHaiyang Zhang, Ivan Ganchev, Nikola S. Nikolov, Mark Stevenson. 3595-3599 [doi]

Toward Skills Dialog Orchestration with Online LearningDjallel Bouneffouf 0001, Raphaël Féraud, Sohini Upadhyay, Mayank Agarwal, Yasaman Khazaeni, Irina Rish. 3600-3604 [doi]

Adaptive Re-Balancing Network with Gate Mechanism for Long-Tailed Visual Question AnsweringHongyu Chen, Ruifang Liu, Han Fang, Ximing Zhang. 3605-3609 [doi]

Co-Capsule Networks Based Knowledge Transfer for Cross-Domain RecommendationHuiyuan Li, Li Yu 0002, Youfang Leng, Qihan Du. 3610-3614 [doi]

Modurec: Recommender Systems with Feature and Time ModulationJavier Maroto, Clément Vignac, Pascal Frossard. 3615-3619 [doi]

Sig2Sig: Signal Translation Networks to Take the Remains of the PastSangyeon Kim, HyunWoo Lee, Jonghee Han, Joon Ho Kim. 3620-3624 [doi]

Solving a Class of Non-Convex Min-Max Games Using Adaptive Momentum MethodsBabak Barazandeh, Davoud Ataee Tarzanagh, George Michailidis. 3625-3629 [doi]

Minimizing Weighted Concave Impurity Partition Under ConstraintsThuan Nguyen, Thinh Nguyen. 3630-3634 [doi]

Constant Approximation Algorithm for Minimizing Concave ImpurityThuan Nguyen, Hoang Le, Thinh Nguyen. 3635-3639 [doi]

Fusing Multitask Models by Recursive Least SquaresXiaobin Li 0006, Lianlei Shan, Weiqiang Wang. 3640-3644 [doi]

Centrality Based Number of Cluster Estimation in Graph ClusteringMahdi Shamsi, Soosan Beheshti. 3645-3649 [doi]

Dependence-Guided Multi-View ClusteringXia Dong, Danyang Wu, Feiping Nie 0001, Rong Wang 0001, Xuelong Li. 3650-3654 [doi]

Improved Step-Size Schedules for Noisy Gradient MethodsSarit Khirirat, Xiaoyu Wang, Sindri Magnússon, Mikael Johansson 0001. 3655-3659 [doi]

Respipe: Resilient Model-Distributed DNN Training at Edge NetworksPengzhen Li, Erdem Koyuncu, Hulya Seferoglu. 3660-3664 [doi]

An Optimal Stochastic Compositional Optimization Method with Applications to Meta LearningYuejiao Sun, Tianyi Chen, Wotao Yin. 3665-3669 [doi]

Decentralized Optimization on Time-Varying Directed Graphs Under Communication ConstraintsYiyue Chen, Abolfazl Hashemi, Haris Vikalo. 3670-3674 [doi]

Decentralized Deep Learning Using Momentum-Accelerated ConsensusAditya Balu, Zhanhong Jiang, Sin Yong Tan, Chinmay Hegde, Young M. Lee, Soumik Sarkar. 3675-3679 [doi]

Demystifying Model Averaging for Communication-Efficient Federated Matrix FactorizationShuai Wang, Richard Cornelius Suwandi, Tsung-Hui Chang. 3680-3684 [doi]

Sample Efficient Subspace-Based Representations for Nonlinear Meta-LearningHalil Ibrahim Gulluk, Yue Sun, Samet Oymak, Maryam Fazel. 3685-3689 [doi]

Multi-Task Learning Via Sharing Inexact Low-Rank SubspaceXiaoqian Wang, Feiping Nie 0001. 3690-3694 [doi]

On The Adversarial Robustness of Principal Component AnalysisYing Li, Fuwei Li, Lifeng Lai, Jun Wu. 3695-3699 [doi]

Fast Manifold Landmarking Using Extreme Eigen-PairsFen Wang, Gene Cheung, Yongchao Wang, Wai-tian Tan. 3700-3704 [doi]

Affine Projection Subspace TrackingMarc Vila, Carlos Alejandro López, Jaume Riba. 3705-3709 [doi]

A Hierarchical Subspace Model for Language-Attuned Acoustic Unit DiscoveryBolaji Yusuf, Lucas Ondel, Lukás Burget, Jan Cernocký, Murat Saraçlar. 3710-3714 [doi]

Independent Vector Analysis Using Semi-Parametric Density Estimation via Multivariate Entropy MaximizationLucas P. Damasceno, Charles C. Cavalcante, Tülay Adali, Zois Boukouvalas. 3715-3719 [doi]

ICA with Orthogonality Constraint: Identifiability And A New Efficient AlgorithmBen Gabrielson, Mohammad A. B. S. Akhonda, Zois Boukouvalas, Seung-Jun Kim, Tülay Adali. 3720-3724 [doi]

Blind Extraction of Moving Sources via Independent Component and Vector Analysis: ExamplesN. Amor, Jaroslav Cmejla, Véclav Kautský, Zbynek Koldovský, Tomás Kounovský. 3725-3729 [doi]

Single Channel Voice Separation for Unknown Number of Speakers Under Reverberant and Noisy SettingsShlomo E. Chazan, Lior Wolf, Eliya Nachmani, Yossi Adi. 3730-3734 [doi]

Unsupervised Musical Timbre Transfer for Notification SoundsJing Yang 0022, Tristan Cinquin, Gábor Sörös. 3735-3739 [doi]

Visual Privacy Protection via Mapping DistortionYiming Li, Peidong Liu, Yong Jiang, Shu-Tao Xia. 3740-3744 [doi]

L-Red: Efficient Post-Training Detection of Imperceptible Backdoor Attacks Without Access to the Training SetZhen Xiang, David J. Miller 0001, George Kesidis. 3745-3749 [doi]

Multi-View Contrastive Learning for Online Knowledge DistillationChuanguang Yang, Zhulin An, Yongjun Xu. 3750-3754 [doi]

Dynamic Texture Recognition via Nuclear Distances on Kernelized Scattering Histogram SpacesAlexander Sagel, Julian Wörmann, Hao Shen. 3755-3759 [doi]

Clustering A Collection of Networks With Mixtures of L1-Sparse Graphical ModelsZuogong Yue, Victor Solo. 3760-3764 [doi]

Taking A Closer Look at Synthesis: Fine-Grained Attribute Analysis for Person Re-IdentificationSuncheng Xiang, Yuzhuo Fu, Guanjie You, Ting Liu. 3765-3769 [doi]

Unified Clustering and Outlier Detection on Specialized HardwareEldan Cohen, Hayato Ushijima-Mwesigwa, Avradip Mandal, Arnab Roy 0001. 3770-3774 [doi]

Class-Imbalanced Classifiers Using Ensembles of Gaussian Processes And Gaussian Process Latent Variable ModelsLiu Yang, Cassandra Heiselman, J. Gerald Quirk, Petar M. Djuric. 3775-3779 [doi]

Improving Deep Learning Sound Events Classifiers Using Gram Matrix Feature-Wise CorrelationsAntonio Joia Neto, André G. C. Pacheco, Diogo Carbonera Luvizon. 3780-3784 [doi]

Adversarially Robust Classification Based on GLRTBhagyashree Puranik, Upamanyu Madhow, Ramtin Pedarsani. 3785-3789 [doi]

Cross-Corpus Speech Emotion Recognition Using Joint Distribution Adaptive RegressionJiacheng Zhang, Lin Jiang, Yuan Zong, Wenming Zheng, Li Zhao 0003. 3790-3794 [doi]

Meta-Cognition-Based Simple And Effective Approach To Object DetectionSannidhi P. Kumar, Chandan Gautam, Suresh Sundaram. 3795-3799 [doi]

Graphnet: Graph Clustering with Deep Neural NetworksXianchao Zhang, Jie Mu, Han Liu 0008, Xiaotong Zhang 0003. 3800-3804 [doi]

Attention Enhanced Spatial Temporal Neural Network For HRRP RecognitionYuchen Chu, Zunhua Guo. 3805-3809 [doi]

DHCN: Deep Hierarchical Context Networks For Image AnnotationMingyuan Jiu, Hichem Sahbi. 3810-3814 [doi]

Online Classification of Dynamic Multilayer-Network Time Series in Riemannian ManifoldsCong Ye, Konstantinos Slavakis, Johan Nakuci, Sarah Feldt Muldoon, John D. Medaglia. 3815-3819 [doi]

On The Power of Deep But Naive Partial Label LearningJunghoon Seo, Joon Suk Huh. 3820-3824 [doi]

Advances in Morphological Neural Networks: Training, Pruning and Enforcing Shape ConstraintsNikolaos Dimitriadis, Petros Maragos. 3825-3829 [doi]

Adversarial Learning via Probabilistic Proximity AnalysisJarrod Hollis, Jinsub Kim, Raviv Raich. 3830-3834 [doi]

Class Aware Robust TrainingZhikang Xia, Bin Chen 0011, Tao Dai, Shu-Tao Xia. 3835-3839 [doi]

Non-Singular Adversarial Robustness of Neural NetworksYu-Lin Tsai, Chia-Yi Hsu, Chia-Mu Yu, Pin-Yu Chen. 3840-3844 [doi]

Towards Adversarial Robustness Via Compact Feature RepresentationsMuhammad A. Shah, Raphael Olivier, Bhiksha Raj. 3845-3849 [doi]

Adversarial Examples Detection Beyond Image SpaceKejiang Chen, Yuefeng Chen, Hang Zhou 0007, Chuan Qin 0001, Xiaofeng Mao, Weiming Zhang, Nenghai Yu. 3850-3854 [doi]

Strong Data Augmentation Sanitizes Poisoning and Backdoor Attacks Without an Accuracy TradeoffEitan Borgnia, Valeriia Cherepanova, Liam Fowl, Amin Ghiasi, Jonas Geiping, Micah Goldblum, Tom Goldstein, Arjun Gupta. 3855-3859 [doi]

Contrastive Predictive Coding Supported Factorized Variational Autoencoder For Unsupervised Learning Of Disentangled Speech RepresentationsJanek Ebbers, Michael Kuhlmann, Tobias Cord-Landwehr, Reinhold Haeb-Umbach. 3860-3864 [doi]

Contrastive Separative Coding for Self-Supervised Representation LearningJun Wang, Max W. Y. Lam, Dan Su 0002, Dong Yu 0001. 3865-3869 [doi]

Contrastive Semi-Supervised Learning for ASRAlex Xiao, Christian Fuegen, Abdelrahman Mohamed. 3870-3874 [doi]

Contrastive Learning of General-Purpose Audio RepresentationsAaqib Saeed, David Grangier, Neil Zeghidour. 3875-3879 [doi]

SEQ-CPC : Sequential Contrastive Predictive Coding for Automatic Speech RecognitionYulong Chen, Jianping Zhao, Weiqi Wang, Ming Fang, Haimei Kang, Lu Wang, Tao Wei, Jun Ma, Shaojun Wang, Jing Xiao. 3880-3884 [doi]

On Scaling Contrastive Representations for Low-Resource Speech RecognitionLasse Borgholt, Tycho M. S. Tax, Jakob D. Havtorn, Lars Maaløe, Christian Igel. 3885-3889 [doi]

Convex Neural Autoregressive Models: Towards Tractable, Expressive, and Theoretically-Backed Models for Sequential Forecasting and GenerationVikul Gupta, Burak Bartan, Tolga Ergen, Mert Pilanci. 3890-3894 [doi]

Inertial Proximal Deep Learning Alternating Minimization for Efficient Neutral Network TrainingLinbo Qiao, Tao Sun, Hengyue Pan, Dongsheng Li 0001. 3895-3899 [doi]

Kalman Optimizer for Consistent Gradient DescentXingyi Yang. 3900-3904 [doi]

Kalmannet: Data-Driven Kalman FilteringGuy Revach, Nir Shlezinger, Ruud J. G. van Sloun, Yonina C. Eldar. 3905-3909 [doi]

HCGM-Net: A Deep Unfolding Network for Financial Index TrackingRuben Pauwels, Evaggelia Tsiligianni, Nikos Deligiannis. 3910-3914 [doi]

Augmenting Transferred Representations for Stock ClassificationElizabeth Fons, Paula Dawson, Xiao-Jun Zeng, John A. Keane, Alexandros Iosifidis. 3915-3919 [doi]

A Framework for Pruning Deep Neural Networks Using Energy-Based ModelsHojjat Salehinejad, Shahrokh Valaee. 3920-3924 [doi]

Prototype-Based Personalized PruningJangho Kim, Simyung Chang, Sungrack Yun, Nojun Kwak. 3925-3929 [doi]

Tensor Reordering for CNN CompressionMatej Ulicny, Vladimir A. Krylov, Rozenn Dahyot. 3930-3934 [doi]

Pruning of Convolutional Neural Networks using ising Energy ModelHojjat Salehinejad, Shahrokh Valaee. 3935-3939 [doi]

Reweighted Dynamic Group ConvolutionWeiwei Chen, Chong Wang, Zhehao Zhang, Zheng Huo, Linlin Gao. 3940-3944 [doi]

Layer-Wise Interpretation of Deep Neural Networks using Identity InitializationShohei Kubota, Hideaki Hayashi, Tomohiro Hayase, Seiichi Uchida. 3945-3949 [doi]

Detection of Post-Traumatic Stress Disorder Using Learned Time-Frequency Representations from PupillometryBilal Taha, Megan Kirk, Paul Ritvo, Dimitrios Hatzinakos. 3950-3954 [doi]

Subject-Invariant Eeg Representation Learning For Emotion RecognitionSoheil Rayatdoost, Yufeng Yin, David Rudrauf, Mohammad Soleymani 0001. 3955-3959 [doi]

Towards Parkinson's Disease Prognosis Using Self-Supervised Learning and Anomaly DetectionHongchao Jiang, Wei Yang Bryan Lim, Jer Shyuan Ng, Yu Wang 0108, Ying Chi, Chunyan Miao. 3960-3964 [doi]

In-Bed Pressure-Based Pose Estimation Using Image Space Representation LearningVandad Davoodnia, Saeed Ghorbani, Ali Etemad. 3965-3969 [doi]

Towards The Development of Subject-Independent Inverse Metabolic ModelsSeyedhooman Sajjadi, Anurag Das, Ricardo Gutierrez-Osuna, Theodora Chaspari, Projna Paromita, Laura E. Ruebush, Nicolaas E. P. Deutz, Bobak J. Mortazavi. 3970-3974 [doi]

Human-Expert-Level Brain Tumor Detection Using Deep Learning with Data Distillation And AugmentationDiyuan Lu, Nenad Polomac, Iskra Gacheva, Elke Hattingen, Jochen Triesch. 3975-3979 [doi]

Multimodal Punctuation Prediction with Contextual DropoutAndrew Silva, Barry-John Theobald, Nicholas Apostoloff. 3980-3984 [doi]

Multi-Modal Label Dequantized Gaussian Process Latent Variable Model for Ordinal Label EstimationMasanao Matsumoto, Keisuke Maeda, Naoki Saito 0006, Takahiro Ogawa, Miki Haseyama. 3985-3989 [doi]

Generative Information FusionKenneth Tran, Wesam Sakla, Hamid Krim. 3990-3994 [doi]

Self-Augmented Multi-Modal Feature EmbeddingShinnosuke Matsuo, Seiichi Uchida, Brian Kenji Iwana. 3995-3999 [doi]

Optimize What Matters: Training DNN-Hmm Keyword Spotting Model Using End MetricAshish Shrivastava, Arnav Kundu, Chandra Dhir, Devang Naik, Oncel Tuzel. 4000-4004 [doi]

Co-Attentional Transformers for Story-Based Video UnderstandingBjörn Bebensee, Byoung-Tak Zhang. 4005-4009 [doi]

Deep Generative Demixing: Error Bounds for Demixing Subgaussian Mixtures of Lipschitz SignalsAaron Berk. 4010-4014 [doi]

Towards an Intrinsic Definition of Robustness for a ClassifierThéo Giraudon, Vincent Gripon, Matthias Löwe, Franck Vermet. 4015-4019 [doi]

Phase Transitions for One-Vs-One and One-Vs-All Linear Separability in Multiclass Gaussian MixturesGanesh Ramachandra Kini, Christos Thrampoulidis. 4020-4024 [doi]

Leaky Integrator Dynamical Systems and Reachable SetsBrian Whiteaker, Peter Gerstoft. 4025-4029 [doi]

Benign Overfitting in Binary Classification of Gaussian MixturesKe Wang, Christos Thrampoulidis. 4030-4034 [doi]

An Order-Optimal Adaptive Test Plan for Noisy Group Testing Under Unknown Noise ModelsSudeep Salgia, Qing Zhao 0001. 4035-4039 [doi]

SapAugment: Learning A Sample Adaptive Policy for Data AugmentationTing-Yao Hu, Ashish Shrivastava, Jen-Hao Rick Chang, Hema Koppula, Stefan Braun, Kyuyeon Hwang, Ozlem Kalinli, Oncel Tuzel. 4040-4044 [doi]

Hierarchical Coded Elastic ComputingShahrzad Kiani, Tharindu Adikari, Stark C. Draper. 4045-4049 [doi]

Synthesize & Learn: Jointly Optimizing Generative and Classifier Networks for Improved Drowsiness DetectionSandipan Banerjee, Ajjen Joshi, Ahmed Ghoneim, Survi Kyal, Taniya Mishra. 4050-4054 [doi]

A Joint Convolutional and Spatial Quad-Directional LSTM Network for Phase UnwrappingMalsha V. Perera, Ashwin De Silva. 4055-4059 [doi]

Integrated Classification and Localization of Targets Using Bayesian Framework In Automotive RadarsAnand Dubey, Avik Santra, Jonas Fuchs, Maximilian Lübke, Robert Weigel, Fabian Lurz. 4060-4064 [doi]

A DNN Autoencoder for Automotive Radar Interference MitigationShengyi Chen, Jalal Taghia, Tai Fei, Uwe Kühnau, Nils Pohl, Rainer Martin 0001. 4065-4069 [doi]

DURAS: Deep Unfolded Radar Sensing Using Doppler FocusingPranav Goyal, Satish Mulleti, Anubha Gupta, Yonina C. Eldar. 4070-4074 [doi]

NNAKF: A Neural Network Adapted Kalman Filter for Target TrackingSami Jouaber, Silvère Bonnabel, Santiago Velasco-Forero, Marion Pilté. 4075-4079 [doi]

Multi-Sample Online Learning for Spiking Neural Networks Based on Generalized Expectation MaximizationHyeryung Jang, Osvaldo Simeone. 4080-4084 [doi]

Probabilistic Graph Neural Networks for Traffic Signal ControlTing Zhong, Zheyang Xu, Fan Zhou 0002. 4085-4089 [doi]

Task-Aware Neural Architecture SearchCat P. Le, Mohammadreza Soltani, Robert J. Ravier, Vahid Tarokh. 4090-4094 [doi]

F-Net: Fusion Neural Network for Vehicle Trajectory Prediction in Autonomous DrivingJue Wang, Ping Wang, Chao Zhang, Kuifeng Su, Jun Li. 4095-4099 [doi]

Unsupervised Reconstruction of Sea Surface Currents from AIS Maritime Traffic Data Using Learnable Variational ModelsS. Benaïchouche, Clement Le Goff, Y. Guichoux, François Rousseau 0002, Ronan Fablet. 4100-4104 [doi]

A Compact Joint Distillation Network for Visual Food RecognitionZhao Heng, Kim-Hui Yap, Alex ChiChung Kot. 4105-4109 [doi]

Pipeline Safety Early Warning Method for Distributed Signal using Bilinear CNN and LightGBMYiyuan Yang, Yi Li, Haifeng Zhang. 4110-4114 [doi]

Deep Learning Based Hybrid Precoding in Dual-Band Communication SystemsRafail Ismayilov, Renato L. G. Cavalcante, Slawomir Stanczak. 4115-4119 [doi]

Deep Learning-Based Cross-Layer Resource Allocation for Wired Communication SystemsPourya Behmandpoor, Jeroen Verdyck, Marc Moonen. 4120-4124 [doi]

ATVIO: Attention Guided Visual-Inertial OdometryLi Liu, Ge Li 0002, Thomas H. Li. 4125-4129 [doi]

Feature Integration via Semi-Supervised Ordinally Multi-Modal Gaussian Process Latent Variable ModelKyohei Kamikawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama. 4130-4134 [doi]

A Multi-Layer Multi-Channel Attentive Network for Gender and Age RecognitionJia Chen, Haiping Yu, Yimei Kang. 4135-4139 [doi]

Effect of Language Proficiency on Subjective Evaluation of Noise Suppression AlgorithmsBabak Naderi, Gabriel Mittag, Rafael Zequeira Jiménez, Sebastian Möller 0001. 4140-4144 [doi]

Melody Harmonization Using Orderless Nade, Chord Balancing, and Blocked Gibbs SamplingChung-En Sun, Yi-Wei Chen, Hung-Shin Lee, Yen-Hsing Chen, Hsin-Min Wang. 4145-4149 [doi]

Cross-Domain Semi-Supervised Deep Metric Learning for Image Sentiment AnalysisYun Liang 0014, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama. 4150-4154 [doi]

Audiovisual Highlight Detection in VideosKarel Mundnich, Alexandra Fenster, Aparna Khare, Shiva Sundaram. 4155-4159 [doi]

Teacher-Assisted Mini-Batch Sampling for Blind Distillation Using Metric LearningNakamasa Inoue. 4160-4164 [doi]

Rule-Embedded Network for Audio-Visual Voice Activity Detection in Live Musical Video StreamsYuanbo Hou, Yi Deng, Bilei Zhu, Zejun Ma, Dick Botteldooren. 4165-4169 [doi]

Reinforcement Stacked Learning with Semantic-Associated Attention for Visual Question AnsweringXinyu Xiao, Chunxia Zhang 0001, Shiming Xiang, Chunhong Pan. 4170-4174 [doi]

Hierarchical Refined Attention for Scene Text RecognitionMin Zhang, Meng Ma, Ping Wang 0003. 4175-4179 [doi]

Collaborative Learning to Generate Audio-Video JointlyVinod K. Kurmi, Vipul Bajaj, Badri N. Patro, K. S. Venkatesh, Vinay P. Namboodiri, Preethi Jyothi. 4180-4184 [doi]

An Attention-Seq2Seq Model Based on CRNN Encoding for Automatic Labanotation Generation from Motion Capture DataMin Li, Zhenjiang Miao, Xiao-Ping Zhang 0002, Wanru Xu. 4185-4189 [doi]

Show and Speak: Directly Synthesize Spoken Description of ImagesXinsheng Wang, Siyuan Feng, Jihua Zhu, Mark Hasegawa-Johnson, Odette Scharenborg. 4190-4194 [doi]

Drawgan: Text to Image Synthesis with Drawing Generative Adversarial NetworksZhiqiang Zhang, Jinjia Zhou, Wenxin Yu, Ning Jiang. 4195-4199 [doi]

Disentangling Subject-Dependent/-Independent Representations for 2D Motion RetargetingFanglu Xie, Go Irie, Tatsushi Matsubayashi. 4200-4204 [doi]

Network and Content-Dependent Bitrate Ladder Estimation for Adaptive Bitrate Video StreamingPierre R. Lebreton, Kazuhisa Yamagishi. 4205-4209 [doi]

Ultra-Low Bitrate Video Conferencing Using Deep Image AnimationGoluck Konuko, Giuseppe Valenzise, Stéphane Lathuilière. 4210-4214 [doi]

Hierarchical Bit-Wise Differential Coding (HBDC) of Point Cloud AttributesYan Huang, Bin Wang, C. C. Jay Kuo, Hui Yuan, Jingliang Peng. 4215-4219 [doi]

Learning-Based Lossless Compression of 3D Point Cloud GeometryDat Thanh Nguyen, Maurice Quach, Giuseppe Valenzise, Pierre Duhamel. 4220-4224 [doi]

Image Coding with Neural Network-Based ColorizationDiogo Lopes, João Ascenso, Catarina Brites, Fernando Pereira 0001. 4225-4229 [doi]

Joint Reinforcement Learning and Game Theory Bitrate Control Method for 360-Degree Dynamic Adaptive StreamingXuekai Wei, Mingliang Zhou, Sam Kwong, Hui Yuan, Tao Xiang. 4230-4234 [doi]

HCAG: A Hierarchical Context-Aware Graph Attention Model for Depression DetectionMeng Niu, Kai Chen, Qingcai Chen, Lufeng Yang. 4235-4239 [doi]

When Face Recognition Meets Occlusion: A New BenchmarkBaojin Huang, Zhongyuan Wang, Guangcheng Wang, Kui Jiang, Kangli Zeng, Zhen Han, Xin Tian 0006, Yuhong Yang. 4240-4244 [doi]

A Triplet Appearance Parsing Network for Person Re-IdentificationMingfu Xiong, Zhongyuan Wang, Ruhan He, Xinrong Hu, Ming Cheng, Xiao Qin 0001, Jia Chen. 4245-4249 [doi]

Part-Aligned Network with Background for Misaligned Person SearchXian Zhong, Yiting Liu, Wenxin Huang, Xiao Wang, Bo Ma, Jingling Yuan. 4250-4254 [doi]

Learning Pose-Adaptive Lip Sync with Cascaded Temporal Convolutional NetworkRuobing Zheng, Bo Song, Changjiang Ji. 4255-4259 [doi]

Assessment of Bipolar Disorder Using Heterogeneous Data of Smartphone-Based Digital PhenotypingHung-Yi Su, Chung-Hsien Wu, Cheng-Ray Liou, Esther Ching-Lan Lin, Po See Chen. 4260-4264 [doi]

Multi-Granularity Feature Interaction and Relation Reasoning for 3D Dense Alignment and Face ReconstructionLei Li, Xiangzheng Li, Kangbo Wu, Kui Lin, Suping Wu. 4265-4269 [doi]

Independent Sign Language Recognition with 3d Body, Hands, and Face ReconstructionAgelos Kratimenos, Georgios Pavlakos, Petros Maragos. 4270-4274 [doi]

Multimodal Cross- and Self-Attention Network for Speech Emotion RecognitionLicai Sun, Bin Liu, Jianhua Tao, Zheng Lian. 4275-4279 [doi]

Multi-Target DoA Estimation with an Audio-Visual Fusion MechanismXinyuan Qian, Maulik C. Madhavi, Zexu Pan, Jiadong Wang, Haizhou Li 0001. 4280-4284 [doi]

Improving Multimodal Speech Enhancement by Incorporating Self-Supervised and Curriculum LearningYing Cheng, Mengyu He, Jiashuo Yu, Rui Feng. 4285-4289 [doi]

Autoencoder for Vibrotactile Signal CompressionZhuoran Li, Rania Hassen, Zhou Wang. 4290-4294 [doi]

Cross-Modal Knowledge Distillation For Fine-Grained One-Shot ClassificationJiabao Zhao, Xin Lin, Yifan Yang, Jing Yang, Liang He. 4295-4299 [doi]

Learning Audio-Visual Correlations From Variational Cross-Modal GenerationYe Zhu, Yu Wu, Hugo Latapie, Yi Yang, Yan Yan. 4300-4304 [doi]

ECCL: Explicit Correlation-Based Convolution Boundary Locator for Moment LocalizationXinfang Liu, Xiushan Nie, Junya Teng, Fanchang Hao, Yilong Yin. 4305-4309 [doi]

COOPNet: Multi-Modal Cooperative Gender Prediction in Social Media User ProfilingLin Li, Kaixi Hu, Yunpei Zheng, Jianquan Liu, Kong-Aik Lee. 4310-4314 [doi]

Robust Latent Representations Via Cross-Modal Translation and AlignmentVandana Rajan, Alessio Brutti, Andrea Cavallaro. 4315-4319 [doi]

Semi-Supervised Multimodal Image Translation for Missing Modality ImputationWangbin Sun, Fei Ma, Yang Li, Shao-Lun Huang, Shiguang Ni, Lin Zhang 0001. 4320-4324 [doi]

Deep Adversarial Quantization Network for Cross-Modal RetrievalYu Zhou, Yong Feng 0002, Mingliang Zhou, Baohua Qiang, Leong Hou U, Jiajie Zhu. 4325-4329 [doi]

Scalable Discriminative Discrete Hashing For Large-Scale Cross-Modal RetrievalJianyang Qin, Lunke Fei, Jian Zhu, Jie Wen 0001, Chunwei Tian, Shuai Wu. 4330-4334 [doi]

Hierarchical Similarity Learning for Language-Based Product Image RetrievalZhe Ma, Fenghao Liu, Jianfeng Dong, Xiaoye Qu, Yuan He, Shouling Ji. 4335-4339 [doi]

Bidirectional Focused Semantic Alignment Attention Network for Cross-Modal RetrievalShuli Cheng, Liejun Wang, Anyu Du, Yongming Li. 4340-4344 [doi]

Detection of Audio-Video Synchronization Errors Via Event DetectionJoshua Peter Ebeneze, Yongjun Wu, Hai Wei, Sriram Sethuraman, Zongyi Liu. 4345-4349 [doi]

2RN: A Fully Convolutional Corner Refinement Network for Accurate Multi-Oriented Scene Text DetectionXugong Qin, Yu Zhou 0015, Youhui Guo, Dayan Wu, Weiping Wang 0005. 4350-4354 [doi]

DoA estimation of a hidden RF source exploiting simple backscatter radio tagsGeorgios Vougioukas, Aggelos Bletsas. 4355-4359 [doi]

Probability of Resolution of G-MUSIC: An Asymptotic ApproachDavid Schenck, Xavier Mestre, Marius Pesavento. 4360-4364 [doi]

A Partially-Relaxed Robust DOA Estimator Under Non-Gaussian Low-Rank Interference and NoiseMinh Trinh-Hoang, Mohammed Nabil El Korso, Marius Pesavento. 4365-4369 [doi]

Non-Coherent DOA Estimation of Off-Grid Signals With Uniform Circular ArraysZhengyu Wan, Wei Liu 0001. 4370-4374 [doi]

Enhanced Standard Esprit For Overcoming Imperfections In DOA EstimationMajdoddin Esfandiari, Sergiy A. Vorobyov. 4375-4379 [doi]

Constrained Tensor Decomposition for 2d DOA Estimation In Transmit Beamspace Mimo Radar with SubarraysFeng Xu, Sergiy A. Vorobyov. 4380-4384 [doi]

Alternating Projections Gridless Covariance-Based Estimation For DOAYongsung Park, Peter Gerstoft. 4385-4389 [doi]

Synthetic Data For Dnn-Based Doa Estimation of Indoor SpeechFemke B. Gelderblom, Yi Liu, Johannes Kvam, Tor André Myrvoll. 4390-4394 [doi]

Direction Of Arrival Estimation For Non-Coherent Sub-Arrays Via Joint Sparse And Low-Rank Signal RecoveryTom Tirer, Oded Bialer. 4395-4399 [doi]

Sparsity And Nonnegativity Constrained Krylov Approach For Direction Of Arrival EstimationHamza Baali, Abdesselam Bouzerdoum, Abdelkrim Khelif. 4400-4404 [doi]

Hybrid Analog-Digital MIMO Radar Receivers With Bit-Limited ADCsFeng Xi, Nir Shlezinger, Yonina C. Eldar. 4405-4409 [doi]

Sparse Array Transceiver Design for Enhanced Adaptive Beamforming in MIMO RadarSyed A. Hamza, Weitong Zhai, Xiangrong Wang 0001, Moeness G. Amin. 4410-4414 [doi]

Sparse Parameter Estimation for PMCW MIMO Radar Using Few-Bit ADCsChao-Yi Wu, Jian Li, Tan F. Wong. 4415-4419 [doi]

Parameter Identifiability Of Spatial-Smoothing-Based Bistatic Mimo RadarJunpeng Shi, Fangqing Wen, Yongxiang Liu, Qinmu Shen, Zhihui Li 0002, Zhen Liu 0004. 4420-4424 [doi]

Parameter Estimation for Coherent Passive MIMO Radar with Unknown Signals under Direct Path InfluenceZhen Wang, Qian He 0002. 4425-4429 [doi]

Riemannian Geometric Optimization Methods for Joint Design of Transmit Sequence and Receive Filter of MIMO RadarJie Li, Guisheng Liao, Yan Huang, Arye Nehorai. 4430-4434 [doi]

High Accuracy Tracking of Targets Using Massive MIMOXiaolu Zeng, Feng Zhang 0016, Beibei Wang 0001, K. J. Ray Liu. 4435-4439 [doi]

Admm-Based Fast Algorithm for Robust Multi-Group Multicast BeamformingNiloofar Mohamadi, Min Dong, Shahram Shahbazpanahi. 4440-4444 [doi]

Scalable and Distributed MMSE Algorithms for Uplink Receive Combining in Cell-Free Massive MIMO SystemsRobbe Van Rompaey, Marc Moonen. 4445-4449 [doi]

Antenna Selection for Massive MIMO Systems Based on POMDP FrameworkSara Sharifi, Shahram Shahbazpanahi, Min Dong. 4450-4454 [doi]

RIS-Aided Joint Localization and Synchronization with a Single-Antenna Mmwave ReceiverAlessio Fascista, Angelo Coluccia, Henk Wymeersch, Gonzalo Seco-Granados. 4455-4459 [doi]

Joint Channel, Data, and Phase-Noise Estimation in MIMO-OFDM Systems Using a Tensor Modeling ApproachBruno Sokal, Paulo R. B. Gomes, André L. F. de Almeida, Martin Haardt. 4460-4464 [doi]

Robust Steerable Differential Beamformers with Null Constraints for Concentric Circular Microphone ArraysXuehan Wang, Gongping Huang, Israel Cohen, Jacob Benesty, Jingdong Chen. 4465-4469 [doi]

Close-Talking Recording with Planarly Distributed MicrophonesTakuma Okamoto. 4470-4474 [doi]

(W)Earable Microphone Array and Ultrasonic Echo Localization for Coarse Indoor Environment MappingFelix Pfreundtner, Jing Yang 0022, Gábor Sörös. 4475-4479 [doi]

Characterization of Mems Microphone Sensitivity and Phase Distributions with Applications in Array ProcessingPatrick W. A. Wijnings, Sander Stuijk, Rick Scholte, Henk Corporaal. 4480-4484 [doi]

Directional Sparse Filtering Using Weighted Lehmer Mean for Blind Separation of Unbalanced Speech MixturesKarn Watcharasupat, Anh H. T. Nguyen, Ching-Hui Ooi, Andy W. H. Khong. 4485-4489 [doi]

Distributed Speech Separation in Spatially Unconstrained Microphone ArraysNicolas Furnon, Romain Serizel, Irina Illina, Slim Essid. 4490-4494 [doi]

An Adaptive Non-Linear Process for Under-Determined Virtual Microphone BeamformingMehdi Bekrani, Anh H. T. Nguyen, Andy W. H. Khong. 4495-4499 [doi]

Window Beamformer for Sparse Concentric Circular ArrayRajib Sharma, Israel Cohen, Baruch Berdugo. 4500-4504 [doi]

Single-Point Array Response Control with Minimum Pattern DeviationXiaoyu Ai, Lu Gan 0003. 4505-4509 [doi]

Focusing-Based Wideband Adaptive Beamforming Using Covariance Matrix ReconstructionPeng Chen, Wei Wang, Jingjie Gao. 4510-4514 [doi]

Bayesian Multiple Change-Point Detection of Propagating EventsTopi Halme, Eyal Nitzan, Visa Koivunen. 4515-4519 [doi]

One-Bit Autocorrelation Estimation With Non-Zero ThresholdsChun-Lin Liu, Zi-Min Lin. 4520-4524 [doi]

A Novel Bayesian Approach for the Two-Dimensional Harmonic Retrieval ProblemRohan R. Pote, Bhaskar D. Rao. 4525-4529 [doi]

On Overfitting in Discrete Super-Resolution RecoveryWenzhe Lu, Heng Qiao. 4530-4534 [doi]

SIML: Sieved Maximum Likelihood for Array Signal ProcessingMatthieu Simeoni, Paul Hurley. 4535-4539 [doi]

Estimation of Groundwater Storage Variations in Indus River Basin Using Grace DataYahya Sattar, Zubair Khalid. 4540-4544 [doi]

Temporal Exemplar Channels In High-Multipath EnvironmentsMohamed Kashef, Peter G. Vouras, Robert Jones, Richard Candell, Kate A. Remley. 4545-4549 [doi]

Multi-Vehicle Velocity Estimation Using IEEE 802.11ad WaveformGeonho Han, Sucheol Kim, Junil Choi. 4550-4554 [doi]

Real-Time Interaural Time Delay Estimation via Onset DetectionElizabeth Ren, Gustavo Cid Ornelas, Hans-Andrea Loeliger. 4555-4559 [doi]

EKFNet: Learning System Noise Statistics from Measurement DataLiang Xu, Ruixin Niu. 4560-4564 [doi]

Sliding-Capon Based Convolutional Beamspace for Linear ArraysPo-Chih Chen, P. P. Vaidyanathan. 4565-4569 [doi]

Modular Binary Tree Architecture for Distributed Large Intelligent SurfaceJuan Vidal-Alegría, Fredrik Rusek, Jesús Rodríguez Sánchez, Ove Edfors. 4565-4569 [doi]

Target Detection from Distributed Passive Sensors: Semi-Labeled Data QuantizationZachariah Sutton, Peter Willett 0001, Stefano Maranò 0001. 4570-4574 [doi]

Sparse Factorization-Based Detection of Off-the-Grid Moving Targets Using FMCW RadarsGilles Monnoyer de Galland, Thomas Feuillen, Luc Vandendorpe, Laurent Jacques. 4575-4579 [doi]

A Robust Copula Model for Radar-Based Landmine DetectionAfief D. Pambudi, Fauzia Ahmad, Abdelhak M. Zoubir. 4580-4584 [doi]

Radar Clutter Classification Using Expectation-Maximization MethodSudan Han, Pia Addabbo, Danilo Orlando, Giuseppe Ricci. 4585-4589 [doi]

A Meta-Learning Framework for Few-Shot Classification of Remote Sensing ScenePei Zhang, Yunpeng Bai, Dong Wang, Bendu Bai, Ying Li. 4590-4594 [doi]

Differential Convolution Feature Guided Deep Multi-Scale Multiple Instance Learning for Aerial Scene ClassificationBeichen Zhou, Jingjun Yi, Qi Bi. 4595-4599 [doi]

Generalized Thinned Coprime Array for DOA EstimationJunpeng Shi, Yongxiang Liu, Fangqing Wen, Zhen Liu 0004, Panhe Hu, Zhenghui Gong. 4600-4604 [doi]

TCLA Array: A New Sparse Array Design with Less Mutual CouplingAhmed M. A. Shaalan, Jun Du, Yanhui Tu. 4605-4609 [doi]

Low Mutual Coupling Sparse Array Design Using ULA FittingWanlu Shi, Yingsong Li 0001, Sergiy A. Vorobyov. 4610-4614 [doi]

Low-Rank and Sparse Decomposition for Joint DOA Estimation and Contaminated Sensors Detection with Sparsely Contaminated ArraysHuiping Huang, Abdelhak M. Zoubir. 4615-4619 [doi]

Fundamental Trade-Offs in Noisy Super-Resolution with Synthetic AperturesSina Shahsavari, Jacob Millhiser, Piya Pal. 4620-4624 [doi]

Enhanced Blind Calibration of Uniform Linear Arrays with One-Bit Quantization by Kullback-Leibler Divergence Covariance FittingAmir Weiss, Arie Yeredor. 4625-4629 [doi]

Non-Iterative Blind Calibration of Nested Arrays with Asymptotically Optimal WeightingAmir Weiss, Arie Yeredor. 4630-4634 [doi]

Sensor Networks TDOA Self-Calibration: 2D Complexity Analysis and SolutionsLuca Ferranti, Kalle Åström, Magnus Oskarsson, Jani Boutellier, Juho Kannala. 4635-4639 [doi]

Kld Minimization-Based Constrained Measurement Filtering For Two-Step TDOA Indoor TrackingRui Huang, Le Yang, Jun Tao, Yanbo Xue. 4635-4639 [doi]

Fast and Robust Stratified Self-Calibration Using Time-Difference-Of-Arrival MeasurementsMartin Larsson, Gabrielle Flood, Magnus Oskarsson, Kalle Åström. 4640-4644 [doi]

Stability Analysis of the RC-PLMS Adaptive Beamformer Using a Simple Transfer Function ApproximationGhattas Akkad, Ali Mansour, Bachar El Hassan, Elie Inaty. 4645-4649 [doi]

On The Asymptotic Performance of One-Bit Co-Array-Based MusicSaeid Sedighi, Bhavani Shankar, Mojtaba Soltanalian, Björn E. Ottersten. 4650-4654 [doi]

A Correntropy Based Algorithm for Robust Localization in Wireless NetworksMahboobeh Sedighizad, Babak Seyfe, Shahrokh Valaee. 4660-4664 [doi]

MuG: A Multipath-Exploited and Grid-Free Localisation MethodHengyan Liu, Wei Dai 0001, Yuan Shen. 4665-4669 [doi]

Sparse Bayesian Learning for Acoustic Source LocalizationRuchi Pandey, Santosh Nannuru, Aditya Siripuram. 4670-4674 [doi]

Automatic Fine-Grained Localization of Utility Pole Landmarks on Distributed Acoustic Sensing Traces Based on Bilinear ResnetsYou Lu, Yue Tian, Shaobo Han, Eric Cosatto, Sarper Ozharar, Yangmin Ding. 4675-4679 [doi]

SSLIDE: Sound Source Localization for Indoors Based on Deep LearningYifan Wu, Roshan Sai Ayyalasomayajula, Michael J. Bianco, Dinesh Bharadia, Peter Gerstoft. 4680-4684 [doi]

Physical-Layer Security via Distributed Beamforming in the Presence of Adversaries with Unknown LocationsYagiz Savas, Abolfazl Hashemi, Abraham P. Vinod, Brian M. Sadler, Ufuk Topcu. 4685-4689 [doi]

Canonical Polyadic Tensor Decomposition With Low-Rank Factor MatricesAnh Huy Phan, Petr Tichavský, Konstantin Sobolev, Konstantin Sozykin, Dmitry Ermilov, Andrzej Cichocki. 4690-4694 [doi]

A Diffusion FXLMS Algorithm for Multi-Channel Active Noise Control and Variable Spatial SmoothingY. J. Chu, Shing-Chow Chan, Cheuk Ming Mak, M. Wu. 4695-4699 [doi]

ADAPT-Then-Combine Full Waveform Inversion for Distributed Subsurface Imaging In Seismic NetworksBan-Sok Shin, Dmitriy Shutin. 4700-4704 [doi]

Data Fusion for Audiovisual Speaker Localization: Extending Dynamic Stream Weights to the Spatial DomainJulio Wissing, Benedikt T. Boenninghoff, Dorothea Kolossa, Tsubasa Ochiai, Marc Delcroix, Keisuke Kinoshita, Tomohiro Nakatani, Shoko Araki, Christopher Schymura. 4705-4709 [doi]

Towards Robust Training of Multi-Sensor Data Fusion Network Against Adversarial Examples in Semantic SegmentationYoungjoon Yu, Hong Joo Lee, Byeong Cheon Kim, Jung-Uk Kim, Yong Man Ro. 4710-4714 [doi]

Data-Driven Adaptive Network Resource Slicing for Multi-Tenant NetworksNavid Reyhanian, Hamid Farmanbar, Zhi-Quan Luo. 4715-4719 [doi]

Distributed Scheduling Using Graph Neural NetworksZhongyuan Zhao, Gunjan Verma, Chirag Rao, Ananthram Swami, Santiago Segarra. 4720-4724 [doi]

Efficient Power Allocation Using Graph Neural Networks and Deep Algorithm UnfoldingArindam Chowdhury, Gunjan Verma, Chirag Rao, Ananthram Swami, Santiago Segarra. 4725-4729 [doi]

A Sample-Efficient Scheme for Channel Resource Allocation in Networked EstimationMarcos M. Vasconcelos, Urbashi Mitra. 4730-4734 [doi]

An Efficient Linear Programming Rounding-and-Refinement Algorithm for Large-Scale Network Slicing ProblemWeikun Chen, Ya-Feng Liu, Yu-Hong Dai, Zhi-Quan Luo. 4735-4739 [doi]

Efficient Migration to the Next Generation of Networks Based on Digital AnnealingMohammad Javad-Kalbasi, Shahrokh Valaee. 4740-4744 [doi]

A Technique for OFDM Symbol SlicingAna I. Pérez-Neira, Miguel A. Lagunas. 4745-4749 [doi]

Communication Over Block Fading Channels - An Algorithmic Perspective On Optimal Transmission SchemesHolger Boche, Rafael F. Schaefer, H. Vincent Poor. 4750-4754 [doi]

Secure UAV Communications Under Uncertain Eavesdroppers LocationsSilei Wang, Fanxiang Kong, Qiang Li. 4755-4759 [doi]

On Strategic Jamming in Distributed Detection NetworksChen Quan, Baocheng Geng, Pramod K. Varshney. 4760-4764 [doi]

Real Number Signal Processing can Detect Denial-of-Service AttacksHolger Boche, Rafael F. Schaefer, H. Vincent Poor. 4765-4769 [doi]

A Hybrid Approach to Coded Compressed Sensing Where Coupling Takes Place Via the Outer CodeJamison R. Ebert, Vamsi K. Amalladinne, Jean-François Chamberland, Krishna R. Narayanan. 4770-4774 [doi]

Globally Optimal Beamforming for Rate Splitting Multiple AccessBho Matthiesen, Yijie Mao, Petar Popovski, Bruno Clerckx. 4775-4779 [doi]

Beam Focusing for Multi-User MIMO Communications with Dynamic Metasurface AntennasHaiyang Zhang, Nir Shlezinger, Francesco Guidi, Davide Dardari, Mohammadreza F. Imani, Yonina C. Eldar. 4780-4784 [doi]

Pushing The Limit of Type I Codebook For Fdd Massive Mimo Beamforming: A Channel Covariance Reconstruction ApproachKai Li, Ying Li, Lei Cheng 0003, Qingjiang Shi, Zhi-Quan Luo. 4785-4789 [doi]

First-Order Fast Algorithm for Structurally Optimal Multi-Group Multicast Beamforming in Large-Scale SystemsChong Zhang, Min Dong, Ben Liang. 4790-4794 [doi]

Analog Beamforming With Antenna Selection For Large-Scale Antenna ArraysAakash Arora, Christos G. Tsinos, R. Bhavani Shankar Mysore, Symeon Chatzinotas, Björn E. Ottersten. 4795-4799 [doi]

Beamforming for Bidirectional Mimo Full Duplex Under the Joint Sum Power and Per Antenna Power ConstraintsChandan Kumar Sheemar, Dirk T. M. Slock. 4800-4804 [doi]

Iterative Reweighted Algorithms for Joint User Identification and Channel Estimation in Spatially Correlated Massive MTCHamza Djelouat, Markus Leinonen, Markku J. Juntti. 4805-4809 [doi]

Millimeter Wave MIMO Channel Estimation with 1-bit Spatial Sigma-Delta Analog-to-Digital ConvertersR. S. Prasobh Sankar, Sundeep Prabhakar Chepuri. 4810-4814 [doi]

An Efficient Algorithm For Device Detection And Channel Estimation In Asynchronous IOT SystemsLiang Liu, Ya-Feng Liu. 4815-4819 [doi]

Kalman Filter Based MIMO CSI Phase Recovery for COTS Wifi DevicesChu Li, Jeremy Brauer, Aydin Sezgin, Christian T. Zenger. 4820-4824 [doi]

Improved Atomic Norm Based Channel Estimation for Time-Varying Narrowband Leaked ChannelsJianxiu Li, Urbashi Mitra. 4825-4829 [doi]

Bayesian Massive MIMO Channel Estimation with Parameter Estimation Using Low-Resolution ADCsShuai Huang, Deqiang Qiu, Trac D. Tran. 4830-4834 [doi]

Optimal Detection in the Presence of Non-Gaussian JammingKhalid A. Almahorg, Ramy H. Gohary. 4835-4839 [doi]

An Efficient Active Set Algorithm for Covariance Based Joint Data and Activity Detection for Massive Random Access with Massive MIMOZiyue Wang, Zhilin Chen, Ya-Feng Liu, Foad Sohrabi, Wei Yu 0001. 4840-4844 [doi]

Neural Layered Min-Sum Decoding for Protograph LDPC CodesDexin Zhang, Jincheng Dai, Kailin Tan, Kai Niu 0001, Mingzhe Chen, H. Vincent Poor, Shuguang Cui. 4845-4849 [doi]

Integer Carrier Frequency Offset Estimation in OFDM with Zadoff-Chu SequencesJohn D. Roth, David A. Garren, R. Clark Robertson. 4850-4854 [doi]

Plug-And-Play Learned Gaussian-mixture Approximate Message PassingOsman Musa, Peter Jung 0001, Giuseppe Caire. 4855-4859 [doi]

Low-Latency Polar Decoder Using Overlapped SCL ProcessingDongyun Kam, Byeong Yong Kong, Youngjoo Lee. 4860-4864 [doi]

Stochastic Successive Weighted Sum-Rate Maximization for Multiuser MIMO Systems with Finite-Alphabet InputsXin Guan, Xiaotong Zhao, Qingjiang Shi. 4870-4874 [doi]

Rate 1 Quasi Orthogonal Universal Transmission and Combining for MIMO Systems Achieving Full DiversityBarak Avraham, Uri Erez, Elad Domanovitz. 4875-4879 [doi]

Energy Efficiency Optimization Technique for SWIPT-Enabled Multi-Group Multicasting Systems with Heterogeneous UsersSumit Gautam, Symeon Chatzinotas, Björn W. Ottersten. 4880-4884 [doi]

Multi-Branch Tomlinson-Harashima Precoding for Rate Splitting Based Systems with Multiple AntennasAndré R. Flores, Rodrigo Caiado ue Lamare, Bruno Clerckx. 4885-4889 [doi]

Divide and Conquer: One-bit MIMO-OFDM Detection by Inexact Expectation MaximizationMingjie Shao, Wing-Kin Ma. 4890-4894 [doi]

Differential Chaos Shift Keying-Based Wireless Power TransferPriyadarshi Mukherjee, Constantinos Psomas, Ioannis Krikidis. 4895-4899 [doi]

VGAI: End-to-End Learning of Vision-Based Decentralized Controllers for Robot SwarmsTing-Kuei Hu, Fernando Gama, Tianlong Chen, Zhangyang Wang, Alejandro Ribeiro, Brian M. Sadler. 4900-4904 [doi]

Recognition of Dynamic Hand Gesture Based on Mm-Wave Fmcw Radar Micro-Doppler SignaturesWen Jiang, Yihui Ren, Ying Liu, Ziao Wang, Xinghua Wang. 4905-4909 [doi]

Dynamic Resource Optimization for Adaptive Federated Learning at the Wireless Network EdgePaolo Di Lorenzo, Claudio Battiloro, Mattia Merluzzi, Sergio Barbarossa. 4910-4914 [doi]

Deep Weighted MMSE Downlink BeamformingLissy Pellaco, Mats Bengtsson, Joakim Jaldén. 4915-4919 [doi]

Deep Generative Model Learning For Blind Spectrum Cartography with NMF-Based Radio Map DisaggregationSagar Shrestha, Xiao Fu 0001, Mingyi Hong. 4920-4924 [doi]

Mitigating Clipping Distortion in OFDM Using Deep Residual LearningMuhammad Shahmeer Omar, Xiaoli Ma. 4925-4929 [doi]

A Low-Complexity Admm-Based Massive Mimo Detectors Via Deep Neural NetworksIsayiyas Nigatu Tiba, Quan Zhang, Jing Jiang, Yongchao Wang. 4930-4934 [doi]

Real-Time Radio Modulation Classification With An LSTM Auto-EncoderZiqi Ke, Haris Vikalo. 4935-4939 [doi]

Deep Active Learning Approach to Adaptive Beamforming for mmWave Initial AlignmentFoad Sohrabi, Zhilin Chen, Wei Yu 0001. 4940-4944 [doi]

Learning to Continuously Optimize Wireless Resource in Episodically Dynamic EnvironmentHaoran Sun, Wenqiang Pu, Minghe Zhu, Xiao Fu 0001, Tsung-Hui Chang, Mingyi Hong. 4945-4949 [doi]

Adaptive Contention Window Design Using Deep Q-LearningAbhishek Kumar, Gunjan Verma, Chirag Rao, Ananthram Swami, Santiago Segarra. 4950-4954 [doi]

On Information Asymmetry in Online Reinforcement LearningEzra Tampubolon, Haris Ceribasic, Holger Boche. 4955-4959 [doi]

Jamming Strategy Generation for Hidden Communication Modes Via Graph Convolution NetworksFanxiang Kong, Qiang Li 0017, Huaizong Shao. 4960-4964 [doi]

Contrastive Self-Supervised Learning for Wireless Power ControlNavid Naderializadeh. 4965-4969 [doi]

Measure-Transformed Covariance Test for Robust Spectrum SensingYair Sorek, Koby Todros. 4970-4974 [doi]

Searching for Anomalies with Multiple Plays under Delay and Switching CostsTidhar Lambez, Kobi Cohen. 4975-4979 [doi]

Robust estimation of high-order phase dynamics using Variational Bayes inferenceFabio Fabozzi, Stéphanie Bidon, Sébastien Roche. 4980-4984 [doi]

Robust PCA Through Maximum Correntropy Power IterationsJean P. Chereau, Bruno Scalzo, Danilo P. Mandic. 4985-4989 [doi]

Score-Based Change Detection For Gradient-Based Learning MachinesLang Liu, Joseph Salmon, Zaïd Harchaoui. 4990-4994 [doi]

Super-Resolution Of Periodic Signals From Short Sequences Of SamplesMarek W. Rupniewski. 4995-4999 [doi]

Quickest Change Detection With Time Inconsistent Anticipatory Agents In Cyber-Physical SystemsVikram Krishnamurthy. 5000-5004 [doi]

Treatment Effect Estimation Using Invariant Risk MinimizationAbhin Shah, Kartik Ahuja, Karthikeyan Shanmugam, Dennis Wei, Kush R. Varshney, Amit Dhurandhar. 5005-5009 [doi]

An F-Test for Polynomial Frequency ModulationKian Blanchette, Wesley Burr, Glen Takahara. 5010-5014 [doi]

Quickest Joint Detection and Classification of Faults in Statistically Periodic ProcessesTaposh Banerjee, Smruti Padhy, Ahmad F. Taha, Eugene John. 5015-5019 [doi]

An Asymptotically Pointwise Optimal Procedure For Sequential Joint Detection And EstimationDominik Reinhard, Michael Fauß, Abdelhak M. Zoubir. 5020-5024 [doi]

Locally Optimal Detection of Stochastic Targeted Universal Adversarial PerturbationsAmish Goel, Pierre Moulin. 5025-5029 [doi]

A Decentralized Variance-Reduced Method for Stochastic Optimization Over Directed GraphsMuhammad I. Qureshi, Ran Xin, Soummya Kar, Usman A. Khan. 5030-5034 [doi]

On Distributed Composite Tests with Dependent Observations in WSNJuan Augusto Maya, Leonardo Rey Vega. 5035-5039 [doi]

Byzantine-Resilient Decentralized TD Learning with Linear Function ApproximationZhaoxian Wu, Han Shen, Tianyi Chen, Qing Ling. 5040-5044 [doi]

On The Effect of Spatial Correlation on Distributed Energy Detection of a Stochastic ProcessJuan Augusto Maya, Leonardo Rey Vega. 5045-5049 [doi]

Provably Fast Asynchronous And Distributed Algorithms For Pagerank Centrality ComputationYiran He, Hoi-To Wai. 5050-5054 [doi]

Decentralized Optimization Over Noisy, Rate-Constrained Networks: How We Agree By Talking About How We DisagreeRajarshi Saha, Stefano Rini, Milind Rao, Andrea Goldsmith. 5055-5059 [doi]

A Multiple Access Channel Game Using Latency MetricAndrey Garnaev, Athina P. Petropulu, Wade Trappe. 5060-5064 [doi]

Linear Computation CodingRalf R. Müller, Bernhard Gäde, Ali Bereyhi. 5065-5069 [doi]

Spectral Folding And Two-Channel Filter-Banks On Arbitrary GraphsEduardo Pavez, Benjamin Girault, Antonio Ortega, Philip A. Chou. 5070-5074 [doi]

Sparse Time-Frequency Representation Via Atomic Norm MinimizationTsubasa Kusano, Kohei Yatabe, Yasuhiro Oikawa. 5075-5079 [doi]

Message Transmission Over Rapidly Time-Varying ChannelsAlihan Kaplan, Volker Pohl. 5080-5084 [doi]

A Robust and Efficient Multi-Scale Seasonal-Trend DecompositionLinxiao Yang, Qingsong Wen, Bo Yang, Liang Sun 0001. 5085-5089 [doi]

Noise-Assisted Multivariate Variational Mode DecompositionCharilaos A. Zisou, Georgios K. Apostolidis, Leontios J. Hadjileontiadis. 5090-5094 [doi]

Approximate Weighted C R Coded Matrix MultiplicationNeophytos Charalambides, Mert Pilanci, Alfred O. Hero III. 5095-5099 [doi]

Periodic Signal Denoising: An Analysis-Synthesis Framework Based on Ramanujan Filter Banks and DictionariesPranav Kulkarni, P. P. Vaidyanathan. 5100-5104 [doi]

Compressive Signal Recovery Under Sensing Matrix Errors Combined With Unknown Measurement GainsJian Vora, Ajit Rajwade 0001. 5105-5109 [doi]

Grid Optimization for Matrix-Based Source Localization Under Inhomogeneous Sensor TopologyHao Sun, Junting Chen. 5110-5114 [doi]

MSR-GAN: Multi-Segment Reconstruction via Adversarial LearningMona Zehni, Zhizhen Zhao. 5115-5119 [doi]

Count Sketch with Zero Checking: Efficient Recovery of Heavy ComponentsGuanqiang Zhou, Zhi Tian. 5120-5124 [doi]

Numerical Solution of Stochastic Differential Equations in Stiefel Manifolds via Tangent Space ParametrizationZhichao Wang, Victor Solo. 5125-5129 [doi]

On The Accuracy Limit of Joint Time-Delay/Doppler/Acceleration Estimation with a Band-Limited SignalH. McPhee, L. Ortega, Jordi Vilà-Valls, Eric Chaumette. 5130-5134 [doi]

Automatic Order Selection in Autoregressive Modeling with Application in EEG Sleep-Stage ClassificationFarah Nassif, Soosan Beheshti. 5135-5139 [doi]

New Variants of DFA Based on Loess and Lowess Methods: Generalization of the Detrending Moving AverageBastien Berthelot, Éric Grivel, Pierrick Legrand. 5140-5144 [doi]

Parameter Estimation for Student's t VAR Model with Missing DataRui Zhou, Junyan Liu, Sandeep Kumar 0005, Daniel P. Palomar. 5145-5149 [doi]

Fast and Robust ADMM for Blind Super-ResolutionYifan Ran, Wei Dai. 5150-5154 [doi]

Nonstationary Portfolios: Diversification in the Spectral DomainBruno Scalzo, Alvaro Arroyo, LJubisa Stankovic, Danilo P. Mandic. 5155-5159 [doi]

A Tyler-Type Estimator of Location and Scatter Leveraging Riemannian OptimizationAntoine Collas, Florent Bouchard, Arnaud Breloy, C. Ren, Guillaume Ginolhac, Jean Philippe Ovarlez. 5160-5164 [doi]

Statistical Properties of a Modified Welch Method That Uses Sample PercentilesFelix Schwock, Shima Abadi. 5165-5169 [doi]

Switched Hawkes ProcessesNamrata Nadagouda, Mark A. Davenport. 5170-5174 [doi]

An Adaptive Regularization Approach to Portfolio OptimizationTarig Ballal, Abdelrahman S. Abdelrahman, Ali H. Muqaibel, Tareq Y. Al-Naffouri. 5175-5179 [doi]

Active Estimation From Multimodal DataArpan Mukherjee, Ali Tajer, Pin-Yu Chen, Payel Das. 5180-5184 [doi]

Network Classifiers Based on Social LearningVirginia Bordignon, Stefan Vlaski, Vincenzo Matta, Ali H. Sayed. 5185-5189 [doi]

Bayes-Optimal Methods for Finding the Source of a CascadeAnirudh Sridhar, H. Vincent Poor. 5190-5194 [doi]

Private Wireless Federated Learning with Anonymous Over-the-Air ComputationBurak Hasircioglu, Deniz Gündüz. 5195-5199 [doi]

Scalable Multilevel Quantization for Distributed DetectionGökhan Gül, Michael Baßler. 5200-5204 [doi]

Stability of Algebraic Neural Networks to Small PerturbationsAlejandro Parada-Mayorga, Alejandro Ribeiro. 5205-5209 [doi]

Resolution Limits of 20 Questions Search Strategies for Moving TargetsLin Zhou, Alfred Hero. 5210-5214 [doi]

Gramian-Based Adaptive Combination Policies for Diffusion Learning Over NetworksY. Efe Erginbas, Stefan Vlaski, Ali H. Sayed. 5215-5219 [doi]

Graph-Adaptive Incremental Learning Using an Ensemble of Gaussian Process ExpertsKonstantinos D. Polyzos, Qin Lu 0002, Georgios B. Giannakis. 5220-5224 [doi]

Online Learning of Time-Varying Signals and GraphsStefania Sardellitti, Sergio Barbarossa, Paolo Di Lorenzo. 5230-5234 [doi]

Kernel Regression on Graphs in Random Fourier Features SpaceVitor R. M. Elias, Vinay Chakravarthi Gogineni, Wallace A. Martins, Stefan Werner 0001. 5235-5239 [doi]

Graph-Homomorphic Perturbations for Private Decentralized LearningStefan Vlaski, Ali H. Sayed. 5240-5244 [doi]

Variance-Constrained Learning for Stochastic Graph Neural NetworksZhan Gao, Elvin Isufi, Alejandro Ribeiro. 5245-5249 [doi]

Graph Neural Network for Large-Scale Network LocalizationWenzhong Yan, Di Jin, Zhidi Lin, Feng Yin. 5250-5254 [doi]

Graphon and Graph Neural Network StabilityLuana Ruiz, Zhiyang Wang, Alejandro Ribeiro. 5255-5259 [doi]

Fast Decentralized Linear Functions Via Successive Graph Shift OperatorsSiavash Mollaebrahim, Daniel Romero 0004, Baltasar Beferull-Lozano. 5255-5259 [doi]

Graph Neural Networks for Decentralized ControllersFernando Gama, Ekaterina I. Tolstaya, Alejandro Ribeiro. 5260-5264 [doi]

Nonlinear State-Space Generalizations of Graph Convolutional Neural NetworksLuana Ruiz, Fernando Gama, Alejandro Ribeiro, Elvin Isufi. 5265-5269 [doi]

Wide and Deep Graph Neural Networks with Distributed Online LearningZhan Gao, Alejandro Ribeiro, Fernando Gama. 5270-5274 [doi]

Design of Graph Signal Sampling Matrices for Arbitrary Signal SubspacesJunya Hara, Koki Yamada, Shunsuke Ono, Yuichi Tanaka 0001. 5275-5279 [doi]

Graph Signal Denoising Using Nested-Structured Deep Algorithm UnrollingMasatoshi Nagahama, Koki Yamada, Yuichi Tanaka 0001, Stanley H. Chan, Yonina C. Eldar. 5280-5284 [doi]

Identifying First-Order Lowpass Graph Signals Using Perron Frobenius TheoremYiran He, Hoi-To Wai. 5285-5289 [doi]

Graph Signal Denoising Via Unrolling NetworksSiheng Chen, Yonina C. Eldar. 5290-5294 [doi]

Adaptive Subsampling of Multidomain Signals with Product GraphsThéo Gnassounou, Pierre Humbert, Laurent Oudre. 5295-5299 [doi]

Robust Graph-Filter Identification with Graph Denoising RegularizationSamuel Rey, Antonio G. Marques. 5300-5304 [doi]

Fast and Provable Robust PCA VIA Normalized Coherence PursuitMostafa Rahmani, Ping Li. 5305-5309 [doi]

Aligning Sets of Temporal Signals with Riemannian Geometry and Koopman OperatorOhad Rahamim, Ronen Talmon. 5310-5314 [doi]

Weight Identification Through Global Optimization in a New Hysteretic Neural Network ModelElie Leroy, Arthur Marmin, Marc Castella, Laurent Duval. 5315-5319 [doi]

Multiview Variational Graph Autoencoders for Canonical Correlation AnalysisYacouba Kaloga, Pierre Borgnat, Sundeep Prabhakar Chepuri, Patrice Abry, Amaury Habrard. 5320-5324 [doi]

Cognitive Memory Constrained Human Decision Making based on Multi-source InformationBaocheng Geng, Quan Chen, Pramod K. Varshney. 5325-5329 [doi]

Binary Control and Digital-to-Analog Conversion Using Composite NUV Priors and Iterative Gaussian Message PassingRaphael Keusch, Hampus Malmberg, Hans-Andrea Loeliger. 5330-5334 [doi]

Outlier-Robust Kernel Hierarchical-Optimization RLS on a Budget with Affine ConstraintsKonstantinos Slavakis, Masahiro Yukawa. 5335-5339 [doi]

Adaptive Real-Time Filter for Partially-Observed Boolean Dynamical SystemsMahdi Imani, Seyede Fatemeh Ghoreishi. 5340-5344 [doi]

Improving the Energy-Efficiency of a Kalman Filter Using Unreliable MemoriesJonathan Kern, Elsa Dupraz, Abdeldjalil Aïssa-El-Bey, François Leduc-Primeau. 5345-5349 [doi]

Parallel Iterated Extended and Sigma-Point Kalman SmoothersFatemeh Yaghoobi, Adrien Corenflos, Sakira Hassan, Simo Särkkä. 5350-5354 [doi]

Wiener Filter on Meet/Join LatticesBastian Seifert, Chris Wendler, Markus Püschel. 5355-5359 [doi]

Learning Bollobás-Riordan Graphs Under Partial ObservabilityMichele Cirillo, Vincenzo Matta, Ali H. Sayed. 5360-5364 [doi]

Learning Sparse Graph Laplacian with K Eigenvector Prior via Iterative Glasso and ProjectionSaghar Bagheri, Gene Cheung, Antonio Ortega, Fen Wang. 5365-5369 [doi]

Learning Mixed Membership from Adjacency Graph Via Systematic Edge Query: Identifiability and AlgorithmShahana Ibrahim, Xiao Fu 0001. 5370-5374 [doi]

Convergence Analysis of the Graph-Topology-Inference Kernel LMS AlgorithmMircea Moscu, Ricardo Augusto Borsoi, Cédric Richard. 5375-5379 [doi]

An Efficient Alternating Direction Method for Graph Learning from Smooth SignalsXiaolu Wang, Chaorui Yao, Haoyu Lei, Anthony Man-Cho So. 5380-5384 [doi]

Topological Volterra FiltersGeert Leus, Maosheng Yang, Mario Coutino, Elvin Isufi. 5385-5399 [doi]

Network Topology Inference with Graphon Spectral PenaltiesT. Mitchell Roddenberry, Madeline Navarro, Santiago Segarra. 5390-5394 [doi]

Network Topology Change-Point Detection from Graph Signals with Prior Spectral SignaturesChiraag Kaushik, T. Mitchell Roddenberry, Santiago Segarra. 5395-5399 [doi]

Online Time-Varying Topology Identification Via Prediction-Correction AlgorithmsAlberto Natali, Mario Coutino, Elvin Isufi, Geert Leus. 5400-5404 [doi]

Graph Learning Under Spectral Sparsity ConstraintsB. Subbareddy, Aditya Siripuram, Jingxin Zhang 0001. 5405-5409 [doi]

A Graph Learning Algorithm Based On Gaussian Markov Random Fields And Minimax Concave PenaltyTatsuya Koyakumaru, Masahiro Yukawa, Eduardo Pavez, Antonio Ortega. 5410-5414 [doi]

Figlearn: Filter and Graph Learning Using Optimal TransportMatthias Minder, Zahra Farsijani, Dhruti Shah, Mireille El Gheche, Pascal Frossard. 5415-5419 [doi]

Construction of Unit-Norm Tight Frame Based Preconditioner for Sparse CodingHuang Bai, Chuanrong Hong, Xiumei Li. 5420-5424 [doi]

Sparse High-Order Portfolios Via Proximal Dca And ScaJinxin Wang, Zengde Deng, Taoli Zheng, Anthony Man-Cho So. 5425-5429 [doi]

A Convex Penalty for Block-Sparse Signals with Unknown StructuresHiroki Kuroda, Daichi Kitahara, Akira Hirabayashi. 5430-5434 [doi]

Event-Driven Modulo SamplingDorian Florescu, Felix Krahmer, Ayush Bhandari. 5435-5439 [doi]

No Relaxation: Guaranteed Recovery of Finite-Valued Signals from Undersampled MeasurementsPulak Sarangi, Piya Pal. 5440-5444 [doi]

Error Estimates in Second-Order Continuous-Time Sigma-Delta ModulatorsDilshad Surroop, Pascal Combes, Philippe Martin 0001. 5445-5448 [doi]

Banraw: Band-Limited Radar Waveform Design Via Phase RetrievalSamuel Pinilla, Kumar Vijay Mishra, Brian M. Sadler, Henry Arguello. 5449-5453 [doi]

Sub-NYQUIST Multichannel Blind DeconvolutionSatish Mulleti, Kiryung Lee, Yonina C. Eldar. 5454-5458 [doi]

Modified Arcsine Law for One-Bit Sampled Stationary Signals with Time-Varying ThresholdsArian Eamaz, Farhang Yeganegi, Mojtaba Soltanalian. 5459-5463 [doi]

Near-Optimal Resampling in Particle Filters Using the Ising Energy ModelMuhammed Tahsin Rahman, Mohammad Javad-Kalbasi, Shahrokh Valaee. 5464-5468 [doi]

Time-Domain Concentration and Approximation of Computable Bandlimited SignalsHolger Boche, Ullrich J. Mönich. 5469-5473 [doi]

Guaranteed Reconstruction from Integrate-and-Fire Neurons with Alpha Synaptic ActivationMarek Hilton, Roxana Alexandru, Pier Luigi Dragotti. 5474-5478 [doi]

Social Learning Under Inferential AttacksKonstantinos Ntemos, Virginia Bordignon, Stefan Vlaski, Ali H. Sayed. 5479-5483 [doi]

Segregation in Social Networks: MARKOV Bridge Models and EstimationVikram Krishnamurthy, Rui Luo, Buddhika Nettasinghe. 5484-5488 [doi]

Controlled Testing and Isolation for Suppressing Covid-19Kobi Cohen, Amir Leshem. 5489-5493 [doi]

Two-Stage Graph-Constrained Group Testing: Theory and ApplicationSaurabh Sihag, Ali Tajer, Urbashi Mitra. 5494-5498 [doi]

Unveiling Anomalous Nodes Via Random Sampling and Consensus on GraphsVassilis N. Ioannidis, Dimitris Berberidis, Georgios B. Giannakis. 5499-5503 [doi]

Estimating Fiedler Value on Large Networks Based on Random Walk ObservationsAlexandre Reiffers-Masson, Thierry Chonavel, Yezekael Hayel. 5504-5508 [doi]

Orthogonality and Zero DC Tradeoffs in Biorthogonal Graph FilterbanksDion Eustathios Olivier Tzamarias, Eduardo Pavez, Benjamin Girault, Antonio Ortega, Ian Blanes, Joan Serra-Sagristà. 5509-5513 [doi]

Graph Signal Compression via Task-Based QuantizationPei Li, Nir Shlezinger, Haiyang Zhang, Baoyun Wang, Yonina C. Eldar. 5514-5518 [doi]

A Partially Collapsed Gibbs Sampler for Unsupervised Nonnegative Sparse Signal RestorationM. C. Amrouche, Hervé Carfantan, Jérôme Idier. 5519-5523 [doi]

A Structure-Guided and Sparse-Representation-Based 3d Seismic Inversion MethodBin She, Yaojun Wang, Guangmin Hu. 5524-5528 [doi]

Accelerating Frank-Wolfe with Weighted Average GradientsYilang Zhang, Bingcong Li, Georgios B. Giannakis. 5529-5533 [doi]

Yapa: Accelerated Proximal Algorithm for Convex Composite ProblemsGiovanni Chierchia, Mireille El Gheche. 5534-5538 [doi]

Data Discovery Using Lossless Compression-Based Sparse RepresentationElyas Sabeti, Peter X. K. Song, Alfred O. Hero III. 5539-5543 [doi]

Safe Screening for Sparse Regression with the Kullback-Leibler DivergenceCássio F. Dantas, Emmanuel Soubies, Cédric Févotte. 5544-5548 [doi]

On the Convergence of Randomized Bregman Coordinate Descent for Non-Lipschitz Composite ProblemsTianxiang Gao, Songtao Lu, Jia Liu 0002, Chris Chu. 5549-5553 [doi]

A Global Cayley Parametrization of Stiefel Manifold for Direct Utilization of Optimization Mechanisms Over Vector SpacesKeita Kume, Isao Yamada. 5554-5558 [doi]

Training Logical Neural Networks by Primal-Dual Methods for Neuro-Symbolic ReasoningSongtao Lu, Naweed Khan, Ismail Yunus Akhalwaya, Ryan Riegel, Lior Horesh, Alexander G. Gray. 5559-5563 [doi]

Cooperative Parameter Tracking on the Unit Sphere Using Distributed Adapt-Then-Combine Particle Filters and Parallel TransportCaio Gomes de Figueredo, Claudio J. Bordin, Marcelo G. S. Bruno. 5564-5568 [doi]

Bayesian Estimation of a Tail-Index with Marginalized ThresholdDouglas E. Johnston, Petar M. Djuric. 5569-5573 [doi]

Block Kalman Filter: An Asymptotic Block Particle Filter in the Linear Gaussian CaseRui Min, Christelle Garnier, François Septier, John Klein. 5574-5578 [doi]

Particle Gibbs Sampling for Regime-Switching State-Space ModelsYousef El-Laham, Liu Yang, Heather J. Lynch, Petar M. Djuric, Mónica F. Bugallo. 5579-5583 [doi]

Adaptive Importance Sampling Via Auto-Regressive Generative Models and Gaussian ProcessesHechuan Wang, Mónica F. Bugallo, Petar M. Djuric. 5584-5588 [doi]

Variational Parameter Learning in Sequential State-Space Model Via Particle FilteringChenhao Li, Simon J. Godsill. 5589-5593 [doi]

Correlation-Based Robust Linear Regression with Iterative Outlier RemovalJian Ding, Jianji Wang, Yue Zhang, Yuanjie Li, Nanning Zheng. 5594-5598 [doi]

On the Optimality of Backward Regression: Sparse Recovery and Subset SelectionSebastian Ament, Carla Gomes. 5599-5603 [doi]

General Total Variation Regularized Sparse Bayesian Learning for Robust Block-Sparse Signal RecoveryAditya Sant, Markus Leinonen, Bhaskar D. Rao. 5604-5608 [doi]

Automatic Registration and Clustering of Time SeriesMichael Weylandt, George Michailidis. 5609-5613 [doi]

Low-Rank on Graphs Plus Temporally Smooth Sparse Decomposition for Anomaly Detection in Spatiotemporal DataSeyyid Emre Sofuoglu, Selin Aviyente. 5614-5618 [doi]

A Parallel Algorithm for Phase Retrieval with Dictionary LearningTianyi Liu, Andreas M. Tillmann, Yang Yang 0033, Yonina C. Eldar, Marius Pesavento. 5619-5623 [doi]

Improving RNN Transducer Modeling for Small-Footprint Keyword SpottingYao Tian, Haitao Yao, Meng Cai, Yaming Liu, Zejun Ma. 5624-5628 [doi]

Cascaded Encoders for Unifying Streaming and Non-Streaming ASRArun Narayanan, Tara N. Sainath, Ruoming Pang, Jiahui Yu, Chung-Cheng Chiu, Rohit Prabhavalkar, Ehsan Variani, Trevor Strohman. 5629-5633 [doi]

A Better and Faster end-to-end Model for Streaming ASRBo Li 0028, Anmol Gulati, Jiahui Yu, Tara N. Sainath, Chung-Cheng Chiu, Arun Narayanan, Shuo-Yiin Chang, Ruoming Pang, Yanzhang He, James Qin, Wei Han 0002, Qiao Liang, Yu Zhang, Trevor Strohman, Yonghui Wu. 5634-5638 [doi]

Efficient Knowledge Distillation for RNN-Transducer ModelsSankaran Panchapagesan, Daniel S. Park, Chung-Cheng Chiu, Yuan Shangguan, Qiao Liang, Alexander Gruenstein. 5639-5643 [doi]

Phoneme Based Neural Transducer for Large Vocabulary Speech RecognitionWei Zhou, Simon Berger, Ralf Schlüter, Hermann Ney. 5644-5648 [doi]

RNN-T Based Open-Vocabulary Keyword Spotting in Mandarin with Multi-Level DetectionZuozhen Liu, Ta Li, Pengyuan Zhang. 5649-5653 [doi]

Advancing RNN Transducer Technology for Speech RecognitionGeorge Saon, Zoltán Tüske, Daniel Bolaños, Brian Kingsbury. 5654-5658 [doi]

Less is More: Improved RNN-T Decoding Using Limited Label Context and Path MergingRohit Prabhavalkar, Yanzhang He, David Rybach, Sean Campbell, Arun Narayanan, Trevor Strohman, Tara N. Sainath. 5659-5663 [doi]

Simpleflat: A Simple Whole-Network Pre-Training Approach for RNN Transducer-Based End-to-End Speech RecognitionTakafumi Moriya, Takanori Ashihara, Tomohiro Tanaka, Tsubasa Ochiai, Hiroshi Sato, Atsushi Ando, Yusuke Ijima, Ryo Masumura, Yusuke Shinohara. 5664-5668 [doi]

Echo State Speech RecognitionHarsh Shrivastava, Ankush Garg, Yuan Cao, Yu Zhang, Tara N. Sainath. 5669-5673 [doi]

Using Synthetic Audio to Improve the Recognition of Out-of-Vocabulary Words in End-to-End Asr SystemsXianrui Zheng, Yulan Liu, Deniz Gunceler, Daniel Willett. 5674-5678 [doi]

Wave-Tacotron: Spectrogram-Free End-to-End Text-to-Speech SynthesisRon J. Weiss, R. J. Skerry-Ryan, Eric Battenberg, Soroosh Mariooryad, Diederik P. Kingma. 5679-5683 [doi]

Patnet : A Phoneme-Level Autoregressive Transformer Network for Speech SynthesisShiming Wang, Zhenhua Ling, Ruibo Fu, Jiangyan Yi, Jianhua Tao. 5684-5688 [doi]

Multi-Rate Attention Architecture for Fast Streamable Text-to-Speech Spectrum ModelingQing He, Zhiping Xiu, Thilo Köhler, Jilong Wu. 5689-5693 [doi]

End-to-End Text-to-Speech Using Latent Duration Based on VQ-VAEYusuke Yasuda, Xin Wang, Junichi Yamagishi. 5694-5698 [doi]

Lightspeech: Lightweight and Fast Text to Speech with Neural Architecture SearchRenqian Luo, Xu Tan 0003, Rui Wang, Tao Qin, Jinzhu Li, Sheng Zhao, Enhong Chen, Tie-Yan Liu. 5699-5703 [doi]

A New High Quality Trajectory Tiling Based Hybrid TTS In Real TimeFeng-Long Xie, Xinhui Li, Wen-Chao Su, Li Lu, Frank K. Soong. 5704-5708 [doi]

Parallel Tacotron: Non-Autoregressive and Controllable TTSIsaac Elias, Heiga Zen, Jonathan Shen, Yu Zhang, Ye Jia, Ron J. Weiss, Yonghui Wu. 5709-5713 [doi]

Fcl-Taco2: Towards Fast, Controllable and Lightweight Text-to-Speech SynthesisDisong Wang, Liqun Deng, Yang Zhang, Nianzu Zheng, Yu Ting Yeung, Xiao Chen, Xunying Liu, Helen Meng. 5714-5718 [doi]

Prosodic Clustering for Phoneme-Level Prosody Control in End-to-End Speech SynthesisAlexandra Vioni, Myrsini Christidou, Nikolaos Ellinas, Georgios Vamvoukakis, Panos Kakoulidis, Taehoon Kim, June Sig Sung, Hyoungmin Park, Aimilios Chalamandaris, Pirros Tsiakoulis. 5719-5723 [doi]

Improving Naturalness and Controllability of Sequence-to-Sequence Speech Synthesis by Learning Local Prosody RepresentationsCheng Gong, Longbiao Wang, Zhenhua Ling, Shaotong Guo, Ju Zhang 0001, Jianwu Dang. 5724-5728 [doi]

Multi-Speaker Emotional Speech Synthesis with Fine-Grained Prosody ModelingChunhui Lu, Xue Wen, Ruolan Liu, Xiao Chen. 5729-5733 [doi]

Emotion Controllable Speech Synthesis Using Emotion-Unlabeled Dataset with the Assistance of Cross-Domain Speech Emotion RecognitionXiong Cai, Dongyang Dai, Zhiyong Wu 0001, Xiang Li, Jingbei Li, Helen Meng. 5734-5738 [doi]

Dual-Path Modeling for Long Recording Speech Separation in MeetingsChenda Li, Zhuo Chen, Yi Luo, Cong Han, Tianyan Zhou, Keisuke Kinoshita, Marc Delcroix, Shinji Watanabe 0001, Yanmin Qian. 5739-5743 [doi]

Time-Domain Loss Modulation Based on Overlap Ratio for Monaural Conversational Speaker SeparationHassan Taherian, DeLiang Wang. 5744-5748 [doi]

Continuous Speech Separation with ConformerSanyuan Chen, Yu Wu, Zhuo Chen, Jian Wu, Jinyu Li 0001, Takuya Yoshioka, Chengyi Wang 0002, Shujie Liu 0001, Ming Zhou 0001. 5749-5753 [doi]

A Flow-Based Neural Network for Time Domain Speech EnhancementMartin Strauss 0003, Bernd Edler. 5754-5758 [doi]

Sandglasset: A Light Multi-Granularity Self-Attentive Network for Time-Domain Speech SeparationMax W. Y. Lam, Jun Wang, Dan Su, Dong Yu. 5759-5763 [doi]

TransMask: A Compact and Fast Speech Separation Model Based on TransformerZining Zhang, Bingsheng He, Zhenjie Zhang. 5764-5768 [doi]

One Shot Learning for Speech SeparationYuan-Kuei Wu, Kuan-Po Huang, Yu Tsao 0001, Hung-yi Lee. 5769-5773 [doi]

Training Noisy Single-Channel Speech Separation with Noisy Oracle Sources: A Large Gap and a Small StepMatthew Maciejewski, Jing Shi 0003, Shinji Watanabe, Sanjeev Khudanpur. 5774-5778 [doi]

Speaker and Direction Inferred Dual-Channel Speech SeparationChenxing Li, Jiaming Xu 0001, Nima Mesgarani, Bo Xu 0002. 5779-5783 [doi]

Speech Dereverberation Using Variational AutoencodersDeepak Baby, Hervé Bourlard. 5784-5788 [doi]

Real-Time Denoising and Dereverberation wtih Tiny Recurrent U-NetHyeong-Seok Choi, Sungjin Park, Jie Hwan Lee, Hoon Heo, Dongsuk Jeon, Kyogu Lee. 5789-5793 [doi]

Weighted Magnitude-Phase Loss for Speech DereverberationJingshu Zhang, Mark D. Plumbley, Wenwu Wang. 5794-5798 [doi]

Speaker Embeddings for Diarization of Broadcast Data In The Allies ChallengeAnthony Larcher, Ambuj Mehrish, Marie Tahon, Sylvain Meignier, Jean Carrive, David Doukhan, Olivier Galibert, Nicholas W. D. Evans. 5799-5803 [doi]

On the Detection of Pitch-Shifted Voice: Machines and Human ListenersDavid Looney, Nikolay D. Gaubitch. 5804-5808 [doi]

The ins and outs of speaker recognition: lessons from VoxSRC 2020Yoohwan Kwon, Hee-Soo Heo, Bong-Jin Lee, Joon Son Chung. 5809-5813 [doi]

The Idlab Voxsrc-20 Submission: Large Margin Fine-Tuning and Quality-Aware Score Calibration in DNN Based Speaker VerificationJenthe Thienpondt, Brecht Desplanques, Kris Demuynck. 5814-5818 [doi]

Analysis of the but Diarization System for Voxconverse ChallengeFederico Landini, Ondrej Glembek, Pavel Matejka, Johan Rohdin, Lukás Burget, Mireia Díez, Anna Silnova. 5819-5823 [doi]

Microsoft Speaker Diarization System for the Voxceleb Speaker Recognition Challenge 2020Xiong Xiao, Naoyuki Kanda, Zhuo Chen 0006, Tianyan Zhou, Takuya Yoshioka, Sanyuan Chen, Yong Zhao 0008, Gang Liu, Yu Wu 0012, Jian Wu, Shujie Liu 0001, Jinyu Li 0001, Yifan Gong 0001. 5824-5828 [doi]

Squeezing Value of Cross-Domain Labels: A Decoupled Scoring Approach for Speaker VerificationLantian Li, Yang Zhang 0052, Jiawen Kang, Thomas Fang Zheng, Dong Wang 0013. 5829-5833 [doi]

Self-Supervised Learning Based Domain Adaptation for Robust Speaker VerificationZhengyang Chen, Shuai Wang, Yanmin Qian. 5834-5838 [doi]

Meta-Learning for Cross-Channel Speaker VerificationHanyi Zhang, Longbiao Wang, Kong-Aik Lee, Meng Liu, Jianwu Dang, Hui Chen. 5839-5843 [doi]

SynAug: Synthesis-Based Data Augmentation for Text-Dependent Speaker VerificationChenpeng Du, Bing Han, Shuai Wang, Yanmin Qian, Kai Yu 0004. 5844-5848 [doi]

Unit Selection Synthesis Based Data Augmentation for Fixed Phrase Speaker VerificationHoujun Huang, Xu Xiang, Fei Zhao, Shuai Wang, Yanmin Qian. 5849-5853 [doi]

Improving Speaker Verification in Reverberant EnvironmentsXiao Chen, Stephen A. Zahorian. 5854-5858 [doi]

Transformer-Transducers for Code-Switched Speech RecognitionSiddharth Dalmia, Yuzong Liu, Srikanth Ronanki, Katrin Kirchhoff. 5859-5863 [doi]

Wake Word Detection with Streaming TransformersYiming Wang, Hang Lv 0001, Daniel Povey, Lei Xie 0001, Sanjeev Khudanpur. 5864-5868 [doi]

Capturing Multi-Resolution Context by Dilated Self-AttentionNiko Moritz, Takaaki Hori, Jonathan Le Roux. 5869-5873 [doi]

Recent Developments on Espnet Toolkit Boosted By ConformerPengcheng Guo, Florian Boyer, Xuankai Chang, Tomoki Hayashi, Yosuke Higuchi, Hirofumi Inaguma, Naoyuki Kamo, Chenda Li, Daniel Garcia-Romero, Jiatong Shi, Jing Shi 0003, Shinji Watanabe 0001, Kun Wei, Wangyou Zhang, Yuekai Zhang. 5874-5878 [doi]

Hierarchical Transformer-Based Large-Context End-To-End ASR with Large-Context Knowledge DistillationRyo Masumura, Naoki Makishima, Mana Ihori, Akihiko Takashima, Tomohiro Tanaka, Shota Orihashi. 5879-5883 [doi]

End-to-End Multi-Channel Transformer for Speech RecognitionFeng-Ju Chang, Martin Radfar, Athanasios Mouchtaris, Brian King, Siegfried Kunzmann. 5884-5888 [doi]

CASS-NAT: CTC Alignment-Based Single Step Non-Autoregressive Transformer for Speech RecognitionRuchao Fan, Wei Chu, Peng Chang, Jing Xiao 0006. 5889-5893 [doi]

Non-Autoregressive Transformer ASR with CTC-Enhanced Decoder InputXingchen Song, Zhiyong Wu 0001, Yiheng Huang, Chao Weng, Dan Su 0002, Helen M. Meng. 5894-5898 [doi]

Transformer-Based End-to-End Speech Recognition with Local Dense Synthesizer AttentionMenglong Xu, Shengqiang Li, Xiao-lei Zhang. 5899-5903 [doi]

Developing Real-Time Streaming Transformer Transducer for Speech Recognition on Large-Scale DatasetXie Chen, Yu Wu 0012, Zhenghao Wang, Shujie Liu 0001, Jinyu Li 0001. 5904-5908 [doi]

Head-Synchronous Decoding for Transformer-Based Streaming ASRMohan Li, Catalin Zorila, Rama Doddipatla. 5909-5913 [doi]

History Utterance Embedding Transformer LM for Speech RecognitionKeqi Deng, Gaofeng Cheng, Haoran Miao, Pengyuan Zhang, Yonghong Yan 0002. 5914-5918 [doi]

Maskcyclegan-VC: Learning Non-Parallel Voice Conversion with Filling in FramesTakuhiro Kaneko, Hirokazu Kameoka, Kou Tanaka, Nobukatsu Hojo. 5919-5923 [doi]

Non-Parallel Many-To-Many Voice Conversion by Knowledge Transfer from a Text-To-Speech ModelXinyuan Yu, Brian Mak. 5924-5928 [doi]

Non-Parallel Many-To-Many Voice Conversion Using Local Linguistic TokensChao Wang, Yibiao Yu. 5929-5933 [doi]

Crank: An Open-Source Software for Nonparallel Voice Conversion Based on Vector-Quantized Variational AutoencoderKazuhiro Kobayashi, Wen-Chin Huang, Yi-Chiao Wu, Patrick Lumban Tobing, Tomoki Hayashi, Tomoki Toda. 5934-5938 [doi]

Fragmentvc: Any-To-Any Voice Conversion by End-To-End Extracting and Fusing Fine-Grained Voice Fragments with AttentionYist Y. Lin, Chung-Ming Chien, Jheng-Hao Lin, Hung-yi Lee, Lin-Shan Lee. 5939-5943 [doi]

Any-to-One Sequence-to-Sequence Voice Conversion Using Self-Supervised Discrete Speech RepresentationsWen-Chin Huang, Yi-Chiao Wu, Tomoki Hayashi. 5944-5948 [doi]

Towards Low-Resource Stargan Voice Conversion Using Weight Adaptive Instance NormalizationMingjie Chen, Yanpei Shi, Thomas Hain. 5949-5953 [doi]

Again-VC: A One-Shot Voice Conversion Using Activation Guidance and Adaptive Instance NormalizationYen-Hao Chen, Da-Yi Wu, Tsung-Han Wu, Hung-yi Lee. 5954-5958 [doi]

One-Shot Voice Conversion Based on Speaker Aware ModuleYing Zhang, Hao Che, Jie Li, Chenxing Li, Xiaorui Wang, Zhongyuan Wang. 5959-5963 [doi]

Zero-Shot Voice Conversion with Adjusted Speaker Embeddings and Simple Acoustic FeaturesZhiyuan Tan, Jianguo Wei, Junhai Xu, Yuqing He, Wenhuan Lu. 5964-5968 [doi]

Towards Natural and Controllable Cross-Lingual Voice Conversion Based on Neural TTS Model and Phonetic PosteriorgramShengkui Zhao, Hao Wang, Trung Hieu Nguyen, Bin Ma. 5969-5973 [doi]

Meta-Learning for Improving Rare Word Recognition in End-to-End ASRFlorian Lux, Ngoc Thang Vu. 5974-5978 [doi]

A Comparison of Methods for OOV-Word Recognition on a New Public DatasetRudolf A. Braun, Srikanth R. Madikeri, Petr Motlícek. 5979-5983 [doi]

Convolutional Dropout and Wordpiece Augmentation for End-to-End Speech RecognitionHainan Xu, Yinghui Huang, Yun Zhu, Kartik Audhkhasi, Bhuvana Ramabhadran. 5984-5988 [doi]

Partially Overlapped Inference for Long-Form Speech RecognitionTae Gyoon Kang, Ho-Gyeong Kim, Min-Joong Lee, Jihyun Lee, Hoshik Lee. 5989-5993 [doi]

Focus on the Present: A Regularization Method for the ASR Source-Target Attention LayerNanxin Chen, Piotr Zelasko, Jesús Villalba, Najim Dehak. 5994-5998 [doi]

Bifocal Neural ASR: Exploiting Keyword Spotting for Inference OptimizationJon Macoskey, Grant P. Strimel, Ariya Rastrow. 5999-6003 [doi]

FastEmit: Low-Latency Streaming ASR with Sequence-Level Emission RegularizationJiahui Yu, Chung-Cheng Chiu, Bo Li 0028, Shuo-Yiin Chang, Tara N. Sainath, Yanzhang He, Arun Narayanan, Wei Han 0002, Anmol Gulati, Yonghui Wu, Ruoming Pang. 6004-6008 [doi]

Sparsification via Compressed Sensing for Automatic Speech RecognitionKai Zhen, Hieu Duy Nguyen, Feng-Ju Chang, Athanasios Mouchtaris, Ariya Rastrow. 6009-6013 [doi]

Dynamic Sparsity Neural Networks for Automatic Speech RecognitionZhaofeng Wu, Ding Zhao, Qiao Liang, Jiahui Yu, Anmol Gulati, Ruoming Pang. 6014-6018 [doi]

An Asynchronous WFST-Based Decoder for Automatic Speech RecognitionHang Lv 0001, Zhehuai Chen, Hainan Xu, Daniel Povey, Lei Xie 0001, Sanjeev Khudanpur. 6019-6023 [doi]

Tiny Transducer: A Highly-Efficient Speech Recognition Model on Edge DevicesYuekai Zhang, Sining Sun, Long Ma. 6024-6028 [doi]

Noise Level Limited Sub-Modeling for Diffusion Probabilistic VocodersTakuma Okamoto, Tomoki Toda, Yoshinori Shiga, Hisashi Kawai. 6029-6033 [doi]

StyleMelGAN: An Efficient High-Fidelity Adversarial Vocoder with Temporal Adaptive NormalizationAhmed Mustafa, Nicola Pia, Guillaume Fuchs. 6034-6038 [doi]

Parallel Waveform Synthesis Based on Generative Adversarial Networks with Voicing-Aware Conditional DiscriminatorsRyuichi Yamamoto, Eunwoo Song, Min-Jae Hwang, Jae Min Kim. 6039-6043 [doi]

Universal Neural Vocoding with Parallel WavenetYunlong Jiao, Adam Gabrys, Georgi Tinchev, Bartosz Putrycz, Daniel Korzekwa, Viacheslav Klimkov. 6044-6048 [doi]

Periodnet: A Non-Autoregressive Waveform Generation Model with a Structure Separating Periodic and Aperiodic ComponentsYukiya Hono, Shinji Takaki, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, Keiichi Tokuda. 6049-6053 [doi]

LVCNet: Efficient Condition-Dependent Modeling Network for Waveform GenerationZhen Zeng, Jianzong Wang, Ning Cheng, Jing Xiao. 6054-6058 [doi]

Graphspeech: Syntax-Aware Graph Attention Network for Neural Speech SynthesisRui Liu 0008, Berrak Sisman, Haizhou Li 0001. 6059-6063 [doi]

Syntactic Representation Learning For Neural Network Based TTS with Syntactic Parse Tree TraversalChanghe Song, Jingbei Li, Yixuan Zhou, Zhiyong Wu 0001, Helen M. Meng. 6064-6068 [doi]

A Chapter-Wise Understanding System for Text-To-Speech in Chinese NovelsJunjie Pan, Lin Wu, Xiang Yin, Pengfei Wu, Chenchang Xu, Zejun Ma. 6069-6073 [doi]

A Universal Bert-Based Front-End Model for Mandarin Text-To-Speech SynthesisZilong Bai, Beibei Hu. 6074-6078 [doi]

Improving Prosody Modelling with Cross-Utterance Bert Embeddings for End-to-End Speech SynthesisGuanghui Xu, Wei Song, Zhengchen Zhang, Chao Zhang, Xiaodong He, Bowen Zhou. 6079-6083 [doi]

Time-Domain Speech Extraction with Spatial Information and Multi Speaker Conditioning MechanismJisi Zhang, Catalin Zorila, Rama Doddipatla, Jon Barker. 6084-6088 [doi]

ADL-MVDR: All Deep Learning MVDR Beamformer for Target Speech SeparationZhuohuang Zhang, Yong Xu 0004, Meng Yu 0003, Shi-Xiong Zhang, LianWu Chen, Dong Yu 0001. 6089-6093 [doi]

Multi-Channel Target Speech Extraction with Channel Decorrelation and Target Speaker AdaptationJiangyu Han, Xinyuan Zhou, Yanhua Long, Yijie Li. 6094-6098 [doi]

Speaker Activity Driven Neural Speech ExtractionMarc Delcroix, Katerina Zmolíková, Tsubasa Ochiai, Keisuke Kinoshita, Tomohiro Nakatani. 6099-6103 [doi]

Wase: Learning When to Attend for Speaker Extraction in Cocktail Party EnvironmentsYunzhe Hao, Jiaming Xu 0001, Peng Zhang, Bo Xu. 6104-6108 [doi]

Multi-Stage Speaker Extraction with Utterance and Frame-Level Reference SignalsMeng Ge, Chenglin Xu, Longbiao Wang, Eng Siong Chng, Jianwu Dang, Haizhou Li 0001. 6109-6113 [doi]

Neural Network-Based Virtual Microphone EstimatorTsubasa Ochiai, Marc Delcroix, Tomohiro Nakatani, Rintaro Ikeshita, Keisuke Kinoshita, Shoko Araki. 6114-6118 [doi]

Joint Maximum Likelihood Estimation of Power Spectral Densities and Relative Acoustic Transfer Functions for Acoustic BeamformingPoul Hoang, Zheng-Hua Tan, Jan Mark de Haan, Jesper Jensen 0001. 6119-6123 [doi]

Cue-Preserving MMSE Filter with Bayesian SNR Marginalization for Binaural Speech EnhancementStefan Thaleiser, Gerald Enzner. 6124-6128 [doi]

Blind and Neural Network-Guided Convolutional Beamformer for Joint Denoising, Dereverberation, and Source SeparationTomohiro Nakatani, Rintaro Ikeshita, Keisuke Kinoshita, Hiroshi Sawada, Shoko Araki. 6129-6133 [doi]

Real-Time Speech Enhancement for Mobile Communication Based on Dual-Channel Complex Spectral MappingKe Tan, Xueliang Zhang, DeLiang Wang. 6134-6138 [doi]

Don't Shoot Butterfly with Rifles: Multi-Channel Continuous Speech Separation with Early Exit TransformerSanyuan Chen, Yu Wu 0012, Zhuo Chen 0006, Takuya Yoshioka, Shujie Liu 0001, Jin-Yu Li 0001, Xiangzhan Yu. 6139-6143 [doi]

Double Multi-Head Attention for Speaker VerificationMiquel India, Pooyan Safari, Javier Hernando. 6144-6148 [doi]

Graph Attention Networks for Speaker VerificationJee-weon Jung, Hee-Soo Heo, Ha-Jin Yu, Joon Son Chung. 6149-6153 [doi]

Memory Layers with Multi-Head Attention Mechanisms for Text-Dependent Speaker VerificationVictoria Mingote, Antonio Miguel, Alfonso Ortega Giménez, Eduardo Lleida. 6154-6158 [doi]

FoolHD: Fooling Speaker Identification by Highly Imperceptible Adversarial DisturbancesAli Shahin Shamsabadi, Francisco Sepúlveda Teixeira, Alberto Abad, Bhiksha Raj, Andrea Cavallaro, Isabel Trancoso. 6159-6163 [doi]

Adversarial Defense for Deep Speaker Recognition Using Hybrid Adversarial TrainingMonisankha Pal, Arindam Jati, Raghuveer Peri, Chin-Cheng Hsu, Wael AbdAlmageed, Shrikanth Narayanan. 6164-6168 [doi]

DEAAN: Disentangled Embedding and Adversarial Adaptation Network for Robust Speaker Representation LearningMufan Sang, Wei Xia, John H. L. Hansen. 6169-6173 [doi]

Playing a Part: Speaker Verification at the moviesAndrew Brown 0006, Jaesung Huh, Arsha Nagrani, Joon Son Chung, Andrew Zisserman. 6174-6178 [doi]

Small Footprint Text-Independent Speaker Verification For Embedded SystemsJulien Balian, Raffaele Tavarone, Mathieu Poumeyrol, Alice Coucke. 6179-6183 [doi]

ASV-SUBTOOLS: Open Source Toolkit for Automatic Speaker VerificationFuchuan Tong, Miao Zhao, Jianfeng Zhou, Hao Lu, Zheng Li, Lin Li 0032, Qingyang Hong. 6184-6188 [doi]

DEEPTALK: Vocal Style Encoding for Speaker Recognition and Speech SynthesisAnurag Chowdhury, Arun Ross, Prabu David. 6189-6193 [doi]

A Multi-View Approach to Audio-Visual Speaker VerificationLeda Sari, Kritika Singh, Jiatong Zhou, Lorenzo Torresani, Nayan Singhal, Yatharth Saraf. 6194-6198 [doi]

Top-Down Attention in End-to-End Spoken Language UnderstandingYixin Chen, Weiyi Lu, Alejandro Mottini, Li Erran Li, Jasha Droppo, Zheng Du, Belinda Zeng. 6199-6203 [doi]

Fine-Tuning of Pre-Trained End-to-End Speech Recognition with Generative Adversarial NetworksMd. Akmal Haidar, Mehdi Rezagholizadeh. 6204-6208 [doi]

A General Multi-Task Learning Framework to Leverage Text Data for Speech to Text TasksYun Tang, Juan Pino, Changhan Wang, Xutai Ma, Dmitriy Genzel. 6209-6213 [doi]

Gaussian Kernelized Self-Attention for Long Sequence Data and its Application to CTC-Based Speech RecognitionYosuke Kashiwagi, Emiru Tsunoo, Shinji Watanabe 0001. 6214-6218 [doi]

Lattice-Free Mmi Adaptation of Self-Supervised Pretrained Acoustic ModelsApoorv Vyas, Srikanth R. Madikeri, Hervé Bourlard. 6219-6223 [doi]

Intermediate Loss Regularization for CTC-Based Speech RecognitionJaesong Lee, Shinji Watanabe 0001. 6224-6228 [doi]

Code-Switch Speech Rescoring with Monolingual DataGuoyu Liu, Lixin Cao. 6229-6233 [doi]

Mixture of Informed Experts for Multilingual Speech RecognitionNeeraj Gaur, Brian Farris, Parisa Haghani, Isabel Leal, Pedro J. Moreno, Manasa Prasad, Bhuvana Ramabhadran, Yun Zhu. 6234-6238 [doi]

Reducing Spelling Inconsistencies in Code-Switching ASR Using Contextualized CTC LossBurin Naowarat, Thananchai Kongthaworn, Korrawe Karunratanakul, Sheng-Hui Wu, Ekapol Chuangsuwanich. 6239-6243 [doi]

Multi-Dialect Speech Recognition in English Using Attention on Ensemble of ExpertsAmit Das, Kshitiz Kumar, Jian Wu. 6244-6248 [doi]

Decoupling Pronunciation and Language for End-to-End Code-Switching Automatic Speech RecognitionShuai Zhang 0014, Jiangyan Yi, Zhengkun Tian, Ye Bai, Jianhua Tao, Zhengqi Wen. 6249-6253 [doi]

AISpeech-SJTU Accent Identification System for the Accented English Speech Recognition ChallengeHoujun Huang, Xu Xiang, Yexin Yang, Rao Ma, Yanmin Qian. 6254-6258 [doi]

Meta-Learning for Low-Resource Speech Emotion RecognitionSuransh Chopra, Puneet Mathur, Ramit Sawhney, Rajiv Ratn Shah. 6259-6263 [doi]

Progressive Co-Teaching for Ambiguous Speech Emotion RecognitionYifei Yin, Yu Gu, Longshan Yao, Ying Zhou, Xuefeng Liang, He Zhang. 6264-6268 [doi]

Emotion Recognition by Fusing Time Synchronous and Time Asynchronous RepresentationsWen Wu, Chao Zhang, Philip C. Woodland. 6269-6273 [doi]

Speech Emotion Recognition Based on Listener Adaptive ModelsAtsushi Ando, Ryo Masumura, Hiroshi Sato, Takafumi Moriya, Takanori Ashihara, Yusuke Ijima, Tomoki Toda. 6274-6278 [doi]

Speech Emotion Recognition Using Semantic InformationPanagiotis Tzirakis, Anh Nguyen, Stefanos Zafeiriou, Björn W. Schuller. 6279-6283 [doi]

Compact Graph Architecture for Speech Emotion RecognitionAmir Shirian, Tanaya Guha. 6284-6288 [doi]

A Novel end-to-end Speech Emotion Recognition Network with Stacked Transformer LayersXianfeng Wang, Min Wang, Wenbo Qi, Wanqi Su, Xiangqian Wang 0001, Huan Zhou. 6289-6293 [doi]

A Novel Attention-Based Gated Recurrent Unit and its Efficacy in Speech Emotion RecognitionSrividya Tirunellai Rajamani, Kumar T. Rajamani, Adria Mallol-Ragolta, Shuo Liu, Björn W. Schuller. 6294-6298 [doi]

MAEC: Multi-Instance Learning with an Adversarial Auto-Encoder-Based Classifier for Speech Emotion RecognitionChangzeng Fu, Chaoran Liu, Carlos Toshinori Ishi, Hiroshi Ishiguro. 6299-6303 [doi]

Representation Learning with Spectro-Temporal-Channel Attention for Speech Emotion RecognitionLili Guo, Longbiao Wang, Chenglin Xu, Jianwu Dang, Eng Siong Chng, Haizhou Li 0001. 6304-6308 [doi]

Speech Emotion Recognition Using Quaternion Convolutional Neural NetworksAneesh Muppidi, Martin Radfar. 6309-6313 [doi]

Domain-Adversarial Autoencoder with Attention Based Feature Level Fusion for Speech Emotion RecognitionYuan Gao, Jiaxing Liu, Longbiao Wang, Jianwu Dang. 6314-6318 [doi]

Speech Emotion Recognition with Multiscale Area Attention and Data AugmentationMingke Xu, Fan Zhang, Xiaodong Cui, Wei Zhang. 6319-6323 [doi]

CopyPaste: An Augmentation Method for Speech Emotion RecognitionRaghavendra Pappagari, Jesús Villalba, Piotr Zelasko, Laureano Moro-Velázquez, Najim Dehak. 6324-6328 [doi]

Contrastive Unsupervised Learning for Speech Emotion RecognitionMao Li, Bo Yang, Joshua Levy, Andreas Stolcke, Viktor Rozgic, Spyros Matsoukas, Constantinos Papayiannis, Daniel Bone, Chao Wang. 6329-6333 [doi]

Hierarchical Network Based on the Fusion of Static and Dynamic Features for Speech Emotion RecognitionQi Cao, Mixiao Hou, Bingzhi Chen, Zheng Zhang, Guangming Lu. 6334-6338 [doi]

Multimodal Emotion Recognition with Capsule Graph Convolutional Based Representation FusionJiaxing Liu, Sen Chen, Longbiao Wang, Zhilei Liu, Yahui Fu, Lili Guo, Jianwu Dang. 6339-6343 [doi]

Disentanglement for Audio-Visual Emotion Recognition Using Multitask SetupRaghuveer Peri, Srinivas Parthasarathy, Charles Bradshaw, Shiva Sundaram. 6344-6348 [doi]

Data Augmentation with Signal Companding for Detection of Logical Access AttacksRohan Kumar Das, Jichen Yang, Haizhou Li 0001. 6349-6353 [doi]

Replay and Synthetic Speech Detection with Res2Net ArchitectureXu Li, Na Li, Chao Weng, Xunying Liu, Dan Su 0002, Dong Yu 0001, Helen Meng. 6354-6358 [doi]

A Capsule Network Based Approach for Detection of Audio Spoofing AttacksAnwei Luo, Enlei Li, Yongliang Liu, Xiangui Kang, Z. Jane Wang 0001. 6359-6363 [doi]

Cross-Teager Energy Cepstral Coefficients for Replay Spoof Detection on Voice AssistantsRajul Acharya, Harsh Kotta, Ankur T. Patil, Hemant A. Patil. 6364-6368 [doi]

End-to-End anti-spoofing with RawNet2Hemlata Tak, Jose Patino 0001, Massimiliano Todisco, Andreas Nautsch, Nicholas W. D. Evans, Anthony Larcher. 6369-6373 [doi]

Replay-Attack Detection Using Features With Adaptive Spectro-Temporal ResolutionMeng Liu, Longbiao Wang, Kong-Aik Lee, Xuanda Chen, Jianwu Dang. 6374-6378 [doi]

Improving Identification of System-Directed Speech Utterances by Deep Learning of ASR-Based Word Embeddings and Confidence MetricsVilayphone Vilaysouk, Amr Nour-Eldin, Dermot Connolly. 6379-6382 [doi]

BLSTM-Based Confidence Estimation for End-to-End Speech RecognitionAtsunori Ogawa, Naohiro Tawara, Takatomo Kano, Marc Delcroix. 6383-6387 [doi]

Confidence Estimation for Attention-Based Sequence-to-Sequence Models for Speech RecognitionQiujia Li, David Qiu, Yu Zhang, Bo Li, Yanzhang He, Philip C. Woodland, Liangliang Cao, Trevor Strohman. 6388-6392 [doi]

Learning Word-Level Confidence for Subword End-To-End ASRDavid Qiu, Qiujia Li, Yanzhang He, Yu Zhang, Bo Li 0028, Liangliang Cao, Rohit Prabhavalkar, Deepti Bhatia, Wei Li 0133, Ke Hu, Tara N. Sainath, Ian McGraw. 6393-6397 [doi]

Neural Utterance Confidence Measure for RNN-Transducers and Two Pass ModelsAshutosh Gupta, Ankur Kumar, Dhananjaya Gowda, Kwangyoun Kim, Sachin Singh, Shatrughan Singh, Chanwoo Kim. 6398-6402 [doi]

Detecting Adversarial Attacks on Audiovisual Speech RecognitionPingchuan Ma 0001, Stavros Petridis, Maja Pantic. 6403-6407 [doi]

REDAT: Accent-Invariant Representation for End-To-End ASR by Domain Adversarial Training with RelabelingHu Hu, Xuesong Yang, Zeynab Raeesy, Jinxi Guo, Gokce Keskin, Harish Arsikere, Ariya Rastrow, Andreas Stolcke, Roland Maas. 6408-6412 [doi]

AISpeech-SJTU ASR System for the Accented English Speech Recognition ChallengeTian Tan 0002, Yizhou Lu, Rao Ma, Sen Zhu, Jiaqi Guo, Yanmin Qian. 6413-6417 [doi]

End-To-End Multi-Accent Speech Recognition with Unsupervised Accent ModellingSong Li, Beibei Ouyang, Dexin Liao, Shipeng Xia, Lin Li, Qingyang Hong. 6418-6422 [doi]

A Comparative Study of Acoustic and Linguistic Features Classification for Alzheimer's Disease DetectionJinchao Li, Jianwei Yu, Zi Ye, Simon Wong, Man-Wai Mak, Brian Mak, Xunying Liu, Helen Meng. 6423-6427 [doi]

Synthesis of New Words for Improved Dysarthric Speech Recognition on an Expanded VocabularyJohn Harvill, Dias Issa, Mark Hasegawa-Johnson, Changdong Yoo. 6428-6432 [doi]

Development of the Cuhk Elderly Speech Recognition System for Neurocognitive Disorder Detection Using the Dementiabank CorpusZi Ye, Shoukang Hu, Jinchao Li, Xurong Xie, Mengzhe Geng, Jianwei Yu, Junhao Xu, Boyang Xue, Shansong Liu, Xunying Liu, Helen Meng. 6433-6437 [doi]

Portable Photoglottography for Monitoring Vocal Fold Vibrations in Speech ProductionYujie Chi, Kiyoshi Honda, Jianguo Wei. 6438-6442 [doi]

Improving Ultrasound Tongue Contour Extraction Using U-Net and Shape Consistency-Based RegularizerMing Feng, Yin Wang, Kele Xu, Huaimin Wang, Bo Ding. 6443-6447 [doi]

Impact of Speaking Rate on the Source Filter Interaction in Speech: A StudyTilak Purohit, Achuth Rao MV, Prasanta Kumar Ghosh. 6448-6452 [doi]

A Two-Stage Deep Modeling Approach to Articulatory InversionAbdolreza Sabzi Shahrebabaki, Negar Olfati, Ali Shariq Imran, Magne Hallstein Johnsen, Sabato Marco Siniscalchi, Torbjørn Svendsen. 6453-6457 [doi]

Acoustic-to-Articulatory Inversion for Dysarthric Speech by Using Cross-Corpus Acoustic-Articulatory DataSarthak Kumar Maharana, Aravind Illa, Renuka Mannem, Yamini Belur, Preetie Shetty, Preethish-Kumar Veeramani, Seena Vengalil, Kiran Polavarapu, Atchayaram Nalini, Prasanta Kumar Ghosh. 6458-6462 [doi]

Speaking Rate and Tonal Realization in Mandarin Chinese: What Can We Learn From Large Speech Corpora?Jiahong Yuan, Kenneth Church 0001. 6463-6467 [doi]

Humanacgan: Conditional Generative Adversarial Network with Human-Based Auxiliary Classifier and its Evaluation in Phoneme PerceptionYota Ueda, Kazuki Fujii, Yuki Saito, Shinnosuke Takamichi, Yukino Baba, Hiroshi Saruwatari. 6468-6472 [doi]

Improving Audio Anomalies Recognition Using Temporal Convolutional Attention NetworksQiang Huang 0008, Thomas Hain. 6473-6477 [doi]

Generative Speech Coding with Predictive Variance RegularizationW. Bastiaan Kleijn, Andrew Storus, Michael Chinen, Tom Denton, Felicia S. C. Lim, Alejandro Luebs, Jan Skoglund, Hengchin Yeh. 6478-6482 [doi]

How to Make Text-to-Speech System Pronounce "Voldemort": an Experimental Approach of Foreign Word Phonemization in VietnameseDang-Khoa Mac, Van Huy Nguyen, Dinh-Nghi Nguyen, Kim Anh Nguyen. 6483-6487 [doi]

How Similar or Different is Rakugo Speech Synthesizer to Professional Performers?Shuhei Kato, Yusuke Yasuda, Xin Wang, Erica Cooper, Junichi Yamagishi. 6488-6492 [doi]

Dnsmos: A Non-Intrusive Perceptual Objective Speech Quality Metric to Evaluate Noise SuppressorsChandan K. A. Reddy, Vishak Gopal, Ross Cutler. 6493-6497 [doi]

A Causal Deep Learning Framework for Classifying Phonemes in Cochlear ImplantsKevin M. Chu, Leslie M. Collins, Boyla Mainsah. 6498-6502 [doi]

Minimum Bayes Risk Training for End-to-End Speaker-Attributed ASRNaoyuki Kanda, Zhong Meng, Liang Lu, Yashesh Gaur, Xiaofei Wang, Zhuo Chen, Takuya Yoshioka. 6503-6507 [doi]

Mutually-Constrained Monotonic Multihead Attention for Online ASRJaeyun Song, Hajin Shim, Eunho Yang. 6508-6512 [doi]

The use of Voice Source Features for Sung Speech RecognitionGerardo Roa Dabike, Jon Barker. 6513-6517 [doi]

A Parallelizable Lattice Rescoring Strategy with Neural Language ModelsKe Li, Daniel Povey, Sanjeev Khudanpur. 6518-6522 [doi]

Decentralizing Feature Extraction with Quantum Convolutional Neural Network for Automatic Speech RecognitionChao-Han Huck Yang, Jun Qi, Samuel Yen-Chi Chen, Pin-Yu Chen, Sabato Marco Siniscalchi, Xiaoli Ma, Chin-Hui Lee. 6523-6527 [doi]

Cif-Based Collaborative Decoding for End-to-End Contextual Speech RecognitionMinglun Han, Linhao Dong, Shiyu Zhou, Bo Xu. 6528-6532 [doi]

Hubert: How Much Can a Bad Teacher Benefit ASR Pre-Training?Wei-Ning Hsu, Yao-Hung Hubert Tsai, Benjamin Bolte, Ruslan Salakhutdinov, Abdelrahman Mohamed. 6533-6537 [doi]

A Further Study of Unsupervised Pretraining for Transformer Based Speech RecognitionDongwei Jiang, Wubo Li, Ruixiong Zhang, Miao Cao, Ne Luo, Yang Han, Wei Zou, Kun Han, Xiangang Li. 6538-6542 [doi]

Pre-Training Transformer Decoder for End-to-End ASR Model with Unpaired Text DataChangfeng Gao, Gaofeng Cheng, Runyan Yang, Han Zhu, Pengyuan Zhang, Yonghong Yan 0002. 6543-6547 [doi]

Semi-Supervised Speech Recognition Via Graph-Based Temporal ClassificationNiko Moritz, Takaaki Hori, Jonathan Le Roux. 6548-6552 [doi]

Unsupervised Domain Adaptation for Speech Recognition via Uncertainty Driven Self-TrainingSameer Khurana, Niko Moritz, Takaaki Hori, Jonathan Le Roux. 6553-6557 [doi]

Improving Streaming Automatic Speech Recognition with Non-Streaming Model Distillation on Unsupervised DataThibault Doutre, Wei Han, Min Ma, Zhiyun Lu, Chung-Cheng Chiu, Ruoming Pang, Arun Narayanan, Ananya Misra, Yu Zhang, Liangliang Cao. 6558-6562 [doi]

Speech Bert Embedding for Improving Prosody in Neural TTSLiping Chen, Yan Deng, Xi Wang, Frank K. Soong, Lei He. 6563-6567 [doi]

Bi-Level Style and Prosody Decoupling Modeling for Personalized End-to-End Speech SynthesisRuibo Fu, Jianhua Tao, Zhengqi Wen, Jiangyan Yi, Tao Wang, Chunyu Qiang. 6568-6572 [doi]

Prosodic Representation Learning and Contextual Sampling for Neural Text-to-SpeechSri Karlapati, Ammar Abbas, Zack Hodari, Alexis Moinet, Arnaud Joly, Penny Karanasou, Thomas Drugman. 6573-6577 [doi]

Camp: A Two-Stage Approach to Modelling Prosody in ContextZack Hodari, Alexis Moinet, Sri Karlapati, Jaime Lorenzo-Trueba, Thomas Merritt, Arnaud Joly, Ammar Abbas, Penny Karanasou, Thomas Drugman. 6578-6582 [doi]

Unsupervised Learning for Multi-Style Speech Synthesis with Limited DataShuang Liang, Chenfeng Miao, Minchuan Chen, Jun Ma, Shaojun Wang, Jing Xiao. 6583-6587 [doi]

Fastpitch: Parallel Text-to-Speech with Pitch PredictionAdrian Lancucki. 6588-6592 [doi]

Low-Resource Expressive Text-To-Speech Using Data AugmentationGoeric Huybrechts, Thomas Merritt, Giulia Comini, Bartek Perz, Raahil Shah, Jaime Lorenzo-Trueba. 6593-6597 [doi]

TTS-by-TTS: TTS-Driven Data Augmentation for Fast and High-Quality Speech SynthesisMin-Jae Hwang, Ryuichi Yamamoto, Eunwoo Song, Jae Min Kim. 6598-6602 [doi]

A Neural Text-to-Speech Model Utilizing Broadcast Data Mixed with Background MusicHanbin Bae, Jae-Sung Bae, Young-Sun Joo, Young Ik Kim, Hoon-Young Cho. 6603-6607 [doi]

Disentangled Speaker and Language Representations Using Mutual Information Minimization and Domain Adaptation for Cross-Lingual TTSDetai Xin, Tatsuya Komatsu, Shinnosuke Takamichi, Hiroshi Saruwatari. 6608-6612 [doi]

Adaspeech 2: Adaptive Text to Speech with Untranscribed DataYuzi Yan, Xu Tan 0003, Bohan Li, Tao Qin, Sheng Zhao, Yuan Shen, Tie-Yan Liu. 6613-6617 [doi]

Investigation of Fast and Efficient Methods for Multi-Speaker Modeling and Speaker AdaptationYibin Zheng, Xinhui Li, Li Lu. 6618-6622 [doi]

ICASSP 2021 Deep Noise Suppression ChallengeChandan K. A. Reddy, Harishchandra Dubey, Vishak Gopal, Ross Cutler, Sebastian Braun, Hannes Gamper, Robert Aichner, Sriram Srinivasan 0003. 6623-6627 [doi]

ICASSP 2021 Deep Noise Suppression Challenge: Decoupling Magnitude and Phase Optimization with a Two-Stage Deep NetworkAndong Li, Wenzhe Liu, XiaoXue Luo, Chengshi Zheng, Xiaodong Li 0002. 6628-6632 [doi]

Fullsubnet: A Full-Band and Sub-Band Fusion Model for Real-Time Single-Channel Speech EnhancementXiang Hao, Xiangdong Su, Radu Horaud, Xiaofei Li. 6633-6637 [doi]

Densely Connected Multi-Stage Model with Channel Wise Subband Feature for Real-Time Speech EnhancementJingdong Li, Dawei Luo, Yun Liu, Yuanyuan Zhu, Zhaoxia Li, Guohui Cui, Wenqi Tang, Wei Chen. 6638-6642 [doi]

A Modulation-Domain Loss for Neural-Network-Based Real-Time Speech EnhancementTyler Vuong, Yangyang Xia, Richard M. Stern. 6643-6647 [doi]

Monaural Speech Enhancement with Complex Convolutional Block Attention Module and Joint Time Frequency LossesShengkui Zhao, Trung Hieu Nguyen, Bin Ma. 6648-6652 [doi]

Audio-Visual Speech Inpainting with Deep LearningGiovanni Morrone, Daniel Michelsanti, Zheng-Hua Tan, Jesper Jensen 0001. 6653-6657 [doi]

Vset: A Multimodal Transformer for Visual Speech EnhancementKarthik Ramesh, Chao Xing, Wupeng Wang, Dong Wang, Xiao Chen. 6658-6662 [doi]

Switching Variational Auto-Encoders for Noise-Agnostic Audio-Visual Speech EnhancementMostafa Sadeghi, Xavier Alameda-Pineda. 6663-6667 [doi]

Audio-Visual Speech Enhancement Method Conditioned in the Lip Motion and Speaker-Discriminative EmbeddingsKoichiro Ito, Masaaki Yamamoto, Kenji Nagamatsu. 6668-6672 [doi]

Audio-Visual Speech Separation Using Cross-Modal Correspondence LossNaoki Makishima, Mana Ihori, Akihiko Takashima, Tomohiro Tanaka, Shota Orihashi, Ryo Masumura. 6673-6677 [doi]

Muse: Multi-Modal Target Speaker Extraction with Visual CuesZexu Pan, Ruijie Tao, Chenglin Xu, Haizhou Li 0001. 6678-6682 [doi]

An Effective Deep Embedding Learning Method Based on Dense-Residual Networks for Speaker VerificationYing Liu, Yan Song, Ian McLoughlin 0001, Lin Liu, Li-Rong Dai 0001. 6683-6687 [doi]

Time-Domain Speaker Verification Using Temporal Convolutional NetworksSangwook Han, Jaeuk Byun, Jong Won Shin. 6688-6692 [doi]

Towards Robust Speaker Verification with Target Speaker EnhancementChunlei Zhang, Meng Yu 0003, Chao Weng, Dong Yu 0001. 6693-6697 [doi]

A Joint Training Framework of Multi-Look Separator and Speaker Embedding Extractor for Overlapped SpeechNaijun Zheng, Na Li, Bo Wu, Meng Yu 0003, Jianwei Yu, Chao Weng, Dan Su, Xunying Liu, Helen Meng. 6698-6702 [doi]

Cam: Context-Aware Masking for Robust Speaker VerificationYa-Qi Yu, Siqi Zheng, Hongbin Suo, Yun Lei, Wu-Jun Li. 6703-6707 [doi]

Short-Time Spectral Aggregation for Speaker EmbeddingYouzhi Tu, Man-Wai Mak. 6708-6712 [doi]

Contrastive Self-Supervised Learning for Text-Independent Speaker VerificationHaoran Zhang, Yuexian Zou, Helin Wang. 6713-6717 [doi]

Adversarial Defense for Automatic Speaker Verification by Cascaded Self-Supervised Learning ModelsHaibin Wu, Xu Li, Andy T. Liu, Zhiyong Wu 0001, Helen Meng, Hung-yi Lee. 6718-6722 [doi]

Self-Supervised Text-Independent Speaker Verification Using Prototypical Momentum Contrastive LearningWei Xia, Chunlei Zhang, Chao Weng, Meng Yu, Dong Yu. 6723-6727 [doi]

An Iterative Framework for Self-Supervised Deep Speaker Representation LearningDanwei Cai, Weiqing Wang, Ming Li. 6728-6732 [doi]

Improving Reconstruction Loss Based Speaker Embedding in Unsupervised and Semi-Supervised ScenariosJaejin Cho, Piotr Zelasko, Jesús Villalba, Najim Dehak. 6733-6737 [doi]

Speech Acoustic Modelling from Raw Phase SpectrumErfan Loweimi, Zoran Cvetkovic, Peter Bell 0001, Steve Renals. 6738-6742 [doi]

An Investigation of Using Hybrid Modeling Units for Improving End-to-End Speech Recognition SystemShunfei Chen, Xinhui Hu, Sheng Li 0010, Xinkang Xu. 6743-6747 [doi]

Federated Acoustic Modeling for Automatic Speech RecognitionXiaodong Cui, Songtao Lu, Brian Kingsbury. 6748-6752 [doi]

Eat: Enhanced ASR-TTS for Self-Supervised Speech RecognitionMurali Karthick Baskar, Lukás Burget, Shinji Watanabe 0001, Ramón Fernandez Astudillo, Jan Honza Cernocký. 6753-6757 [doi]

Neural Architecture Search for LF-MMI Trained Time Delay Neural NetworksShoukang Hu, Xurong Xie, Shansong Liu, Mingyu Cui, Mengzhe Geng, Xunying Liu, Helen Meng. 6758-6762 [doi]

Hypothesis Stitcher for End-to-End Speaker-Attributed ASR on Long-Form Multi-Talker RecordingsXuankai Chang, Naoyuki Kanda, Yashesh Gaur, Xiaofei Wang, Zhong Meng, Takuya Yoshioka. 6763-6767 [doi]

Ensemble Combination between Different Time SegmentationsJeremy H. M. Wong, Dimitrios Dimitriadis, Ken'ichi Kumatani, Yashesh Gaur, George Polovets, Partha Parthasarathy, Eric Sun, Jinyu Li 0001, Yifan Gong 0001. 6768-6772 [doi]

Streaming End-to-End Speech Recognition with Jointly Trained Neural Feature EnhancementChanwoo Kim, Abhinav Garg, Dhananjaya Gowda, Seongkyu Mun, Changwoo Han. 6773-6777 [doi]

Transformer in Action: A Comparative Study of Transformer-Based Acoustic Models for Large Scale Speech Recognition ApplicationsYongqiang Wang, Yangyang Shi, Frank Zhang 0001, Chunyang Wu, Julian Chan, Ching-feng Yeh, Alex Xiao. 6778-6782 [doi]

Emformer: Efficient Memory Transformer Based Acoustic Model for Low Latency Streaming Speech RecognitionYangyang Shi, Yongqiang Wang, Chunyang Wu, Ching-feng Yeh, Julian Chan, Frank Zhang 0001, Duc Le, Mike Seltzer. 6783-6787 [doi]

Learned Transferable Architectures Can Surpass Hand-Designed Architectures for Large Scale Speech RecognitionLiqiang He, Dan Su 0002, Dong Yu 0001. 6788-6792 [doi]

Multitask Learning and Joint Optimization for Transformer-RNN-Transducer Speech RecognitionJae-Jin Jeon, Eesung Kim. 6793-6797 [doi]

SEP-28k: A Dataset for Stuttering Event Detection from Podcasts with People Who StutterColin Lea, Vikramjit Mitra, Aparna Joshi, Sachin Kajarekar, Jeffrey P. Bigham. 6798-6802 [doi]

A Hybrid CNN-BiLSTM Voice Activity DetectorNicholas Wilkinson, Thomas Niesler. 6803-6807 [doi]

Self-Attentive VAD: Context-Aware Detection of Voice from NoiseYong Rae Jo, Young Ki Moon, Won-Ik Cho, Geun Sik Jo. 6808-6812 [doi]

Preventing Early Endpointing for Online Automatic Speech RecognitionYingzhu Zhao, Chongjia Ni, Cheung Chi Leung, Shafiq R. Joty, Eng Siong Chng, Bin Ma. 6813-6817 [doi]

MarbleNet: Deep 1D Time-Channel Separable Convolutional Neural Network for Voice Activity DetectionFei Jia, Somshubra Majumdar, Boris Ginsburg. 6818-6822 [doi]

Speech Enhancement Aided End-To-End Multi-Task Learning for Voice Activity DetectionXu Tan, Xiao-lei Zhang. 6823-6827 [doi]

Robust Voice Activity Detection Using a Masked Auditory Encoder Based Convolutional Neural NetworkNan Li, Longbiao Wang, Masashi Unoki, Sheng Li 0010, Rui Wang, Meng Ge, Jianwu Dang. 6828-6832 [doi]

A Stage Match for Query-by-Example Spoken Term Detection Based On Structure Information of QueryJunyao Zhan, Qianhua He, Jianbin Su, Yanxiong Li. 6833-6837 [doi]

Knowledge Transfer for Efficient on-Device False Trigger MitigationPranay Dighe, Erik Marchi, Srikanth Vishnubhotla, Sachin Kajarekar, Devang Naik. 6838-6842 [doi]

Progressive Voice Trigger Detection: Accuracy vs LatencySiddharth Sigtia, John Bridle, Hywel Richards, Pascal Clark, Erik Marchi, Vineet Garg. 6843-6847 [doi]

Dynamic Curriculum Learning via Data Parameters for Noise Robust Keyword SpottingTakuya Higuchi, Shreyas Saxena, Mehrez Souden, Tien Dung Tran, Masood Delfarah, Chandra Dhir. 6848-6852 [doi]

CNN-Based Spoken Term Detection and Localization without Dynamic ProgrammingTzeviya Sylvia Fuchs, Yael Segal, Joseph Keshet. 6853-6857 [doi]

Query-By-Example Keyword Spotting System Using Multi-Head Attention and Soft-triple LossJinmiao Huang, Waseem Gharbieh, Han Suk Shim, Eugene Kim. 6858-6862 [doi]

A Closer Look at Audio-Visual Multi-Person Speech Recognition and Active Speaker SelectionOtavio Braga, Olivier Siohan. 6863-6867 [doi]

Generalized Knowledge Distillation from an Ensemble of Specialized Teachers Leveraging Unsupervised Neural ClusteringTakashi Fukuda, Gakuto Kurata. 6868-6872 [doi]

Multistream CNN for Robust Acoustic ModelingKyu J. Han, Jing Pan, Venkata Krishna Naveen Tadala, Tao Ma, Dan Povey. 6873-6877 [doi]

Improved Robustness to Disfluencies in Rnn-Transducer Based Speech RecognitionValentin Mendelev, Tina Raissi, Guglielmo Camporese, Manuel Giollo. 6878-6882 [doi]

Representation Learning for Speech Recognition Using Feedback Based Relevance WeightingPurvi Agrawal, Sriram Ganapathy. 6883-6887 [doi]

Towards Data Selection on TTS Data for Children's Speech RecognitionWei Wang, Zhikai Zhou, Yizhou Lu, Hongji Wang, Chenpeng Du, Yanmin Qian. 6888-6892 [doi]

An Investigation of End-to-End Models for Robust Speech RecognitionArchiki Prasad, Preethi Jyothi, Rajbabu Velmurugan. 6893-6897 [doi]

End-to-End Dereverberation, Beamforming, and Speech Recognition with Improved Numerical Stability and Advanced FrontendWangyou Zhang, Christoph Böddeker, Shinji Watanabe 0001, Tomohiro Nakatani, Marc Delcroix, Keisuke Kinoshita, Tsubasa Ochiai, Naoyuki Kamo, Reinhold Haeb-Umbach, Yanmin Qian. 6898-6902 [doi]

Streaming Multi-Speaker ASR with RNN-TIlya Sklyar, Anna Piunova, Yulan Liu. 6903-6907 [doi]

Improving RNN Transducer with Target Speaker Extraction and Neural Uncertainty EstimationJiatong Shi, Chunlei Zhang, Chao Weng, Shinji Watanabe 0001, Meng Yu 0003, Dong Yu 0001. 6908-6912 [doi]

A Progressive Learning Approach to Adaptive Noise and Speech Estimation for Speech Enhancement and Noisy Speech RecognitionZhaoxu Nian, Yan-Hui Tu, Jun Du, Chin-Hui Lee. 6913-6917 [doi]

The Accented English Speech Recognition Challenge 2020: Open Datasets, Tracks, Baselines, Results and MethodsXian Shi, Fan Yu, Yizhou Lu, Yuhao Liang, Qiangze Feng, Daliang Wang, Yanmin Qian, Lei Xie. 6918-6922 [doi]

Comparative Study of Different Epoch Extraction Methods for Speech Associated with Voice DisordersPurva Barche, Krishna Gurugubelli, Anil Kumar Vuppala. 6923-6927 [doi]

Have You Made a Decision? Where? A Pilot Study on Interpretability of Polarity Analysis Based on Advising ProblemTianda Li, Jia-Chen Gu, Hui Liu, Quan Liu, Zhen-Hua Ling, Zhiming Su, Xiaodan Zhu. 6928-6932 [doi]

Transformer Based Unsupervised Pre-Training for Acoustic Representation LearningRuixiong Zhang, Haiwei Wu, Wubo Li, Dongwei Jiang, Wei Zou, Xiangang Li. 6933-6937 [doi]

A Comparison of Convolutional Neural Networks for Glottal Closure Instant Detection from Raw SpeechJindrich Matousek, Daniel Tihelka. 6938-6942 [doi]

Encoder-Decoder Based Pitch Tracking and Joint Model Training for Mandarin Tone ClassificationHao Huang, Kai Wang, Ying Hu, Sheng Li 0010. 6943-6947 [doi]

Construction of a Large-Scale Japanese ASR Corpus on TV RecordingsShintaro Ando, Hiromasa Fujihara. 6948-6952 [doi]

NISP: A Multi-lingual Multi-accent Dataset for Speaker ProfilingShareef Babu Kalluri, Deepu Vijayasenan, Sriram Ganapathy, Ragesh Rajan M, Prashant Krishnan V. 6953-6957 [doi]

Multilingual Phonetic Dataset for Low Resource Speech RecognitionXinjian Li, David R. Mortensen, Florian Metze, Alan W. Black. 6958-6962 [doi]

Age-VOX-Celeb: Multi-Modal Corpus for Facial and Speech EstimationNaohiro Tawara, Atsunori Ogawa, Yuki Kitagishi, Hosana Kamiyama. 6963-6967 [doi]

Didispeech: A Large Scale Mandarin Speech CorpusTingwei Guo, Cheng Wen, Dongwei Jiang, Ne Luo, Ruixiong Zhang, Shuaijiang Zhao, Wubo Li, Cheng Gong, Wei Zou, Kun Han, Xiangang Li. 6968-6972 [doi]

The in-the-Wild Speech Medical CorpusMaria Joana Correia, Francisco Teixeira, Catarina Botelho, Isabel Trancoso, Bhiksha Raj. 6973-6977 [doi]

Multiple-Hypothesis CTC-Based Semi-Supervised Adaptation of End-to-End Speech RecognitionCong-Thanh Do, Rama Doddipatla, Thomas Hain. 6978-6982 [doi]

Vowel Non-Vowel Based Spectral Warping and Time Scale Modification for Improvement in Children's ASRHemant Kumar Kathania, Avinash Kumar, Mikko Kurimo. 6983-6987 [doi]

Extending Parrotron: An End-to-End, Speech Conversion and Speech Recognition Model for Atypical SpeechRohan Doshi, Youzheng Chen, Liyang Jiang, Xia Zhang, Fadi Biadsy, Bhuvana Ramabhadran, Fang Chu, Andrew Rosenberg, Pedro J. Moreno. 6988-6992 [doi]

Fundamental Frequency Feature Normalization and Data Augmentation for Child Speech RecognitionGary Yeung, Ruchao Fan, Abeer Alwan. 6993-6997 [doi]

Analysis of X-Vectors for Low-Resource Speech RecognitionMartin Karafiát, Karel Veselý, Jan Honza Cernocký, Jan Profant, Jirí Nytra, Miroslav Hlavácek, Tomás Pavlícek. 6998-7002 [doi]

Refining Automatic Speech Recognition System for Older AdultsLiu Chen, Meysam Asgari. 7003-7007 [doi]

MixSpeech: Data Augmentation for Low-Resource Automatic Speech RecognitionLinghui Meng, Jin Xu, Xu Tan 0003, Jindong Wang 0001, Tao Qin, Bo Xu 0002. 7008-7012 [doi]

End-to-End Multilingual Automatic Speech Recognition for Less-Resourced Languages: The Case of Four Ethiopian LanguagesSolomon Teferra Abate, Martha Yifiru Tachbelie, Tanja Schultz. 7013-7017 [doi]

Improved Data Selection for Domain Adaptation in ASRShannon Wotherspoon, William Hartmann, Matthew Snover, Owen Kimball. 7018-7022 [doi]

Bi-APC: Bidirectional Autoregressive Predictive Coding for Unsupervised Pre-Training and its Application to Children's ASRRuchao Fan, Amber Afshan, Abeer Alwan. 7023-7027 [doi]

Meta-Adapter: Efficient Cross-Lingual Adaptation With Meta-LearningWenxin Hou, Yidong Wang, Shengzhou Gao, Takahiro Shinozaki. 7028-7032 [doi]

Error-Driven Fixed-Budget ASR Personalization for Accented SpeakersAbhijeet Awasthi, Aman Kansal, Sunita Sarawagi, Preethi Jyothi. 7033-7037 [doi]

Context-Aware Prosody Correction for Text-Based Speech EditingMax Morrison, Lucas Rencker, Zeyu Jin, Nicholas J. Bryan, Juan Pablo Cáceres, Bryan Pardo. 7038-7042 [doi]

Fast DCTTS: Efficient Deep Convolutional Text-to-SpeechMinsu Kang, Jihyun Lee, Simin Kim, Injung Kim. 7043-7047 [doi]

Speech Prediction in Silent Videos Using Variational AutoencodersRavindra Yadav, Ashish Sardana, Vinay P. Namboodiri, Rajesh M. Hegde. 7048-7052 [doi]

Learning Disentangled Phone and Speaker Representations in a Semi-Supervised VQ-VAE ParadigmJennifer Williams, Yi Zhao 0006, Erica Cooper, Junichi Yamagishi. 7053-7057 [doi]

High-Intelligibility Speech Synthesis for Dysarthric Speakers with LPCNet-Based TTS and CycleVAE-Based VCKeisuke Matsubara, Takuma Okamoto, Ryoichi Takashima, Tetsuya Takiguchi, Tomoki Toda, Yoshinori Shiga, Hisashi Kawai. 7058-7062 [doi]

Denoispeech: Denoising Text to Speech with Frame-Level Noise ModelingChen Zhang, Yi Ren 0006, Xu Tan 0003, Jinglin Liu, Kejun Zhang, Tao Qin, Sheng Zhao, Tie-Yan Liu. 7063-7067 [doi]

Non-Autoregressive Sequence-To-Sequence Voice ConversionTomoki Hayashi, Wen-Chin Huang, Kazuhiro Kobayashi, Tomoki Toda. 7068-7072 [doi]

PPG-Based Singing Voice Conversion with Adversarial Representation LearningZhonghao Li, Benlai Tang, Xiang Yin, Yuan Wan, Ling Xu, Chen Shen, Zejun Ma. 7073-7077 [doi]

Litesing: Towards Fast, Lightweight and Expressive Singing Voice SynthesisXiaobin Zhuang, Tao Jiang, Szu-Yu Chou, Bin Wu, Peng Hu, Simon Lui. 7078-7082 [doi]

Semi-Supervised Learning for Singing Synthesis TimbreJordi Bonada, Merlijn Blaauw. 7083-7087 [doi]

Recurrent Phase Reconstruction Using Estimated Phase Derivatives from Deep Neural NetworksLars Thieling, Daniel Wilhelm, Peter Jax. 7088-7092 [doi]

Stable Checkpoint Selection and Evaluation in Sequence to Sequence Speech SynthesisSlava Shechtman, David Haws, Raul Fernandez. 7093-7097 [doi]

TSTNN: Two-Stage Transformer Based Neural Network for Speech Enhancement in the Time DomainKai Wang, Bengbeng He, Wei-Ping Zhu 0001. 7098-7102 [doi]

Self-Attention Generative Adversarial Network for Speech EnhancementHuy Phan, Huy Le Nguyen, Oliver Y. Chén, Philipp Koch, Ngoc Q. K. Duong, Ian Vince McLoughlin, Alfred Mertins. 7103-7107 [doi]

Neural Kalman Filtering for Speech EnhancementWei Xue, Gang Quan, Chao Zhang, Guohong Ding, Xiaodong He, Bowen Zhou. 7108-7112 [doi]

Neural Noise Embedding for End-To-End Speech Enhancement with Conditional Layer NormalizationZhihui Zhang, Xiaoqi Li 0011, Yaxing Li, Yuanjie Dong, Dan Wang, Shengwu Xiong. 7113-7117 [doi]

Perceptual Loss Based Speech Denoising with an Ensemble of Audio Pattern Recognition and Self-Supervised ModelsSaurabh Kataria, Jesús Villalba, Najim Dehak. 7118-7122 [doi]

Towards An ASR Approach Using Acoustic and Language Models for Speech EnhancementKhandokar Md. Nayem, Donald S. Williamson. 7123-7127 [doi]

A Neural Acoustic Echo Canceller Optimized Using An Automatic Speech Recognizer and Large Scale Synthetic DataNathan Howard, Alex Park 0001, Turaj Zakizadeh Shabestary, Alexander Gruenstein, Rohit Prabhavalkar. 7128-7132 [doi]

Low-Complexity, Real-Time Joint Neural Echo Control and Speech Enhancement Based On PercepnetJean-Marc Valin, Srikanth Tenneti, Karim Helwani, Umut Isik, Arvindh Krishnaswamy. 7133-7137 [doi]

Acoustic Echo Cancellation with the Dual-Signal Transformation LSTM NetworkNils L. Westhausen, Bernd T. Meyer. 7138-7142 [doi]

High Fidelity Speech Regeneration with Application to Speech EnhancementAdam Polyak, Lior Wolf, Yossi Adi, Ori Kabeli, Yaniv Taigman. 7143-7147 [doi]

A Time-Domain Convolutional Recurrent Network for Packet Loss ConcealmentJu Lin, Yun Wang, Kaustubh Kalgaonkar, Gil Keren, Didi Zhang, Christian Fuegen. 7148-7152 [doi]

Cascaded Time + Time-Frequency Unet For Speech Enhancement: Jointly Addressing Clipping, Codec Distortions, And GapsArun Asokan Nair, Kazuhito Koishida. 7153-7157 [doi]

Hidden Markov Model Diarisation with Speaker Location InformationJeremy H. M. Wong, Xiong Xiao, Yifan Gong 0001. 7158-7162 [doi]

Compositional Embedding Models for Speaker Identification and Diarization with Simultaneous Speech From 2+ SpeakersZeqian Li, Jacob Whitehill. 7163-7167 [doi]

Content-Aware Speaker Embeddings for Speaker DiarisationG. Sun, D. Liu, C. Zhang, Philip C. Woodland. 7168-7172 [doi]

Multi-Scale Speaker Diarization with Neural Affinity Score FusionTae-Jin Park, Manoj Kumar 0007, Shrikanth Narayanan. 7173-7177 [doi]

A Comparison Study on Infant-Parent Voice DiarizationJunzhe Zhu, Mark Hasegawa-Johnson, Nancy L. McElwain. 7178-7182 [doi]

End-To-End Diarization for Variable Number of Speakers with Local-Global Networks and Discriminative Speaker EmbeddingsSoumi Maiti, Hakan Erdogan, Kevin W. Wilson, Scott Wisdom, Shinji Watanabe 0001, John R. Hershey. 7183-7187 [doi]

End-To-End Speaker Diarization as Post-ProcessingShota Horiguchi, Paola García, Yusuke Fujita, Shinji Watanabe, Kenji Nagamatsu. 7188-7192 [doi]

BW-EDA-EEND: streaming END-TO-END Neural Speaker Diarization for a Variable Number of SpeakersEunjung Han, Chul Lee, Andreas Stolcke. 7193-7197 [doi]

Integrating End-to-End Neural and Clustering-Based Diarization: Getting the Best of Both WorldsKeisuke Kinoshita, Marc Delcroix, Naohiro Tawara. 7198-7202 [doi]

Siamese Capsule Network for End-to-End Speaker Recognition in the WildAmirhossein Hajavi, Ali Etemad. 7203-7207 [doi]

A Real-Time Speaker Diarization System Based on Spatial SpectrumSiqi Zheng, Weilong Huang, Xianliang Wang, Hongbin Suo, Jinwei Feng, Zhijie Yan. 7208-7212 [doi]

Unsupervised Neural Adaptation Model Based on Optimal Transport for Spoken Language IdentificationXugang Lu, Peng Shen, Yu Tsao 0001, Hisashi Kawai. 7213-7217 [doi]

Joint ASR and Language Identification Using RNN-T: An Efficient Approach to Dynamic Language SwitchingSurabhi Punjabi, Harish Arsikere, Zeynab Raeesy, Chander Chandak, Nikhil Bhave, Ankish Bansal, Markus Müller, Sergio Murillo, Ariya Rastrow, Andreas Stolcke, Jasha Droppo, Sri Garimella, Roland Maas, Mat Hans, Athanasios Mouchtaris, Siegfried Kunzmann. 7218-7222 [doi]

Spoken Language Identification in Unseen Target Domain Using Within-Sample Similarity LossMuralikrishna H, Shantanu Kapoor, Dileep Aroor Dinesh, Padmanabhan Rajan. 7223-7227 [doi]

Exploring the use of Common Label Set to Improve Speech Recognition of Low Resource Indian LanguagesVishwas M. Shetty, S. Umesh. 7228-7232 [doi]

Phone Distribution Estimation for Low Resource LanguagesXinjian Li, Juncheng Li 0001, Jiali Yao, Alan W. Black, Florian Metze. 7233-7237 [doi]

How Phonotactics Affect Multilingual and Zero-Shot ASR PerformanceSiyuan Feng, Piotr Zelasko, Laureano Moro-Velázquez, Ali Abavisani, Mark Hasegawa-Johnson, Odette Scharenborg, Najim Dehak. 7238-7242 [doi]

Modelling Paralinguistic Properties in Conversational Speech to Detect Bipolar Disorder and Borderline Personality DisorderBo Wang, Yue Wu, Nemanja Vaci, Maria Liakata, Terry J. Lyons, Kate E. A. Saunders. 7243-7247 [doi]

An Attention Model for Hypernasality Prediction in Children with Cleft PalateVikram C. Mathad, Nancy Scherer, Kathy Chapman, Julie Liss, Visar Berisha. 7248-7252 [doi]

An End-to-End Speech Accent Recognition Method Based on Hybrid CTC/Attention Transformer ASRQiang Gao, Haiwei Wu, Yanqing Sun, Yitao Duan. 7253-7257 [doi]

Multi-Task Estimation of Age and Cognitive Decline from SpeechYilin Pan, Venkata Srikanth Nallanthighal, Daniel Blackburn, Heidi Christensen, Aki Härmä. 7258-7262 [doi]

Deepemocluster: a Semi-Supervised Framework for Latent Cluster Representation of Speech EmotionsWei-Cheng Lin, Kusha Sridhar, Carlos Busso. 7263-7267 [doi]

The Role of Task and Acoustic Similarity in Audio Transfer Learning: Insights from the Speech Emotion Recognition CaseAndreas Triantafyllopoulos, Björn W. Schuller. 7268-7272 [doi]

Speech-Based Depression Prediction Using Encoder-Weight-Only Transfer Learning and a Large CorpusAmir Harati, Elizabeth Shriberg, Tomasz Rutowski, Piotr Chlebek, Yang Lu, Ricardo Oliveira. 7273-7277 [doi]

Estimating Severity of Depression From Acoustic Features and Embeddings of Natural SpeechSri Harsha Dumpala, Sheri Rempel, Katerina Dikaios, Mehri Sajjadian, Rudolf Uher, Sageev Oore. 7278-7282 [doi]

Automatic Elicitation Compliance for Short-Duration Speech Based Depression DetectionBrian Stasak, Zhaocheng Huang, Dale Joachim, Julien Epps. 7283-7287 [doi]

Deep Neural Network Embeddings for the Estimation of the Degree of SleepinessJosé Vicente Egas López, Gábor Gosztolya. 7288-7292 [doi]

Pause-Encoded Language Models for Recognition of Alzheimer's Disease and EmotionJiahong Yuan, Xingyu Cai, Kenneth Church 0001. 7293-7297 [doi]

End-2-End Modeling of Speech and Gait from Patients with Parkinson's Disease: Comparison Between High Quality Vs. Smartphone DataJuan Camilo Vásquez-Correa, Tomas Arias-Vergara, Philipp Klumpp, Paula Andrea Pérez-Toro, Juan Rafael Orozco-Arroyave, Elmar Nöth. 7298-7302 [doi]

A Sequential Contrastive Learning Framework for Robust Dysarthric Speech RecognitionLidan Wu, Daoming Zong, Shiliang Sun, Jing Zhao 0015. 7303-7307 [doi]

Automatic And Perceptual Discrimination Between Dysarthria, Apraxia of Speech, and Neurotypical SpeechIna Kodrasi, Michaela Pernon, Marina Laganaro, Hervé Bourlard. 7308-7312 [doi]

Effect of Noise and Model Complexity on Detection of Amyotrophic Lateral Sclerosis and Parkinson's Disease Using Pitch and MFCCTanuka Bhattacharjee, Jhansi Mallela, Yamini Belur, Nalini Atchayarcmf, Ravi Yadav, Pradeep Reddy, Dipanjan Gope, Prasanta Kumar Ghosh. 7313-7317 [doi]

Multi-Task Transformer with Input Feature Reconstruction for Dysarthric Speech RecognitionChaoyue Ding, Shiliang Sun, Jing Zhao 0015. 7318-7322 [doi]

Detecting Alzheimer's Disease from Speech Using Neural Networks with Bottleneck Features and Data AugmentationZhaoci Liu, Zhiqiang Guo, Zhenhua Ling, Yunxia Li. 7323-7327 [doi]

Automatic Dysarthric Speech Detection Exploiting Pairwise Distance-Based Convolutional Neural NetworksParvaneh Janbakhshi, Ina Kodrasi, Hervé Bourlard. 7328-7332 [doi]

Improved Neural Language Model Fusion for Streaming Recurrent Neural Network TransducerSuyoun Kim, Yuan Shangguan, Jay Mahadeokar, Antoine Bruguier, Christian Fuegen, Michael L. Seltzer, Duc Le. 7333-7337 [doi]

Internal Language Model Training for Domain-Adaptive End-To-End Speech RecognitionZhong Meng, Naoyuki Kanda, Yashesh Gaur, Sarangarajan Parthasarathy, Eric Sun, Liang Lu, Xie Chen, Jinyu Li 0001, Yifan Gong 0001. 7338-7342 [doi]

Speech Recognition by Simply Fine-Tuning BertWen-Chin Huang, Chia-Hua Wu, Shang-Bao Luo, Kuan-Yu Chen, Hsin-Min Wang, Tomoki Toda. 7343-7347 [doi]

Personalization Strategies for End-to-End Speech Recognition SystemsAditya Gourav, Linda Liu, Ankur Gandhe, Yile Gu, Guitang Lan, Xiangyang Huang, Shashank Kalmane, Gautam Tiwari, Denis Filimonov, Ariya Rastrow, Andreas Stolcke, Ivan Bulyko. 7348-7352 [doi]

Improving Entity Recall in Automatic Speech Recognition with Neural EmbeddingsChristopher Li, Pat Rondon, Diamantino Caseiro, Leonid Velikovich, Xavier Velez, Petar Aleksic. 7353-7357 [doi]

Adaptable Multi-Domain Language Model for Transformer ASRTaewoo Lee, Min-Joong Lee, Tae Gyoon Kang, Seokyeoung Jung, Minseok Kwon, Yeona Hong, Jungin Lee, Kyoung-Gu Woo, Ho-Gyeong Kim, Jiseung Jeong, Jihyun Lee, Hosik Lee, Young Sang Choi. 7358-7362 [doi]

Transformer Language Models with LSTM-Based Cross-Utterance Information RepresentationGuangzhi Sun, Chao Zhang 0031, Philip C. Woodland. 7363-7367 [doi]

Large Margin Training Improves Language Models for ASRJilin Wang, Jiaji Huang, Kenneth Ward Church. 7368-7372 [doi]

Domain-Aware Neural Language Models for Speech RecognitionLinda Liu, Yile Gu, Aditya Gourav, Ankur Gandhe, Shashank Kalmane, Denis Filimonov, Ariya Rastrow, Ivan Bulyko. 7373-7377 [doi]

Bayesian Transformer Language Models for Speech RecognitionBoyang Xue, Jianwei Yu, Junhao Xu, Shansong Liu, Shoukang Hu, Zi Ye, Mengzhe Geng, Xunying Liu, Helen Meng. 7378-7382 [doi]

Mixed Precision Quantization of Transformer Language Models for Speech RecognitionJunhao Xu, Shoukang Hu, Jianwei Yu, Xunying Liu, Helen Meng. 7383-7387 [doi]

Federated Marginal Personalization for ASR RescoringZhe Liu, Fuchun Peng. 7388-7392 [doi]

Multi Path Training Framework for Data-Driven Open-Domain Conversation SystemSixing Wu, Dawei Zhang, Ying Li, Zhonghai Wu. 7393-7397 [doi]

Action State Update Approach to Dialogue ManagementSvetlana Stoyanchev, Simon Keizer, Rama Doddipatla. 7398-7402 [doi]

Generating Empathetic Responses by Injecting Anticipated EmotionYuhan Liu, Jiachen Du, Xiang Li, Ruifeng Xu. 7403-7407 [doi]

Towards Immediate Backchannel Generation Using Attention-Based Early Prediction ModelAmalia Istiqlali Adiba, Takeshi Homma, Toshinori Miyoshi. 7408-7412 [doi]

Error-Driven Pruning of Language Models for Virtual AssistantsSashank Gondala, Lyan Verwimp, Ernest Pusateri, Manos Tsagkias, Christophe Van Gysel. 7413-7417 [doi]

Paragraph Level Multi-Perspective Context Modeling for Question GenerationJun Bai, Wenge Rong, Feiyu Xia, Yanmeng Wang, Yuanxin Ouyang, Zhang Xiong. 7418-7422 [doi]

Improving Dialogue Response Generation Via Knowledge Graph FilterYanmeng Wang, Ye Wang, Xingyu Lou, Wenge Rong, Zhenghong Hao, Shaojun Wang. 7423-7427 [doi]

Topic-Aware Dialogue Generation with Two-Hop Based Graph AttentionShijie Zhou, Wenge Rong, Jianfei Zhang, Yanmeng Wang, Libin Shi, Zhang Xiong. 7428-7432 [doi]

HSAN: A Hierarchical Self-Attention Network for Multi-Turn Dialogue GenerationYawei Kong, Lu Zhang, Can Ma, Cong Cao. 7433-7437 [doi]

Learning to Select Context in a Hierarchical and Global Perspective for Open-Domain Dialogue GenerationLei Shen, Haolan Zhan, Xin Shen, Yang Feng. 7438-7442 [doi]

Towards Efficiently Diversifying Dialogue Generation Via Embedding AugmentationYu Cao, Liang Ding, Zhiliang Tian, Meng Fang. 7443-7447 [doi]

End2End Acoustic to Semantic TransductionValentin Pelloin, Nathalie Camelin, Antoine Laurent, Renato de Mori, Antoine Caubrière, Yannick Estève, Sylvain Meignier. 7448-7452 [doi]

Acoustics Based Intent Recognition Using Discovered Phonetic Units for Low Resource LanguagesAkshat Gupta, Xinjian Li, Sai Krishna Rallabandi, Alan W. Black. 7453-7457 [doi]

Speech-Language Pre-Training for End-to-End Spoken Language UnderstandingYao Qian, Ximo Bian, Yu Shi, Naoyuki Kanda, Leo Shen, Zhen Xiao, Michael Zeng. 7458-7462 [doi]

Two-Stage Textual Knowledge Distillation for End-to-End Spoken Language UnderstandingSeongbin Kim, Gyuwan Kim, Seongjin Shin, Sangmin Lee. 7463-7467 [doi]

Semi-Supervised Spoken Language Understanding via Self-Supervised Speech and Language Model PretrainingCheng-I Lai, Yung-Sung Chuang, Hung-yi Lee, Shang-wen Li 0001, James R. Glass. 7468-7472 [doi]

DO as I Mean, Not as I Say: Sequence Loss Training for Spoken Language UnderstandingMilind Rao, Pranav Dheram, Gautam Tiwari, Anirudh Raju, Jasha Droppo, Ariya Rastrow, Andreas Stolcke. 7473-7477 [doi]

St-Bert: Cross-Modal Language Model Pre-Training for End-to-End Spoken Language UnderstandingMinjeong Kim, Gyuwan Kim, Sang-Woo Lee, Jung-Woo Ha 0001. 7478-7482 [doi]

End-to-End Spoken Language Understanding Using Transformer Networks and Self-Supervised Pre-Trained FeaturesEdmilson Da Silva Morais, Hong-Kwang Jeff Kuo, Samuel Thomas 0001, Zoltán Tüske, Brian Kingsbury. 7483-7487 [doi]

Sentiment Injected Iteratively Co-Interactive Network for Spoken Language UnderstandingZhiqi Huang, Fenglin Liu, Peilin Zhou, Yuexian Zou. 7488-7492 [doi]

RNN Transducer Models for Spoken Language UnderstandingSamuel Thomas 0001, Hong-Kwang Jeff Kuo, George Saon, Zoltán Tüske, Brian Kingsbury, Gakuto Kurata, Zvi Kons, Ron Hoory. 7493-7497 [doi]

Leveraging Acoustic and Linguistic Embeddings from Pretrained Speech and Language Models for Intent ClassificationBidisha Sharma, Maulik C. Madhavi, Haizhou Li 0001. 7498-7502 [doi]

ORTHROS: non-autoregressive end-to-end speech translation With dual-decoderHirofumi Inaguma, Yosuke Higuchi, Kevin Duh, Tatsuya Kawahara, Shinji Watanabe 0001. 7503-7507 [doi]

Cascaded Models with Cyclic Feedback for Direct Speech TranslationTsz Kin Lam, Shigehiko Schamoni, Stefan Riezler. 7508-7512 [doi]

Jointly Trained Transformers Models for Spoken Language TranslationHari Krishna Vydana, Martin Karafiát, Katerina Zmolíková, Lukás Burget, Honza Cernocký. 7513-7517 [doi]

Efficient Use of End-to-End Data in Spoken Language ProcessingYiting Lu, Yu Wang 0027, Mark J. F. Gales. 7518-7522 [doi]

Streaming Simultaneous Speech Translation with Augmented Memory TransformerXutai Ma, Yongqiang Wang, Mohammad Javad Dousti, Philipp Koehn, Juan Pino. 7523-7527 [doi]

An Empirical Study of End-To-End Simultaneous Speech Translation Decoding StrategiesHa Nguyen, Yannick Estève, Laurent Besacier. 7528-7532 [doi]

Modeling Homophone Noise for Robust Neural Machine TranslationWenjie Qin, Xiang Li, Yuhui Sun, Deyi Xiong, Jianwei Cui, Bin Wang. 7533-7537 [doi]

Machine Translation Verbosity Control for Automatic DubbingSurafel Melaku Lakew, Marcello Federico, Yue Wang, Cuong Hoang, Yogesh Virkar, Roberto Barra-Chicote, Robert Enyedi. 7538-7542 [doi]

Improvements to Prosodic Alignment for Automatic DubbingYogesh Virkar, Marcello Federico, Robert Enyedi, Roberto Barra-Chicote. 7543-7574 [doi]

Image-Assisted Transformer in Zero-Resource Multi-Modal TranslationPing Huang 0002, Shiliang Sun, Hao Yang. 7548-7552 [doi]

Sentence Boundary Augmentation for Neural Machine Translation RobustnessDaniel Li, Te I, Naveen Arivazhagan, Colin Cherry, Dirk Padfield. 7553-7557 [doi]

An Empirical Study on Task-Oriented Dialogue TranslationSiyou Liu. 7558-7562 [doi]

MAPGN: Masked Pointer-Generator Network for Sequence-to-Sequence Pre-TrainingMana Ihori, Naoki Makishima, Tomohiro Tanaka, Akihiko Takashima, Shota Orihashi, Ryo Masumura. 7563-7567 [doi]

Aligning the training and evaluation of unsupervised text style TransferWanhui Qian, Fuqing Zhu, Jinzhu Yang, Jizhong Han, Songlin Hu. 7568-7572 [doi]

Neural Inverse Text NormalizationMonica Sunkara, Chaitanya Shivade, Sravan Bodapati, Katrin Kirchhoff. 7573-7577 [doi]

Generating Human Readable Transcript for Automatic Speech Recognition with Pre-Trained Language ModelJunwei Liao, Yu Shi, Ming Gong, Linjun Shou, Sefik Emre Eskimez, Liyang Lu, Hong Qu, Michael Zeng. 7578-7582 [doi]

Improving Neural Text Normalization with Partial Parameter Generator and Pointer-Generator NetworkWeiWei Jiang, Junjie Li, Minchuan Chen, Jun Ma, Shaojun Wang, Jing Xiao. 7583-7587 [doi]

Incorporating Syntactic and Phonetic Information into Multimodal Word Embeddings Using Graph Convolutional NetworksWenhao Zhu, Shuang Liu, Chaoming Liu. 7588-7592 [doi]

LIFI: Towards Linguistically Informed Frame InterpolationAradhya Neeraj Mathur, Devansh Batra, Yaman Kumar Singla, Rajiv Ratn Shah, Changyou Chen, Roger Zimmermann. 7593-7597 [doi]

Triple Sequence Generative Adversarial Nets for Unsupervised Image CaptioningYucheng Zhou, Wei Tao, Wenqiang Zhang. 7598-7602 [doi]

Align or attend? Toward More Efficient and Accurate Spoken Word Discovery Using Speech-to-Image RetrievalLiming Wang, Xinsheng Wang, Mark Hasegawa-Johnson, Odette Scharenborg, Najim Dehak. 7603-7607 [doi]

Towards Practical Lipreading with Distilled and Efficient ModelsPingchuan Ma 0001, Brais Martínez, Stavros Petridis, Maja Pantic. 7608-7612 [doi]

End-To-End Audio-Visual Speech Recognition with ConformersPingchuan Ma 0001, Stavros Petridis, Maja Pantic. 7613-7617 [doi]

ASR N-Best Fusion NetsXinyue Liu, Mingda Li, Luoxin Chen, Prashan Wanigasekara, Weitong Ruan, Haidar Khan, Wael Hamza, Chengwei Su. 7618-7622 [doi]

Boosting Low-Resource Intent Detection with in-Scope Prototypical NetworksHongzhan Lin, Yuanmeng Yan, Guang Chen. 7623-7627 [doi]

Conversational Query Rewriting with Self-Supervised LearningHang Liu, Meng Chen 0006, Youzheng Wu, Xiaodong He 0002, Bowen Zhou. 7628-7632 [doi]

Handling Class Imbalance in Low-Resource Dialogue Systems by Combining Few-Shot Classification and InterpolationVishal Sunder, Eric Fosler-Lussier. 7633-7637 [doi]

Improving Cross-Domain Slot Filling with Common Syntactic StructureLuchen Liu, Xixun Lin, Peng Zhang, Bin Wang. 7638-7642 [doi]

Joint Intent Detection and Slot Filling Based on Continual Learning ModelYanfei Hui, Jianzong Wang, Ning Cheng, Fengying Yu, TianBo Wu, Jing Xiao. 7643-7647 [doi]

Knowledge-Based Chat Detection with False Mention DiscriminationWei Liu, Peijie Huang, Dongzhu Liang, Zihao Zhou. 7648-7652 [doi]

Replacing Human Audio with Synthetic Audio for on-Device Unspoken Punctuation PredictionDaria Soboleva, Ondrej Skopek, Márius Sajgalík, Victor Carbune, Felix Weissenberger, Julia Proskurnia, Bogdan Prisacari, Daniel Valcarce, Justin Lu, Rohit Prabhavalkar, Balint Miklos. 7653-7657 [doi]

Adversarial Generative Distance-Based Classifier for Robust Out-of-Domain DetectionZhiyuan Zeng, Hong Xu, Keqing He, Yuanmeng Yan, Sihong Liu, Zijun Liu, Weiran Xu. 7658-7662 [doi]

GAN-Based Out-of-Domain Detection Using Both In-Domain and Out-of-Domain SamplesChaojie Liang, Peijie Huang, Wenbin Lai, Ziheng Ruan. 7663-7667 [doi]

Progressive Dialogue State Tracking for Multi-Domain Dialogue SystemsJiahao Wang, Minqian Liu, Xiaojun Quan. 7668-7672 [doi]

Multi-Step Spoken Language Understanding System Based on Adversarial LearningYu Wang 0091, Yilin Shen, Hongxia Jin. 7673-7677 [doi]

Multi-Entity Collaborative Relation ExtractionHaozhuang Liu, Ziran Li, Dongming Sheng, Hai-Tao Zheng, Ying Shen. 7678-7682 [doi]

Multi-Granularity Heterogeneous Graph for Document-Level Relation ExtractionHengzhu Tang, Yanan Cao, Zhenyu Zhang 0006, Ruipeng Jia, Fang Fang, Shi Wang. 7683-7687 [doi]

Improving Event Detection by Exploiting Label HierarchyXiangyu Xi, Wei Ye, Tong Zhang, Quanxiu Wang, Shikun Zhang, Huixing Jiang, Wei Wu. 7688-7692 [doi]

Improving NER in Social Media via Entity Type-Compatible Unknown Word SubstitutionJian Xie, Kai Zhang 0033, Lin Sun 0006, Yindu Su, Chenxiang Xu. 7693-7697 [doi]

More: A Metric Learning Based Framework for Open-Domain Relation ExtractionYutong Wang, Renze Lou, Kai Zhang, Mao Yan Chen, Yujiu Yang. 7698-7702 [doi]

"You Should Probably Read This": Hedge Detection in TextDenys Katerenchuk, Rivka Levitan. 7703-7707 [doi]

Enhancing Model Robustness by Incorporating Adversarial Knowledge into Semantic RepresentationJinfeng Li, Tianyu Du, Xiangyu Liu, Rong Zhang, Hui Xue, Shouling Ji. 7708-7712 [doi]

Elbert: Fast Albert with Confidence-Window Based Early ExitKeli Xie, Siyuan Lu, Meiqi Wang, Zhongfeng Wang. 7713-7717 [doi]

Dualformer: A Unified Bidirectional Sequence-to-Sequence LearningJen-Tzung Chien, Wei-Hsiang Chang. 7718-7722 [doi]

Task Aware Multi-Task Learning for Speech to Text TasksSathish Reddy Indurthi, Mohd Abbas Zaidi, Nikhil Kumar Lakumarapu, Beomseok Lee, HyoJung Han, Seokchan Ahn, Sangha Kim 0002, Chanwoo Kim, Inchul Hwang. 7723-7727 [doi]

Label-Aware Text Representation for Multi-Label Text ClassificationHao Guo, Xiangyang Li, Lei Zhang, Jia Liu, Wei Chen. 7728-7732 [doi]

Mixup Regularized Adversarial Networks for Multi-Domain Text ClassificationYuan Wu 0002, Diana Inkpen, Ahmed El-Roby. 7733-7737 [doi]

Mispronunciation Detection in Non-Native (L2) English with Uncertainty ModelingDaniel Korzekwa, Jaime Lorenzo-Trueba, Szymon Zaporowski, Shira Calamaro, Thomas Drugman, Bozena Kostek. 7738-7742 [doi]

Attention-Based Multi-Encoder Automatic Pronunciation AssessmentBinghuai Lin, Liyuan Wang. 7743-7747 [doi]

Improving Pronunciation Assessment Via Ordinal Regression with Anchored Reference SamplesBin Su, Shaoguang Mao, Frank K. Soong, Yan Xia, Jonathan Tien, Zhiyong Wu 0001. 7748-7752 [doi]

Analysing Bias in Spoken Language Assessment Using Concept Activation VectorsXizi Wei, Mark J. F. Gales, Kate M. Knill. 7753-7757 [doi]

Senone-Aware Adversarial Multi-Task Training for Unsupervised Child to Adult Speech AdaptationRicheng Duan, Nancy F. Chen. 7758-7762 [doi]

Classifying Speech Intelligibility Levels of Children in Two Continuous Speech StylesYeh-Sheng Lin, Shu-Chuan Tseng. 7763-7767 [doi]

Recent Advances in Arabic Syntactic Diacritics RestorationYasser Hifny. 7768-7772 [doi]

Making Punctuation Restoration Robust and Fast with Multi-Task Learning and Knowledge DistillationMichael Hentschel, Emiru Tsunoo, Takao Okuda. 7773-7777 [doi]

Variational Dialogue Generation with Normalizing FlowsTien-Ching Luo, Jen-Tzung Chien. 7778-7782 [doi]

NN-KOG2P: A Novel Grapheme-to-Phoneme Model for Korean LanguageHwa-Yeon Kim, Jong-Hwan Kim, Jae Min Kim. 7783-7787 [doi]

Joint Alignment Learning-Attention Based Model for Grapheme-to-Phoneme ConversionYonghe Wang, Feilong Bao, Hui Zhang, Guanglai Gao. 7788-7792 [doi]

Knowledge Distillation for Improved Accuracy in Spoken Question AnsweringChenyu You, Nuo Chen, Yuexian Zou. 7793-7797 [doi]

Coarse-To-Careful: Seeking Semantic-Related Knowledge for Open-Domain Commonsense Question AnsweringLuxi Xing, Yue Hu 0002, Jing Yu, Yuqiang Xie, Wei Peng. 7798-7802 [doi]

Language Model is all You Need: Natural Language Understanding as Question AnsweringMahdi Namazifar, Alexandros Papangelis, Gökhan Tür, Dilek Hakkani-Tür. 7803-7807 [doi]

Integrating Subgraph-Aware Relation and Direction Reasoning for Question AnsweringXu Wang, Shuai Zhao 0001, Bo Cheng 0001, Jiale Han, Yingting Li, Hao Yang, Ivan Sekulic, Guoshun Nan. 7808-7812 [doi]

Role Aware Multi-Party Dialogue Question AnsweringJui-Heng Hsu, Po-Wei Shen, Hung-Ting Su, Chen-Hsi Chang, Jia-Fong Yeh, Winston H. Hsu. 7813-7817 [doi]

MCR-NET: A Multi-Step Co-Interactive Relation Network for Unanswerable Questions on Machine Reading ComprehensionWei Peng, Yue Hu 0002, Jing Yu, Luxi Xing, Yuqiang Xie, Zihao Zhu, Yajing Sun. 7818-7822 [doi]

Hierarchical Speaker-Aware Sequence-to-Sequence Model for Dialogue SummarizationYuejie Lei, Yuanmeng Yan, Zhiyuan Zeng, Keqing He, Ximing Zhang, Weiran Xu. 7823-7827 [doi]

A Large-Scale Chinese Long-Text Extractive Summarization CorpusKai Chen, Guanyu Fu, Qingcai Chen, Baotian Hu. 7828-7832 [doi]

Adaptive Bi-Directional Attention: Exploring Multi-Granularity Representations for Machine Reading ComprehensionNuo Chen, Fenglin Liu, Chenyu You, Peilin Zhou, Yuexian Zou. 7833-7837 [doi]

Graph Attention and Interaction Network With Multi-Task Learning for Fact VerificationRui Yang, Runze Wang, Zhen-Hua Ling. 7838-7842 [doi]

Enhancing Deep Paraphrase Identification via Leveraging Word Alignment InformationBoxin Li, Tingwen Liu, Bin Wang, Lihong Wang. 7843-7847 [doi]

An End-To-End Actor-Critic-Based Neural Coreference Resolution SystemYu Wang 0091, Yilin Shen, Hongxia Jin. 7848-7852 [doi]

Reduced-Complexity Modular Polynomial Multiplication for R-LWE CryptosystemsXinmiao Zhang, Keshab K. Parhi. 7853-7857 [doi]

Seizure Detection Using Power Spectral Density via Hyperdimensional ComputingLulu Ge, Keshab K. Parhi. 7858-7862 [doi]

FPGA Hardware Design for Plenoptic 3D Image Processing Algorithm Targeting a Mobile ApplicationFaraz Bhatti, Thomas Greiner. 7863-7867 [doi]

SLAP: a Split Latency Adaptive VLIW Pipeline Architecture Which Enables on-The-Fly Variable SIMD Vector-LengthAshish Shrivastava, Alan Gatherer, Tong Sun, Sushma Wokhlu, Alex Chandra. 7868-7872 [doi]

Unsupervised Clustering of Time Series Signals Using Neuromorphic Energy-Efficient Temporal Neural NetworksShreyas Chaudhari, Harideep Nair, José M. F. Moura, John Paul Shen. 7873-7877 [doi]

Angle-of-Arrival (AoA) Factorization in Multipath ChannelsYu-Lin Wei, Romit Roy Choudhury. 7878-7882 [doi]

Scaled Fast Nested Key Equation Solver for Generalized Integrated Interleaved BCH DecodersZhenshan Xie, Xinmiao Zhang. 7883-7887 [doi]

Joint Optimization for Full-Duplex Cellular Communications Via Intelligent Reflecting SurfaceZhangjie Peng, Cunhua Pan, Zhenkun Zhang, Xianzhe Chen, Li Li, A. Lee Swindlehurst. 7888-7892 [doi]

A Color Doppler Processing Engine with an Adaptive Clutter Filter for Portable Ultrasound Imaging DevicesYi-Lin Lo, Chia-Hsiang Yang. 7893-7897 [doi]

Convolutional Neural Network-Aided Bit-Flipping for Belief Propagation Decoding of Polar CodesChieh-Fang Teng, Andrew Kuan-Shiuan Ho, Chen-Hsi Derek Wu, Sin-Sheng Wong, An-Yeu Andy Wu. 7898-7902 [doi]

Taming Voting Algorithms on Gpus for an Efficient Connected Component Analysis AlgorithmFlorian Lemaitre, Arthur Hennequin, Lionel Lacassagne. 7903-7907 [doi]

Positnn: Training Deep Neural Networks with Mixed Low-Precision PositGonçalo Raposo, Pedro Tomás, Nuno Roma. 7908-7912 [doi]

Bluetooth Low Energy and CNN-Based Angle of Arrival Localization in Presence of Rayleigh FadingZohreh Hajiakhondi-Meybodi, Mohammad Salimibeni, Arash Mohammadi 0001, Konstantinos N. Plataniotis. 7913-7917 [doi]

Robust Device-Free Proximity Detection Using WifiYuqian Hu, M. Zahid Ozturk, Feng Zhang 0016, Beibei Wang 0001, Kuo J. Ray Liu. 7918-7922 [doi]

Online Dynamic Window (ODW) Assisted 2-Stage LSTM Indoor Localization for Smart PhonesMohammadamin Atashi, Arash Mohammadi 0001. 7923-7927 [doi]

Optimal TOA Localization for Moving Sensor in Asymmetric NetworkSihao Zhao, Xiao-Ping Zhang 0002, XiaoWei Cui, MingQuan Lu. 7928-7932 [doi]

Low Complexity SLM for OFDMA System with Implicit Side InformationShicheng Hu, Miao Yang, Kai Kang, Hua Qian. 7933-7937 [doi]

Reduced-Complexity Channel Estimation by Hierarchical Interpolation Exploiting Sparsity for Massive MIMO Systems with Uniform Rectangular ArrayChi-Shiang Wang, Pei-Yun Tsai. 7938-7942 [doi]

Traffic Speed Forecasting Via Spatio-Temporal Attentive Graph Isomorphism NetworkQing Yang, Ting Zhong, Fan Zhou 0002. 7943-7947 [doi]

Inferring High-Resolutional Urban Flow With Internet Of Mobile ThingsFan Zhou 0002, Xin Jing, Liang Li, Ting Zhong. 7948-7952 [doi]

Transfer Learning for Input Estimation of Vehicle SystemsLiam M. Cronin, Soheil Sadeghi Eshkevari, Debarshi Sen, Shamim N. Pakzad. 7953-7957 [doi]

Identification of Deep Breath While Moving Forward Based on Multiple Body Regions and Graph Signal AnalysisYunlu Wang, Cheng Yang, Menghan Hu, Jian Zhang 0060, Qingli Li, Guangtao Zhai, Xiao-Ping Zhang 0002. 7958-7962 [doi]

Multi-Object Tracking Using Poisson Multi-Bernoulli Mixture Filtering For Autonomous VehiclesSu Pang, Hayder Radha. 7963-7967 [doi]

Adaptive RF Fingerprint Decomposition in Micro UAV Detection based on Machine LearningChengtao Xu, Fengyu He, Bowen Chen, Yushan Jiang, Houbing Song. 7968-7972 [doi]

Depression Detection by Analysing Eye Movements on Emotional ImagesRuizhe Shen, Qi Zhan, Yu Wang 0002, Huimin Ma. 7973-7977 [doi]

Weakly Supervised Patch Label Inference Network with Image Pyramid for Pavement Diseases Recognition in the WildGuixin Huang, Sheng Huang, Luwen Huangfu, Dan Yang 0001. 7978-7982 [doi]

A Wireless Reference Active Noise Control Headphone Using Coherence Based Selection TechniqueXiaoyi Shen, Dong-Yuan Shi, Woon-Seng Gan. 7983-7987 [doi]

How to Use Time Information Effectively? Combining with Time Shift Module for LipreadingMingfeng Hao, Mutallip Mamut, Nurbiya Yadikar, Alimjan Aysa, Kurban Ubul. 7988-7992 [doi]

Exploring the application of synthetic audio in training keyword spottersAndrew Werchniak, Roberto Barra-Chicote, Yuriy Mishchenko, Jasha Droppo, Jeff Condal, Peng Liu, Anish Shah. 7993-7996 [doi]

Graph Enhanced Query Rewriting for Spoken Language Understanding SystemSiyang Yuan, Saurabh Gupta, Xing Fan, Derek Liu, Yang Liu, Chenlei Guo. 7997-8001 [doi]

Deep Neural Network Based Cough Detection Using Bed-Mounted Accelerometer MeasurementsMadhurananda Pahar, Igor D. S. Miranda, Andreas H. Diacon, Thomas Niesler. 8002-8006 [doi]

Radio Frequency Based Heart Rate Variability MonitoringFengyu Wang, Xiaolu Zeng, Chenshu Wu, Beibei Wang 0001, K. J. Ray Liu. 8007-8011 [doi]

Discrete Cosine Transform Based Causal Convolutional Neural Network for Drift Compensation in Chemical SensorsDiaa Badawi, Agamyrat Agambayev, Sule Ozev, A. Enis Çetin. 8012-8016 [doi]

Wifi-Based Device-Free Gesture Recognition Through-the-WallSai Deepika Regani, Beibei Wang 0001, K. J. Ray Liu. 8017-8021 [doi]

Sound Recovery From Radio SignalsMuhammed Zahid Ozturk, Chenshu Wu, Beibei Wang 0001, K. J. Ray Liu. 8022-8026 [doi]

Fully-Neural Approach to Vehicle Weighing and Strain Prediction on Bridges Using Wireless AccelerometersTakaya Kawakatsu, Kenro Aihara, Atsuhiro Takasu, Jun Adachi, Haoqi Wang, Tomonori Nagayama. 8027-8031 [doi]

End To End Learning For Convolutive Multi-Channel Wiener FilteringMasahito Togami. 8032-8036 [doi]

Makf-Sr: Multi-Agent Adaptive Kalman Filtering-Based Successor RepresentationsMohammad Salimibeni, Parvin Malekzadeh, Arash Mohammadi 0001, Petros Spachos, Konstantinos N. Plataniotis. 8037-8041 [doi]

Variation-Stable Fusion for PPG-Based Biometric SystemDae-Yon Hwang, Bilal Taha, Dimitrios Hatzinakos. 8042-8046 [doi]

Improving Stability of Adversarial Li-ion Cell Usage Data Generation using Generative Latent Space ModellingSubhankar Chattoraj, Sawon Pratiher, Souvik Pratiher, Hubert Konik. 8047-8051 [doi]

SQWA: Stochastic Quantized Weight Averaging For Improving The Generalization Capability Of Low-Precision Deep Neural NetworksSungho Shin, Yoonho Boo, Wonyong Sung. 8052-8056 [doi]

A Quantitative Analysis Of The Robustness Of Neural Networks For Tabular DataKavya Gupta, Béatrice Pesquet-Popescu, Fateh Kaakai, Jean-Christophe Pesquet. 8057-8061 [doi]

Spatial Equalization Before Reception: Reconfigurable Intelligent Surfaces for Multi-Path MitigationHongliang Zhang, Lingyang Song, Zhu Han, H. Vincent Poor. 8062-8066 [doi]

Interference Analysis in Reconfigurable Intelligent Surface-Assisted Multiple-Input Multiple-Output SystemsJiang Liu, Xuewen Qian, Marco Di Renzo. 8067-8071 [doi]

Codebook Design for Dual-Polarized Ultra-Massive Mimo Communications at Millimeter Wave and Terahertz BandsShuai Nie, Ian F. Akyildiz. 8072-8076 [doi]

Performance Analysis of Spatial and Frequency Domain Index-Modulated Reconfigurable Intelligent MetasurfacesJohn A. Hodge, Kumar Vijay Mishra, Brian M. Sadler, Amir I. Zaghloul. 8077-8081 [doi]

Meta-Learning for 6G Communication Networks with Reconfigurable Intelligent SurfacesMinchae Jung, Walid Saad. 8082-8086 [doi]

Model-Inspired Deep Learning for Light-Field Microscopy with Application to Neuron LocalizationPingfan Song, Herman Verinaz-Jadan, Carmel L. Howe, Peter Quicke, Amanda J. Foust, Pier Luigi Dragotti. 8087-8091 [doi]

Time-Varying Graph Signal Inpainting Via Unrolling NetworksSiheng Chen, Yonina C. Eldar. 8092-8097 [doi]

Deep Learning for Linear Inverse Problems Using the Plug-and-Play Priors FrameworkWei Chen, David Wipf, Miguel Rodrigues. 8098-8102 [doi]

A Plug-and-Play Deep Image PriorZhaodong Sun, Fabian Latorre, Thomas Sanchez, Volkan Cevher. 8103-8107 [doi]

MRI Image Recovery using Damped Denoising Vector AMPSubrata Sarkar, Rizwan Ahmad, Philip Schniter. 8108-8112 [doi]

Overcoming Measurement Inconsistency In Deep Learning For Linear Inverse Problems: Applications In Medical ImagingMarija Vella, João F. C. Mota. 8113-8117 [doi]

Scalable Reinforcement Learning For Routing In Ad-Hoc Networks Based On Physical-Layer AttributesWei Cui, Wei Yu 0001. 8118-8122 [doi]

Blind Carbon Copy on Dirty Paper: Seamless Spectrum Underlay via Canonical Correlation AnalysisMohamed Salah Ibrahim, Nicholas D. Sidiropoulos. 8123-8127 [doi]

An Actor-Critic Reinforcement Learning Approach to Minimum age of Information Scheduling in Energy Harvesting NetworksShiyang Leng, Aylin Yener. 8128-8132 [doi]

Moving Object Classification with a Sub-6 GHz Massive MIMO Array Using Real DataB. R. Manoj, Guoda Tian, Sara Gunnarsson, Fredrik Tufvesson, Erik G. Larsson. 8133-8137 [doi]

Optimizing Coverage and Capacity in Cellular Networks using Machine LearningRyan M. Dreifuerst, Samuel Daulton, Yuchen Qian, Paul Varkey, Maximilian Balandat, Sanjay Kasturia, Anoop Tomar, Ali Yazdan, Vish Ponnampalam, Robert W. Heath Jr.. 8138-8142 [doi]

Unsupervised Learning for Asynchronous Resource Allocation In Ad-Hoc Wireless NetworksZhiyang Wang, Mark Eisen, Alejandro Ribeiro. 8143-8147 [doi]

Two-Stage Adaptive Pooling with RT-QPCR for Covid-19 ScreeningAnoosheh Heidarzadeh, Krishna Narayanan 0001. 8148-8152 [doi]

Point of Care Image Analysis for COVID-19Daniel Yaron, Daphna Keidar, Elisha Goldstein, Yair Shachar, Ayelet Blass, Oz Frank, Nir Schipper, Nogah Shabshin, Ahuva Grubstein, Dror Suhami, Naama R. Bogot, Chedva S. Weiss, Eyal Sela, Amiel A. Dror, Mordehay Vaturi, Federico Mento, Elena Torri, Riccardo Inchingolo, Andrea Smargiassi, Gino Soldati, Tiziano Perrone, Libertario Demi, Meirav Galun, Shai Bagon, Yishai M. Elyada, Yonina C. Eldar. 8153-8157 [doi]

An Improved Data Driven Dynamic SIRD Model for Predictive Monitoring of COVID-19Pushpendra Singh 0002, Amit Singhal 0002, Binish Fatimah, Anubha Gupta. 8158-8162 [doi]

Leveraging A Multiple-Strain Model with Mutations in Analyzing the Spread of Covid-19Anirudh Sridhar, Osman Yagan, Rashad Eletreby, Simon A. Levin, Joshua B. Plotkin, H. Vincent Poor. 8163-8167 [doi]

Contact Tracing Enhances the Efficiency of Covid-19 Group TestingRitesh Goenka, Shu-Jie Cao, Chau-Wai Wong, Ajit Rajwade, Dror Baron. 8168-8172 [doi]

Optimal Questionnaires for Screening of Strategic AgentsAnuj S. Vora, Ankur A. Kulkarni. 8173-8177 [doi]

Exploring Visual-Audio Composition Alignment Network for Quality Fashion Retrieval in VideoYanhao Zhang, Jianmin Wu, Xiong Xiong, Dangwei Li, Chenwei Xie, Yun Zheng, Pan Pan, Yinghui Xu. 8178-8182 [doi]

A Secure Searchable Image Retrieval Scheme with Correct Retrieval IdentityLiejun Wang, Haitao Yu 0011. 8183-8187 [doi]

Injecting Word Information with Multi-Level Word Adapter for Chinese Spoken Language UnderstandingDechuan Teng, Libo Qin, Wanxiang Che, Sendong Zhao, Ting Liu 0001. 8188-8192 [doi]

A Co-Interactive Transformer for Joint Slot Filling and Intent DetectionLibo Qin, Tailu Liu, Wanxiang Che, Bingbing Kang, Sendong Zhao, Ting Liu 0001. 8193-8197 [doi]

Dual Metric Discriminator for Open Set Video Domain AdaptationYatian Wang, Xiaolin Song, Yezhen Wang, Pengfei Xu 0013, Runbo Hu, Hua Chai. 8198-8202 [doi]

Cross-Domain Sentiment Classification with Contrastive Learning and Mutual Information MaximizationTian Li, Xiang Chen, Shanghang Zhang, Zhen Dong, Kurt Keutzer. 8203-8207 [doi]

Low-Complexity Parameter Learning for OTFS Modulation Based Automotive RadarChenwen Liu, Shengheng Liu, Zihuan Mao, Yongming Huang, Haiming Wang. 8208-8212 [doi]

Federated Dropout Learning for Hybrid Beamforming with Spatial Path Index Modulation in Multi-User Mmwave-Mimo SystemsAhmet M. Elbir, Sinem Coleri, Kumar Vijay Mishra. 8213-8217 [doi]

Information Decoding and SDR Implementation of DFRC Systems without Training SignalsDaniel M. Wong, Batu K. Chalise, Justin G. Metcalf, Moeness G. Amin. 8218-8222 [doi]

A Low-Complexity MIMO Dual Function Radar Communication System via One-Bit SamplingSiyu Zhu, Feng Xi, Shengyao Chen, Arye Nehorai. 8223-8227 [doi]

Learning to Select for Mimo Radar Based on Hybrid Analog-Digital BeamformingZhaoyi Xu, Fan Liu 0005, Konstantinos I. Diamantaras, Christos Masouros, Athina P. Petropulu. 8228-8232 [doi]

Word-Level ASL Recognition and Trigger Sign Detection with RF SensorsM. Mahbubur Rahman, Emre Kurtoglu, Robiulhossain Mdrafi, Ali Cafer Gürbüz, Evie Malaia, Chris S. Crawford, Darrin J. Griffin, Sevgi Zubeyde Gurbuz. 8233-8237 [doi]

Hybrid Beamforming for Wideband OFDM Dual Function Radar CommunicationsZiyang Cheng, Jinyang He, Shengnan Shi, Zishu He, Bin Liao. 8238-8242 [doi]

Bit Constrained Communication Receivers In Joint Radar Communications SystemsDingyou Ma, Nir Shlezinger, Tianyao Huang, Yimin Liu, Yonina C. Eldar. 8243-8247 [doi]

ICI-Aware Parameter Estimation for Mimo-Ofdm Radar via Apes Spatial FilteringMusa Furkan Keskin, Henk Wymeersch, Visa Koivunen. 8248-8252 [doi]

Joint Communications with FH-MIMO Radar Systems: An Extended Signaling StrategyXiangrong Wang 0001, Jing Xu, Aboulnasr Hassanien, Elias Aboutanios. 8253-8257 [doi]

Full-Duplex Multifunction Transceiver with Joint Constant Envelope Transmission and Wideband ReceptionJaakko Marin, Micael Bernhardt, Taneli Riihonen. 8258-8262 [doi]

Waveform Design for the Joint MIMO Radar and Communications with Low Integrated Sidelobe Levels and Accurate Information EmbeddingYongzhe Li, Xinyu Wu, Ran Tao 0003. 8263-8267 [doi]

Ordered Reliability Bits Guessing Random Additive Noise DecodingKen R. Duffy. 8268-8272 [doi]

Learned Decimation for Neural Belief Propagation Decoders : Invited PaperAndreas Buchberger, Christian Häger, Henry D. Pfister, Laurent Schmalen, Alexandre Graell i Amat. 8273-8277 [doi]

ADMM-Based ML Decoding: from Theory to PracticeKira Kraft, Norbert Wehn. 8278-8282 [doi]

Towards Practical Near-Maximum-Likelihood Decoding of Error-Correcting Codes: An OverviewThibaud Tonnellier, Marzieh Hashemipour, Nghia Doan, Warren J. Gross, Alexios Balatsoukas-Stimming. 8283-8287 [doi]

High-Throughput VLSI Architecture for Soft-Decision Decoding with ORBGRANDSyed Mohsin Abbas, Thibaud Tonnellier, Furkan Ercan, Marwan Jalaleddine, Warren J. Gross. 8288-8292 [doi]

Hardware Implementation of Iterative Projection-Aggregation Decoding of Reed-Muller CodesMarzieh Hashemipour-Nazari, Kees Goossens, Alexios Balatsoukas-Stimming. 8293-8297 [doi]

m-Activity: Accurate and Real-Time Human Activity Recognition Via Millimeter Wave RadarYuheng Wang, Haipeng Liu, Kening Cui, Anfu Zhou, Wensheng Li, Huadong Ma. 8298-8302 [doi]

Pushing the Limit of Phase Offset for Contactless Sensing Using Commodity WifiDongheng Zhang, Xiong Li, Yan Chen. 8303-8307 [doi]

Noncontact Heartbeat Detection by Viterbi Algorithm with Fusion of Beat-Beat Interval and Deep Learning-Driven Branch MetricsKohei Yamamoto, Tomoaki Ohtsuki. 8308-8312 [doi]

Typingwristband: A Human Slight Motion Sensing System Based on Vibration DetectionSiyao Cheng, Jialiang Yan, Jianzhong Li0001, Jie Liu. 8313-8317 [doi]

Movement Detection Using A Reciprocal Received Signal Strength ModelOssi Kaltiokallio, Hüseyin Yigitler. 8318-8322 [doi]

Deep Convolutional Gaussian Processes for Mmwave Outdoor LocalizationXuyu Wang, Mohini Patil, Chao Yang 0025, Shiwen Mao, Palak Anilkumar Patel. 8323-8327 [doi]

Exploring Automatic COVID-19 Diagnosis via Voice and Symptoms from Crowdsourced DataJing Han, Chloë Brown, Jagmohan Chauhan, Andreas Grammenos, Apinan Hasthanasombat, Dimitris Spathis, Tong Xia, Pietro Cicuta, Cecilia Mascolo. 8328-8332 [doi]

Coughwatch: Real-World Cough Detection using SmartwatchesDaniyal Liaqat, Salaar Liaqat, Jun-Lin Chen, Tina Sedaghat, Moshe Gabel, Frank Rudzicz, Eyal de Lara. 8333-8337 [doi]

Acoustic and Linguistic Analyses to Assess Early-Onset and Genetic Alzheimer's DiseasePaula Andrea Pérez-Toro, Juan Camilo Vásquez-Correa, Tomas Arias-Vergara, Philipp Klumpp, M. Sierra-Castrillón, M. E. Roldán-López, D. Aguillón, L. Hincapié-Henao, Carlos Andrés Tóbon-Quintero, Tobias Bocklet, M. Schuster, Juan Rafael Orozco-Arroyave, Elmar Nöth. 8338-8342 [doi]

A Noise-Robust Signal Processing Strategy for Cochlear Implants Using Neural NetworksNengheng Zheng, Yupeng Shi, Yuyong Kang, Qinglin Meng. 8343-8347 [doi]

Context-Aware Speech Stress Detection in Hospital Workers Using Bi-LSTM ClassifiersAmr Gaballah, Abhishek Tiwari, Shrikanth Narayanan, Tiago H. Falk. 8348-8352 [doi]

Unsupervised Heart Abnormality Detection Based on Phonocardiogram Analysis with Beta Variational Auto-EncodersShengchen Li, Ke Tian, Rui Wang. 8353-8357 [doi]

Compressing Deep Neural Networks for Efficient Speech EnhancementKe Tan, DeLiang Wang. 8358-8362 [doi]

Improved Mask-CTC for Non-Autoregressive End-to-End ASRYosuke Higuchi, Hirofumi Inaguma, Shinji Watanabe 0001, Tetsuji Ogawa, Tetsunori Kobayashi. 8363-8367 [doi]

Memory-Efficient Speech Recognition on Smart DevicesGanesh Venkatesh, Alagappan Valliappan, Jay Mahadeokar, Yuan Shangguan, Christian Fuegen, Michael L. Seltzer, Vikas Chandra. 8368-8372 [doi]

Expediting discovery in Neural Architecture Search by Combining Learning with PlanningFarzaneh S. Fard, Vikrant Singh Tomar. 8373-8377 [doi]

Specialized Embedding Approximation for Edge Intelligence: A Case Study in Urban Sound ClassificationSangeeta Srivastava, Dhrubojyoti Roy, Mark Cartwright, Juan Pablo Bello, Anish Arora. 8378-8382 [doi]

Light-TTS: Lightweight Multi-Speaker Multi-Lingual Text-to-SpeechSong Li, Beibei Ouyang, Lin Li, Qingyang Hong. 8383-8387 [doi]

Efficient Long Periodic Binary Sequence Designs for Automotive RadarYutao Chen, Ronghao Lin, Jian Li. 8388-8392 [doi]

Joint Localization and Predictive Beamforming in Vehicular Networks: Power Allocation Beyond Water-FillingFan Liu 0005, Christos Masouros. 8393-8397 [doi]

A New Automotive Radar 4D Point Clouds Detector by Using Deep LearningYuwei Cheng, Jingran Su, Hongyu Chen, Yimin Liu. 8398-8402 [doi]

Enhanced Automotive Target Detection through Radar and Communications Sensor FusionSayed Hossein Dokhanchi, R. Bhavani Shankar Mysore, Kumar Vijay Mishra, Björn E. Ottersten. 8403-8407 [doi]

Extended Object Tracking With Automotive Radar Using B-Spline Chained Ellipses ModelG. Yao, P. Wang, Karl Berntorp, H. Mansour, Petros Boufounos, Philip V. Orlik. 8408-8412 [doi]

Four-Dimensional High-Resolution Automotive Radar Imaging Exploiting Joint Sparse-Frequency and Sparse-Array DesignShunqiao Sun, Yimin D. Zhang. 8413-8417 [doi]

An Empirical Study of Visual Features for DNN Based Audio-Visual Speech Enhancement in Multi-Talker EnvironmentsShrishti Saha Shetu, Soumitro Chakrabarty, Emanuël Anco Peter Habets. 8418-8422 [doi]

On The Role of Visual Cues in Audiovisual Speech EnhancementZakaria Aldeneh, Anushree Prasanna Kumar, Barry-John Theobald, Erik Marchi, Sachin Kajarekar, Devang Naik, Ahmed Hussen Abdelaziz. 8423-8427 [doi]

Convolutive Transfer Function Invariant SDR Training Criteria for Multi-Channel Reverberant Speech SeparationChristoph Böddeker, Wangyou Zhang, Tomohiro Nakatani, Keisuke Kinoshita, Tsubasa Ochiai, Marc Delcroix, Naoyuki Kamo, Yanmin Qian, Reinhold Haeb-Umbach. 8428-8432 [doi]

Directional ASR: A New Paradigm for E2E Multi-Speaker Speech Recognition with Source LocalizationAswin Shanmugam Subramanian, Chao Weng, Shinji Watanabe 0001, Meng Yu 0003, Yong Xu 0004, Shi-Xiong Zhang, Dong Yu 0001. 8433-8437 [doi]

Communication-Cost Aware Microphone Selection for Neural Speech Enhancement with Ad-Hoc Microphone ArraysJonah Casebeer, Jamshed Kaikaus, Paris Smaragdis. 8438-8442 [doi]

Deep Multi-Frame MVDR Filtering for Single-Microphone Speech EnhancementMarvin Tammen, Simon Doclo. 8443-8447 [doi]

Compressive Wideband Spectrum Sensing and Carrier Frequency Estimation with Unknown Mimo ChannelsHongwei Wang 0005, Jilin Wang, Jun Fang 0001, Hongbin Li 0001. 8448-8452 [doi]

Joint Optimization of Spectrally Co-Existing Multi-Carrier Radar and Communication Systems in Cluttered EnvironmentsFangzhou Wang, Hongbin Li 0001, Braham Himed. 8453-8457 [doi]

Target Detection in Frequency Hopping MIMO Dual-Function Radar-Communication SystemsIndu Priya Eedara, Moeness G. Amin, Giuseppe A. Fabrizio. 8458-8462 [doi]

Asymptotic Distribution of Generalized Likelihood Ratio Test Under Model Misspecification With Application to Cooperative Radar-CommunicationsAkshay S. Bondre, Christ D. Richmond. 8463-8467 [doi]

Online Antenna Selection for Enhanced DOA EstimationElias Aboutanios, Hamed Nosrati, Xiangrong Wang 0001. 8468-8472 [doi]

Designing Random FM Radar Waveforms with Compact SpectrumCharles A. Mohr, Shannon D. Blunt. 8473-8477 [doi]

Collaborative Inference via Ensembles on the EdgeNir Shlezinger, Erez Farhan, Hai Morgenstern, Yonina C. Eldar. 8478-8482 [doi]

Allocating DNN Layers Computation Between Front-End Devices and The Cloud Server for Video Big Data ProcessingPeiyin Xing, Xiaofei Liu, Peixi Peng, Tiejun Huang, Yonghong Tian 0001. 8483-8487 [doi]

Branchy-GNN: A Device-Edge Co-Inference Framework for Efficient Point Cloud ProcessingJiawei Shao, Haowei Zhang, Yuyi Mao, Jun Zhang 0004. 8488-8492 [doi]

Collaborative Intelligence: Challenges and OpportunitiesIvan V. Bajic, Weisi Lin, YongHong Tian. 8493-8497 [doi]

Latent Space Motion Analysis for Collaborative IntelligenceMateen Ulhaq, Ivan V. Bajic. 8498-8502 [doi]

Teacher-Student Learning With Multi-Granularity Constraint Towards Compact Facial Feature RepresentationShurun Wang, Shiqi Wang 0001, Wenhan Yang, Xinfeng Zhang, Shanshe Wang, Siwei Ma. 8503-8507 [doi]

Discriminability of Single-Layer Graph Neural NetworksSamuel Pfrommer, Alejandro Ribeiro, Fernando Gama. 8508-8512 [doi]

On The Stability of Graph Convolutional Neural Networks Under Edge RewiringHenry Kenlay, Dorina Thanou, Xiaowen Dong 0001. 8513-8517 [doi]

Geometric Scattering Attention NetworksYimeng Min, Frederik Wenkel, Guy Wolf. 8518-8522 [doi]

Ego-GNNs: Exploiting Ego Structures in Graph Neural NetworksDylan Sandfelder, Priyesh Vijayan, William L. Hamilton. 8523-8527 [doi]

Learning the Relevant Substructures for Tasks on Graph DataLei Chen 0062, Zhengdao Chen, Joan Bruna. 8528-8532 [doi]

A Short Tutorial on The Weisfeiler-Lehman Test And Its VariantsNingyuan Teresa Huang, Soledad Villar. 8533-8537 [doi]

Hybrid Model for Network Anomaly Detection with Gradient Boosting Decision Trees and TabtransformerXinyue Xu, Xiaolu Zheng. 8538-8542 [doi]

Voting-Based Ensemble Model for Network Anomaly DetectionTzu-Hsin Yang, Yu-Tai Lin, Chao-Lun Wu, Chih-Yu Wang 0001. 8543-8547 [doi]

An Accuracy Network Anomaly Detection Method Based on Ensemble ModelFengrui Liu, Xuefei Li, Wei Xiong, Haiyang Jiang, Gaogang Xie. 8548-8552 [doi]

Fden: Mining Effective Information of Features in Detecting Network AnomaliesBin Li 0030, Yijie Wang, Mingyu Liu, Kele Xu, Zhongyang Wang, Li Cheng, Yizhou Li. 8553-8557 [doi]

Multi-Scale Residual Network for Covid-19 Diagnosis Using Ct-ScansPratyush Garg, Rishabh Ranjan, Kamini Upadhyay, Monika Agrawal, Desh Deepak. 8558-8562 [doi]

Diagnosing Covid-19 from CT Images Based on an Ensemble Learning FrameworkBingyang Li, Qi Zhang, Yinan Song, Zhicheng Zhao, Zhu Meng, Fei Su. 8563-8567 [doi]

CNR-IEMN: A Deep Learning Based Approach to Recognise Covid-19 from CT-ScanFares Bougourzi, Riccardo Contino, Cosimo Distante, Abdelmalik Taleb-Ahmed. 8568-8572 [doi]

Covid-19 Diagnostic Using 3d Deep Transfer Learning for Classification of Volumetric Computerised Tomography Chest ScansShuohan Xue, Charith Abhayaratne. 8573-8577 [doi]

A Multi-Stage Progressive Learning Strategy for Covid-19 Diagnosis Using Chest Computed Tomography with Imbalanced DataZaifeng Yang, Yubo Hou, Zhenghua Chen, Le Zhang, Jie Chen. 8578-8582 [doi]

Detecting Covid-19 and Community Acquired Pneumonia Using Chest CT Scan Images With Deep LearningShubham Chaudhary, Sadbhawna, Vinit Jakhetiya, Badri N. Subudhi, Ujjwal Baid, Sharath Chandra Guntuku. 8583-8587 [doi]

Investigating on Incorporating Pretrained and Learnable Speaker Representations for Multi-Speaker Multi-Style Text-to-SpeechChung-Ming Chien, Jheng-Hao Lin, Chien-Yu Huang, Po-Chun Hsu, Hung-yi Lee. 8588-8592 [doi]

The Thinkit System for Icassp2021 M2voc ChallengeZengqiang Shang, Haozhe Zhang, Ziyi Chen, Bolin Zhou, Pengyuan Zhang. 8593-8597 [doi]

Dian: Duration Informed Auto-Regressive Network for Voice CloningWei Song, Xin Yuan, Zhengchen Zhang, Chao Zhang, Youzheng Wu, Xiaodong He, Bowen Zhou. 8598-8602 [doi]

Prosody and Voice Factorization for Few-Shot Speaker Adaptation in the Challenge M2voc 2021Tao Wang, Ruibo Fu, Jiangyan Yi, Jianhua Tao, Zhengqi Wen, Chunyu Qiang, Shiming Wang. 8603-8607 [doi]

The Huya Multi-Speaker and Multi-Style Speech Synthesis System for M2voc Challenge 2020Jie Wang, Yuren You, Feng Liu, Deyi Tuo, Shiyin Kang, Zhiyong Wu 0001, Helen Meng. 8608-8612 [doi]

The Multi-Speaker Multi-Style Voice Cloning Challenge 2021Qicong Xie, Xiaohai Tian, Guanghou Liu, Kun Song, Lei Xie 0001, Zhiyong Wu, Hai Li, Song Shi, Haizhou Li 0001, Fen Hong, Hui Bu, Xin Xu. 8613-8617 [doi]

External Links

Cite Key

Statistics

PDF

Researchr

IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2021, Toronto, ON, Canada, June 6-11, 2021

Abstract

Table of Contents