International Conference on Machine Learning, ICML 2022, 17-23 July 2022, Baltimore, Maryland, USA

researchr

You are not signed in
Sign in
Sign up

Kamalika Chaudhuri, Stefanie Jegelka, Le Song, Csaba Szepesvári, Gang Niu 0001, Sivan Sabato, editors, International Conference on Machine Learning, ICML 2022, 17-23 July 2022, Baltimore, Maryland, USA. Volume 162 of Proceedings of Machine Learning Research, PMLR, 2022. [doi]

Conference: icml2022

Abstract is missing.

PAC-Bayesian Bounds on Rate-Efficient ClassifiersAlhabib Abbas, Yiannis Andreopoulos. 1-9 [doi]

Sharp-MAML: Sharpness-Aware Model-Agnostic Meta LearningMomin Abbas, Quan Xiao, Lisha Chen, Pin-Yu Chen, Tianyi Chen. 10-32 [doi]

An Initial Alignment between Neural Network and Target is Needed for Gradient Descent to LearnEmmanuel Abbe, Elisabetta Cornacchia, Jan Hazla, Christopher Marquis. 33-52 [doi]

Active Sampling for Min-Max FairnessJacob D. Abernethy, Pranjal Awasthi, Matthäus Kleindessner, Jamie Morgenstern, Chris Russell 0001, Jie Zhang. 53-65 [doi]

Meaningfully debugging model mistakes using conceptual counterfactual explanationsAbubakar Abid, Mert Yüksekgönül, James Zou 0001. 66-88 [doi]

Batched Dueling BanditsArpit Agarwal, Rohan Ghuge, Viswanath Nagarajan. 89-110 [doi]

Hierarchical Shrinkage: Improving the accuracy and interpretability of tree-based modelsAbhineet Agarwal, Yan Shuo Tan, Omer Ronen, Chandan Singh, Bin Yu 0001. 111-135 [doi]

Deep equilibrium networks are sensitive to initialization statisticsAtish Agarwala, Samuel S. Schoenholz. 136-160 [doi]

Learning of Cluster-based Feature Importance for Electronic Health Record Time-seriesHenrique Aguiar, Mauro D. Santos, Peter J. Watkinson, Tingting Zhu 0001. 161-179 [doi]

On the Convergence of the Shapley Value in Parametric Bayesian Learning GamesLucas Agussurja, Xinyi Xu, Bryan Kian Hsiang Low. 180-196 [doi]

Individual Preference Stability for ClusteringSaba Ahmadi, Pranjal Awasthi, Samir Khuller, Matthäus Kleindessner, Jamie Morgenstern, Pattara Sukprasert, Ali Vakilian. 197-246 [doi]

Understanding the unstable convergence of gradient descentKwangjun Ahn, Jingzhao Zhang, Suvrit Sra. 247-257 [doi]

Minimum Cost Intervention Design for Causal Effect IdentificationSina Akbari, Jalal Etesami, Negar Kiyavash. 258-289 [doi]

How Faithful is your Synthetic Data? Sample-level Metrics for Evaluating and Auditing Generative ModelsAhmed Alaa, Boris van Breugel, Evgeny S. Saveliev, Mihaela van der Schaar. 290-306 [doi]

A Natural Actor-Critic Framework for Zero-Sum Markov GamesAhmet Alacaoglu, Luca Viano, Niao He, Volkan Cevher. 307-366 [doi]

Deploying Convolutional Networks on Untrusted Platforms Using 2D Holographic Reduced RepresentationsMohammad Mahmudul Alam, Edward Raff, Tim Oates, James Holt. 367-393 [doi]

Optimistic Linear Support and Successor Features as a Basis for Optimal Policy TransferLucas Nunes Alegre, Ana L. C. Bazzan, Bruno C. da Silva 0001. 394-413 [doi]

Structured Stochastic Gradient MCMCAntonios Alexos, Alex J. Boyd, Stephan Mandt. 414-434 [doi]

XAI for Transformers: Better Explanations through Conservative PropagationAmeen Ali, Thomas Schnake, Oliver Eberle, Grégoire Montavon, Klaus-Robert Müller, Lior Wolf. 435-451 [doi]

RUMs from Head-to-Head ContestsMatteo Almanza, Flavio Chierichetti, Ravi Kumar 0001, Alessandro Panconesi, Andrew Tomkins. 452-467 [doi]

Neuro-Symbolic Language Modeling with Automaton-augmented RetrievalUri Alon 0002, Frank F. Xu, Junxian He, Sudipta Sengupta, Dan Roth, Graham Neubig. 468-485 [doi]

Minimax Classification under Concept Drift with Multidimensional Adaptation and Performance GuaranteesVerónica Álvarez, Santiago Mazuelas, José Antonio Lozano. 486-499 [doi]

Scalable First-Order Bayesian Optimization via Structured Automatic DifferentiationSebastian E. Ament, Carla P. Gomes. 500-516 [doi]

Public Data-Assisted Mirror Descent for Private Model TrainingEhsan Amid, Arun Ganesh, Rajiv Mathews, Swaroop Ramaswamy, Shuang Song 0001, Thomas Steinke 0002, Vinith M. Suriyakumar, Om Thakkar 0001, Abhradeep Thakurta. 517-535 [doi]

On Last-Iterate Convergence Beyond Zero-Sum GamesIoannis Anagnostides, Ioannis Panageas, Gabriele Farina, Tuomas Sandholm. 536-581 [doi]

Online Algorithms with Multiple PredictionsKeerti Anand, Rong Ge 0001, Amit Kumar, Debmalya Panigrahi. 582-598 [doi]

Learning to Hash Robustly, GuaranteedAlexandr Andoni, Daniel Beaglehole. 599-618 [doi]

Set Based Stochastic SubsamplingBruno Andreis, Seanie Lee, Tuan A. Nguyen, Juho Lee 0001, Eunho Yang, Sung Ju Hwang. 619-638 [doi]

Towards Understanding Sharpness-Aware MinimizationMaksym Andriushchenko, Nicolas Flammarion. 639-668 [doi]

Fair and Fast k-Center Clustering for Data SummarizationHaris Angelidakis, Adam Kurpisz, Leon Sering, Rico Zenklusen. 669-702 [doi]

Interactive Correlation Clustering with Existential Cluster ConstraintsRico Angell, Nicholas Monath, Nishant Yadav, Andrew McCallum. 703-716 [doi]

Image-to-Image Regression with Distribution-Free Uncertainty Quantification and Applications in ImagingAnastasios N. Angelopoulos, Amit Pal Singh Kohli, Stephen Bates, Michael I. Jordan, Jitendra Malik, Thayer Alshaabi, Srigokul Upadhyayula, Yaniv Romano. 717-730 [doi]

AdaGrad Avoids Saddle PointsKimon Antonakopoulos, Panayotis Mertikopoulos, Georgios Piliouras, Xiao Wang 0036. 731-771 [doi]

UnderGrad: A Universal Black-Box Optimization Method with Almost Dimension-Free Convergence Rate GuaranteesKimon Antonakopoulos, Dong Quan Vu, Volkan Cevher, Kfir Y. Levy, Panayotis Mertikopoulos. 772-795 [doi]

Adapting the Linearised Laplace Model Evidence for Modern Deep LearningJavier Antorán, David Janz, James Urquhart Allingham, Erik A. Daxberger, Riccardo Barbano, Eric T. Nalisnick, José Miguel Hernández-Lobato. 796-821 [doi]

EAT-C: Environment-Adversarial sub-Task Curriculum for Efficient Reinforcement LearningShuang Ao, Tianyi Zhou, Jing Jiang 0002, Guodong Long, Xuan Song, Chengqi Zhang. 822-843 [doi]

Online Balanced Experimental DesignDavid Arbour, Drew Dimmery, Tung Mai, Anup B. Rao. 844-864 [doi]

VariGrow: Variational Architecture Growing for Task-Agnostic Continual Learning based on Bayesian NoveltyRandy Ardywibowo, Zepeng Huo, Zhangyang Wang, Bobak J. Mortazavi, Shuai Huang, Xiaoning Qian. 865-877 [doi]

Thresholded Lasso BanditKaito Ariu, Kenshi Abe, Alexandre Proutière. 878-928 [doi]

Gradient Based ClusteringAleksandar Armacki, Dragana Bajovic, Dusan Jakovetic, Soummya Kar. 929-947 [doi]

Understanding Gradient Descent on the Edge of Stability in Deep LearningSanjeev Arora, Zhiyuan Li 0005, Abhishek Panigrahi. 948-1024 [doi]

Private optimization in the interpolation regime: faster rates and hardness resultsHilal Asi, Karan N. Chadha, Gary Cheng 0004, John Duchi. 1025-1045 [doi]

Optimal Algorithms for Mean Estimation under Local Differential PrivacyHilal Asi, Vitaly Feldman, Kunal Talwar. 1046-1056 [doi]

Asymptotically-Optimal Gaussian Bandits with Side ObservationsAlexia Atsidakou, Orestis Papadigenopoulos, Constantine Caramanis, Sujay Sanghavi, Sanjay Shakkottai. 1057-1077 [doi]

Congested Bandits: Optimal Routing via Short-term ResetsPranjal Awasthi, Kush Bhatia, Sreenivas Gollapudi, Kostas Kollias. 1078-1100 [doi]

Do More Negative Samples Necessarily Hurt In Contrastive Learning?Pranjal Awasthi, Nishanth Dikkala, Pritish Kamath. 1101-1116 [doi]

H-Consistency Bounds for Surrogate Loss MinimizersPranjal Awasthi, Anqi Mao, Mehryar Mohri, Yutao Zhong 0002. 1117-1174 [doi]

Iterative Hard Thresholding with Adaptive Regularization: Sparser Solutions Without Sacrificing RuntimeKyriakos Axiotis, Maxim Sviridenko. 1175-1197 [doi]

Proving Theorems using Incremental Learning and Hindsight Experience ReplayEser Aygün, Ankit Anand, Laurent Orseau, Xavier Glorot, Stephen M. McAleer, Vlad Firoiu, Lei M. Zhang, Doina Precup, Shibl Mourad. 1198-1210 [doi]

Near-optimal rate of consistency for linear models with missing valuesAlexis Ayme, Claire Boyer, Aymeric Dieuleveut, Erwan Scornet. 1211-1243 [doi]

How Tempering Fixes Data Augmentation in Bayesian Neural NetworksGregor Bachmann, Lorenzo Noci, Thomas Hofmann. 1244-1260 [doi]

ASAP.SGD: Instance-based Adaptiveness to Staleness in Asynchronous SGDKarl Bäckström, Marina Papatriantafilou, Philippas Tsigas. 1261-1276 [doi]

From Noisy Prediction to True Label: Noisy Prediction Calibration via Generative ModelHeeSun Bae, SeungJae Shin, Byeonghu Na, JoonHo Jang, Kyungwoo Song, Il-Chul Moon. 1277-1297 [doi]

data2vec: A General Framework for Self-supervised Learning in Speech, Vision and LanguageAlexei Baevski, Wei-Ning Hsu, Qiantong Xu, Arun Babu, Jiatao Gu, Michael Auli. 1298-1312 [doi]

End-to-End Balancing for Causal Continuous Treatment-Effect EstimationMohammad Taha Bahadori, Eric Tchetgen Tchetgen, David Heckerman. 1313-1326 [doi]

A Hierarchical Transitive-Aligned Graph Kernel for Un-attributed GraphsLu Bai, Lixin Cui, Edwin R. Hancock. 1327-1336 [doi]

Near-Optimal Learning of Extensive-Form Games with Imperfect InformationYu Bai, Chi Jin, Song Mei, Tiancheng Yu. 1337-1382 [doi]

Gaussian Mixture Variational Autoencoder with Contrastive Learning for Multi-Label ClassificationJunwen Bai, Shufeng Kong, Carla P. Gomes. 1383-1398 [doi]

3T: Alignment-Aware Acoustic and Text Pretraining for Speech Synthesis and EditingHe Bai, Renjie Zheng, Junkun Chen, Mingbo Ma, Xintong Li, Liang Huang 0001. 1399-1411 [doi]

Stability Based Generalization Bounds for Exponential Family Langevin DynamicsArindam Banerjee 0001, Tiancong Chen, Xinyan Li, Yingxue Zhou. 1412-1449 [doi]

Certified Neural Network Watermarks with Randomized SmoothingArpit Bansal, Ping-Yeh Chiang, Michael J. Curry, Rajiv Jain, Curtis Wigington, Varun Manjunatha, John P. Dickerson, Tom Goldstein. 1450-1465 [doi]

Data Scaling Laws in NMT: The Effect of Noise and ArchitectureYamini Bansal, Behrooz Ghorbani, Ankush Garg, Biao Zhang, Colin Cherry, Behnam Neyshabur, Orhan Firat. 1466-1482 [doi]

Learning Stable Classifiers by Transferring Unstable FeaturesYujia Bao, Shiyu Chang, Regina Barzilay. 1483-1507 [doi]

Fast Composite Optimization and Statistical Recovery in Federated LearningYajie Bao, Michael Crawshaw, Shan Luo, Mingrui Liu. 1508-1536 [doi]

Generative Modeling for Multi-task Visual LearningZhipeng Bao, Martial Hebert, Yu-Xiong Wang. 1537-1554 [doi]

Estimating the Optimal Covariance with Imperfect Mean in Diffusion Probabilistic ModelsFan Bao, Chongxuan Li, Jiacheng Sun, Jun Zhu, Bo Zhang. 1555-1584 [doi]

On the Surrogate Gap between Contrastive and Supervised LossesHan Bao 0002, Yoshihiro Nagano, Kento Nozawa. 1585-1606 [doi]

Representation Topology Divergence: A Method for Comparing Neural Network RepresentationsSerguei Barannikov, Ilya Trofimov, Nikita Balabin, Evgeny Burnaev. 1607-1626 [doi]

Sparse Mixed Linear Regression with Guarantees: Taming an Intractable Problem with Invex RelaxationAdarsh Barik, Jean Honorio. 1627-1646 [doi]

Neural Fisher Discriminant Analysis: Optimal Neural Network Embeddings in Polynomial TimeBurak Bartan, Mert Pilanci. 1647-1663 [doi]

Fictitious Play and Best-Response Dynamics in Identical Interest and Zero-Sum Stochastic GamesLucas Baudin, Rida Laraki. 1664-1690 [doi]

Information Discrepancy in Strategic LearningYahav Bechavod, Chara Podimata, Zhiwei Steven Wu, Juba Ziani. 1691-1715 [doi]

On the Hidden Biases of Policy Mirror Ascent in Continuous Action SpacesAmrit Singh Bedi, Souradip Chakraborty, Anjaly Parayil, Brian M. Sadler, Pratap Tokekar, Alec Koppel. 1716-1731 [doi]

Imitation Learning by Estimating Expertise of DemonstratorsMark Beliaev, Andy Shih, Stefano Ermon, Dorsa Sadigh, Ramtin Pedarsani. 1732-1748 [doi]

Matching Normalizing Flows and Probability Paths on ManifoldsHeli Ben Hamu, Samuel Cohen, Joey Bose, Brandon Amos, Maximilian Nickel, Aditya Grover, Ricky T. Q. Chen, Yaron Lipman. 1749-1763 [doi]

Stochastic Contextual Dueling Bandits under Linear Stochastic Transitivity ModelsViktor Bengs, Aadirupa Saha, Eyke Hüllermeier. 1764-1786 [doi]

Neural Inverse KinematicRaphael Bensadoun, Shir Gur, Nitsan Blau, Lior Wolf. 1787-1797 [doi]

Volatility Based Kernels and Moving Average Means for Accurate Forecasting with Gaussian ProcessesGregory W. Benton, Wesley J. Maddox, Andrew Gordon Wilson. 1798-1816 [doi]

Gradient Descent on Neurons and its Link to Approximate Second-order OptimizationFrederik Benzing. 1817-1853 [doi]

Safe Learning in Tree-Form Sequential Decision Making: Handling Hard and Soft ConstraintsMartino Bernasconi, Federico Cacciamani, Matteo Castiglioni, Alberto Marchesi, Nicola Gatti 0001, Francesco Trovò. 1854-1873 [doi]

Skin Deep Unlearning: Artefact and Instrument Debiasing in the Context of Melanoma ClassificationPeter J. Bevan, Amir Atapour Abarghouei. 1874-1892 [doi]

Approximate Bayesian Computation with Domain Expert in the LoopAyush Bharti, Louis Filstroff, Samuel Kaski. 1893-1905 [doi]

Minimax M-estimation under Adversarial ContaminationSujay Bhatt, Guanhua Fang, Ping Li 0001, Gennady Samorodnitsky. 1906-1924 [doi]

Nearly Optimal Catoni's M-estimator for Infinite VarianceSujay Bhatt, Guanhua Fang, Ping Li 0001, Gennady Samorodnitsky. 1925-1944 [doi]

Personalization Improves Privacy-Accuracy Tradeoffs in Federated LearningAlberto Bietti, Chen-Yu Wei, Miroslav Dudík, John Langford 0001, Zhiwei Steven Wu. 1945-1962 [doi]

Non-Vacuous Generalisation Bounds for Shallow Neural NetworksFelix Biggs, Benjamin Guedj. 1963-1981 [doi]

Structure-preserving GANsJeremiah Birrell, Markos A. Katsoulakis, Luc Rey-Bellet, Wei Zhu. 1982-2020 [doi]

Scalable Spike-and-SlabNiloy Biswas, Lester Mackey, Xiao-Li Meng. 2021-2040 [doi]

Breaking Down Out-of-Distribution Detection: Many Methods Based on OOD Training Data Estimate a Combination of the Same Core QuantitiesJulian Bitterwolf, Alexander Meinke, Maximilian Augustin, Matthias Hein 0001. 2041-2074 [doi]

A query-optimal algorithm for finding counterfactualsGuy Blanc, Caleb Koch, Jane Lange, Li-Yang Tan. 2075-2090 [doi]

Popular decision tree algorithms are provably noise tolerantGuy Blanc, Jane Lange, Ali Malik, Li-Yang Tan. 2091-2106 [doi]

Optimizing Sequential Experimental Design with Deep Reinforcement LearningTom Blau, Edwin V. Bonilla, Iadine Chades, Amir Dezfouli. 2107-2128 [doi]

Lagrangian Method for Q-Function Learning (with Applications to Machine Translation)Bojun Huang. 2129-2159 [doi]

Generalized Results for the Existence and Consistency of the MLE in the Bradley-Terry-Luce ModelHeejong Bong, Alessandro Rinaldo. 2160-2177 [doi]

How to Train Your Wide Neural Network Without Backprop: An Input-Weight Alignment PerspectiveAkhilan Boopathy, Ila Fiete. 2178-2205 [doi]

Improving Language Models by Retrieving from Trillions of TokensSebastian Borgeaud, Arthur Mensch, Jordan Hoffmann, Trevor Cai, Eliza Rutherford, Katie Millican, George van den Driessche 0002, Jean-Baptiste Lespiau, Bogdan Damoc, Aidan Clark, Diego de Las Casas, Aurelia Guy, Jacob Menick, Roman Ring, Tom Hennigan, Saffron Huang, Loren Maggiore, Chris Jones, Albin Cassirer, Andy Brock, Michela Paganini, Geoffrey Irving, Oriol Vinyals, Simon Osindero, Karen Simonyan, Jack W. Rae, Erich Elsen, Laurent Sifre. 2206-2240 [doi]

Lie Point Symmetry Data Augmentation for Neural PDE SolversJohannes Brandstetter, Max Welling, Daniel E. Worrall. 2241-2256 [doi]

An iterative clustering algorithm for the Contextual Stochastic Block Model with optimality guaranteesGuillaume Braun, Hemant Tyagi, Christophe Biernacki. 2257-2291 [doi]

Tractable Dendritic RNNs for Reconstructing Nonlinear Dynamical SystemsManuel Brenner, Florian Hess, Jonas M. Mikhaeil, Leonard F. Bereska, Zahra Monfared, Po-Chen Kuo, Daniel Durstewitz. 2292-2320 [doi]

Learning to Predict Graphs with Fused Gromov-Wasserstein BarycentersLuc Brogat-Motte, Rémi Flamary, Céline Brouard, Juho Rousu, Florence d'Alché-Buc. 2321-2335 [doi]

Efficient Learning of CNNs using Patch Based FeaturesAlon Brutzkus, Amir Globerson, Eran Malach, Alon Regev Netser, Shai Shalev-Shwartz. 2336-2356 [doi]

Causal structure-based root cause analysis of outliersKailash Budhathoki, Lenon Minorics, Patrick Blöbaum, Dominik Janzing. 2357-2369 [doi]

IGLUE: A Benchmark for Transfer Learning across Modalities, Tasks, and LanguagesEmanuele Bugliarello, Fangyu Liu 0001, Jonas Pfeiffer, Siva Reddy, Desmond Elliott, Edoardo Maria Ponti, Ivan Vulic. 2370-2392 [doi]

Interactive Inverse Reinforcement Learning for Cooperative GamesThomas Kleine Büning, Anne-Marie George, Christos Dimitrakakis. 2393-2413 [doi]

Convolutional and Residual Networks Provably Contain Lottery TicketsRebekka Burkholz. 2414-2433 [doi]

Near-Optimal Algorithms for Autonomous Exploration and Multi-Goal Stochastic Shortest PathHaoyuan Cai, Tengyu Ma 0001, Simon S. Du. 2434-2456 [doi]

Convergence of Invariant Graph NetworksChen Cai, Yusu Wang. 2457-2484 [doi]

Reinforcement Learning from Partial Observation: Linear Function Approximation with Provable Sample EfficiencyQi Cai, Zhuoran Yang, Zhaoran Wang. 2485-2522 [doi]

Scaling Gaussian Process Optimization by Evaluating a Few Unique Candidates Multiple TimesDaniele Calandriello, Luigi Carratino, Alessandro Lazaric, Michal Valko, Lorenzo Rosasco. 2523-2541 [doi]

Adaptive Gaussian Process Change Point DetectionEdoardo Caldarelli, Philippe Wenk, Stefan Bauer, Andreas Krause 0001. 2542-2571 [doi]

Measuring dissimilarity with diffeomorphism invarianceThéophile Cantelobre, Carlo Ciliberto, Benjamin Guedj, Alessandro Rudi. 2572-2596 [doi]

A Model-Agnostic Randomized Learning Framework based on Random Hypothesis Subspace SamplingYiting Cao, Chao Lan. 2597-2608 [doi]

Gaussian Process Uniform Error Bounds with Unknown Hyperparameters for Safety-Critical ApplicationsAlexandre Capone, Armin Lederer, Sandra Hirche. 2609-2624 [doi]

Burst-Dependent Plasticity and Dendritic Amplification Support Target-Based Learning and Hierarchical Imitation LearningCristiano Capone, Cosimo Lupo, Paolo Muratore, Pier Stanislao Paolucci. 2625-2637 [doi]

A Marriage between Adversarial Team Games and 2-player Games: Enabling Abstractions, No-regret Learning, and Subgame SolvingLuca Carminati, Federico Cacciamani, Marco Ciccone, Nicola Gatti 0001. 2638-2657 [doi]

RECAPP: Crafting a More Efficient Catalyst for Convex OptimizationYair Carmon, Arun Jambulapati, Yujia Jin, Aaron Sidford. 2658-2685 [doi]

Estimating and Penalizing Induced Preference Shifts in Recommender SystemsMicah D. Carroll, Anca D. Dragan, Stuart Russell 0001, Dylan Hadfield-Menell. 2686-2708 [doi]

YourTTS: Towards Zero-Shot Multi-Speaker TTS and Zero-Shot Voice Conversion for EveryoneEdresson Casanova, Julian Weber, Christopher Dane Shulby, Arnaldo Cândido Júnior, Eren Gölge, Moacir A. Ponti. 2709-2720 [doi]

The Infinite Contextual Graph Markov ModelDaniele Castellana, Federico Errica, Davide Bacciu, Alessio Micheli. 2721-2737 [doi]

Compressed-VFL: Communication-Efficient Learning with Vertically Partitioned DataTimothy J. Castiglia, Anirban Das, Shiqiang Wang 0001, Stacy Patterson. 2738-2766 [doi]

Online Learning with Knapsacks: the Best of Both WorldsMatteo Castiglioni, Andrea Celli, Christian Kroer. 2767-2783 [doi]

Stabilizing Off-Policy Deep Reinforcement Learning from PixelsEdoardo Cetin, Philip J. Ball, Stephen J. Roberts, Oya Çeliktutan. 2784-2810 [doi]

Accelerated, Optimal and Parallel: Some results on model-based stochastic optimizationKaran N. Chadha, Gary Cheng 0004, John C. Duchi. 2811-2827 [doi]

Robust Imitation Learning against Variations in Environment DynamicsJongseong Chae, Seungyul Han, Whiyoung Jung, Myungsik Cho, Sungho Choi, Youngchul Sung. 2828-2852 [doi]

Fairness with Adaptive WeightsJunyi Chai, Xiaoqian Wang. 2853-2866 [doi]

UNIREX: A Unified Learning Framework for Language Model Rationale ExtractionAaron Chan, Maziar Sanjabi, Lambert Mathias, Liang Tan 0005, Shaoliang Nie, Xiaochang Peng, Xiang Ren, Hamed Firooz. 2867-2889 [doi]

Revisiting Label Smoothing and Knowledge Distillation Compatibility: What was Missing?Keshigeyan Chandrasegaran, Ngoc-Trung Tran, Yunqing Zhao, Ngai-Man Cheung. 2890-2916 [doi]

Style Equalization: Unsupervised Learning of Controllable Generative Sequence ModelsJen-Hao Rick Chang, Ashish Shrivastava, Hema Koppula, Xiaoshuai Zhang, Oncel Tuzel. 2917-2937 [doi]

Learning Bellman Complete Representations for Offline Policy EvaluationJonathan Chang, Kaiwen Wang, Nathan Kallus, Wen Sun. 2938-2971 [doi]

Sample Efficient Learning of Predictors that Complement HumansMohammad-Amin Charusaie, Hussein Mozannar, David A. Sontag, Samira Samadi. 2972-3005 [doi]

Nyström Kernel Mean EmbeddingsAntoine Chatalic, Nicolas Schreuder, Lorenzo Rosasco, Alessandro Rudi. 3006-3024 [doi]

Coarsening the Granularity: Towards Structurally Sparse Lottery TicketsTianlong Chen, Xuxi Chen, Xiaolong Ma, Yanzhi Wang, Zhangyang Wang. 3025-3039 [doi]

Learning Domain Adaptive Object Detection with Probabilistic TeacherMeilin Chen, Weijie Chen, Shicai Yang, Jie Song, Xinchao Wang, Lei Zhang, Yunfeng Yan, Donglian Qi, Yueting Zhuang, Di Xie, Shiliang Pu. 3040-3055 [doi]

The Fundamental Price of Secure Aggregation in Differentially Private Federated LearningWei-Ning Chen, Christopher A. Choquette-Choo, Peter Kairouz, Ananda Theertha Suresh. 3056-3089 [doi]

Perfectly Balanced: Improving Transfer and Robustness of Supervised Contrastive LearningMayee F. Chen, Daniel Y. Fu, Avanika Narayan, Michael Zhang, Zhao Song 0002, Kayvon Fatahalian, Christopher Ré. 3090-3122 [doi]

Strategies for Safe Multi-Armed Bandits with Logarithmic Regret and RiskTianrui Chen, Aditya Gangrade, Venkatesh Saligrama. 3123-3148 [doi]

On the Sample Complexity of Learning Infinite-horizon Discounted Linear Kernel MDPsYuanzhou Chen, Jiafan He, Quanquan Gu. 3149-3183 [doi]

Streaming Algorithms for Support-Aware HistogramsJustin Y. Chen, Piotr Indyk, Tal Wagner. 3184-3203 [doi]

Improved No-Regret Algorithms for Stochastic Shortest Path with Linear MDPLiyu Chen, Rahul Jain 0002, Haipeng Luo. 3204-3245 [doi]

Learning Infinite-horizon Average-reward Markov Decision Process with ConstraintsLiyu Chen, Rahul Jain 0002, Haipeng Luo. 3246-3270 [doi]

Active Multi-Task Representation LearningYifang Chen, Kevin G. Jamieson, Simon S. Du. 3271-3298 [doi]

On Collective Robustness of Bagging Against Data PoisoningRuoxin Chen, Zenan Li, Jie Li 0002, Junchi Yan, Chentao Wu. 3299-3319 [doi]

Online Active RegressionCheng Chen, Yi Li 0002, Yiming Sun. 3320-3335 [doi]

Selling Data To a Machine Learner: Pricing via Costly SignalingJunjie Chen, Minming Li, Haifeng Xu. 3336-3359 [doi]

ME-GAN: Learning Panoptic Electrocardio Representations for Multi-view ECG Synthesis Conditioned on Heart DiseasesJintai Chen, Kuanlun Liao, Kun Wei, Haochao Ying, Danny Z. Chen, Jian Wu 0001. 3360-3370 [doi]

Weisfeiler-Lehman Meets Gromov-WassersteinSamantha Chen, Sunhyuk Lim, Facundo Mémoli, Zhengchao Wan, Yusu Wang. 3371-3416 [doi]

On Non-local Convergence Analysis of Deep Linear NetworksKun Chen, Dachao Lin, Zhihua Zhang. 3417-3443 [doi]

Flow-based Recurrent Belief State Learning for POMDPsXiaoyu Chen, Yao Mark Mu, Ping Luo, Shengbo Li, Jianyu Chen. 3444-3468 [doi]

Structure-Aware Transformer for Graph Representation LearningDexiong Chen, Leslie O'Bray, Karsten M. Borgwardt. 3469-3489 [doi]

The Poisson Binomial Mechanism for Unbiased Federated Learning with Secure AggregationWei-Ning Chen, Ayfer Özgür, Peter Kairouz. 3490-3506 [doi]

Learning Mixtures of Linear Dynamical SystemsYanxi Chen, H. Vincent Poor. 3507-3557 [doi]

On Well-posedness and Minimax Optimal Rates of Nonparametric Q-function Estimation in Off-policy EvaluationXiaohong Chen, Zhengling Qi. 3558-3582 [doi]

Faster Fundamental Graph Algorithms via Learned PredictionsJustin Y. Chen, Sandeep Silwal, Ali Vakilian, Fred Zhang. 3583-3602 [doi]

Improve Single-Point Zeroth-Order Optimization Using High-Pass and Low-Pass FiltersXin Chen, Yujie Tang 0002, Na Li 0002. 3603-3620 [doi]

Deep Variational Graph Convolutional Recurrent Network for Multivariate Time Series Anomaly DetectionWenchao Chen, Long Tian, Bo Chen, Liang Dai, Zhibin Duan, Mingyuan Zhou. 3621-3633 [doi]

Auxiliary Learning with Joint Task and Data SchedulingHong Chen, Xin Wang, Chaoyu Guan, Yue Liu, Wenwu Zhu 0001. 3634-3647 [doi]

Optimization-Induced Graph Implicit Nonlinear DiffusionQi Chen, Yifei Wang, Yisen Wang 0001, Jiansheng Yang, Zhouchen Lin. 3648-3661 [doi]

Robust Meta-learning with Sampling Noise and Label Noise via Eigen-ReptileDong Chen, Lingfei Wu, Siliang Tang, Xiao Yun, Bo Long, Yueting Zhuang. 3662-3678 [doi]

Adaptive Model Design for Markov Decision ProcessSiyu Chen, Donglin Yang, Jiayang Li, Senmiao Wang, Zhuoran Yang, Zhaoran Wang. 3679-3700 [doi]

State Transition of Dendritic Spines Improves Learning of Sparse Spiking Neural NetworksYanqi Chen, Zhaofei Yu, Wei Fang, Zhengyu Ma, Tiejun Huang 0001, Yonghong Tian 0001. 3701-3715 [doi]

Efficient Online ML API Selection for Multi-Label Classification TasksLingjiao Chen, Matei Zaharia, James Zou 0001. 3716-3746 [doi]

Data-Efficient Double-Win Lottery Tickets from Robust Pre-trainingTianlong Chen, Zhenyu Zhang, Sijia Liu 0001, Yang Zhang, Shiyu Chang, Zhangyang Wang. 3747-3759 [doi]

Linearity Grafting: Relaxed Neuron Pruning Helps Certifiable RobustnessTianlong Chen, Huan Zhang, Zhenyu Zhang, Shiyu Chang, Sijia Liu 0001, Pin-Yu Chen, Zhangyang Wang. 3760-3772 [doi]

Human-in-the-loop: Provably Efficient Preference-based Reinforcement Learning with General Function ApproximationXiaoyu Chen, Han Zhong, Zhuoran Yang, Zhaoran Wang, Liwei Wang. 3773-3793 [doi]

Sample and Communication-Efficient Decentralized Actor-Critic Algorithms with Finite-Time AnalysisZiyi Chen 0002, Yi Zhou, Rong-Rong Chen, Shaofeng Zou. 3794-3834 [doi]

Task-aware Privacy Preservation for Multi-dimensional DataJiangnan Cheng, Ao Tang, Sandeep Chinchali. 3835-3851 [doi]

Adversarially Trained Actor Critic for Offline Reinforcement LearningChing-An Cheng, Tengyang Xie, Nan Jiang 0008, Alekh Agarwal. 3852-3878 [doi]

Quantum-Inspired Algorithms from Randomized Numerical Linear AlgebraNadiia Chepurko, Kenneth L. Clarkson, Lior Horesh, Honghao Lin, David P. Woodruff. 3879-3900 [doi]

RieszNet and ForestRiesz: Automatic Debiased Machine Learning with Neural Nets and Random ForestsVictor Chernozhukov, Whitney Newey, Victor Quintas-Martinez, Vasilis Syrgkanis. 3901-3914 [doi]

Self-supervised learning with random-projection quantizer for speech recognitionChung-Cheng Chiu, James Qin, Yu Zhang, Jiahui Yu, Yonghui Wu. 3915-3924 [doi]

Discrete Probabilistic Inverse Optimal TransportWei-Ting Chiu, Pei Wang, Patrick Shafto. 3925-3946 [doi]

Selective Network Linearization for Efficient Private InferenceMinsu Cho, Ameya Joshi, Brandon Reagen, Siddharth Garg, Chinmay Hegde. 3947-3961 [doi]

From block-Toeplitz matrices to differential equations on graphs: towards a general theory for scalable masked TransformersKrzysztof Choromanski, Han Lin, Haoxian Chen, Tianyi Zhang, Arijit Sehanobish, Valerii Likhosherstov, Jack Parker-Holder, Tamás Sarlós, Adrian Weller, Thomas Weingarten. 3962-3983 [doi]

Shuffle Private Linear Contextual BanditsSayak Ray Chowdhury, Xingyu Zhou 0001. 3984-4009 [doi]

DNA: Domain Generalization with Diversified Neural AveragingXu Chu, Yujie Jin, Wenwu Zhu 0001, Yasha Wang, Xin Wang, Shanghang Zhang, Hong Mei. 4010-4034 [doi]

TPC: Transformation-Specific Smoothing for Point Cloud ModelsWenda Chu, Linyi Li, Bo Li 0026. 4035-4056 [doi]

Unified Scaling Laws for Routed Language ModelsAidan Clark, Diego de Las Casas, Aurelia Guy, Arthur Mensch, Michela Paganini, Jordan Hoffmann, Bogdan Damoc, Blake A. Hechtman, Trevor Cai, Sebastian Borgeaud, George van den Driessche 0002, Eliza Rutherford, Tom Hennigan, Matthew J. Johnson, Albin Cassirer, Chris Jones, Elena Buchatskaya, David Budden, Laurent Sifre, Simon Osindero, Oriol Vinyals, Marc'Aurelio Ranzato, Jack W. Rae, Erich Elsen, Koray Kavukcuoglu, Karen Simonyan. 4057-4086 [doi]

Context-Aware Drift DetectionOliver Cobb, Arnaud Van Looveren. 4087-4111 [doi]

On the Robustness of CountSketch to Adaptive InputsEdith Cohen, Xin Lyu 0002, Jelani Nelson, Tamás Sarlós, Moshe Shechner, Uri Stemmer. 4112-4140 [doi]

Diffusion bridges vector quantized variational autoencodersMax Cohen, Guillaume Quispe, Sylvain Le Corff, Charles Ollion, Eric Moulines. 4141-4156 [doi]

Online and Consistent Correlation ClusteringVincent Cohen-Addad, Silvio Lattanzi, Andreas Maggiori, Nikos Parotsidis. 4157-4179 [doi]

Massively Parallel k-Means Clustering for Perturbation Resilient InstancesVincent Cohen-Addad, Vahab S. Mirrokni, Peilin Zhong. 4180-4201 [doi]

One-Pass Diversified Sampling with Application to Terabyte-Scale Genomic Sequence StreamsBenjamin Coleman, Benito Geordie, Li Chou, Ryan A. Leo Elworth, Todd J. Treangen, Anshumali Shrivastava. 4202-4218 [doi]

Transfer and Marginalize: Explaining Away Label Noise with Privileged InformationMark Collier, Rodolphe Jenatton, Effrosyni Kokiopoulou, Jesse Berent. 4219-4237 [doi]

MAML and ANIL Provably Learn RepresentationsLiam Collins, Aryan Mokhtari, Sewoong Oh, Sanjay Shakkottai. 4238-4310 [doi]

Entropic Causal Inference: Graph IdentifiabilitySpencer Compton, Kristjan H. Greenewald, Dmitriy A. Katz, Murat Kocaoglu. 4311-4343 [doi]

Mitigating Gender Bias in Face Recognition using the von Mises-Fisher Mixture ModelJean-Rémy Conti, Nathan Noiry, Stéphan Clemencon, Vincent Despiegel, Stéphane Gentric. 4344-4369 [doi]

Counterfactual Transportability: A Formal ApproachJuan D. Correa, Sanghack Lee, Elias Bareinboim. 4370-4390 [doi]

Label-Free Explainability for Unsupervised ModelsJonathan Crabbé, Mihaela van der Schaar. 4391-4420 [doi]

Evaluating the Adversarial Robustness of Adaptive Test-time DefensesFrancesco Croce, Sven Gowal, Thomas Brunner, Evan Shelhamer, Matthias Hein 0001, A. Taylan Cemgil. 4421-4435 [doi]

p-Threat Models via Quick Fine-Tuning of Robust ClassifiersFrancesco Croce, Matthias Hein 0001. 4436-4454 [doi]

Self-conditioning Pre-Trained Language ModelsXavier Suau Cuadros, Luca Zappella, Nicholas Apostoloff. 4455-4473 [doi]

Only tails matter: Average-Case Universality and Robustness in the Convex RegimeLeonardo Cunha, Gauthier Gidel, Fabian Pedregosa, Damien Scieur, Courtney Paquette. 4474-4491 [doi]

Principal Component FlowsEdmond Cunningham, Adam D. Cobb, Susmit Jha. 4492-4519 [doi]

Deep symbolic regression for recurrence predictionStéphane d'Ascoli, Pierre-Alexandre Kamienny, Guillaume Lample, François Charton. 4520-4536 [doi]

Continuous Control with Action Quantization from DemonstrationsRobert Dadashi, Léonard Hussenot, Damien Vincent, Sertan Girgin, Anton Raichuk, Matthieu Geist, Olivier Pietquin. 4537-4557 [doi]

Dialog Inpainting: Turning Documents into DialogsZhuyun Dai, Arun Tejasvi Chaganty, Vincent Y. Zhao, Aida Amini, Qazi Mamunur Rashid, Mike Green, Kelvin Guu. 4558-4586 [doi]

DisPFL: Towards Communication-Efficient Personalized Federated Learning via Decentralized Sparse TrainingRong Dai, Li Shen 0008, Fengxiang He, Xinmei Tian 0001, Dacheng Tao. 4587-4604 [doi]

Marginal Distribution Adaptation for Discrete Sets via Module-Oriented Divergence MinimizationHanjun Dai, Mengjiao Yang, Yuan Xue, Dale Schuurmans, Bo Dai. 4605-4617 [doi]

Balancing Sample Efficiency and Suboptimality in Inverse Reinforcement LearningAngelo Damiani, Giorgio Manganini, Alberto Maria Metelli, Marcello Restelli. 4618-4629 [doi]

Understanding Robust Generalization in Learning Regular LanguagesSoham Dan, Osbert Bastani, Dan Roth. 4630-4643 [doi]

Unsupervised Image Representation Learning with Deep Latent ParticlesTal Daniel, Aviv Tamar. 4644-4665 [doi]

Guarantees for Epsilon-Greedy Reinforcement Learning with Function ApproximationChristoph Dann, Yishay Mansour, Mehryar Mohri, Ayush Sekhari, Karthik Sridharan. 4666-4689 [doi]

Monarch: Expressive Structured Matrices for Efficient and Accurate TrainingTri Dao, Beidi Chen, Nimit Sharad Sohoni, Arjun D. Desai, Michael Poli, Jessica Grogan, Alexander Liu, Aniruddh Rao, Atri Rudra, Christopher Ré. 4690-4721 [doi]

Score-Guided Intermediate Level Optimization: Fast Langevin Mixing for Inverse ProblemsGiannis Daras, Yuval Dagan, Alex Dimakis, Constantinos Daskalakis. 4722-4753 [doi]

Test-Time Training Can Close the Natural Distribution Shift Performance Gap in Deep Learning Based Compressed SensingMohammad Zalbagi Darestani, Jiayu Liu, Reinhard Heckel. 4754-4776 [doi]

Knowledge Base Question Answering by Case-based Reasoning over SubgraphsRajarshi Das, Ameya Godbole, Ankita Naik, Elliot Tower, Manzil Zaheer, Hannaneh Hajishirzi, Robin Jia, Andrew McCallum. 4777-4793 [doi]

Framework for Evaluating Faithfulness of Local ExplanationsSanjoy Dasgupta, Nave Frost, Michal Moshkovitz. 4794-4815 [doi]

Distinguishing rule and exemplar-based generalization in learning systemsIshita Dasgupta, Erin Grant, Tom Griffiths. 4816-4830 [doi]

Robust Multi-Objective Bayesian Optimization Under Input NoiseSamuel Daulton, Sait Cakmak, Maximilian Balandat, Michael A. Osborne, Enlu Zhou, Eytan Bakshy. 4831-4866 [doi]

Attentional Meta-learners for Few-shot Polythetic ClassificationBen J. Day, Ramón Viñas Torné 0001, Nikola Simidjievski, Pietro Lió. 4867-4889 [doi]

Adversarial Vulnerability of Randomized EnsemblesHassan Dbouk, Naresh R. Shanbhag. 4890-4917 [doi]

Born-Infeld (BI) for AI: Energy-Conserving Descent (ECD) for OptimizationGiuseppe Bruno De Luca, Eva Silverstein. 4918-4936 [doi]

Error-driven Input Modulation: Solving the Credit Assignment Problem without a Backward PassGiorgia Dellaferrera, Gabriel Kreiman. 4937-4955 [doi]

DreamerPro: Reconstruction-Free Model-Based Reinforcement Learning with Prototypical RepresentationsFei Deng, Ingook Jang, Sungjin Ahn. 4956-4975 [doi]

NeuralEF: Deconstructing Kernels by Deep Neural NetworksZhijie Deng, Jiaxin Shi, Jun Zhu. 4976-4992 [doi]

Deep Causal Metric LearningXiang Deng 0002, Zhongfei Zhang. 4993-5006 [doi]

On the Convergence of Inexact Predictor-Corrector Methods for Linear ProgrammingGregory Dexter, Agniva Chowdhury, Haim Avron, Petros Drineas. 5007-5038 [doi]

Analysis of Stochastic Processes through Replay BuffersShirli Di-Castro Shashua, Shie Mannor, Dotan Di Castro. 5039-5060 [doi]

Streaming Algorithms for High-Dimensional Robust StatisticsIlias Diakonikolas, Daniel M. Kane, Ankit Pensia, Thanasis Pittas. 5061-5117 [doi]

Learning General Halfspaces with Adversarial Label Noise via Online Gradient DescentIlias Diakonikolas, Vasilis Kontonis, Christos Tzamos, Nikos Zarifis. 5118-5141 [doi]

Variational Feature Pyramid NetworksPanagiotis Dimitrakopoulos, Giorgos Sfikas, Christophoros Nikou. 5142-5152 [doi]

Understanding Doubly Stochastic ClusteringTianjiao Ding, Derek Lim, René Vidal, Benjamin D. Haeffele. 5153-5165 [doi]

Independent Policy Gradient for Large-Scale Markov Potential Games: Sharper Rates, Function Approximation, and Game-Agnostic ConvergenceDongsheng Ding, Chen-Yu Wei, Kaiqing Zhang, Mihailo R. Jovanovic. 5166-5220 [doi]

Generalization and Robustness Implications in Object-Centric LearningAndrea Dittadi, Samuele S. Papa, Michele De Vita, Bernhard Schölkopf, Ole Winther, Francesco Locatello. 5221-5285 [doi]

Fair Generalized Linear Models with a Convex PenaltyHyungrok Do, Preston Putzel, Axel S. Martin, Padhraic Smyth, Judy Zhong. 5286-5308 [doi]

Bayesian Learning with Information Gain Provably Bounds Risk for a Robust Adversarial DefenseBao Gia Doan, Ehsan Abbasnejad, Javen Qinfeng Shi, Damith Ranashinghe. 5309-5323 [doi]

On the Adversarial Robustness of Causal Algorithmic RecourseRicardo Dominguez-Olmedo, Amir-Hossein Karimi, Bernhard Schölkopf. 5324-5342 [doi]

Finding the Task-Optimal Low-Bit Sub-Distribution in Deep Neural NetworksRunpei Dong, Zhanhong Tan, Mengdi Wu, Linfeng Zhang, Kaisheng Ma. 5343-5359 [doi]

PACE: A Parallelizable Computation Encoder for Directed Acyclic GraphsZehao Dong, Muhan Zhang, Fuhai Li, Yixin Chen. 5360-5377 [doi]

Privacy for Free: How does Dataset Condensation Help Privacy?Tian Dong, Bo Zhao, Lingjuan Lyu. 5378-5396 [doi]

Fast rates for noisy interpolation require rethinking the effect of inductive biasKonstantin Donhauser, Nicolò Ruggeri, Stefan Stojanovic, Fanny Yang. 5397-5428 [doi]

Adapting to Mixing Time in Stochastic Optimization with Markovian DataRon Dorfman, Kfir Yehuda Levy. 5429-5446 [doi]

TACTiS: Transformer-Attentional Copulas for Time SeriesAlexandre Drouin, Étienne Marcotte, Nicolas Chapados. 5447-5493 [doi]

Branching Reinforcement LearningYihan Du, Wei Chen 0013. 5494-5530 [doi]

Bayesian Imitation Learning for End-to-End Mobile ManipulationYuqing Du, Daniel Ho, Alex Alemi, Eric Jang, Mohi Khansari. 5531-5546 [doi]

GLaM: Efficient Scaling of Language Models with Mixture-of-ExpertsNan Du, Yanping Huang, Andrew M. Dai, Simon Tong, Dmitry Lepikhin, Yuanzhong Xu, Maxim Krikun, Yanqi Zhou, Adams Wei Yu, Orhan Firat, Barret Zoph, Liam Fedus, Maarten P. Bosma, Zongwei Zhou, Tao Wang, Yu Emma Wang, Kellie Webster, Marie Pellat, Kevin Robinson, Kathleen S. Meier-Hellstern, Toju Duke, Lucas Dixon, Kun Zhang, Quoc V. Le, Yonghui Wu, Zhifeng Chen, Claire Cui. 5547-5569 [doi]

Learning Iterative Reasoning through Energy MinimizationYilun Du, Shuang Li, Joshua B. Tenenbaum, Igor Mordatch. 5570-5582 [doi]

SE(3) Equivariant Graph Neural Networks with Complete Local FramesWeitao Du, He Zhang, Yuanqi Du, Qi Meng, Wei Chen, Nanning Zheng 0001, Bin Shao, Tie-Yan Liu. 5583-5608 [doi]

A Context-Integrated Transformer-Based Neural Network for Auction DesignZhijian Duan 0001, Jingwu Tang, Yutong Yin, Zhe Feng 0004, Xiang Yan, Manzil Zaheer, Xiaotie Deng. 5609-5626 [doi]

Augment with Care: Contrastive Learning for Combinatorial ProblemsHaonan Duan, Pashootan Vaezipoor, Max B. Paulus, Yangjun Ruan, Chris J. Maddison. 5627-5642 [doi]

Parametric Visual Program Induction with Function ModularizationXuguang Duan, Xin Wang, Ziwei Zhang, Wenwu Zhu 0001. 5643-5658 [doi]

Bayesian Deep Embedding Topic Meta-LearnerZhibin Duan, Yishi Xu, Jianqiao Sun, Bo Chen, Wenchao Chen, Chaojie Wang 0001, Mingyuan Zhou. 5659-5670 [doi]

Deletion Robust Submodular Maximization over MatroidsPaul Duetting, Federico Fusco, Silvio Lattanzi, Ashkan Norouzi-Fard, Morteza Zadimoghaddam. 5671-5693 [doi]

From data to functa: Your data point is a function and you can treat it like oneEmilien Dupont, Hyunjik Kim, S. M. Ali Eslami, Danilo Jimenez Rezende, Dan Rosenbaum. 5694-5725 [doi]

Efficient Low Rank Convex Bounds for Pairwise Discrete Graphical ModelsValentin Durante, George Katsirelos, Thomas Schiex. 5726-5741 [doi]

Robust Counterfactual Explanations for Tree-Based EnsemblesSanghamitra Dutta, Jason Long, Saumitra Mishra, Cecilia Tilli, Daniele Magazzeni. 5742-5756 [doi]

On the Difficulty of Defending Self-Supervised Learning against Model ExtractionAdam Dziedzic, Nikita Dhawan, Muhammad Ahmad Kaleem, Jonas Guan, Nicolas Papernot. 5757-5776 [doi]

LIMO: Latent Inceptionism for Targeted Molecule GenerationPeter Eckmann, Kunyang Sun, Bo Zhao, Mudong Feng, Michael K. Gilson, Rose Yu. 5777-5792 [doi]

Inductive Biases and Variable Creation in Self-Attention MechanismsBenjamin L. Edelman, Surbhi Goel, Sham M. Kakade, Cyril Zhang. 5793-5831 [doi]

Provable Reinforcement Learning with a Short-Term MemoryYonathan Efroni, Chi Jin, Akshay Krishnamurthy, Sobhan Miryoosefi. 5832-5850 [doi]

Sparsity in Partially Controllable Linear SystemsYonathan Efroni, Sham M. Kakade, Akshay Krishnamurthy, Cyril Zhang. 5851-5860 [doi]

FedNew: A Communication-Efficient and Privacy-Preserving Newton-Type Method for Federated LearningAnis Elgabli, Chaouki Ben Issaid, Amrit Singh Bedi, Ketan Rajawat, Mehdi Bennis, Vaneet Aggarwal. 5861-5877 [doi]

pathGCN: Learning General Graph Spatial Operators from PathsMoshe Eliasof, Eldad Haber, Eran Treister. 5878-5891 [doi]

Discrete Tree Flows via Tree-Structured PermutationsMai Elkady, Hyung Zin Lim, David I. Inouye. 5892-5923 [doi]

For Learning in Symmetric Teams, Local Optima are Global Nash EquilibriaScott Emmons, Caspar Oesterheld, Andrew Critch, Vincent Conitzer, Stuart Russell 0001. 5924-5943 [doi]

Streaming Algorithm for Monotone k-Submodular Maximization with Cardinality ConstraintsAlina Ene, Huy L. Nguyen. 5944-5967 [doi]

Towards Scaling Difference Target Propagation by Learning Backprop TargetsMaxence Ernoult, Fabrice Normandin, Abhinav Moudgil, Sean Spinney, Eugene Belilovsky, Irina Rish, Blake A. Richards, Yoshua Bengio. 5968-5987 [doi]

V-Usable InformationKawin Ethayarajh, Yejin Choi, Swabha Swayamdipta. 5988-6008 [doi]

Head2Toe: Utilizing Intermediate Representations for Better Transfer LearningUtku Evci, Vincent Dumoulin, Hugo Larochelle, Michael C. Mozer. 6009-6033 [doi]

Variational Sparse Coding with Learned ThresholdingKion Fallah, Christopher J. Rozell. 6034-6058 [doi]

Training Discrete Deep Generative Models via Gapped Straight-Through EstimatorTing-Han Fan, Ta-Chung Chi, Alexander I. Rudnicky, Peter J. Ramadge. 6059-6073 [doi]

DRIBO: Robust Deep Reinforcement Learning via Multi-View Information BottleneckJiameng Fan, Wenchao Li. 6074-6102 [doi]

Generalized Data Distribution IterationJiajun Fan, Changnan Xiao. 6103-6184 [doi]

Variational Wasserstein gradient flowJiaoJiao Fan, Qinsheng Zhang, Amirhossein Taghvaei, Yongxin Chen. 6185-6215 [doi]

Data Determines Distributional Robustness in Contrastive Language Image Pre-training (CLIP)Alex Fang, Gabriel Ilharco, Mitchell Wortsman, Yuhao Wan, Vaishaal Shankar, Achal Dave, Ludwig Schmidt. 6216-6234 [doi]

Bayesian Continuous-Time Tucker DecompositionShikai Fang, Akil Narayan 0001, Robert M. Kirby, Shandian Zhe. 6235-6245 [doi]

Byzantine Machine Learning Made Easy By Resilient Averaging of MomentumsSadegh Farhadkhani, Rachid Guerraoui, Nirupam Gupta, Rafael Pinot, John Stephan. 6246-6283 [doi]

An Equivalence Between Data Poisoning and Byzantine Gradient AttacksSadegh Farhadkhani, Rachid Guerraoui, Lê Nguyên Hoang, Oscar Villemaud. 6284-6323 [doi]

Investigating Generalization by Controlling Normalized MarginAlexander R. Farhang, Jeremy D. Bernstein, Kushal Tirumala, Yang Liu, Yisong Yue. 6324-6336 [doi]

Kernelized Multiplicative Weights for 0/1-Polyhedral Games: Bridging the Gap Between Learning in Extensive-Form and Normal-Form GamesGabriele Farina, Chung-wei Lee, Haipeng Luo, Christian Kroer. 6337-6357 [doi]

Local Linear Convergence of Douglas-Rachford for Linear Programming: a Probabilistic AnalysisOisin Faust, Hamza Fawzi. 6358-6372 [doi]

Matching Structure for Dual LearningHao Fei 0001, Shengqiong Wu, Yafeng Ren, Meishan Zhang. 6373-6391 [doi]

Cascaded Gaps: Towards Logarithmic Regret for Risk-Sensitive Reinforcement LearningYingjie Fei, Ruitu Xu. 6392-6417 [doi]

Private frequency estimation via projective geometryVitaly Feldman, Jelani Nelson, Huy Nguyen, Kunal Talwar. 6418-6433 [doi]

An Intriguing Property of Geophysics InversionYinan Feng, Yinpeng Chen, Shihang Feng, Peng Jin, Zicheng Liu, Youzuo Lin. 6434-6446 [doi]

Principled Knowledge Extrapolation with GANsRuili Feng, Jie Xiao 0002, Kecheng Zheng, Deli Zhao, Jingren Zhou, Qibin Sun, Zheng-Jun Zha. 6447-6464 [doi]

A Resilient Distributed Boosting AlgorithmYuval Filmus, Idan Mehalel, Shay Moran. 6465-6473 [doi]

Model-Value Inconsistency as a Signal for Epistemic UncertaintyAngelos Filos, Eszter Vértes, Zita Marinho, Gregory Farquhar, Diana Borsa, Abram L. Friesen, Feryal Behbahani, Tom Schaul, André Barreto 0001, Simon Osindero. 6474-6498 [doi]

Coordinated Double Machine LearningNitai Fingerhut, Matteo Sesia, Yaniv Romano. 6499-6513 [doi]

Conformal Prediction Sets with Limited False PositivesAdam Fisch, Tal Schuster, Tommi Jaakkola, Regina Barzilay. 6514-6532 [doi]

Fast Population-Based Reinforcement Learning on a Single MachineArthur Flajolet, Claire Bizon Monroc, Karim Beguir, Thomas Pierrot. 6533-6547 [doi]

Fast Relative Entropy Coding with A* codingGergely Flamich, Stratis Markou, José Miguel Hernández-Lobato. 6548-6577 [doi]

Contrastive Mixture of Posteriors for Counterfactual Inference, Data Integration and FairnessAdam Foster, Árpi Vezér, Craig A. Glastonbury, Páidi Creed, Samer Abujudeh, Aaron Sim. 6578-6621 [doi]

Label Ranking through Nonparametric RegressionDimitris Fotakis 0001, Alkis Kalavasis, Eleni Psaroudaki. 6622-6659 [doi]

A Neural Tangent Kernel Perspective of GANsJean-Yves Franceschi, Emmanuel de Bézenac, Ibrahim Ayed, Mickaël Chen, Sylvain Lamprier, Patrick Gallinari. 6660-6704 [doi]

Extracting Latent State Representations with Linear Dynamics from Rich ObservationsAbraham Frandsen, Rong Ge 0001, Holden Lee. 6705-6725 [doi]

SPDY: Accurate Pruning with Speedup GuaranteesElias Frantar, Dan Alistarh. 6726-6743 [doi]

Revisiting the Effects of Stochasticity for Hamiltonian SamplersGiulio Franzese, Dimitrios Milios, Maurizio Filippone, Pietro Michiardi. 6744-6778 [doi]

Bregman Neural NetworksJordan Frécon, Gilles Gasso, Massimiliano Pontil, Saverio Salzo. 6779-6792 [doi]

(Non-)Convergence Results for Predictive Coding NetworksSimon Frieder, Thomas Lukasiewicz. 6793-6810 [doi]

Scaling Structured Inference with RandomizationYao Fu, John P. Cunningham, Mirella Lapata. 6811-6828 [doi]

Greedy when Sure and Conservative when Uncertain about the OpponentsHaobo Fu, Ye Tian, Hongxiang Yu, Weiming Liu, Shuang Wu, Jiechao Xiong, Ying Wen, Kai Li, Junliang Xing, Qiang Fu, Wei Yang 0032. 6829-6848 [doi]

DepthShrinker: A New Compression Paradigm Towards Boosting Real-Hardware Efficiency of Compact Neural NetworksYonggan Fu, Haichuan Yang, Jiayi Yuan, Meng Li, Cheng Wan, Raghuraman Krishnamoorthi, Vikas Chandra, Yingyan Lin. 6849-6862 [doi]

Revisiting Some Common Practices in Cooperative Multi-Agent Reinforcement LearningWei Fu, Chao Yu, Zelai Xu, Jiaqi Yang, Yi Wu. 6863-6877 [doi]

p-Laplacian Based Graph Neural NetworksGuoji Fu, Peilin Zhao, Yatao Bian. 6878-6917 [doi]

Why Should I Trust You, Bellman? The Bellman Error is a Poor Replacement for Value ErrorScott Fujimoto, David Meger, Doina Precup, Ofir Nachum, Shixiang Shane Gu. 6918-6943 [doi]

Robin Hood and Matthew Effects: Differential Privacy Has Disparate Impact on Synthetic DataGeorgi Ganev, Bristena Oprisanu, Emiliano De Cristofaro. 6944-6959 [doi]

The Complexity of k-Means Clustering when Little is KnownRobert Ganian, Thekla Hamm, Viktoriia Korchemna, Karolina Okrasa, Kirill Simonov. 6960-6987 [doi]

IDYNO: Learning Nonparametric DAGs from Interventional Dynamic DataTian Gao, Debarun Bhattacharjya, Elliot Nelson, Miao Liu, Yue Yu. 6988-7001 [doi]

Loss Function Learning for Domain Generalization by Implicit GradientBoyan Gao, Henry Gouk, Yongxin Yang, Timothy M. Hospedales. 7002-7016 [doi]

On the Convergence of Local Stochastic Compositional Gradient Descent with MomentumHongchang Gao, Junyi Li, Heng Huang. 7017-7035 [doi]

Deep Reference Priors: What is the best way to pretrain a model?Yansong Gao, Rahul Ramesh, Pratik Chaudhari. 7036-7051 [doi]

On the Equivalence Between Temporal and Static Equivariant Graph RepresentationsJianfei Gao, Bruno Ribeiro 0001. 7052-7076 [doi]

Generalizing Gaussian Smoothing for Random SearchKatelyn Gao, Ozan Sener. 7077-7101 [doi]

Rethinking Image-Scaling Attacks: The Interplay Between Vulnerabilities in Machine Learning SystemsYue Gao, Ilia Shumailov, Kassem Fawaz. 7102-7121 [doi]

Lazy Estimation of Variable Importance for Large Neural NetworksYue Gao, Abby Stevens, Garvesh Raskutti, Rebecca Willett. 7122-7143 [doi]

Fast and Reliable Evaluation of Adversarial Robustness with Minimum-Margin AttackRuize Gao, Jiongxiao Wang, Kaiwen Zhou, Feng Liu 0003, Binghui Xie, Gang Niu 0001, Bo Han 0003, James Cheng. 7144-7163 [doi]

Value Function based Difference-of-Convex Algorithm for Bilevel Hyperparameter Selection ProblemsLucy Gao, Jane J. Ye, Haian Yin, Shangzhi Zeng, Jin Zhang. 7164-7182 [doi]

Learning to Incorporate Texture Saliency Adaptive Attention to Image CartoonizationXiang Gao, Yuqi Zhang, Yingjie Tian. 7183-7207 [doi]

Stochastic smoothing of the top-K calibrated hinge loss for deep imbalanced classificationCamille Garcin, Maximilien Servajean, Alexis Joly, Joseph Salmon. 7208-7222 [doi]

PAGE-PG: A Simple and Loopless Variance-Reduced Policy Gradient Method with Probabilistic Gradient EstimationMatilde Gargiani, Andrea Zanelli, Andrea Martinelli, Tyler H. Summers, John Lygeros. 7223-7240 [doi]

The power of first-order smooth optimization for black-box non-smooth problemsAlexander V. Gasnikov, Anton Novitskii, Vasilii Novitskii, Farshed Abdukhakimov, Dmitry Kamzolov, Aleksandr Beznosikov, Martin Takác, Pavel E. Dvurechensky, Bin Gu. 7241-7265 [doi]

A Functional Information Perspective on Model InterpretationItai Gat, Nitay Calderon, Roi Reichart, Tamir Hazan. 7266-7278 [doi]

UniRank: Unimodal Bandit Algorithms for Online RankingCamille-Sovanneary Gauthier, Romaric Gaudel, Élisa Fromont. 7279-7309 [doi]

Variational Inference with Locally Enhanced Bounds for Hierarchical ModelsTomas Geffner, Justin Domke. 7310-7323 [doi]

Inducing Causal Structure for Interpretable Neural NetworksAtticus Geiger, Zhengxuan Wu, Hanson Lu, Josh Rozner, Elisa Kreiss, Thomas Icard, Noah D. Goodman, Christopher Potts. 7324-7338 [doi]

Achieving Minimax Rates in Pool-Based Batch Active LearningClaudio Gentile, Zhilei Wang, Tong Zhang. 7339-7367 [doi]

Near-Exact Recovery for Tomographic Inverse Problems via Deep LearningMartin Genzel, Ingo Gühring, Jan MacDonald, Maximilian März. 7368-7381 [doi]

Online Learning for Min Sum Set Cover and Pandora's BoxEvangelia Gergatsouli, Christos Tzamos. 7382-7403 [doi]

Equivariance versus Augmentation for Spherical ImagesJan E. Gerken, Oscar Carlsson, Hampus Linander, Fredrik Ohlsson, Christoffer Petersson, Daniel Persson. 7404-7421 [doi]

A Regret Minimization Approach to Multi-Agent ControlUdaya Ghai, Udari Madhushani, Naomi Ehrich Leonard, Elad Hazan. 7422-7434 [doi]

Blocks Assemble! Learning to Assemble with Large-Scale Structured Reinforcement LearningSeyed Kamyar Seyed Ghasemipour, Satoshi Kataoka, Byron David, Daniel Freeman, Shixiang Shane Gu, Igor Mordatch. 7435-7469 [doi]

Faster Privacy Accounting via Evolving DiscretizationBadih Ghazi, Pritish Kamath, Ravi Kumar 0001, Pasin Manurangsi. 7470-7483 [doi]

Plug-In Inversion: Model-Agnostic Inversion for Vision with Data AugmentationsAmin Ghiasi, Hamid Kazemi, Steven Reich, Chen Zhu, Micah Goldblum, Tom Goldstein. 7484-7512 [doi]

Offline RL Policies Should Be Trained to be AdaptiveDibya Ghosh, Anurag Ajay, Pulkit Agrawal, Sergey Levine. 7513-7530 [doi]

Breaking the $\sqrt{T}$ Barrier: Instance-Independent Logarithmic Regret in Stochastic Contextual Linear BanditsAvishek Ghosh, Abishek Sankararaman. 7531-7549 [doi]

SCHA-VAE: Hierarchical Context Aggregation for Few-Shot GenerationGiorgio Giannone, Ole Winther. 7550-7569 [doi]

A Joint Exponential Mechanism For Differentially Private Top-kJennifer Gillenwater, Matthew Joseph, Andres Muñoz Medina, Mónica Ribero Diaz. 7570-7582 [doi]

Neuro-Symbolic Hierarchical Rule InductionClaire Glanois, Zhaohui Jiang, Xuening Feng, Paul Weng, Matthieu Zimmer, Dong Li 0030, Wulong Liu, Jianye Hao. 7583-7615 [doi]

It's Raw! Audio Generation with State-Space ModelsKaran Goel, Albert Gu, Chris Donahue, Christopher Ré. 7616-7633 [doi]

RankSim: Ranking Similarity Regularization for Deep Imbalanced RegressionYu Gong, Greg Mori, Frederick Tung. 7634-7649 [doi]

How to Fill the Optimum Set? Population Gradient Descent with Harmless DiversityChengYue Gong, Lemeng Wu, Qiang Liu 0001. 7650-7664 [doi]

Partial Label Learning via Label Influence FunctionXiuwen Gong, Dong Yuan, Wei Bao. 7665-7678 [doi]

Secure Distributed Training at ScaleEduard Gorbunov, Alexander Borzunov, Michael Diskin, Max Ryabinin. 7679-7739 [doi]

Retrieval-Augmented Reinforcement LearningAnirudh Goyal, Abram L. Friesen, Andrea Banino, Theophane Weber, Nan Rosemary Ke, Adrià Puigdomènech Badia, Arthur Guez, Mehdi Mirza, Peter C. Humphreys, Ksenia Konyushkova, Michal Valko, Simon Osindero, Timothy P. Lillicrap, Nicolas Heess, Charles Blundell. 7740-7765 [doi]

The State of Sparse Training in Deep Reinforcement LearningLaura Graesser, Utku Evci, Erich Elsen, Pablo Samuel Castro. 7766-7792 [doi]

Causal Inference Through the Structural Causal Marginal ProblemLuigi Gresele, Julius von Kügelgen, Jonas M. Kübler, Elke Kirschbaum, Bernhard Schölkopf, Dominik Janzing. 7793-7824 [doi]

Mirror Learning: A Unifying Framework of Policy OptimisationJakub Grudzien Kuba, Christian A. Schröder de Witt, Jakob N. Foerster. 7825-7844 [doi]

Adapting k-means Algorithms for OutliersChristoph Grunau, Václav Rozhon. 7845-7886 [doi]

Variational Mixtures of ODEs for Inferring Cellular Gene Expression DynamicsYichen Gu, David T. Blaauw, Joshua D. Welch. 7887-7901 [doi]

Learning Pseudometric-based Action Representations for Offline Reinforcement LearningPengjie Gu, Mengchen Zhao, Chen Chen, Dong Li, Jianye Hao, Bo An. 7902-7918 [doi]

NeuroFluid: Fluid Dynamics Grounding with Particle-Driven Neural Radiance FieldsShanyan Guan, Huayu Deng, Yunbo Wang, Xiaokang Yang. 7919-7929 [doi]

Fast-Rate PAC-Bayesian Generalization Bounds for Meta-LearningJiechao Guan, Zhiwu Lu 0001. 7930-7948 [doi]

Leveraging Approximate Symbolic Models for Reinforcement Learning via Skill DiversityLin Guan, Sarath Sreedharan, Subbarao Kambhampati. 7949-7967 [doi]

Large-Scale Graph Neural Architecture SearchChaoyu Guan, Xin Wang, Hong Chen, Ziwei Zhang, Wenwu Zhu 0001. 7968-7981 [doi]

Identifiability Conditions for Domain AdaptationIshaan Gulrajani, Tatsunori Hashimoto. 7982-7997 [doi]

A Parametric Class of Approximate Gradient Updates for Policy OptimizationRamki Gummadi, Saurabh Kumar 0004, Junfeng Wen, Dale Schuurmans. 7998-8015 [doi]

Provably Efficient Offline Reinforcement Learning for Partially Observable Markov Decision ProcessesHongyi Guo, Qi Cai, Yufeng Zhang, Zhuoran Yang, Zhaoran Wang. 8016-8038 [doi]

No-Regret Learning in Partially-Informed AuctionsWenshuo Guo, Michael I. Jordan, Ellen Vitercik. 8039-8055 [doi]

Bounding Training Data Reconstruction in Private (Deep) LearningChuan Guo, Brian Karrer, Kamalika Chaudhuri, Laurens van der Maaten. 8056-8071 [doi]

Adversarially trained neural representations are already as robust as biological neural representationsChong Guo, Michael J. Lee, Guillaume Leclerc, Joel Dapello, Yug Rao, Aleksander Madry, James J. DiCarlo. 8072-8081 [doi]

Class-Imbalanced Semi-Supervised Learning with Adaptive ThresholdingLan-Zhe Guo, Yu-Feng Li. 8082-8094 [doi]

Deep Squared Euclidean Approximation to the Levenshtein Distance for DNA StorageAlan J. X. Guo, Cong Liang, Qing-Hu Hou. 8095-8108 [doi]

Online Continual Learning through Mutual Information MaximizationYiduo Guo, Bing Liu, Dongyan Zhao 0001. 8109-8126 [doi]

Fast Provably Robust Decision Trees and BoostingJun-Qi Guo, Ming-Zhuo Teng, Wei Gao, Zhi-Hua Zhou. 8127-8144 [doi]

Understanding and Improving Knowledge Graph Embedding for Entity AlignmentLingbing Guo, Qiang Zhang, Zequn Sun, Mingyang Chen, Wei Hu, Huajun Chen. 8145-8156 [doi]

NISPA: Neuro-Inspired Stability-Plasticity Adaptation for Continual Learning in Sparse NetworksMustafa Burak Gurbuz, Constantine Dovrolis. 8157-8174 [doi]

Active Learning on a Budget: Opposite Strategies Suit High and Low BudgetsGuy Hacohen, Avihu Dekel, Daphna Weinshall. 8175-8195 [doi]

You Only Cut Once: Boosting Data Augmentation with a Single CutJunlin Han, Pengfei Fang, Weihao Li, Jie Hong, Mohammad Ali Armin, Ian D. Reid, Lars Petersson, Hongdong Li. 8196-8212 [doi]

Scalable MCMC Sampling for Nonsymmetric Determinantal Point ProcessesInsu Han, Mike Gartrell, Elvis Dohmatob, Amin Karbasi. 8213-8229 [doi]

G-Mixup: Graph Data Augmentation for Graph ClassificationXiaotian Han, Zhimeng Jiang, Ninghao Liu, Xia Hu. 8230-8248 [doi]

p geometry with Applications in High Dimensional Online Decision MakingYuxuan Han, Zhicong Liang, Zhipeng Liang, Yang Wang, Yuan Yao, Jiheng Zhang. 8249-8279 [doi]

Off-Policy Reinforcement Learning with Delayed RewardsBeining Han, Zhizhou Ren, Zuofan Wu, Yuan Zhou 0007, Jian Peng 0001. 8280-8303 [doi]

Adversarial Attacks on Gaussian Process BanditsEric Han, Jonathan Scarlett. 8304-8329 [doi]

Random Gegenbauer Features for Scalable Kernel MethodsInsu Han, Amir Zandieh, Haim Avron. 8330-8358 [doi]

Stochastic Reweighted Gradient DescentAyoub El Hanchi, David A. Stephens, Chris J. Maddison. 8359-8374 [doi]

Dual Perspective of Label-Specific Feature Learning for Multi-Label ClassificationJun-Yi Hang, Min-Ling Zhang. 8375-8386 [doi]

Temporal Difference Learning for Model Predictive ControlNicklas A. Hansen, Hao Su, Xiaolong Wang. 8387-8406 [doi]

Bisimulation Makes Analogies in Goal-Conditioned Reinforcement LearningPhilippe Hansen-Estruch, Amy Zhang 0001, Ashvin Nair, Patrick Yin, Sergey Levine. 8407-8426 [doi]

TURF: Two-Factor, Universal, Robust, Fast Distribution Learning AlgorithmYi Hao, Ayush Jain, Alon Orlitsky, Vaishakh Ravindrakumar. 8427-8445 [doi]

Contextual Information-Directed SamplingBotao Hao, Tor Lattimore, Chao Qin. 8446-8464 [doi]

GSmooth: Certified Robustness against Semantic Transformations via Generalized Randomized SmoothingZhongkai Hao, Chengyang Ying, Yinpeng Dong, Hang Su 0006, Jian Song, Jun Zhu. 8465-8483 [doi]

Implicit Regularization with Polynomial Growth in Deep Tensor FactorizationKais Hariz, Hachem Kadri, Stéphane Ayache, Maher Moakher, Thierry Artières. 8484-8501 [doi]

Strategic Instrumental Variable Regression: Recovering Causal Relationships From Strategic ResponsesKeegan Harris, Dung Daniel T. Ngo, Logan Stapleton, Hoda Heidari, Steven Wu 0001. 8502-8522 [doi]

C*-algebra Net: A New Approach Generalizing Neural Network Parameters to C*-algebraYuka Hashimoto, Zhao Wang, Tomoko Matsui. 8523-8534 [doi]

General-purpose, long-context autoregressive modeling with Perceiver ARCurtis Hawthorne, Andrew Jaegle, Catalina Cangea, Sebastian Borgeaud, Charlie Nash, Mateusz Malinowski, Sander Dieleman, Oriol Vinyals, Matthew M. Botvinick, Ian Simon, Hannah Sheahan, Neil Zeghidour, Jean-Baptiste Alayrac, João Carreira, Jesse H. Engel. 8535-8558 [doi]

On Distribution Shift in Learning-based Bug DetectorsJingxuan He, Luca Beurer-Kellner, Martin T. Vechev. 8559-8580 [doi]

GNNRank: Learning Global Rankings from Pairwise Comparisons via Directed Graph Neural NetworksYixuan He, Quan Gan, David Wipf, Gesine D. Reinert, Junchi Yan, Mihai Cucuringu. 8581-8612 [doi]

Exploring the Gap between Collapsed & Whitened Features in Self-Supervised LearningBobby He, Mete Ozay. 8613-8634 [doi]

Sparse Double Descent: Where Network Pruning Aggravates OverfittingZheng He, Zeke Xie, Quanzhi Zhu, Zengchang Qin. 8635-8659 [doi]

A Reduction from Linear Contextual Bandit Lower Bounds to Estimation Lower BoundsJiahao He, Jiheng Zhang, Rachel Q. Zhang. 8660-8677 [doi]

HyperPrompt: Prompt-based Task-Conditioning of TransformersYun He, Huaixiu Steven Zheng, Yi Tay, Jai Prakash Gupta, Yu Du, Vamsi Aribandi, Zhe Zhao, Yaguang Li, Zhao Chen, Donald Metzler, Heng Tze Cheng, Ed H. Chi. 8678-8690 [doi]

Label-Descriptive Patterns and Their Application to Characterizing Classification ErrorsMichael A. Hedderich, Jonas Fischer, Dietrich Klakow, Jilles Vreeken. 8691-8707 [doi]

NOMU: Neural Optimization-based Model UncertaintyJakob Heiss, Jakob Weissteiner, Hanna S. Wutte, Sven Seuken, Josef Teichmann. 8708-8758 [doi]

Scaling Out-of-Distribution Detection for Real-World SettingsDan Hendrycks, Steven Basart, Mantas Mazeika, Andy Zou, Joseph Kwon, Mohammadreza Mostajabi, Jacob Steinhardt, Dawn Song. 8759-8773 [doi]

Generalization Bounds using Lower Tail Exponents in Stochastic OptimizersLiam Hodgkinson, Umut Simsekli, Rajiv Khanna, Michael W. Mahoney. 8774-8795 [doi]

Unsupervised Detection of Contextualized Embedding Bias with Application to IdeologyValentin Hofmann, Janet B. Pierrehumbert, Hinrich Schütze. 8796-8810 [doi]

Neural Laplace: Learning diverse classes of differential equations in the Laplace domainSamuel Holt, Zhaozhi Qian, Mihaela van der Schaar. 8811-8832 [doi]

Deep Hierarchy in BanditsJoey Hong, Branislav Kveton, Sumeet Katariya, Manzil Zaheer, Mohammad Ghavamzadeh. 8833-8851 [doi]

DAdaQuant: Doubly-adaptive quantization for communication-efficient Federated LearningRobert Hönig, Yiren Zhao, Robert Mullins. 8852-8866 [doi]

Equivariant Diffusion for Molecule Generation in 3DEmiel Hoogeboom, Victor Garcia Satorras, Clément Vignac, Max Welling. 8867-8887 [doi]

Conditional GANs with Auxiliary Discriminative ClassifierLiang Hou, Qi Cao, Huawei Shen, Siyuan Pan, Xiaoshuang Li, Xueqi Cheng. 8888-8902 [doi]

AdAUC: End-to-end Adversarial AUC Optimization Against Long-tail ProblemsWenzheng Hou, Qianqian Xu, Zhiyong Yang 0001, Shilong Bao, Yuan He, Qingming Huang. 8903-8925 [doi]

Wide Bayesian neural networks have a simple weight posterior: theory and accelerated samplingJiri Hron, Roman Novak, Jeffrey Pennington, Jascha Sohl-Dickstein. 8926-8945 [doi]

Learning inverse folding from millions of predicted structuresChloe Hsu, Robert Verkuil, Jason Liu, Zeming Lin, Brian Hie, Tom Sercu, Adam Lerer, Alexander Rives. 8946-8970 [doi]

Nearly Minimax Optimal Reinforcement Learning with Linear Function ApproximationPihe Hu, Yu Chen, Longbo Huang. 8971-9019 [doi]

Neuron Dependency Graphs: A Causal Abstraction of Neural NetworksYaojie Hu, Jin Tian. 9020-9040 [doi]

Policy Diagnosis via Measuring Role Diversity in Cooperative Multi-agent RLSiyi Hu, Chuanlong Xie, Xiaodan Liang, Xiaojun Chang. 9041-9071 [doi]

On the Role of Discount Factor in Offline Reinforcement LearningHao Hu, Yiqin Yang, Qianchuan Zhao, Chongjie Zhang. 9072-9098 [doi]

Transformer Quality in Linear TimeWeizhe Hua, Zihang Dai, Hanxiao Liu, Quoc V. Le. 9099-9117 [doi]

Language Models as Zero-Shot Planners: Extracting Actionable Knowledge for Embodied AgentsWenlong Huang, Pieter Abbeel, Deepak Pathak, Igor Mordatch. 9118-9147 [doi]

Forward Operator Estimation in Generative Models with Kernel Transfer OperatorsZhichun Huang, Rudrasis Chakraborty, Vikas Singh. 9148-9172 [doi]

Adaptive Best-of-Both-Worlds Algorithm for Heavy-Tailed Multi-Armed BanditsJiatai Huang, Yan Dai 0002, Longbo Huang. 9173-9200 [doi]

Frustratingly Easy Transferability EstimationLong-Kai Huang, JunZhou Huang, Yu Rong, Qiang Yang, Ying Wei 0001. 9201-9225 [doi]

Modality Competition: What Makes Joint Training of Multi-modal Network Fail in Deep Learning? (Provably)Yu Huang, Junyang Lin, Chang Zhou, Hongxia Yang, Longbo Huang. 9226-9259 [doi]

Action-Sufficient State Representation Learning for Control with Structural ConstraintsBiwei Huang, Chaochao Lu, Liu Leqi, José Miguel Hernández-Lobato, Clark Glymour, Bernhard Schölkopf, Kun Zhang 0001. 9260-9279 [doi]

3DLinker: An E(3) Equivariant Variational Autoencoder for Molecular Linker DesignYinan Huang, Xingang Peng, Jianzhu Ma, Muhan Zhang. 9280-9294 [doi]

SDQ: Stochastic Differentiable Quantization with Mixed PrecisionXijie Huang, Zhiqiang Shen, Shichao Li 0002, Zechun Liu, Xianghong Hu, Jeffry Wicaksana, Eric P. Xing, Kwang-Ting Cheng. 9295-9309 [doi]

Tackling Data Heterogeneity: A New Unified Framework for Decentralized SGD with Sample-induced TopologyYan Huang, Ying Sun, Zehan Zhu, Changzhi Yan, Jinming Xu. 9310-9345 [doi]

Efficient Representation Learning via Adaptive Context PoolingChen Huang, Walter Talbott, Navdeep Jaitly, Joshua M. Susskind. 9346-9355 [doi]

On the Learning of Non-Autoregressive TransformersFei Huang, Tianhua Tao, Hao Zhou, Lei Li, Minlie Huang. 9356-9376 [doi]

Going Deeper into Permutation-Sensitive Graph Neural NetworksZhongyu Huang, Yingheng Wang, Chaozhuo Li, Huiguang He. 9377-9409 [doi]

Directed Acyclic Transformer for Non-Autoregressive Machine TranslationFei Huang, Hao Zhou, Yang Liu, Hang Li, Minlie Huang. 9410-9428 [doi]

Unsupervised Ground Metric Learning Using Wasserstein Singular VectorsGeert-Jan Huizing, Laura Cantini, Gabriel Peyré. 9429-9443 [doi]

Robust Kernel Density Estimation with Median-of-Means principlePierre Humbert, Batiste Le Bars, Ludovic Minvielle. 9444-9465 [doi]

A data-driven approach for learning to control computersPeter C. Humphreys, David Raposo, Tobias Pohlen, Gregory Thornton, Rachita Chhaparia, Alistair Muldal, Josh Abramson, Petko Georgiev, Adam Santoro, Timothy P. Lillicrap. 9466-9482 [doi]

Proximal Denoiser for Convergent Plug-and-Play Optimization with Nonconvex RegularizationSamuel Hurault, Arthur Leclaire, Nicolas Papadakis. 9483-9505 [doi]

Inverse Contextual Bandits: Learning How Behavior Evolves over TimeAlihan Hüyük, Daniel Jarrett, Mihaela van der Schaar. 9506-9524 [doi]

Datamodels: Understanding Predictions with Data and Data with PredictionsAndrew Ilyas, Sung Min Park, Logan Engstrom, Guillaume Leclerc, Aleksander Madry. 9525-9587 [doi]

Parsimonious Learning-Augmented CachingSungjin Im, Ravi Kumar 0001, Aditya Petety, Manish Purohit. 9588-9601 [doi]

Bayesian Optimization for Distributionally Robust Chance-constrained ProblemYu Inatsu, Shion Takeno, Masayuki Karasuyama, Ichiro Takeuchi. 9602-9621 [doi]

LeNSE: Learning To Navigate Subgraph Embeddings for Large-Scale Combinatorial OptimisationDavid Ireland, Giovanni Montana. 9622-9638 [doi]

The Dual Form of Neural Networks Revisited: Connecting Test Time Predictions to Training Patterns via Spotlights of AttentionKazuki Irie, Róbert Csordás, Jürgen Schmidhuber. 9639-9659 [doi]

A Modern Self-Referential Weight Matrix That Learns to Modify ItselfKazuki Irie, Imanol Schlag, Róbert Csordás, Jürgen Schmidhuber. 9660-9677 [doi]

Revisiting Online Submodular Minimization: Gap-Dependent Regret Bounds, Best of Both Worlds and Adversarial RobustnessShinji Ito. 9678-9694 [doi]

Modeling Strong and Human-Like Gameplay with KL-Regularized SearchAthul Paul Jacob, David J. Wu, Gabriele Farina, Adam Lerer, Hengyuan Hu, Anton Bakhtin, Jacob Andreas, Noam Brown. 9695-9728 [doi]

A deep convolutional neural network that is invariant to time rescalingBrandon G. Jacques, Zoran Tiganj, Aakash Sarkar, Marc W. Howard, Per B. Sederberg. 9729-9738 [doi]

Input Dependent Sparse Gaussian ProcessesBahram Jafrasteh, Carlos Villacampa-Calvo, Daniel Hernández-Lobato. 9739-9759 [doi]

Regret Minimization with Performative FeedbackMeena Jagadeesan, Tijana Zrnic, Celestine Mendler-Dünner. 9760-9785 [doi]

Biological Sequence Design with GFlowNetsMoksh Jain, Emmanuel Bengio, Alex Hernández-García, Jarrid Rector-Brooks, Bonaventure F. P. Dossou, Chanakya Ajit Ekbote, Jie Fu, Tianyu Zhang, Michael Kilgour, Dinghuai Zhang, Lena Simine, Payel Das, Yoshua Bengio. 9786-9801 [doi]

Combining Diverse Feature PriorsSaachi Jain, Dimitris Tsipras, Aleksander Madry. 9802-9832 [doi]

Training Your Sparse Neural Network Better with Any MaskAjay Kumar Jaiswal, Haoyu Ma, Tianlong Chen, Ying Ding 0001, Zhangyang Wang. 9833-9844 [doi]

Sequential Covariate Shift Detection Using Classifier Two-Sample TestsSooyong Jang, Sangdon Park, Insup Lee, Osbert Bastani. 9845-9880 [doi]

Surrogate Likelihoods for Variational Annealed Importance SamplingMartin Jankowiak, Du Phan. 9881-9901 [doi]

Planning with Diffusion for Flexible Behavior SynthesisMichael Janner, Yilun Du, Joshua B. Tenenbaum, Sergey Levine. 9902-9915 [doi]

HyperImpute: Generalized Iterative Imputation with Automatic Model SelectionDaniel Jarrett, Bogdan Cebere, Tennison Liu, Alicia Curth, Mihaela van der Schaar. 9916-9937 [doi]

Mitigating Modality Collapse in Multimodal VAEs via Impartial OptimizationAdrián Javaloy, Maryam Meghdadi, Isabel Valera. 9938-9964 [doi]

Towards understanding how momentum improves generalization in deep learningSamy Jelassi, Yuanzhi Li. 9965-10040 [doi]

MASER: Multi-Agent Reinforcement Learning with Subgoals Generated from Experience Replay BufferJeewon Jeon, Woojun Kim, Whiyoung Jung, Youngchul Sung. 10041-10052 [doi]

An Exact Symbolic Reduction of Linear Smart Predict+Optimize to Mixed Integer Linear ProgrammingJihwan Jeong, Parth Jaggi, Andrew Butler, Scott Sanner. 10053-10067 [doi]

Agnostic Learnability of Halfspaces via Logistic LossZiwei Ji, Kwangjun Ahn, Pranjal Awasthi, Satyen Kale, Stefani Karp. 10068-10103 [doi]

Improving Policy Optimization with Generalist-Specialist LearningZhiwei Jia, Xuanlin Li, Zhan Ling, Shuang Liu, Yiran Wu, Hao Su 0001. 10104-10119 [doi]

Translatotron 2: High-quality direct speech-to-speech translation with voice preservationYe Jia, Michelle Tadmor Ramanovich, Tal Remez, Roi Pomerantz. 10120-10134 [doi]

Online Learning and Pricing with Reusable Resources: Linear Bandits with Sub-Exponential RewardsHuiwen Jia, Cong Shi 0001, Siqian Shen. 10135-10160 [doi]

The Role of Deconfounding in Meta-learningYinjie Jiang, Zhengyu Chen, Kun Kuang, Luotian Yuan, Xinhai Ye, Zhihua Wang, Fei Wu 0001, Ying Wei. 10161-10176 [doi]

Subspace Learning for Effective Meta-LearningWeisen Jiang, James Kwok, Yu Zhang 0006. 10177-10194 [doi]

Optimal Algorithms for Stochastic Multi-Level Compositional OptimizationWei Jiang, Bokun Wang, Yibo Wang, Lijun Zhang, Tianbao Yang. 10195-10216 [doi]

Antibody-Antigen Docking and Design via Hierarchical Structure RefinementWengong Jin, Regina Barzilay, Tommi Jaakkola. 10217-10227 [doi]

Sharpened Quasi-Newton Methods: Faster Superlinear Rate and Larger Local Convergence NeighborhoodQiujiang Jin, Alec Koppel, Ketan Rajawat, Aryan Mokhtari. 10228-10250 [doi]

The Power of Exploiter: Provable Multi-Agent RL in Large State SpacesChi Jin, Qinghua Liu, Tiancheng Yu. 10251-10279 [doi]

Domain Adaptation for Time Series Forecasting via Attention SharingXiaoyong Jin, Youngsuk Park, Danielle C. Maddix, Hao Wang, Yuyang Wang. 10280-10297 [doi]

Accelerated Federated Learning with Decoupled Adaptive OptimizationJiayin Jin, Jiaxiang Ren, Yang Zhou 0001, Lingjuan Lyu, Ji Liu, Dejing Dou. 10298-10322 [doi]

Supervised Off-Policy RankingYue Jin, Yue Zhang, Tao Qin, Xudong Zhang, Jian Yuan, Houqiang Li, Tie-Yan Liu. 10323-10339 [doi]

Input-agnostic Certified Group Fairness via Gaussian Parameter SmoothingJiayin Jin, Zeru Zhang, Yang Zhou, Lingfei Wu. 10340-10361 [doi]

Score-based Generative Modeling of Graphs via the System of Stochastic Differential EquationsJaehyeong Jo, Seul Lee, Sung Ju Hwang. 10362-10383 [doi]

Choosing Answers in Epsilon-Best-Answer Identification for Linear BanditsMarc Jourdan, Rémy Degenne. 10384-10430 [doi]

Robust Fine-Tuning of Deep Neural Networks with Hessian-based Generalization GuaranteesHaotian Ju, Dongyue Li, Hongyang R. Zhang. 10431-10461 [doi]

Robust alignment of cross-session recordings of neural population activity by behaviour via unsupervised domain adaptationJustin Jude, Matthew G. Perich, Lee E. Miller, Matthias H. Hennig. 10462-10475 [doi]

On Measuring Causal Contributions via do-interventionsYonghan Jung, Shiva Kasiviswanathan, Jin Tian 0001, Dominik Janzing, Patrick Blöbaum, Elias Bareinboim. 10476-10501 [doi]

Efficient Approximate Inference for Stationary Kernel on Frequency DomainYohan Jung, Kyungwoo Song, Jinkyoo Park. 10502-10538 [doi]

Sketching Algorithms and Lower Bounds for Ridge RegressionPraneeth Kacham, David P. Woodruff. 10539-10556 [doi]

Flashlight: Enabling Innovation in Tools for Machine LearningJacob D. Kahn, Vineel Pratap, Tatiana Likhomanenko, Qiantong Xu, Awni Y. Hannun, Jeff Cai, Paden Tomasello, Ann Lee 0001, Edouard Grave, Gilad Avidov, Benoit Steiner, Vitaliy Liptchinsky, Gabriel Synnaeve, Ronan Collobert. 10557-10574 [doi]

Learning-based Optimisation of Particle Accelerators Under Partial Observability Without Real-World TrainingJan Kaiser, Oliver Stein, Annika Eichler. 10575-10585 [doi]

Stochastic Deep Networks with Linear Competing Units for Model-Agnostic Meta-LearningKonstantinos Kalais, Sotirios Chatzis. 10586-10597 [doi]

Doubly Robust Distributionally Robust Off-Policy Evaluation and LearningNathan Kallus, Xiaojie Mao, Kaiwen Wang, Zhengyuan Zhou. 10598-10632 [doi]

Improved Rates for Differentially Private Stochastic Convex Optimization with Heavy-Tailed DataGautam Kamath 0001, Xingtu Liu, Huanyu Zhang. 10633-10660 [doi]

Comprehensive Analysis of Negative Sampling in Knowledge Graph Representation LearningHidetaka Kamigaito, Katsuhiko Hayashi. 10661-10675 [doi]

Matching Learned Causal Effects of Neural Networks with Domain PriorsSai Srinivas Kancheti, Abbavaram Gowtham Reddy, Vineeth N. Balasubramanian, Amit Sharma. 10676-10696 [doi]

Deduplicating Training Data Mitigates Privacy Risks in Language ModelsNikhil Kandpal, Eric Wallace, Colin Raffel. 10697-10707 [doi]

Lyapunov Density Models: Constraining Distribution Shift in Learning-Based ControlKatie Kang, Paula Gradu, Jason J. Choi, Michael Janner, Claire J. Tomlin, Sergey Levine. 10708-10733 [doi]

Forget-free Continual Learning with Winning SubnetworksHaeyong Kang, Rusty John Lloyd Mina, Sultan Rizky Hikmawan Madjid, Jaehong Yoon, Mark Hasegawa-Johnson, Sung Ju Hwang, Chang D. Yoo. 10734-10750 [doi]

Differentially Private Approximate QuantilesHaim Kaplan, Shachar Schnapp, Uri Stemmer. 10751-10761 [doi]

Simultaneous Graph Signal Clustering and Graph LearningAbdullah Karaaslanli, Selin Aviyente. 10762-10772 [doi]

Composing Partial Differential Equations with Physics-Aware Neural NetworksMatthias Karlbauer, Timothy Praditia, Sebastian Otte, Sergey Oladyshkin, Wolfgang Nowak, Martin V. Butz. 10773-10801 [doi]

Meta-Learning Hypothesis Spaces for Sequential Decision-makingParnian Kassraie, Jonas Rothfuss, Andreas Krause 0001. 10802-10824 [doi]

FOCUS: Familiar Objects in Common and Uncommon SettingsPriyatham Kattakinda, Soheil Feizi. 10825-10847 [doi]

Training OOD Detectors in their Natural HabitatsJulian Katz-Samuels, Julia B. Nakhleh, Robert D. Nowak, Yixuan Li. 10848-10865 [doi]

Robustness Implies Generalization via Data-Dependent Generalization BoundsKenji Kawaguchi, Zhun Deng, Kyle Luh, Jiaoyang Huang. 10866-10894 [doi]

Generating Distributional Adversarial Examples to Evade Statistical DetectorsYigitcan Kaya, Muhammad Bilal Zafar, Sergül Aydöre, Nathalie Rauschmayr, Krishnaram Kenthapadi. 10895-10911 [doi]

Secure Quantized Training for Deep LearningMarcel Keller, Ke Sun 0001. 10912-10938 [doi]

A Convergent and Dimension-Independent Min-Max Optimization AlgorithmVijay Keswani, Oren Mangoubi, Sushant Sachdeva, Nisheeth K. Vishnoi. 10939-10973 [doi]

Neural Network Poisson Models for Behavioural and Neural Spike Train DataMoein Khajehnejad, Forough Habibollahi, Richard Nock, Ehsan Arabzadeh, Peter Dayan, Amir Dezfouli. 10974-10996 [doi]

Federated Reinforcement Learning: Linear Speedup Under Markovian SamplingSajad Khodadadian, Pranay Sharma, Gauri Joshi, Siva Theja Maguluri. 10997-11057 [doi]

Multi-Level Branched Regularization for Federated LearningJinkyu Kim, Geeho Kim, Bohyung Han. 11058-11073 [doi]

Learning fair representation with a parametric integral probability metricDongha Kim, Kunwoong Kim, Insung Kong, Ilsang Ohn, Yongdai Kim. 11074-11101 [doi]

Dataset Condensation via Efficient Synthetic-Data ParameterizationJang-Hyun Kim, Jinuk Kim, Seong Joon Oh, Sangdoo Yun, Hwanjun Song, Joonhyun Jeong, Jung-Woo Ha 0001, Hyun Oh Song. 11102-11118 [doi]

Guided-TTS: A Diffusion Model for Text-to-Speech via Classifier GuidanceHeeseung Kim, Sungwon Kim, Sungroh Yoon. 11119-11133 [doi]

Variational On-the-Fly PersonalizationJangho Kim, Juntae Lee, Simyung Chang, Nojun Kwak. 11134-11147 [doi]

Fisher SAM: Information Geometry and Sharpness Aware MinimisationMinyoung Kim, Da Li 0001, Shell Xu Hu, Timothy M. Hospedales. 11148-11161 [doi]

ViT-NeT: Interpretable Vision Transformers with Neural Tree DecoderSangwon Kim, Jae Yeal Nam, ByoungChul Ko. 11162-11172 [doi]

Sanity Simulations for Saliency MethodsJoon Sik Kim, Gregory Plumb, Ameet Talwalkar. 11173-11200 [doi]

Soft Truncation: A Universal Training Technique of Score-based Diffusion Model for High Precision Score EstimationDongjun Kim, SeungJae Shin, Kyungwoo Song, Wanmo Kang, Il-Chul Moon. 11201-11228 [doi]

Rotting Infinitely Many-Armed BanditsJung Hun Kim, Milan Vojnovic, Se-Young Yun. 11229-11254 [doi]

Accelerated Gradient Methods for Geodesically Convex Optimization: Tractable Algorithms and Convergence AnalysisJungbin Kim, Insoon Yang. 11255-11282 [doi]

Generalizing to New Physical Systems via Context-Informed Dynamics ModelMatthieu Kirchmeyer, Yuan Yin, Jérémie Donà, Nicolas Baskiotis, Alain Rakotomamonjy, Patrick Gallinari. 11283-11301 [doi]

SoQal: Selective Oracle Questioning for Consistency Based Active Learning of Cardiac SignalsDani Kiyasseh, Tingting Zhu 0001, David A. Clifton. 11302-11340 [doi]

Curriculum Reinforcement Learning via Constrained Optimal TransportPascal Klink, Haoyi Yang, Carlo D'Eramo, Jan Peters 0001, Joni Pajarinen. 11341-11358 [doi]

Exploiting Redundancy: Separable Group Convolutional Networks on Lie GroupsDavid M. Knigge, David W. Romero, Erik J. Bekkers. 11359-11386 [doi]

Revisiting Contrastive Learning through the Lens of Neighborhood Component Analysis: an Integrated FrameworkChing Yun Ko, Jeet Mohapatra, Sijia Liu, Pin-Yu Chen, Luca Daniel, Lily Weng. 11387-11412 [doi]

Transfer Learning In Differential Privacy's Hybrid-ModelRefael Kohen, Or Sheffet. 11413-11429 [doi]

Markov Chain Monte Carlo for Continuous-Time Switching Dynamical SystemsLukas Köhs, Bastian Alt, Heinz Koeppl. 11430-11454 [doi]

Partial disentanglement for domain adaptationLingjing Kong, Shaoan Xie, Weiran Yao, Yujia Zheng, Guangyi Chen, Petar Stojanov, Victor Akinwande, Kun Zhang 0001. 11455-11472 [doi]

Simultaneously Learning Stochastic and Adversarial Bandits with General Graph FeedbackFang Kong 0002, Yichi Zhou, Shuai Li. 11473-11482 [doi]

Adaptive Data Analysis with Correlated ObservationsAryeh Kontorovich, Menachem Sadigurschi, Uri Stemmer. 11483-11498 [doi]

Controlling Conditional Language Models without Catastrophic ForgettingTomasz Korbak, Hady ElSahar, Germán Kruszewski, Marc Dymetman. 11499-11528 [doi]

Batch Greenkhorn Algorithm for Entropic-Regularized Multimarginal Optimal Transport: Linear Rate of Convergence and Iteration ComplexityVladimir R. Kostic, Saverio Salzo, Massimiliano Pontil. 11529-11558 [doi]

Certified Adversarial Robustness Under the Bounded Support SetYiwen Kou, Qinyuan Zheng, Yisen Wang. 11559-11597 [doi]

Exact Learning of Preference Structure: Single-peaked Preferences and BeyondSonja Kraiczy, Edith Elkind. 11598-11612 [doi]

Reconstructing Nonlinear Dynamical Systems from Multi-Modal Time SeriesDaniel Kramer, Philine Lou Bommer, Daniel Durstewitz, Carlo Tombolini, Georgia Koppe. 11613-11633 [doi]

Probabilistic ODE Solutions in Millions of DimensionsNicholas Krämer, Nathanael Bosch, Jonathan Schmidt, Philipp Hennig. 11634-11649 [doi]

Active Nearest Neighbor Regression Through Delaunay RefinementAlexander Kravberg, Giovanni Luca Marchetti, Vladislav Polianskii, Anastasiia Varava, Florian T. Pokorny, Danica Kragic. 11650-11664 [doi]

Functional Generalized Empirical Likelihood Estimation for Conditional Moment RestrictionsHeiner Kremer, Jia-Jie Zhu, Krikamol Muandet, Bernhard Schölkopf. 11665-11682 [doi]

Calibrated and Sharp Uncertainties in Deep Learning via Density EstimationVolodymyr Kuleshov, Shachi Deshpande. 11683-11693 [doi]

ActiveHedge: Hedge meets Active LearningBhuvesh Kumar, Jacob D. Abernethy, Venkatesh Saligrama. 11694-11709 [doi]

Balancing Discriminability and Transferability for Source-Free Domain AdaptationJogendra Nath Kundu, Akshay R. Kulkarni, Suvaansh Bhambri, Deepesh Mehta, Shreyas Anand Kulkarni, Varun Jampani, Venkatesh Babu Radhakrishnan. 11710-11728 [doi]

Showing Your Offline Reinforcement Learning Work: Online Evaluation Budget MattersVladislav Kurenkov, Sergey Kolesnikov. 11729-11752 [doi]

Equivariant Priors for compressed sensing with unknown orientationAnna Kuzina, Kumar Pratik, Fabio Valerio Massoli, Arash Behboodi. 11753-11771 [doi]

Coordinated Attacks against Contextual Bandits: Fundamental Limits and Defense MechanismsJeongyeol Kwon, Yonathan Efroni, Constantine Caramanis, Shie Mannor. 11772-11789 [doi]

Large Batch Experience ReplayThibault Lahire, Matthieu Geist, Emmanuel Rachelson. 11790-11813 [doi]

FedScale: Benchmarking Model and System Performance of Federated Learning at ScaleFan Lai, Yinwei Dai, Sanjay Sri Vallabh Singapuram, Jiachen Liu, Xiangfeng Zhu, Harsha V. Madhyastha, Mosharaf Chowdhury. 11814-11827 [doi]

Smoothed Adaptive Weighting for Imbalanced Semi-Supervised Learning: Improve Reliability Against Unknown Distribution DataZhengfeng Lai, Chao Wang, Henrry Gunawan, Sen-Ching S. Cheung, Chen-Nee Chuah. 11828-11843 [doi]

Functional Output Regression with Infimal Convolution: Exploring the Huber and ε-insensitive LossesAlex Lambert, Dimitri Bouche, Zoltán Szabó, Florence d'Alché-Buc. 11844-11867 [doi]

Tell me why! Explanations support learning relational and causal structureAndrew K. Lampinen, Nicholas A. Roy, Ishita Dasgupta, Stephanie Cy Chan, Allison C. Tam, James L. McClelland, Chen Yan, Adam Santoro, Neil C. Rabinowitz, Jane X. Wang, Felix Hill. 11868-11890 [doi]

Generative Cooperative Networks for Natural Language GenerationSylvain Lamprier, Thomas Scialom, Antoine Chaffin, Vincent Claveau, Ewa Kijak, Jacopo Staiano, Benjamin Piwowarski. 11891-11905 [doi]

DSTAGNN: Dynamic Spatial-Temporal Aware Graph Neural Network for Traffic Flow ForecastingShiyong Lan, Yitong Ma, Weikang Huang, Wenwu Wang, Hongyu Yang, Pyang Li. 11906-11917 [doi]

Cooperative Online Learning in Stochastic and Adversarial MDPsTal Lancewicki, Aviv Rosenberg 0002, Yishay Mansour. 11918-11968 [doi]

PINs: Progressive Implicit Networks for Multi-Scale Neural RepresentationsZoe Landgraf, Alexander Sorkine-Hornung, Ricardo Silveira Cabral. 11969-11984 [doi]

Co-training Improves Prompt-based Learning for Large Language ModelsHunter Lang, Monica N. Agrawal, Yoon Kim, David A. Sontag. 11985-12003 [doi]

Goal Misgeneralization in Deep Reinforcement LearningLauro Langosco di Langosco, Jack Koch, Lee D. Sharkey, Jacob Pfau, David Krueger. 12004-12019 [doi]

Marginal Tail-Adaptive Normalizing FlowsMike Laszkiewicz, Johannes Lederer, Asja Fischer. 12020-12048 [doi]

Bregman Proximal Langevin Monte Carlo via Bregman-Moreau EnvelopesTim Tsz-Kit Lau, Han Liu. 12049-12077 [doi]

Scalable Deep Reinforcement Learning Algorithms for Mean Field GamesMathieu Laurière, Sarah Perrin, Sertan Girgin, Paul Muller, Ayush Jain, Theophile Cabannes, Georgios Piliouras, Julien Pérolat, Romuald Elie, Olivier Pietquin, Matthieu Geist. 12078-12095 [doi]

Implicit Bias of Linear Equivariant NetworksHannah Lawrence, Bobak Toussi Kiani, Kristian G. Georgiev, Andrew K. Dienes. 12096-12125 [doi]

Differentially Private Maximal Information CoefficientsJohn Lazarsfeld, Aaron Johnson, Emmanuel Adéníran. 12126-12163 [doi]

Entropic Gromov-Wasserstein between Gaussian DistributionsKhang Le, Dung Q. Le, Huy Nguyen, Dat Do, Tung Pham 0001, Nhat Ho. 12164-12203 [doi]

Neurocoder: General-Purpose Computation Using Stored Neural ProgramsHung Le, Svetha Venkatesh. 12204-12221 [doi]

Convergence of Policy Gradient for Entropy Regularized MDPs with Neural Network Approximation in the Mean-Field RegimeJames-Michael Leahy, Bekzhan Kerimkulov, David Siska, Lukasz Szpruch. 12222-12252 [doi]

A Random Matrix Analysis of Data Stream Clustering: Coping With Limited Memory ResourcesHugo Lebeau, Romain Couillet, Florent Chatelain. 12253-12281 [doi]

Neural Tangent Kernel Analysis of Deep Narrow Neural NetworksJongmin Lee, Joo-Young Choi, Ernest K. Ryu, Albert No. 12282-12351 [doi]

Dataset Condensation with Contrastive SignalsSaehyung Lee, Sanghyuk Chun, Sangwon Jung, Sangdoo Yun, Sungroh Yoon. 12352-12364 [doi]

Confidence Score for Source-Free Unsupervised Domain AdaptationJonghyun Lee 0004, Dahuin Jung, Junho Yim, Sungroh Yoon. 12365-12377 [doi]

A Statistical Manifold Framework for Point Cloud DataYonghyeon Lee, Seungyeon Kim, Jinwon Choi, Frank Chongwoo Park. 12378-12402 [doi]

Low-Complexity Deep Convolutional Neural Networks on Fully Homomorphic Encryption Using Multiplexed Parallel ConvolutionsEunsang Lee, Joon-Woo Lee, Junghyun Lee, Young-Sik Kim, Yongjune Kim 0001, Jong-Seon No, Woosuk Choi. 12403-12422 [doi]

Statistical inference with implicit SGD: proximal Robbins-Monro vs. Polyak-RuppertYoonhyung Lee, Sungdong Lee, Joong-Ho Won. 12423-12454 [doi]

Maslow's Hammer in Catastrophic Forgetting: Node Re-Use vs. Node ActivationSebastian Lee, Stefano Sarao Mannelli, Claudia Clopath, Sebastian Goldt, Andrew M. Saxe. 12455-12477 [doi]

Query-Efficient and Scalable Black-Box Adversarial Attacks on Discrete Sequential Data via Bayesian OptimizationDeokjae Lee, Seungyong Moon, Junhyeok Lee, Hyun Oh Song. 12478-12497 [doi]

Least Squares Estimation using Sketched Data with Heteroskedastic ErrorsSokbae Lee, Serena Ng. 12498-12520 [doi]

Why the Rich Get Richer? On the Balancedness of Random Partition ModelsChangwoo J. Lee, Huiyan Sang. 12521-12541 [doi]

Model Selection in Batch Policy OptimizationJonathan Lee 0002, George Tucker, Ofir Nachum, Bo Dai. 12542-12569 [doi]

Supervised Learning with General Risk FunctionalsLiu Leqi, Audrey Huang, Zachary C. Lipton, Kamyar Azizzadenesheli. 12570-12592 [doi]

Generalized Strategic Classification and the Case of Aligned IncentivesSagi Levanon, Nir Rosenfeld. 12593-12618 [doi]

A Simple Unified Framework for High Dimensional Bandit ProblemsWenjie Li, Adarsh Barik, Jean Honorio. 12619-12655 [doi]

Robust Training of Neural Networks Using Scale Invariant ArchitecturesZhiyuan Li 0005, Srinadh Bhojanapalli, Manzil Zaheer, Sashank J. Reddi, Sanjiv Kumar. 12656-12684 [doi]

Spatial-Channel Token Distillation for Vision MLPsYanxi Li 0001, Xinghao Chen 0001, Minjing Dong, Yehui Tang, Yunhe Wang 0001, Chang Xu 0002. 12685-12695 [doi]

An Analytical Update Rule for General Policy OptimizationHepeng Li, Nicholas Clavette, Haibo He. 12696-12716 [doi]

On Convergence of Gradient Descent Ascent: A Tight Local AnalysisHaochuan Li, Farzan Farnia, Subhro Das, Ali Jadbabaie. 12717-12740 [doi]

On the Finite-Time Performance of the Knowledge Gradient AlgorithmYanwen Li, Siyang Gao. 12741-12764 [doi]

Phasic Self-Imitative Reduction for Sparse-Reward Goal-Conditioned Reinforcement LearningYunfei Li, Tian Gao, Jiaqi Yang, Huazhe Xu, Yi Wu. 12765-12781 [doi]

2CN: Graph Gaussian Convolution Networks with Concentrated Graph FiltersMingjie Li, Xiaojun Guo, Yifei Wang, Yisen Wang, Zhouchen Lin. 12782-12796 [doi]

Decomposing Temporal High-Order Interactions via Latent ODEsShibo Li, Robert Kirby, Shandian Zhe. 12797-12812 [doi]

Neural Inverse Transform SamplerHenry Li, Yuval Kluger. 12813-12825 [doi]

PLATINUM: Semi-Supervised Model Agnostic Meta-Learning using Submodular Mutual InformationChangbin Li, Suraj Kothawade, Feng Chen 0001, Rishabh K. Iyer. 12826-12842 [doi]

Deconfounded Value Decomposition for Multi-Agent Reinforcement LearningJiahui Li, Kun Kuang, Baoxiang Wang 0001, Furui Liu, Long Chen, Changjie Fan, Fei Wu 0001, Jun Xiao 0001. 12843-12856 [doi]

C-MinHash: Improving Minwise Hashing with Circulant PermutationXiaoyun Li, Ping Li 0001. 12857-12887 [doi]

BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and GenerationJunnan Li 0001, Dongxu Li, Caiming Xiong, Steven C. H. Hoi. 12888-12900 [doi]

-7/4) ComplexityHuan Li 0007, Zhouchen Lin. 12901-12916 [doi]

Achieving Fairness at No Utility Cost via Data Reweighing with InfluencePeizhao Li, Hongfu Liu. 12917-12930 [doi]

High Probability Guarantees for Nonconvex Stochastic Gradient Descent with Heavy TailsShaojie Li, Yong Liu. 12931-12963 [doi]

MetAug: Contrastive Learning via Meta Feature AugmentationJiangmeng Li, Wenwen Qiang, Changwen Zheng, Bing Su 0001, Hui Xiong. 12964-12978 [doi]

PMIC: Improving Multi-Agent Reinforcement Learning with Progressive Mutual Information CollaborationPengyi Li, Hongyao Tang, Tianpei Yang, Xiaotian Hao, Tong Sang, Yan Zheng, Jianye Hao, Matthew E. Taylor, Wenyuan Tao, Zhen Wang. 12979-12997 [doi]

CerDEQ: Certifiable Deep Equilibrium ModelMingjie Li, Yisen Wang 0002, Zhouchen Lin. 12998-13013 [doi]

Generalization Guarantee of Training Graph Convolutional Networks with Graph Topology SamplingHongkang Li, Meng Wang, Sijia Liu, Pin-Yu Chen, Jinjun Xiong. 13014-13051 [doi]

Let Invariant Rationale Discovery Inspire Graph Contrastive LearningSihang Li, Xiang Wang, An Zhang, Yingxin Wu, Xiangnan He 0001, Tat-Seng Chua. 13052-13065 [doi]

Difference Advantage Estimation for Multi-Agent Policy GradientsYueheng Li, Guangming Xie, Zongqing Lu. 13066-13085 [doi]

Private Adaptive Optimization with Side informationTian Li 0005, Manzil Zaheer, Sashank J. Reddi, Virginia Smith. 13086-13105 [doi]

Permutation Search of Tensor Network Structures via Local SamplingChao Li 0013, Junhua Zeng, Zerui Tao, Qibin Zhao. 13106-13124 [doi]

Hessian-Free High-Resolution Nesterov Acceleration For SamplingRuilin Li, Hongyuan Zha, Molei Tao. 13125-13162 [doi]

Double Sampling Randomized SmoothingLinyi Li, Jiawei Zhang, Tao Xie 0001, Bo Li 0026. 13163-13208 [doi]

HousE: Knowledge Graph Embedding with Householder ParameterizationRui Li, Jianan Zhao 0002, Chaozhuo Li, Di He, Yiqi Wang 0001, Yuming Liu, Hao Sun, Senzhang Wang, Weiwei Deng, Yanming Shen, Xing Xie 0001, Qi Zhang. 13209-13224 [doi]

Learning Multiscale Transformer Models for Sequence GenerationBei Li, Tong Zheng, Yi Jing, Chengbo Jiao, Tong Xiao, Jingbo Zhu. 13225-13241 [doi]

Finding Global Homophily in Graph Neural Networks When Meeting HeterophilyXiang Li, Renyu Zhu, Yao Cheng, Caihua Shan, Siqiang Luo, Dongsheng Li, Weining Qian. 13242-13256 [doi]

Fat-Tailed Variational Inference with Anisotropic Tail Adaptive FlowsFeynman T. Liang, Michael W. Mahoney, Liam Hodgkinson. 13257-13270 [doi]

Exploring and Exploiting Hubness Priors for High-Quality GAN Latent SamplingYuanbang Liang, Jing Wu, Yu-Kun Lai, Yipeng Qin. 13271-13284 [doi]

Reducing Variance in Temporal-Difference Value Estimation via Ensemble of Deep NetworksLitian Liang, Yaosheng Xu, Stephen McAleer, Dailin Hu, Alexander Ihler, Pieter Abbeel, Roy Fox. 13285-13301 [doi]

TSPipe: Learn from Teacher Faster with PipelinesHwijoon Lim, Yechan Kim, Sukmin Yun, Jinwoo Shin, Dongsu Han. 13302-13312 [doi]

Order Constraints in Optimal TransportYu Chin, Fabian Lim, Laura Wynter, Shiau Hong Lim. 13313-13333 [doi]

Flow-Guided Sparse Transformer for Video DeblurringJing Lin, Yuanhao Cai, Xiaowan Hu, Haoqian Wang, Youliang Yan, Xueyi Zou, Henghui Ding, Yulun Zhang, Radu Timofte, Luc Van Gool. 13334-13343 [doi]

Federated Learning with Positive and Unlabeled DataXinyang Lin, Hanting Chen, Yixing Xu, Chao Xu 0006, Xiaolin Gui, Yiping Deng, Yunhe Wang 0001. 13344-13355 [doi]

Decentralized Online Convex Optimization in Networked SystemsYiheng Lin, Judy Gan, Guannan Qu, Yash Kanoria, Adam Wierman. 13356-13393 [doi]

Unsupervised Flow-Aligned Sequence-to-Sequence Learning for Video RestorationJing Lin, Xiaowan Hu, Yuanhao Cai, Haoqian Wang, Youliang Yan, Xueyi Zou, Yulun Zhang, Luc Van Gool. 13394-13404 [doi]

Constrained Gradient Descent: A Powerful and Principled Evasion Attack Against Neural NetworksWeiran Lin, Keane Lucas, Lujo Bauer, Michael K. Reiter, Mahmood Sharif. 13405-13430 [doi]

Learning Augmented Binary Search TreesHonghao Lin, Tian Luo, David P. Woodruff. 13431-13440 [doi]

Online Nonsubmodular Minimization with Delayed Costs: From Full Information to Bandit FeedbackTianyi Lin, Aldo Pacchiano, Yaodong Yu, Michael I. Jordan. 13441-13467 [doi]

Measuring the Effect of Training Data on Deep Learning Predictions via Randomized ExperimentsJinkun Lin, Anqi Zhang, Mathias Lécuyer, Jinyang Li 0001, Aurojit Panda, Siddhartha Sen 0001. 13468-13504 [doi]

Interactively Learning Preference Constraints in Linear BanditsDavid Lindner, Sebastian Tschiatschek, Katja Hofmann, Andreas Krause 0001. 13505-13527 [doi]

Delayed Reinforcement Learning by ImitationPierre Liotet, Davide Maran, Lorenzo Bisi, Marcello Restelli. 13528-13556 [doi]

CITRIS: Causal Identifiability from Temporal Intervened SequencesPhillip Lippe, Sara Magliacane, Sindy Löwe, Yuki M. Asano, Taco Cohen, Stratis Gavves. 13557-13603 [doi]

StreamingQA: A Benchmark for Adaptation to New Knowledge over Time in Question Answering ModelsAdam Liska, Tomás Kociský, Elena Gribovskaya, Tayfun Terzi, Eren Sezener, Devang Agrawal, Cyprien de Masson d'Autume, Tim Scholtes, Manzil Zaheer, Susannah Young, Ellen Gilsenan-McMahon, Sophia Austin, Phil Blunsom, Angeliki Lazaridou. 13604-13622 [doi]

Distributionally Robust Q-LearningZijian Liu, Qinxun Bai, Jose H. Blanchet, Perry Dong, Wei Xu 0017, Zhengqing Zhou, Zhengyuan Zhou. 13623-13643 [doi]

Constrained Variational Policy Optimization for Safe Reinforcement LearningZuxin Liu, Zhepeng Cen, Vladislav Isenbaev, Wei Liu, Steven Wu, Bo Li 0026, Ding Zhao. 13644-13668 [doi]

Benefits of Overparameterized Convolutional Residual Networks: Function Approximation under Smoothness ConstraintHao Liu, Minshuo Chen, Siawpeng Er, Wenjing Liao, Tong Zhang, Tuo Zhao. 13669-13703 [doi]

Boosting Graph Structure Learning with Dummy NodesXin Liu, Jiayang Cheng, Yangqiu Song, Xin Jiang. 13704-13716 [doi]

Equivalence Analysis between Counterfactual Regret Minimization and Online Mirror DescentWeiming Liu 0004, Huacong Jiang, Bin Li 0025, Houqiang Li. 13717-13745 [doi]

Deep Probability EstimationSheng Liu, Aakash Kaku, Weicheng Zhu, Matan Leibovich, Sreyas Mohan, Boyang Yu, Haoxiang Huang, Laure Zanna, Narges Razavian, Jonathan Niles-Weed, Carlos Fernandez-Granda. 13746-13781 [doi]

Gating Dropout: Communication-efficient Regularization for Sparsely Activated TransformersRui Liu 0013, Young-Jin Kim, Alexandre Muzio, Hany Hassan. 13782-13792 [doi]

Simplex Neural Population Learning: Any-Mixture Bayes-Optimality in Symmetric Zero-sum GamesSiqi Liu, Marc Lanctot, Luke Marris, Nicolas Heess. 13793-13806 [doi]

Rethinking Attention-Model Explainability through Faithfulness Violation TestYibing Liu, Haoliang Li, Yangyang Guo, Chenqi Kong, Jing Li, Shiqi Wang 0001. 13807-13824 [doi]

Optimization-Derived Learning with Essential Convergence Analysis of Training and Hyper-trainingRisheng Liu, Xuan Liu, Shangzhi Zeng, Jin Zhang, Yixuan Zhang. 13825-13856 [doi]

Deep Neural Network Fusion via Graph Matching with Applications to Model Ensemble and Federated LearningChang Liu, Chenfei Lou, Runzhong Wang, Alan Yuhan Xi, Li Shen, Junchi Yan. 13857-13869 [doi]

Welfare Maximization in Competitive Equilibrium: Reinforcement Learning for Markov Exchange EconomyZhihan Liu, Miao Lu, Zhaoran Wang, Michael I. Jordan, Zhuoran Yang. 13870-13911 [doi]

Generating 3D Molecules for Target Protein BindingMeng Liu, Youzhi Luo, Kanji Uchino, Koji Maruhashi, Shuiwang Ji. 13912-13924 [doi]

Communication-efficient Distributed Learning for Large Batch OptimizationRui Liu 0013, Barzan Mozafari. 13925-13946 [doi]

Adaptive Accelerated (Extra-)Gradient Methods with Variance ReductionZijian Liu, Ta Duy Nguyen, Alina Ene, Huy Nguyen. 13947-13994 [doi]

REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy TransferXingyu Liu, Deepak Pathak, Kris Kitani. 13995-14007 [doi]

Kill a Bird with Two Stones: Closing the Convergence Gaps in Non-Strongly Convex Optimization by Directly Accelerated SVRG with Double Compensation and SnapshotsYuanyuan Liu 0001, Fanhua Shang, Weixin An, Hongying Liu, Zhouchen Lin. 14008-14035 [doi]

Learning Markov Games with Adversarial Opponents: Efficient Algorithms and Fundamental LimitsQinghua Liu, Yuanhao Wang 0004, Chi Jin. 14036-14053 [doi]

Local Augmentation for Graph Neural NetworksSongtao Liu, Rex Ying, Hanze Dong, Lanqing Li, Tingyang Xu, Yu Rong, Peilin Zhao, JunZhou Huang, Dinghao Wu. 14054-14072 [doi]

Asking for Knowledge (AFK): Training RL Agents to Query External Knowledge Using LanguageIou-Jen Liu, Xingdi Yuan, Marc-Alexandre Côté, Pierre-Yves Oudeyer, Alexander G. Schwing. 14073-14093 [doi]

Learning from Demonstration: Provably Efficient Adversarial Policy Imitation with Linear Function ApproximationZhihan Liu, Yufeng Zhang, Zuyue Fu, Zhuoran Yang, Zhaoran Wang. 14094-14138 [doi]

GACT: Activation Compressed Training for Generic Network ArchitecturesXiaoxuan Liu, Lianmin Zheng, Dequan Wang, Yukuo Cen, Weize Chen, Xu Han, Jianfei Chen, Zhiyuan Liu, Jie Tang, Joey Gonzalez, Michael Mahoney, Alvin Cheung. 14139-14152 [doi]

Robust Training under Label Noise by Over-parameterizationSheng Liu, Zhihui Zhu, Qing Qu 0001, Chong You. 14153-14172 [doi]

Plan Your Target and Learn Your Skills: Transferable State-Only Imitation Learning via Decoupled Policy OptimizationMinghuan Liu, Zhengbang Zhu, Yuzheng Zhuang, Weinan Zhang 0001, Jianye Hao, Yong Yu 0001, Jun Wang. 14173-14196 [doi]

On the Impossibility of Learning to Cooperate with Adaptive Partner Strategies in Repeated GamesRobert Loftin, Frans A. Oliehoek. 14197-14209 [doi]

AutoIP: A United Framework to Integrate Physics into Gaussian ProcessesDa Long, Zheng Wang, Aditi S. Krishnapriyan, Robert M. Kirby, Shandian Zhe, Michael W. Mahoney. 14210-14222 [doi]

Bayesian Model Selection, the Marginal Likelihood, and GeneralizationSanae Lotfi, Pavel Izmailov, Gregory W. Benton, Micah Goldblum, Andrew Gordon Wilson. 14223-14247 [doi]

Feature Learning and Signal Propagation in Deep Neural NetworksYizhang Lou, Chris E. Mingard, Soufiane Hayou. 14248-14282 [doi]

Fluctuations, Bias, Variance & Ensemble of Learners: Exact Asymptotics for Convex Losses in High-DimensionBruno Loureiro, Cédric Gerbelot, Maria Refinetti, Gabriele Sicuro, Florent Krzakala. 14283-14314 [doi]

A Single-Loop Gradient Descent and Perturbed Ascent Algorithm for Nonconvex Functional Constrained OptimizationSongtao Lu. 14315-14357 [doi]

Additive Gaussian Processes RevisitedXiaoyu Lu, Alexis Boukouvalas, James Hensman. 14358-14383 [doi]

ModLaNets: Learning Generalisable Dynamics via Modularity and Physical Inductive BiasYupu Lu, Shijie Lin, Guanqi Chen, Jia Pan. 14384-14397 [doi]

Model-Free Opponent ShapingChristopher Lu, Timon Willi, Christian A. Schröder de Witt, Jakob N. Foerster. 14398-14411 [doi]

Multi-slots Online Matching with High EntropyXingyu Lu, Qintong Wu, Wenliang Zhong. 14412-14428 [doi]

Maximum Likelihood Training for Score-based Diffusion ODEs by High Order Denoising Score MatchingCheng Lu, Kaiwen Zheng, Fan Bao, Jianfei Chen 0001, Chongxuan Li, Jun Zhu 0001. 14429-14460 [doi]

Orchestra: Unsupervised Federated Learning via Globally Consistent ClusteringEkdeep Singh Lubana, Chi Ian Tang, Fahim Kawsar, Robert P. Dick, Akhil Mathur. 14461-14484 [doi]

A Rigorous Study of Integrated Gradients Method and Extensions to Internal Neuron AttributionsDaniel Lundström, Tianjian Huang, Meisam Razaviyayn. 14485-14508 [doi]

BAMDT: Bayesian Additive Semi-Multivariate Decision Trees for Nonparametric RegressionZhao Tang Luo, Huiyan Sang, Bani K. Mallick. 14509-14526 [doi]

Disentangled Federated Learning for Tackling Attributes Skew via Invariant Aggregation and Diversity TransferringZhengquan Luo, Yunlong Wang, Zilei Wang, Zhenan Sun, Tieniu Tan. 14527-14541 [doi]

Channel Importance Matters in Few-Shot Image ClassificationXu Luo, Jing Xu, Zenglin Xu. 14542-14559 [doi]

Learning Dynamics and Generalization in Deep Reinforcement LearningClare Lyle, Mark Rowland, Will Dabney, Marta Kwiatkowska, Yarin Gal. 14560-14581 [doi]

On Finite-Sample Identifiability of Contrastive Learning-Based Nonlinear Independent Component AnalysisQi Lyu, Xiao Fu 0001. 14582-14600 [doi]

Pessimism meets VCG: Learning Dynamic Mechanism Design via Offline Reinforcement LearningBoxiang Lyu, Zhaoran Wang, Mladen Kolar, Zhuoran Yang. 14601-14638 [doi]

Versatile Offline Imitation from Observations and Examples via Regularized State-Occupancy MatchingYecheng Jason Ma, Andrew Shen, Dinesh Jayaraman, Osbert Bastani. 14639-14663 [doi]

Quantification and Analysis of Layer-wise and Pixel-wise Information DiscardingHaotian Ma, Hao Zhang, Fan Zhou, Yinqing Zhang, Quanshi Zhang. 14664-14698 [doi]

Interpretable Neural Networks with Frank-Wolfe: Sparse Relevance Maps and Relevance OrderingsJan MacDonald, Mathieu Besançon, Sebastian Pokutta. 14699-14716 [doi]

A Tighter Analysis of Spectral Clustering, and BeyondPeter Macgregor, He Sun 0001. 14717-14742 [doi]

Zero-Shot Reward Specification via Grounded Natural LanguageParsa Mahmoudieh, Deepak Pathak, Trevor Darrell. 14743-14752 [doi]

Feature selection using e-valuesSubhabrata Majumdar, Snigdhansu Chatterjee. 14753-14773 [doi]

SSL Enables Learning from Sparse Rewards in Image-Goal NavigationArjun Majumdar, Gunnar A. Sigurdsson, Robinson Piramuthu, Jesse Thomason, Dhruv Batra, Gaurav S. Sukhatme. 14774-14785 [doi]

Knowledge-Grounded Self-Rationalization via Extractive and Natural Language ExplanationsBodhisattwa Prasad Majumder, Oana Camburu, Thomas Lukasiewicz, Julian J. McAuley. 14786-14801 [doi]

Nonparametric Involutive Markov Chain Monte CarloCarol Mak, Fabian Zaiser, Luke Ong. 14802-14859 [doi]

Architecture Agnostic Federated Learning for Neural NetworksDisha Makhija, Xing Han, Nhat Ho, Joydeep Ghosh. 14860-14870 [doi]

Robustness in Multi-Objective Submodular Optimization: a Quantile ApproachCédric Malherbe, Kevin Scaman. 14871-14886 [doi]

More Efficient Sampling for Tensor Decomposition With Worst-Case GuaranteesOsman Asif Malik. 14887-14917 [doi]

Unaligned Supervision for Automatic Music Transcription in The WildBen Maman, Amit H. Bermano. 14918-14934 [doi]

Decision-Focused Learning: Through the Lens of Learning to RankJayanta Mandi, Víctor Bucarey, Maxime Mulamba Ke Tchomba, Tias Guns. 14935-14947 [doi]

Differentially Private Coordinate Descent for Composite Empirical Risk MinimizationPaul Mangold, Aurélien Bellet, Joseph Salmon, Marc Tommasi. 14948-14978 [doi]

Refined Convergence Rates for Maximum Likelihood Estimation under Finite Mixture ModelsTudor A. Manole, Nhat Ho. 14979-15006 [doi]

On Improving Model-Free Algorithms for Decentralized Multi-Agent Reinforcement LearningWeichao Mao, Lin Yang 0011, Kaiqing Zhang, Tamer Basar. 15007-15049 [doi]

On the Effects of Artificial Data ModificationAntonia Marcu, Adam Prügel-Bennett. 15050-15069 [doi]

Personalized Federated Learning through Local MemorizationOthmane Marfoq, Giovanni Neglia, Richard Vidal, Laetitia Kameni. 15070-15092 [doi]

Nested BanditsMatthieu Martin, Panayotis Mertikopoulos, Thibaud Rahier, Houssam Zenati. 15093-15121 [doi]

Closed-Form Diffeomorphic Transformations for Time Series AlignmentIñigo Martinez, Elisabeth Viles, Igor G. Olaizola. 15122-15158 [doi]

SPECTRE: Spectral Conditioning Helps to Overcome the Expressivity Limits of One-shot Graph GeneratorsKarolis Martinkus, Andreas Loukas, Nathanaël Perraudin, Roger Wattenhofer. 15159-15179 [doi]

Modular Conformal CalibrationCharles Marx, Shengjia Zhao, Willie Neiswanger, Stefano Ermon. 15180-15195 [doi]

Continual Repeated Annealed Flow Transport Monte CarloAlexander G. de G. Matthews, Michael Arbel, Danilo Jimenez Rezende, Arnaud Doucet. 15196-15219 [doi]

How to Stay Curious while avoiding Noisy TVs using Aleatoric Uncertainty EstimationAugustine N. Mavor-Parker, Kimberly A. Young, Caswell Barry, Lewis D. Griffin. 15220-15240 [doi]

How to Steer Your Adversary: Targeted and Efficient Model Stealing Defenses with Gradient RedirectionMantas Mazeika, Bo Li 0026, David A. Forsyth. 15241-15254 [doi]

Quant-BnB: A Scalable Branch-and-Bound Method for Optimal Decision Trees with Continuous FeaturesRahul Mazumder, Xiang Meng, Haoyue Wang. 15255-15277 [doi]

Optimizing Tensor Network Contraction Using Reinforcement LearningEli A. Meirom, Haggai Maron, Shie Mannor, Gal Chechik. 15278-15292 [doi]

Causal Transformer for Estimating Counterfactual OutcomesValentyn Melnychuk, Dennis Frauen, Stefan Feuerriegel. 15293-15329 [doi]

Steerable 3D Spherical NeuronsPavlo Melnyk, Michael Felsberg, Mårten Wadenbäck. 15330-15339 [doi]

Transformers are Meta-Reinforcement LearnersLuckeciano C. Melo. 15340-15359 [doi]

ButterflyFlow: Building Invertible Layers with Butterfly MatricesChenlin Meng, Linqi Zhou, Kristy Choi, Tri Dao, Stefano Ermon. 15360-15375 [doi]

In defense of dual-encoders for neural rankingAditya Krishna Menon, Sadeep Jayasumana, Ankit Singh Rawat, Seungyeon Kim, Sashank J. Reddi, Sanjiv Kumar. 15376-15400 [doi]

Equivariant Quantum Graph CircuitsPéter Mernyei, Konstantinos Meichanetzidis, Ismail Ilkan Ceylan. 15401-15420 [doi]

Stochastic Rising BanditsAlberto Maria Metelli, Francesco Trovò, Matteo Pirola, Marcello Restelli. 15421-15457 [doi]

Minimizing Control for Credit Assignment with Strong FeedbackAlexander Meulemans, Matilde Tristany Farinha, Maria R. Cervera, João Sacramento, Benjamin F. Grewe. 15458-15483 [doi]

A Dynamical System Perspective for Lipschitz Neural NetworksLaurent Meunier, Blaise Delattre, Alexandre Araujo, Alexandre Allauzen. 15484-15500 [doi]

Distribution Regression with Sliced Wasserstein KernelsDimitri Meunier, Massimiliano Pontil, Carlo Ciliberto. 15501-15523 [doi]

Interpretable and Generalizable Graph Learning via Stochastic Attention MechanismSiqi Miao, Mia Liu, Pan Li. 15524-15543 [doi]

Modeling Structure with Undirected Neural NetworksTsvetomila Mihaylova, Vlad Niculae, André F. T. Martins. 15544-15560 [doi]

Universal Hopfield Networks: A General Framework for Single-Shot Associative Memory ModelsBeren Millidge, Tommaso Salvatori, Yuhang Song 0001, Thomas Lukasiewicz, Rafal Bogacz. 15561-15583 [doi]

Learning Stochastic Shortest Path with Linear Function ApproximationYifei Min, Jiafan He, Tianhao Wang 0002, Quanquan Gu. 15584-15629 [doi]

Prioritized Training on Points that are Learnable, Worth Learning, and not yet LearntSören Mindermann, Jan Markus Brauner, Muhammed Razzak, Mrinank Sharma, Andreas Kirsch 0002, Winnie Xu, Benedikt Höltgen, Aidan N. Gomez, Adrien Morisot, Sebastian Farquhar, Yarin Gal. 15630-15649 [doi]

POEM: Out-of-Distribution Detection with Posterior SamplingYifei Ming, Ying Fan, Yixuan Li. 15650-15665 [doi]

A Simple Reward-free Approach to Constrained Reinforcement LearningSobhan Miryoosefi, Chi Jin. 15666-15698 [doi]

Wide Neural Networks Forget Less CatastrophicallySeyed-Iman Mirzadeh, Arslan Chaudhry, Dong Yin, Huiyi Hu, Razvan Pascanu, Dilan Görür, Mehrdad Farajtabar. 15699-15717 [doi]

Proximal and Federated Random ReshufflingKonstantin Mishchenko, Ahmed Khaled 0001, Peter Richtárik. 15718-15749 [doi]

ProxSkip: Yes! Local Gradient Steps Provably Lead to Communication Acceleration! Finally!Konstantin Mishchenko, Grigory Malinovsky, Sebastian Stich, Peter Richtárik. 15750-15769 [doi]

Fast Convex Optimization for Two-Layer ReLU Networks: Equivalent Model Classes and Cone DecompositionsAaron Mishkin, Arda Sahiner, Mert Pilanci. 15770-15816 [doi]

Memory-Based Model Editing at ScaleEric Mitchell, Charles Lin, Antoine Bosselut, Christopher D. Manning, Chelsea Finn. 15817-15831 [doi]

Invariant Ancestry SearchPhillip B. Mogensen, Nikolaj Thams, Jonas Peters. 15832-15857 [doi]

Differentially Private Community Detection for Stochastic Block ModelsMohamed S. Mohamed, Dung Nguyen, Anil Vullikanti, Ravi Tandon. 15858-15894 [doi]

A Multi-objective / Multi-task Learning Framework Induced by Pareto StationarityMichinari Momma, Chaosheng Dong, Jia Liu. 15895-15907 [doi]

EqR: Equivariant Representations for Data-Efficient Reinforcement LearningArnab Kumar Mondal, Vineet Jain, Kaleem Siddiqi, Siamak Ravanbakhsh. 15908-15926 [doi]

Feature and Parameter Selection in Stochastic Linear BanditsAhmadreza Moradipari, Berkay Turan, Yasin Abbasi-Yadkori, Mahnoosh Alizadeh, Mohammad Ghavamzadeh. 15927-15958 [doi]

Power-Law Escape Rate of SGDTakashi Mori, Ziyin Liu, Kangqiao Liu, Masahito Ueda. 15959-15975 [doi]

Rethinking Fano's Inequality in Ensemble LearningTerufumi Morishita, Gaku Morio, Shota Horiguchi, Hiroaki Ozaki, Nobuo Nukaga. 15976-16016 [doi]

SpeqNets: Sparsity-aware permutation-equivariant graph networksChristopher Morris 0001, Gaurav Rattan, Sandra Kiefer, Siamak Ravanbakhsh. 16017-16042 [doi]

CtrlFormer: Learning Transferable State Representation for Visual Control via TransformerYao Mark Mu, Shoufa Chen, Mingyu Ding, Jianyu Chen, Runjian Chen, Ping Luo. 16043-16061 [doi]

Generalized Beliefs for Cooperative AIDarius Muglich, Luisa M. Zintgraf, Christian A. Schröder de Witt, Shimon Whiteson, Jakob N. Foerster. 16062-16082 [doi]

Bounding the Width of Neural Networks via Coupled Initialization A Worst Case AnalysisAlexander Munteanu, Simon Omlor, Zhao Song 0002, David P. Woodruff. 16083-16122 [doi]

Constants Matter: The Performance Gains of Active LearningStephen O. Mussmann, Sanjoy Dasgupta. 16123-16173 [doi]

On the Generalization Analysis of Adversarial LearningWaleed Mustafa, Yunwen Lei, Marius Kloft. 16174-16196 [doi]

Universal and data-adaptive algorithms for model selection in linear contextual banditsVidya K. Muthukumar, Akshay Krishnamurthy. 16197-16222 [doi]

The Importance of Non-Markovianity in Maximum State Entropy ExplorationMirco Mutti, Riccardo De Santi, Marcello Restelli. 16223-16239 [doi]

PAC-Net: A Model Pruning Approach to Inductive Transfer LearningSanghoon Myung, In Huh, Wonik Jang, Jae Myung Choe, Jisu Ryu, Daesin Kim, Kee-Eung Kim, Changwook Jeong. 16240-16252 [doi]

AutoSNN: Towards Energy-Efficient Spiking Neural NetworksByunggook Na, Jisoo Mok, Seongsik Park, DongJin Lee, Hyeokjun Choe, Sungroh Yoon. 16253-16269 [doi]

Implicit Bias of the Step Size in Linear Diagonal Neural NetworksMor Shpigel Nacson, Kavya Ravichandran, Nathan Srebro, Daniel Soudry. 16270-16295 [doi]

DNNR: Differential Nearest Neighbors RegressionYoussef Nader, Leon Sixt, Tim Landgraf. 16296-16317 [doi]

Overcoming Oscillations in Quantization-Aware TrainingMarkus Nagel, Marios Fournarakis, Yelysei Bondarenko, Tijmen Blankevoort. 16318-16330 [doi]

Strategic RepresentationVineet Nair, Ganesh Ghalme, Inbal Talgam-Cohen, Nir Rosenfeld. 16331-16352 [doi]

Improving Ensemble Distillation With Weight Averaging and Diversifying PerturbationGiung Nam, Hyungi Lee, Byeongho Heo, Juho Lee 0001. 16353-16367 [doi]

Measuring Representational Robustness of Neural Networks Through Shared InvariancesVedant Nanda, Till Speicher, Camila Kolling, John P. Dickerson, Krishna P. Gummadi, Adrian Weller. 16368-16382 [doi]

Tight and Robust Private Mean Estimation with Few UsersShyam Narayanan, Vahab S. Mirrokni, Hossein Esfandiari. 16383-16412 [doi]

Fast Aquatic Swimmer Optimization with Differentiable Projective Dynamics and Neural Network Hydrodynamic ModelsElvis Nava, John Z. Zhang, Mike Yan Michelis, Tao Du 0001, Pingchuan Ma 0002, Benjamin F. Grewe, Wojciech Matusik, Robert Kevin Katzschmann. 16413-16427 [doi]

Multi-Task Learning as a Bargaining GameAviv Navon, Aviv Shamsian, Idan Achituve, Haggai Maron, Kenji Kawaguchi, Gal Chechik, Ethan Fetaya. 16428-16446 [doi]

Variational Inference for Infinitely Deep Neural NetworksAchille Nazaret, David M. Blei. 16447-16461 [doi]

Stable Conformal Prediction SetsEugène Ndiaye. 16462-16479 [doi]

Discovering Generalizable Spatial Goal Representations via Graph-based Active Reward LearningAviv Netanyahu, Tianmin Shu, Joshua Tenenbaum, Pulkit Agrawal. 16480-16495 [doi]

Sublinear-Time Clustering Oracle for Signed GraphsStefan Neumann 0003, Pan Peng. 16496-16528 [doi]

Improved Regret for Differentially Private Exploration in Linear MDPDung Daniel T. Ngo, Giuseppe Vietri, Steven Wu 0001. 16529-16552 [doi]

A Framework for Learning to Request Rich and Contextually Useful Information from HumansKhanh X. Nguyen, Yonatan Bisk, Hal Daumé III. 16553-16568 [doi]

Transformer Neural Processes: Uncertainty-Aware Meta Learning Via Sequence ModelingTung Nguyen, Aditya Grover. 16569-16594 [doi]

Improving Transformers with Probabilistic Attention KeysTam Minh Nguyen, Tan Minh Nguyen, Dung D. D. Le, Duy Khuong Nguyen, Viet-Anh Tran, Richard G. Baraniuk, Nhat Ho, Stanley J. Osher. 16595-16621 [doi]

On Transportation of Mini-batches: A Hierarchical ApproachKhai Nguyen, Dang Nguyen, Quoc Dinh Nguyen, Tung Pham, Hung Bui, Dinh Phung 0001, Trung Le, Nhat Ho. 16622-16655 [doi]

Improving Mini-batch Optimal Transport via Partial TransportationKhai Nguyen, Dang Nguyen, The-Anh Vu-Le, Tung Pham 0001, Nhat Ho. 16656-16690 [doi]

Recurrent Model-Free RL Can Be a Strong Baseline for Many POMDPsTianwei Ni, Benjamin Eysenbach, Ruslan Salakhutdinov. 16691-16723 [doi]

Optimal Estimation of Policy Gradient via Double Fitted IterationChengzhuo Ni, Ruiqi Zhang, Xiang Ji, Xuezhou Zhang, Mengdi Wang. 16724-16783 [doi]

GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion ModelsAlexander Quinn Nichol, Prafulla Dhariwal, Aditya Ramesh, Pranav Shyam, Pamela Mishkin, Bob McGrew, Ilya Sutskever, Mark Chen. 16784-16804 [doi]

Diffusion Models for Adversarial PurificationWeili Nie, Brandon Guo, Yujia Huang, Chaowei Xiao, Arash Vahdat, Animashree Anandkumar. 16805-16827 [doi]

The Primacy Bias in Deep Reinforcement LearningEvgenii Nikishin, Max Schwarzer, Pierluca D'Oro, Pierre-Luc Bacon, Aaron C. Courville. 16828-16847 [doi]

Causal Conceptions of Fairness and their ConsequencesHamed Nilforoshan, Johann D. Gaebler, Ravi Shroff, Sharad Goel. 16848-16887 [doi]

Efficient Test-Time Model Adaptation without ForgettingShuaicheng Niu, Jiaxiang Wu, Yifan Zhang 0004, Yaofo Chen, Shijian Zheng, Peilin Zhao, Mingkui Tan. 16888-16905 [doi]

Generative Trees: Adversarial and CopycatRichard Nock, Mathieu Guillame-Bert. 16906-16951 [doi]

Path-Aware and Structure-Preserving Generation of Synthetically Accessible MoleculesJuhwan Noh, Dae-Woong Jeong, Kiyoung Kim, Sehui Han, Moontae Lee, Honglak Lee, Yousung Jung. 16952-16968 [doi]

Utilizing Expert Features for Contrastive Learning of Time-Series RepresentationsManuel T. Nonnenmacher, Lukas Oldenburg, Ingo Steinwart, David Reeb. 16969-16989 [doi]

Tranception: Protein Fitness Prediction with Autoregressive Transformers and Inference-time RetrievalPascal Notin, Mafalda Dias, Jonathan Frazer, Javier Marchena-Hurtado, Aidan N. Gomez, Debora S. Marks, Yarin Gal. 16990-17017 [doi]

Fast Finite Width Neural Tangent KernelRoman Novak, Jascha Sohl-Dickstein, Samuel S. Schoenholz. 17018-17044 [doi]

Multicoated Supermasks Enhance Hidden NetworksYasuyuki Okoshi, Ángel López García-Arias, Kazutoshi Hirose, Kota Ando, Kazushi Kawamura, Thiem Van Chu, Masato Motomura, Jaehoon Yu. 17045-17055 [doi]

Generalized Leverage Scores: Geometric Interpretation and ApplicationsBruno Ordozgoiti, Antonis Matakos, Aristides Gionis. 17056-17070 [doi]

Practical Almost-Linear-Time Approximation Algorithms for Hybrid and Overlapping Graph ClusteringLorenzo Orecchia, Konstantinos Ameranis, Charalampos E. Tsourakakis, Kunal Talwar. 17071-17093 [doi]

Anticorrelated Noise Injection for Improved GeneralizationAntonio Orvieto, Hans Kersting, Frank Proske, Francis R. Bach, Aurélien Lucchi. 17094-17116 [doi]

Scalable Deep Gaussian Markov Random Fields for General GraphsJoel Oskarsson, Per Sidén, Fredrik Lindsten. 17117-17137 [doi]

Zero-shot AutoML with Pretrained ModelsEkrem Öztürk, Fabio Ferreira, Hadi S. Jomaa, Lars Schmidt-Thieme, Josif Grabocka, Frank Hutter. 17138-17155 [doi]

History Compression via Language Models in Reinforcement LearningFabian Paischer, Thomas Adler, Vihang P. Patil, Angela Bitto-Nemling, Markus Holzleitner, Sebastian Lehner, Hamid Eghbal-zadeh, Sepp Hochreiter. 17156-17185 [doi]

A Study on the Ramanujan Graph Property of Winning Lottery TicketsBithika Pal, Arindam Biswas 0004, Sudeshna Kolay, Pabitra Mitra, Biswajit Basu. 17186-17201 [doi]

On Learning Mixture of Linear Regressions in the Non-Realizable SettingSoumyabrata Pal, Arya Mazumdar, Rajat Sen, Avishek Ghosh. 17202-17220 [doi]

Plan Better Amid Conservatism: Offline Multi-Agent Reinforcement Learning with Actor RectificationLing Pan, Longbo Huang, Tengyu Ma 0001, Huazhe Xu. 17221-17237 [doi]

A Unified Weight Initialization Paradigm for Tensorial Convolutional Neural NetworksYu Pan 0005, Zeyong Su, Ao Liu, Jingquan Wang, Nannan Li 0001, Zenglin Xu. 17238-17257 [doi]

Robustness and Accuracy Could Be Reconcilable by (Proper) DefinitionTianyu Pang, Min Lin, Xiao Yang, Jun Zhu, Shuicheng Yan. 17258-17277 [doi]

Towards Coherent and Consistent Use of Entities in Narrative GenerationPinelopi Papalampidi, Kris Cao, Tomás Kociský. 17278-17294 [doi]

Constrained Discrete Black-Box Optimization using Mixed-Integer ProgrammingTheodore P. Papalexopoulos, Christian Tjandraatmadja, Ross Anderson, Juan Pablo Vielma, David Belanger. 17295-17322 [doi]

A Theoretical Comparison of Graph Neural Network ExtensionsPál András Papp, Roger Wattenhofer. 17323-17345 [doi]

Validating Causal Inference MethodsHarsh Parikh, Carlos Varjao, Louise Xu, Eric Tchetgen Tchetgen. 17346-17358 [doi]

The Unsurprising Effectiveness of Pre-Trained Vision Models for ControlSimone Parisi, Aravind Rajeswaran, Senthil Purushwalkam, Abhinav Gupta 0001. 17359-17371 [doi]

Learning Symmetric Embeddings for Equivariant World ModelsJung Yeon Park, Ondrej Biza, Linfeng Zhao, Jan-Willem van de Meent, Robin Walters. 17372-17389 [doi]

Blurs Behave Like Ensembles: Spatial Smoothings to Improve Accuracy, Uncertainty, and RobustnessNamuk Park, Songkuk Kim. 17390-17419 [doi]

Exact Optimal Accelerated Complexity for Fixed-Point IterationsJisun Park, Ernest K. Ryu. 17420-17457 [doi]

Kernel Methods for Radial Transformed Compositional Data with Many ZerosJunyoung Park, Changwon Yoon, Cheolwoo Park, Jeongyoun Ahn. 17458-17472 [doi]

Evolving Curricula with Regret-Based Environment DesignJack Parker-Holder, Minqi Jiang, Michael Dennis 0001, Mikayel Samvelyan, Jakob N. Foerster, Edward Grefenstette, Tim Rocktäschel. 17473-17498 [doi]

Neural Language Models are not Born Equal to Fit Brain Data, but Training HelpsAlexandre Pasquiou, Yair Lakretz, John T. Hale, Bertrand Thirion, Christophe Pallier. 17499-17516 [doi]

A new similarity measure for covariate shift with applications to nonparametric regressionReese Pathak, Cong Ma, Martin J. Wainwright. 17517-17530 [doi]

Align-RUDDER: Learning From Few Demonstrations by Reward RedistributionVihang P. Patil, Markus Hofmarcher, Marius-Constantin Dinu, Matthias Dorfer, Patrick M. Blies, Johannes Brandstetter, José Antonio Arjona-Medina, Sepp Hochreiter. 17531-17572 [doi]

POET: Training Neural Networks on Tiny Devices with Integrated Rematerialization and PagingShishir G. Patil, Paras Jain 0001, Prabal Dutta, Ion Stoica, Joseph Gonzalez 0001. 17573-17583 [doi]

Learning to Cut by Looking Ahead: Cutting Plane Selection via Imitation LearningMax B. Paulus, Giulia Zarpellon, Andreas Krause 0001, Laurent Charlin, Chris J. Maddison. 17584-17600 [doi]

Neural Network Pruning Denoises the Features and Makes Local Connectivity Emerge in Visual TasksFranco Pellegrini, Giulio Biroli. 17601-17626 [doi]

Branchformer: Parallel MLP-Attention Architectures to Capture Local and Global Context for Speech Recognition and UnderstandingYifan Peng, Siddharth Dalmia, Ian R. Lane, Shinji Watanabe 0001. 17627-17643 [doi]

Pocket2Mol: Efficient Molecular Sampling Based on 3D Protein PocketsXingang Peng, Shitong Luo, Jiaqi Guan, Qi Xie, Jian Peng, Jianzhu Ma. 17644-17655 [doi]

Differentiable Top-k Classification LearningFelix Petersen, Hilde Kuehne, Christian Borgelt, Oliver Deussen. 17656-17668 [doi]

Multi-scale Feature Learning Dynamics: Insights for Double DescentMohammad Pezeshki, Amartya Mitra, Yoshua Bengio, Guillaume Lajoie. 17669-17690 [doi]

A Differential Entropy Estimator for Training Neural NetworksGeorg Pichler, Pierre Jean A. Colombo, Malik Boudiaf, Günther Koliander, Pablo Piantanida. 17691-17715 [doi]

Federated Learning with Partial Model PersonalizationKrishna Pillutla, Kshitiz Malik, Abdelrahman Mohamed, Michael Rabbat, Maziar Sanjabi, Lin Xiao 0003. 17716-17758 [doi]

Deep Networks on Toroids: Removing Symmetries Reveals the Structure of Flat Regions in the Landscape GeometryFabrizio Pittorino, Antonio Ferraro, Gabriele Perugini, Christoph Feinauer, Carlo Baldassi, Riccardo Zecchina. 17759-17781 [doi]

Geometric Multimodal Contrastive Representation LearningPetra Poklukar, Miguel Vasco, Hang Yin, Francisco S. Melo, Ana Paiva 0001, Danica Kragic. 17782-17800 [doi]

Constrained Offline Policy OptimizationNicholas Polosky, Bruno C. da Silva, Madalina Fiterau, Jithin Jagannath. 17801-17810 [doi]

Offline Meta-Reinforcement Learning with Online Self-SupervisionVitchyr H. Pong, Ashvin V. Nair, Laura M. Smith, Catherine Huang, Sergey Levine. 17811-17829 [doi]

Debiaser Beware: Pitfalls of Centering Regularized Transport MapsAram-Alexandre Pooladian, Marco Cuturi, Jonathan Niles-Weed. 17830-17847 [doi]

Adaptive Second Order Coresets for Data-efficient Machine LearningOmead Pooladzandi, David Davini, Baharan Mirzasoleiman. 17848-17869 [doi]

On the Practicality of Deterministic Epistemic UncertaintyJanis Postels, Mattia Segù, Tao Sun, Luca Daniel Sieber, Luc Van Gool, Fisher Yu, Federico Tombari. 17870-17909 [doi]

A Simple Guard for Learned OptimizersIsabeau Prémont-Schwarz, Jaroslav Vitku, Jan Feyereisl. 17910-17925 [doi]

Hardness and Algorithms for Robust and Sparse OptimizationEric Price 0001, Sandeep Silwal, Samson Zhou. 17926-17944 [doi]

Nonlinear Feature Diffusion on HypergraphsKonstantin Prokopchik, Austin R. Benson, Francesco Tudisco. 17945-17958 [doi]

Universal Joint Approximation of Manifolds and Densities by Simple Injective FlowsMichael Puthawala, Matti Lassas, Ivan Dokmanic, Maarten V. De Hoop. 17959-17983 [doi]

The Teaching Dimension of Regularized Kernel LearnersHong Qian, Xu-Hui Liu, Chen-Xi Su, Aimin Zhou, Yang Yu 0001. 17984-18002 [doi]

ContentVec: An Improved Self-Supervised Speech Representation by Disentangling SpeakersKaizhi Qian, Yang Zhang, Heting Gao, Junrui Ni, Cheng-I Lai, David D. Cox, Mark Hasegawa-Johnson, Shiyu Chang. 18003-18017 [doi]

Interventional Contrastive Learning with Meta Semantic RegularizerWenwen Qiang, Jiangmeng Li, Changwen Zheng, Bing Su 0001, Hui Xiong. 18018-18030 [doi]

Sample-Efficient Reinforcement Learning with loglog(T) Switching CostDan Qiao, Ming Yin, Ming Min, Yu-Xiang Wang 0003. 18031-18061 [doi]

Generalizing to Evolving Domains with Latent Structure-Aware Sequential AutoencoderTiexin Qin, Shiqi Wang 0001, Haoliang Li. 18062-18082 [doi]

Graph Neural Architecture Search Under Distribution ShiftsYijian Qin, Xin Wang, Ziwei Zhang, Pengtao Xie, Wenwu Zhu 0001. 18083-18095 [doi]

Spectral Representation of Robustness Measures for Optimization Under Input UncertaintyJixiang Qing, Tom Dhaene, Ivo Couckuyt. 18096-18121 [doi]

Large-scale Stochastic Optimization of NDCG Surrogates for Deep Learning with Provable ConvergenceZi-Hao Qiu, Quanqi Hu, Yongjian Zhong, Lijun Zhang, Tianbao Yang. 18122-18152 [doi]

Latent Outlier Exposure for Anomaly Detection with Contaminated DataChen Qiu, Aodong Li, Marius Kloft, Maja Rudolph, Stephan Mandt. 18153-18167 [doi]

Contrastive UCB: Provably Efficient Contrastive Self-Supervised Learning in Online Reinforcement LearningShuang Qiu, Lingxiao Wang, Chenjia Bai, Zhuoran Yang, Zhaoran Wang. 18168-18210 [doi]

Fast and Provable Nonconvex Tensor RPCAHaiquan Qiu, Yao Wang, ShaoJie Tang, Deyu Meng, Quanming Yao. 18211-18249 [doi]

Generalized Federated Learning via Sharpness Aware MinimizationZhe Qu, Xingyu Li, Rui Duan, Yao Liu, Bo Tang, Zhuo Lu. 18250-18280 [doi]

Particle Transformer for Jet TaggingHuilin Qu, Congqiao Li, Sitian Qian. 18281-18292 [doi]

Winning the Lottery Ahead of Time: Efficient Early Network PruningJohn Rachwan, Daniel Zügner, Bertrand Charpentier, Simon Geisler, Morgane Ayle, Stephan Günnemann. 18293-18309 [doi]

Convergence of Uncertainty Sampling for Active LearningAnant Raj, Francis R. Bach. 18310-18331 [doi]

DeepSpeed-MoE: Advancing Mixture-of-Experts Inference and Training to Power Next-Generation AI ScaleSamyam Rajbhandari, Conglong Li, Zhewei Yao, Minjia Zhang, Reza Yazdani Aminabadi, Ammar Ahmad Awan, Jeff Rasley, Yuxiong He. 18332-18346 [doi]

Fishr: Invariant Gradient Variances for Out-of-Distribution GeneralizationAlexandre Ramé, Corentin Dancette, Matthieu Cord. 18347-18377 [doi]

A Closer Look at Smoothness in Domain Adversarial TrainingHarsh Rangwani, Sumukh K. Aithal, Mayank Mishra, Arihant Jain, Venkatesh Babu Radhakrishnan. 18378-18399 [doi]

Linear Adversarial Concept ErasureShauli Ravfogel, Michael Twiton, Yoav Goldberg, Ryan Cotterell. 18400-18421 [doi]

Implicit Regularization in Hierarchical Tensor Factorization and Deep Convolutional Neural NetworksNoam Razin, Asaf Maman, Nadav Cohen. 18422-18462 [doi]

One-Pass Algorithms for MAP Inference of Nonsymmetric Determinantal Point ProcessesAravind Reddy, Ryan A. Rossi, Zhao Song 0002, Anup B. Rao, Tung Mai, Nedim Lipka, Gang Wu, Eunyee Koh, Nesreen K. Ahmed. 18463-18482 [doi]

Universality of Winning Tickets: A Renormalization Group PerspectiveWilliam T. Redman, Tianlong Chen, Zhangyang Wang, Akshunna S. Dogra. 18483-18498 [doi]

The dynamics of representation learning in shallow, non-linear autoencodersMaria Refinetti, Sebastian Goldt. 18499-18519 [doi]

Proximal Exploration for Model-guided Protein Sequence DesignZhizhou Ren, Jiahan Li, Fan Ding, Yuan Zhou 0007, Jianzhu Ma, Jian Peng 0001. 18520-18536 [doi]

Towards Theoretical Analysis of Transformation Complexity of ReLU DNNsJie Ren 0018, Mingjie Li, Meng Zhou, Shih-Han Chan, Quanshi Zhang. 18537-18558 [doi]

Benchmarking and Analyzing Point Cloud Classification under CorruptionsJiawei Ren, Liang Pan, Ziwei Liu 0002. 18559-18575 [doi]

A Unified View on PAC-Bayes Bounds for Meta-LearningArezou Rezazadeh 0001. 18576-18595 [doi]

3PC: Three Point Compressors for Communication-Efficient Distributed Training and a Better Theory for Lazy AggregationPeter Richtárik, Igor Sokolov 0001, Elnur Gasanov, Ilyas Fatkhullin, Zhize Li, Eduard Gorbunov. 18596-18648 [doi]

Robust SDE-Based Variational Formulations for Solving Linear PDEs via Deep LearningLorenz Richter, Julius Berner. 18649-18666 [doi]

Probabilistically Robust Learning: Balancing Average and Worst-case PerformanceAlexander Robey, Luiz F. O. Chamon, George J. Pappas, Hamed Hassani. 18667-18686 [doi]

LyaNet: A Lyapunov Framework for Training Neural ODEsIvan Dario Jimenez Rodriguez, Aaron D. Ames, Yisong Yue. 18687-18703 [doi]

Short-Term Plasticity Neurons Learning to Learn and ForgetHector Garcia Rodriguez, Qinghai Guo, Timoleon Moraitis. 18704-18722 [doi]

Function-space Inference with Sparse Implicit ProcessesSimón Rodríguez Santana, Bryan Zaldivar, Daniel Hernández-Lobato. 18723-18740 [doi]

Score Matching Enables Causal Discovery of Nonlinear Additive Noise ModelsPaul Rolland, Volkan Cevher, Matthäus Kleindessner, Chris Russell 0001, Dominik Janzing, Bernhard Schölkopf, Francesco Locatello. 18741-18753 [doi]

Dual Decomposition of Convex Optimization Layers for Consistent Attention in Medical ImagesTom Ron, Tamir Hazan. 18754-18769 [doi]

A Consistent and Efficient Evaluation Strategy for Attribution MethodsYao Rong, Tobias Leemann, Vadim Borisov, Gjergji Kasneci, Enkelejda Kasneci. 18770-18795 [doi]

Efficiently Learning the Topology and Behavior of a Networked Dynamical System Via Active QueriesDaniel J. Rosenkrantz, Abhijin Adiga, Madhav Marathe, Zirou Qiu, S. S. Ravi, Richard Edwin Stearns, Anil Vullikanti. 18796-18808 [doi]

Learning to Infer Structures of Network GamesEmanuele Rossi, Federico Monti, Yan Leng, Michael M. Bronstein, Xiaowen Dong 0001. 18809-18827 [doi]

Direct Behavior Specification via Constrained Reinforcement LearningJulien Roy, Roger Girgis, Joshua Romoff, Pierre-Luc Bacon, Christopher J. Pal. 18828-18843 [doi]

Constraint-based graph network simulatorYulia Rubanova, Alvaro Sanchez-Gonzalez, Tobias Pfaff, Peter W. Battaglia. 18844-18870 [doi]

Continual Learning via Sequential Function-Space Variational InferenceTim G. J. Rudner, Freddie Bickford Smith, Qixuan Feng, Yee Whye Teh, Yarin Gal. 18871-18887 [doi]

Graph-Coupled Oscillator NetworksT. Konstantin Rusch, Ben Chamberlain 0001, James Rowbottom, Siddhartha Mishra, Michael M. Bronstein. 18888-18909 [doi]

Hindering Adversarial Attacks with Implicit Neural RepresentationsAndrei A. Rusu, Dan Andrei Calian, Sven Gowal, Raia Hadsell. 18910-18934 [doi]

Exploiting Independent Instruments: Identification and Distribution GeneralizationSorawit Saengkyongam, Leonard Henckel, Niklas Pfister, Jonas Peters. 18935-18958 [doi]

FedNL: Making Newton-Type Methods Applicable to Federated LearningMher Safaryan, Rustem Islamov, Xun Qian, Peter Richtárik. 18959-19010 [doi]

Versatile Dueling Bandits: Best-of-both World Analyses for Learning from Relative PreferencesAadirupa Saha, Pierre Gaillard. 19011-19026 [doi]

Optimal and Efficient Dynamic Regret Algorithms for Non-Stationary Dueling BanditsAadirupa Saha, Shubham Gupta. 19027-19049 [doi]

Unraveling Attention via Convex Duality: Analysis and Interpretations of Vision TransformersArda Sahiner, Tolga Ergen, Batu Ozturkler, John M. Pauly, Morteza Mardani, Mert Pilanci. 19050-19088 [doi]

Off-Policy Evaluation for Large Action Spaces via EmbeddingsYuta Saito, Thorsten Joachims. 19089-19122 [doi]

Optimal Clipping and Magnitude-aware Differentiation for Improved Quantization-aware TrainingCharbel Sakr, Steve Dai, Rangharajan Venkatesan, Brian Zimmer, William J. Dally, Brucek Khailany. 19123-19138 [doi]

A Convergence Theory for SVGD in the Population Limit under Talagrand's Inequality T1Adil Salim, Lukang Sun, Peter Richtárik. 19139-19152 [doi]

FITNESS: (Fine Tune on New and Similar Samples) to detect anomalies in streams with drift and outliersAbishek Sankararaman, Balakrishnan Narayanaswamy, Vikramank Y. Singh, Zhao Song. 19153-19177 [doi]

The Algebraic Path Problem for Graph MetricsEnrique Fita Sanmartín, Sebastian Damrich, Fred A. Hamprecht. 19178-19204 [doi]

LSB: Local Self-Balancing MCMC in Discrete SpacesEmanuele Sansone. 19205-19220 [doi]

PoF: Post-Training of Feature Extractor for Improving GeneralizationIkuro Sato, Ryota Yamada, Masayuki Tanaka, Nakamasa Inoue, Rei Kawakami. 19221-19230 [doi]

Re-evaluating Word Mover's DistanceRyoma Sato, Makoto Yamada, Hisashi Kashima. 19231-19249 [doi]

Understanding Contrastive Learning Requires Incorporating Inductive BiasesNikunj Saunshi, Jordan T. Ash, Surbhi Goel, Dipendra Misra, Cyril Zhang, Sanjeev Arora, Sham M. Kakade, Akshay Krishnamurthy. 19250-19286 [doi]

The Neural Race Reduction: Dynamics of Abstraction in Gated NetworksAndrew Saxe, Shagun Sodhani, Sam Jay Lewallen. 19287-19309 [doi]

Convergence Rates of Non-Convex Stochastic Gradient Descent Under a Generic Lojasiewicz Condition and Local SmoothnessKevin Scaman, Cédric Malherbe, Ludovic Dos Santos. 19310-19327 [doi]

An Asymptotic Test for Conditional Independence using Analytic Kernel EmbeddingsMeyer Scetbon, Laurent Meunier, Yaniv Romano. 19328-19346 [doi]

Linear-Time Gromov Wasserstein Distances using Low Rank Couplings and CostsMeyer Scetbon, Gabriel Peyré, Marco Cuturi. 19347-19365 [doi]

Streaming Inference for Infinite Feature ModelsRylan Schaeffer, Yilun Du, Gabrielle K. Liu, Ila Fiete. 19366-19387 [doi]

Modeling Irregular Time Series with Continuous Recurrent UnitsMona Schirmer, Mazin Eltayeb, Stefan Lessmann, Maja Rudolph. 19388-19405 [doi]

Structure Preserving Neural Networks: A Case Study in the Entropy Closure of the Boltzmann EquationSteffen Schotthöfer, Tianbai Xiao, Martin Frank, Cory D. Hauck. 19406-19433 [doi]

Improving Robustness against Real-World and Worst-Case Distribution Shifts through Decision Region QuantificationLeo Schwinn, Leon Bungert, An Nguyen, René Raab, Falk Pulsmeyer, Doina Precup, Bjoern M. Eskofier, Dario Zanca. 19434-19449 [doi]

Symmetric Machine Theory of MindMelanie Sclar, Graham Neubig, Yonatan Bisk. 19450-19466 [doi]

Data-SUITE: Data-centric identification of in-distribution incongruous examplesNabeel Seedat, Jonathan Crabbé, Mihaela van der Schaar. 19467-19496 [doi]

Continuous-Time Modeling of Counterfactual Outcomes Using Neural Controlled Differential EquationsNabeel Seedat, Fergus Imrie, Alexis Bellot, Zhaozhi Qian, Mihaela van der Schaar. 19497-19521 [doi]

Neural Tangent Kernel Beyond the Infinite-Width Limit: Effects of Depth and InitializationMariia Seleznova, Gitta Kutyniok. 19522-19560 [doi]

Reinforcement Learning with Action-Free Pre-Training from VideosYounggyo Seo, Kimin Lee, Stephen L. James, Pieter Abbeel. 19561-19579 [doi]

Efficient Model-based Multi-agent Reinforcement Learning via Optimistic Equilibrium ComputationPier Giuseppe Sessa, Maryam Kamgarpour, Andreas Krause 0001. 19580-19597 [doi]

Selective Regression under Fairness CriteriaAbhin Shah, Yuheng Bu, Joshua K. Lee, Subhro Das, Rameswar Panda, Prasanna Sattigeri, Gregory W. Wornell. 19598-19615 [doi]

Utility Theory for Sequential Decision MakingMehran Shakerinava, Siamak Ravanbakhsh. 19616-19625 [doi]

Translating Robot Skills: Learning Unsupervised Skill Correspondences Across RobotsTanmay Shankar, Yixin Lin, Aravind Rajeswaran, Vikash Kumar, Stuart Anderson, Jean Oh. 19626-19644 [doi]

A State-Distribution Matching Approach to Non-Episodic Reinforcement LearningArchit Sharma, Rehaan Ahmad, Chelsea Finn. 19645-19657 [doi]

Content Addressable Memory Without Catastrophic Forgetting by Heteroassociation with a Fixed ScaffoldSugandha Sharma, Sarthak Chandra, Ila R. Fiete. 19658-19682 [doi]

Federated Minimax Optimization: Improved Convergence Analyses and AlgorithmsPranay Sharma, Rohan Panda, Gauri Joshi, Pramod K. Varshney. 19683-19730 [doi]

DNS: Determinantal Point Process Based Neural Network Sampler for Ensemble Reinforcement LearningHassam Sheikh, Kizza Frisbee, Mariano Phielipp. 19731-19746 [doi]

Instance Dependent Regret Analysis of Kernelized BanditsShubhanshu Shekhar, Tara Javidi. 19747-19772 [doi]

Data Augmentation as Feature ManipulationRuoqi Shen, Sébastien Bubeck, Suriya Gunasekar. 19773-19808 [doi]

Metric-Fair Active LearningJie Shen, Nan Cui, Jing Wang. 19809-19826 [doi]

PDO-s3DCNNs: Partial Differential Operator Based Steerable 3D CNNsZhengyang Shen, Tao Hong, Qi She, Jinwen Ma, Zhouchen Lin. 19827-19846 [doi]

Connect, Not Collapse: Explaining Contrastive Learning for Unsupervised Domain AdaptationKendrick Shen, Robbie M. Jones, Ananya Kumar, Sang Michael Xie, Jeff Z. HaoChen, Tengyu Ma 0001, Percy Liang. 19847-19878 [doi]

Constrained Optimization with Dynamic Bound-scaling for Effective NLP Backdoor DefenseGuangyu Shen, Yingqi Liu, Guanhong Tao, Qiuling Xu, Zhuo Zhang 0002, Shengwei An, ShiQing Ma, Xiangyu Zhang 0001. 19879-19892 [doi]

Staged Training for Transformer Language ModelsSheng Shen, Pete Walsh, Kurt Keutzer, Jesse Dodge, Matthew E. Peters, Iz Beltagy. 19893-19908 [doi]

Deep Network Approximation in Terms of Intrinsic ParametersZuowei Shen, Haizhao Yang, Shijun Zhang. 19909-19934 [doi]

Gradient-Free Method for Heavily Constrained Nonconvex OptimizationWanli Shi, Hongchang Gao, Bin Gu 0001. 19935-19955 [doi]

Global Optimization of K-Center ClusteringMingfei Shi, Kaixun Hua, Jiayang Ren, Yankai Cao. 19956-19966 [doi]

Pessimistic Q-Learning for Offline Reinforcement Learning: Towards Optimal Sample ComplexityLaixi Shi, Gen Li 0005, Yuting Wei, Yuxin Chen 0002, Yuejie Chi. 19967-20025 [doi]

Adversarial Masking for Self-Supervised LearningYuge Shi, N. Siddharth 0001, Philip H. S. Torr, Adam R. Kosiorek. 20026-20040 [doi]

Visual Attention Emerges from Recurrent Sparse ReconstructionBaifeng Shi, Yale Song, Neel Joshi, Trevor Darrell, Xin Wang. 20041-20056 [doi]

A Minimax Learning Approach to Off-Policy Evaluation in Confounded Partially Observable Markov Decision ProcessesChengchun Shi, Masatoshi Uehara, Jiawei Huang, Nan Jiang. 20057-20094 [doi]

Robust Group Synchronization via Quadratic ProgrammingYunpeng Shi, Cole M. Wyeth, Gilad Lerman. 20095-20105 [doi]

Log-Euclidean Signatures for Intrinsic Distances Between Unaligned DatasetsTal Shnitzer, Mikhail Yurochkin, Kristjan H. Greenewald, Justin M. Solomon. 20106-20124 [doi]

Scalable Computation of Causal BoundsMadhumitha Shridharan, Garud Iyengar. 20125-20140 [doi]

Bit Prioritization in Variational Autoencoders via Progressive CodingRui Shu, Stefano Ermon. 20141-20155 [doi]

Fair Representation Learning through Implicit Path AlignmentChangjian Shui, Qi Chen, Jiaqi Li 0005, Boyu Wang, Christian Gagné 0001. 20156-20175 [doi]

Faster Algorithms for Learning Convex FunctionsAli Siahkamari, Durmus Alp Emre Acar, Christopher Liao, Kelly L. Geyer, Venkatesh Saligrama, Brian Kulis. 20176-20194 [doi]

Coin Flipping Neural NetworksYuval Sieradzki, Nitzan Hodos, Gal Yehuda, Assaf Schuster. 20195-20214 [doi]

Reverse Engineering the Neural Tangent KernelJames Benjamin Simon, Sajant Anand, Michael Robert DeWeese. 20215-20231 [doi]

Demystifying the Adversarial Robustness of Random Transformation DefensesChawin Sitawarin, Zachary J. Golan-Strieb, David A. Wagner 0001. 20232-20252 [doi]

Smoothed Adversarial Linear Contextual Bandits with KnapsacksVidyashankar Sivakumar, Shiliang Zuo, Arindam Banerjee 0001. 20253-20277 [doi]

GenLabel: Mixup Relabeling using Generative ModelsJy-yong Sohn, Liang Shang, Hongxu Chen, Jaekyun Moon, Dimitris S. Papailiopoulos, Kangwook Lee. 20278-20313 [doi]

Communicating via Markov Decision ProcessesSamuel Sokota, Christian A. Schröder de Witt, Maximilian Igl, Luisa M. Zintgraf, Philip H. S. Torr, Martin Strohmeier, J. Zico Kolter, Shimon Whiteson, Jakob N. Foerster. 20314-20328 [doi]

The Multivariate Community Hawkes Model for Dependent Relational Events in Continuous-time NetworksHadeel Soliman, Lingfei Zhao, Zhipeng Huang 0011, Subhadeep Paul, Kevin S. Xu 0001. 20329-20346 [doi]

Disentangling Sources of Risk for Distributional Multi-Agent Reinforcement LearningKyunghwan Son, Junsu Kim, Sungsoo Ahn, Roben Delos Reyes, Yung Yi, Jinwoo Shin. 20347-20368 [doi]

TAM: Topology-Aware Margin Loss for Class-Imbalanced Node ClassificationJaeyun Song, Joonhyung Park, Eunho Yang. 20369-20383 [doi]

A General Recipe for Likelihood-free Bayesian OptimizationJiaming Song, Lantao Yu, Willie Neiswanger, Stefano Ermon. 20384-20404 [doi]

Fully-Connected Network on Noncompact Symmetric Space and Ridgelet Transform based on Helgason-Fourier AnalysisSho Sonoda, Isao Ishikawa, Masahiro Ikeda. 20405-20422 [doi]

Saute RL: Almost Surely Safe Reinforcement Learning Using State AugmentationAivar Sootla, Alexander I. Cowen-Rivers, Taher Jafferjee, Ziyan Wang, David Henry Mguni, Jun Wang, Haitham Ammar. 20423-20443 [doi]

Lightweight Projective Derivative Codes for Compressed Asynchronous Gradient DescentPedro J. Soto, Ilia Ilmer, Haibin Guan, Jun Li 0017. 20444-20458 [doi]

Accelerating Bayesian Optimization for Biological Sequence Design with Denoising AutoencodersSamuel Stanton, Wesley J. Maddox, Nate Gruver, Phillip Maffettone, Emily Delaney, Peyton Greenside, Andrew Gordon Wilson. 20459-20478 [doi]

3D Infomax improves GNNs for Molecular Property PredictionHannes Stärk, Dominique Beaini, Gabriele Corso, Prudencio Tossou, Christian Dallago, Stephan Günnemann, Pietro Lió. 20479-20502 [doi]

EquiBind: Geometric Deep Learning for Drug Binding Structure PredictionHannes Stärk, Octavian Ganea, Lagnajit Pattanaik, Regina Barzilay, Tommi Jaakkola. 20503-20521 [doi]

Plug & Play Attacks: Towards Robust and Flexible Model Inversion AttacksLukas Struppek, Dominik Hintersdorf, Antonio De Almeida Correia, Antonia Adler, Kristian Kersting. 20522-20545 [doi]

Scaling-up Diverse Orthogonal Convolutional Networks by a Paraunitary FrameworkJiahao Su, Wonmin Byeon, Furong Huang. 20546-20579 [doi]

Divergence-Regularized Multi-Agent Actor-CriticKefan Su, Zongqing Lu. 20580-20603 [doi]

Influence-Augmented Local Simulators: a Scalable Solution for Fast Deep RL in Large Networked SystemsMiguel Suau, Jinke He, Matthijs T. J. Spaan, Frans A. Oliehoek. 20604-20624 [doi]

Improved StyleGAN-v2 based Inversion for Out-of-Distribution ImagesRakshith Subramanyam, Vivek Sivaraman Narayanaswamy, Mark Naufel, Andreas Spanias, Jayaraman J. Thiagarajan. 20625-20639 [doi]

Continuous-Time Analysis of Accelerated Gradient Methods via Conservation Laws in Dilated Coordinate SystemsJaewook J. Suh, Gyumin Roh, Ernest K. Ryu. 20640-20667 [doi]

Do Differentiable Simulators Give Better Policy Gradients?Hyung Ju Suh, Max Simchowitz, Kaiqing Zhang, Russ Tedrake. 20668-20696 [doi]

Intriguing Properties of Input-Dependent Randomized SmoothingPeter Súkeník, Aleksei Kuvshinov, Stephan Günnemann. 20697-20743 [doi]

Cliff Diving: Exploring Reward Surfaces in Reinforcement Learning EnvironmentsRyan Sullivan, Jordan K. Terry, Benjamin Black, John P. Dickerson. 20744-20776 [doi]

AGNAS: Attention-Guided Micro and Macro-Architecture SearchZihao Sun, Yu Hu 0001, Shun Lu, Longxing Yang, Jilin Mei, Yinhe Han, Xiaowei Li. 20777-20789 [doi]

Adaptive Random Walk Gradient Descent for Decentralized OptimizationTao Sun, Dongsheng Li, Bao Wang. 20790-20809 [doi]

MAE-DET: Revisiting Maximum Entropy Principle in Zero-Shot NAS for Efficient Object DetectionZhenhong Sun, Ming Lin, Xiuyu Sun, Zhiyu Tan, Hao Li, Rong Jin 0001. 20810-20826 [doi]

Out-of-Distribution Detection with Deep Nearest NeighborsYiyou Sun, Yifei Ming, Xiaojin Zhu 0001, Yixuan Li. 20827-20840 [doi]

Black-Box Tuning for Language-Model-as-a-ServiceTianxiang Sun, Yunfan Shao, Hong Qian, Xuanjing Huang, Xipeng Qiu. 20841-20855 [doi]

Correlated Quantization for Distributed Mean Estimation and OptimizationAnanda Theertha Suresh, Ziteng Sun, Jae Ro, Felix X. Yu. 20856-20876 [doi]

Causal Imitation Learning under Temporally Correlated NoiseGokul Swamy, Sanjiban Choudhury, Drew Bagnell, Steven Wu 0001. 20877-20890 [doi]

Being Properly ImproperTyler Sypherd, Richard Nock, Lalitha Sankar. 20891-20932 [doi]

Distributionally-Aware Kernelized Bandit Problems for Risk AversionSho Takemori. 20933-20959 [doi]

Sequential and Parallel Constrained Max-value Entropy Search via Information Lower BoundShion Takeno, Tomoyuki Tamura, Kazuki Shitara, Masayuki Karasuyama. 20960-20986 [doi]

SQ-VAE: Variational Bayes on Discrete Representation with Self-annealed Stochastic QuantizationYuhta Takida, Takashi Shibuya 0001, Wei-Hsiang Liao, Chieh-Hsin Lai, Junki Ohmura, Toshimitsu Uesaka, Naoki Murata, Shusuke Takahashi, Toshiyuki Kumakura, Yuki Mitsufuji. 20987-21012 [doi]

A Tree-based Model Averaging Approach for Personalized Treatment Effect Estimation from Heterogeneous Data SourcesXiaoqing Tan, Chung-Chou H. Chang, Ling Zhou, Lu Tang 0003. 21013-21036 [doi]

N-Penetrate: Active Learning of Neural Collision Handler for Complex 3D Mesh DeformationsQingyang Tan, Zherong Pan, Breannan Smith, Takaaki Shiratori, Dinesh Manocha. 21037-21049 [doi]

Biased Gradient Estimate with Drastic Variance Reduction for Meta Reinforcement LearningYunhao Tang. 21050-21075 [doi]

Rethinking Graph Neural Networks for Anomaly DetectionJianheng Tang, Jiajin Li, Ziqi Gao, Jia Li. 21076-21089 [doi]

Deep Safe Incomplete Multi-view Clustering: Theorem and AlgorithmHuayi Tang, Yong Liu. 21090-21110 [doi]

Virtual Homogeneity Learning: Defending against Data Heterogeneity in Federated LearningZhenheng Tang, Yonggang Zhang, Shaohuai Shi, Xin He, Bo Han, Xiaowen Chu 0001. 21111-21132 [doi]

Cross-Space Active Learning on Graph Convolutional NetworksYufei Tao, Hao Wu, Shiyuan Deng. 21133-21145 [doi]

FedNest: Federated Bilevel, Minimax, and Compositional OptimizationDavoud Ataee Tarzanagh, Mingchen Li, Christos Thrampoulidis, Samet Oymak. 21146-21179 [doi]

Efficient Distributionally Robust Bayesian Optimization with Worst-case SensitivitySebastian Shenghong Tay, Chuan-Sheng Foo, Urano Daisuke, Richalynn Leong, Bryan Kian Hsiang Low. 21180-21204 [doi]

LIDL: Local Intrinsic Dimension Estimation Using Approximate LikelihoodPiotr Tempczyk, Rafal Michaluk, Lukasz Garncarek, Przemyslaw Spurek, Jacek Tabor, Adam Golinski. 21205-21231 [doi]

LCANets: Lateral Competition Improves Robustness Against Corruption and AttackMichael Teti, Garrett T. Kenyon, Ben Migliori, Juston Moore. 21232-21252 [doi]

p attacks: A block-sparse optimization approach with recovery guaranteesDarshan Thaker, Paris Giampouras, René Vidal. 21253-21271 [doi]

Generalised Policy Improvement with Geometric Policy CompositionShantanu Thakoor, Mark Rowland, Diana Borsa, Will Dabney, Rémi Munos, André Barreto 0001. 21272-21307 [doi]

Algorithms for the Communication of SamplesLucas Theis, Noureldin Y. Ahmed. 21308-21328 [doi]

Consistent Polyhedral Surrogates for Top-k Classification and VariantsAnish Thilagar, Rafael M. Frongillo, Jessica Finocchiaro, Emma Goodwill. 21329-21359 [doi]

On the Finite-Time Complexity and Practical Computation of Approximate Stationarity Concepts of Lipschitz FunctionsLai Tian, Kaiwen Zhou, Anthony Man-Cho So. 21360-21379 [doi]

From Dirichlet to Rubin: Optimistic Exploration in RL without BonusesDaniil Tiapkin, Denis Belomestny, Eric Moulines, Alexey Naumov, Sergey Samsonov, Yunhao Tang, Michal Valko, Pierre Ménard. 21380-21431 [doi]

Nonparametric Sparse Tensor Factorization with Hierarchical Gamma ProcessesConor Tillinghast, Zheng Wang, Shandian Zhe. 21432-21448 [doi]

Deciphering Lasso-based Classification Through a Large Dimensional Analysis of the Iterative Soft-Thresholding AlgorithmMalik Tiomoko, Ekkehard Schnoor, Mohamed-El-Amine Seddik, Igor Colin, Aladin Virmaux. 21449-21477 [doi]

Extended Unconstrained Features Model for Exploring Deep Neural CollapseTom Tirer, Joan Bruna. 21478-21505 [doi]

Object Permanence Emerges in a Random Walk along MemoryPavel Tokmakov, Allan Jabri, Jie Li 0031, Adrien Gaidon. 21506-21519 [doi]

Generic Coreset for Scalable Learning of Monotonic Kernels: Logistic Regression, Sigmoid and moreElad Tolochinsky, Ibrahim Jubran, Dan Feldman. 21520-21547 [doi]

Failure and success of the spectral bias prediction for Laplace Kernel Ridge Regression: the case of low-dimensional dataUmberto M. Tomasini, Antonio Sclocchi, Matthieu Wyart. 21548-21583 [doi]

Quantifying and Learning Linear Symmetry-Based DisentanglementLoek Tonnaer, Luis Armando Pérez Rey, Vlado Menkovski, Mike Holenderski, Jim Portegies. 21584-21608 [doi]

A Temporal-Difference Approach to Policy Gradient EstimationSamuele Tosatto, Andrew Patterson, Martha White, Rupam Mahmood. 21609-21632 [doi]

Simple and near-optimal algorithms for hidden stratification and multi-group learningChristopher J. Tosh, Daniel Hsu 0001. 21633-21657 [doi]

Design-Bench: Benchmarks for Data-Driven Offline Model-Based OptimizationBrandon Trabucco, Xinyang Geng, Aviral Kumar, Sergey Levine. 21658-21676 [doi]

AnyMorph: Learning Transferable Polices By Inferring Agent MorphologyBrandon Trabucco, Mariano Phielipp, Glen Berseth. 21677-21691 [doi]

Detecting Adversarial Examples Is (Nearly) As Hard As Classifying ThemFlorian Tramèr. 21692-21702 [doi]

Nesterov Accelerated Shuffling Gradient Method for Convex OptimizationTrang H. Tran, Katya Scheinberg, Lam M. Nguyen. 21703-21732 [doi]

A Completely Tuning-Free and Robust Approach to Sparse Precision Matrix EstimationChau Tran, Guo Yu. 21733-21750 [doi]

Tackling covariate shift with node-based Bayesian neural networksTrung Q. Trinh, Markus Heinonen, Luigi Acerbi, Samuel Kaski. 21751-21775 [doi]

Fenrir: Physics-Enhanced Regression for Initial Value ProblemsFilip Tronarp, Nathanael Bosch, Philipp Hennig. 21776-21794 [doi]

Interpretable Off-Policy Learning via Hyperbox SearchDaniel Tschernutter, Tobias Hatt, Stefan Feuerriegel. 21795-21827 [doi]

FriendlyCore: Practical Differentially Private AggregationEliad Tsfadia, Edith Cohen, Haim Kaplan, Yishay Mansour, Uri Stemmer. 21828-21863 [doi]

Pairwise Conditional Gradients without Swap Steps and Sparser Kernel HerdingKazuma Tsuji, Ken'ichiro Tanaka, Sebastian Pokutta. 21864-21883 [doi]

Prototype Based Classification from Hierarchy to FairnessMycal Tucker, Julie A. Shah. 21884-21900 [doi]

Consensus Multiplicative Weights Update: Learning to Learn using Projector-based Game SignaturesNelson Vadori, Rahul Savani, Thomas Spooner, Sumitra Ganesh. 21901-21926 [doi]

Self-Supervised Models of Audio Effectively Explain Human Cortical Responses to SpeechAditya R. Vaidya, Shailee Jain, Alexander Huth. 21927-21944 [doi]

Path-Gradient Estimators for Continuous Normalizing FlowsLorenz Vaitl, Kim Andrea Nicoli, Shinichi Nakajima, Pan Kessel. 21945-21959 [doi]

Improved Convergence Rates for Sparse Approximation Methods in Kernel-Based LearningSattar Vakili, Jonathan Scarlett, Da-shan Shiu, Alberto Bernacchia. 21960-21983 [doi]

EDEN: Communication-Efficient and Robust Distributed Mean Estimation for Federated LearningShay Vargaftik, Ran Ben-Basat, Amit Portnoy, Gal Mendelson, Yaniv Ben-Itzhak, Michael Mitzenmacher. 21984-22014 [doi]

Towards Noise-adaptive, Problem-adaptive (Accelerated) Stochastic Gradient DescentSharan Vaswani, Benjamin Dubois-Taine, Reza Babanezhad. 22015-22059 [doi]

Correlation Clustering via Strong Triadic Closure Labeling: Fast Approximation Algorithms and Practical Lower BoundsNate Veldt. 22060-22083 [doi]

The CLRS Algorithmic Reasoning BenchmarkPetar Velickovic, Adrià Puigdomènech Badia, David Budden, Razvan Pascanu, Andrea Banino, Misha Dashevskiy, Raia Hadsell, Charles Blundell. 22084-22102 [doi]

Bregman Power k-Means for Clustering Exponential Family DataAdithya Vellal, Saptarshi Chakraborty, Jason Q. Xu. 22103-22119 [doi]

Estimation in Rotationally Invariant Generalized Linear Models via Approximate Message PassingRamji Venkataramanan, Kevin Kögler, Marco Mondelli. 22120-22144 [doi]

Bayesian Optimization under Stochastic Delayed FeedbackArun Verma, Zhongxiang Dai, Bryan Kian Hsiang Low. 22145-22167 [doi]

VarScene: A Deep Generative Model for Realistic Scene Graph SynthesisTathagat Verma, Abir De, Yateesh Agrawal, Vishwa Vinay, Soumen Chakrabarti. 22168-22183 [doi]

Calibrated Learning to Defer with One-vs-All ClassifiersRajeev Verma, Eric T. Nalisnick. 22184-22202 [doi]

Regret Bounds for Stochastic Shortest Path Problems with Linear Function ApproximationDaniel Vial, Advait Parulekar, Sanjay Shakkottai, R. Srikant 0001. 22203-22233 [doi]

On Implicit Bias in Overparameterized Bilevel OptimizationPaul Vicol, Jonathan P. Lorraine, Fabian Pedregosa, David Duvenaud, Roger B. Grosse. 22234-22259 [doi]

Multiclass learning with margin: exponential rates with no bias-variance trade-offStefano Vigogna, Giacomo Meanti, Ernesto De Vito, Lorenzo Rosasco. 22260-22269 [doi]

Addressing Optimism Bias in Sequence Modeling for Reinforcement LearningAdam R. Villaflor, Zhe Huang, Swapnil Pande, John M. Dolan, Jeff Schneider. 22270-22283 [doi]

Bayesian Nonparametrics for Offline Skill DiscoveryValentin Villecroze, Harry J. Braviner, Panteha Naderian, Chris J. Maddison, Gabriel Loaiza-Ganem. 22284-22299 [doi]

Hermite Polynomial Features for Private Data GenerationMargarita Vinaroz, Mohammad-Amin Charusaie, Frederik Harder, Kamil Adamczewski, Mijung Park. 22300-22324 [doi]

What Can Linear Interpolation of Neural Network Loss Landscapes Tell Us?Tiffany J. Vlaar, Jonathan Frankle. 22325-22341 [doi]

Multirate Training of Neural NetworksTiffany J. Vlaar, Benedict J. Leimkuhler. 22342-22360 [doi]

Provably Adversarially Robust Nearest Prototype ClassifiersVáclav Vorácek, Matthias Hein. 22361-22383 [doi]

First-Order Regret in Reinforcement Learning with Linear Function Approximation: A Robust Estimation ApproachAndrew J. Wagenmaker, Yifang Chen, Max Simchowitz, Simon S. Du, Kevin G. Jamieson. 22384-22429 [doi]

Reward-Free RL is No Harder Than Reward-Aware RL in Linear Markov Decision ProcessesAndrew J. Wagenmaker, Yifang Chen, Max Simchowitz, Simon S. Du, Kevin G. Jamieson. 22430-22456 [doi]

Training Characteristic Functions with Reinforcement Learning: XAI-methods play Connect FourStephan Wäldchen, Sebastian Pokutta, Felix Huber. 22457-22474 [doi]

Retroformer: Pushing the Limits of End-to-end Retrosynthesis TransformerYue Wan, Chang-Yu Hsieh, Ben Liao, Shengyu Zhang. 22475-22490 [doi]

Safe Exploration for Efficient Policy Evaluation and ComparisonRunzhe Wan, Branislav Kveton, Rui Song 0006. 22491-22511 [doi]

Greedy based Value Representation for Optimal Coordination in Multi-agent Reinforcement LearningLipeng Wan, Zeyang Liu, Xingyu Chen, Xuguang Lan, Nanning Zheng 0001. 22512-22535 [doi]

Towards Evaluating Adaptivity of Model-Based Reinforcement Learning MethodsYi Wan, Ali Rahimi-Kalahroudi, Janarthanan Rajendran, Ida Momennejad, Sarath Chandar, Harm van Seijen. 22536-22561 [doi]

Fast Lossless Neural Compression with Integer-Only Discrete FlowsSiyu Wang, Jianfei Chen 0001, Chongxuan Li, Jun Zhu 0001, Bo Zhang 0010. 22562-22575 [doi]

Accelerating Shapley Explanation via Contributive Cooperator SelectionGuanchu Wang, Yu-Neng Chuang, Mengnan Du, Fan Yang, Quan Zhou, Pushkar Tripathi, Xuanting Cai, Xia Hu. 22576-22590 [doi]

Denoised MDPs: Learning World Models Better Than the World ItselfTongzhou Wang 0001, Simon Du, Antonio Torralba 0001, Phillip Isola, Amy Zhang, Yuandong Tian. 22591-22612 [doi]

Neural Implicit Dictionary Learning via Mixture-of-Expert TrainingPeihao Wang, Zhiwen Fan, Tianlong Chen, Zhangyang Wang. 22613-22624 [doi]

Robust Models Are More Interpretable Because Attributions Look NormalZifan Wang, Matt Fredrikson, Anupam Datta. 22625-22651 [doi]

Disentangling Disease-related Representation from Obscure for Disease PredictionChu-ran Wang, Fei Gao, Fandong Zhang, Fangwei Zhong, Yizhou Yu, Yizhou Wang 0001. 22652-22664 [doi]

Solving Stackelberg Prediction Game with Least Squares Loss via Spherically Constrained Least Squares ReformulationJiali Wang, Wen Huang, Rujun Jiang, Xudong Li, Alex L. Wang. 22665-22679 [doi]

VLMixer: Unpaired Vision-Language Pre-training via Cross-Modal CutMixTeng Wang, Wenhao Jiang, Zhichao Lu, Feng Zheng, Ran Cheng, ChengGuo Yin, Ping Luo. 22680-22690 [doi]

DynaMixer: A Vision MLP Architecture with Dynamic MixingZiyu Wang, Wenhao Jiang, Yiming Zhu, Li Yuan, Yibing Song, Wei Liu. 22691-22701 [doi]

Improving Screening Processes via Calibrated Subset SelectionLequn Wang, Thorsten Joachims, Manuel Gomez-Rodriguez. 22702-22726 [doi]

The Geometry of Robust Value FunctionsKaixin Wang, Navdeep Kumar, Kuangqi Zhou, Bryan Hooi, Jiashi Feng, Shie Mannor. 22727-22751 [doi]

What Dense Graph Do You Need for Self-Attention?Yuxin Wang, Chu-Tak Lee, Qipeng Guo, Zhangyue Yin, Yunhua Zhou, Xuanjing Huang, Xipeng Qiu. 22752-22768 [doi]

Improved Certified Defenses against Data Poisoning with (Deterministic) Finite AggregationWenxiao Wang 0002, Alexander Levine 0001, Soheil Feizi. 22769-22783 [doi]

Understanding Gradual Domain Adaptation: Improved Analysis, Optimal Path and BeyondHaoxiang Wang, Bo Li, Han Zhao 0002. 22784-22801 [doi]

Communication-Efficient Adaptive Federated LearningYujia Wang, Lu Lin, Jinghui Chen. 22802-22838 [doi]

Provable Acceleration of Heavy Ball beyond Quadratics for a Class of Polyak-Lojasiewicz Functions when the Non-Convexity is Averaged-OutJun-Kun Wang, Chi-Heng Lin, Andre Wibisono, Bin Hu. 22839-22864 [doi]

Robustness Verification for Contrastive LearningZekai Wang, Weiwei Liu 0003. 22865-22883 [doi]

Convergence and Recovery Guarantees of the K-Subspaces Method for Subspace ClusteringPeng Wang 0098, Huikang Liu, Anthony Man-Cho So, Laura Balzano. 22884-22918 [doi]

NP-Match: When Neural Processes meet Semi-Supervised LearningJianfeng Wang, Thomas Lukasiewicz, Daniela Massiceti, Xiaolin Hu, Vladimir Pavlovic, Alexandros Neophytou. 22919-22934 [doi]

Iterative Double Sketching for Faster Least-Squares OptimizationRui Wang, Yanyan Ouyang, Wangli Xu. 22935-22963 [doi]

What Language Model Architecture and Pretraining Objective Works Best for Zero-Shot Generalization?Thomas Wang, Adam Roberts, Daniel Hesslow, Teven Le Scao, Hyung Won Chung, Iz Beltagy, Julien Launay, Colin Raffel. 22964-22984 [doi]

Improving Task-free Continual Learning by Distributionally Robust Memory EvolutionZhenyi Wang, Li Shen, Le Fang, Qiuling Suo, Tiehang Duan, Mingchen Gao. 22985-22998 [doi]

Risk-Averse No-Regret Learning in Online Convex GamesZifan Wang, Yi Shen, Michael M. Zavlanos. 22999-23017 [doi]

Provable Domain Generalization via Invariant-Feature Subspace RecoveryHaoxiang Wang, Haozhe Si, Bo Li 0026, Han Zhao 0002. 23018-23033 [doi]

ProgFed: Effective, Communication, and Computation Efficient Federated Learning by Progressive TrainingHui-Po Wang, Sebastian U. Stich, Yang He 0005, Mario Fritz. 23034-23054 [doi]

Model-based Meta Reinforcement Learning using Graph Structured Surrogate Models and Amortized Policy SearchQi Wang, Herke van Hoof. 23055-23077 [doi]

Approximately Equivariant Networks for Imperfectly Symmetric DynamicsRui Wang, Robin Walters, Rose Yu. 23078-23091 [doi]

Three-stage Evolution and Fast Equilibrium for SGD with Non-degerate Critical PointsYi Wang, Zhiren Wang. 23092-23113 [doi]

Understanding Instance-Level Impact of Fairness ConstraintsJialu Wang, Xin Eric Wang, Yang Liu. 23114-23130 [doi]

Tractable Uncertainty for Structure LearningBenjie Wang, Matthew Wicker, Marta Kwiatkowska. 23131-23150 [doi]

Causal Dynamics Learning for Task-Independent State AbstractionZizhao Wang, Xuesu Xiao, Zifan Xu, Yuke Zhu, Peter Stone. 23151-23180 [doi]

Multiple-Play Stochastic Bandits with Shareable Finite-Capacity ArmsXuchuang Wang, Hong Xie 0004, John C. S. Lui. 23181-23212 [doi]

Generative Coarse-Graining of Molecular ConformationsWujie Wang, Minkai Xu, Chen Cai, Benjamin Kurt Miller, Tess E. Smidt, Yusu Wang, Jian Tang 0005, Rafael Gómez-Bombarelli. 23213-23236 [doi]

Nonparametric Embeddings of Sparse High-Order Interaction EventsZheng Wang, Yiming Xu, Conor Tillinghast, Shibo Li, Akil Narayan 0001, Shandian Zhe. 23237-23253 [doi]

When Are Linear Stochastic Bandits Attackable?Huazheng Wang, Haifeng Xu, Hongning Wang. 23254-23273 [doi]

DRAGONN: Distributed Randomized Approximate Gradients of Neural NetworksZhuang Wang, Zhaozhuo Xu, Xinyu Crystal Wu, Anshumali Shrivastava, T. S. Eugene Ng. 23274-23291 [doi]

Finite-Sum Coupled Compositional Stochastic Optimization: Theory and ApplicationsBokun Wang, Tianbao Yang. 23292-23317 [doi]

OFA: Unifying Architectures, Tasks, and Modalities Through a Simple Sequence-to-Sequence Learning FrameworkPeng Wang, an Yang, Rui Men, Junyang Lin, Shuai Bai, Zhikang Li, Jianxin Ma, Chang Zhou, Jingren Zhou, Hongxia Yang. 23318-23340 [doi]

How Powerful are Spectral Graph Neural NetworksXiyuan Wang, Muhan Zhang. 23341-23362 [doi]

Thompson Sampling for Robust Transfer in Multi-Task BanditsZhi Wang 0013, Chicheng Zhang, Kamalika Chaudhuri. 23363-23416 [doi]

Individual Reward Assisted Multi-Agent Reinforcement LearningLi Wang, Yupeng Zhang, Yujing Hu, Weixun Wang, Chongjie Zhang, Yang Gao, Jianye Hao, Tangjie Lv, Changjie Fan. 23417-23432 [doi]

Removing Batch Normalization Boosts Adversarial TrainingHaotao Wang, Aston Zhang, Shuai Zheng, Xingjian Shi, Mu Li 0003, Zhangyang Wang. 23433-23445 [doi]

Partial and Asymmetric Contrastive Learning for Out-of-Distribution Detection in Long-Tailed RecognitionHaotao Wang, Aston Zhang, Yi Zhu, Shuai Zheng, Mu Li, Alex J. Smola, Zhangyang Wang. 23446-23458 [doi]

Nonparametric Factor Trajectory Learning for Dynamic Tensor DecompositionZheng Wang, Shandian Zhe. 23459-23469 [doi]

Thompson Sampling for (Combinatorial) Pure ExplorationSiwei Wang, Jun Zhu. 23470-23483 [doi]

Policy Gradient Method For Robust Reinforcement LearningYue Wang, Shaofeng Zou. 23484-23526 [doi]

Certifying Out-of-Domain Generalization for Blackbox FunctionsMaurice Weber, Linyi Li, Boxin Wang, Zhikuan Zhao, Bo Li 0026, Ce Zhang 0001. 23527-23548 [doi]

More Than a Toy: Random Matrix Models Predict How Real-World Neural Representations GeneralizeAlexander Wei 0001, Wei Hu, Jacob Steinhardt. 23549-23588 [doi]

To Smooth or Not? When Label Smoothing Meets Noisy LabelsJiaheng Wei, Hangyu Liu, Tongliang Liu, Gang Niu 0001, Masashi Sugiyama, Yang Liu. 23589-23614 [doi]

Open-Sampling: Exploring Out-of-Distribution data for Re-balancing Long-tailed datasetsHongxin Wei, Lue Tao, Renchunzi Xie, Lei Feng, Bo An 0001. 23615-23630 [doi]

Mitigating Neural Network Overconfidence with Logit NormalizationHongxin Wei, Renchunzi Xie, Hao Cheng, Lei Feng, Bo An 0001, Yixuan Li. 23631-23644 [doi]

Koopman Q-learning: Offline Reinforcement Learning via Symmetries of DynamicsMatthias Weissenbacher, Samarth Sinha, Animesh Garg, Yoshinobu Kawahara. 23645-23667 [doi]

Fishing for User Data in Large-Batch Federated Learning via Gradient MagnificationYuxin Wen, Jonas Geiping, Liam Fowl, Micah Goldblum, Tom Goldstein. 23668-23684 [doi]

BabelTower: Learning to Auto-parallelized Program TranslationYuanbo Wen, Qi Guo 0001, Qiang Fu, Xiaqing Li, Jianxing Xu, Yanlin Tang, Yongwei Zhao, Xing Hu 0001, Zidong Du, Ling Li 0001, Chao Wang 0003, Xuehai Zhou, Yunji Chen. 23685-23700 [doi]

Random Forest Density EstimationHongwei Wen, Hanyuan Hang. 23701-23722 [doi]

Fighting Fire with Fire: Avoiding DNN Shortcuts through PrimingChuan Wen, Jianing Qian, Jierui Lin, Jiaye Teng, Dinesh Jayaraman, Yang Gao 0029. 23723-23750 [doi]

Preconditioning for Scalable Gaussian Process Hyperparameter OptimizationJonathan Wenger, Geoff Pleiss, Philipp Hennig, John P. Cunningham, Jacob R. Gardner. 23751-23780 [doi]

Measure Estimation in the Barycentric Coding ModelMattthew Werenski, Ruijie Jiang, Abiy Tasissa, Shuchin Aeron, James M. Murphy. 23781-23803 [doi]

COLA: Consistent Learning with Opponent-Learning AwarenessTimon Willi, Alistair Letcher, Johannes Treutlein, Jakob N. Foerster. 23804-23831 [doi]

Distributional Hamilton-Jacobi-Bellman Equations for Continuous-Time Reinforcement LearningHarley E. Wiltzer, David Meger, Marc G. Bellemare. 23832-23856 [doi]

Easy Variational Inference for Categorical Models via an Independent Binary ApproximationMichael T. Wojnowicz, Shuchin Aeron, Eric L. Miller 0001, Michael C. Hughes. 23857-23896 [doi]

Continual Learning with Guarantees via Weight Interval ConstraintsMaciej Wolczyk, Karol J. Piczak, Bartosz Wójcik, Lukasz Pustelnik, Pawel Morawiecki, Jacek Tabor, Tomasz Trzcinski, Przemyslaw Spurek. 23897-23911 [doi]

A Deep Learning Approach for the Segmentation of Electroencephalography Data in Eye Tracking ApplicationsLukas Wolf, Ard Kastrati, Martyna Beata Plomecka, Jie-Ming Li, Dustin Klebe, Alexander Veicht, Roger Wattenhofer, Nicolas Langer. 23912-23932 [doi]

Leverage Score Sampling for Tensor Product Matrices in Input Sparsity TimeDavid P. Woodruff, Amir Zandieh. 23933-23964 [doi]

Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference timeMitchell Wortsman, Gabriel Ilharco, Samir Ya Gadre, Rebecca Roelofs, Raphael Gontijo Lopes, Ari S. Morcos, Hongseok Namkoong, Ali Farhadi, Yair Carmon, Simon Kornblith, Ludwig Schmidt. 23965-23998 [doi]

Metric-Fair Classifier DerandomizationJimmy Wu, Yatong Chen, Yang Liu. 23999-24016 [doi]

Structural Entropy Guided Graph Hierarchical PoolingJunran Wu, Xueyuan Chen, Ke Xu 0001, Shangzhe Li. 24017-24030 [doi]

Self-supervised Models are Good Teaching Assistants for Vision TransformersHaiyan Wu, Yuting Gao, Yinqi Zhang, Shaohui Lin, Yuan Xie 0006, Xing Sun, Ke Li. 24031-24042 [doi]

Characterizing and Overcoming the Greedy Nature of Learning in Multi-modal Deep Neural NetworksNan Wu, Stanislaw Jastrzebski, KyungHyun Cho, Krzysztof J. Geras. 24043-24055 [doi]

Instrumental Variable Regression with Confounder BalancingAnpeng Wu, Kun Kuang, Bo Li 0064, Fei Wu 0001. 24056-24075 [doi]

MemSR: Training Memory-efficient Lightweight Model for Image Super-ResolutionKailu Wu, Chung-Kuei Lee, Kaisheng Ma. 24076-24092 [doi]

Delay-Adaptive Step-sizes for Asynchronous LearningXuyang Wu, Sindri Magnússon, Hamid Reza Feyzmahdavian, Mikael Johansson 0001. 24093-24113 [doi]

Variational nearest neighbor Gaussian processLuhuan Wu, Geoff Pleiss, John P. Cunningham. 24114-24130 [doi]

Understanding Policy Gradient Algorithms: A Sensitivity-Based ApproachShuang Wu 0005, Ling Shi, Jun Wang, Guangjian Tian. 24131-24149 [doi]

DAVINZ: Data Valuation using Deep Neural Networks at InitializationZhaoxuan Wu, Yao Shu, Bryan Kian Hsiang Low. 24150-24176 [doi]

Robust Deep Reinforcement Learning through Bootstrapped Opportunistic CurriculumJunlin Wu 0001, Yevgeniy Vorobeychik. 24177-24211 [doi]

Revisiting Consistency Regularization for Deep Partial Label LearningDong-Dong Wu, Deng-Bao Wang, Min-Ling Zhang. 24212-24225 [doi]

Flowformer: Linearizing Transformers with Conservation FlowsHaixu Wu, Jialong Wu, Jiehui Xu, Jianmin Wang, Mingsheng Long. 24226-24242 [doi]

Nearly Optimal Policy Optimization with Stable at Any Time GuaranteeTianhao Wu, Yunchang Yang, Han Zhong, Liwei Wang 0001, Simon S. Du, Jiantao Jiao. 24243-24265 [doi]

RetrievalGuard: Provably Robust 1-Nearest Neighbor Image RetrievalYihan Wu, Hongyang Zhang, Heng Huang. 24266-24279 [doi]

Last Iterate Risk Bounds of SGD with Decaying Stepsize for Overparameterized Linear RegressionJingfeng Wu, Difan Zou, Vladimir Braverman, Quanquan Gu, Sham M. Kakade. 24280-24314 [doi]

Optimal Clustering with Noisy Queries via Multi-Armed BanditJinghui Xia, Zengfeng Huang. 24315-24331 [doi]

ProGCL: Rethinking Hard Negative Mining in Graph Contrastive LearningJun Xia, Lirong Wu, Ge Wang, Jintao Chen, Stan Z. Li. 24332-24346 [doi]

Synergy and Symmetry in Deep Learning: Interactions between the Data, Model, and Inference AlgorithmLechao Xiao, Jeffrey Pennington. 24347-24369 [doi]

Identification of Linear Non-Gaussian Latent Hierarchical StructureFeng Xie 0002, Biwei Huang, Zhengming Chen, Yangbo He, Zhi Geng, Kun Zhang 0001. 24370-24387 [doi]

COAT: Measuring Object Compositionality in Emergent RepresentationsSirui Xie, Ari S. Morcos, Song Chun Zhu, Ramakrishna Vedantam. 24388-24413 [doi]

Robust Policy Learning over Multiple Uncertainty SetsAnnie Xie, Shagun Sodhani, Chelsea Finn, Joelle Pineau, Amy Zhang 0001. 24414-24429 [doi]

Adaptive Inertia: Disentangling the Effects of Adaptive Learning Rate and MomentumZeke Xie, Xinrui Wang, Huishuai Zhang, Issei Sato, Masashi Sugiyama. 24430-24459 [doi]

Self-Supervised Representation Learning via Latent Graph PredictionYaochen Xie, Zhao Xu, Shuiwang Ji. 24460-24477 [doi]

Efficient Computation of Higher-Order Subgraph Attribution via Message PassingPing Xiong, Thomas Schnake, Grégoire Montavon, Klaus-Robert Müller, Shinichi Nakajima. 24478-24495 [doi]

A Self-Play Posterior Sampling Algorithm for Zero-Sum Markov GamesWei Xiong, Han Zhong, Chengshuai Shi, Cong Shen, Tong Zhang. 24496-24523 [doi]

Importance Weighted Kernel Bayes' RuleLiyuan Xu, Yutian Chen, Arnaud Doucet, Arthur Gretton. 24524-24538 [doi]

Learning to Separate Voices by Spatial RegionsAlan Xu, Romit Roy Choudhury. 24539-24549 [doi]

Detached Error Feedback for Distributed SGD with Random Sparsificationan Xu, Heng Huang. 24550-24575 [doi]

Accurate Quantization of Measures via Interacting Particle-based OptimizationLantian Xu, Anna Korba, Dejan Slepcev. 24576-24595 [doi]

Unified Fourier-based Kernel and Nonlinearity Design for Equivariant Networks on Homogeneous SpacesYinshuang Xu, Jiahui Lei, Edgar Dobriban, Kostas Daniilidis. 24596-24614 [doi]

Inferring Cause and Effect in the Presence of Heteroscedastic NoiseSascha Xu, Osman Ali Mian, Alexander Marx, Jilles Vreeken. 24615-24630 [doi]

Prompting Decision Transformer for Few-Shot Policy GeneralizationMengdi Xu, Yikang Shen, Shun Zhang, Yuchen Lu, Ding Zhao, Joshua B. Tenenbaum, Chuang Gan. 24631-24645 [doi]

Analyzing and Mitigating Interference in Neural Architecture SearchJin Xu, Xu Tan 0003, Kaitao Song, Renqian Luo, Yichong Leng, Tao Qin, Tie-Yan Liu, Jian Li. 24646-24662 [doi]

On the Statistical Benefits of Curriculum LearningZiping Xu, Ambuj Tewari. 24663-24682 [doi]

A Difference Standardization Method for Mutual Transfer LearningHaoqing Xu, Meng Wang, Beilun Wang. 24683-24697 [doi]

SkexGen: Autoregressive Generation of CAD Construction Sequences with Disentangled CodebooksXiang Xu, Karl D. D. Willis, Joseph G. Lambourne, Chin-Yi Cheng, Pradeep Kumar Jayaraman, Yasutaka Furukawa. 24698-24724 [doi]

Discriminator-Weighted Offline Imitation Learning from Suboptimal DemonstrationsHaoran Xu, Xianyuan Zhan, Honglei Yin, Huiling Qin. 24725-24742 [doi]

Adversarial Attack and Defense for Non-Parametric Two-Sample TestsXilie Xu, Jingfeng Zhang, Feng Liu, Masashi Sugiyama, Mohan S. Kankanhalli. 24743-24769 [doi]

Adversarially Robust Models may not Transfer Better: Sufficient Conditions for Domain Transferability from the View of RegularizationXiaojun Xu, Jacky Y. Zhang, Evelyn Ma, Hyun Ho Son, Sanmi Koyejo, Bo Li. 24770-24802 [doi]

A Theoretical Analysis on Independence-driven Importance Weighting for Covariate-shift GeneralizationRenzhe Xu, Xingxuan Zhang, Zheyan Shen, Tong Zhang, Peng Cui 0001. 24803-24829 [doi]

Langevin Monte Carlo for Contextual BanditsPan Xu 0002, Hongkai Zheng, Eric V. Mazumdar, Kamyar Azizzadenesheli, Animashree Anandkumar. 24830-24850 [doi]

Investigating Why Contrastive Learning Benefits Robustness against Label NoiseYihao Xue, Kyle Whitecross, Baharan Mirzasoleiman. 24851-24871 [doi]

Diversified Adversarial Attacks based on Conjugate Gradient MethodKeiichiro Yamamura, Haruki Sato, Nariaki Tateiwa, Nozomi Hata, Toru Mitsutake, Issa Oe, Hiroki Ishikura, Katsuki Fujisawa. 24872-24894 [doi]

Cycle Representation Learning for Inductive Relation PredictionZuoYu Yan, Tengfei Ma, Liangcai Gao, Zhi Tang, Chao Chen 0012. 24895-24910 [doi]

Optimally Controllable Perceptual Lossy CompressionZeyu Yan, Fei Wen, Peilin Liu. 24911-24928 [doi]

Active fairness auditingTom Yan, Chicheng Zhang. 24929-24962 [doi]

Self-Organized Polynomial-Time Coordination GraphsQianlan Yang, Weijun Dong, Zhizhou Ren, Jianhao Wang, Tonghan Wang 0001, Chongjie Zhang. 24963-24979 [doi]

Regularizing a Model-based Policy Stationary Distribution to Stabilize Offline Reinforcement LearningShentao Yang, Yihao Feng, Shujian Zhang, Mingyuan Zhou. 24980-25006 [doi]

A Psychological Theory of ExplainabilityScott Cheng-Hsin Yang, Tomas Folke, Patrick Shafto. 25007-25021 [doi]

Omni-Granular Ego-Semantic Propagation for Self-Supervised Graph Representation LearningLing Yang, Shenda Hong. 25022-25037 [doi]

Unsupervised Time-Series Representation Learning with Iterative Bilinear Temporal-Spectral FusionLing Yang, Shenda Hong. 25038-25054 [doi]

Searching for BurgerFormer with Micro-Meso-Macro Space DesignLongxing Yang, Yu Hu 0001, Shun Lu, Zihao Sun, Jilin Mei, Yinhe Han, Xiaowei Li. 25055-25069 [doi]

Efficient Variance Reduction for Meta-learningHansi Yang, James T. Kwok. 25070-25095 [doi]

Injecting Logical Constraints into Neural Networks via Straight-Through EstimatorsZhun Yang, Joohyung Lee 0002, Chiyoun Park. 25096-25122 [doi]

Locally Sparse Neural Networks for Tabular Biomedical DataJunchen Yang, Ofir Lindenbaum, Yuval Kluger. 25123-25153 [doi]

Not All Poisons are Created Equal: Robust Training against Data PoisoningYu Yang, Tian-Yu Liu, Baharan Mirzasoleiman. 25154-25165 [doi]

Does the Data Induce Capacity Control in Deep Learning?Rubing Yang, Jialin Mao, Pratik Chaudhari. 25166-25197 [doi]

Informed Learning by Wide Neural Networks: Convergence, Generalization and Sampling ComplexityJianyi Yang, Shaolei Ren. 25198-25240 [doi]

Linear Bandit Algorithms with Sublinear Time ComplexityShuo Yang, Tongzheng Ren, Sanjay Shakkottai, Eric Price 0001, Inderjit S. Dhillon, Sujay Sanghavi. 25241-25260 [doi]

A New Perspective on the Effects of Spectrum in Graph Neural NetworksMingqi Yang, Yanming Shen, Rui Li, Heng Qi, Qiang Zhang, Baocai Yin. 25261-25279 [doi]

Fourier Learning with Cyclical DataYingxiang Yang, Zhihan Xiong, Tianyi Liu, Taiqing Wang, Chong Wang. 25280-25301 [doi]

Estimating Instance-dependent Bayes-label Transition Matrix using a Deep Neural NetworkShuo Yang, Erkun Yang, Bo Han, Yang Liu 0018, Min Xu, Gang Niu 0001, Tongliang Liu. 25302-25312 [doi]

A Study of Face Obfuscation in ImageNetKaiyu Yang, Jacqueline H. Yau, Li Fei-Fei 0001, Jia Deng 0001, Olga Russakovsky. 25313-25330 [doi]

Anarchic Federated LearningHaibo Yang, Xin Zhang, Prashant Khanduri, Jia Liu 0002. 25331-25363 [doi]

Identity-Disentangled Adversarial Augmentation for Self-supervised LearningKaiwen Yang, Tianyi Zhou, Xinmei Tian 0001, Dacheng Tao. 25364-25381 [doi]

Learning from a Learning User for Optimal RecommendationsFan Yao, Chuanhao Li, Denis Nekipelov, Hongning Wang, Haifeng Xu. 25382-25406 [doi]

Improving Out-of-Distribution Robustness via Selective AugmentationHuaxiu Yao, Yu Wang 0002, Sai Li, Linjun Zhang, Weixin Liang, James Zou 0001, Chelsea Finn. 25407-25437 [doi]

NLP From Scratch Without Large-Scale Pretraining: A Simple and Efficient FrameworkXingcheng Yao, Yanan Zheng, Xiaocong Yang, Zhilin Yang. 25438-25451 [doi]

Feature Space Particle Inference for Neural Network EnsemblesShingo Yashima, Teppei Suzuki, Kohta Ishikawa, Ikuro Sato, Rei Kawakami. 25452-25468 [doi]

Centroid Approximation for Bootstrap: Improving Particle Quality at InferenceMao Ye, Qiang Liu 0001. 25469-25489 [doi]

Be Like Water: Adaptive Floating Point for Machine LearningThomas Yeh, Max Sterner, Zerlina Lai, Brandon Chuang, Alexander Ihler. 25490-25500 [doi]

QSFL: A Two-Level Uplink Communication Optimization Framework for Federated LearningLiping Yi, Gang Wang 0001, Xiaoguang Liu 0001. 25501-25513 [doi]

De novo mass spectrometry peptide sequencing with a transformer modelMelih Yilmaz, William Fondrie, Wout Bittremieux, Sewoong Oh, William S. Noble. 25514-25522 [doi]

Bayesian Nonparametric Learning for Point Processes with Spatial Homogeneity: A Spatial Analysis of NBA Shot LocationsFan Yin, Jieying Jiao, Jun Yan, Guanyu Hu. 25523-25551 [doi]

Bitwidth Heterogeneous Federated Learning with Progressive Weight DequantizationJaehong Yoon, Geon Park, Wonyong Jeong, Sung Ju Hwang. 25552-25565 [doi]

ShiftAddNAS: Hardware-Inspired Search for More Accurate and Efficient Neural NetworksHaoran You, Baopu Li, Huihong Shi, Yonggan Fu, Yingyan Lin. 25566-25580 [doi]

Molecular Representation Learning via Heterogeneous Motif Graph Neural NetworksZhaoning Yu, Hongyang Gao. 25581-25594 [doi]

Understanding Robust Overfitting of Adversarial Training and BeyondChaojian Yu, Bo Han 0003, Li Shen, Jun Yu, Chen Gong 0002, Mingming Gong, Tongliang Liu. 25595-25610 [doi]

How to Leverage Unlabeled Data in Offline Reinforcement LearningTianhe Yu, Aviral Kumar, Yevgen Chebotar, Karol Hausman, Chelsea Finn, Sergey Levine. 25611-25635 [doi]

Reachability Constrained Reinforcement LearningDongjie Yu, Haitong Ma, Sheng-bo Li 0001, Jianyu Chen. 25636-25655 [doi]

Topology-Aware Network Pruning using Multi-stage Graph Embedding and Reinforcement LearningSixing Yu, Arya Mazaheri, Ali Jannesari 0001. 25656-25667 [doi]

The Combinatorial Brain Surgeon: Pruning Weights That Cancel One Another in Neural NetworksXin Yu 0003, Thiago Serra, Srikumar Ramalingam, Shandian Zhe. 25668-25683 [doi]

GraphFM: Improving Large-Scale GNN Training via Feature MomentumHaiyang Yu, Limei Wang, Bokun Wang, Meng Liu, Tianbao Yang, Shuiwang Ji. 25684-25701 [doi]

Latent Diffusion Energy-Based Model for Interpretable Text ModellingPeiyu Yu, Sirui Xie, Xiaojian Ma, Baoxiong Jia, Bo Pang, RuiQi Gao, Yixin Zhu, Song Chun Zhu, Ying Nian Wu. 25702-25720 [doi]

Predicting Out-of-Distribution Error with the Projection NormYaodong Yu, Zitong Yang, Alexander Wei 0001, Yi Ma 0001, Jacob Steinhardt. 25721-25746 [doi]

Robust Task Representations for Offline Meta-Reinforcement Learning via Contrastive LearningHaoqi Yuan, Zongqing Lu. 25747-25759 [doi]

Provable Stochastic Optimization for Global Contrastive Learning: Small Batch Does Not Harm PerformanceZhuoning Yuan, Yuexin Wu, Zi-Hao Qiu, Xianzhi Du, Lijun Zhang, Denny Zhou, Tianbao Yang. 25760-25782 [doi]

Neural Tangent Kernel Empowered Federated LearningKai Yue, Richeng Jin, Ryan Pilgrim, Chau-Wai Wong, Dror Baron, Huaiyu Dai. 25783-25803 [doi]

Time Is MattEr: Temporal Self-supervision for Video TransformersSukmin Yun, Jaehyung Kim, Dongyoon Han, Hwanjun Song, Jung-Woo Ha 0001, Jinwoo Shin. 25804-25816 [doi]

Pure Noise to the Rescue of Insufficient Data: Improving Imbalanced Classification by Training on Random Noise ImagesShiran Zada, Itay Benou, Michal Irani. 25817-25833 [doi]

Adaptive Conformal Predictions for Time SeriesMargaux Zaffran, Olivier Féron, Yannig Goude, Julie Josse, Aymeric Dieuleveut. 25834-25866 [doi]

Actor-Critic based Improper Reinforcement LearningMohammadi Zaki, Avi Mohan, Aditya Gopalan, Shie Mannor. 25867-25919 [doi]

Stabilizing Q-learning with Linear Architectures for Provable Efficient LearningAndrea Zanette, Martin J. Wainwright. 25920-25954 [doi]

Multi Resolution Analysis (MRA) for Approximate Self-AttentionZhanpeng Zeng, Sourav Pal, Jeffery Kline, Glenn Moo Fung, Vikas Singh. 25955-25972 [doi]

Efficient PAC Learning from the Crowd with Pairwise ComparisonsShiwei Zeng, Jie Shen 0005. 25973-25993 [doi]

Multi-Grained Vision Language Pre-Training: Aligning Texts with Visual ConceptsYan Zeng, Xinsong Zhang, Hang Li. 25994-26009 [doi]

Position Prediction as an Effective Pretraining StrategyShuangfei Zhai, Navdeep Jaitly, Jason Ramapuram, Dan Busbridge, Tatiana Likhomanenko, Joseph Y. Cheng, Walter Talbott, Chen Huang, Hanlin Goh, Joshua M. Susskind. 26010-26027 [doi]

Anytime Information Cascade Popularity Prediction via Self-Exciting ProcessesXi Zhang, Akshay Aravamudan, Georgios C. Anagnostopoulos. 26028-26047 [doi]

Understanding Clipping for Federated Learning: Convergence and Client-Level Differential PrivacyXinwei Zhang, Xiangyi Chen, Mingyi Hong, Steven Wu 0001, Jinfeng Yi. 26048-26067 [doi]

Collaboration of Experts: Achieving 80% Top-1 Accuracy on ImageNet with 100M FLOPsYikang Zhang, Zhuo Chen, Zhao Zhong. 26068-26084 [doi]

PDE-Based Optimal Strategy for Unconstrained Online LearningZhiyu Zhang 0003, Ashok Cutkosky, Ioannis Ch. Paschalidis. 26085-26115 [doi]

Stochastic Continuous Submodular Maximization: Boosting via Non-oblivious FunctionQixin Zhang, Zengde Deng, Zaiyi Chen, Haoyuan Hu, Yu Yang 0001. 26116-26134 [doi]

When and How Mixup Improves CalibrationLinjun Zhang, Zhun Deng, Kenji Kawaguchi, James Zou 0001. 26135-26160 [doi]

UAST: Uncertainty-Aware Siamese TrackingDawei Zhang 0002, Yanwei Fu, Zhonglong Zheng. 26161-26175 [doi]

Examining Scaling and Transfer of Language Model Architectures for Machine TranslationBiao Zhang, Behrooz Ghorbani, Ankur Bapna, Yong Cheng, Xavier Garcia, Jonathan Shen, Orhan Firat. 26176-26192 [doi]

Revisiting End-to-End Speech-to-Text Translation From ScratchBiao Zhang, Barry Haddow, Rico Sennrich. 26193-26205 [doi]

A Stochastic Multi-Rate Control Framework For Modeling Distributed Optimization AlgorithmsXinwei Zhang, Mingyi Hong, Sairaj V. Dhople, Nicola Elia. 26206-26222 [doi]

GALAXY: Graph-based Active Learning at the ExtremeJifan Zhang, Julian Katz-Samuels, Robert D. Nowak. 26223-26238 [doi]

Fairness Interventions as (Dis)Incentives for Strategic ManipulationXueru Zhang, Mohammad Mahdi Khalili, Kun Jin, Parinaz Naghizadeh, Mingyan Liu. 26239-26264 [doi]

Role-based Multiplex Network EmbeddingHegui Zhang, Gang Kou. 26265-26280 [doi]

Dynamic Topic Models for Temporal Document NetworksDelvin Ce Zhang, Hady W. Lauw. 26281-26292 [doi]

Personalized Federated Learning via Variational Bayesian InferenceXu Zhang, Yinchuan Li, Wenpeng Li, Kaiyang Guo, Yunfeng Shao. 26293-26310 [doi]

Federated Learning with Label Distribution Skew via Logits CalibrationJie Zhang, Zhiqi Li, Bo Li, Jianghe Xu, Shuang Wu 0001, Shouhong Ding, Chao Wu. 26311-26329 [doi]

Neural Network Weights Do Not Converge to Stationary Points: An Invariant Measure PerspectiveJingzhao Zhang, Haochuan Li, Suvrit Sra, Ali Jadbabaie. 26330-26346 [doi]

Beyond Worst-Case Analysis in Stochastic Approximation: Moment Estimation Improves Instance ComplexityJingzhao Zhang, Hongzhou Lin, Subhro Das, Suvrit Sra, Ali Jadbabaie. 26347-26361 [doi]

Deep and Flexible Graph Neural Architecture SearchWentao Zhang, Zheyu Lin, Yu Shen, Yang Li, Zhi Yang 0001, Bin Cui 0001. 26362-26374 [doi]

A Langevin-like Sampler for Discrete DistributionsRuqi Zhang, Xingchao Liu, Qiang Liu. 26375-26396 [doi]

Rich Feature Construction for the Optimization-Generalization DilemmaJianyu Zhang, David Lopez-Paz, Léon Bottou. 26397-26411 [doi]

Generative Flow Networks for Discrete Probabilistic ModelingDinghuai Zhang, Nikolay Malkin, Zhen Liu, Alexandra Volokhova, Aaron C. Courville, Yoshua Bengio. 26412-26428 [doi]

Neurotoxin: Durable Backdoors in Federated LearningZhengming Zhang, Ashwinee Panda, Linyue Song, Yaoqing Yang, Michael W. Mahoney, Prateek Mittal, Kannan Ramchandran, Joseph Gonzalez 0001. 26429-26446 [doi]

Making Linear MDPs Practical via Contrastive Representation LearningTianjun Zhang, Tongzheng Ren, Mengjiao Yang, Joseph Gonzalez 0001, Dale Schuurmans, Bo Dai. 26447-26466 [doi]

NAFS: A Simple yet Tough-to-beat Baseline for Graph Representation LearningWentao Zhang, Zeang Sheng, Mingyu Yang, Yang Li, Yu Shen, Zhi Yang, Bin Cui 0001. 26467-26483 [doi]

Correct-N-Contrast: a Contrastive Approach for Improving Robustness to Spurious CorrelationsMichael Zhang, Nimit Sharad Sohoni, Hongyang R. Zhang, Chelsea Finn, Christopher Ré. 26484-26516 [doi]

Efficient Reinforcement Learning in Block MDPs: A Model-free Representation Learning approachXuezhou Zhang, Yuda Song, Masatoshi Uehara, Mengdi Wang, Alekh Agarwal, Wen Sun. 26517-26547 [doi]

Partial Counterfactual Identification from Observational and Experimental DataJunzhe Zhang, Jin Tian 0001, Elias Bareinboim. 26548-26558 [doi]

Set Norm and Equivariant Skip Connections: Putting the Deep in Deep SetsLily H. Zhang, Veronica Tozzo, John M. Higgins, Rajesh Ranganath. 26559-26574 [doi]

Learning to Estimate and Refine Fluid Motion with Physical DynamicsMingrui Zhang, Jianhong Wang, James B. Tlhomole, Matthew D. Piggott. 26575-26590 [doi]

A Branch and Bound Framework for Stronger Adversarial Attacks of ReLU NetworksHuan Zhang, Shiqi Wang 0002, Kaidi Xu, Yihan Wang, Suman Jana, Cho-Jui Hsieh, J. Zico Kolter. 26591-26604 [doi]

A Simple yet Universal Strategy for Online Convex OptimizationLijun Zhang, Guanghui Wang 0006, Jinfeng Yi, Tianbao Yang. 26605-26623 [doi]

Low-Precision Stochastic Gradient Langevin DynamicsRuqi Zhang, Andrew Gordon Wilson, Christopher De Sa. 26624-26644 [doi]

Expression might be enough: representing pressure and demand for reinforcement learning based traffic signal controlLiang Zhang, Qiang Wu, Jun Shen, Linyuan Lü, Bo Du, Jianqing Wu. 26645-26654 [doi]

Uncertainty Modeling in Generative Compressed SensingYilang Zhang, Mengchu Xu, Xiaojun Mao, Jian Wang. 26655-26668 [doi]

Building Robust Ensembles via Margin BoostingDinghuai Zhang, Hongyang Zhang, Aaron C. Courville, Yoshua Bengio, Pradeep Ravikumar, Arun Sai Suggala. 26669-26692 [doi]

Revisiting and Advancing Fast Adversarial Training Through The Lens of Bi-Level OptimizationYihua Zhang, Guanhua Zhang, Prashant Khanduri, Mingyi Hong, Shiyu Chang, Sijia Liu 0001. 26693-26712 [doi]

Off-Policy Fitted Q-Evaluation with Differentiable Function Approximators: Z-Estimation and Inference TheoryRuiqi Zhang, Xuezhou Zhang, Chengzhuo Ni, Mengdi Wang. 26713-26749 [doi]

ROCK: Causal Inference Principles for Reasoning about Commonsense CausalityJiayao Zhang 0001, Hongming Zhang, Weijie J. Su, Dan Roth. 26750-26771 [doi]

No-Regret Learning in Time-Varying Zero-Sum GamesMengxiao Zhang, Peng Zhao 0006, Haipeng Luo, Zhi-Hua Zhou. 26772-26808 [doi]

PLATON: Pruning Large Transformer Models with Upper Confidence Bound of Weight ImportanceQingru Zhang, Simiao Zuo, Chen Liang, Alexander Bukharin, Pengcheng He, Weizhu Chen, Tuo Zhao. 26809-26823 [doi]

NysADMM: faster composite convex optimization via low-rank approximationShipu Zhao, Zachary Frangella, Madeleine Udell. 26824-26840 [doi]

Toward Compositional Generalization in Object-Oriented World ModelingLinfeng Zhao, Lingzhi Kong, Robin Walters, Lawson L. S. Wong. 26841-26864 [doi]

Dynamic Regret of Online Markov Decision ProcessesPeng Zhao 0006, Longfei Li, Zhi-Hua Zhou. 26865-26894 [doi]

Learning to Solve PDE-constrained Inverse Problems with Graph NetworksQingqing Zhao, David B. Lindell, Gordon Wetzstein. 26895-26910 [doi]

Learning from Counterfactual Links for Link PredictionTong Zhao, Gang Liu, Daheng Wang, Wenhao Yu 0002, Meng Jiang 0001. 26911-26926 [doi]

Global Optimization NetworksSen Zhao, Erez Louidor, Maya R. Gupta. 26927-26957 [doi]

Certified Robustness Against Natural Language Attacks by Causal InterventionHaiteng Zhao, Chang Ma, Xinshuai Dong, Anh Tuan Luu, Zhi-Hong Deng, Hanwang Zhang. 26958-26970 [doi]

Efficient Learning for AlphaZero via Path ConsistencyDengwei Zhao, Shikui Tu, Lei Xu 0001. 26971-26981 [doi]

Penalizing Gradient Norm for Efficiently Improving Generalization in Deep LearningYang Zhao, Hao Zhang, Xiuyuan Hu. 26982-26992 [doi]

Ripple Attention for Visual Perception with Sub-quadratic ComplexityLin Zheng, Huijie Pan, Lingpeng Kong. 26993-27010 [doi]

Linear Complexity Randomized Self-attention MechanismLin Zheng, Chong Wang, Lingpeng Kong. 27011-27041 [doi]

Online Decision TransformerQinqing Zheng, Amy Zhang, Aditya Grover. 27042-27059 [doi]

Learning Efficient and Robust Ordinary Differential Equations via Invertible Neural NetworksWeiming Zhi, Tin Lai, Lionel Ott, Edwin V. Bonilla, Fabio Ramos. 27060-27074 [doi]

HyperTransformer: Model Generation for Supervised and Semi-Supervised Few-Shot LearningAndrey Zhmoginov, Mark Sandler 0002, Maksym Vladymyrov. 27075-27098 [doi]

Describing Differences between Text Distributions with Natural LanguageRuiqi Zhong, Charlie Snell, Dan Klein, Jacob Steinhardt. 27099-27116 [doi]

Pessimistic Minimax Value Iteration: Provably Efficient Equilibrium Learning from Offline DatasetsHan Zhong, Wei Xiong, Jiyuan Tan, Liwei Wang, Tong Zhang, Zhaoran Wang, Zhuoran Yang. 27117-27142 [doi]

Dimension-free Complexity Bounds for High-order Nonconvex Finite-sum OptimizationDongruo Zhou, Quanquan Gu. 27143-27158 [doi]

A Hierarchical Bayesian Approach to Inverse Reinforcement Learning with Symbolic Reward MachinesWeichao Zhou, Wenchao Li. 27159-27178 [doi]

On the Optimization Landscape of Neural Collapse under MSE Loss: Global Optimality with Unconstrained FeaturesJinxin Zhou, Xiao Li, Tianyu Ding, Chong You, Qing Qu 0001, Zhihui Zhu. 27179-27202 [doi]

Model Agnostic Sample Reweighting for Out-of-Distribution LearningXiao Zhou, Yong Lin, Renjie Pi, Weizhong Zhang, Renzhe Xu, Peng Cui, Tong Zhang. 27203-27221 [doi]

Sparse Invariant Risk MinimizationXiao Zhou, Yong Lin, Weizhong Zhang, Tong Zhang. 27222-27244 [doi]

Prototype-Anchored Learning for Learning with Imperfect AnnotationsXiong Zhou, Xianming Liu, Deming Zhai, Junjun Jiang, Xin Gao, Xiangyang Ji. 27245-27267 [doi]

FEDformer: Frequency Enhanced Decomposed Transformer for Long-term Series ForecastingTian Zhou, Ziqing Ma, Qingsong Wen, Xue Wang, Liang Sun 0001, Rong Jin 0001. 27268-27286 [doi]

Probabilistic Bilevel Coreset SelectionXiao Zhou, Renjie Pi, Weizhong Zhang, Yong Lin, Zonghao Chen, Tong Zhang. 27287-27302 [doi]

Approximate Frank-Wolfe Algorithms over Graph-structured Support SetsBaojian Zhou, Yifan Sun. 27303-27337 [doi]

Improving Adversarial Robustness via Mutual Information EstimationDawei Zhou, Nannan Wang 0001, Xinbo Gao 0001, Bo Han 0003, Xiaoyu Wang, Yibing Zhan, Tongliang Liu. 27338-27352 [doi]

Modeling Adversarial Noise for Adversarial TrainingDawei Zhou, Nannan Wang, Bo Han, Tongliang Liu. 27353-27366 [doi]

Contrastive Learning with Boosted MemorizationZhihan Zhou, Jiangchao Yao, Yan-Feng Wang, Bo Han, Ya Zhang. 27367-27377 [doi]

Understanding The Robustness in Vision TransformersDaquan Zhou, Zhiding Yu, Enze Xie, Chaowei Xiao, Animashree Anandkumar, Jiashi Feng, Jose M. Alvarez. 27378-27394 [doi]

VLUE: A Multi-Task Multi-Dimension Benchmark for Evaluating Vision-Language Pre-trainingWangchunshu Zhou, Yan Zeng 0003, Shizhe Diao, Xinsong Zhang. 27395-27411 [doi]

Detecting Corrupted Labels Without Training a Model to PredictZhaowei Zhu, Zihao Dong, Yang Liu. 27412-27427 [doi]

Contextual Bandits with Large Action Spaces: Made PracticalYinglun Zhu, Dylan J. Foster, John Langford 0001, Paul Mineiro. 27428-27453 [doi]

Neural-Symbolic Models for Logical Queries on Knowledge GraphsZhaocheng Zhu, Mikhail Galkin 0002, Zuobai Zhang, Jian Tang 0005. 27454-27478 [doi]

Topology-aware Generalization of Decentralized SGDTongtian Zhu, Fengxiang He, Lan Zhang, Zhengyang Niu, Mingli Song, Dacheng Tao. 27479-27503 [doi]

Resilient and Communication Efficient Learning for Heterogeneous Federated SystemsZhuangdi Zhu, Junyuan Hong, Steve Drew, Jiayu Zhou. 27504-27526 [doi]

On Numerical Integration in Neural Ordinary Differential EquationsAiqing Zhu, Pengzhan Jin, Beibei Zhu, Yifa Tang. 27527-27547 [doi]

When AUC meets DRO: Optimizing Partial AUC for Deep Learning with Non-Convex Convergence GuaranteeDixian Zhu, Gang Li, Bokun Wang, Xiaodong Wu, Tianbao Yang. 27548-27573 [doi]

Contextual Bandits with Smooth Regret: Efficient Learning in Continuous Action SpacesYinglun Zhu, Paul Mineiro. 27574-27590 [doi]

Residual-Based Sampling for Online Outlier-Robust PCATianhao Zhu, Jie Shen. 27591-27611 [doi]

Region-Based Semantic Factorization in GANsJiapeng Zhu, Yujun Shen, Yinghao Xu, Deli Zhao, Qifeng Chen. 27612-27632 [doi]

Beyond Images: Label Noise Transition Matrix Estimation for Tasks with Lower-Quality FeaturesZhaowei Zhu, Jialu Wang, Yang Liu. 27633-27653 [doi]

Towards Uniformly Superhuman Autonomy via Subdominance MinimizationBrian D. Ziebart, Sanjiban Choudhury, Xinyan Yan, Paul Vernaza. 27654-27670 [doi]

Inductive Matrix Completion: No Bad Local Minima and a Fast AlgorithmPini Zilber, Boaz Nadler. 27671-27692 [doi]

Counterfactual Prediction for Outcome-Oriented TreatmentsHao Zou, Bo Li, Jiangang Han, Shuiping Chen, Xuetao Ding, Peng Cui. 27693-27706 [doi]

SpaceMAP: Visualizing High-Dimensional Data by Space ExpansionXinrui Zu, Qian Tao. 27707-27723 [doi]

External Links

Cite Key

Statistics

PDF

Researchr

International Conference on Machine Learning, ICML 2022, 17-23 July 2022, Baltimore, Maryland, USA

Abstract

Table of Contents