Advances in Neural Information Processing Systems 34: Annual Conference on Neural Information Processing Systems 2021, NeurIPS 2021, December 6-14, 2021, virtual - researchr publication

researchr

You are not signed in
Sign in
Sign up

Marc'Aurelio Ranzato, Alina Beygelzimer, Yann N. Dauphin, Percy Liang, Jennifer Wortman Vaughan, editors, Advances in Neural Information Processing Systems 34: Annual Conference on Neural Information Processing Systems 2021, NeurIPS 2021, December 6-14, 2021, virtual. 2021. [doi]

Conference: nips2021

Abstract is missing.

Beyond Value-Function Gaps: Improved Instance-Dependent Regret Bounds for Episodic Reinforcement LearningChristoph Dann, Teodor Vanislavov Marinov, Mehryar Mohri, Julian Zimmert. 1-12 [doi]

Learning One Representation to Optimize All RewardsAhmed Touati, Yann Ollivier. 13-23 [doi]

Matrix factorisation and the interpretation of geodesic distanceNick Whiteley, Annie Gray, Patrick Rubin-Delanchy. 24-38 [doi]

UniDoc: Unified Pretraining Framework for Document UnderstandingJiuxiang Gu, Jason Kuen, Vlad I. Morariu, Handong Zhao, Rajiv Jain, Nikolaos Barmpalios, Ani Nenkova, Tong Sun. 39-50 [doi]

Finding Discriminative Filters for Specific Degradations in Blind Super-ResolutionLiangbin Xie, Xintao Wang, Chao Dong, Zhongang Qi, Ying Shan. 51-61 [doi]

Counterfactual Explanations Can Be ManipulatedDylan Slack, Anna Hilgard, Himabindu Lakkaraju, Sameer Singh 0001. 62-75 [doi]

From Canonical Correlation Analysis to Self-supervised Graph Neural NetworksHengrui Zhang, Qitian Wu, Junchi Yan, David Wipf, Philip S. Yu. 76-89 [doi]

BAST: Bayesian Additive Regression Spanning Trees for Complex Constrained DomainZhao Tang Luo, Huiyan Sang, Bani K. Mallick. 90-102 [doi]

Hyperbolic Busemann Learning with Ideal PrototypesMina Ghadimi Atigh, Martin Keller-Ressel, Pascal Mettes. 103-115 [doi]

Backward-Compatible Prediction Updates: A Probabilistic ApproachFrederik Träuble, Julius von Kügelgen, Matthäus Kleindessner, Francesco Locatello, Bernhard Schölkopf, Peter V. Gehler. 116-128 [doi]

Truncated Marginal Neural Ratio EstimationBenjamin Kurt Miller, Alex Cole, Patrick Forré, Gilles Louppe, Christoph Weniger. 129-143 [doi]

ReAct: Out-of-distribution Detection With Rectified ActivationsYiyou Sun, Chuan Guo, Yixuan Li. 144-157 [doi]

Non-local Latent Relation Distillation for Self-Adaptive 3D Human Pose EstimationJogendra Nath Kundu, Siddharth Seth, Anirudh Jamkhandi, Pradyumna YM, Varun Jampani, Anirban Chakraborty, Venkatesh Babu R.. 158-171 [doi]

Fast Training of Neural Lumigraph Representations using Meta LearningAlexander W. Bergman, Petr Kellnhofer, Gordon Wetzstein. 172-186 [doi]

Analytical Study of Momentum-Based Acceleration Methods in Paradigmatic High-Dimensional Non-Convex ProblemsStefano Sarao Mannelli, Pierfrancesco Urbani. 187-199 [doi]

Multimodal Few-Shot Learning with Frozen Language ModelsMaria Tsimpoukelli, Jacob Menick, Serkan Cabi, S. M. Ali Eslami, Oriol Vinyals, Felix Hill. 200-212 [doi]

Approximating the Permanent with Deep Rejection SamplingJuha Harviainen, Antti Röyskö, Mikko Koivisto. 213-224 [doi]

Revisiting Model Stitching to Compare Neural RepresentationsYamini Bansal, Preetum Nakkiran, Boaz Barak. 225-236 [doi]

AugMax: Adversarial Composition of Random Augmentations for Robust TrainingHaotao Wang, Chaowei Xiao, Jean Kossaifi, Zhiding Yu, Anima Anandkumar, Zhangyang Wang. 237-250 [doi]

Habitat 2.0: Training Home Assistants to Rearrange their HabitatAndrew Szot, Alexander Clegg, Eric Undersander, Erik Wijmans, Yili Zhao, John Turner, Noah Maestre, Mustafa Mukadam, Devendra Singh Chaplot, Oleksandr Maksymets, Aaron Gokaslan, Vladimir Vondrus, Sameer Dharur, Franziska Meier, Wojciech Galuba, Angel X. Chang, Zsolt Kira, Vladlen Koltun, Jitendra Malik, Manolis Savva, Dhruv Batra. 251-266 [doi]

Time Discretization-Invariant Safe Action Repetition for Policy Gradient MethodsSeohong Park, Jaekyeom Kim, Gunhee Kim. 267-279 [doi]

Meta-Learning Reliable Priors in the Function SpaceJonas Rothfuss, Dominique Heyn, Jinfan Chen, Andreas Krause 0001. 280-293 [doi]

VoiceMixer: Adversarial Voice Style MixupSang-Hoon Lee, Ji-Hoon Kim, Hyunseung Chung, Seong-Whan Lee. 294-308 [doi]

Predicting What You Already Know Helps: Provable Self-Supervised LearningJason D. Lee, Qi Lei, Nikunj Saunshi, Jiacheng Zhuo. 309-323 [doi]

Oracle Complexity in Nonsmooth Nonconvex OptimizationGuy Kornowski, Ohad Shamir. 324-334 [doi]

CentripetalText: An Efficient Text Instance Representation for Scene Text DetectionTao Sheng, Jie Chen, Zhouhui Lian. 335-346 [doi]

Learning to Select Exogenous Events for Marked Temporal Point ProcessPing Zhang, Rishabh K. Iyer, Ashish Tendulkar, Gaurav Aggarwal, Abir De. 347-361 [doi]

DRIVE: One-bit Distributed Mean EstimationShay Vargaftik, Ran Ben-Basat, Amit Portnoy, Gal Mendelson, Yaniv Ben-Itzhak, Michael Mitzenmacher. 362-377 [doi]

Learning Space Partitions for Path PlanningKevin Yang, Tianjun Zhang, Chris Cummins, Brandon Cui, Benoit Steiner, Linnan Wang, Joseph E. Gonzalez, Dan Klein, Yuandong Tian. 378-391 [doi]

Progressive Feature Interaction Search for Deep Sparse NetworkChen Gao, Yinfeng Li, Quanming Yao, Depeng Jin, Yong Li 0008. 392-403 [doi]

Local Explanation of Dialogue Response GenerationYi-Lin Tuan, Connor Pryor, Wenhu Chen, Lise Getoor, William Yang Wang. 404-416 [doi]

Scalable Inference in SDEs by Direct Matching of the Fokker-Planck-Kolmogorov EquationArno Solin, Ella Tamir, Prakhar Verma. 417-429 [doi]

The Complexity of Bayesian Network Learning: Revisiting the SuperstructureRobert Ganian, Viktoriia Korchemna. 430-442 [doi]

Fast Tucker Rank Reduction for Non-Negative Tensors Using Mean-Field ApproximationKazu Ghalamkari, Mahito Sugiyama. 443-454 [doi]

Learning Stochastic Majority Votes by Minimizing a PAC-Bayes Generalization BoundValentina Zantedeschi, Paul Viallard, Emilie Morvant, Rémi Emonet, Amaury Habrard, Pascal Germain, Benjamin Guedj. 455-467 [doi]

Numerical influence of ReLU'(0) on backpropagationDavid Bertoin, Jérôme Bolte, Sébastien Gerchinovitz, Edouard Pauwels. 468-479 [doi]

A Contrastive Learning Approach for Training Variational Autoencoder PriorsJyoti Aneja, Alexander G. Schwing, Jan Kautz, Arash Vahdat. 480-493 [doi]

What training reveals about neural network complexityAndreas Loukas, Marinos Poiitis, Stefanie Jegelka. 494-508 [doi]

Class-agnostic Reconstruction of Dynamic Objects from VideosZhongzheng Ren, Xiaoming Zhao, Alexander G. Schwing. 509-522 [doi]

Unique sparse decomposition of low rank matricesDian Jin, Xin Bing, Yuqian Zhang. 523-535 [doi]

Neighborhood Reconstructing AutoencodersYonghyeon Lee, Hyeokjun Kwon, Frank C. Park 0001. 536-546 [doi]

TopicNet: Semantic Graph-Guided Topic DiscoveryZhibin Duan, Yishi Xu, Bo Chen 0001, Dongsheng Wang 0003, Chaojie Wang 0001, Mingyuan Zhou. 547-559 [doi]

(Almost) Free Incentivized Exploration from Decentralized Learning AgentsChengshuai Shi, Haifeng Xu, Wei Xiong, Cong Shen. 560-571 [doi]

Combining Recurrent, Convolutional, and Continuous-time Models with Linear State Space LayersAlbert Gu, Isys Johnson, Karan Goel, Khaled Saab, Tri Dao, Atri Rudra, Christopher Ré. 572-585 [doi]

Revisiting Hilbert-Schmidt Information Bottleneck for Adversarial RobustnessZifeng Wang 0002, Tong Jian, Aria Masoomi, Stratis Ioannidis, Jennifer G. Dy. 586-597 [doi]

T-LoHo: A Bayesian Regularization Model for Structured Sparsity and Smoothness on GraphsChangwoo J. Lee, Zhao Tang Luo, Huiyan Sang. 598-609 [doi]

The Utility of Explainable AI in Ad Hoc Human-Machine TeamingRohan R. Paleja, Muyleng Ghuy, Nadun Ranawaka Arachchige, Reed Jensen, Matthew Gombolay. 610-623 [doi]

Subgoal Search For Complex Reasoning TasksKonrad Czechowski, Tomasz Odrzygózdz, Marek Zbysinski, Michal Zawalski, Krzysztof Olejnik, Yuhuai Wu, Lukasz Kucinski, Piotr Milos. 624-638 [doi]

MCMC Variational Inference via Uncorrected Hamiltonian AnnealingTomas Geffner, Justin Domke. 639-651 [doi]

Landmark-RxR: Solving Vision-and-Language Navigation with Fine-Grained Alignment SupervisionKeji He, Yan Huang 0008, Qi Wu 0001, Jianhua Yang, Dong An, Shuanglin Sima, Liang Wang 0001. 652-663 [doi]

A Winning Hand: Compressing Deep Networks Can Improve Out-of-Distribution RobustnessJames Diffenderfer, Brian R. Bartoldson, Shreya Chaganti, Jize Zhang, Bhavya Kailkhura. 664-676 [doi]

On the Importance of Gradients for Detecting Distributional Shifts in the WildRui Huang, Andrew Geng, Yixuan Li. 677-689 [doi]

Iterative Methods for Private Synthetic Data: Unifying Framework and New MethodsTerrance Liu, Giuseppe Vietri, Steven Wu 0001. 690-702 [doi]

Understanding End-to-End Model-Based Reinforcement Learning Methods as Implicit ParameterizationClement Gehring, Kenji Kawaguchi, Jiaoyang Huang, Leslie Pack Kaelbling. 703-714 [doi]

Mirror Langevin Monte Carlo: the Case Under IsoperimetryQijia Jiang. 715-725 [doi]

Do Different Tracking Tasks Require Different Appearance Models?Zhongdao Wang, Hengshuang Zhao, Ya-Li Li 0001, Shengjin Wang, Philip H. S. Torr, Luca Bertinetto. 726-738 [doi]

Towards robust vision by multi-task learning on monkey visual cortexShahd Safarani, Arne Nix, Konstantin Willeke, Santiago A. Cadena, Kelli Restivo, George H. Denfield, Andreas S. Tolias, Fabian H. Sinz. 739-751 [doi]

Arbitrary Conditional Distributions with EnergyRyan R. Strauss, Junier B. Oliva. 752-763 [doi]

Learning Domain Invariant Representations in Goal-conditioned Block MDPsBeining Han, Chongyi Zheng, Harris Chan, Keiran Paster, Michael R. Zhang, Jimmy Ba. 764-776 [doi]

Near-Optimal Multi-Perturbation Experimental Design for Causal Structure LearningScott Sussex, Caroline Uhler, Andreas Krause 0001. 777-788 [doi]

Fuzzy Clustering with Similarity QueriesWasim Huleihel, Arya Mazumdar, Soumyabrata Pal. 789-801 [doi]

Improving black-box optimization in VAE latent space using decoder uncertaintyPascal Notin, José Miguel Hernández-Lobato, Yarin Gal. 802-814 [doi]

Sample Selection for Fair and Robust TrainingYuji Roh, Kangwook Lee 0001, Steven Whang, Changho Suh. 815-827 [doi]

NeurWIN: Neural Whittle Index Network For Restless Bandits Via Deep RLKhaled Nakhleh, Santosh Ganji, Ping-Chun Hsieh, I-Hong Hou, Srinivas Shakkottai. 828-839 [doi]

Sageflow: Robust Federated Learning against Both Stragglers and AdversariesJungwuk Park, Dong-Jun Han, Minseok Choi, Jaekyun Moon. 840-851 [doi]

Alias-Free Generative Adversarial NetworksTero Karras, Miika Aittala, Samuli Laine, Erik Härkönen, Janne Hellsten, Jaakko Lehtinen, Timo Aila. 852-863 [doi]

Noise2Score: Tweedie's Approach to Self-Supervised Image Denoising without Clean ImagesKwanyoung Kim, Jong Chul Ye. 864-874 [doi]

Continuous Mean-Covariance BanditsYihan Du, Siwei Wang, Zhixuan Fang, Longbo Huang. 875-886 [doi]

Dynamic Visual Reasoning by Learning Differentiable Physics Models from Video and LanguageMingyu Ding, Zhenfang Chen, Tao Du 0001, Ping Luo 0002, Josh Tenenbaum 0001, Chuang Gan. 887-899 [doi]

Solving Soft Clustering Ensemble via $k$-Sparse Discrete Wasserstein BarycenterRuizhe Qin, Mengying Li, Hu Ding. 900-913 [doi]

Bayesian Adaptation for Covariate ShiftAurick Zhou, Sergey Levine. 914-927 [doi]

Perturb-and-max-product: Sampling and learning in discrete energy-based modelsMiguel Lázaro-Gredilla, Antoine Dedieu, Dileep George. 928-940 [doi]

Towards Unifying Behavioral and Response Diversity for Open-ended Learning in Zero-sum GamesXiangyu Liu, Hangtian Jia, Ying Wen, Yujing Hu, Yingfeng Chen, Changjie Fan, Zhipeng Hu, Yaodong Yang 0001. 941-952 [doi]

Towards Better Understanding of Training Certifiably Robust Models against Adversarial ExamplesSungyoon Lee, Woojin Lee, Jinseong Park, Jaewook Lee 0001. 953-964 [doi]

Mitigating Covariate Shift in Imitation Learning via Offline Data With Partial CoverageJonathan D. Chang, Masatoshi Uehara, Dhruv Sreenivas, Rahul Kidambi, Wen Sun. 965-979 [doi]

Global Filter Networks for Image ClassificationYongming Rao, Wenliang Zhao, Zheng Zhu, Jiwen Lu, Jie Zhou 0001. 980-993 [doi]

Catastrophic Data Leakage in Vertical Federated LearningXiao Jin, Pin-Yu Chen, Chia-Yi Hsu, Chia-Mu Yu, Tianyi Chen. 994-1006 [doi]

Fault-Tolerant Federated Reinforcement Learning with Theoretical GuaranteeFlint Xiaofeng Fan, Yining Ma 0001, Zhongxiang Dai, Wei Jing, Cheston Tan, Bryan Kian Hsiang Low. 1007-1021 [doi]

Compacter: Efficient Low-Rank Hypercomplex Adapter LayersRabeeh Karimi Mahabadi, James Henderson 0001, Sebastian Ruder. 1022-1035 [doi]

Distilling Image Classifiers in Object DetectorsShuxuan Guo, Jose M. Alvarez, Mathieu Salzmann. 1036-1047 [doi]

Subgroup Generalization and Fairness of Graph Neural NetworksJiaqi Ma 0001, Junwei Deng, Qiaozhu Mei. 1048-1061 [doi]

Scaling Neural Tangent Kernels via Sketching and Random FeaturesAmir Zandieh, Insu Han, Haim Avron, Neta Shoham, Chaewon Kim, Jinwoo Shin. 1062-1073 [doi]

BatchQuant: Quantized-for-all Architecture Search with Robust QuantizerHaoping Bai, Meng Cao, Ping Huang, Jiulong Shan. 1074-1085 [doi]

Long Short-Term Transformer for Online Action DetectionMingze Xu, Yuanjun Xiong, Hao Chen, Xinyu Li, Wei Xia, Zhuowen Tu, Stefano Soatto. 1086-1099 [doi]

Near Optimal Policy Optimization via REPSAldo Pacchiano, Jonathan N. Lee, Peter L. Bartlett, Ofir Nachum. 1100-1110 [doi]

Self-Consistent Models and ValuesGregory Farquhar, Kate Baumli, Zita Marinho, Angelos Filos, Matteo Hessel, Hado Philip van Hasselt, David Silver. 1111-1125 [doi]

Learning on Random Balls is Sufficient for Estimating (Some) Graph ParametersTakanori Maehara, Hoang NT. 1126-1141 [doi]

Risk-Averse Bayes-Adaptive Reinforcement LearningMarc Rigter, Bruno Lacerda, Nick Hawes. 1142-1154 [doi]

Iterative Connecting Probability Estimation for NetworksYichen Qin, Linhan Yu, Yang Li. 1155-1166 [doi]

Learning to Adapt via Latent Domains for Adaptive Semantic SegmentationYunan Liu, Shanshan Zhang, Yang Li, Jian Yang 0003. 1167-1178 [doi]

Single Layer Predictive Normalized Maximum Likelihood for Out-of-Distribution DetectionKoby Bibas, Meir Feder, Tal Hassner. 1179-1191 [doi]

Prototypical Cross-Attention Networks for Multiple Object Tracking and SegmentationLei Ke, Xia Li, Martin Danelljan, Yu-Wing Tai, Chi-Keung Tang, Fisher Yu. 1192-1203 [doi]

Algorithmic Instabilities of Accelerated Gradient DescentAmit Attia, Tomer Koren. 1204-1214 [doi]

Learning Optimal Predictive ChecklistsHaoran Zhang, Quaid Morris, Berk Ustun, Marzyeh Ghassemi. 1215-1229 [doi]

Finite Sample Analysis of Average-Reward TD Learning and $Q$-LearningSheng Zhang, Zhe Zhang, Siva Theja Maguluri. 1230-1242 [doi]

Generalization Bounds for Graph Embedding Using Negative Sampling: Linear vs HyperbolicAtsushi Suzuki, Atsushi Nitanda, Jing Wang 0023, Linchuan Xu, Kenji Yamanishi, Marc Cavazza. 1243-1255 [doi]

Gradient Starvation: A Learning Proclivity in Neural NetworksMohammad Pezeshki, Sékou-Oumar Kaba, Yoshua Bengio, Aaron C. Courville, Doina Precup, Guillaume Lajoie. 1256-1272 [doi]

Offline Reinforcement Learning as One Big Sequence Modeling ProblemMichael Janner, Qiyang Li, Sergey Levine. 1273-1286 [doi]

Optimality and Stability in Federated Learning: A Game-theoretic ApproachKate Donahue, Jon M. Kleinberg. 1287-1298 [doi]

Understanding Deflation Process in Over-parametrized Tensor DecompositionRong Ge 0001, Yunwei Ren, Xiang Wang 0011, Mo Zhou. 1299-1311 [doi]

Privately Learning SubspacesVikrant Singhal, Thomas Steinke 0002. 1312-1324 [doi]

On the Value of Interaction and Function Approximation in Imitation LearningNived Rajaraman, Yanjun Han, Lin Yang 0011, Jingbo Liu, Jiantao Jiao, Kannan Ramchandran. 1325-1336 [doi]

Shapeshifter: a Parameter-efficient Transformer using Factorized Reshaped MatricesAliakbar Panahi, Seyran Saeedi, Tom Arodz. 1337-1350 [doi]

The Adaptive Doubly Robust Estimator and a Paradox Concerning Logging PolicyMasahiro Kato, Kenichiro McAlinn, Shota Yasui. 1351-1364 [doi]

Regularized Softmax Deep Multi-Agent Q-LearningLing Pan, Tabish Rashid, Bei Peng, Longbo Huang, Shimon Whiteson. 1365-1377 [doi]

Physics-Aware Downsampling with Deep Learning for Scalable Flood ModelingNiv Giladi, Zvika Ben-Haim, Sella Nevo, Yossi Matias, Daniel Soudry. 1378-1389 [doi]

Systematic Generalization with Edge TransformersLeon Bergen, Timothy J. O'Donnell, Dzmitry Bahdanau. 1390-1402 [doi]

TransformerFusion: Monocular RGB Scene Reconstruction using TransformersAljaz Bozic, Pablo R. Palafox, Justus Thies, Angela Dai, Matthias Nießner. 1403-1414 [doi]

Maximum Likelihood Training of Score-Based Diffusion ModelsYang Song 0011, Conor Durkan, Iain Murray 0001, Stefano Ermon. 1415-1428 [doi]

Global Convergence of Gradient Descent for Asymmetric Low-Rank Matrix FactorizationTian Ye, Simon S. Du. 1429-1439 [doi]

Adaptive Data Augmentation on Temporal GraphsYiwei Wang 0001, Yujun Cai, Yuxuan Liang, Henghui Ding, Changhu Wang, Siddharth Bhatia 0001, Bryan Hooi. 1440-1452 [doi]

Regularized Frank-Wolfe for Dense CRFs: Generalizing Mean Field and BeyondD. Khuê Lê-Huu, Karteek Alahari. 1453-1467 [doi]

Terra: Imperative-Symbolic Co-Execution of Imperative Deep Learning ProgramsTaebum Kim, Eunji Jeong, Geon Woo Kim, Yunmo Koo, Sehoon Kim, Gyeong-In Yu, Byung-Gon Chun. 1468-1480 [doi]

Uniform Sampling over Episode DifficultySébastien M. R. Arnold, Guneet S. Dhillon, Avinash Ravichandran, Stefano Soatto. 1481-1493 [doi]

Scalable Intervention Target Estimation in Linear ModelsBurak Varici, Karthikeyan Shanmugam, Prasanna Sattigeri, Ali Tajer. 1494-1505 [doi]

Play to Grade: Testing Coding Games as Classifying Markov Decision ProcessAllen Nie, Emma Brunskill, Chris Piech. 1506-1518 [doi]

Distributional Reinforcement Learning for Multi-Dimensional Reward FunctionsPushi Zhang, Xiaoyu Chen, Li Zhao 0007, Wei Xiong, Tao Qin, Tie-Yan Liu. 1519-1529 [doi]

Differentiable Unsupervised Feature Selection based on a Gated LaplacianOfir Lindenbaum, Uri Shaham, Erez Peterfreund, Jonathan Svirsky, Nicolas Casey, Yuval Kluger. 1530-1542 [doi]

Smooth Bilevel Programming for Sparse RegularizationClarice Poon, Gabriel Peyré. 1543-1555 [doi]

Grounding Representation Similarity Through Statistical TestingFrances Ding, Jean-Stanislas Denain, Jacob Steinhardt. 1556-1568 [doi]

A Consciousness-Inspired Planning Agent for Model-Based Reinforcement LearningMingde Zhao, Zhen Liu 0019, Sitao Luan, Shuyuan Zhang, Doina Precup, Yoshua Bengio. 1569-1581 [doi]

Reward-Free Model-Based Reinforcement Learning with Linear Function ApproximationWeitong Zhang, Dongruo Zhou, Quanquan Gu. 1582-1593 [doi]

Beltrami Flow and Neural Diffusion on GraphsBen Chamberlain 0001, James Rowbottom, Davide Eynard, Francesco Di Giovanni, Xiaowen Dong 0001, Michael M. Bronstein. 1594-1609 [doi]

Think Big, Teach Small: Do Language Models Distil Occam's Razor?Gonzalo Jaimovitch-Lopez, David Castellano Falcón, César Ferri, José Hernández-Orallo. 1610-1623 [doi]

Disentangling Identifiable Features from Noisy Data with Structured Nonlinear ICAHermanni Hälvä, Sylvain Le Corff, Luc Lehéricy, Jonathan So, Yongjie Zhu, Elisabeth Gassiat, Aapo Hyvärinen. 1624-1633 [doi]

Conditionally Parameterized, Discretization-Aware Neural Networks for Mesh-Based Modeling of Physical SystemsJiayang Xu, Aniruddhe Pradhan, Karthik Duraisamy. 1634-1645 [doi]

USCO-Solver: Solving Undetermined Stochastic Combinatorial Optimization ProblemsGuangmo Tong. 1646-1659 [doi]

Adaptive Conformal Inference Under Distribution ShiftIsaac Gibbs, Emmanuel J. Candès. 1660-1672 [doi]

Periodic Activation Functions Induce StationarityLassi Meronen, Martin Trapp 0001, Arno Solin. 1673-1685 [doi]

Towards Optimal Strategies for Training Self-Driving Perception Models in SimulationDavid Acuna, Jonah Philion, Sanja Fidler. 1686-1699 [doi]

KS-GNN: Keywords Search over Incomplete Graphs via Graphs Neural NetworkYu Hao 0003, Xin Cao 0001, Yufan Sheng, Yixiang Fang, Wei Wang 0011. 1700-1712 [doi]

Reconstruction for Powerful Graph RepresentationsLeonardo Cotta, Christopher Morris 0001, Bruno Ribeiro 0001. 1713-1726 [doi]

Revealing and Protecting Labels in Distributed TrainingTrung Dang, Om Thakkar 0001, Swaroop Ramaswamy, Rajiv Mathews, Peter Chin, Françoise Beaufays. 1727-1738 [doi]

Solving Graph-based Public Goods Games with Tree Search and Imitation LearningVictor-Alexandru Darvariu, Stephen Hailes, Mirco Musolesi. 1739-1751 [doi]

Stochastic Optimization of Areas Under Precision-Recall Curves with Provable ConvergenceQi Qi, Youzhi Luo, Zhao Xu, Shuiwang Ji, Tianbao Yang. 1752-1765 [doi]

Transfer Learning of Graph Neural Networks with Ego-graph Information MaximizationQi Zhu 0008, Carl Yang, Yidan Xu, Haonan Wang, Chao Zhang 0014, Jiawei Han 0001. 1766-1779 [doi]

You are caught stealing my winning lottery ticket! Making a lottery ticket claim its ownershipXuxi Chen, Tianlong Chen, Zhenyu Zhang, Zhangyang Wang. 1780-1791 [doi]

Complexity Lower Bounds for Nonconvex-Strongly-Concave Min-Max OptimizationHaochuan Li, Yi Tian, Jingzhao Zhang, Ali Jadbabaie. 1792-1804 [doi]

Early-stopped neural networks are consistentZiwei Ji, Justin D. Li, Matus Telgarsky. 1805-1817 [doi]

NxMTransformer: Semi-Structured Sparsification for Natural Language Understanding via ADMMConnor Holmes, Minjia Zhang, Yuxiong He, Bo Wu 0002. 1818-1830 [doi]

Reliable Decisions with Threshold CalibrationRoshni Sahoo, Shengjia Zhao, Alyssa Chen, Stefano Ermon. 1831-1844 [doi]

End-to-End Weak SupervisionSalva Rühling Cachay, Benedikt Boecking, Artur Dubrawski. 1845-1857 [doi]

Shift Invariance Can Reduce Adversarial RobustnessVasu Singla, Songwei Ge, Ronen Basri, David W. Jacobs. 1858-1871 [doi]

Wisdom of the Crowd Voting: Truthful Aggregation of Voter Information and PreferencesGrant Schoenebeck, Biaoshuai Tao. 1872-1883 [doi]

Replay-Guided Adversarial Environment DesignMinqi Jiang, Michael Dennis 0001, Jack Parker-Holder, Jakob N. Foerster, Edward Grefenstette, Tim Rocktäschel. 1884-1897 [doi]

There Is No Turning Back: A Self-Supervised Approach for Reversibility-Aware Reinforcement LearningNathan Grinsztajn, Johan Ferret, Olivier Pietquin, Philippe Preux, Matthieu Geist. 1898-1911 [doi]

Learning to Execute: Efficient Learning of Universal Plan-Conditioned Policies in RoboticsIngmar Schubert, Danny Driess, Ozgur S. Oguz, Marc Toussaint. 1912-1924 [doi]

Self-Diagnosing GAN: Diagnosing Underrepresented Samples in Generative Adversarial NetworksJinhee Lee, Haeri Kim, Youngkyu Hong, Hye Won Chung. 1925-1938 [doi]

Online Multi-Armed Bandits with Adaptive InferenceMaria Dimakopoulou, Zhimei Ren, Zhengyuan Zhou. 1939-1951 [doi]

Efficient Truncated Linear Regression with Unknown Noise VarianceConstantinos Daskalakis, Patroklos Stefanou, Rui Yao, Emmanouil Zampetakis. 1952-1963 [doi]

Breaking the Dilemma of Medical Image-to-image TranslationLingke Kong, Chenyu Lian, Detian Huang, Zhenjiang Li, Yanle Hu, Qichao Zhou. 1964-1978 [doi]

Temporally Abstract Partial ModelsKhimya Khetarpal, Zafarali Ahmed, Gheorghe Comanici, Doina Precup. 1979-1991 [doi]

TransMatcher: Deep Image Matching Through Transformers for Generalizable Person Re-identificationShengCai Liao, Ling Shao 0001. 1992-2003 [doi]

Multi-Objective SPIBB: Seldonian Offline Policy Improvement with Safety Constraints in Finite MDPsHarsh Satija, Philip S. Thomas, Joelle Pineau, Romain Laroche. 2004-2017 [doi]

Is Automated Topic Model Evaluation Broken? The Incoherence of CoherenceAlexander Miserlis Hoyle, Pranav Goel, Andrew Hian-Cheong, Denis Peskov, Jordan L. Boyd-Graber, Philip Resnik. 2018-2033 [doi]

INDIGO: GNN-Based Inductive Knowledge Graph Completion Using Pair-Wise EncodingShuwen Liu, Bernardo Cuenca Grau, Ian Horrocks, Egor V. Kostylev. 2034-2045 [doi]

Do Input Gradients Highlight Discriminative Features?Harshay Shah, Prateek Jain 0002, Praneeth Netrapalli. 2046-2059 [doi]

Improving Conditional Coverage via Orthogonal Quantile RegressionShai Feldman, Stephen Bates, Yaniv Romano. 2060-2071 [doi]

Minimizing Polarization and Disagreement in Social Networks via Link RecommendationLiwang Zhu, Qi Bao, Zhongzhi Zhang. 2072-2084 [doi]

Adversarial Attacks on Black Box Video Classifiers: Leveraging the Power of Geometric TransformationsShasha Li, Abhishek Aich, Shitong Zhu, M. Salman Asif, Chengyu Song, Amit K. Roy Chowdhury, Srikanth V. Krishnamurthy. 2085-2096 [doi]

Optimal Rates for Random Order Online OptimizationUri Sherman, Tomer Koren, Yishay Mansour. 2097-2108 [doi]

Discrete-Valued Neural CommunicationDianbo Liu, Alex Lamb, Kenji Kawaguchi, Anirudh Goyal, Chen Sun, Michael C. Mozer, Yoshua Bengio. 2109-2121 [doi]

Skyformer: Remodel Self-Attention with Gaussian Kernel and Nystr\"om MethodYifan Chen, Qi Zeng, Heng Ji, Yun Yang. 2122-2135 [doi]

TransMIL: Transformer based Correlated Multiple Instance Learning for Whole Slide Image ClassificationZhuchen Shao, Hao Bian, Yang Chen, Yifeng Wang, Jian Zhang, Xiangyang Ji, Yongbing Zhang. 2136-2147 [doi]

Multi-view Contrastive Graph ClusteringErlin Pan, Zhao Kang 0001. 2148-2159 [doi]

Inverse-Weighted Survival GamesXintian Han, Mark Goldstein, Aahlad Manas Puli, Thomas Wies, Adler J. Perotte, Rajesh Ranganath. 2160-2172 [doi]

Generalization Bounds for Meta-Learning via PAC-Bayes and Uniform StabilityAlec Farid, Anirudha Majumdar. 2173-2186 [doi]

Parallel Bayesian Optimization of Multiple Noisy Objectives with Expected Hypervolume ImprovementSamuel Daulton, Maximilian Balandat, Eytan Bakshy. 2187-2200 [doi]

Evolution Gym: A Large-Scale Benchmark for Evolving Soft RobotsJagdeep Singh Bhatia, Holly Jackson, Yunsheng Tian, Jie Xu 0028, Wojciech Matusik. 2201-2214 [doi]

On Calibration and Out-of-Domain GeneralizationYoav Wald, Amir Feder, Daniel Greenfeld, Uri Shalit. 2215-2227 [doi]

On the Convergence and Sample Efficiency of Variance-Reduced Policy Gradient MethodJunyu Zhang, Chengzhuo Ni, Zheng Yu, Csaba Szepesvári, Mengdi Wang. 2228-2240 [doi]

Circa: Stochastic ReLUs for Private Deep LearningZahra Ghodsi, Nandan Kumar Jha, Brandon Reagen, Siddharth Garg. 2241-2252 [doi]

Reinforcement Learning in Reward-Mixing MDPsJeongyeol Kwon, Yonathan Efroni, Constantine Caramanis, Shie Mannor. 2253-2264 [doi]

A Gang of Adversarial BanditsMark Herbster, Stephen Pasteris, Fabio Vitale, Massimiliano Pontil. 2265-2279 [doi]

Explaining Hyperparameter Optimization via Partial Dependence PlotsJulia Moosbauer, Julia Herbinger, Giuseppe Casalicchio, Marius Lindauer, Bernd Bischl. 2280-2291 [doi]

Robustifying Algorithms of Learning Latent Trees with Vector VariablesFengzhuo Zhang, Vincent Y. F. Tan. 2292-2302 [doi]

Representation Learning on Spatial NetworksZheng Zhan 0001, Liang Zhao. 2303-2318 [doi]

Continuous-time edge modelling using non-parametric point processesXuhui Fan, Bin Li 0015, Feng Zhou 0011, Scott A. Sisson. 2319-2330 [doi]

Deep inference of latent dynamics with spatio-temporal super-resolution using selective backpropagation through timeFeng Zhu, Andrew R. Sedler, Harrison A. Grier, Nauman Ahad, Mark A. Davenport, Matthew T. Kaufman, Andrea Giovannucci, Chethan Pandarinath. 2331-2345 [doi]

Memory-efficient Patch-based Inference for Tiny Deep LearningJi Lin 0002, Wei-Ming Chen, Han Cai, Chuang Gan, Song Han 0003. 2346-2358 [doi]

Self-Interpretable Model with Transformation Equivariant InterpretationYipei Wang, Xiaoqian Wang 0001. 2359-2372 [doi]

Solving Min-Max Optimization with Hidden Structure via Gradient Descent AscentEmmanouil-Vasileios Vlatakis-Gkaragkounis, Lampros Flokas, Georgios Piliouras. 2373-2386 [doi]

Preserved central model for faster bidirectional compression in distributed settingsConstantin Philippenko, Aymeric Dieuleveut. 2387-2399 [doi]

Understanding Instance-based Interpretability of Variational Auto-EncodersZhifeng Kong, Kamalika Chaudhuri. 2400-2412 [doi]

Voxel-based 3D Detection and Reconstruction of Multiple Objects from a Single ImageFeng Liu 0037, Xiaoming Liu 0002. 2413-2426 [doi]

Test-Time Classifier Adjustment Module for Model-Agnostic Domain GeneralizationYusuke Iwasawa, Yutaka Matsuo. 2427-2440 [doi]

Luna: Linear Unified Nested AttentionXuezhe Ma, Xiang Kong, Sinong Wang, Chunting Zhou, Jonathan May, Hao Ma, Luke Zettlemoyer. 2441-2453 [doi]

Iterative Causal Discovery in the Possible Presence of Latent Confounders and Selection BiasRaanan Y. Rohekar, Shami Nisimov, Yaniv Gurwicz, Gal Novik. 2454-2465 [doi]

Hindsight Task Relabelling: Experience Replay for Sparse Reward Meta-RLCharles Packer, Pieter Abbeel, Joseph E. Gonzalez. 2466-2477 [doi]

A Bayesian-Symbolic Approach to Reasoning and Learning in Intuitive PhysicsKai Xu, Akash Srivastava, Dan Gutfreund, Felix Sosa, Tomer D. Ullman, Josh Tenenbaum 0001, Charles Sutton. 2478-2490 [doi]

Associating Objects with Transformers for Video Object SegmentationZongxin Yang, Yunchao Wei, Yi Yang 0001. 2491-2502 [doi]

Automatic Symmetry Discovery with Lie Algebra Convolutional NetworkNima Dehmamy, Robin Walters, Yanchen Liu, Dashun Wang, Rose Yu. 2503-2515 [doi]

Zero Time Waste: Recycling Predictions in Early Exit Neural NetworksMaciej Wolczyk, Bartosz Wójcik, Klaudia Balazy, Igor T. Podolak, Jacek Tabor, Marek Smieja, Tomasz Trzcinski. 2516-2528 [doi]

On Model Calibration for Long-Tailed Object Detection and Instance SegmentationTai-Yu Pan, Cheng Zhang 0014, Yandong Li, Hexiang Hu, Dong Xuan, Soravit Changpinyo, Boqing Gong, Wei-Lun Chao. 2529-2542 [doi]

ReSSL: Relational Self-Supervised Learning with Weak AugmentationMingkai Zheng, Shan You, Fei Wang 0032, Chen Qian 0006, Changshui Zhang, Xiaogang Wang 0001, Chang Xu 0002. 2543-2555 [doi]

Learning to See by Looking at NoiseManel Baradad Jurjo, Jonas Wulff, Tongzhou Wang 0001, Phillip Isola, Antonio Torralba 0001. 2556-2569 [doi]

Explicit loss asymptotics in the gradient descent training of neural networksMaksim Velikanov, Dmitry Yarotsky. 2570-2582 [doi]

Test-Time Personalization with a Transformer for Human Pose EstimationYizhuo Li 0001, Miao Hao, Zonglin Di, Nitesh B. Gundavarapu, Xiaolong Wang 0004. 2583-2597 [doi]

Towards Scalable Unpaired Virtual Try-On via Patch-Routed Spatially-Adaptive GANZhenyu Xie, Zaiyu Huang, Fuwei Zhao, Haoye Dong, Michael Kampffmeyer, Xiaodan Liang. 2598-2610 [doi]

Bias Out-of-the-Box: An Empirical Analysis of Intersectional Occupational Biases in Popular Generative Language ModelsHannah Rose Kirk, Yennie Jun, Filippo Volpin, Haider Iqbal, Elias Benussi, Frédéric A. Dreyer, Aleksandar Shtedritski, Yuki M. Asano. 2611-2624 [doi]

Weisfeiler and Lehman Go Cellular: CW NetworksCristian Bodnar, Fabrizio Frasca, Nina Otter, Yuguang Wang 0001, Pietro Liò, Guido F. Montúfar, Michael M. Bronstein. 2625-2640 [doi]

Learning Conjoint Attentions for Graph Neural NetsTiantian He, Yew-Soon Ong, Lu Bai 0005. 2641-2653 [doi]

Hybrid Regret Bounds for Combinatorial Semi-Bandits and Adversarial Linear BanditsShinji Ito. 2654-2667 [doi]

Pay Better Attention to Attention: Head Selection in Multilingual and Multi-Domain Sequence ModelingHongyu Gong, Yun Tang, Juan Pino, Xian Li. 2668-2681 [doi]

Cardinality-Regularized Hawkes-Granger ModelTsuyoshi Idé, Georgios Kollias, Dzung T. Phan, Naoki Abe. 2682-2694 [doi]

Aligned Structured Sparsity Learning for Efficient Image Super-ResolutionYulun Zhang, Huan Wang 0014, Can Qin, Yun Fu 0001. 2695-2706 [doi]

Why Lottery Ticket Wins? A Theoretical Perspective of Sample Complexity on Sparse Neural NetworksShuai Zhang 0015, Meng Wang 0003, Sijia Liu 0001, Pin-Yu Chen, Jinjun Xiong. 2707-2720 [doi]

Constrained Robust Submodular PartitioningShengjie Wang, Tianyi Zhou, Chandrashekhar Lavania, Jeff A. Bilmes. 2721-2732 [doi]

Online Knapsack with Frequency PredictionsSungjin Im, Ravi Kumar 0001, Mahshid Montazer Qaem, Manish Purohit. 2733-2743 [doi]

On Component Interactions in Two-Stage Recommender SystemsJiri Hron, Karl Krauth, Michael I. Jordan, Niki Kilbertus. 2744-2757 [doi]

Lip to Speech Synthesis with Visual Context Attentional GANMinsu Kim, Joanna Hong, Yong Man Ro. 2758-2770 [doi]

Non-convex Distributionally Robust Optimization: Non-asymptotic AnalysisJikai Jin, Bohang Zhang, Haiyang Wang, Liwei Wang 0001. 2771-2782 [doi]

Goal-Aware Cross-Entropy for Multi-Target Reinforcement LearningKibeom Kim, Min Whoo Lee, Yoonsung Kim, Je-hwan Ryu, Min Su Lee, Byoung-Tak Zhang. 2783-2795 [doi]

Smooth Normalizing FlowsJonas Köhler 0001, Andreas Krämer, Frank Noé. 2796-2809 [doi]

MetaAvatar: Learning Animatable Clothed Human Models from Few Depth ImagesShaofei Wang, Marko Mihajlovic, Qianli Ma, Andreas Geiger 0001, Siyu Tang 0001. 2810-2822 [doi]

Distributed Principal Component Analysis with Limited CommunicationFoivos Alimisis, Peter Davies, Bart Vandereycken, Dan Alistarh. 2823-2834 [doi]

Newton-LESS: Sparsification without Trade-offs for the Sketched Newton UpdateMichal Derezinski, Jonathan Lacotte, Mert Pilanci, Michael W. Mahoney. 2835-2847 [doi]

Confident Anchor-Induced Multi-Source Free Domain AdaptationJiahua Dong, Zhen Fang, Anjin Liu, Gan Sun, Tongliang Liu. 2848-2860 [doi]

Word2Fun: Modelling Words as Functions for Diachronic Word RepresentationBenyou Wang, Emanuele Di Buccio, Massimo Melucci. 2861-2872 [doi]

Iteratively Reweighted Least Squares for Basis Pursuit with Global Linear Convergence RateChristian Kümmerle, Claudio Mayrink Verdun, Dominik Stöger. 2873-2886 [doi]

Low-Rank Constraints for Fast Inference in Structured ModelsJustin T. Chiu, Yuntian Deng, Alexander M. Rush. 2887-2898 [doi]

Accumulative Poisoning Attacks on Real-time DataTianyu Pang, Xiao Yang, Yinpeng Dong, Hang Su 0006, Jun Zhu 0001. 2899-2912 [doi]

UCB-based Algorithms for Multinomial Logistic Regression BanditsSanae Amani, Christos Thrampoulidis. 2913-2924 [doi]

Estimating the Long-Term Effects of Novel TreatmentsKeith Battocchi, Eleanor Dillon, Maggie Hei, Greg Lewis, Miruna Oprescu, Vasilis Syrgkanis. 2925-2935 [doi]

Dual Progressive Prototype Network for Generalized Zero-Shot LearningChaoqun Wang, Shaobo Min, Xuejin Chen, Xiaoyan Sun 0001, Houqiang Li. 2936-2948 [doi]

Derivative-Free Policy Optimization for Linear Risk-Sensitive and Robust Control Design: Implicit Regularization and Sample ComplexityKaiqing Zhang, Xiangyuan Zhang, Bin Hu, Tamer Basar. 2949-2964 [doi]

G-PATE: Scalable Differentially Private Data Generator via Private Aggregation of Teacher DiscriminatorsYunhui Long, Boxin Wang, Zhuolin Yang, Bhavya Kailkhura, Aston Zhang, Carl A. Gunter, Bo Li 0026. 2965-2977 [doi]

On the Existence of The Adversarial Bayes ClassifierPranjal Awasthi, Natalie Frank, Mehryar Mohri. 2978-2990 [doi]

Convex-Concave Min-Max Stackelberg GamesDenizalp Goktas, Amy Greenwald. 2991-3003 [doi]

Misspecified Gaussian Process Bandit OptimizationIlija Bogunovic, Andreas Krause 0001. 3004-3015 [doi]

Visual Adversarial Imitation Learning using Variational ModelsRafael Rafailov, Tianhe Yu, Aravind Rajeswaran, Chelsea Finn. 3016-3028 [doi]

Object-Aware Regularization for Addressing Causal Confusion in Imitation LearningJongjin Park, Younggyo Seo, Chang Liu 0030, Li Zhao 0007, Tao Qin, Jinwoo Shin, Tie-Yan Liu. 3029-3042 [doi]

Reliable and Trustworthy Machine Learning for Health Using Dataset Shift DetectionChunjong Park, Anas Awadalla, Tadayoshi Kohno, Shwetak N. Patel. 3043-3056 [doi]

Multiclass Boosting and the Cost of Weak LearningNataly Brukhim, Elad Hazan, Shay Moran, Indraneel Mukherjee, Robert E. Schapire. 3057-3067 [doi]

Partition-Based Formulations for Mixed-Integer Optimization of Trained ReLU Neural NetworksCalvin Tsay, Jan Kronqvist, Alexander Thebelt, Ruth Misener. 3068-3080 [doi]

Hyperparameter Optimization Is Deceiving Us, and How to Stop ItA. Feder Cooper, Yucheng Lu, Jessica Forde, Christopher De Sa. 3081-3095 [doi]

On the Convergence Theory of Debiased Model-Agnostic Meta-Reinforcement LearningAlireza Fallah 0001, Kristian Georgiev, Aryan Mokhtari, Asuman E. Ozdaglar. 3096-3107 [doi]

3D Pose Transfer with Correspondence Learning and Mesh RefinementChaoyue Song, Jiacheng Wei, Ruibo Li, Fayao Liu, Guosheng Lin. 3108-3120 [doi]

Framing RNN as a kernel method: A neural ODE approachAdeline Fermanian, Pierre Marion, Jean-Philippe Vert, Gérard Biau. 3121-3134 [doi]

Contextual Similarity Aggregation with Self-attention for Visual Re-rankingJianbo Ouyang, Hui Wu, Min Wang 0019, Wengang Zhou, Houqiang Li. 3135-3148 [doi]

Can Information Flows Suggest Targets for Interventions in Neural Circuits?Praveen Venkatesh, Sanghamitra Dutta, Neil Mehta, Pulkit Grover. 3149-3162 [doi]

AutoBalance: Optimized Loss Functions for Imbalanced DataMingchen Li, Xuechen Zhang, Christos Thrampoulidis, Jiasi Chen, Samet Oymak. 3163-3177 [doi]

SyncTwin: Treatment Effect Estimation with Longitudinal OutcomesZhaozhi Qian, Yao Zhang, Ioana Bica, Angela M. Wood, Mihaela van der Schaar. 3178-3190 [doi]

Statistical Query Lower Bounds for List-Decodable Linear RegressionIlias Diakonikolas, Daniel Kane, Ankit Pensia, Thanasis Pittas, Alistair Stewart. 3191-3204 [doi]

Unsupervised Motion Representation Learning with Capsule AutoencodersZiwei Xu 0001, Xudong Shen, Yongkang Wong, Mohan S. Kankanhalli. 3205-3217 [doi]

VigDet: Knowledge Informed Neural Temporal Point Process for Coordination Detection on Social MediaYizhou Zhang, Karishma Sharma, Yan Liu. 3218-3231 [doi]

An Improved Analysis and Rates for Variance Reduction under Without-replacement Sampling OrdersXinmeng Huang, Kun Yuan, Xianghui Mao, Wotao Yin. 3232-3243 [doi]

Exploring Forensic Dental Identification with Deep LearningYuan Liang, Weikun Han, Liang Qiu, Chen Wu, Yiting Shao, Kun Wang 0005, Lei He 0001. 3244-3258 [doi]

Learning to Generate Realistic Noisy Images via Pixel-level Noise-aware Adversarial TrainingYuanhao Cai, Xiaowan Hu, Haoqian Wang, Yulun Zhang, Hanspeter Pfister, Donglai Wei. 3259-3270 [doi]

Multi-Agent Reinforcement Learning for Active Voltage Control on Power Distribution NetworksJianhong Wang, Wangkun Xu, Yunjie Gu, Wenbin Song, Tim C. Green. 3271-3284 [doi]

Looking Beyond Single Images for Contrastive Semantic Segmentation LearningFeihu Zhang, Philip H. S. Torr, René Ranftl, Stephan R. Richter. 3285-3297 [doi]

A Constant Approximation Algorithm for Sequential Random-Order No-Substitution k-Median ClusteringTom Hess, Michal Moshkovitz, Sivan Sabato. 3298-3308 [doi]

Dangers of Bayesian Model Averaging under Covariate ShiftPavel Izmailov, Patrick Nicholson, Sanae Lotfi, Andrew Gordon Wilson. 3309-3322 [doi]

Learning Equilibria in Matching Markets from Bandit FeedbackMeena Jagadeesan, Alexander Wei, Yixin Wang, Michael I. Jordan, Jacob Steinhardt. 3323-3335 [doi]

Towards Lower Bounds on the Depth of ReLU Neural NetworksChristoph Hertrich, Amitabh Basu, Marco Di Summa, Martin Skutella. 3336-3348 [doi]

The Limitations of Large Width in Neural Networks: A Deep Gaussian Process PerspectiveGeoff Pleiss, John P. Cunningham. 3349-3363 [doi]

Exact marginal prior distributions of finite Bayesian neural networksJacob A. Zavatone-Veth, Cengiz Pehlevan. 3364-3375 [doi]

Spatiotemporal Joint Filter Decomposition in 3D Convolutional Neural NetworksZichen Miao, Ze Wang, Xiuyuan Cheng, Qiang Qiu. 3376-3388 [doi]

Pooling by Sliced-Wasserstein EmbeddingNavid Naderializadeh, Joseph F. Comer, Reed W. Andrews, Heiko Hoffmann, Soheil Kolouri. 3389-3400 [doi]

On the Theory of Reinforcement Learning with Once-per-Episode FeedbackNiladri S. Chatterji, Aldo Pacchiano, Peter L. Bartlett, Michael I. Jordan. 3401-3412 [doi]

ResNEsts and DenseNEsts: Block-based DNN Models with Improved Representation GuaranteesKuan-Lin Chen, Ching Hua Lee, Harinath Garudadri, Bhaskar D. Rao. 3413-3424 [doi]

Locally private online change point detectionThomas Berrett, Yi Yu. 3425-3437 [doi]

Invariance Principle Meets Information Bottleneck for Out-of-Distribution GeneralizationKartik Ahuja, Ethan Caballero, Dinghuai Zhang, Jean-Christophe Gagnon-Audet, Yoshua Bengio, Ioannis Mitliagkas, Irina Rish. 3438-3450 [doi]

Repulsive Deep Ensembles are BayesianFrancesco D'Angelo, Vincent Fortuin. 3451-3465 [doi]

BayesIMP: Uncertainty Quantification for Causal Data FusionSiu Lun Chau, Jean-Francois Ton, Javier González, Yee Whye Teh, Dino Sejdinovic. 3466-3477 [doi]

RMM: Reinforced Memory Management for Class-Incremental LearningYaoyao Liu 0001, Bernt Schiele, Qianru Sun. 3478-3490 [doi]

Learning Compact Representations of Neural Networks using DiscriminAtive Masking (DAM)Jie Bu, Arka Daw, M. Maruf, Anuj Karpatne. 3491-3503 [doi]

Neural Auto-Curricula in Two-Player Zero-Sum GamesXidong Feng, Oliver Slumbers, Ziyu Wan, Bo Liu 0039, Stephen McAleer, Ying Wen, Jun Wang 0012, Yaodong Yang 0001. 3504-3517 [doi]

ImageBART: Bidirectional Context with Multinomial Diffusion for Autoregressive Image SynthesisPatrick Esser, Robin Rombach, Andreas Blattmann, Björn Ommer. 3518-3532 [doi]

From global to local MDI variable importances for random forests and when they are Shapley valuesAntonio Sutera, Gilles Louppe, Vân Anh Huynh-Thu, Louis Wehenkel, Pierre Geurts. 3533-3543 [doi]

Adversarial Robustness of Streaming Algorithms through Importance SamplingVladimir Braverman, Avinatan Hassidim, Yossi Matias, Mariano Schain, Sandeep Silwal, Samson Zhou. 3544-3557 [doi]

Tractable Regularization of Probabilistic CircuitsAnji Liu, Guy Van den Broeck. 3558-3570 [doi]

On Interaction Between Augmentations and Corruptions in Natural Corruption RobustnessEric Mintun, Alexander Kirillov, Saining Xie. 3571-3583 [doi]

Dynamic Distillation Network for Cross-Domain Few-Shot Recognition with Unlabeled DataAshraful Islam, Chun-Fu (Richard) Chen, Rameswar Panda, Leonid Karlinsky, Rogério Feris, Richard J. Radke. 3584-3595 [doi]

Hypergraph Propagation and Community Selection for Objects RetrievalGuo Yuan An, Yuchi Huo, Sung-Eui Yoon. 3596-3608 [doi]

Deep learning is adaptive to intrinsic dimensionality of model smoothness in anisotropic Besov spaceTaiji Suzuki, Atsushi Nitanda. 3609-3621 [doi]

QuPeD: Quantized Personalization via Distillation with Applications to Federated LearningKaan Ozkara, Navjot Singh, Deepesh Data, Suhas N. Diggavi. 3622-3634 [doi]

Model Adaptation: Historical Contrastive Learning for Unsupervised Domain Adaptation without Source DataJiaxing Huang 0001, Dayan Guan, Aoran Xiao, Shijian Lu. 3635-3649 [doi]

The Out-of-Distribution Problem in Explainability and Search Methods for Feature Importance ExplanationsPeter Hase, Harry Xie, Mohit Bansal. 3650-3666 [doi]

Control Variates for Slate Off-Policy EvaluationNikos Vlassis, Ashok Chandrashekar, Fernando Amat Gil, Nathan Kallus. 3667-3679 [doi]

Stabilizing Deep Q-Learning with ConvNets and Vision Transformers under Data AugmentationNicklas Hansen, Hao Su 0001, Xiaolong Wang 0004. 3680-3693 [doi]

On Effective Scheduling of Model-based Reinforcement LearningHang Lai, Jian Shen 0003, Weinan Zhang 0001, Yimin Huang, Xing Zhang, Ruiming Tang, Yong Yu 0001, Zhenguo Li. 3694-3705 [doi]

Removing Inter-Experimental Variability from Functional Data in Systems NeuroscienceDominic Gonschorek, Larissa Höfling, Klaudia P. Szatko, Katrin Franke, Timm Schubert, Benjamin Dunn, Philipp Berens, David Klindt, Thomas Euler. 3706-3719 [doi]

Learning Knowledge Graph-based World Models of Textual EnvironmentsPrithviraj Ammanabrolu, Mark O. Riedl. 3720-3731 [doi]

Damped Anderson Mixing for Deep Reinforcement Learning: Acceleration, Convergence, and StabilizationKe Sun 0013, Yafei Wang, Yi Liu, Yingnan Zhao, Bo Pan, Shangling Jui, Bei Jiang, Linglong Kong. 3732-3743 [doi]

Approximate Decomposable Submodular Function Minimization for Cardinality-Based ComponentsNate Veldt, Austin R. Benson, Jon M. Kleinberg. 3744-3756 [doi]

Episodic Multi-agent Reinforcement Learning with Curiosity-driven ExplorationLulu Zheng, Jiarui Chen, Jianhao Wang, Jiamin He, Yujing Hu, Yingfeng Chen, Changjie Fan, Yang Gao 0001, Chongjie Zhang. 3757-3769 [doi]

Two Sides of Meta-Learning Evaluation: In vs. Out of DistributionAmrith Setlur, Oscar Li, Virginia Smith. 3770-3783 [doi]

Debiased Visual Question Answering from Feature and Sample PerspectivesZhiquan Wen, Guanghui Xu, Mingkui Tan, Qingyao Wu, Qi Wu 0001. 3784-3796 [doi]

Towards a Unified Game-Theoretic View of Adversarial Perturbations and RobustnessJie Ren 0018, Die Zhang, Yisen Wang 0001, Lu Chen, Zhanpeng Zhou, Yiting Chen, Xu Cheng 0005, Xin Wang 0108, Meng Zhou, Jie Shi, Quanshi Zhang. 3797-3810 [doi]

On the Out-of-distribution Generalization of Probabilistic Image ModellingMingtian Zhang, Andi Zhang, Steven McDonagh. 3811-3823 [doi]

Exploiting Local Convergence of Quasi-Newton Methods Globally: Adaptive Sample Size ApproachQiujiang Jin, Aryan Mokhtari. 3824-3835 [doi]

PDE-GCN: Novel Architectures for Graph Neural Networks Motivated by Partial Differential EquationsMoshe Eliasof, Eldad Haber, Eran Treister. 3836-3849 [doi]

Information Directed Reward Learning for Reinforcement LearningDavid Lindner, Matteo Turchetta, Sebastian Tschiatschek, Kamil Ciosek, Andreas Krause 0001. 3850-3862 [doi]

SSMF: Shifting Seasonal Matrix FactorizationKoki Kawabata, Siddharth Bhatia 0001, Rui Liu 0004, Mohit Wadhwa, Bryan Hooi. 3863-3873 [doi]

Associative Memories via Predictive CodingTommaso Salvatori, Yuhang Song 0001, Yujian Hong, Lei Sha, Simon Frieder, Zhenghua Xu, Rafal Bogacz, Thomas Lukasiewicz. 3874-3886 [doi]

Robust and differentially private mean estimationXiyang Liu, Weihao Kong, Sham M. Kakade, Sewoong Oh. 3887-3901 [doi]

Adaptable Agent Populations via a Generative Model of PoliciesKenneth Derek, Phillip Isola. 3902-3913 [doi]

A No-go Theorem for Robust Acceleration in the Hyperbolic PlaneLinus Hamilton, Ankur Moitra. 3914-3924 [doi]

Privately Learning Mixtures of Axis-Aligned GaussiansIshaq Aden-Ali, Hassan Ashtiani, Christopher Liaw. 3925-3938 [doi]

Deep Self-Dissimilarities as Powerful Visual FingerprintsIdan Kligvasser, Tamar Rott Shaham, Yuval Bahat, Tomer Michaeli. 3939-3951 [doi]

Invariant Causal Imitation Learning for Generalizable PoliciesIoana Bica, Daniel Jarrett, Mihaela van der Schaar. 3952-3964 [doi]

CoAtNet: Marrying Convolution and Attention for All Data SizesZihang Dai, Hanxiao Liu, Quoc V. Le, Mingxing Tan. 3965-3977 [doi]

Mixed Supervised Object Detection by Transferring Mask Prior and Semantic SimilarityYan Liu, Zhijie Zhang, Li Niu 0002, Junjie Chen, Liqing Zhang 0001. 3978-3990 [doi]

Celebrating Diversity in Shared Multi-Agent Reinforcement LearningChenghao Li 0002, Tonghan Wang 0001, Chengjie Wu, Qianchuan Zhao, Jun Yang 0028, Chongjie Zhang. 3991-4002 [doi]

Rebounding Bandits for Modeling Satiation EffectsLiu Leqi, Fatma Kilinç-Karzan, Zachary C. Lipton, Alan L. Montgomery. 4003-4014 [doi]

Sample Complexity of Tree Search Configuration: Cutting Planes and BeyondMaria-Florina Balcan, Siddharth Prasad, Tuomas Sandholm, Ellen Vitercik. 4015-4027 [doi]

IQ-Learn: Inverse soft-Q Learning for ImitationDivyansh Garg, Shuvam Chakraborty, Chris Cundy, Jiaming Song, Stefano Ermon. 4028-4039 [doi]

Task-Agnostic Undesirable Feature Deactivation Using Out-of-Distribution DataDongmin Park, Hwanjun Song, Minseok Kim, Jae-Gil Lee 0001. 4040-4052 [doi]

Private Non-smooth ERM and SCO in Subquadratic StepsJanardhan Kulkarni, Yin Tat Lee, Daogao Liu. 4053-4064 [doi]

Towards Instance-Optimal Offline Reinforcement Learning with PessimismMing Yin, Yu-Xiang Wang 0003. 4065-4078 [doi]

Speedy Performance Estimation for Neural Architecture SearchRobin Ru, Clare Lyle, Lisa Schut, Miroslav Fil, Mark van der Wilk, Yarin Gal. 4079-4092 [doi]

How Tight Can PAC-Bayes be in the Small Data Regime?Andrew Y. K. Foong, Wessel P. Bruinsma, David R. Burt, Richard E. Turner. 4093-4105 [doi]

Deep Synoptic Monte-Carlo Planning in Reconnaissance Blind ChessGregory Clark. 4106-4119 [doi]

Dynamic Analysis of Higher-Order Coordination in Neuronal Assemblies via De-Sparsified Orthogonal Matching PursuitShoutik Mukherjee, Behtash Babadi. 4120-4133 [doi]

Efficient Training of Retrieval Models using Negative CacheErik Lindgren, Sashank J. Reddi, Ruiqi Guo, Sanjiv Kumar. 4134-4146 [doi]

Understanding Partial Multi-Label Learning via Mutual InformationXiuwen Gong, Dong Yuan, Wei Bao. 4147-4156 [doi]

Environment Generation for Zero-Shot Compositional Reinforcement LearningIzzeddin Gur, Natasha Jaques, Yingjie Miao, Jongwook Choi, Manoj Tiwari, Honglak Lee, Aleksandra Faust. 4157-4169 [doi]

Optimizing Conditional Value-At-Risk of Black-Box FunctionsQuoc Phong Nguyen, Zhongxiang Dai, Bryan Kian Hsiang Low, Patrick Jaillet. 4170-4180 [doi]

E(n) Equivariant Normalizing FlowsVictor Garcia Satorras, Emiel Hoogeboom, Fabian Fuchs, Ingmar Posner, Max Welling. 4181-4192 [doi]

Revitalizing CNN Attention via Transformers in Self-Supervised Visual Representation LearningChongjian Ge, Youwei Liang, Yibing Song, Jianbo Jiao, Jue Wang 0001, Ping Luo 0002. 4193-4206 [doi]

A Critical Look at the Consistency of Causal Estimation with Deep Latent Variable ModelsSeveri Rissanen, Pekka Marttinen. 4207-4217 [doi]

Improving Robustness using Generated DataSven Gowal, Sylvestre-Alvise Rebuffi, Olivia Wiles, Florian Stimberg, Dan Andrei Calian, Timothy A. Mann. 4218-4233 [doi]

An Analysis of Constant Step Size SGD in the Non-convex Regime: Asymptotic Normality and BiasLu Yu, Krishnakumar Balasubramanian, Stanislav Volgushev, Murat A. Erdogdu. 4234-4248 [doi]

Learning to Learn Graph TopologiesXingyue Pu, Tianyue Cao, Xiaoyun Zhang, Xiaowen Dong 0001, Siheng Chen. 4249-4262 [doi]

Invertible Tabular GANs: Killing Two Birds with One Stone for Tabular Data SynthesisJaehoon Lee 0002, Jihyeon Hyeong, Jinsung Jeon, Noseong Park, Jihoon Cho. 4263-4273 [doi]

Reducing Collision Checking for Sampling-Based Motion Planning Using Graph Neural NetworksChenning Yu, Sicun Gao. 4274-4289 [doi]

Sample Complexity Bounds for Active Ranking from Multi-wise ComparisonsWenbo Ren, Jia Liu 0002, Ness B. Shroff. 4290-4300 [doi]

Efficient Bayesian network structure learning via local Markov boundary searchMing Gao, Bryon Aragam. 4301-4313 [doi]

Learning Dynamic Graph Representation of Brain Connectome with Spatio-Temporal AttentionByung-Hoon Kim, Jong Chul Ye, Jae-Jin Kim. 4314-4327 [doi]

Understanding the Generalization Benefit of Model Invariance from a Data PerspectiveSicheng Zhu, Bang An, Furong Huang. 4328-4341 [doi]

Improved Variance-Aware Confidence Sets for Linear Bandits and Linear Mixture MDPZihan Zhang, Jiaqi Yang 0001, Xiangyang Ji, Simon S. Du. 4342-4355 [doi]

How Should Pre-Trained Language Models Be Fine-Tuned Towards Adversarial Robustness?Xinshuai Dong, Anh Tuan Luu, Min Lin, Shuicheng Yan, Hanwang Zhang. 4356-4369 [doi]

Recursive Bayesian Networks: Generalising and Unifying Probabilistic Context-Free Grammars and Dynamic Bayesian NetworksRobert Lieck, Martin Rohrmeier. 4370-4383 [doi]

EF21: A New, Simpler, Theoretically Better, and Practically Faster Error FeedbackPeter Richtárik, Igor Sokolov 0001, Ilyas Fatkhullin. 4384-4396 [doi]

Mixture weights optimisation for Alpha-Divergence Variational InferenceKamélia Daudel, Randal Douc. 4397-4408 [doi]

Instance-dependent Label-noise Learning under a Structural Causal ModelYu Yao, Tongliang Liu, Mingming Gong, Bo Han 0003, Gang Niu 0001, Kun Zhang 0001. 4409-4420 [doi]

Combining Human Predictions with Model Probabilities via Confusion Matrices and CalibrationGavin Kerrigan, Padhraic Smyth, Mark Steyvers. 4421-4434 [doi]

$\texttt{LeadCache}$: Regret-Optimal Caching in NetworksDebjit Paria, Abhishek Sinha. 4435-4447 [doi]

Probabilistic Attention for Interactive SegmentationPrasad Gabbur, Manjot Bilkhu, Javier R. Movellan. 4448-4460 [doi]

Influence Patterns for Explaining Information Flow in BERTKaiji Lu, Zifan Wang, Piotr Mardziel, Anupam Datta. 4461-4474 [doi]

Robust Regression Revisited: Acceleration and Improved Estimation RatesArun Jambulapati, Jerry Li 0001, Tselil Schramm, Kevin Tian. 4475-4488 [doi]

Automatic Unsupervised Outlier Model SelectionYue Zhao 0016, Ryan A. Rossi, Leman Akoglu. 4489-4502 [doi]

Pruning Randomly Initialized Neural Networks with Iterative RandomizationDaiki Chijiwa, Shin'ya Yamaguchi, Yasutoshi Ida, Kenji Umakoshi, Tomohiro Inoue. 4503-4513 [doi]

Probing Inter-modality: Visual Parsing with Self-Attention for Vision-and-Language Pre-trainingHongwei Xue, Yupan Huang, Bei Liu 0001, Houwen Peng, Jianlong Fu, Houqiang Li, Jiebo Luo. 4514-4528 [doi]

Stability and Generalization of Bilevel Programming in Hyperparameter OptimizationFan Bao, Guoqiang Wu, Chongxuan Li, Jun Zhu 0001, Bo Zhang 0010. 4529-4541 [doi]

Regime Switching BanditsXiang Zhou, Yi Xiong, Ningyuan Chen, Xuefeng Gao. 4542-4554 [doi]

MixACM: Mixup-Based Robustness Transfer via Distillation of Activated Channel MapsMuhammad Awais, Fengwei Zhou, Chuanlong Xie, Jiawei Li, Sung-Ho Bae, Zhenguo Li. 4555-4569 [doi]

Localization, Convexity, and Star AggregationSuhas Vijaykumar. 4570-4581 [doi]

Aligning Silhouette Topology for Self-Adaptive 3D Human Pose RecoveryRamesha Rakesh Mugaludi, Jogendra Nath Kundu, Varun Jampani, Venkatesh Babu R.. 4582-4593 [doi]

Self-Adaptable Point Processes with Nonparametric Time DecaysZhimeng Pan, Zheng Wang, Jeff M. Phillips, Shandian Zhe. 4594-4606 [doi]

Offline Meta Reinforcement Learning - Identifiability Challenges and Effective Data Collection StrategiesRon Dorfman, Idan Shenfeld, Aviv Tamar. 4607-4618 [doi]

RoMA: Robust Model Adaptation for Offline Model-based OptimizationSihyun Yu, Sungsoo Ahn, Le Song, Jinwoo Shin. 4619-4631 [doi]

Flexible Option LearningMartin Klissarov, Doina Precup. 4632-4646 [doi]

Faster Directional Convergence of Linear Neural Networks under Spherically Symmetric DataDachao Lin, Ruoyu Sun 0001, Zhihua Zhang. 4647-4660 [doi]

Online Facility Location with Multiple AdviceMatteo Almanza, Flavio Chierichetti, Silvio Lattanzi, Alessandro Panconesi, Giuseppe Re. 4661-4673 [doi]

Credit Assignment in Neural Networks through Deep Feedback ControlAlexander Meulemans, Matilde Tristany Farinha, Javier García Ordóñez, Pau Vilimelis Aceituno, João Sacramento, Benjamin F. Grewe. 4674-4687 [doi]

Robust Online Correlation ClusteringSilvio Lattanzi, Benjamin Moseley, Sergei Vassilvitskii, Yuyan Wang, Rudy Zhou. 4688-4698 [doi]

Neural Additive Models: Interpretable Machine Learning with Neural NetsRishabh Agarwal, Levi Melnick, Nicholas Frosst, Xuezhou Zhang, Benjamin Lengerich, Rich Caruana, Geoffrey E. Hinton. 4699-4711 [doi]

Representation Learning for Event-based Visuomotor PoliciesSai Vemprala, Sami Mian, Ashish Kapoor. 4712-4724 [doi]

Kernel Functional OptimisationArun Kumar Anjanapura Venkatesh, Alistair Shilton, Santu Rana, Sunil Gupta 0001, Svetha Venkatesh. 4725-4737 [doi]

Generalized Shape Metrics on Neural RepresentationsAlex H. Williams, Erin Kunz, Simon Kornblith, Scott W. Linderman. 4738-4750 [doi]

Diverse Message Passing for Attribute with HeterophilyLiang Yang 0002, Mengzhe Li, Liyang Liu, Bingxin Niu, Chuan Wang 0002, Xiaochun Cao, Yuanfang Guo. 4751-4763 [doi]

Towards Robust Bisimulation Metric LearningMete Kemertas, Tristan Aumentado-Armstrong. 4764-4777 [doi]

Beyond BatchNorm: Towards a Unified Understanding of Normalization in Deep LearningEkdeep Singh Lubana, Robert P. Dick, Hidenori Tanaka. 4778-4791 [doi]

Representation Learning Beyond Linear Prediction FunctionsZiping Xu, Ambuj Tewari. 4792-4804 [doi]

Volume Rendering of Neural Implicit SurfacesLior Yariv, Jiatao Gu, Yoni Kasten, Yaron Lipman. 4805-4815 [doi]

MAUVE: Measuring the Gap Between Neural Text and Human Text using Divergence FrontiersKrishna Pillutla, Swabha Swayamdipta, Rowan Zellers, John Thickstun, Sean Welleck, Yejin Choi, Zaïd Harchaoui. 4816-4828 [doi]

Accurately Solving Rod Dynamics with Graph LearningHan Shao, Tassilo Kugelstadt, Torsten Hädrich, Wojtek Palubicki, Jan Bender, Sören Pirk, Dominik L. Michels. 4829-4842 [doi]

Limiting fluctuation and trajectorial stability of multilayer neural networks with mean field trainingHuy Tuan Pham, Phan-Minh Nguyen. 4843-4855 [doi]

Medical Dead-ends and Learning to Identify High-Risk States and TreatmentsMehdi Fatemi, Taylor W. Killian, Jayakumar Subramanian, Marzyeh Ghassemi. 4856-4870 [doi]

Overcoming the Convex Barrier for Simplex InputsHarkirat Singh Behl, M. Pawan Kumar, Philip H. S. Torr, Krishnamurthy Dvijotham. 4871-4882 [doi]

High-probability Bounds for Non-Convex Stochastic Optimization with Heavy TailsAshok Cutkosky, Harsh Mehta. 4883-4895 [doi]

Batch Normalization Orthogonalizes Representations in Deep Random NetworksHadi Daneshmand, Amir Joudaki, Francis R. Bach. 4896-4906 [doi]

Support vector machines and linear regression coincide with very high-dimensional featuresNavid Ardeshir, Clayton Sanford, Daniel J. Hsu. 4907-4918 [doi]

Coupled Segmentation and Edge Learning via Dynamic Graph PropagationZhiding Yu, Rui Huang, Wonmin Byeon, Sifei Liu, Guilin Liu, Thomas M. Breuel, Anima Anandkumar, Jan Kautz. 4919-4932 [doi]

Offline RL Without Off-Policy EvaluationDavid Brandfonbrener, Will Whitney, Rajesh Ranganath, Joan Bruna. 4933-4946 [doi]

Continuous vs. Discrete Optimization of Deep Neural NetworksOmer Elkabetz, Nadav Cohen. 4947-4960 [doi]

CrypTen: Secure Multi-Party Computation Meets Machine LearningBrian Knott, Shobha Venkataraman, Awni Y. Hannun, Shubho Sengupta, Mark Ibrahim, Laurens van der Maaten. 4961-4973 [doi]

Can contrastive learning avoid shortcut solutions?Joshua Robinson, Li Sun, Ke Yu, Kayhan Batmanghelich, Stefanie Jegelka, Suvrit Sra. 4974-4986 [doi]

See More for Scene: Pairwise Consistency Learning for Scene ClassificationGongwei Chen, Xinhang Song, Bohan Wang, Shuqiang Jiang. 4987-4999 [doi]

Provable Guarantees for Self-Supervised Deep Learning with Spectral Contrastive LossJeff Z. HaoChen, Colin Wei, Adrien Gaidon, Tengyu Ma 0001. 5000-5011 [doi]

Greedy Approximation Algorithms for Active Sequential Hypothesis TestingKyra Gan, Su Jia, Andrew A. Li. 5012-5024 [doi]

When False Positive is Intolerant: End-to-End Optimization with Low FPR for Multipartite RankingPeisong Wen, Qianqian Xu, Zhiyong Yang 0001, Yuan He, Qingming Huang. 5025-5037 [doi]

Convex Polytope Trees and its Application to VAEMohammadreza Armandpour, Ali Sadeghian, Mingyuan Zhou. 5038-5051 [doi]

The Skellam Mechanism for Differentially Private Federated LearningNaman Agarwal, Peter Kairouz, Ziyu Liu 0002. 5052-5064 [doi]

Stability and Deviation Optimal Risk Bounds with Convergence Rate $O(1/n)$Yegor Klochkov, Nikita Zhivotovskiy. 5065-5076 [doi]

SketchGen: Generating Constrained CAD SketchesWamiq Reyaz Para, Shariq Farooq Bhat, Paul Guerrero, Tom Kelly, Niloy J. Mitra, Leonidas J. Guibas, Peter Wonka. 5077-5088 [doi]

CLDA: Contrastive Learning for Semi-Supervised Domain AdaptationAnkit Singh. 5089-5101 [doi]

Differentially Private n-gram ExtractionKunho Kim, Sivakanth Gopi, Janardhan Kulkarni, Sergey Yekhanin. 5102-5111 [doi]

Capturing implicit hierarchical structure in 3D biomedical images with self-supervised hyperbolic representationsJoy Hsu, Jeffrey Gu, Gong Her Wu, Wah Chiu, Serena Yeung. 5112-5123 [doi]

Noisy Recurrent Neural NetworksSoon Hoe Lim, N. Benjamin Erichson, Liam Hodgkinson, Michael W. Mahoney. 5124-5137 [doi]

Matrix encoding networks for neural combinatorial optimizationYeong-Dae Kwon, Jinho Choo, Iljoo Yoon, Minah Park, Duwon Park, Youngjune Gwon. 5138-5149 [doi]

When Is Unsupervised Disentanglement Possible?Daniella Horan, Eitan Richardson, Yair Weiss. 5150-5161 [doi]

Continuous Latent Process FlowsRuizhi Deng, Marcus A. Brubaker, Greg Mori, Andreas M. Lehrmann. 5162-5173 [doi]

Perturbation-based Regret Analysis of Predictive Control in Linear Time Varying SystemsYiheng Lin, Yang Hu, Guanya Shi, Haoyuan Sun, Guannan Qu, Adam Wierman. 5174-5185 [doi]

Dataset Distillation with Infinitely Wide Convolutional NetworksTimothy Nguyen, Roman Novak, Lechao Xiao, Jaehoon Lee 0001. 5186-5198 [doi]

SPANN: Highly-efficient Billion-scale Approximate Nearest Neighborhood SearchQi Chen, Bing Zhao, Haidong Wang, Mingqin Li, Chuanjie Liu, Zengzhong Li, Mao Yang, Jingdong Wang 0001. 5199-5212 [doi]

Distilling Object Detectors with Feature RichnessZhixing Du, Rui Zhang 0040, Ming Chang, Xishan Zhang, Shaoli Liu, Tianshi Chen 0002, Yunji Chen. 5213-5224 [doi]

Analysis of one-hidden-layer neural networks via the resolvent methodVanessa Piccolo, Dominik Schröder. 5225-5235 [doi]

Grounding Spatio-Temporal Language with TransformersTristan Karch, Laetitia Teodorescu, Katja Hofmann, Clément Moulin-Frier, Pierre-Yves Oudeyer. 5236-5249 [doi]

Learning where to learn: Gradient sparsity in meta and continual learningJohannes von Oswald, Dominic Zhao, Seijin Kobayashi, Simon Schug, Massimo Caccia, Nicolas Zucchet, João Sacramento. 5250-5263 [doi]

Domain Invariant Representation Learning with Domain Density TransformationsA. Tuan Nguyen, Toan Tran, Yarin Gal, Atilim Gunes Baydin. 5264-5275 [doi]

PlayVirtual: Augmenting Cycle-Consistent Virtual Trajectories for Reinforcement LearningTao Yu, Cuiling Lan, Wenjun Zeng, Mingxiao Feng, Zhizheng Zhang 0004, Zhibo Chen 0001. 5276-5289 [doi]

Efficient Equivariant NetworkLingshen He, Yuxuan Chen, Zhengyang Shen, Yiming Dong, Yisen Wang 0001, Zhouchen Lin. 5290-5302 [doi]

Unifying Gradient Estimators for Meta-Reinforcement Learning via Off-Policy EvaluationYunhao Tang, Tadashi Kozuno, Mark Rowland, Rémi Munos, Michal Valko. 5303-5315 [doi]

Even your Teacher Needs Guidance: Ground-Truth Targets Dampen Regularization Imposed by Self-DistillationKenneth Borup, Lars Nørvang Andersen. 5316-5327 [doi]

Compressing Neural Networks: Towards Determining the Optimal Layer-wise DecompositionLucas Liebenwein, Alaa Maalouf, Dan Feldman, Daniela Rus. 5328-5344 [doi]

Equilibrium and non-Equilibrium regimes in the learning of Restricted Boltzmann MachinesAurélien Decelle, Cyril Furtlehner, Beatriz Seoane. 5345-5359 [doi]

Imitation with Neural Density ModelsKuno Kim, Akshat Jindal, Yang Song 0011, Jiaming Song, Yanan Sui, Stefano Ermon. 5360-5372 [doi]

Accurate Point Cloud Registration with Robust Optimal TransportZhengyang Shen, Jean Feydy, Peirong Liu, Ariel Hernán Curiale, Rubén San José Estépar, Raúl San José Estépar, Marc Niethammer. 5373-5389 [doi]

Simple steps are all you need: Frank-Wolfe and generalized self-concordant functionsAlejandro Carderera, Mathieu Besançon, Sebastian Pokutta. 5390-5401 [doi]

Automatic Data Augmentation for Generalization in Reinforcement LearningRoberta Raileanu, Max Goldstein, Denis Yarats, Ilya Kostrikov, Rob Fergus. 5402-5415 [doi]

Blending Anti-Aliasing into Vision TransformerShengju Qian, Hao Shao, Yi Zhu, Mu Li 0003, Jiaya Jia. 5416-5429 [doi]

A Trainable Spectral-Spatial Sparse Coding Model for Hyperspectral Image RestorationThéo Bodrito, Alexandre Zouaoui, Jocelyn Chanussot, Julien Mairal. 5430-5442 [doi]

Posterior Collapse and Latent Variable Non-identifiabilityYixin Wang, David M. Blei, John P. Cunningham. 5443-5455 [doi]

The Benefits of Implicit Regularization from SGD in Least Squares ProblemsDifan Zou, Jingfeng Wu, Vladimir Braverman, Quanquan Gu, Dean P. Foster, Sham M. Kakade. 5456-5468 [doi]

Generalization of Model-Agnostic Meta-Learning Algorithms: Recurring and Unseen TasksAlireza Fallah 0001, Aryan Mokhtari, Asuman E. Ozdaglar. 5469-5480 [doi]

Factored Policy Gradients: Leveraging Structure for Efficient Learning in MOMDPsThomas Spooner, Nelson Vadori, Sumitra Ganesh. 5481-5493 [doi]

MarioNette: Self-Supervised Sprite LearningDmitriy Smirnov 0001, Michaël Gharbi, Matthew Fisher, Vitor Guizilini, Alexei A. Efros, Justin M. Solomon. 5494-5505 [doi]

RLlib Flow: Distributed Reinforcement Learning is a Dataflow ProblemEric Liang, Zhanghao Wu, Michael Luo, Sven Mika, Joseph E. Gonzalez, Ion Stoica. 5506-5517 [doi]

Improve Agents without Retraining: Parallel Tree Search with Off-Policy CorrectionGal Dalal, Assaf Hallak, Steven Dalton, Iuri Frosio, Shie Mannor, Gal Chechik. 5518-5530 [doi]

Redesigning the Transformer Architecture with Insights from Multi-particle Dynamical SystemsSubhabrata Dutta, Tanya Gautam, Soumen Chakrabarti, Tanmoy Chakraborty 0002. 5531-5544 [doi]

Exploring Architectural Ingredients of Adversarially Robust Deep Neural NetworksHanxun Huang, Yisen Wang 0001, Sarah M. Erfani, Quanquan Gu, James Bailey 0001, Xingjun Ma. 5545-5559 [doi]

Center Smoothing: Certified Robustness for Networks with Structured OutputsAounon Kumar, Tom Goldstein. 5560-5575 [doi]

Breaking the Linear Iteration Cost Barrier for Some Well-known Conditional Gradient Methods Using MaxIP Data-structuresZhaozhuo Xu, Zhao Song 0002, Anshumali Shrivastava. 5576-5589 [doi]

Neural Regression, Representational Similarity, Model Zoology & Neural Taskonomy at Scale in Rodent Visual CortexColin Conwell, David Mayo, Andrei Barbu, Michael A. Buice, George Alvarez, Boris Katz. 5590-5607 [doi]

A Topological Perspective on Causal InferenceDuligur Ibeling, Thomas Icard. 5608-5619 [doi]

Parameter Inference with Bifurcation DiagramsGregory Szép, Neil Dalchau, Attila Csikász-Nagy. 5620-5630 [doi]

Scalable Thompson Sampling using Sparse Gaussian Process ModelsSattar Vakili, Henry B. Moss, Artem Artemev, Vincent Dutordoir, Victor Picheny. 5631-5643 [doi]

Robust Counterfactual Explanations on Graph Neural NetworksMohit Bajaj, Lingyang Chu, Zi Yu Xue, Jian Pei, Lanjun Wang, Peter Cho-Ho Lam, Yong Zhang. 5644-5655 [doi]

Similarity and Matching of Neural Network RepresentationsAdrián Csiszárik, Péter Korösi-Szabó, Ákos K. Matszangosz, Gergely Papp, Dániel Varga. 5656-5668 [doi]

DOCTOR: A Simple Method for Detecting Misclassification ErrorsFederica Granese, Marco Romanelli 0002, Daniele Gorla, Catuscia Palamidessi, Pablo Piantanida. 5669-5681 [doi]

Contrastive Laplacian EigenmapsHao Zhu, Ke Sun 0001, Peter Koniusz. 5682-5695 [doi]

Machine learning structure preserving brackets for forecasting irreversible processesKookjin Lee, Nathaniel Trask, Panos Stinis. 5696-5707 [doi]

On the Variance of the Fisher Information for Deep LearningAlexander Soen, Ke Sun 0001. 5708-5719 [doi]

A$^2$-Net: Learning Attribute-Aware Hash Codes for Large-Scale Fine-Grained Image RetrievalXiu-Shen Wei, Yang Shen, Xuhao Sun, Han-Jia Ye, Jian Yang 0003. 5720-5730 [doi]

Shape Registration in the Time of TransformersGiovanni Trappolini, Luca Cosmo, Luca Moschella, Riccardo Marin, Simone Melzi, Emanuele Rodolà. 5731-5744 [doi]

Brick-by-Brick: Combinatorial Construction with Deep Reinforcement LearningHyunsoo Chung, Jungtaek Kim 0001, Boris Knyazev, Jinhwi Lee, Graham W. Taylor, Jaesik Park, Minsu Cho. 5745-5757 [doi]

Dissecting the Diffusion Process in Linear Graph Convolutional NetworksYifei Wang, Yisen Wang 0001, Jiansheng Yang, Zhouchen Lin. 5758-5769 [doi]

Dynamic Grained Encoder for Vision TransformersLin Song, Songyang Zhang, Songtao Liu, Zeming Li, Xuming He 0001, Hongbin Sun 0001, Jian Sun 0001, Nanning Zheng 0001. 5770-5783 [doi]

Understanding Negative Samples in Instance Discriminative Self-supervised Representation LearningKento Nozawa, Issei Sato. 5784-5797 [doi]

On UMAP's True Loss FunctionSebastian Damrich, Fred A. Hamprecht. 5798-5809 [doi]

Fast Pure Exploration via Frank-WolfePo-An Wang, Ruo-Chun Tzeng, Alexandre Proutière. 5810-5821 [doi]

iFlow: Numerically Invertible Flows for Efficient Lossless Compression via a Uniform CoderShifeng Zhang, Ning Kang 0001, Tom Ryder, Zhenguo Li. 5822-5833 [doi]

History Aware Multimodal Transformer for Vision-and-Language NavigationShizhe Chen, Pierre-Louis Guhur, Cordelia Schmid, Ivan Laptev. 5834-5847 [doi]

Meta Two-Sample Testing: Learning Kernels for Testing with Limited DataFeng Liu 0003, Wenkai Xu, Jie Lu 0001, Danica J. Sutherland. 5848-5860 [doi]

Process for Adapting Language Models to Society (PALMS) with Values-Targeted DatasetsIrene Solaiman, Christy Dennison. 5861-5873 [doi]

The Lazy Online Subgradient Algorithm is Universal on Strongly Convex DomainsDaron Anderson, Douglas J. Leith. 5874-5884 [doi]

Computer-Aided Design as LanguageYaroslav Ganin, Sergey Bartunov, Yujia Li, Ethan Keller, Stefano Saliceti. 5885-5897 [doi]

COHESIV: Contrastive Object and Hand Embedding Segmentation In VideoDandan Shan, Richard E. L. Higgins, David F. Fouhey. 5898-5909 [doi]

ByPE-VAE: Bayesian Pseudocoresets Exemplar VAEQingzhong Ai, Lirong He, Shiyu Liu, Zenglin Xu. 5910-5920 [doi]

Recovery Analysis for Plug-and-Play Priors using the Restricted Eigenvalue ConditionJiaming Liu, M. Salman Asif, Brendt Wohlberg, Ulugbek Kamilov. 5921-5933 [doi]

Group Equivariant SubsamplingJin Xu 0011, Hyunjik Kim, Thomas Rainforth, Yee Whye Teh. 5934-5946 [doi]

Data Sharing and Compression for Cooperative Networked ControlJiangnan Cheng, Marco Pavone, Sachin Katti, Sandeep Chinchali, Ao Tang. 5947-5958 [doi]

Hyperbolic Procrustes Analysis Using Riemannian GeometryYa-Wei Eileen Lin, Yuval Kluger, Ronen Talmon. 5959-5971 [doi]

No Fear of Heterogeneity: Classifier Calibration for Federated Learning with Non-IID DataMi Luo, Fei Chen, Dapeng Hu, Yifan Zhang, Jian Liang, Jiashi Feng. 5972-5984 [doi]

Preconditioned Gradient Descent for Over-Parameterized Nonconvex Matrix FactorizationJialun Zhang, Salar Fattahi, Richard Y. Zhang. 5985-5996 [doi]

Improving Contrastive Learning on Imbalanced Data via Open-World SamplingZiyu Jiang, Tianlong Chen, Ting Chen, Zhangyang Wang. 5997-6009 [doi]

Searching for Efficient Transformers for Language ModelingDavid R. So, Wojciech Manke, Hanxiao Liu, Zihang Dai, Noam Shazeer, Quoc V. Le. 6010-6022 [doi]

Scaling Ensemble Distribution Distillation to Many Classes with Proxy TargetsMax Ryabinin, Andrey Malinin, Mark J. F. Gales. 6023-6035 [doi]

Multi-Person 3D Motion Prediction with Multi-Range TransformersJiashun Wang, Huazhe Xu, Medhini Narasimhan, Xiaolong Wang 0004. 6036-6049 [doi]

STEM: A Stochastic Two-Sided Momentum Algorithm Achieving Near-Optimal Sample and Communication Complexities for Federated LearningPrashant Khanduri, Pranay Sharma, Haibo Yang, Mingyi Hong, Jia Liu 0002, Ketan Rajawat, Pramod K. Varshney. 6050-6061 [doi]

Bubblewrap: Online tiling and real-time flow prediction on neural manifoldsAnne Draelos, Pranjal Gupta, Na Young Jun, Chaichontat Sriworarat, John M. Pearson. 6062-6074 [doi]

The Semi-Random Satisfaction of Voting AxiomsLirong Xia. 6075-6086 [doi]

Deep Marching Tetrahedra: a Hybrid Representation for High-Resolution 3D Shape SynthesisTianchang Shen, Jun Gao, Kangxue Yin, Ming-Yu Liu 0001, Sanja Fidler. 6087-6101 [doi]

Learning to Combine Per-Example Solutions for Neural Program SynthesisDisha Shrivastava, Hugo Larochelle, Daniel Tarlow. 6102-6114 [doi]

On Success and Simplicity: A Second Look at Transferable Targeted AttacksZhengyu Zhao 0001, Zhuoran Liu, Martha A. Larson. 6115-6128 [doi]

Provably efficient, succinct, and precise explanationsGuy Blanc, Jane Lange, Li-Yang Tan. 6129-6141 [doi]

Refined Learning Bounds for Kernel and Approximate $k$-MeansYong Liu 0018. 6142-6154 [doi]

Learning Causal Semantic Representation for Out-of-Distribution PredictionChang Liu 0030, Xinwei Sun 0001, Jindong Wang 0001, Haoyue Tang, Tao Li 0040, Tao Qin, Wei Chen 0034, Tie-Yan Liu. 6155-6170 [doi]

A first-order primal-dual method with adaptivity to local smoothnessMaria-Luiza Vladarean, Yura Malitsky, Volkan Cevher. 6171-6182 [doi]

A Theory-Driven Self-Labeling Refinement Method for Contrastive Representation LearningPan Zhou, Caiming Xiong, Xiaotong Yuan, Steven Chu Hong Hoi. 6183-6197 [doi]

Adversarial Robustness with Semi-Infinite Constrained LearningAlexander Robey, Luiz F. O. Chamon, George J. Pappas, Hamed Hassani, Alejandro Ribeiro. 6198-6215 [doi]

Conformal Time-series ForecastingKamile Stankeviciute, Ahmed M. Alaa, Mihaela van der Schaar. 6216-6228 [doi]

A 3D Generative Model for Structure-Based Drug DesignShitong Luo, Jiaqi Guan, Jianzhu Ma, Jian Peng 0001. 6229-6239 [doi]

Bootstrapping the Error of Oja's AlgorithmRobert Lunde, Purnamrita Sarkar, Rachel Ward. 6240-6252 [doi]

Landscape analysis of an improved power method for tensor decompositionJoe Kileel, Timo Klock, João M. Pereira 0002. 6253-6265 [doi]

Curriculum Offline Imitating LearningMinghuan Liu, Hanye Zhao, Zhengyu Yang, Jian Shen 0003, Weinan Zhang 0001, Li Zhao, Tie-Yan Liu. 6266-6277 [doi]

Robust Pose Estimation in Crowded Scenes with Direct Pose-Level InferenceDongkai Wang, Shiliang Zhang, Gang Hua 0001. 6278-6289 [doi]

Ising Model Selection Using $\ell_{1}$-Regularized Linear Regression: A Statistical Mechanics AnalysisXiangming Meng, Tomoyuki Obuchi, Yoshiyuki Kabashima. 6290-6303 [doi]

Conformal Prediction using Conditional HistogramsMatteo Sesia, Yaniv Romano. 6304-6315 [doi]

Contrastive Graph Poisson Networks: Semi-Supervised Learning with Extremely Limited LabelsSheng Wan, Yibing Zhan, Liu Liu 0014, Baosheng Yu, Shirui Pan, Chen Gong 0002. 6316-6327 [doi]

Collaborative Uncertainty in Multi-Agent Trajectory ForecastingBohan Tang, Yiqi Zhong, Ulrich Neumann, Gang Wang, Siheng Chen, Ya Zhang 0002. 6328-6340 [doi]

Network-to-Network Regularization: Enforcing Occam's Razor to Improve GeneralizationRohan Ghosh, Mehul Motani. 6341-6352 [doi]

Generalized and Discriminative Few-Shot Object Detection via SVD-Dictionary EnhancementAming Wu, Suqi Zhao, Cheng Deng, Wei Liu 0005. 6353-6364 [doi]

Conditioning Sparse Variational Gaussian Processes for Online Decision-makingWesley J. Maddox, Samuel Stanton, Andrew Gordon Wilson. 6365-6379 [doi]

Spherical Motion Dynamics: Learning Dynamics of Normalized Neural Network using SGD and Weight DecayRuosi Wan, Zhanxing Zhu, Xiangyu Zhang 0005, Jian Sun 0001. 6380-6391 [doi]

Imitating Deep Learning Dynamics via Locally Elastic Stochastic Differential EquationsJiayao Zhang 0001, Hua Wang, Weijie J. Su. 6392-6403 [doi]

Probabilistic Forecasting: A Level-Set ApproachHilaf Hasson, Bernie Wang, Tim Januschowski, Jan Gasthaus. 6404-6416 [doi]

Roto-translated Local Coordinate Frames For Interacting Dynamical SystemsMiltiadis Kofinas, Naveen Shankar Nagaraja, Efstratios Gavves. 6417-6429 [doi]

ParK: Sound and Efficient Kernel Ridge Regression by Feature Space PartitionsLuigi Carratino, Stefano Vigogna, Daniele Calandriello, Lorenzo Rosasco. 6430-6441 [doi]

Scaling Gaussian Processes with Derivative Information Using Variational InferenceMisha Padidar, Xinran Zhu, Leo Huang, Jacob R. Gardner, David Bindel. 6442-6453 [doi]

On the Representation of Solutions to Elliptic PDEs in Barron SpacesZiang Chen, Jianfeng Lu 0001, Yulong Lu. 6454-6465 [doi]

A/B Testing for Recommender Systems in a Two-sided MarketplacePreetam Nandy, Divya Venugopalan, Chun Lo, Shaunak Chatterjee. 6466-6477 [doi]

Retiring Adult: New Datasets for Fair Machine LearningFrances Ding, Moritz Hardt, John Miller 0001, Ludwig Schmidt. 6478-6490 [doi]

Cardinality constrained submodular maximization for random streamsPaul Liu, Aviad Rubinstein, Jan Vondrák, Junyao Zhao 0001. 6491-6502 [doi]

Self-Instantiated Recurrent Units with Dynamic Soft RecursionAston Zhang, Yi Tay, Yikang Shen, Alvin Chan, Shuai Zhang 0007. 6503-6514 [doi]

Sparse Uncertainty Representation in Deep Learning with Inducing WeightsHippolyt Ritter, Martin Kukla, Cheng Zhang 0005, Yingzhen Li. 6515-6528 [doi]

Scalable Inference of Sparsely-changing Gaussian Markov Random FieldsSalar Fattahi, Andrés Gómez 0001. 6529-6541 [doi]

Grad2Task: Improved Few-shot Text Classification Using Gradients for Task RepresentationJixuan Wang, Kuan-Chieh Wang, Frank Rudzicz, Michael Brudno. 6542-6554 [doi]

Learnability of Linear Thresholds from Label ProportionsRishi Saket. 6555-6566 [doi]

A variational approximate posterior for the deep Wishart processSebastian W. Ober, Laurence Aitchison. 6567-6579 [doi]

Neural Pseudo-Label Optimism for the Bank Loan ProblemAldo Pacchiano, Shaun Singh, Edward Chou, Alexander C. Berg, Jakob N. Foerster. 6580-6593 [doi]

Visualizing the Emergence of Intermediate Visual Patterns in DNNsMingjie Li, Shaobo Wang, Quanshi Zhang. 6594-6607 [doi]

Learning 3D Dense Correspondence via Canonical Point AutoencoderAn-Chieh Cheng, Xueting Li, Min Sun, Ming-Hsuan Yang 0001, Sifei Liu. 6608-6620 [doi]

Speech-T: Transducer for Text to Speech and BeyondJiawei Chen 0008, Xu Tan 0003, Yichong Leng, Jin Xu 0010, Guihua Wen, Tao Qin, Tie-Yan Liu. 6621-6633 [doi]

Multi-modal Dependency Tree for Video CaptioningWentian Zhao, Xinxiao Wu, Jiebo Luo. 6634-6645 [doi]

Greedy and Random Quasi-Newton Methods with Faster Explicit Superlinear ConvergenceDachao Lin, Haishan Ye, Zhihua Zhang. 6646-6657 [doi]

Neural Tangent Kernel Maximum Mean DiscrepancyXiuyuan Cheng, Yao Xie 0002. 6658-6670 [doi]

Subgraph Federated Learning with Missing Neighbor GenerationKe Zhang, Carl Yang, Xiaoxiao Li, Lichao Sun, Siu-Ming Yiu. 6671-6682 [doi]

Bellman-consistent Pessimism for Offline Reinforcement LearningTengyang Xie, Ching-An Cheng, Nan Jiang 0008, Paul Mineiro, Alekh Agarwal. 6683-6694 [doi]

Can You Learn an Algorithm? Generalizing from Easy to Hard Problems with Recurrent NetworksAvi Schwarzschild, Eitan Borgnia, Arjun Gupta, Furong Huang, Uzi Vishkin, Micah Goldblum, Tom Goldstein. 6695-6706 [doi]

Sub-Linear Memory: How to Make Performers SLiMValerii Likhosherstov, Krzysztof Marcin Choromanski, Jared Quincy Davis, Xingyou Song, Adrian Weller. 6707-6719 [doi]

Efficient Learning of Discrete-Continuous Computation GraphsDavid Friede, Mathias Niepert. 6720-6732 [doi]

VQ-GNN: A Universal Framework to Scale up Graph Neural Networks using Vector QuantizationMucong Ding, Kezhi Kong, Jingling Li, Chen Zhu, John Dickerson 0001, Furong Huang, Tom Goldstein. 6733-6746 [doi]

Overcoming Catastrophic Forgetting in Incremental Few-Shot Learning by Finding Flat MinimaGuangyuan Shi, Jiaxin Chen, Wenlong Zhang, Li-Ming Zhan, Xiao-Ming Wu 0003. 6747-6761 [doi]

Functional Neural Networks for Parametric Image Restoration ProblemsFangzhou Luo, Xiaolin Wu 0001, Yanhui Guo. 6762-6775 [doi]

Intrinsic Dimension, Persistent Homology and Generalization in Neural NetworksTolga Birdal, Aaron Lou, Leonidas J. Guibas, Umut Simsekli. 6776-6789 [doi]

GemNet: Universal Directional Graph Neural Networks for MoleculesJohannes Gasteiger, Florian Becker, Stephan Günnemann. 6790-6802 [doi]

Loss function based second-order Jensen inequality and its application to particle variational inferenceFutoshi Futami, Tomoharu Iwata, Naonori Ueda, Issei Sato, Masashi Sugiyama. 6803-6815 [doi]

Detecting and Adapting to Irregular Distribution Shifts in Bayesian Online LearningAodong Li, Alex Boyd, Padhraic Smyth, Stephan Mandt. 6816-6828 [doi]

Asynchronous Decentralized SGD with Quantized and Local UpdatesGiorgi Nadiradze, Amirmojtaba Sabour, Peter Davies, Shigang Li 0002, Dan Alistarh. 6829-6842 [doi]

Stochastic Shortest Path: Minimax, Parameter-Free and Towards Horizon-Free RegretJean Tarbouriech, Runlong Zhou, Simon S. Du, Matteo Pirotta, Michal Valko, Alessandro Lazaric. 6843-6855 [doi]

Nested Counterfactual Identification from Arbitrary Surrogate ExperimentsJuan D. Correa, Sanghack Lee, Elias Bareinboim. 6856-6867 [doi]

Sim and Real: Better TogetherShirli Di-Castro Shashua, Dotan Di Castro, Shie Mannor. 6868-6880 [doi]

Trustworthy Multimodal Regression with Mixture of Normal-inverse Gamma DistributionsHuan Ma, Zongbo Han, Changqing Zhang, Huazhu Fu, Joey Tianyi Zhou, Qinghua Hu. 6881-6893 [doi]

An Empirical Study of Adder Neural Networks for Object DetectionXinghao Chen 0001, Chang Xu 0002, Minjing Dong, Chunjing Xu, Yunhe Wang 0001. 6894-6905 [doi]

Does Knowledge Distillation Really Work?Samuel Stanton, Pavel Izmailov, Polina Kirichenko, Alexander A. Alemi, Andrew Gordon Wilson. 6906-6919 [doi]

Teachable Reinforcement Learning via Advice DistillationOlivia Watkins, Abhishek Gupta 0004, Trevor Darrell, Pieter Abbeel, Jacob Andreas. 6920-6933 [doi]

Antipodes of Label Differential Privacy: PATE and ALIBIMani Malek Esmaeili, Ilya Mironov, Karthik Prasad, Igor Shilov, Florian Tramèr. 6934-6945 [doi]

Visual Search Asymmetry: Deep Nets and Humans Share Similar Inherent BiasesShashi Kant Gupta, Mengmi Zhang, Chia-Chien Wu, Jeremy M. Wolfe, Gabriel Kreiman. 6946-6959 [doi]

On the Universality of Graph Neural Networks on Large Random GraphsNicolas Keriven, Alberto Bietti, Samuel Vaiter. 6960-6971 [doi]

Inverse Reinforcement Learning in a Continuous State Space with Formal GuaranteesGregory Dexter, Kevin Bello, Jean Honorio. 6972-6982 [doi]

Adversarial Attacks on Graph Classifiers via Bayesian OptimisationXingchen Wan, Henry Kenlay, Robin Ru, Arno Blaas, Michael A. Osborne, Xiaowen Dong 0001. 6983-6996 [doi]

Regulating algorithmic filtering on social mediaSarah Huiyi Cen, Devavrat Shah. 6997-7011 [doi]

argmax centroidChengYue Gong, Mao Ye, Qiang Liu 0001. 7012-7024 [doi]

Contrastive Learning of Global and Local Video RepresentationsShuang Ma, Zhaoyang Zeng, Daniel McDuff, Yale Song. 7025-7040 [doi]

BooVI: Provably Efficient Bootstrapped Value IterationBoyi Liu, Qi Cai, Zhuoran Yang, Zhaoran Wang. 7041-7053 [doi]

Do Wider Neural Networks Really Help Adversarial Robustness?Boxi Wu, Jinghui Chen, Deng Cai 0001, Xiaofei He 0001, Quanquan Gu. 7054-7067 [doi]

Exploring the Limits of Out-of-Distribution DetectionStanislav Fort, Jie Ren 0006, Balaji Lakshminarayanan. 7068-7081 [doi]

ABC: Auxiliary Balanced Classifier for Class-imbalanced Semi-supervised LearningHyuck Lee, SeungJae Shin, Heeyoung Kim. 7082-7094 [doi]

BCD Nets: Scalable Variational Approaches for Bayesian Causal DiscoveryChris Cundy, Aditya Grover, Stefano Ermon. 7095-7110 [doi]

Discovering Dynamic Salient Regions for Spatio-Temporal Graph Neural NetworksIulia Duta, Andrei Liviu Nicolicioiu, Marius Leordeanu. 7111-7125 [doi]

Information-constrained optimization: can adaptive processing of gradients help?Jayadev Acharya, Clément L. Canonne, Prathamesh Mayekar, Himanshu Tyagi. 7126-7138 [doi]

Towards Calibrated Model for Long-Tailed Visual Recognition from Prior PerspectiveZhengzhuo Xu, Zenghao Chai, Chun Yuan. 7139-7152 [doi]

Learning to Draw: Emergent Communication through SketchingDaniela Mihai, Jonathon S. Hare. 7153-7166 [doi]

Self-Supervised Learning of Event-Based Optical Flow with Spiking Neural NetworksJesse J. Hagenaars, Federico Paredes-Vallés, Guido de Croon. 7167-7179 [doi]

On the Value of Infinite Gradients in Variational Autoencoder ModelsBin Dai, Wenliang Li, David P. Wipf. 7180-7192 [doi]

Online Robust Reinforcement Learning with Model UncertaintyYue Wang, Shaofeng Zou. 7193-7206 [doi]

Neural View Synthesis and Matching for Semi-Supervised Few-Shot Learning of 3D PoseAngtian Wang, Shenxiao Mei, Alan L. Yuille, Adam Kortylewski. 7207-7219 [doi]

Sharp Impossibility Results for Hyper-graph TestingJiashun Jin, Zheng Tracy Ke, Jiajun Liang. 7220-7231 [doi]

Evaluating Gradient Inversion Attacks and Defenses in Federated LearningYangsibo Huang, Samyak Gupta, Zhao Song 0002, Kai Li, Sanjeev Arora. 7232-7241 [doi]

Faster Non-asymptotic Convergence for Double Q-learningLin Zhao 0009, Huaqing Xiong, Yingbin Liang. 7242-7253 [doi]

Towards Tight Communication Lower Bounds for Distributed OptimisationJanne H. Korhonen, Dan Alistarh. 7254-7266 [doi]

Fast Multi-Resolution Transformer Fine-tuning for Extreme Multi-label Text ClassificationJiong Zhang, Wei-Cheng Chang, Hsiang-Fu Yu, Inderjit S. Dhillon. 7267-7280 [doi]

HRFormer: High-Resolution Vision Transformer for Dense PredictYuhui Yuan, Rao Fu, Lang Huang, Weihong Lin, Chao Zhang 0001, Xilin Chen 0001, Jingdong Wang 0001. 7281-7293 [doi]

Manifold Topology Divergence: a Framework for Comparing Data ManifoldsSerguei Barannikov, Ilya Trofimov, Grigorii Sotnikov, Ekaterina Trimbach, Alexander Korotin, Alexander Filippov, Evgeny Burnaev. 7294-7305 [doi]

Weak-shot Fine-grained Classification via Similarity TransferJunjie Chen, Li Niu 0002, Liu Liu, Liqing Zhang 0001. 7306-7318 [doi]

Shape your Space: A Gaussian Mixture Regularization Approach to Deterministic AutoencodersAmrutha Saseendran, Kathrin Skubch, Stefan Falkner, Margret Keuper. 7319-7332 [doi]

An Even More Optimal Stochastic Optimization Algorithm: Minibatching and Interpolation LearningBlake E. Woodworth, Nathan Srebro. 7333-7345 [doi]

Indexed Minimum Empirical Divergence for Unimodal BanditsHassan Saber, Pierre Ménard, Odalric-Ambrym Maillard. 7346-7356 [doi]

SOAT: A Scene- and Object-Aware Transformer for Vision-and-Language NavigationAbhinav Moudgil, Arjun Majumdar, Harsh Agrawal, Stefan Lee, Dhruv Batra. 7357-7367 [doi]

A Normative and Biologically Plausible Algorithm for Independent Component AnalysisYanis Bahroun, Dmitri B. Chklovskii, Anirvan M. Sengupta. 7368-7384 [doi]

Regret Bounds for Gaussian-Process Optimization in Large DomainsManuel Wüthrich, Bernhard Schölkopf, Andreas Krause 0001. 7385-7396 [doi]

Deeply Shared Filter Bases for Parameter-Efficient Convolutional Neural NetworksWoochul Kang, Daeyeon Kim. 7397-7408 [doi]

On Optimal Robustness to Adversarial Corruption in Online Decision ProblemsShinji Ito. 7409-7420 [doi]

Directed Spectrum Measures Improve Latent Network Models Of Neural PopulationsNeil Gallagher, Kafui Dzirasa, David E. Carlson. 7421-7435 [doi]

Uncertainty-Based Offline Reinforcement Learning with Diversified Q-EnsembleGaon An, Seungyong Moon, Jang-Hyun Kim, Hyun Oh Song. 7436-7447 [doi]

Distribution-free inference for regression: discrete, continuous, and in betweenYonghoon Lee, Rina Barber. 7448-7459 [doi]

Statistical Inference with M-Estimators on Adaptively Collected DataKelly W. Zhang, Lucas Janson, Susan A. Murphy. 7460-7471 [doi]

NeuroLKH: Combining Deep Learning Model with Lin-Kernighan-Helsgaun Heuristic for Solving the Traveling Salesman ProblemLiang Xin, Wen Song, Zhiguang Cao, Jie Zhang 0002. 7472-7483 [doi]

LSH-SMILE: Locality Sensitive Hashing Accelerated Simulation and LearningChonghao Sima, Yexiang Xue. 7484-7496 [doi]

Meta-learning with an Adaptive Task SchedulerHuaxiu Yao, Yu Wang 0002, Ying Wei 0001, Peilin Zhao, Mehrdad Mahdavi, Defu Lian, Chelsea Finn. 7497-7509 [doi]

Neural Active Learning with Performance GuaranteesZhilei Wang, Pranjal Awasthi, Christoph Dann, Ayush Sekhari, Claudio Gentile. 7510-7521 [doi]

A Gradient Method for Multilevel OptimizationRyo Sato, Mirai Tanaka, Akiko Takeda. 7522-7533 [doi]

Edge Representation Learning with HypergraphsJaehyeong Jo, Jinheon Baek, Seul Lee, Dongki Kim, Minki Kang, Sung Ju Hwang. 7534-7546 [doi]

One Question Answering Model for Many Languages with Cross-lingual Dense Passage RetrievalAkari Asai, Xinyan Yu, Jungo Kasai, Hanna Hajishirzi. 7547-7560 [doi]

LEADS: Learning Dynamical Systems that Generalize Across EnvironmentsYuan Yin, Ibrahim Ayed, Emmanuel de Bézenac, Nicolas Baskiotis, Patrick Gallinari. 7561-7573 [doi]

Storchastic: A Framework for General Stochastic Automatic DifferentiationEmile van Krieken, Jakub M. Tomczak, Annette ten Teije. 7574-7587 [doi]

Concentration inequalities under sub-Gaussian and sub-exponential conditionsAndreas Maurer, Massimiliano Pontil. 7588-7597 [doi]

Variance-Aware Off-Policy Evaluation with Linear Function ApproximationYifei Min, Tianhao Wang 0002, Dongruo Zhou, Quanquan Gu. 7598-7610 [doi]

A Provably Efficient Sample Collection Strategy for Reinforcement LearningJean Tarbouriech, Matteo Pirotta, Michal Valko, Alessandro Lazaric. 7611-7624 [doi]

Improved Regret Bounds for Tracking Experts with MemoryJames Robinson, Mark Herbster. 7625-7636 [doi]

Robustness of Graph Neural Networks at ScaleSimon Geisler, Tobias Schmidt, Hakan Sirin, Daniel Zügner, Aleksandar Bojchevski, Stephan Günnemann. 7637-7649 [doi]

Random Noise Defense Against Query-Based Black-Box AttacksZeyu Qin, Yanbo Fan, Hongyuan Zha, Baoyuan Wu. 7650-7663 [doi]

SADGA: Structure-Aware Dual Graph Aggregation Network for Text-to-SQLRuichu Cai, Jinjie Yuan, Boyan Xu, Zhifeng Hao. 7664-7676 [doi]

Near-Optimal Offline Reinforcement Learning via Double Variance ReductionMing Yin, Yu Bai, Yu-Xiang Wang 0003. 7677-7688 [doi]

Joint Modeling of Visual Objects and Relations for Scene Graph GenerationMinghao Xu, Meng Qu, Bingbing Ni, Jian Tang 0005. 7689-7702 [doi]

Going Beyond Linear Transformers with Recurrent Fast Weight ProgrammersKazuki Irie, Imanol Schlag, Róbert Csordás, Jürgen Schmidhuber. 7703-7717 [doi]

Reinforced Few-Shot Acquisition Function Learning for Bayesian OptimizationBing-Jing Hsieh, Ping-Chun Hsieh, Xi Liu 0011. 7718-7731 [doi]

Forster Decomposition and Learning Halfspaces with NoiseIlias Diakonikolas, Daniel Kane, Christos Tzamos. 7732-7744 [doi]

Cortico-cerebellar networks as decoupling neural interfacesJoseph Pemberton, Ellen Boven, Richard Apps, Rui Ponte Costa. 7745-7759 [doi]

To The Point: Correspondence-driven monocular 3D category reconstructionFilippos Kokkinos, Iasonas Kokkinos. 7760-7772 [doi]

Proper Value EquivalenceChristopher Grimm, André Barreto 0001, Gregory Farquhar, David Silver, Satinder Singh 0001. 7773-7786 [doi]

Challenges and Opportunities in High Dimensional Variational InferenceAkash Kumar Dhaka, Alejandro Catalina, Manushi Welandawe, Michael Riis Andersen, Jonathan H. Huggins, Aki Vehtari. 7787-7798 [doi]

On the Expressivity of Markov RewardDavid Abel, Will Dabney, Anna Harutyunyan, Mark K. Ho, Michael L. Littman, Doina Precup, Satinder Singh 0001. 7799-7812 [doi]

One More Step Towards Reality: Cooperative Bandits with Imperfect CommunicationUdari Madhushani, Abhimanyu Dubey, Naomi Ehrich Leonard, Alex Pentland. 7813-7824 [doi]

Multi-Agent Reinforcement Learning in Stochastic Networked SystemsYiheng Lin, Guannan Qu, Longbo Huang, Adam Wierman. 7825-7837 [doi]

Neural Scene Flow PriorXueqian Li, Jhony Kaesemodel Pontes, Simon Lucey. 7838-7851 [doi]

The future is log-Gaussian: ResNets and their infinite-depth-and-width limit at initializationMufan Bill Li, Mihai Nica, Daniel M. Roy 0001. 7852-7864 [doi]

Grammar-Based Grounded Lexicon LearningJiayuan Mao, Freda Shi, Jiajun Wu 0001, Roger Levy, Josh Tenenbaum 0001. 7865-7878 [doi]

Distributed Deep Learning In Open CollaborationsMichael Diskin, Alexey Bukhtiyarov, Max Ryabinin, Lucile Saulnier, Quentin Lhoest, Anton Sinitsin, Dmitry Popov 0003, Dmitry V. Pyrkin, Maxim Kashirin, Alexander Borzunov, Albert Villanova del Moral, Denis Mazur, Ilia Kobelev, Yacine Jernite, Thomas Wolf 0008, Gennady Pekhimenko. 7879-7897 [doi]

Neural Ensemble Search for Uncertainty Estimation and Dataset ShiftSheheryar Zaidi, Arber Zela, Thomas Elsken, Chris C. Holmes, Frank Hutter, Yee Whye Teh. 7898-7911 [doi]

Finding Bipartite Components in HypergraphsPeter Macgregor, He Sun 0001. 7912-7923 [doi]

Hit and Lead Discovery with Explorative RL and Fragment-based Molecule GenerationSoojung Yang, Doyeong Hwang, Seul Lee, Seongok Ryu, Sung Ju Hwang. 7924-7936 [doi]

Proxy Convexity: A Unified Framework for the Analysis of Neural Networks Trained by Gradient DescentSpencer Frei, Quanquan Gu. 7937-7949 [doi]

Covariance-Aware Private Mean Estimation Without Private Covariance EstimationGavin Brown, Marco Gaboardi, Adam D. Smith, Jonathan R. Ullman, Lydia Zakynthinou. 7950-7964 [doi]

Label consistency in overfitted generalized $k$-meansLinfan Zhang, Arash A. Amini. 7965-7977 [doi]

Open-set Label Noise Can Improve Robustness Against Inherent Label NoiseHongxin Wei, Lue Tao, Renchunzi Xie, Bo An 0001. 7978-7992 [doi]

The Complexity of Sparse Tensor PCADavin Choo, Tommaso d'Orsi. 7993-8005 [doi]

Learning to ElectCem Anil, Xuchan Bao. 8006-8017 [doi]

KALE Flow: A Relaxed KL Gradient Flow for Probabilities with Disjoint SupportPierre Glaser, Michael Arbel, Arthur Gretton. 8018-8031 [doi]

When Is Generalizable Reinforcement Learning Tractable?Dhruv Malik, Yuanzhi Li, Pradeep Ravikumar. 8032-8045 [doi]

Relational Self-Attention: What's Missing in Attention for Video UnderstandingManjin Kim, Heeseung Kwon, Chunyu Wang, Suha Kwak, Minsu Cho. 8046-8059 [doi]

Towards Enabling Meta-Learning from Target ModelsSu Lu, Han-Jia Ye, Le Gan, De-Chuan Zhan. 8060-8071 [doi]

A Near-Optimal Algorithm for Debiasing Trained Machine Learning ModelsIbrahim M. Alabdulmohsin, Mario Lucic. 8072-8084 [doi]

GENESIS-V2: Inferring Unordered Object Representations without Iterative RefinementMartin Engelcke, Oiwi Parker Jones, Ingmar Posner. 8085-8094 [doi]

How Data Augmentation affects Optimization for Linear RegressionBoris Hanin, Yi Sun. 8095-8105 [doi]

An Exact Characterization of the Generalization Error for the Gibbs AlgorithmGholamali Aminian, Yuheng Bu, Laura Toni, Miguel R. D. Rodrigues, Gregory W. Wornell. 8106-8118 [doi]

Subgaussian and Differentiable Importance Sampling for Off-Policy Evaluation and LearningAlberto Maria Metelli, Alessio Russo, Marcello Restelli. 8119-8132 [doi]

Rethinking gradient sparsification as total error minimizationAtal Narayan Sahu, Aritra Dutta, Ahmed M. Abdelmoniem, Trambak Banerjee, Marco Canini, Panos Kalnis. 8133-8146 [doi]

Approximate optimization of convex functions with outlier noiseAnindya De, Sanjeev Khanna, Huan Li, MohammadHesam NikpeySalekde. 8147-8157 [doi]

Fair Classification with Adversarial PerturbationsL. Elisa Celis, Anay Mehrotra, Nisheeth K. Vishnoi. 8158-8171 [doi]

Distributed Saddle-Point Problems Under Data SimilarityAleksandr Beznosikov, Gesualdo Scutari, Alexander Rogozin, Alexander V. Gasnikov. 8172-8184 [doi]

Combining Latent Space and Structured Kernels for Bayesian Optimization over Combinatorial SpacesAryan Deshwal, Janardhan Rao Doppa. 8185-8200 [doi]

Gradual Domain Adaptation without Indexed Intermediate DomainsHong-You Chen, Wei-Lun Chao. 8201-8214 [doi]

K-level Reasoning for Zero-Shot Coordination in HanabiBrandon Cui, Hengyuan Hu, Luis-Pineda, Jakob N. Foerster. 8215-8228 [doi]

Learning Markov State Abstractions for Deep Reinforcement LearningCameron Allen, Neev Parikh, Omer Gottesman, George Konidaris 0001. 8229-8241 [doi]

Towards Deeper Deep Reinforcement Learning with Spectral NormalizationJohan Bjorck, Carla P. Gomes, Kilian Q. Weinberger. 8242-8255 [doi]

Functionally Regionalized Knowledge Transfer for Low-resource Drug DiscoveryHuaxiu Yao, Ying Wei 0001, Long-Kai Huang, Ding Xue, JunZhou Huang, Zhenhui Li. 8256-8268 [doi]

Memory-Efficient Approximation Algorithms for Max-k-Cut and Correlation ClusteringNimita Shinde, Vishnu Narayanan, James Saunderson. 8269-8281 [doi]

Panoptic 3D Scene Reconstruction From a Single RGB ImageManuel Dahnert, Ji Hou, Matthias Nießner, Angela Dai. 8282-8293 [doi]

Measuring Generalization with Optimal TransportChing-Yao Chuang, Youssef Mroueh, Kristjan H. Greenewald, Antonio Torralba 0001, Stefanie Jegelka. 8294-8306 [doi]

Uniform Concentration Bounds toward a Unified Framework for Robust ClusteringDebolina Paul, Saptarshi Chakraborty, Swagatam Das, Jason Xu. 8307-8319 [doi]

Learning Signal-Agnostic Manifolds of Neural FieldsYilun Du, Katie Collins, Josh Tenenbaum 0001, Vincent Sitzmann. 8320-8331 [doi]

Low-dimensional Structure in the Space of Language Representations is Reflected in Brain ResponsesRichard Antonello, Javier S. Turek, Vy Ai Vo, Alexander Huth. 8332-8344 [doi]

On the Suboptimality of Thompson Sampling in High DimensionsRaymond Zhang, Richard Combes. 8345-8354 [doi]

Learning Debiased and Disentangled Representations for Semantic SegmentationSanghyeok Chu, Dongwan Kim, Bohyung Han. 8355-8366 [doi]

Diversity Matters When Learning From EnsemblesGiung Nam, Jongmin Yoon, Yoonho Lee 0001, Juho Lee 0001. 8367-8377 [doi]

Locally Valid and Discriminative Prediction Intervals for Deep Learning ModelsZhen Lin, Shubhendu Trivedi, Jimeng Sun. 8378-8391 [doi]

Personalized Federated Learning With Gaussian ProcessesIdan Achituve, Aviv Shamsian, Aviv Navon, Gal Chechik, Ethan Fetaya. 8392-8406 [doi]

Risk Bounds for Over-parameterized Maximum Margin Classification on Sub-Gaussian MixturesYuan Cao 0006, Quanquan Gu, Mikhail Belkin. 8407-8418 [doi]

Implicit SVD for Graph Representation LearningSami Abu-El-Haija, Hesham Mostafa, Marcel Nassar, Valentino Crespi, Greg Ver Steeg, Aram Galstyan. 8419-8431 [doi]

Offline Model-based Adaptable Policy LearningXiong-Hui Chen, Yang Yu 0001, Qingyang Li, Fan-Ming Luo, Zhiwei (Tony) Qin, Wenjie Shang, Jieping Ye. 8432-8443 [doi]

Multilingual Pre-training with Universal Dependency LearningKailai Sun, Zuchao Li, Hai Zhao. 8444-8456 [doi]

Parameter-free HE-friendly Logistic RegressionJunyoung Byun, Woojin Lee, Jaewook Lee 0001. 8457-8468 [doi]

Active clustering for labeling training dataQuentin Lutz, Elie de Panafieu, Maya Stein, Alex Scott 0001. 8469-8480 [doi]

Exploring Social Posterior Collapse in Variational Autoencoder for Interaction ModelingChen Tang, Wei Zhan, Masayoshi Tomizuka. 8481-8494 [doi]

Ensembling Graph Predictions for AMR ParsingThanh Lam Hoang, Gabriele Picco, Yufang Hou, Young-Suk Lee, Lam M. Nguyen, Dzung T. Phan, Vanessa López, Ramón Fernandez Astudillo. 8495-8505 [doi]

On the interplay between data structure and loss function in classification problemsStéphane d'Ascoli, Marylou Gabrié, Levent Sagun, Giulio Biroli. 8506-8517 [doi]

Near-optimal Offline and Streaming Algorithms for Learning Non-Linear Dynamical SystemsSuhas S. Kowshik, Dheeraj Nagaraj, Prateek Jain 0002, Praneeth Netrapalli. 8518-8531 [doi]

Mixture Proportion Estimation and PU Learning: A Modern ApproachSaurabh Garg, Yifan Wu, Alexander J. Smola, Sivaraman Balakrishnan, Zachary C. Lipton. 8532-8544 [doi]

Escape saddle points by a simple gradient-descent based algorithmChenyi Zhang, Tongyang Li. 8545-8556 [doi]

AC/DC: Alternating Compressed/DeCompressed Training of Deep Neural NetworksAlexandra Peste, Eugenia Iofinova, Adrian Vladu, Dan Alistarh. 8557-8570 [doi]

HyperSPNs: Compact and Expressive Probabilistic CircuitsAndy Shih, Dorsa Sadigh, Stefano Ermon. 8571-8582 [doi]

Scaling Vision with Sparse Mixture of ExpertsCarlos Riquelme, Joan Puigcerver, Basil Mustafa, Maxim Neumann, Rodolphe Jenatton, André Susano Pinto, Daniel Keysers, Neil Houlsby. 8583-8595 [doi]

Two-sided fairness in rankings via Lorenz dominanceVirginie Do, Sam Corbett-Davies, Jamal Atif, Nicolas Usunier. 8596-8608 [doi]

Stability & Generalisation of Gradient Descent for Shallow Neural Networks without the Neural Tangent KernelDominic Richards, Ilja Kuzborskij. 8609-8621 [doi]

Adversarial Intrinsic Motivation for Reinforcement LearningIshan Durugkar, Mauricio Tec, Scott Niekum, Peter Stone. 8622-8636 [doi]

Machine Learning for Variance Reduction in Online ExperimentsYongyi Guo, Dominic Coey, Mikael Konutgan, Wenting Li, Chris Schoener, Matt Goldman. 8637-8648 [doi]

L2ight: Enabling On-Chip Learning for Optical Neural Networks via Efficient in-situ Subspace OptimizationJiaqi Gu, Hanqing Zhu, Chenghao Feng, Zixuan Jiang, Ray T. Chen, David Z. Pan. 8649-8661 [doi]

Towards Gradient-based Bilevel Optimization with Non-convex Followers and BeyondRisheng Liu, Yaohua Liu, Shangzhi Zeng, Jin Zhang 0002. 8662-8675 [doi]

Multi-Facet Clustering Variational AutoencodersFabian Falck, Haoting Zhang, Matthew Willetts, George Nicholson, Christopher Yau, Chris C. Holmes. 8676-8690 [doi]

Synthetic Design: An Optimization Approach to Experimental Design with Synthetic ControlsNick Doudchenko, Khashayar Khosravi, Jean Pouget-Abadie, Sébastien Lahaie, Miles Lubin, Vahab S. Mirrokni, Jann Spiess, Guido Imbens. 8691-8701 [doi]

Ranking Policy DecisionsHadrien Pouget, Hana Chockler, Youcheng Sun, Daniel Kroening. 8702-8713 [doi]

Searching the Search Space of Vision TransformerMinghao Chen, Kan Wu, Bolin Ni, Houwen Peng, Bei Liu 0001, Jianlong Fu, Hongyang Chao, Haibin Ling. 8714-8726 [doi]

Relative stability toward diffeomorphisms indicates performance in deep netsLeonardo Petrini, Alessandro Favero, Mario Geiger, Matthieu Wyart. 8727-8739 [doi]

Raw Nav-merge Seismic Data to Subsurface Properties with MLP based Multi-Modal Information UnscramblerAditya Desai, Zhaozhuo Xu, Menal Gupta, Anu Chandran, Antoine Vial-Aussavy, Anshumali Shrivastava. 8740-8752 [doi]

Inverse Problems Leveraging Pre-trained Contrastive RepresentationsSriram Ravula, Georgios Smyrnis, Matt Jordan, Alexandros G. Dimakis. 8753-8765 [doi]

The Unbalanced Gromov Wasserstein Distance: Conic Formulation and RelaxationThibault Séjourné, François-Xavier Vialard, Gabriel Peyré. 8766-8779 [doi]

Diffusion Models Beat GANs on Image SynthesisPrafulla Dhariwal, Alexander Quinn Nichol. 8780-8794 [doi]

Learning MDPs from Features: Predict-Then-Optimize for Sequential Decision Making by Reinforcement LearningKai Wang 0040, Sanket Shah, Haipeng Chen 0001, Andrew Perrault, Finale Doshi-Velez, Milind Tambe. 8795-8806 [doi]

A Closer Look at the Worst-case Behavior of Multi-armed Bandit AlgorithmsAnand Kalvit, Assaf Zeevi. 8807-8819 [doi]

SAPE: Spatially-Adaptive Progressive Encoding for Neural OptimizationAmir Hertz, Or Perel, Raja Giryes, Olga Sorkine-Hornung, Daniel Cohen-Or. 8820-8832 [doi]

A Biased Graph Neural Network Sampler with Near-Optimal RegretQingru Zhang, David Wipf, Quan Gan, Le Song. 8833-8844 [doi]

Equilibrium Refinement for the Age of Machines: The One-Sided Quasi-Perfect EquilibriumGabriele Farina, Tuomas Sandholm. 8845-8856 [doi]

Interpreting Representation Quality of DNNs for 3D Point Cloud ProcessingWen Shen 0002, Qihan Ren, Dongrui Liu, Quanshi Zhang. 8857-8870 [doi]

How Fine-Tuning Allows for Effective Meta-LearningKurtland Chua, Qi Lei, Jason D. Lee. 8871-8884 [doi]

Cooperative Stochastic Bandits with Asynchronous Agents and Constrained FeedbackLin Yang, Yu-Zhen Janice Chen, Stephen Pasteris, Mohammad H. Hajiesmaili, John C. S. Lui, Don Towsley. 8885-8897 [doi]

Multiple Descent: Design Your Own Generalization CurveLin Chen 0003, Yifei Min, Mikhail Belkin, Amin Karbasi. 8898-8912 [doi]

On Empirical Risk Minimization with Dependent and Heavy-Tailed DataAbhishek Roy 0005, Krishnakumar Balasubramanian, Murat A. Erdogdu. 8913-8926 [doi]

Gone Fishing: Neural Active Learning with Fisher EmbeddingsJordan T. Ash, Surbhi Goel, Akshay Krishnamurthy, Sham M. Kakade. 8927-8939 [doi]

On Riemannian Optimization over Positive Definite Matrices with the Bures-Wasserstein GeometryAndi Han, Bamdev Mishra, Pratik Kumar Jawanpuria, Junbin Gao. 8940-8953 [doi]

Refining Language Models with Compositional ExplanationsHuihan Yao, Ying Chen, Qinyuan Ye, Xisen Jin, Xiang Ren 0001. 8954-8967 [doi]

Going Beyond Linear RL: Sample Efficient Neural Function ApproximationBaihe Huang, Kaixuan Huang, Sham M. Kakade, Jason D. Lee, Qi Lei, Runzhe Wang, Jiaqi Yang 0001. 8968-8983 [doi]

Scalable Neural Data Server: A Data Recommender for Transfer LearningTianshi Cao, Sasha Doubov, David Acuna, Sanja Fidler. 8984-8997 [doi]

What can linearized neural networks actually say about generalization?Guillermo Ortiz-Jiménez, Seyed-Mohsen Moosavi-Dezfooli, Pascal Frossard. 8998-9010 [doi]

CATs: Cost Aggregation Transformers for Visual CorrespondenceSeokju Cho, Sunghwan Hong, Sangryul Jeon, Yunsung Lee, Kwanghoon Sohn, Seungryong Kim. 9011-9023 [doi]

Asynchronous Stochastic Optimization Robust to Arbitrary DelaysAlon Cohen, Amit Daniely, Yoel Drori, Tomer Koren, Mariano Schain. 9024-9035 [doi]

Consistent Non-Parametric Methods for Maximizing RobustnessRobi Bhattacharjee, Kamalika Chaudhuri. 9036-9048 [doi]

Generalizable Multi-linear Attention NetworkTao Jin, Zhou Zhao. 9049-9060 [doi]

Labeling Trick: A Theory of Using Graph Neural Networks for Multi-Node Representation LearningMuhan Zhang, Pan Li 0005, Yinglong Xia, Kai Wang, Long Jin. 9061-9073 [doi]

SUPER-ADAM: Faster and Universal Framework of Adaptive GradientsFeihu Huang, Junyi Li, Heng Huang. 9074-9085 [doi]

General Nonlinearities in SO(2)-Equivariant CNNsDaniel Franzen, Michael Wand 0001. 9086-9098 [doi]

Denoising Normalizing FlowChristian Horvat, Jean-Pascal Pfister. 9099-9111 [doi]

Attention over Learned Object Embeddings Enables Complex Visual ReasoningDavid Ding, Felix Hill, Adam Santoro, Malcolm Reynolds, Matt M. Botvinick. 9112-9124 [doi]

Differentially Private Federated Bayesian Optimization with Distributed ExplorationZhongxiang Dai, Bryan Kian Hsiang Low, Patrick Jaillet. 9125-9139 [doi]

Differentiable Learning Under TriageNastaran Okati, Abir De, Manuel Gomez-Rodriguez. 9140-9151 [doi]

A New Theoretical Framework for Fast and Accurate Online Decision-MakingNicolò Cesa-Bianchi, Tommaso Cesari, Yishay Mansour, Vianney Perchet. 9152-9166 [doi]

When Expressivity Meets Trainability: Fewer than $n$ Neurons Can WorkJiawei Zhang, Yushun Zhang, Mingyi Hong, Ruoyu Sun 0001, Zhi-Quan Luo. 9167-9180 [doi]

Analyzing the Confidentiality of Undistillable Teachers in Knowledge DistillationSouvik Kundu 0002, Qirui Sun, Yao Fu, Massoud Pedram, Peter A. Beerel. 9181-9192 [doi]

High Probability Complexity Bounds for Line Search Based on Stochastic OraclesBilly Jin, Katya Scheinberg, Miaolan Xie. 9193-9203 [doi]

Pay Attention to MLPsHanxiao Liu, Zihang Dai, David R. So, Quoc V. Le. 9204-9215 [doi]

An Image is Worth More Than a Thousand Words: Towards Disentanglement in The WildAviv Gabbay, Niv Cohen, Yedid Hoshen. 9216-9228 [doi]

Dynamics of Stochastic Momentum Methods on Large-scale, Quadratic ModelsCourtney Paquette, Elliot Paquette. 9229-9240 [doi]

Adversarial Examples in Multi-Layer Random ReLU NetworksPeter L. Bartlett, Sébastien Bubeck, Yeshwanth Cherapanamjeri. 9241-9252 [doi]

Efficient Statistical Assessment of Neural Network Corruption RobustnessKarim Tit, Teddy Furon, Mathias Rousset. 9253-9263 [doi]

A Highly-Efficient Group Elastic Net Algorithm with an Application to Function-On-Scalar RegressionTobia Boschi, Matthew Reimherr, Francesca Chiaromonte. 9264-9277 [doi]

Hierarchical Clustering: O(1)-Approximation for Well-Clustered GraphsBogdan-Adrian Manghiuc, He Sun 0001. 9278-9289 [doi]

Realistic evaluation of transductive few-shot learningOlivier Veilleux, Malik Boudiaf, Pablo Piantanida, Ismail Ben Ayed. 9290-9302 [doi]

Qu-ANTI-zation: Exploiting Quantization Artifacts for Achieving Adversarial OutcomesSanghyun Hong, Michael-Andrei Panaitescu-Liess, Yigitcan Kaya, Tudor Dumitras. 9303-9316 [doi]

Differentially Private Stochastic Optimization: New Results in Convex and Non-Convex SettingsRaef Bassily, Cristóbal Guzmán, Michael Menart. 9317-9329 [doi]

TacticZero: Learning to Prove Theorems from Scratch with Deep Reinforcement LearningMinchao Wu, Michael Norrish, Christian Walder, Amir Dezfouli. 9330-9342 [doi]

Integrating Tree Path in Transformer for Code RepresentationHan Peng, Ge Li 0001, Wenhan Wang, Yunfei Zhao, Zhi Jin. 9343-9354 [doi]

Twins: Revisiting the Design of Spatial Attention in Vision TransformersXiangxiang Chu, Zhi Tian, Yuqing Wang, Bo Zhang 0046, Haibing Ren, Xiaolin Wei, Huaxia Xia, Chunhua Shen. 9355-9366 [doi]

Evaluating State-of-the-Art Classification Models Against Bayes OptimalityRyan Theisen, Huan Wang, Lav R. Varshney, Caiming Xiong, Richard Socher. 9367-9377 [doi]

Data-Efficient Instance Generation from Instance DiscriminationCeyuan Yang, Yujun Shen, Yinghao Xu, Bolei Zhou. 9378-9390 [doi]

Reliable Post hoc Explanations: Modeling Uncertainty in ExplainabilityDylan Slack, Anna Hilgard, Sameer Singh 0001, Himabindu Lakkaraju. 9391-9404 [doi]

Learning Graph Models for Retrosynthesis PredictionVignesh Ram Somnath, Charlotte Bunne, Connor W. Coley, Andreas Krause 0001, Regina Barzilay. 9405-9415 [doi]

Differentiable Equilibrium Computation with Decision Diagrams for Stackelberg Models of Combinatorial Congestion GamesShinsaku Sakaue, Kengo Nakamura. 9416-9428 [doi]

Inverse Optimal Control Adapted to the Noise Characteristics of the Human Sensorimotor SystemMatthias Schultheis, Dominik Straub, Constantin A. Rothkopf. 9429-9442 [doi]

Deep Neural Networks as Point Estimates for Deep Gaussian ProcessesVincent Dutordoir, James Hensman, Mark van der Wilk, Carl Henrik Ek, Zoubin Ghahramani, Nicolas Durrande. 9443-9455 [doi]

Locality defeats the curse of dimensionality in convolutional teacher-student scenariosAlessandro Favero, Francesco Cagnetta, Matthieu Wyart. 9456-9467 [doi]

Causal Identification with Matrix EquationsSanghack Lee, Elias Bareinboim. 9468-9479 [doi]

Private and Non-private Uniformity Testing for Ranking DataRóbert Busa-Fekete, Dimitris Fotakis 0001, Emmanouil Zampetakis. 9480-9492 [doi]

Model-Based Reinforcement Learning via Imagination with Derived MemoryYao Mu, Yuzheng Zhuang, Bin Wang 0034, Guangxiang Zhu, Wulong Liu, Jianyu Chen, Ping Luo, Shengbo Li 0001, Chongjie Zhang, Jianye Hao. 9493-9505 [doi]

Compositional Transformers for Scene GenerationDor Arad Hudson, Larry Zitnick. 9506-9520 [doi]

An Exponential Lower Bound for Linearly Realizable MDP with Constant Suboptimality GapYuanhao Wang 0004, Ruosong Wang, Sham M. Kakade. 9521-9533 [doi]

Combating Noise: Semi-supervised Learning by Region Uncertainty QuantificationZhenyu Wang 0005, Ya-Li Li 0001, Ye Guo, Shengjin Wang. 9534-9545 [doi]

Reducing the Covariate Shift by Mirror Samples in Cross Domain AlignmentYin Zhao, Minquan Wang, Longjun Cai. 9546-9558 [doi]

Permutation-Invariant Variational Autoencoder for Graph-Level Representation LearningRobin Winter, Frank Noé, Djork-Arné Clevert. 9559-9573 [doi]

Causal Abstractions of Neural NetworksAtticus Geiger, Hanson Lu, Thomas Icard, Christopher Potts. 9574-9586 [doi]

Conic Blackwell Algorithm: Parameter-Free Convex-Concave Saddle-Point SolvingJulien Grand-Clément, Christian Kroer. 9587-9599 [doi]

3DP3: 3D Scene Perception via Probabilistic ProgrammingNishad Gothoskar, Marco Cusumano-Towner, Ben Zinberg, Matin Ghavamizadeh, Falk Pollok, Austin Garrett, Josh Tenenbaum 0001, Dan Gutfreund, Vikash K. Mansinghka. 9600-9612 [doi]

Novel Upper Bounds for the Constrained Most Probable Explanation TaskTahrima Rahman, Sara Rouhani, Vibhav Gogate. 9613-9624 [doi]

Why Spectral Normalization Stabilizes GANs: Analysis and ImprovementsZinan Lin 0001, Vyas Sekar, Giulia Fanti. 9625-9638 [doi]

$(\textrm{Implicit})^2$: Implicit Layers for Implicit RepresentationsZhichun Huang, Shaojie Bai, J. Zico Kolter. 9639-9650 [doi]

Best Arm Identification in Contaminated Stochastic BanditsArpan Mukherjee, Ali Tajer, Pin-Yu Chen, Payel Das. 9651-9662 [doi]

MADE: Exploration via Maximizing Deviation from Explored RegionsTianjun Zhang, Paria Rashidinejad, Jiantao Jiao, Yuandong Tian, Joseph E. Gonzalez, Stuart Russell 0001. 9663-9680 [doi]

Variational Automatic Curriculum Learning for Sparse-Reward Cooperative Multi-Agent ProblemsJiayu Chen 0005, Yuanxin Zhang, Yuanfan Xu, Huimin Ma, Huazhong Yang, Jiaming Song, Yu Wang 0002, Yi Wu. 9681-9693 [doi]

Align before Fuse: Vision and Language Representation Learning with Momentum DistillationJunnan Li 0001, Ramprasaath R. Selvaraju, Akhilesh Gotmare, Shafiq R. Joty, Caiming Xiong, Steven Chu Hong Hoi. 9694-9705 [doi]

Variational Model Inversion AttacksKuan-Chieh Wang, Yan Fu, Ke Li, Ashish Khisti, Richard S. Zemel, Alireza Makhzani. 9706-9719 [doi]

Graph Neural Networks with Adaptive ResidualXiaorui Liu, Jiayuan Ding, Wei Jin 0009, Han Xu, Yao Ma 0001, Zitao Liu 0001, Jiliang Tang. 9720-9733 [doi]

Efficient Active Learning for Gaussian Process Classification by Error ReductionGuang Zhao, Edward R. Dougherty, Byung-Jun Yoon, Francis J. Alexander, Xiaoning Qian. 9734-9746 [doi]

Non-Asymptotic Analysis for Two Time-scale TDC with General Smooth Function ApproximationYue Wang, Shaofeng Zou, Yi Zhou. 9747-9758 [doi]

A Little Robustness Goes a Long Way: Leveraging Robust Features for Targeted Transfer AttacksJacob M. Springer, Melanie Mitchell, Garrett T. Kenyon. 9759-9773 [doi]

TriBERT: Human-centric Audio-visual Representation LearningTanzila Rahman, Mengyu Yang, Leonid Sigal. 9774-9787 [doi]

How does a Neural Network's Architecture Impact its Robustness to Noisy Labels?Jingling Li, Mozhi Zhang, Keyulu Xu, John Dickerson 0001, Jimmy Ba. 9788-9803 [doi]

Calibration and Consistency of Adversarial Surrogate LossesPranjal Awasthi, Natalie Frank, Anqi Mao, Mehryar Mohri, Yutao Zhong 0002. 9804-9815 [doi]

The Value of Information When Deciding What to LearnDilip Arumugam, Benjamin Van Roy. 9816-9827 [doi]

Co-Adaptation of Algorithmic and Implementational Innovations in Inference-based Deep Reinforcement LearningHiroki Furuta, Tadashi Kozuno, Tatsuya Matsushima, Yutaka Matsuo, Shixiang Shane Gu. 9828-9842 [doi]

Can fMRI reveal the representation of syntactic structure in the brain?Aniketh Janardhan Reddy, Leila Wehbe. 9843-9856 [doi]

Robust Implicit Networks via Non-Euclidean ContractionsSaber Jafarpour, Alexander Davydov 0001, Anton V. Proskurnikov, Francesco Bullo. 9857-9868 [doi]

A Kernel-based Test of Independence for Cluster-correlated DataHongjiao Liu, Anna M. Plantinga, Yunhua Xiang, Michael C. Wu. 9869-9881 [doi]

Efficient methods for Gaussian Markov random fields under sparse linear constraintsDavid Bolin, Jonas Wallin. 9882-9894 [doi]

Sparse is Enough in Scaling TransformersSebastian Jaszczur, Aakanksha Chowdhery, Afroz Mohiuddin, Lukasz Kaiser, Wojciech Gajewski, Henryk Michalewski, Jonni Kanerva. 9895-9907 [doi]

Sparse Training via Boosting Pruning Plasticity with NeuroregenerationShiwei Liu, Tianlong Chen, Xiaohan Chen, Zahra Atashgahi, Lu Yin 0006, Huanyu Kou, Li Shen 0008, Mykola Pechenizkiy, Zhangyang Wang, Decebal Constantin Mocanu. 9908-9922 [doi]

Low-Fidelity Video Encoder Optimization for Temporal Action LocalizationMengmeng Xu, Juan-Manuel Pérez-Rúa, Xiatian Zhu, Bernard Ghanem, Brais Martínez. 9923-9935 [doi]

On Provable Benefits of Depth in Training Graph Convolutional NetworksWeilin Cong, Morteza Ramezani, Mehrdad Mahdavi. 9936-9949 [doi]

Practical Near Neighbor Search via Group TestingJoshua Engels, Benjamin Coleman, Anshumali Shrivastava. 9950-9962 [doi]

Baby Intuitions Benchmark (BIB): Discerning the goals, preferences, and actions of othersKanishk Gandhi, Gala Stojnic, Brenden M. Lake, Moira R. Dillon. 9963-9976 [doi]

Neural Hybrid Automata: Learning Dynamics With Multiple Modes and Stochastic TransitionsMichael Poli, Stefano Massaroli, Luca Scimeca, Sanghyuk Chun, Seong Joon Oh, Atsushi Yamashita, Hajime Asama, Jinkyoo Park, Animesh Garg. 9977-9989 [doi]

Fast Projection onto the Capped Simplex with Applications to Sparse Regression in BioinformaticsAndersen Man Shun Ang, Jianzhu Ma, Nianjun Liu, Kun Huang, Yijie Wang. 9990-9999 [doi]

The Many Faces of Adversarial RiskMuni Sreenivas Pydi, Varun S. Jog. 10000-10012 [doi]

Meta-Adaptive Nonlinear Control: Theory and AlgorithmsGuanya Shi, Kamyar Azizzadenesheli, Michael O'Connell, Soon Jo Chung, Yisong Yue. 10013-10025 [doi]

Compositional Reinforcement Learning from Logical SpecificationsKishor Jothimurugan, Suguman Bansal, Osbert Bastani, Rajeev Alur. 10026-10039 [doi]

Differentiable Quality DiversityMatthew C. Fontaine, Stefanos Nikolaidis. 10040-10052 [doi]

Credit Assignment Through Broadcasting a Global Error VectorDavid G. Clark, L. F. Abbott, SueYeon Chung. 10053-10066 [doi]

An Online Method for A Class of Distributionally Robust Optimization with Non-convex ObjectivesQi Qi 0006, Zhishuai Guo, Yi Xu, Rong Jin 0001, Tianbao Yang. 10067-10080 [doi]

A single gradient step finds adversarial examples on random two-layers neural networksSébastien Bubeck, Yeshwanth Cherapanamjeri, Gauthier Gidel, Remi Tachet des Combes. 10081-10091 [doi]

Parameterized Knowledge Transfer for Personalized Federated LearningJie Zhang, Song Guo 0001, Xiaosong Ma, Haozhao Wang, Wenchao Xu, Feijie Wu. 10092-10104 [doi]

Contrastively Disentangled Sequential Variational AutoencoderJunwen Bai, Weiran Wang, Carla P. Gomes. 10105-10118 [doi]

Recursive Causal Structure Learning in the Presence of Latent Variables and Selection BiasSina Akbari, Ehsan Mokhtarian, AmirEmad Ghassami, Negar Kiyavash. 10119-10130 [doi]

Generalization Error Rates in Kernel Regression: The Crossover from the Noiseless to Noisy RegimeHugo Cui, Bruno Loureiro, Florent Krzakala, Lenka Zdeborová. 10131-10143 [doi]

Learning Gaussian Mixtures with Generalized Linear Models: Precise Asymptotics in High-dimensionsBruno Loureiro, Gabriele Sicuro, Cédric Gerbelot, Alessandro Pacco, Florent Krzakala, Lenka Zdeborová. 10144-10157 [doi]

Spectral embedding for dynamic networks with stability guaranteesIan Gallagher, Andrew Jones, Patrick Rubin-Delanchy. 10158-10170 [doi]

Infinite Time Horizon Safety of Bayesian Neural NetworksMathias Lechner, Dorde Zikelic, Krishnendu Chatterjee, Thomas A. Henzinger. 10171-10185 [doi]

Towards understanding retrosynthesis by energy-based modelsRuoxi Sun, Hanjun Dai, Li Li 0060, Steven Kearnes, Bo Dai. 10186-10194 [doi]

List-Decodable Mean Estimation in Nearly-PCA TimeIlias Diakonikolas, Daniel Kane, Daniel Kongsgaard, Jerry Li 0001, Kevin Tian. 10195-10208 [doi]

Distributed Zero-Order Optimization under Adversarial NoiseArya Akhavan, Massimiliano Pontil, Alexandre B. Tsybakov. 10209-10220 [doi]

Reliable Estimation of KL Divergence using a Discriminator in Reproducing Kernel Hilbert SpaceSandesh Ghimire, Aria Masoomi, Jennifer G. Dy. 10221-10233 [doi]

Latent Matters: Learning Deep State-Space ModelsAlexej Klushyn, Richard Kurle, Maximilian Soelch, Botond Cseke, Patrick van der Smagt. 10234-10245 [doi]

On the Estimation Bias in Double Q-LearningZhizhou Ren, Guangxiang Zhu, Hao Hu, Beining Han, Jianglun Chen, Chongjie Zhang. 10246-10259 [doi]

Mitigating Forgetting in Online Continual Learning with Neuron CalibrationHaiyan Yin, Peng Yang, Ping Li 0001. 10260-10272 [doi]

Escaping Saddle Points with Compressed SGDDmitrii Avdiukhin, Grigory Yaroslavtsev. 10273-10284 [doi]

Non-Gaussian Gaussian Processes for Few-Shot RegressionMarcin Sendera, Jacek Tabor, Aleksandra Nowak 0001, Andrzej Bedychaj, Massimiliano Patacchiola, Tomasz Trzcinski, Przemyslaw Spurek, Maciej Zieba. 10285-10298 [doi]

Believe What You See: Implicit Constraint Approach for Offline Multi-Agent Reinforcement LearningYiqin Yang, Xiaoteng Ma, Chenghao Li 0002, Zewu Zheng, Qiyuan Zhang, Gao Huang, Jun Yang 0028, Qianchuan Zhao. 10299-10312 [doi]

Online Learning in Periodic Zero-Sum GamesTanner Fiez, Ryann Sim, Stratis Skoulakis, Georgios Piliouras, Lillian J. Ratliff. 10313-10325 [doi]

K-Net: Towards Unified Image SegmentationWenwei Zhang, Jiangmiao Pang, Kai Chen 0026, Chen Change Loy. 10326-10338 [doi]

Pareto-Optimal Learning-Augmented Algorithms for Online Conversion ProblemsBo Sun 0004, Russell Lee, Mohammad H. Hajiesmaili, Adam Wierman, Danny H. K. Tsang. 10339-10350 [doi]

Dynaboard: An Evaluation-As-A-Service Platform for Holistic Next-Generation BenchmarkingZhiyi Ma, Kawin Ethayarajh, Tristan Thrush, Somya Jain, Ledell Wu, Robin Jia, Christopher Potts, Adina Williams, Douwe Kiela. 10351-10367 [doi]

NTopo: Mesh-free Topology Optimization using Implicit Neural RepresentationsJonas Zehnder, Yue Li, Stelian Coros, Bernhard Thomaszewski. 10368-10381 [doi]

Generalization Bounds for (Wasserstein) Robust OptimizationYang An, Rui Gao. 10382-10392 [doi]

Faster Matchings via Learned DualsMichael Dinitz, Sungjin Im, Thomas Lavastida, Benjamin Moseley, Sergei Vassilvitskii. 10393-10406 [doi]

Online learning in MDPs with linear function approximation and bandit feedbackGergely Neu, Julia Olkhovskaya. 10407-10417 [doi]

Learning Collaborative Policies to Solve NP-hard Routing ProblemsMinsu Kim, Jinkyoo Park, Joungho Kim. 10418-10430 [doi]

Efficient Mirror Descent Ascent Methods for Nonsmooth Minimax ProblemsFeihu Huang, Xidong Wu, Heng Huang. 10431-10443 [doi]

CO-PILOT: COllaborative Planning and reInforcement Learning On sub-Task curriculumShuang Ao, Tianyi Zhou, Guodong Long, Qinghua Lu 0001, Liming Zhu 0001, Jing Jiang 0002. 10444-10456 [doi]

Modality-Agnostic Topology Aware LocalizationFarhad Ghazvinian Zanjani, Ilia Karmanov, Hanno Ackermann, Daniel Dijkman, Simone Merlin, Max Welling, Fatih Porikli. 10457-10468 [doi]

Scalable Quasi-Bayesian Inference for Instrumental Variable RegressionZiyu Wang 0006, Yuhao Zhou, Tongzheng Ren, Jun Zhu 0001. 10469-10482 [doi]

Kernel Identification Through TransformersFergus Simpson, Ian Davies, Vidhi Lalchand, Alessandro Vullo, Nicolas Durrande, Carl Edward Rasmussen. 10483-10495 [doi]

Curriculum Design for Teaching via Demonstrations: Theory and ApplicationsGaurav Yengera, Rati Devidze, Parameswaran Kamalaruban, Adish Singla. 10496-10509 [doi]

Revenue maximization via machine learning with noisy dataEllen Vitercik, Tom Yan. 10510-10523 [doi]

Exploiting Data Sparsity in Secure Cross-Platform Social RecommendationJinming Cui, Chaochao Chen 0001, Lingjuan Lyu, Carl Yang, Li Wang 0056. 10524-10534 [doi]

Parallelizing Thompson SamplingAmin Karbasi, Vahab S. Mirrokni, Mohammad Shadravan. 10535-10548 [doi]

Dynamic Causal Bayesian OptimizationVirginia Aglietti, Neil Dhir, Javier González, Theodoros Damoulas. 10549-10560 [doi]

Local Differential Privacy for Regret Minimization in Reinforcement LearningEvrard Garcelon, Vianney Perchet, Ciara Pike-Burke, Matteo Pirotta. 10561-10573 [doi]

Emergent Discrete Communication in Semantic SpacesMycal Tucker, Huao Li, Siddharth Agrawal, Dana Hughes 0001, Katia P. Sycara, Michael Lewis 0001, Julie A. Shah. 10574-10586 [doi]

Drop, Swap, and Generate: A Self-Supervised Approach for Generating Neural ActivityRan Liu, Mehdi Azabou, Max Dabagia, Chi-Heng Lin, Mohammad Gheshlaghi Azar, Keith B. Hengen, Michal Valko, Eva L. Dyer. 10587-10599 [doi]

Equivariant Manifold FlowsIsay Katsman, Aaron Lou, Derek Lim, Qingxuan Jiang, Ser-Nam Lim, Christopher De Sa. 10600-10612 [doi]

Scalable Bayesian GPFA with automatic relevance determination and discrete noise modelsKristopher T. Jensen, Ta-Chu Kao, Jasmine Stone, Guillaume Hennequin. 10613-10626 [doi]

Recurrence along Depth: Deep Convolutional Neural Networks with Recurrent Layer AggregationJingyu Zhao 0001, Yanwen Fang, Guodong Li. 10627-10640 [doi]

Independent Prototype Propagation for Zero-Shot CompositionalityFrank Ruis, Gertjan J. Burghouts, Doina Bucur. 10641-10653 [doi]

Universal Graph Convolutional NetworksDi Jin, Zhizhi Yu, Cuiying Huo, Rui Wang, Xiao Wang 0017, Dongxiao He, Jiawei Han 0001. 10654-10664 [doi]

Adversarial Feature DesensitizationPouya Bashivan, Reza Bayat, Adam Ibrahim, Kartik Ahuja, Mojtaba Faramarzi, Touraj Laleh, Blake A. Richards, Irina Rish. 10665-10677 [doi]

Few-Shot Data-Driven Algorithms for Low Rank ApproximationPiotr Indyk, Tal Wagner, David P. Woodruff. 10678-10690 [doi]

Neural-PIL: Neural Pre-Integrated Lighting for Reflectance DecompositionMark Boss, Varun Jampani, Raphael Braun, Ce Liu, Jonathan T. Barron, Hendrik P. A. Lensch. 10691-10704 [doi]

Asymptotics of the Bootstrap via Stability with Applications to Inference with Model SelectionMorgane Austern, Vasilis Syrgkanis. 10705-10717 [doi]

Dynamic influence maximizationBinghui Peng. 10718-10731 [doi]

Risk Monotonicity in Statistical LearningZakaria Mhammedi. 10732-10744 [doi]

Information is Power: Intrinsic Control via Information CaptureNicholas Rhinehart, Jenny Wang, Glen Berseth, John D. Co-Reyes, Danijar Hafner, Chelsea Finn, Sergey Levine. 10745-10758 [doi]

Extracting Deformation-Aware Local Features by Learning to DeformGuilherme A. Potje, Renato Martins, Felipe C. Chamone, Erickson R. Nascimento. 10759-10771 [doi]

Object-Centric Representation Learning with Generative Spatial-Temporal FactorizationNanbo Li, Muhammad Ahmed Raza, Wenbin Hu, Zhaole Sun, Robert B. Fisher. 10772-10783 [doi]

Learning to Simulate Self-driven Particles System with Coordinated Policy OptimizationZhenghao Peng, Quanyi Li, Ka-Ming Hui, Chunxiao Liu, Bolei Zhou. 10784-10797 [doi]

Gradient-based Hyperparameter Optimization Over Long HorizonsPaul Micaelli, Amos J. Storkey. 10798-10809 [doi]

Stochastic Bias-Reduced Gradient MethodsHilal Asi, Yair Carmon, Arun Jambulapati, Yujia Jin, Aaron Sidford. 10810-10822 [doi]

The Causal-Neural Connection: Expressiveness, Learnability, and InferenceKevin Xia, Kai-Zhan Lee, Yoshua Bengio, Elias Bareinboim. 10823-10836 [doi]

Validation Free and Replication Robust Volume-based Data ValuationXinyi Xu, Zhaoxuan Wu, Chuan-Sheng Foo, Bryan Kian Hsiang Low. 10837-10848 [doi]

Implicit Finite-Horizon Approximation and Efficient Optimal Algorithms for Stochastic Shortest PathLiyu Chen, Mehdi Jafarnia-Jahromi, Rahul Jain 0002, Haipeng Luo. 10849-10861 [doi]

A Separation Result Between Data-oblivious and Data-aware Poisoning AttacksSamuel Deng, Sanjam Garg, Somesh Jha, Saeed Mahloujifar, Mohammad Mahmoody, Abhradeep Guha Thakurta. 10862-10875 [doi]

Deep Learning Through the Lens of Example DifficultyRobert J. N. Baldock, Hartmut Maennel, Behnam Neyshabur. 10876-10889 [doi]

R-Drop: Regularized Dropout for Neural NetworksXiaobo Liang, Lijun Wu, Juntao Li, Yue Wang 0039, Qi Meng, Tao Qin, Wei Chen 0034, Min Zhang 0005, Tie-Yan Liu. 10890-10905 [doi]

Diversity Enhanced Active Learning with Strictly Proper Scoring RulesWei Tan, Lan Du 0002, Wray L. Buntine. 10906-10918 [doi]

SSUL: Semantic Segmentation with Unknown Label for Exemplar-based Class-Incremental LearningSungmin Cha, Beomyoung Kim, Youngjoon Yoo, Taesup Moon. 10919-10930 [doi]

Lower and Upper Bounds on the Pseudo-Dimension of Tensor Network ModelsBehnoush Khavari, Guillaume Rabusseau. 10931-10943 [doi]

What Makes Multi-Modal Learning Better than Single (Provably)Yu Huang, Chenzhuang Du, Zihui Xue, Xuanyao Chen, Hang Zhao, Longbo Huang. 10944-10956 [doi]

Quantifying and Improving Transferability in Domain GeneralizationGuojun Zhang, Han Zhao 0002, Yaoliang Yu, Pascal Poupart. 10957-10970 [doi]

Beyond Pinball Loss: Quantile Methods for Calibrated Uncertainty QuantificationYoungseog Chung, Willie Neiswanger, Ian Char, Jeff Schneider 0001. 10971-10984 [doi]

Dynamic Inference with Neural InterpretersNasim Rahaman, Muhammad Waleed Gondal, Shruti Joshi, Peter V. Gehler, Yoshua Bengio, Francesco Locatello, Bernhard Schölkopf. 10985-10998 [doi]

Leveraging Recursive Gumbel-Max Trick for Approximate Inference in Combinatorial SpacesKirill Struminsky, Artyom Gadetsky, Denis Rakitin, Danil Karpushkin, Dmitry P. Vetrov. 10999-11011 [doi]

Hamiltonian Dynamics with Non-Newtonian Momentum for Rapid SamplingGreg Ver Steeg, Aram Galstyan. 11012-11025 [doi]

Dynamic Normalization and Relay for Video Action RecognitionDongqi Cai, Anbang Yao, Yurong Chen 0001. 11026-11040 [doi]

Robust Visual Reasoning via Language Guided Neural Module NetworksArjun R. Akula, Varun Jampani, Soravit Changpinyo, Song Chun Zhu. 11041-11053 [doi]

True Few-Shot Learning with Language ModelsEthan Perez, Douwe Kiela, KyungHyun Cho. 11054-11070 [doi]

Selective Sampling for Online Best-arm IdentificationRomain Camilleri, Zhihan Xiong, Maryam Fazel, Lalit Jain, Kevin G. Jamieson. 11071-11082 [doi]

Multi-task Learning of Order-Consistent Causal GraphsXinshi Chen, Haoran Sun, Caleb Ellington, Eric P. Xing, Le Song. 11083-11095 [doi]

Learning to Iteratively Solve Routing Problems with Dual-Aspect Collaborative TransformerYining Ma 0001, Jingwen Li, Zhiguang Cao, Wen Song, Le Zhang 0001, Zhenghua Chen, Jing Tang 0004. 11096-11107 [doi]

Learning interaction rules from multi-animal trajectories via augmented behavioral modelsKeisuke Fujii 0001, Naoya Takeishi, Kazushi Tsutsui, Emyo Fujioka, Nozomi Nishiumi, Ryoya Tanaka, Mika Fukushiro, Kaoru Ide, Hiroyoshi Kohno, Ken Yoda, Susumu Takahashi, Shizuko Hiryu, Yoshinobu Kawahara. 11108-11122 [doi]

Differentiable Synthesis of Program ArchitecturesGuofeng Cui, He Zhu. 11123-11135 [doi]

Make Sure You're Unsure: A Framework for Verifying Probabilistic SpecificationsLeonard Berrada, Sumanth Dathathri, Krishnamurthy Dvijotham, Robert Stanforth, Rudy Bunel, Jonathan Uesato, Sven Gowal, M. Pawan Kumar. 11136-11147 [doi]

Oracle-Efficient Regret Minimization in Factored MDPs with Unknown StructureAviv Rosenberg 0002, Yishay Mansour. 11148-11159 [doi]

Linear-Time Probabilistic Solution of Boundary Value ProblemsNicholas Krämer, Philipp Hennig. 11160-11171 [doi]

Lifelong Domain Adaptation via Consolidated Internal DistributionMohammad Rostami. 11172-11183 [doi]

Counterbalancing Learning and Strategic Incentives in Allocation MarketsJamie Kang, Faidra Monachou, Moran Koren, Itai Ashlagi. 11184-11195 [doi]

Controlling Neural Networks with Rule RepresentationsSungyong Seo, Sercan Ö. Arik, Jinsung Yoon, Xiang Zhang, Kihyuk Sohn, Tomas Pfister. 11196-11207 [doi]

Making the most of your day: online learning for optimal allocation of timeEtienne Boursier, Tristan Garrec, Vianney Perchet, Marco Scarsini. 11208-11219 [doi]

Federated Reconstruction: Partially Local Federated LearningKaran Singhal, Hakim Sidahmed, Zachary Garrett, Shanshan Wu, John Rush, Sushant Prakash. 11220-11232 [doi]

Optimal prediction of Markov chains with and without spectral gapYanjun Han, Soham Jana, Yihong Wu 0001. 11233-11246 [doi]

Subquadratic Overparameterization for Shallow Neural NetworksChaehwan Song, Ali Ramezani-Kebrya, Thomas Pethick, Armin Eftekhari, Volkan Cevher. 11247-11259 [doi]

Continuous Doubly Constrained Batch Reinforcement LearningRasool Fakoor, Jonas Mueller, Kavosh Asadi, Pratik Chaudhari, Alexander J. Smola. 11260-11273 [doi]

Bridging Explicit and Implicit Deep Generative Models via Neural Stein EstimatorsQitian Wu, Rui Gao, Hongyuan Zha. 11274-11286 [doi]

Score-based Generative Modeling in Latent SpaceArash Vahdat, Karsten Kreis, Jan Kautz. 11287-11302 [doi]

Deep Conditional Gaussian Mixture Model for Constrained ClusteringLaura Manduchi, Kieran Chin-Cheong, Holger Michel, Sven Wellmann, Julia E. Vogt. 11303-11314 [doi]

Bootstrap Your Object Detector via Mixed TrainingMengde Xu, Zheng Zhang 0022, Fangyun Wei, Yutong Lin, Yue Cao 0001, Stephen Lin, Han Hu 0004, Xiang Bai. 11315-11325 [doi]

Tensor decompositions of higher-order correlations by nonlinear Hebbian plasticityGabriel Koch Ocker, Michael A. Buice. 11326-11339 [doi]

Online Adaptation to Label Distribution ShiftRuihan Wu, Chuan Guo, Yi Su, Kilian Q. Weinberger. 11340-11351 [doi]

One Explanation is Not Enough: Structured Attention Graphs for Image ClassificationVivswan Shitole, Fuxin Li, Minsuk Kahng, Prasad Tadepalli, Alan Fern. 11352-11363 [doi]

Integrating Expert ODEs into Neural ODEs: Pharmacology and Disease ProgressionZhaozhi Qian, William R. Zame, Lucas M. Fleuren, Paul W. G. Elbers, Mihaela van der Schaar. 11364-11383 [doi]

Shifted Chunk Transformer for Spatio-Temporal Representational LearningXuefan Zha, Wentao Zhu, Xun Lv, Sen Yang 0004, Ji Liu 0002. 11384-11396 [doi]

Faster proximal algorithms for matrix optimization using Jacobi-based eigenvalue methodsHamza Fawzi, Harry Goulbourne. 11397-11408 [doi]

Decrypting Cryptic Crosswords: Semantically Complex Wordplay Puzzles as a Target for NLPJosh Rozner, Christopher Potts, Kyle Mahowald. 11409-11421 [doi]

An Improved Analysis of Gradient Tracking for Decentralized Machine LearningAnastasia Koloskova, Tao Lin 0004, Sebastian U. Stich. 11422-11435 [doi]

Entropic Desired Dynamics for Intrinsic ControlSteven Hansen, Guillaume Desjardins, Kate Baumli, David Warde-Farley, Nicolas Heess, Simon Osindero, Volodymyr Mnih. 11436-11448 [doi]

Exploring Cross-Video and Cross-Modality Signals for Weakly-Supervised Audio-Visual Video ParsingYan-Bo Lin, Hung-Yu Tseng, Hsin-Ying Lee, Yen-Yu Lin, Ming-Hsuan Yang 0001. 11449-11461 [doi]

Littlestone Classes are Privately Online LearnableNoah Golowich, Roi Livni. 11462-11473 [doi]

Dual Parameterization of Sparse Variational Gaussian ProcessesVincent Adam, Paul E. Chang, Mohammad Emtiyaz Khan, Arno Solin. 11474-11486 [doi]

Learning to dehaze with polarizationChu Zhou, Minggui Teng, Yufei Han, Chao Xu 0006, Boxin Shi. 11487-11500 [doi]

Conservative Data Sharing for Multi-Task Offline Reinforcement LearningTianhe Yu, Aviral Kumar, Yevgen Chebotar, Karol Hausman, Sergey Levine, Chelsea Finn. 11501-11516 [doi]

Universal Rate-Distortion-Perception Representations for Lossy CompressionGeorge Zhang, Jingjing Qian, Jun Chen 0005, Ashish Khisti. 11517-11529 [doi]

What's a good imputation to predict with missing values?Marine Le Morvan, Julie Josse, Erwan Scornet, Gaël Varoquaux. 11530-11540 [doi]

Replacing Rewards with Examples: Example-Based Policy Search via Recursive ClassificationBen Eysenbach, Sergey Levine, Ruslan Salakhutdinov. 11541-11552 [doi]

Hierarchical Skills for Efficient ExplorationJonas Gehring, Gabriel Synnaeve, Andreas Krause 0001, Nicolas Usunier. 11553-11564 [doi]

Evidential Softmax for Sparse Multimodal Distributions in Deep Generative ModelsPhil Chen, Masha Itkina, Ransalu Senanayake, Mykel J. Kochenderfer. 11565-11576 [doi]

Submodular + ConcaveSiddharth Mitra, Moran Feldman, Amin Karbasi. 11577-11591 [doi]

DeepGEM: Generalized Expectation-Maximization for Blind InversionAngela F. Gao, Jorge C. Castellanos, Yisong Yue, Zachary E. Ross, Katherine L. Bouman. 11592-11603 [doi]

Learning to Generate Visual Questions with Noisy SupervisionKai Shen, Lingfei Wu, Siliang Tang, Yueting Zhuang, Zhen He, Zhuoye Ding, Yun Xiao, Bo Long. 11604-11617 [doi]

Pure Exploration in Kernel and Neural BanditsYinglun Zhu, Dongruo Zhou, Ruoxi Jiang, Quanquan Gu, Rebecca Willett, Robert Nowak 0001. 11618-11630 [doi]

Numerical Composition of Differential PrivacySivakanth Gopi, Yin Tat Lee, Lukas Wutschitz. 11631-11642 [doi]

Coresets for Classification - Simplified and StrengthenedTung Mai, Cameron Musco, Anup Rao 0002. 11643-11654 [doi]

Sequential Algorithms for Testing Closeness of DistributionsAadil Oufkir, Omar Fawzi, Nicolas Flammarion, Aurélien Garivier. 11655-11664 [doi]

Overlapping Spaces for Compact Graph RepresentationsKirill Shevkunov, Liudmila Prokhorenkova. 11665-11677 [doi]

Hyperparameter Tuning is All You Need for LISTAXiaohan Chen, Jialin Liu 0003, Zhangyang Wang, Wotao Yin. 11678-11689 [doi]

Foundations of Symbolic Languages for Model InterpretabilityMarcelo Arenas, Daniel Baez, Pablo Barceló, Jorge Pérez 0001, Bernardo Subercaseaux. 11690-11701 [doi]

Bridging Offline Reinforcement Learning and Imitation Learning: A Tale of PessimismParia Rashidinejad, Banghua Zhu, Cong Ma, Jiantao Jiao, Stuart Russell 0001. 11702-11716 [doi]

Impression learning: Online representation learning with synaptic plasticityColin Bredenberg, Benjamin Lyo, Eero P. Simoncelli, Cristina Savin. 11717-11729 [doi]

How Well do Feature Visualizations Support Causal Understanding of CNN Activations?Roland S. Zimmermann, Judy Borowski, Robert Geirhos, Matthias Bethge, Thomas S. A. Wallis, Wieland Brendel. 11730-11744 [doi]

Fixes That Fail: Self-Defeating Improvements in Machine-Learning SystemsRuihan Wu, Chuan Guo, Awni Y. Hannun, Laurens van der Maaten. 11745-11756 [doi]

Coarse-to-fine Animal Pose and Shape EstimationChen Li, Gim Hee Lee. 11757-11768 [doi]

Meta-Learning Sparse Implicit Neural RepresentationsJaeho Lee, Jihoon Tack, Namhoon Lee, Jinwoo Shin. 11769-11780 [doi]

Rethinking Space-Time Networks with Improved Memory Coverage for Efficient Video Object SegmentationHo Kei Cheng, Yu-Wing Tai, Chi-Keung Tang. 11781-11794 [doi]

Sparse Spiking Gradient DescentNicolas Perez Nieves, Dan F. M. Goodman. 11795-11808 [doi]

Rethinking Calibration of Deep Neural Networks: Do Not Be Afraid of OverconfidenceDeng-Bao Wang, Lei Feng, Min-Ling Zhang. 11809-11820 [doi]

Towards Efficient and Effective Adversarial TrainingGaurang Sriramanan, Sravanti Addepalli, Arya Baburaj, Venkatesh Babu R.. 11821-11833 [doi]

Intriguing Properties of Contrastive LossesTing Chen, Calvin Luo, Lala Li. 11834-11845 [doi]

Detecting Moments and Highlights in Videos via Natural Language QueriesJie Lei, Tamara L. Berg, Mohit Bansal. 11846-11858 [doi]

Stochastic optimization under time drift: iterate averaging, step-decay schedules, and high probability guaranteesJoshua Cutler, Dmitriy Drusvyatskiy, Zaïd Harchaoui. 11859-11869 [doi]

Learning Stable Deep Dynamics Models for Partially Observed or Delayed Dynamical SystemsAndreas Schlaginhaufen, Philippe Wenk, Andreas Krause 0001, Florian Dörfler. 11870-11882 [doi]

An Uncertainty Principle is a Price of Privacy-Preserving MicrodataJohn M. Abowd, Robert Ashmead, Ryan Cumings-Menon, Simson L. Garfinkel, Daniel Kifer, Philip Leclerc, William Sexton, Ashley Simpson, Christine Task, Pavel Zhuravlev. 11883-11895 [doi]

Fairness in Ranking under UncertaintyAshudeep Singh, David Kempe 0001, Thorsten Joachims. 11896-11908 [doi]

Generalized Proximal Policy Optimization with Sample ReuseJames Queeney, Yannis Paschalidis, Christos G. Cassandras. 11909-11919 [doi]

Mosaicking to Distill: Knowledge Distillation from Out-of-Domain DataGongfan Fang, Yifan Bao, Jie Song, Xinchao Wang, Donglin Xie, Chengchao Shen, Mingli Song. 11920-11932 [doi]

Batch Active Learning at ScaleGui Citovsky, Giulia DeSalvo, Claudio Gentile, Lazaros Karydas, Anand Rajagopalan, Afshin Rostamizadeh, Sanjiv Kumar. 11933-11944 [doi]

Joint Semantic Mining for Weakly Supervised RGB-D Salient Object DetectionJingjing Li, Wei Ji, Qi Bi, Cheng Yan, Miao Zhang, Yongri Piao, Huchuan Lu, Li Cheng 0001. 11945-11959 [doi]

Not All Images are Worth 16x16 Words: Dynamic Transformers for Efficient Image RecognitionYulin Wang, Rui Huang, Shiji Song, Zeyi Huang, Gao Huang. 11960-11973 [doi]

Contrastive Learning for Neural Topic ModelThong Nguyen, Anh Tuan Luu. 11974-11986 [doi]

Learning in two-player zero-sum partially observable Markov games with perfect recallTadashi Kozuno, Pierre Ménard, Rémi Munos, Michal Valko. 11987-11998 [doi]

A Geometric Structure of Acceleration and Its Role in Making Gradients Small FastJongmin Lee, Chanwoo Park, Ernest K. Ryu. 11999-12012 [doi]

ATISS: Autoregressive Transformers for Indoor Scene SynthesisDespoina Paschalidou, Amlan Kar, Maria Shugrina, Karsten Kreis, Andreas Geiger 0001, Sanja Fidler. 12013-12026 [doi]

Generalized Depthwise-Separable Convolutions for Adversarially Robust and Efficient Neural NetworksHassan Dbouk, Naresh R. Shanbhag. 12027-12039 [doi]

A Provably Efficient Model-Free Posterior Sampling Method for Episodic Reinforcement LearningChristoph Dann, Mehryar Mohri, Tong Zhang 0001, Julian Zimmert. 12040-12051 [doi]

Fast Federated Learning in the Presence of Arbitrary Device UnavailabilityXinran Gu, Kaixuan Huang, Jingzhao Zhang, Longbo Huang. 12052-12064 [doi]

On The Structure of Parametric Tournaments with Application to Ranking from Pairwise ComparisonsVishnu Veerathu, Arun Rajkumar. 12065-12076 [doi]

SegFormer: Simple and Efficient Design for Semantic Segmentation with TransformersEnze Xie, Wenhai Wang, Zhiding Yu, Anima Anandkumar, Jose M. Alvarez, Ping Luo 0002. 12077-12090 [doi]

Fairness via Representation NeutralizationMengnan Du, Subhabrata Mukherjee, Guanchu Wang, Ruixiang Tang, Ahmed Hassan Awadallah, Xia Hu. 12091-12103 [doi]

Residual Relaxation for Multi-view Representation LearningYifei Wang, Zhengyang Geng, Feng Jiang, Chuming Li, Yisen Wang 0001, Jiansheng Yang, Zhouchen Lin. 12104-12115 [doi]

Do Vision Transformers See Like Convolutional Neural Networks?Maithra Raghu, Thomas Unterthiner, Simon Kornblith, Chiyuan Zhang, Alexey Dosovitskiy. 12116-12128 [doi]

Optimization-Based Algebraic Multigrid Coarsening Using Reinforcement LearningAli Taghibakhshi, Scott P. MacLachlan, Luke N. Olson, Matthew West 0001. 12129-12140 [doi]

Delayed Propagation Transformer: A Universal Computation Engine towards Practical Control in Cyber-Physical SystemsWenqing Zheng, Qiangqiang Guo, Hao Yang, Peihao Wang, Zhangyang Wang. 12141-12153 [doi]

Explaining Latent Representations with a Corpus of ExamplesJonathan Crabbé, Zhaozhi Qian, Fergus Imrie, Mihaela van der Schaar. 12154-12166 [doi]

Explaining heterogeneity in medial entorhinal cortex with task-driven neural networksAran Nayebi, Alexander Attinger, Malcolm Campbell, Kiah Hardcastle, Isabel Low, Caitlin S. Mallory, Gabriel Mel, Ben Sorscher, Alex H. Williams, Surya Ganguli, Lisa M. Giocomo, Daniel L. K. Yamins. 12167-12179 [doi]

Beyond Smoothness: Incorporating Low-Rank Analysis into Nonparametric Density EstimationRobert A. Vandermeulen, Antoine Ledent. 12180-12193 [doi]

Multi-View Representation Learning via Total Correlation ObjectiveHyeongJoo Hwang, Geon-hyeong Kim, Seunghoon Hong, Kee-Eung Kim. 12194-12207 [doi]

FACMAC: Factored Multi-Agent Centralised Policy GradientsBei Peng, Tabish Rashid, Christian Schröder de Witt, Pierre-Alexandre Kamienny, Philip H. S. Torr, Wendelin Boehmer, Shimon Whiteson. 12208-12221 [doi]

EDGE: Explaining Deep Reinforcement Learning PoliciesWenbo Guo 0002, Xian Wu, Usmann Khan, Xinyu Xing. 12222-12236 [doi]

Learning to Assimilate in Chaotic Dynamical SystemsJohn McCabe, Jed Brown. 12237-12250 [doi]

Object-aware Contrastive Learning for Debiased Scene RepresentationSangwoo Mo, Hyunwoo Kang, Kihyuk Sohn, Chun-Liang Li, Jinwoo Shin. 12251-12264 [doi]

Evaluating Efficient Performance Estimators of Neural ArchitecturesXuefei Ning, Changcheng Tang, Wenshuo Li, Zixuan Zhou, Shuang Liang, Huazhong Yang, Yu Wang 0002. 12265-12277 [doi]

A-NeRF: Articulated Neural Radiance Fields for Learning Human Shape, Appearance, and PoseShih-Yang Su, Frank Yu, Michael Zollhöfer, Helge Rhodin. 12278-12291 [doi]

Differential Privacy Over Riemannian ManifoldsMatthew Reimherr, Karthik Bharath, Carlos Soto. 12292-12303 [doi]

How can classical multidimensional scaling go wrong?Rishi Sonthalia, Greg Van Buskirk, Benjamin Raichel, Anna C. Gilbert. 12304-12315 [doi]

Modeling Heterogeneous Hierarchies with Relation-specific Hyperbolic ConesYushi Bai, Zhitao Ying, Hongyu Ren, Jure Leskovec. 12316-12327 [doi]

Non-asymptotic Error Bounds for Bidirectional GANsShiao Liu, Yunfei Yang, Jian Huang 0003, Yuling Jiao, Yang Wang 0020. 12328-12339 [doi]

Confidence-Aware Imitation Learning from Demonstrations with Varying OptimalitySongyuan Zhang, Zhangjie Cao, Dorsa Sadigh, Yanan Sui. 12340-12350 [doi]

Answering Complex Causal Queries With the Maximum Causal Set EffectZachary Markovich. 12351-12361 [doi]

Identifiability in inverse reinforcement learningHaoyang Cao, Samuel N. Cohen, Lukasz Szpruch. 12362-12373 [doi]

A Probabilistic State Space Model for Joint Inference from Differential Equations and DataJonathan Schmidt, Nicholas Krämer, Philipp Hennig. 12374-12385 [doi]

On Plasticity, Invariance, and Mutually Frozen Weights in Sequential Task LearningJulian G. Zilly, Alessandro Achille, Andrea Censi, Emilio Frazzoli. 12386-12399 [doi]

Provably Efficient Black-Box Action Poisoning Attacks Against Reinforcement LearningGuanlin Liu, Lifeng Lai. 12400-12410 [doi]

Fast Approximation of the Sliced-Wasserstein Distance Using Concentration of Random ProjectionsKimia Nadjahi, Alain Durmus, Pierre E. Jacob, Roland Badeau, Umut Simsekli. 12411-12424 [doi]

Causal Navigation by Continuous-time Neural NetworksCharles Vorbach, Ramin M. Hasani, Alexander Amini, Mathias Lechner, Daniela Rus. 12425-12440 [doi]

Global Convergence of Online Optimization for Nonlinear Model Predictive ControlSen Na. 12441-12453 [doi]

Argmax Flows and Multinomial Diffusion: Learning Categorical DistributionsEmiel Hoogeboom, Didrik Nielsen, Priyank Jaini, Patrick Forré, Max Welling. 12454-12465 [doi]

Learning with User-Level PrivacyDaniel Levy, Ziteng Sun, Kareem Amin, Satyen Kale, Alex Kulesza, Mehryar Mohri, Ananda Theertha Suresh. 12466-12479 [doi]

Don't Generate Me: Training Differentially Private Generative Models with Sinkhorn DivergenceTianshi Cao, Alex Bie, Arash Vahdat, Sanja Fidler, Karsten Kreis. 12480-12492 [doi]

Keeping Your Eye on the Ball: Trajectory Attention in Video TransformersMandela Patrick, Dylan Campbell, Yuki M. Asano, Ishan Misra, Florian Metze, Christoph Feichtenhofer, Andrea Vedaldi, João F. Henriques. 12493-12506 [doi]

Variational Bayesian Optimistic SamplingBrendan O'Donoghue, Tor Lattimore. 12507-12519 [doi]

Cross-modal Domain Adaptation for Cost-Efficient Visual Reinforcement LearningXiong-Hui Chen, Shengyi Jiang, Feng Xu, Zongzhang Zhang, Yang Yu 0001. 12520-12532 [doi]

D2C: Diffusion-Decoding Models for Few-Shot Conditional GenerationAbhishek Sinha, Jiaming Song, Chenlin Meng, Stefano Ermon. 12533-12548 [doi]

Continual Auxiliary Task LearningMatthew McLeod, Chunlok Lo, Matthew Schlegel, Andrew Jacobsen, Raksha Kumaraswamy, Martha White, Adam White. 12549-12562 [doi]

Two-step lookahead Bayesian optimization with inequality constraintsYunxiang Zhang, Xiangyu Zhang 0012, Peter I. Frazier. 12563-12575 [doi]

Learning with Labeling Induced AbstentionsKareem Amin, Giulia DeSalvo, Afshin Rostamizadeh. 12576-12586 [doi]

SQALER: Scaling Question Answering by Decoupling Multi-Hop and Logical ReasoningMattia Atzeni, Jasmina Bogojeska, Andreas Loukas. 12587-12599 [doi]

Out-of-Distribution Generalization in Kernel RegressionAbdulkadir Canatar, Blake Bordelon, Cengiz Pehlevan. 12600-12612 [doi]

FL-WBC: Enhancing Robustness against Model Poisoning Attacks in Federated Learning from a Client PerspectiveJingwei Sun, Ang Li 0005, Louis DiValentin, Amin Hassanzadeh, Yiran Chen, Hai Li 0001. 12613-12624 [doi]

Chebyshev-Cantelli PAC-Bayes-Bennett Inequality for the Weighted Majority VoteYi-Shan Wu 0003, Andrés R. Masegosa, Stephan Sloth Lorenzen, Christian Igel, Yevgeny Seldin. 12625-12636 [doi]

A Multi-Implicit Neural Representation for FontsPradyumna Reddy, Zhifei Zhang, Zhaowen Wang, Matthew Fisher, Hailin Jin, Niloy J. Mitra. 12637-12647 [doi]

OctField: Hierarchical Implicit Functions for 3D ModelingJia-Heng Tang, Weikai Chen 0001, Jie Yang, Bo Wang, Songrun Liu, Bo Yang, Lin Gao 0004. 12648-12660 [doi]

The Inductive Bias of Quantum KernelsJonas M. Kübler, Simon Buchholz, Bernhard Schölkopf. 12661-12673 [doi]

An Exponential Improvement on the Memorization Capacity of Deep Threshold NetworksShashank Rajput, Kartik Sreenivasan, Dimitris S. Papailiopoulos, Amin Karbasi. 12674-12685 [doi]

Pretraining Representations for Data-Efficient Reinforcement LearningMax Schwarzer, Nitarshan Rajkumar, Michael Noukhovitch, Ankesh Anand, Laurent Charlin, R. Devon Hjelm, Philip Bachman, Aaron C. Courville. 12686-12699 [doi]

Universal Approximation Using Well-Conditioned Normalizing FlowsHolden Lee, Chirag Pabbaraju, Anish Prasad Sevekari, Andrej Risteski. 12700-12711 [doi]

On the Validity of Modeling SGD with Stochastic Differential Equations (SDEs)Zhiyuan Li 0005, Sadhika Malladi, Sanjeev Arora. 12712-12725 [doi]

Proportional Participatory Budgeting with Additive UtilitiesGrzegorz Pierczynski, Piotr Skowron 0001, Dominik Peters. 12726-12737 [doi]

Disentangling the Roles of Curation, Data-Augmentation and the Prior in the Cold Posterior EffectLorenzo Noci, Kevin Roth, Gregor Bachmann, Sebastian Nowozin, Thomas Hofmann. 12738-12748 [doi]

Sanity Checks for Lottery Tickets: Does Your Winning Ticket Really Win the Jackpot?Xiaolong Ma, Geng Yuan, Xuan Shen, Tianlong Chen, Xuxi Chen, Xiaohan Chen, Ning Liu 0007, Minghai Qin, Sijia Liu 0001, Zhangyang Wang, Yanzhi Wang. 12749-12760 [doi]

Collaborative Causal Discovery with Atomic InterventionsRaghavendra Addanki, Shiva Prasad Kasiviswanathan. 12761-12773 [doi]

Towards optimally abstaining from prediction with OOD test examplesAdam Kalai, Varun Kanade. 12774-12785 [doi]

TokenLearner: Adaptive Space-Time Tokenization for VideosMichael S. Ryoo, A. J. Piergiovanni, Anurag Arnab, Mostafa Dehghani 0001, Anelia Angelova. 12786-12797 [doi]

Learning in Multi-Stage Decentralized Matching MarketsXiaowu Dai, Michael I. Jordan. 12798-12809 [doi]

Non-asymptotic convergence bounds for Wasserstein approximation using point cloudsQuentin Mérigot, Filippo Santambrogio, Clément Sarrazin. 12810-12821 [doi]

Understanding Interlocking Dynamics of Cooperative RationalizationMo Yu, Yang Zhang 0001, Shiyu Chang, Tommi S. Jaakkola. 12822-12835 [doi]

Adversarial Robustness without Adversarial Training: A Teacher-Guided Curriculum Learning ApproachAnindya Sarkar, Anirban Sarkar, Sowrya Gali, Vineeth N. Balasubramanian. 12836-12848 [doi]

Tactical Optimism and Pessimism for Deep Reinforcement LearningTed Moskovitz, Jack Parker-Holder, Aldo Pacchiano, Michael Arbel, Michael I. Jordan. 12849-12863 [doi]

Towards Hyperparameter-free Policy Selection for Offline Reinforcement LearningSiyuan Zhang, Nan Jiang. 12864-12875 [doi]

FjORD: Fair and Accurate Federated Learning under heterogeneous targets with Ordered DropoutSamuel Horváth, Stefanos Laskaridis, Mário Almeida, Ilias Leontiadis, Stylianos I. Venieris, Nicholas D. Lane. 12876-12889 [doi]

Optimal Uniform OPE and Model-based Offline Reinforcement Learning in Time-Homogeneous, Reward-Free and Task-Agnostic SettingsMing Yin, Yu-Xiang Wang 0003. 12890-12903 [doi]

MixSeq: Connecting Macroscopic Time Series Forecasting with Microscopic Time Series DataZhibo Zhu, Ziqi Liu, Ge Jin, Zhiqiang Zhang 0012, Lei Chen, Jun Zhou 0011, Jianyong Zhou. 12904-12916 [doi]

Pareto Domain AdaptationFangrui Lv, Jian Liang, Kaixiong Gong, Shuang Li 0008, Chi Harold Liu, Han Li, Di Liu, Guoren Wang. 12917-12929 [doi]

Divergence Frontiers for Generative Models: Sample Complexity, Quantization Effects, and Frontier IntegralsLang Liu, Krishna Pillutla, Sean Welleck, Sewoong Oh, Yejin Choi, Zaïd Harchaoui. 12930-12942 [doi]

Consistency Regularization for Variational Auto-EncodersSamarth Sinha, Adji Bousso Dieng. 12943-12954 [doi]

Score-based Generative Neural Networks for Large-Scale Optimal TransportGrady Daniels, Tyler Maunu, Paul Hand. 12955-12965 [doi]

Interactive Label Cleaning with Example-based ExplanationsStefano Teso, Andrea Bontempelli, Fausto Giunchiglia, Andrea Passerini. 12966-12977 [doi]

Gradient Descent on Two-layer Nets: Margin Maximization and Simplicity BiasKaifeng Lyu, Zhiyuan Li 0005, Runzhe Wang, Sanjeev Arora. 12978-12991 [doi]

Glance-and-Gaze Vision TransformerQihang Yu, Yingda Xia, Yutong Bai, Yongyi Lu, Alan L. Yuille, Wei Shen 0002. 12992-13003 [doi]

Stochastic $L^\natural$-convex Function MinimizationHaixiang Zhang, Zeyu Zheng, Javad Lavaei. 13004-13018 [doi]

Self-Supervised GANs with Label AugmentationLiang Hou, Huawei Shen, Qi Cao, Xueqi Cheng. 13019-13031 [doi]

Shape As Points: A Differentiable Poisson SolverSongyou Peng, Chiyu Jiang, Yiyi Liao, Michael Niemeyer, Marc Pollefeys, Andreas Geiger 0001. 13032-13044 [doi]

Outcome-Driven Reinforcement Learning via Variational InferenceTim G. J. Rudner, Vitchyr Pong, Rowan McAllister, Yarin Gal, Sergey Levine. 13045-13058 [doi]

Drawing Robust Scratch Tickets: Subnetworks with Inborn Robustness Are Found within Randomly Initialized NetworksYonggan Fu, Qixuan Yu, Yang Zhang, Shang Wu, Xu Ouyang, David D. Cox, Yingyan Lin. 13059-13072 [doi]

Rectifying the Shortcut Learning of Background for Few-Shot LearningXu Luo, Longhui Wei, Liangjian Wen, Jinrong Yang, Lingxi Xie, Zenglin Xu, Qi Tian 0001. 13073-13085 [doi]

SEAL: Self-supervised Embodied Active Learning using Exploration and 3D ConsistencyDevendra Singh Chaplot, Murtaza Dalal, Saurabh Gupta 0001, Jitendra Malik, Ruslan Salakhutdinov. 13086-13098 [doi]

Sifting through the noise: Universal first-order methods for stochastic variational inequalitiesKimon Antonakopoulos, Thomas Pethick, Ali Kavis, Panayotis Mertikopoulos, Volkan Cevher. 13099-13111 [doi]

Accommodating Picky Customers: Regret Bound and Exploration Complexity for Multi-Objective Reinforcement LearningJingfeng Wu, Vladimir Braverman, Lin Yang 0011. 13112-13124 [doi]

Exact Privacy Guarantees for Markov Chain Implementations of the Exponential Mechanism with Artificial AtomsJeremy Seeman, Matthew Reimherr, Aleksandra B. Slavkovic. 13125-13136 [doi]

The Emergence of Objectness: Learning Zero-shot Segmentation from VideosRuntao Liu, Zhirong Wu, Stella X. Yu, Stephen Lin. 13137-13152 [doi]

Direct Multi-view Multi-person 3D Pose EstimationTao Wang 0053, Jianfeng Zhang, Yujun Cai, Shuicheng Yan, Jiashi Feng. 13153-13164 [doi]

MST: Masked Self-Supervised Transformer for Visual RepresentationZhaowen Li, Zhiyang Chen, Fan Yang, Wei Li, Yousong Zhu, Chaoyang Zhao, Rui Deng, Liwei Wu, Rui Zhao, Ming Tang 0001, Jinqiao Wang. 13165-13176 [doi]

Exploiting Opponents Under Utility Constraints in Sequential GamesMartino Bernasconi de Luca, Federico Cacciamani, Simone Fioravanti, Nicola Gatti 0001, Alberto Marchesi, Francesco Trovò. 13177-13188 [doi]

A Compositional Atlas of Tractable Circuit Operations for Probabilistic InferenceAntonio Vergari, Yoojung Choi, Anji Liu, Stefano Teso, Guy Van den Broeck. 13189-13201 [doi]

Demystifying and Generalizing BinaryConnectTim Dockhorn, Yaoliang Yu, Eyyüb Sari, Mahdi Zolnouri, Vahid Partovi Nia. 13202-13216 [doi]

CARMS: Categorical-Antithetic-REINFORCE Multi-Sample Gradient EstimatorAlek Dimitriev, Mingyuan Zhou. 13217-13229 [doi]

Learning to Learn Dense Gaussian Processes for Few-Shot LearningZe Wang, Zichen Miao, Xiantong Zhen, Qiang Qiu. 13230-13241 [doi]

Stochastic Solutions for Linear Inverse Problems using the Prior Implicit in a DenoiserZahra Kadkhodaie, Eero P. Simoncelli. 13242-13254 [doi]

Towards Stable and Robust AdderNetsMinjing Dong, Yunhe Wang 0001, Xinghao Chen 0001, Chang Xu 0002. 13255-13265 [doi]

Representing Long-Range Context for Graph Neural Networks with Global AttentionZhanghao Wu, Paras Jain 0001, Matthew A. Wright, Azalia Mirhoseini, Joseph E. Gonzalez, Ion Stoica. 13266-13279 [doi]

Beyond Bandit Feedback in Online Multiclass ClassificationDirk van der Hoeven, Federico Fusco, Nicolò Cesa-Bianchi. 13280-13291 [doi]

Learning Student-Friendly Teacher Networks for Knowledge DistillationDae Young Park, Moon-Hyun Cha, Changwook Jeong, Daesin Kim, Bohyung Han. 13292-13303 [doi]

Implicit Transformer Network for Screen Content Image Continuous Super-ResolutionJingyu Yang 0002, Sheng Shen, Huanjing Yue, Kun Li 0001. 13304-13315 [doi]

Channel Permutations for N: M SparsityJeff Pool, Chong Yu. 13316-13327 [doi]

Curriculum Learning for Vision-and-Language NavigationJiwen Zhang, Zhongyu Wei, Jianqing Fan, Jiajie Peng. 13328-13339 [doi]

k-ClusteringMaryam Negahbani, Deeparnab Chakrabarty. 13340-13351 [doi]

Video Instance Segmentation using Inter-Frame Communication TransformersSukjun Hwang, Miran Heo, Seoung Wug Oh, Seon Joo Kim. 13352-13363 [doi]

Progressive Coordinate Transforms for Monocular 3D Object DetectionLi Wang, Li Zhang 0040, Yi Zhu, Zhi Zhang, Tong He, Mu Li 0003, Xiangyang Xue. 13364-13377 [doi]

Structured Reordering for Modeling Latent Alignments in Sequence TransductionBailin Wang, Mirella Lapata, Ivan Titov. 13378-13391 [doi]

A universal probabilistic spike count model reveals ongoing modulation of neural variabilityDavid Liu, Máté Lengyel. 13392-13405 [doi]

Bellman Eluder Dimension: New Rich Classes of RL Problems, and Sample-Efficient AlgorithmsChi Jin, Qinghua Liu, Sobhan Miryoosefi. 13406-13418 [doi]

Detecting Anomalous Event Sequences with Temporal Point ProcessesOleksandr Shchur, Ali Caner Türkmen, Tim Januschowski, Jan Gasthaus, Stephan Günnemann. 13419-13431 [doi]

HNPE: Leveraging Global Parameters for Neural Posterior EstimationPedro Rodrigues 0002, Thomas Moreau, Gilles Louppe, Alexandre Gramfort. 13432-13443 [doi]

Alignment Attention by Matching Key and Query DistributionsShujian Zhang, Xinjie Fan, Huangjie Zheng, Korawat Tanwisuth, Mingyuan Zhou. 13444-13457 [doi]

Settling the Variance of Multi-Agent Policy GradientsJakub Grudzien Kuba, Muning Wen, Linghui Meng 0001, Shangding Gu, Haifeng Zhang 0002, David Mguni, Jun Wang 0012, Yaodong Yang 0001. 13458-13470 [doi]

For high-dimensional hierarchical models, consider exchangeability of effects across covariates instead of across datasetsBrian L. Trippe, Hilary K. Finucane, Tamara Broderick. 13471-13484 [doi]

Efficient Algorithms for Learning Depth-2 Neural Networks with General ReLU ActivationsPranjal Awasthi, Alex Tang, Aravindan Vijayaraghavan. 13485-13496 [doi]

Controllable and Compositional Generation with Latent-Space Energy-Based ModelsWeili Nie, Arash Vahdat, Anima Anandkumar. 13497-13510 [doi]

Reverse-Complement Equivariant Networks for DNA SequencesVincent Mallet, Jean-Philippe Vert. 13511-13523 [doi]

Provably Efficient Reinforcement Learning with Linear Function Approximation under Adaptivity ConstraintsTianhao Wang 0002, Dongruo Zhou, Quanquan Gu. 13524-13536 [doi]

Nonsmooth Implicit Differentiation for Machine-Learning and OptimizationJérôme Bolte, Tam Le, Edouard Pauwels, Antonio Silveti-Falls. 13537-13549 [doi]

Heuristic-Guided Reinforcement LearningChing-An Cheng, Andrey Kolobov, Adith Swaminathan. 13550-13563 [doi]

Statistical Undecidability in Linear, Non-Gaussian Causal Models in the Presence of Latent ConfoundersKonstantin Genin. 13564-13574 [doi]

A novel notion of barycenter for probability distributions based on optimal weak mass transportElsa Cazelles, Felipe A. Tobar, Joaquín Fontbona. 13575-13586 [doi]

Temporal-attentive Covariance Pooling Networks for Video RecognitionZilin Gao, Qilong Wang, Bingbing Zhang, Qinghua Hu, Peihua Li. 13587-13598 [doi]

Revisiting Smoothed Online LearningLijun Zhang 0005, Wei Jiang, Shiyin Lu, Tianbao Yang. 13599-13612 [doi]

Marginalised Gaussian Processes with Nested SamplingFergus Simpson, Vidhi Lalchand, Carl Edward Rasmussen. 13613-13625 [doi]

Provable Benefits of Actor-Critic Methods for Offline Reinforcement LearningAndrea Zanette, Martin J. Wainwright, Emma Brunskill. 13626-13640 [doi]

Bayesian Bellman OperatorsMattie Fellows, Kristian Hartikainen, Shimon Whiteson. 13641-13656 [doi]

Uncertainty Calibration for Ensemble-Based Debiasing MethodsRuibin Xiong, Yimeng Chen, Liang Pang, Xueqi Cheng, Zhi-Ming Ma, Yanyan Lan. 13657-13669 [doi]

Provably Faster Algorithms for Bilevel OptimizationJunjie Yang, Kaiyi Ji, Yingbin Liang. 13670-13682 [doi]

Neo-GNNs: Neighborhood Overlap-aware Graph Neural Networks for Link PredictionSeongjun Yun, Seoyoon Kim, Junhyun Lee, Jaewoo Kang, Hyunwoo J. Kim. 13683-13694 [doi]

Self-Supervised Multi-Object Tracking with Cross-input ConsistencyFavyen Bastani, Songtao He, Samuel Madden. 13695-13706 [doi]

Tree in Tree: from Decision Trees to Decision GraphsBingzhao Zhu, Mahsa Shoaran. 13707-13718 [doi]

Test-time Collective PredictionCelestine Mendler-Dünner, Wenshuo Guo, Stephen Bates, Michael I. Jordan. 13719-13731 [doi]

A Continuous Mapping For Augmentation DesignKeyu Tian, Chen Lin 0003, Ser-Nam Lim, Wanli Ouyang, Puneet K. Dokania, Philip H. S. Torr. 13732-13743 [doi]

Neural Routing by MemoryKaipeng Zhang, Zhenqiang Li, Zhifeng Li 0001, Wei Liu 0005, Yoichi Sato. 13744-13756 [doi]

GeoMol: Torsional Geometric Generation of Molecular 3D Conformer EnsemblesOctavian Ganea, Lagnajit Pattanaik, Connor W. Coley, Regina Barzilay, Klavs F. Jensen, William H. Green Jr., Tommi S. Jaakkola. 13757-13769 [doi]

CANITA: Faster Rates for Distributed Convex Optimization with Communication CompressionZhize Li, Peter Richtárik. 13770-13781 [doi]

Drop-DTW: Aligning Common Signal Between Sequences While Dropping OutliersNikita Dvornik, Isma Hadji, Konstantinos G. Derpanis, Animesh Garg, Allan D. Jepson. 13782-13793 [doi]

Safe Reinforcement Learning with Natural Language ConstraintsTsung-Yen Yang, Michael Y. Hu, Yinlam Chow, Peter J. Ramadge, Karthik Narasimhan. 13794-13808 [doi]

Compositional Modeling of Nonlinear Dynamical Systems with ODE-based Random FeaturesThomas M. McDonald, Mauricio A. Álvarez. 13809-13819 [doi]

Implicit Semantic Response Alignment for Partial Domain AdaptationWenxiao Xiao, Zhengming Ding, Hongfu Liu. 13820-13833 [doi]

ToAlign: Task-Oriented Alignment for Unsupervised Domain AdaptationGuoqiang Wei, Cuiling Lan, Wenjun Zeng, Zhizheng Zhang 0004, Zhibo Chen 0001. 13834-13846 [doi]

Prior-independent Dynamic Auctions for a Value-maximizing BuyerYuan Deng, Hanrui Zhang. 13847-13858 [doi]

Safe Reinforcement Learning by Imagining the Near FutureGarrett Thomas, Yuping Luo, Tengyu Ma 0001. 13859-13869 [doi]

Contrastive Active InferencePietro Mazzaglia, Tim Verbelen, Bart Dhoedt. 13870-13882 [doi]

Overparameterization Improves Robustness to Covariate Shift in High DimensionsNilesh Tripuraneni, Ben Adlam, Jeffrey Pennington. 13883-13897 [doi]

Logarithmic Regret in Feature-based Dynamic PricingJianyu Xu, Yu-Xiang Wang 0003. 13898-13910 [doi]

Dimension-free empirical entropy estimationDoron Cohen, Aryeh Kontorovich, Aaron Koolyk, Geoffrey Wolfer. 13911-13923 [doi]

Towards Biologically Plausible Convolutional NetworksRoman Pogodin, Yash Mehta, Timothy P. Lillicrap, Peter E. Latham. 13924-13936 [doi]

DynamicViT: Efficient Vision Transformers with Dynamic Token SparsificationYongming Rao, Wenliang Zhao, Benlin Liu, Jiwen Lu, Jie Zhou 0001, Cho-Jui Hsieh. 13937-13949 [doi]

Learning Transferable Adversarial PerturbationsKrishna Kanth Nakka, Mathieu Salzmann. 13950-13962 [doi]

PortaSpeech: Portable and High-Quality Generative Text-to-SpeechYi Ren 0006, Jinglin Liu, Zhou Zhao. 13963-13974 [doi]

Exponential Graph is Provably Efficient for Decentralized Deep TrainingBicheng Ying, Kun Yuan, Yiming Chen 0003, Hanbin Hu, Pan Pan, Wotao Yin. 13975-13987 [doi]

CLIP-It! Language-Guided Video SummarizationMedhini Narasimhan, Anna Rohrbach, Trevor Darrell. 13988-14000 [doi]

Learning Treatment Effects in Panels with General Intervention PatternsVivek F. Farias, Andrew A. Li, Tianyi Peng. 14001-14013 [doi]

Lossy Compression for Lossless PredictionYann Dubois, Benjamin Bloem-Reddy, Karen Ullrich, Chris J. Maddison. 14014-14028 [doi]

From Optimality to Robustness: Adaptive Re-Sampling Strategies in Stochastic BanditsDorian Baudry, Patrick Saux, Odalric-Ambrym Maillard. 14029-14041 [doi]

CCVS: Context-aware Controllable Video SynthesisGuillaume Le Moing, Jean Ponce, Cordelia Schmid. 14042-14055 [doi]

An Online Riemannian PCA for Stochastic Canonical Correlation AnalysisZihang Meng, Rudrasis Chakraborty, Vikas Singh. 14056-14068 [doi]

Predify: Augmenting deep neural networks with brain-inspired predictive coding dynamicsBhavin Choksi, Milad Mozafari, Callum Biggs O'May, Benjamin Ador, Andrea Alamia, Rufin VanRullen. 14069-14083 [doi]

Deep Extrapolation for Attribute-Enhanced GenerationAlvin Chan, Ali Madani, Ben Krause, Nikhil Naik. 14084-14096 [doi]

Generalized DataWeighting via Class-Level Gradient ManipulationCan Chen, Shuhao Zheng, Xi Chen 0009, Erqun Dong, Xue (Steve) Liu, Hao Liu, Dejing Dou. 14097-14109 [doi]

Slow Learning and Fast Inference: Efficient Graph Similarity Computation via Knowledge DistillationCan Qin, Handong Zhao, Lichen Wang, Huan Wang 0014, Yulun Zhang, Yun Fu 0001. 14110-14121 [doi]

Meta Learning Backpropagation And Improving ItLouis Kirsch, Jürgen Schmidhuber. 14122-14134 [doi]

Posterior Meta-Replay for Continual LearningChristian Henning, Maria R. Cervera, Francesco D'Angelo, Johannes von Oswald, Regina Traber, Benjamin Ehret, Seijin Kobayashi, Benjamin F. Grewe, João Sacramento. 14135-14149 [doi]

Optimizing Reusable Knowledge for Continual Learning via MetalearningJulio Hurtado, Alain Raymond-Saez, Alvaro Soto. 14150-14162 [doi]

A sampling-based circuit for optimal decision makingCamille E. Rullán Buxó, Cristina Savin. 14163-14175 [doi]

Compressed Video Contrastive LearningYuqi Huo, Mingyu Ding, Haoyu Lu, Nanyi Fei, Zhiwu Lu 0001, Ji-Rong Wen, Ping Luo 0002. 14176-14187 [doi]

Uniform-PAC Bounds for Reinforcement Learning with Linear Function ApproximationJiafan He, Dongruo Zhou, Quanquan Gu. 14188-14199 [doi]

Attention Bottlenecks for Multimodal FusionArsha Nagrani, Shan Yang, Anurag Arnab, Aren Jansen, Cordelia Schmid, Chen Sun 0002. 14200-14213 [doi]

Convergence of adaptive algorithms for constrained weakly convex optimizationAhmet Alacaoglu, Yura Malitsky, Volkan Cevher. 14214-14225 [doi]

On the Convergence of Step Decay Step-Size for Stochastic OptimizationXiaoyu Wang, Sindri Magnússon, Mikael Johansson 0001. 14226-14238 [doi]

BernNet: Learning Arbitrary Graph Spectral Filters via Bernstein ApproximationMingguo He, Zhewei Wei, Zengfeng Huang, Hongteng Xu. 14239-14251 [doi]

Co-evolution Transformer for Protein Contact PredictionHe Zhang, Fusong Ju, Jianwei Zhu, Liang He, Bin Shao, Nanning Zheng 0001, Tie-Yan Liu. 14252-14263 [doi]

Unsupervised Foreground Extraction via Deep Region CompetitionPeiyu Yu, Sirui Xie, Xiaojian Ma, Yixin Zhu, Ying Nian Wu, Song Chun Zhu. 14264-14279 [doi]

Leveraging Spatial and Temporal Correlations in Sparsified Mean EstimationDivyansh Jhunjhunwala, Ankur Mallick, Advait Gadhikar, Swanand Kadhe, Gauri Joshi. 14280-14292 [doi]

Last-iterate Convergence in Extensive-Form GamesChung-wei Lee, Christian Kroer, Haipeng Luo. 14293-14305 [doi]

Class-Incremental Learning via Dual AugmentationFei Zhu, Zhen Cheng, Xu-Yao Zhang, Chenglin Liu. 14306-14318 [doi]

Robust and Fully-Dynamic Coreset for Continuous-and-Bounded Learning (With Outliers) ProblemsZixiu Wang, Yiwen Guo, Hu Ding. 14319-14331 [doi]

Rethinking and Reweighting the Univariate Losses for Multi-Label Ranking: Consistency and GeneralizationGuoqiang Wu, Chongxuan Li, Kun Xu 0004, Jun Zhu 0001. 14332-14344 [doi]

Fair Clustering Under a Bounded CostSeyed A. Esmaeili, Brian Brubach, Aravind Srinivasan, John Dickerson 0001. 14345-14357 [doi]

Improving Calibration through the Relationship with Adversarial RobustnessYao Qin, Xuezhi Wang 0002, Alex Beutel, Ed H. Chi. 14358-14369 [doi]

Credal Self-Supervised LearningJulian Lienen, Eyke Hüllermeier. 14370-14382 [doi]

Spot the Difference: Detection of Topological Changes via Geometric AlignmentSteffen Czolbe, Aasa Feragen, Oswin Krause. 14383-14395 [doi]

Rethinking the Variational Interpretation of Accelerated Optimization MethodsPeiyuan Zhang, Antonio Orvieto, Hadi Daneshmand. 14396-14406 [doi]

Linear and Kernel Classification in the Streaming Model: Improved Bounds for Heavy HittersArvind V. Mahankali, David P. Woodruff. 14407-14420 [doi]

A PAC-Bayes Analysis of Adversarial RobustnessPaul Viallard, Guillaume Vidot, Amaury Habrard, Emilie Morvant. 14421-14433 [doi]

SE(3)-equivariant prediction of molecular wavefunctions and electronic densitiesOliver T. Unke, Mihail Bogojeski, Michael Gastegger, Mario Geiger, Tess Smidt, Klaus-Robert Müller. 14434-14447 [doi]

Modified Frank Wolfe in Probability SpaceCarson Kent, Jiajin Li, José H. Blanchet, Peter W. Glynn. 14448-14462 [doi]

Bayesian Optimization of Function NetworksRaul Astudillo, Peter I. Frazier. 14463-14475 [doi]

Look at What I'm Doing: Self-Supervised Spatial Grounding of Narrations in Instructional VideosReuben Tan, Bryan A. Plummer, Kate Saenko, Hailin Jin, Bryan Russell. 14476-14487 [doi]

RETRIEVE: Coreset Selection for Efficient and Robust Semi-Supervised LearningKrishnaTeja Killamsetty, Xujiang Zhao, Feng Chen 0001, Rishabh K. Iyer. 14488-14501 [doi]

Collaborating with Humans without Human DataDJ Strouse, Kevin R. McKee, Matt M. Botvinick, Edward Hughes 0001, Richard Everett 0001. 14502-14515 [doi]

Training Feedback Spiking Neural Networks by Implicit Differentiation on the Equilibrium StateMingqing Xiao 0002, Qingyan Meng, Zongpeng Zhang, Yisen Wang 0001, Zhouchen Lin. 14516-14528 [doi]

Online Selective Classification with Limited FeedbackAditya Gangrade, Anil Kag, Ashok Cutkosky, Venkatesh Saligrama. 14529-14541 [doi]

Controlled Text Generation as Continuous Optimization with Multiple ConstraintsSachin Kumar, Eric Malmi, Aliaksei Severyn, Yulia Tsvetkov. 14542-14554 [doi]

S$^3$: Sign-Sparse-Shift Reparametrization for Effective Training of Low-bit Shift NetworksXinlin Li, Bang Liu, Yaoliang Yu, Wulong Liu, Chunjing Xu, Vahid Partovi Nia. 14555-14566 [doi]

Implicit MLE: Backpropagating Through Discrete Exponential Family DistributionsMathias Niepert, Pasquale Minervini, Luca Franceschi. 14567-14579 [doi]

Scaling up Continuous-Time Markov Chains Helps Resolve UnderspecificationAlkis Gotovos, Rebekka Burkholz, John Quackenbush, Stefanie Jegelka. 14580-14592 [doi]

Do Neural Optimal Transport Solvers Work? A Continuous Wasserstein-2 BenchmarkAlexander Korotin, Lingxiao Li, Aude Genevay, Justin M. Solomon, Alexander Filippov, Evgeny Burnaev. 14593-14605 [doi]

Linear Convergence in Federated Learning: Tackling Client Heterogeneity and Sparse GradientsAritra Mitra, Rayana H. Jaafar, George J. Pappas, Hamed Hassani. 14606-14619 [doi]

On the Convergence of Prior-Guided Zeroth-Order Optimization AlgorithmsShuyu Cheng, Guoqiang Wu, Jun Zhu 0001. 14620-14631 [doi]

Revisit Multimodal Meta-Learning through the Lens of Multi-Task LearningMilad Abdollahzadeh, Touba Malekzadeh, Ngai-Man Cheung. 14632-14644 [doi]

Dynamic Sasvi: Strong Safe Screening for Norm-Regularized Least SquaresHiroaki Yamada 0006, Makoto Yamada. 14645-14655 [doi]

What Matters for Adversarial Imitation Learning?Manu Orsini, Anton Raichuk, Léonard Hussenot, Damien Vincent, Robert Dadashi, Sertan Girgin, Matthieu Geist, Olivier Bachem, Olivier Pietquin, Marcin Andrychowicz. 14656-14668 [doi]

Sequential Causal Imitation Learning with Unobserved ConfoundersDaniel Kumor, Junzhe Zhang, Elias Bareinboim. 14669-14680 [doi]

Topic Modeling Revisited: A Document Graph-based Neural Network PerspectiveDazhong Shen, Chuan Qin 0002, Chao Wang 0086, Zheng Dong, Hengshu Zhu, Hui Xiong 0001. 14681-14693 [doi]

Hard-Attention for Scalable Image ClassificationAthanasios Papadopoulos, Pawel Korus, Nasir D. Memon. 14694-14707 [doi]

Fast Routing under Uncertainty: Adaptive Learning in Congestion Games via Exponential WeightsDong Quan Vu, Kimon Antonakopoulos, Panayotis Mertikopoulos. 14708-14720 [doi]

Profiling Pareto Front With Multi-Objective Stein Variational Gradient DescentXingchao Liu, Xin Tong, Qiang Liu 0001. 14721-14733 [doi]

MAP Propagation Algorithm: Faster Learning with a Team of Reinforcement Learning AgentsStephen Chung. 14734-14744 [doi]

TransGAN: Two Pure Transformers Can Make One Strong GAN, and That Can Scale UpYifan Jiang 0001, Shiyu Chang, Zhangyang Wang. 14745-14758 [doi]

A Central Limit Theorem for Differentially Private Query AnsweringJinshuo Dong, Weijie J. Su, Linjun Zhang. 14759-14770 [doi]

Differential Privacy Dynamics of Langevin Diffusion and Noisy Gradient DescentRishav Chourasia, Jiayuan Ye 0001, Reza Shokri. 14771-14781 [doi]

Data driven semi-supervised learningMaria-Florina Balcan, Dravyansh Sharma. 14782-14794 [doi]

Meta-Learning via Learning with Distributed MemorySudarshan Babu, Pedro Savarese, Michael Maire. 14795-14808 [doi]

Physics-Integrated Variational Autoencoders for Robust and Interpretable Generative ModelingNaoya Takeishi, Alexandros Kalousis. 14809-14821 [doi]

Characterizing the risk of fairwashingUlrich Aïvodji, Hiromi Arai, Sébastien Gambs, Satoshi Hara 0001. 14822-14834 [doi]

Qimera: Data-free Quantization with Synthetic Boundary Supporting SamplesKanghyun Choi, Deokki Hong, Noseong Park, Youngsok Kim, Jinho Lee. 14835-14847 [doi]

Embedding Principle of Loss Landscape of Deep Neural NetworksYaoyu Zhang, Zhongwang Zhang, Tao Luo, Zhi-Qin J. Xu. 14848-14859 [doi]

Adversarial Reweighting for Partial Domain AdaptationXiang Gu 0005, Xi Yu, Yan Yang 0007, Jian Sun 0009, ZongBen Xu. 14860-14872 [doi]

M-FAC: Efficient Matrix-Free Approximations of Second-Order InformationElias Frantar, Eldar Kurtic, Dan Alistarh. 14873-14886 [doi]

Graph Adversarial Self-Supervised LearningLongqi Yang, LiangLiang Zhang, Wenjing Yang 0002. 14887-14899 [doi]

Anti-Backdoor Learning: Training Clean Models on Poisoned DataYige Li, Xixiang Lyu, Nodens Koren, Lingjuan Lyu, Bo Li 0026, Xingjun Ma. 14900-14912 [doi]

Locally Most Powerful Bayesian Test for Out-of-Distribution Detection using Deep Generative ModelsKeunseo Kim, Juncheol Shin, Heeyoung Kim. 14913-14924 [doi]

Stable Neural ODE with Lyapunov-Stable Equilibrium Points for Defending Against Adversarial AttacksQiyu Kang, Yang Song 0012, Qinxu Ding, Wee-Peng Tay. 14925-14937 [doi]

Robust Compressed Sensing MRI with Deep Generative PriorsAjil Jalal, Marius Arvinte, Giannis Daras, Eric Price 0001, Alexandros G. Dimakis, Jonathan I. Tamir. 14938-14954 [doi]

H-NeRF: Neural Radiance Fields for Rendering and Temporal Reconstruction of Humans in MotionHongyi Xu, Thiemo Alldieck, Cristian Sminchisescu. 14955-14966 [doi]

DOBF: A Deobfuscation Pre-Training Objective for Programming LanguagesMarie-Anne Lachaux, Baptiste Rozière, Marc Szafraniec, Guillaume Lample. 14967-14979 [doi]

Detecting Errors and Estimating Accuracy on Unlabeled Data with Self-training EnsemblesJiefeng Chen 0001, Frederick Liu, Besim Avci, Xi Wu 0001, Yingyu Liang, Somesh Jha. 14980-14992 [doi]

Exploiting Chain Rule and Bayes' Theorem to Compare Probability DistributionsHuangjie Zheng, Mingyuan Zhou. 14993-15006 [doi]

Actively Identifying Causal Effects with Latent Variables Given Only Response Variable ObservableTian-Zuo Wang, Zhi-Hua Zhou. 15007-15018 [doi]

Interventional Sum-Product Networks: Causal Inference with Tractable Probabilistic ModelsMatej Zecevic, Devendra Singh Dhami, Athresh Karanam, Sriraam Natarajan, Kristian Kersting. 15019-15031 [doi]

PettingZoo: Gym for Multi-Agent Reinforcement LearningJustin K. Terry, Benjamin Black, Nathaniel Grammel, Mario Jayakumar, Ananth Hari, Ryan Sullivan, Luis S. Santos, Clemens Dieffendahl, Caroline Horsch, Rodrigo Perez-Vicente, Niall L. Williams, Yashas Lokesh, Praveen Ravi. 15032-15043 [doi]

Parametric Complexity Bounds for Approximating PDEs with Neural NetworksTanya Marwah, Zachary C. Lipton, Andrej Risteski. 15044-15055 [doi]

Learning-to-learn non-convex piecewise-Lipschitz functionsMaria-Florina Balcan, Mikhail Khodak, Dravyansh Sharma, Ameet Talwalkar. 15056-15069 [doi]

Uncertain Decisions Facilitate Better Preference LearningCassidy Laidlaw, Stuart Russell. 15070-15083 [doi]

Decision Transformer: Reinforcement Learning via Sequence ModelingLili Chen, Kevin Lu, Aravind Rajeswaran, Kimin Lee, Aditya Grover, Michael Laskin, Pieter Abbeel, Aravind Srinivas, Igor Mordatch. 15084-15097 [doi]

Probability Paths and the Structure of Predictions over TimeZhiyuan (Jerry) Lin, Hao Sheng 0003, Sharad Goel. 15098-15110 [doi]

Deep Extended Hazard Models for Survival AnalysisQixian Zhong, Jonas Mueller, Jane-ling Wang. 15111-15124 [doi]

TNASP: A Transformer-based NAS Predictor with a Self-evolution FrameworkShun Lu, Jixiang Li, Jianchao Tan, Sen Yang 0004, Ji Liu 0002. 15125-15137 [doi]

Automorphic Equivalence-aware Graph Neural NetworkFengli Xu, Quanming Yao, Pan Hui 0001, Yong Li 0008. 15138-15150 [doi]

Random Shuffling Beats SGD Only After Many Epochs on Ill-Conditioned ProblemsItay Safran, Ohad Shamir. 15151-15161 [doi]

Analytic Study of Families of Spurious Minima in Two-Layer ReLU Neural Networks: A Tale of Symmetry IIYossi Arjevani, Michael Field. 15162-15174 [doi]

CAM-GAN: Continual Adaptation Modules for Generative Adversarial NetworksSakshi Varshney, Vinay Kumar Verma, P. K. Srijith, Lawrence Carin, Piyush Rai. 15175-15187 [doi]

Structured Dropout Variational Inference for Bayesian Neural NetworksSon Nguyen, Duong Nguyen, Khai Nguyen, Khoat Than, Hung Bui, Nhat Ho. 15188-15202 [doi]

Neural Relightable Participating Media RenderingQuan Zheng 0004, Gurprit Singh, Hans-Peter Seidel. 15203-15215 [doi]

Efficient Neural Network Training via Forward and Backward Propagation SparsificationXiao Zhou, Weizhong Zhang, Zonghao Chen, Shizhe Diao, Tong Zhang. 15216-15229 [doi]

Learning to Ground Multi-Agent Communication with AutoencodersToru Lin, Jacob Huh, Christopher Stauffer, Ser-Nam Lim, Phillip Isola. 15230-15242 [doi]

Large-Scale Wasserstein Gradient FlowsPetr Mokrov, Alexander Korotin, Lingxiao Li, Aude Genevay, Justin M. Solomon, Evgeny Burnaev. 15243-15256 [doi]

Who Leads and Who Follows in Strategic Classification?Tijana Zrnic, Eric Mazumdar, S. Shankar Sastry, Michael I. Jordan. 15257-15269 [doi]

Unadversarial Examples: Designing Objects for Robust VisionHadi Salman, Andrew Ilyas, Logan Engstrom, Sai Vemprala, Aleksander Madry, Ashish Kapoor. 15270-15284 [doi]

Deep Jump Learning for Off-Policy Evaluation in Continuous Treatment SettingsHengrui Cai, Chengchun Shi, Rui Song, Wenbin Lu. 15285-15300 [doi]

Attention Approximates Sparse Distributed MemoryTrenton Bricken, Cengiz Pehlevan. 15301-15315 [doi]

Augmented Shortcuts for Vision TransformersYehui Tang, Kai Han 0002, Chang Xu 0002, An Xiao, Yiping Deng, Chao Xu 0006, Yunhe Wang 0001. 15316-15327 [doi]

Finding Regions of Heterogeneity in Decision-Making via Expected Conditional CovarianceJustin Lim, Christina X. Ji, Michael Oberst, Saul Blecker, Leora Horwitz, David A. Sontag. 15328-15343 [doi]

Identifying and Benchmarking Natural Out-of-Context Prediction ProblemsDavid Madras, Richard S. Zemel. 15344-15358 [doi]

Label Disentanglement in Partition-based Extreme Multilabel ClassificationXuanqing Liu, Wei-Cheng Chang, Hsiang-Fu Yu, Cho-Jui Hsieh, Inderjit S. Dhillon. 15359-15369 [doi]

Leveraging SE(3) Equivariance for Self-supervised Category-Level Object Pose Estimation from Point CloudsXiaolong Li, Yijia Weng, Li Yi, Leonidas J. Guibas, A. Lynn Abbott, Shuran Song, He Wang 0010. 15370-15381 [doi]

A Theoretical Analysis of Fine-tuning with Linear TeachersGal Shachaf, Alon Brutzkus, Amir Globerson. 15382-15394 [doi]

Overinterpretation reveals image classification model pathologiesBrandon Carter 0001, Siddhartha Jain 0001, Jonas Mueller, David Gifford 0001. 15395-15407 [doi]

Neural Circuit Synthesis from Specification PatternsFrederik Schmitt, Christopher Hahn, Markus N. Rabe, Bernd Finkbeiner. 15408-15420 [doi]

Directional Message Passing on Molecular Graphs via Synthetic CoordinatesJohannes Gasteiger, Chandan Yeshwanth, Stephan Günnemann. 15421-15433 [doi]

Federated Multi-Task Learning under a Mixture of DistributionsOthmane Marfoq, Giovanni Neglia, Aurélien Bellet, Laetitia Kameni, Richard Vidal. 15434-15447 [doi]

Learning Generative Vision Transformer with Energy-Based Latent Space for Saliency PredictionJing Zhang 0052, Jianwen Xie, Nick Barnes, Ping Li 0001. 15448-15463 [doi]

Regularization in ResNet with Stochastic DepthSoufiane Hayou, Fadhel Ayed. 15464-15474 [doi]

ResT: An Efficient Transformer for Visual RecognitionQinglong Zhang, Yu-Bin Yang. 15475-15485 [doi]

Adversarial Examples for k-Nearest Neighbor Classifiers Based on Higher-Order Voronoi DiagramsChawin Sitawarin, Evgenios M. Kornaropoulos, Dawn Song, David A. Wagner 0001. 15486-15497 [doi]

Adversarially Robust 3D Point Cloud Recognition Using Self-SupervisionsJiachen Sun, Yulong Cao, Christopher B. Choy, Zhiding Yu, Anima Anandkumar, Zhuoqing Morley Mao, Chaowei Xiao. 15498-15512 [doi]

Tuning Mixed Input Hyperparameters on the Fly for Efficient Population Based AutoRLJack Parker-Holder, Vu Nguyen, Shaan Desai, Stephen J. Roberts. 15513-15528 [doi]

Neural Algorithmic Reasoners are Implicit PlannersAndreea Deac, Petar Velickovic, Ognjen Milinkovic, Pierre-Luc Bacon, Jian Tang 0005, Mladen Nikolic. 15529-15542 [doi]

Self-Supervised Learning with Kernel Dependence MaximizationYazhe Li, Roman Pogodin, Danica J. Sutherland, Arthur Gretton. 15543-15556 [doi]

CROCS: Clustering and Retrieval of Cardiac Signals Based on Patient Disease Class, Sex, and AgeDani Kiyasseh, Tingting Zhu 0001, David A. Clifton. 15557-15569 [doi]

Representing Hyperbolic Space Accurately using Multi-Component FloatsTao Yu, Christopher De Sa. 15570-15581 [doi]

Dimensionality Reduction for Wasserstein BarycenterZachary Izzo, Sandeep Silwal, Samson Zhou. 15582-15594 [doi]

Neural Population Geometry Reveals the Role of Stochasticity in Robust PerceptionJoel Dapello, Jenelle Feather, Hang Le, Tiago Marques, David D. Cox, Josh H. McDermott, James J. DiCarlo, SueYeon Chung. 15595-15607 [doi]

Unsupervised Learning of Compositional Energy ConceptsYilun Du, Shuang Li, Yash Sharma, Josh Tenenbaum 0001, Igor Mordatch. 15608-15620 [doi]

Nearly Horizon-Free Offline Reinforcement LearningTongzheng Ren, Jialian Li, Bo Dai, Simon S. Du, Sujay Sanghavi. 15621-15634 [doi]

Combinatorial Optimization for Panoptic Segmentation: A Fully Differentiable ApproachAhmed Abbas, Paul Swoboda. 15635-15649 [doi]

Reinforcement Learning with State Observation Costs in Action-Contingent Noiselessly Observable Markov Decision ProcessesHyunji Alex Nam, Scott L. Fleming, Emma Brunskill. 15650-15666 [doi]

Iterative Amortized Policy OptimizationJoseph Marino, Alexandre Piché, Alessandro Davide Ialongo, Yisong Yue. 15667-15681 [doi]

Revisiting the Calibration of Modern Neural NetworksMatthias Minderer, Josip Djolonga, Rob Romijnders, Frances Hubis, Xiaohua Zhai, Neil Houlsby, Dustin Tran, Mario Lucic. 15682-15694 [doi]

The decomposition of the higher-order homology embedding constructed from the $k$-LaplacianYu-Chia Chen, Marina Meila. 15695-15709 [doi]

Breaking the Moments Condition Barrier: No-Regret Algorithm for Bandits with Super Heavy-Tailed PayoffsHan Zhong, Jiayi Huang, Lin Yang 0011, Liwei Wang 0001. 15710-15720 [doi]

A nonparametric method for gradual change problems with statistical guaranteesLizhen Nie, Dan Nicolae. 15721-15733 [doi]

Nested Graph Neural NetworksMuhan Zhang, Pan Li 0005. 15734-15747 [doi]

Multimodal and Multilingual Embeddings for Large-Scale Speech MiningPaul-Ambroise Duquenne, Hongyu Gong, Holger Schwenk. 15748-15761 [doi]

Necessary and sufficient graphical conditions for optimal adjustment sets in causal graphical models with hidden variablesJakob Runge. 15762-15773 [doi]

On Blame Attribution for Accountable Multi-Agent Sequential Decision MakingStelios Triantafyllou, Adish Singla, Goran Radanovic. 15774-15786 [doi]

FLEX: Unifying Evaluation for Few-Shot NLPJonathan Bragg, Arman Cohan, Kyle Lo, Iz Beltagy. 15787-15800 [doi]

A flow-based latent state generative model of neural population responses to natural imagesMohammad Bashiri, Edgar Y. Walker, Konstantin-Klemens Lurz, Akshay Jagadish, Taliah Muhammad, Zhiwei Ding, Zhuokun Ding, Andreas S. Tolias, Fabian H. Sinz. 15801-15815 [doi]

Learnable Fourier Features for Multi-dimensional Spatial Positional EncodingYang Li 0058, Si Si, Gang Li, Cho-Jui Hsieh, Samy Bengio. 15816-15829 [doi]

Doubly Robust Thompson Sampling with Linear PayoffsWonyoung Kim, Gi-Soo Kim, Myunghee Cho Paik. 15830-15840 [doi]

A Computationally Efficient Method for Learning Exponential Family DistributionsAbhin Shah, Devavrat Shah, Gregory W. Wornell. 15841-15854 [doi]

Rethinking Neural Operations for Diverse TasksNicholas Roberts, Mikhail Khodak, Tri Dao, Liam Li, Christopher Ré, Ameet Talwalkar. 15855-15869 [doi]

Motif-based Graph Self-Supervised Learning for Molecular Property PredictionZaixi Zhang, Qi Liu 0003, Hao Wang 0076, Chengqiang Lu, Chee-Kong Lee. 15870-15882 [doi]

On Inductive Biases for Heterogeneous Treatment Effect EstimationAlicia Curth, Mihaela van der Schaar. 15883-15894 [doi]

DP-SSL: Towards Robust Semi-supervised Learning with A Few Labeled SamplesYi Xu 0003, Jiandong Ding, Lu Zhang, Shuigeng Zhou. 15895-15907 [doi]

Transformer in TransformerKai Han 0002, An Xiao, Enhua Wu, Jianyuan Guo, Chunjing Xu, Yunhe Wang 0001. 15908-15919 [doi]

Adversarial Graph Augmentation to Improve Graph Contrastive LearningSusheel Suresh, Pan Li, Cong Hao, Jennifer Neville. 15920-15933 [doi]

Online Control of Unknown Time-Varying Dynamical SystemsEdgar Minasyan, Paula Gradu, Max Simchowitz, Elad Hazan. 15934-15945 [doi]

Contrastive Reinforcement Learning of Symbolic Reasoning DomainsGabriel Poesia, Wenxin Dong, Noah D. Goodman. 15946-15956 [doi]

Spatial Ensemble: a Novel Model Smoothing Mechanism for Student-Teacher FrameworkTengteng Huang, Yifan Sun 0003, Xun Wang, Haotian Yao, Chi Zhang 0026. 15957-15968 [doi]

Probabilistic Tensor Decomposition of Neural Population Spiking ActivityHugo Soulat, Sepiedeh Keshavarzi, Troy W. Margrie, Maneesh Sahani. 15969-15980 [doi]

Recurrent Bayesian Classifier Chains for Exact Multi-Label ClassificationWalter Gerych, Thomas Hartvigsen, Luke Buquicchio, Emmanuel Agu, Elke A. Rundensteiner. 15981-15992 [doi]

Wasserstein Flow Meets Replicator Dynamics: A Mean-Field Analysis of Representation Learning in Actor-CriticYufeng Zhang 0007, Siyu Chen, Zhuoran Yang, Michael I. Jordan, Zhaoran Wang. 15993-16006 [doi]

Assessing Fairness in the Presence of Missing DataYiliang Zhang, Qi Long. 16007-16019 [doi]

Adversarial Attack Generation Empowered by Min-Max OptimizationJingkang Wang, Tianyun Zhang, Sijia Liu 0001, Pin-Yu Chen, Jiacen Xu, Makan Fardad, Bo Li 0026. 16020-16033 [doi]

Safe Pontryagin Differentiable ProgrammingWanxin Jin, Shaoshuai Mou, George J. Pappas. 16034-16050 [doi]

Class-Disentanglement and Applications in Adversarial Detection and DefenseKaiwen Yang, Tianyi Zhou, Yonggang Zhang, Xinmei Tian 0001, Dacheng Tao. 16051-16063 [doi]

Active 3D Shape Reconstruction from Vision and TouchEdward J. Smith, David Meger, Luis-Pineda, Roberto Calandra, Jitendra Malik, Adriana Romero-Soriano, Michal Drozdzal. 16064-16078 [doi]

CAPE: Encoding Relative Positions with Continuous Augmented Positional EmbeddingsTatiana Likhomanenko, Qiantong Xu, Gabriel Synnaeve, Ronan Collobert, Alex Rogozhnikov. 16079-16092 [doi]

Multi-armed Bandit Requiring Monotone Arm SequencesNingyuan Chen. 16093-16103 [doi]

Gradient Driven Rewards to Guarantee Fairness in Collaborative Machine LearningXinyi Xu, Lingjuan Lyu, Xingjun Ma, Chenglin Miao, Chuan-Sheng Foo, Bryan Kian Hsiang Low. 16104-16117 [doi]

Generalizable Imitation Learning from Observation via Inferring Goal ProximityYoungwoon Lee, Andrew Szot, Shao-Hua Sun, Joseph J. Lim. 16118-16130 [doi]

DualNet: Continual Learning, Fast and SlowQuang Pham, Chenghao Liu, Steven C. H. Hoi. 16131-16144 [doi]

Deformable Butterfly: A Highly Structured and Sparse Linear TransformRui Lin, Jie Ran, King Hung Chiu, Graziano Chesi, Ngai Wong. 16145-16157 [doi]

Why Do Pretrained Language Models Help in Downstream Tasks? An Analysis of Head and Prompt TuningColin Wei, Sang Michael Xie, Tengyu Ma 0001. 16158-16170 [doi]

Learning Diverse Policies in MOBA Games via Macro-GoalsYiming Gao 0007, Bei Shi, Xueying Du, Liang Wang 0015, Guangwei Chen, Zhenjie Lian, Fuhao Qiu, Guoan Han, Weixuan Wang, Deheng Ye, Qiang Fu, Wei Yang 0032, Lanxiao Huang. 16171-16182 [doi]

Evaluation of Human-AI Teams for Learned and Rule-Based Agents in HanabiHo Chit Siu, Jaime Daniel Peña, Edenna Chen, Yutai Zhou, Victor J. Lopez, Kyle Palko, Kimberlee C. Chang, Ross E. Allen. 16183-16195 [doi]

Counterfactual Invariance to Spurious Correlations in Text ClassificationVictor Veitch, Alexander D'Amour, Steve Yadlowsky, Jacob Eisenstein. 16196-16208 [doi]

Better Safe Than Sorry: Preventing Delusive Adversaries with Adversarial TrainingLue Tao, Lei Feng, Jinfeng Yi, Sheng-Jun Huang, Songcan Chen. 16209-16225 [doi]

Determinantal point processes based on orthogonal polynomials for sampling minibatches in SGDRémi Bardenet, Subhroshekhar Ghosh, Meixia Lin. 16226-16237 [doi]

Revisiting Contrastive Methods for Unsupervised Learning of Visual RepresentationsWouter Van Gansbeke, Simon Vandenhende, Stamatios Georgoulis, Luc Van Gool. 16238-16250 [doi]

Neural Analysis and Synthesis: Reconstructing Speech from Self-Supervised RepresentationsHyeong-Seok Choi, Juheon Lee, Wansoo Kim, Jie Lee, Hoon Heo, Kyogu Lee. 16251-16265 [doi]

Auto-Encoding Knowledge Graph for Unsupervised Medical Report GenerationFenglin Liu, Chenyu You, Xian Wu, Shen Ge, Sheng Wang, Xu Sun 0001. 16266-16279 [doi]

Diffusion Normalizing FlowQinsheng Zhang, Yongxin Chen. 16280-16291 [doi]

Introspective Distillation for Robust Question AnsweringYulei Niu, Hanwang Zhang. 16292-16304 [doi]

Rethinking the Pruning Criteria for Convolutional Neural NetworkZhongzhan Huang, Wenqi Shao, Xinjiang Wang, Liang Lin, Ping Luo 0002. 16305-16318 [doi]

Adaptive Machine UnlearningVarun Gupta, Christopher Jung 0001, Seth Neel, Aaron Roth 0001, Saeed Sharifi-Malvajerdi, Chris Waites. 16319-16330 [doi]

EditGAN: High-Precision Semantic Image EditingHuan Ling, Karsten Kreis, Daiqing Li, Seung Wook Kim, Antonio Torralba 0001, Sanja Fidler. 16331-16345 [doi]

Deep Molecular Representation Learning via Fusing Physical and Chemical InformationShuwen Yang, Ziyao Li, Guojie Song, Lingsheng Cai. 16346-16357 [doi]

Neural optimal feedback control with local learning rulesJohannes Friedrich, Siavash Golkar, Shiva Farashahi, Alexander Genkin, Anirvan M. Sengupta, Dmitri B. Chklovskii. 16358-16370 [doi]

Reinforcement Learning in Linear MDPs: Constant Regret and Representation SelectionMatteo Papini, Andrea Tirinzoni, Aldo Pacchiano, Marcello Restelli, Alessandro Lazaric, Matteo Pirotta. 16371-16383 [doi]

Noether Networks: meta-learning useful conserved quantitiesFerran Alet, Dylan Doblar, Allan Zhou, Josh Tenenbaum 0001, Kenji Kawaguchi, Chelsea Finn. 16384-16397 [doi]

Uncertainty-Driven Loss for Single Image Super-ResolutionQian Ning, Weisheng Dong, Xin Li 0005, Jinjian Wu, Guangming Shi. 16398-16409 [doi]

GradInit: Learning to Initialize Neural Networks for Stable and Efficient TrainingChen Zhu, Renkun Ni, Zheng Xu 0002, Kezhi Kong, W. Ronny Huang, Tom Goldstein. 16410-16422 [doi]

Capacity and Bias of Learned Geometric Embeddings for Directed GraphsMichael Boratko, Dongxu Zhang, Nicholas Monath, Luke Vilnis, Kenneth L. Clarkson, Andrew McCallum. 16423-16436 [doi]

Online Learning Of Neural Computations From Sparse Temporal FeedbackMikio Ludwig Braun, Tim P. Vogels. 16437-16450 [doi]

Self-Supervised Learning with Data Augmentations Provably Isolates Content from StyleJulius von Kügelgen, Yash Sharma, Luigi Gresele, Wieland Brendel, Bernhard Schölkopf, Michel Besserve, Francesco Locatello. 16451-16467 [doi]

Instance-Conditional Knowledge Distillation for Object DetectionZijian Kang, Peizhen Zhang, Xiangyu Zhang 0005, Jian Sun 0001, Nanning Zheng 0001. 16468-16480 [doi]

Self-Supervised Representation Learning on Neural Network Weights for Model Characteristic PredictionKonstantin Schürholt, Dimche Kostadinov, Damian Borth. 16481-16493 [doi]

Multimodal Virtual Point 3D DetectionTianwei Yin, Xingyi Zhou, Philipp Krähenbühl. 16494-16507 [doi]

On Joint Learning for Solving Placement and Routing in Chip DesignRuoyu Cheng, Junchi Yan. 16508-16519 [doi]

Learning with Algorithmic Supervision via Continuous RelaxationsFelix Petersen, Christian Borgelt, Hilde Kuehne, Oliver Deussen. 16520-16531 [doi]

Differentiable Multiple Shooting LayersStefano Massaroli, Michael Poli, Sho Sonoda, Taiji Suzuki, Jinkyoo Park, Atsushi Yamashita, Hajime Asama. 16532-16544 [doi]

Global-aware Beam Search for Neural Abstractive SummarizationYe Ma, Zixun Lan, Lu Zong, Kaizhu Huang. 16545-16557 [doi]

DROID-SLAM: Deep Visual SLAM for Monocular, Stereo, and RGB-D CamerasZachary Teed, Jia Deng 0001. 16558-16569 [doi]

Few-Shot Object Detection via Association and DIscriminationYuhang Cao, Jiaqi Wang, Ying Jin, Tong Wu, Kai Chen 0026, Ziwei Liu 0002, Dahua Lin. 16570-16581 [doi]

Neural Dubber: Dubbing for Videos According to ScriptsChenxu Hu, Qiao Tian, Tingle Li, Yuping Wang, Yuxuan Wang 0002, Hang Zhao. 16582-16595 [doi]

Neural BootstrapperMinsuk Shin, Hyungjoo Cho, Hyun-seok Min, Sungbin Lim. 16596-16609 [doi]

An Axiomatic Theory of Provably-Fair Welfare-Centric Machine LearningCyrus Cousins. 16610-16621 [doi]

HSVA: Hierarchical Semantic-Visual Adaptation for Zero-Shot LearningShiming Chen 0002, Guo-Sen Xie, Yang Liu, Qinmu Peng, Baigui Sun, Hao Li 0030, Xinge You, Ling Shao 0001. 16622-16634 [doi]

Higher Order Kernel Mean Embeddings to Capture Filtrations of Stochastic ProcessesCristopher Salvi, Maud Lemercier, Chong Liu, Blanka Horvath, Theodoros Damoulas, Terry J. Lyons. 16635-16647 [doi]

Low-Rank Subspaces in GANsJiapeng Zhu, Ruili Feng, Yujun Shen, Deli Zhao, Zheng-Jun Zha, Jingren Zhou, Qifeng Chen. 16648-16658 [doi]

Neural Symplectic Form: Learning Hamiltonian Equations on General Coordinate SystemsYuhan Chen, Takashi Matsubara 0001, Takaharu Yaguchi. 16659-16670 [doi]

Sample-Efficient Reinforcement Learning Is Feasible for Linearly Realizable MDPs with Limited RevisitingGen Li 0005, Yuxin Chen 0002, Yuejie Chi, Yuantao Gu, Yuting Wei. 16671-16685 [doi]

Self-Paced Contrastive Learning for Semi-supervised Medical Image Segmentation with Meta-labelsJizong Peng, Ping Wang 0016, Christian Desrosiers, Marco Pedersoli. 16686-16699 [doi]

Reverse engineering recurrent neural networks with Jacobian switching linear dynamical systemsJimmy T. H. Smith, Scott W. Linderman, David Sussillo. 16700-16713 [doi]

Learning-Augmented Dynamic Power Management with Multiple States via New Ski Rental BoundsAntonios Antoniadis, Christian Coester, Marek Eliás 0001, Adam Polak 0001, Bertrand Simon. 16714-16726 [doi]

Learning Equivariant Energy Based Models with Equivariant Stein Variational Gradient DescentPriyank Jaini, Lars Holdijk, Max Welling. 16727-16737 [doi]

Information Directed Sampling for Sparse Linear BanditsBotao Hao, Tor Lattimore, Wei Deng 0002. 16738-16750 [doi]

Linear Convergence of Gradient Methods for Estimating Structured Transition Matrices in High-dimensional Vector Autoregressive ModelsXiao Lv, Wei Cui 0001, Yulong Liu. 16751-16763 [doi]

Large-Scale Unsupervised Object DiscoveryHuy V. Vo, Elena Sizikova, Cordelia Schmid, Patrick Pérez, Jean Ponce. 16764-16778 [doi]

Sparse Steerable Convolutions: An Efficient Learning of SE(3)-Equivariant Features for Estimation and Tracking of Object Poses in 3D SpaceJiehong Lin, Hongyang Li, Ke Chen 0004, Jiangbo Lu, Kui Jia. 16779-16790 [doi]

Noisy Adaptation Generates Lévy Flights in Attractor Neural NetworksXingsi Dong, Tianhao Chu, Tiejun Huang 0001, Zilong Ji, Si Wu 0001. 16791-16804 [doi]

On Linear Stability of SGD and Input-Smoothness of Neural NetworksChao Ma 0012, Lexing Ying. 16805-16817 [doi]

Joint inference and input optimization in equilibrium networksSwaminathan Gurumurthy, Shaojie Bai, Zachary Manchester, J. Zico Kolter. 16818-16832 [doi]

A unified framework for bandit multiple testingZiyu Xu, Ruodu Wang, Aaditya Ramdas. 16833-16845 [doi]

Recovering Latent Causal Factor for Generalization to Distributional ShiftsXinwei Sun 0001, Botong Wu, Xiangyu Zheng, Chang Liu 0030, Wei Chen 0034, Tao Qin, Tie-Yan Liu. 16846-16859 [doi]

Graph Differentiable Architecture Search with Structure LearningYijian Qin, Xin Wang 0019, Zeyang Zhang, Wenwu Zhu 0001. 16860-16872 [doi]

Designing Counterfactual Generators using Deep Model InversionJayaraman J. Thiagarajan, Vivek Sivaraman Narayanaswamy, Deepta Rajan, Jia Liang, Akshay Chaudhari, Andreas Spanias. 16873-16884 [doi]

A Faster Maximum Cardinality Matching Algorithm with Applications in Machine LearningNathaniel Lahn, Sharath Raghvendra, Jiacheng Ye. 16885-16898 [doi]

Dynamic population-based meta-learning for multi-agent communication with natural languageAbhinav Gupta 0002, Marc Lanctot, Angeliki Lazaridou. 16899-16912 [doi]

Adversarial Neuron Pruning Purifies Backdoored Deep ModelsDongxian Wu, Yisen Wang 0001. 16913-16925 [doi]

Towards Robust and Reliable Algorithmic RecourseSohini Upadhyay, Shalmali Joshi, Himabindu Lakkaraju. 16926-16937 [doi]

Neural Rule-Execution Tracking Machine For Transformer-Based Text GenerationYufei Wang 0003, Can Xu, Huang Hu, Chongyang Tao, Stephen Wan 0001, Mark Dras, Mark Johnson 0001, Daxin Jiang. 16938-16950 [doi]

Scalable Online Planning via Reinforcement Learning Fine-TuningArnaud Fickinger, Hengyuan Hu, Brandon Amos, Stuart J. Russell, Noam Brown. 16951-16963 [doi]

Adversarial Regression with Doubly Non-negative Weighting MatricesTam Le, Truyen Nguyen, Makoto Yamada, Jose H. Blanchet, Viet Anh Nguyen. 16964-16976 [doi]

Learned Robust PCA: A Scalable Deep Unfolding Approach for High-Dimensional Outlier DetectionHanQin Cai, Jialin Liu 0003, Wotao Yin. 16977-16989 [doi]

Proxy-Normalizing Activations to Match Batch Normalization while Removing Batch DependenceAntoine Labatie, Dominic Masters, Zach Eaton-Rosen, Carlo Luschi. 16990-17006 [doi]

Dynamic Bottleneck for Robust Self-Supervised ExplorationChenjia Bai, Lingxiao Wang, Lei Han, Animesh Garg, Jianye Hao, Peng Liu 0008, Zhaoran Wang. 17007-17020 [doi]

ProTo: Program-Guided Transformer for Program-Guided TasksZelin Zhao, Karan Samel, Binghong Chen, Le Song. 17021-17036 [doi]

An Efficient Transfer Learning Framework for Multiagent Reinforcement LearningTianpei Yang, Weixun Wang, Hongyao Tang, Jianye Hao, Zhaopeng Meng, Hangyu Mao, Dong Li 0030, Wulong Liu, Yingfeng Chen, Yujing Hu, Changjie Fan, Chengwei Zhang 0001. 17037-17048 [doi]

Learning to Time-Decode in Spiking Neural Networks Through the Information BottleneckNicolas Skatchkovsky, Osvaldo Simeone, Hyeryung Jang. 17049-17059 [doi]

NEO: Non Equilibrium Sampling on the Orbits of a Deterministic TransformAchille Thin, Yazid Janati El Idrissi, Sylvain Le Corff, Charles Ollion, Eric Moulines, Arnaud Doucet, Alain Durmus, Christian X. Robert. 17060-17071 [doi]

Relaxing Local RobustnessKlas Leino, Matt Fredrikson. 17072-17083 [doi]

Tuning Large Neural Networks via Zero-Shot Hyperparameter TransferGe Yang, Edward J. Hu, Igor Babuschkin, Szymon Sidor, Xiaodong Liu, David Farhi, Nick Ryder, Jakub Pachocki, Weizhu Chen, Jianfeng Gao. 17084-17097 [doi]

Statistical Regeneration Guarantees of the Wasserstein Autoencoder with Latent Space ConsistencyAnish Chakrabarty, Swagatam Das. 17098-17110 [doi]

Leveraging the Inductive Bias of Large Language Models for Abstract Textual ReasoningChristopher Michael Rytting, David Wingate. 17111-17122 [doi]

Differentiable Simulation of Soft Multi-body SystemsYi-Ling Qiao, Junbang Liang, Vladlen Koltun, Ming C. Lin. 17123-17135 [doi]

Good Classification Measures and How to Find ThemMartijn Gösgens, Anton Zhiyanov, Aleksey Tikhonov, Liudmila Prokhorenkova. 17136-17147 [doi]

Distilling Robust and Non-Robust Features in Adversarial Examples by Information BottleneckJunho Kim, Byung kwan Lee, Yong Man Ro. 17148-17159 [doi]

Vector-valued Gaussian Processes on Riemannian Manifolds via Gauge Independent Projected KernelsMichael Hutchinson, Alexander Terenin, Viacheslav Borovitskiy, So Takao, Yee Whye Teh, Marc Peter Deisenroth. 17160-17169 [doi]

On the Representation Power of Set Pooling NetworksChristian Bueno, Alan Hylton. 17170-17182 [doi]

Learning Policies with Zero or Bounded Constraint Violation for Constrained MDPsTao Liu 0035, Ruida Zhou, Dileep Kalathil 0001, Panganamala R. Kumar, Chao Tian 0002. 17183-17193 [doi]

A Prototype-Oriented Framework for Unsupervised Domain AdaptationKorawat Tanwisuth, Xinjie Fan, Huangjie Zheng, Shujian Zhang, Hao Zhang 0050, Bo Chen 0001, Mingyuan Zhou. 17194-17208 [doi]

Mining the Benefits of Two-stage and One-stage HOI DetectionAixi Zhang, Yue Liao, Si Liu 0001, Miao Lu, Yongliang Wang, Chen Gao, Xiaobo Li. 17209-17220 [doi]

Discerning Decision-Making Process of Deep Neural Networks with Hierarchical Voting TransformationYing Sun, Hengshu Zhu, Chuan Qin 0002, Fuzhen Zhuang, Qing He 0003, Hui Xiong 0001. 17221-17234 [doi]

Risk-averse Heteroscedastic Bayesian OptimizationAnastasia Makarova, Ilnura Usmanova, Ilija Bogunovic, Andreas Krause 0001. 17235-17245 [doi]

Invertible DenseNets with Concatenated LipSwishYura Perugachi-Diaz, Jakub M. Tomczak, Sandjai Bhulai. 17246-17257 [doi]

Topological Detection of Trojaned Neural NetworksSongzhu Zheng, Yikai Zhang, Hubert Wagner, Mayank Goswami 0001, Chao Chen 0012. 17258-17272 [doi]

Provably Strict Generalisation Benefit for Invariance in Kernel MethodsBryn Elesedy. 17273-17283 [doi]

Formalizing the Generalization-Forgetting Trade-off in Continual LearningKrishnan Raghavan, Prasanna Balaprakash. 17284-17297 [doi]

Risk-Aware Transfer in Reinforcement Learning using Successor FeaturesMichael Gimelfarb, André Barreto 0001, Scott Sanner, Chi-Guhn Lee. 17298-17310 [doi]

Causal Inference for Event Pairs in Multivariate Point ProcessesTian Gao, Dharmashankar Subramanian, Debarun Bhattacharjya, Xiao Shou, Nicholas Mattei, Kristin P. Bennett. 17311-17324 [doi]

Evaluating model performance under worst-case subpopulationsMike Li, Hongseok Namkoong, Shangzhou Xia. 17325-17334 [doi]

Privately Publishable Per-instance PrivacyRachel Redberg, Yu-Xiang Wang 0003. 17335-17346 [doi]

Understanding the Limits of Unsupervised Domain Adaptation via Data PoisoningAkshay Mehra, Bhavya Kailkhura, Pin-Yu Chen, Jihun Hamm. 17347-17359 [doi]

Coresets for Clustering with Missing ValuesVladimir Braverman, Shaofeng H.-C. Jiang, Robert Krauthgamer, Xuan Wu 0002. 17360-17372 [doi]

Boosting with Multiple SourcesCorinna Cortes, Mehryar Mohri, Dmitry Storcheus, Ananda Theertha Suresh. 17373-17387 [doi]

Dynamic Neural Representational Decoders for High-Resolution Semantic SegmentationBowen Zhang 0007, Yifan Liu 0001, Zhi Tian, Chunhua Shen. 17388-17399 [doi]

Dense Keypoints via Multiview SupervisionZhixuan Yu, Haozheng Yu, Long Sha, Sujoy Ganguly, Hyun Soo Park. 17400-17412 [doi]

Scatterbrain: Unifying Sparse and Low-rank AttentionBeidi Chen, Tri Dao, Eric Winsor, Zhao Song 0002, Atri Rudra, Christopher Ré. 17413-17426 [doi]

PTR: A Benchmark for Part-based Conceptual, Relational, and Physical ReasoningYining Hong, Li Yi, Josh Tenenbaum 0001, Antonio Torralba 0001, Chuang Gan. 17427-17440 [doi]

Property-Aware Relation Networks for Few-Shot Molecular Property PredictionYaqing Wang, Abulikemu Abuduweili, Quanming Yao, Dejing Dou. 17441-17454 [doi]

Differentially Private Learning with Adaptive ClippingGalen Andrew, Om Thakkar 0001, Brendan McMahan, Swaroop Ramaswamy. 17455-17466 [doi]

Can Less be More? When Increasing-to-Balancing Label Noise Rates Considered BeneficialYang Liu 0018, Jialu Wang. 17467-17479 [doi]

Projected GANs Converge FasterAxel Sauer, Kashyap Chitta, Jens Müller, Andreas Geiger 0001. 17480-17492 [doi]

Generating High-Quality Explanations for Navigation in Partially-Revealed EnvironmentsGregory J. Stein. 17493-17506 [doi]

De-randomizing MCMC dynamics with the diffusion Stein operatorZheyang Shen, Markus Heinonen, Samuel Kaski. 17507-17517 [doi]

Sparsely Changing Latent States for Prediction and Planning in Partially Observable DomainsChristian Gumbsch, Martin V. Butz, Georg Martius. 17518-17531 [doi]

PreferenceNet: Encoding Human Preferences in Auction Design with Deep LearningNeehar Peri, Michael J. Curry, Samuel Dooley, John Dickerson 0001. 17532-17542 [doi]

Large-Scale Learning with Fourier Features and Tensor DecompositionsFrederiek Wesel, Kim Batselier. 17543-17554 [doi]

Hash Layers For Large Sparse ModelsStephen Roller, Sainbayar Sukhbaatar, Arthur Szlam, Jason Weston. 17555-17566 [doi]

Sliced Mutual Information: A Scalable Measure of Statistical DependenceZiv Goldfeld, Kristjan H. Greenewald. 17567-17578 [doi]

Emergent Communication under Varying Sizes and ConnectivitiesJooyeon Kim, Alice Oh. 17579-17591 [doi]

Deep Bandits Show-Off: Simple and Efficient Exploration with Deep NetworksRong Zhu, Mattia Rigotti. 17592-17603 [doi]

Regret Minimization Experience Replay in Off-Policy Reinforcement LearningXu-Hui Liu, Zhenghai Xue, Jing-Cheng Pang, Shengyi Jiang, Feng Xu, Yang Yu 0001. 17604-17615 [doi]

Relative Uncertainty Learning for Facial Expression RecognitionYuhang Zhang, Chengrui Wang, Weihong Deng. 17616-17627 [doi]

An Information-theoretic Approach to Distribution ShiftsMarco Federici, Ryota Tomioka, Patrick Forré. 17628-17641 [doi]

TRS: Transferability Reduced Ensemble via Promoting Gradient Diversity and Model SmoothnessZhuolin Yang, Linyi Li, Xiaojun Xu, Shiliang Zuo, Qian Chen 0003, Pan Zhou, Benjamin I. P. Rubinstein, Ce Zhang 0001, Bo Li 0026. 17642-17655 [doi]

Towards Sample-Optimal Compressive Phase Retrieval with Sparse and Generative PriorsZhaoqiang Liu, Subhroshekhar Ghosh, Jonathan Scarlett. 17656-17668 [doi]

Moser Flow: Divergence-based Generative Modeling on ManifoldsNoam Rozen, Aditya Grover, Maximilian Nickel, Yaron Lipman. 17669-17680 [doi]

Structure-Aware Random Fourier Kernel for GraphsJinyuan Fang, Qiang Zhang 0026, Zaiqiao Meng, Shangsong Liang. 17681-17694 [doi]

Diffusion Schrödinger Bridge with Applications to Score-Based Generative ModelingValentin De Bortoli, James Thornton, Jeremy Heng, Arnaud Doucet. 17695-17709 [doi]

Improving Transferability of Representations via Augmentation-Aware Self-SupervisionHankook Lee, Kibok Lee, Kimin Lee, Honglak Lee, Jinwoo Shin. 17710-17722 [doi]

Long-Short Transformer: Efficient Transformers for Language and VisionChen Zhu, Wei Ping, Chaowei Xiao, Mohammad Shoeybi, Tom Goldstein, Anima Anandkumar, Bryan Catanzaro. 17723-17736 [doi]

Post-Training Sparsity-Aware QuantizationGil Shomron, Freddy Gabbay, Samer Kurzum, Uri C. Weiser. 17737-17748 [doi]

The Implicit Bias of Minima Stability: A View from Function SpaceRotem Mulayoff, Tomer Michaeli, Daniel Soudry. 17749-17761 [doi]

Breaking the Sample Complexity Barrier to Regret-Optimal Model-Free Reinforcement LearningGen Li 0005, Laixi Shi, Yuxin Chen 0002, Yuantao Gu, Yuejie Chi. 17762-17776 [doi]

Robust Auction Design in the Auto-bidding WorldSantiago R. Balseiro, Yuan Deng, Jieming Mao, Vahab S. Mirrokni, Song Zuo. 17777-17788 [doi]

Weighted model estimation for offline model-based reinforcement learningToru Hishinuma, Kei Senda. 17789-17800 [doi]

Practical, Provably-Correct Interactive Learning in the Realizable Setting: The Power of True BelieversJulian Katz-Samuels, Blake Mason, Kevin G. Jamieson, Robert Nowak 0001. 17801-17812 [doi]

Deconditional Downscaling with Gaussian ProcessesSiu Lun Chau, Shahine Bouabid, Dino Sejdinovic. 17813-17825 [doi]

Image Generation using Continuous Filter AtomsZe Wang, Seunghyun Hwang, Zichen Miao, Qiang Qiu. 17826-17838 [doi]

Latent Equilibrium: Arbitrarily fast computation with arbitrarily slow neuronsPaul Haider, Benjamin Ellenberger, Laura Kriener, Jakob Jordan, Walter Senn, Mihai A. Petrovici. 17839-17851 [doi]

Learning Fast-Inference Bayesian NetworksVaidyanathan Peruvemba Ramaswamy, Stefan Szeider. 17852-17863 [doi]

Per-Pixel Classification is Not All You Need for Semantic SegmentationBowen Cheng, Alexander G. Schwing, Alexander Kirillov. 17864-17875 [doi]

Deep Markov Factor Analysis: Towards Concurrent Temporal and Spatial Analysis of fMRI DataAmirreza Farnoosh, Sarah Ostadabbas. 17876-17888 [doi]

BooVAE: Boosting Approach for Continual Learning of VAEEvgenii Egorov, Anna Kuzina, Evgeny Burnaev. 17889-17901 [doi]

Handling Long-tailed Feature Distribution in AdderNetsMinjing Dong, Yunhe Wang 0001, Xinghao Chen 0001, Chang Xu 0002. 17902-17912 [doi]

Pessimism Meets Invariance: Provably Efficient Offline Mean-Field Multi-Agent RLMinshuo Chen, Yan Li 0074, Ethan Wang, Zhuoran Yang, Zhaoran Wang, Tuo Zhao. 17913-17926 [doi]

A Law of Iterated Logarithm for Multi-Agent Reinforcement LearningGugan Thoppe, Bhumesh Kumar. 17927-17938 [doi]

MOMA: Multi-Object Multi-Actor Activity ParsingZelun Luo, Wanze Xie, Siddharth Kapoor, Yiyun Liang, Michael Cooper, Juan Carlos Niebles, Ehsan Adeli 0001, Fei-Fei Li 0001. 17939-17955 [doi]

The Pareto Frontier of model selection for general Contextual BanditsTeodor Vanislavov Marinov, Julian Zimmert. 17956-17967 [doi]

Teaching an Active Learner with Contrastive ExamplesChaoqi Wang, Adish Singla, Yuxin Chen 0001. 17968-17980 [doi]

Structured Denoising Diffusion Models in Discrete State-SpacesJacob Austin, Daniel D. Johnson 0001, Jonathan Ho, Daniel Tarlow, Rianne van den Berg. 17981-17993 [doi]

Emergent Communication of GeneralizationsJesse Mu, Noah D. Goodman. 17994-18007 [doi]

Distributed Machine Learning with Sparse Heterogeneous DataDominic Richards, Sahand Negahban, Patrick Rebeschini. 18008-18020 [doi]

Manipulating SGD with Data Ordering AttacksIlia Shumailov, Zakhar Shumaylov, Dmitry Kazhdan, Yiren Zhao, Nicolas Papernot, Murat A. Erdogdu, Ross J. Anderson. 18021-18032 [doi]

Graph Posterior Network: Bayesian Predictive Uncertainty for Node ClassificationMaximilian Stadler, Bertrand Charpentier, Simon Geisler, Daniel Zügner, Stephan Günnemann. 18033-18048 [doi]

Locality Sensitive TeachingZhaozhuo Xu, Beidi Chen, Chaojian Li, Weiyang Liu, Le Song, Yingyan Lin, Anshumali Shrivastava. 18049-18062 [doi]

No-Press Diplomacy from ScratchAnton Bakhtin, David J. Wu, Adam Lerer, Noam Brown. 18063-18074 [doi]

Remember What You Want to Forget: Algorithms for Machine UnlearningAyush Sekhari, Jayadev Acharya, Gautam Kamath 0001, Ananda Theertha Suresh. 18075-18086 [doi]

Learning latent causal graphs via mixture oraclesBohdan Kivva, Goutham Rajendran, Pradeep Ravikumar, Bryon Aragam. 18087-18101 [doi]

ErrorCompensatedX: error compensation for variance reduced algorithmsHanlin Tang, Yao Li, Ji Liu 0002, Ming Yan 0006. 18102-18113 [doi]

Deep Contextual Video CompressionJiahao Li, Bin Li 0012, Yan Lu. 18114-18125 [doi]

On the Frequency Bias of Generative ModelsKatja Schwarz, Yiyi Liao, Andreas Geiger 0001. 18126-18136 [doi]

Learning curves of generic features maps for realistic datasets with a teacher-student modelBruno Loureiro, Cédric Gerbelot, Hugo Cui, Sebastian Goldt, Florent Krzakala, Marc Mézard, Lenka Zdeborová. 18137-18151 [doi]

It Has Potential: Gradient-Driven Denoisers for Convergent Solutions to Inverse ProblemsRegev Cohen, Yochai Blau, Daniel Freedman, Ehud Rivlin. 18152-18164 [doi]

Training Over-parameterized Models with Non-decomposable ObjectivesHarikrishna Narasimhan, Aditya Krishna Menon. 18165-18181 [doi]

Reinforcement learning for optimization of variational quantum circuit architecturesMateusz Ostaszewski, Lea M. Trenkwalder, Wojciech Masarczyk, Eleanor Scerri, Vedran Dunjko. 18182-18194 [doi]

Moshpit SGD: Communication-Efficient Decentralized Training on Heterogeneous Unreliable DevicesMax Ryabinin, Eduard Gorbunov, Vsevolod Plokhotnyuk, Gennady Pekhimenko. 18195-18211 [doi]

IRM - when it works and when it doesn't: A test case of natural language inferenceYana Dranker, He He 0001, Yonatan Belinkov. 18212-18224 [doi]

Self-Supervised Learning Disentangled Group Representation as FeatureTan Wang, Zhongqi Yue, Jianqiang Huang, Qianru Sun, Hanwang Zhang. 18225-18240 [doi]

SalKG: Learning From Knowledge Graph Explanations for Commonsense ReasoningAaron Chan, Jiashu Xu, Boyuan Long, Soumya Sanyal, Tanishq Gupta, Xiang Ren 0001. 18241-18255 [doi]

Supervising the Transfer of Reasoning Patterns in VQACorentin Kervadec, Christian Wolf 0001, Grigory Antipov, Moez Baccouche, Madiha Nadri. 18256-18267 [doi]

Conformal Bayesian ComputationEdwin Fong, Chris C. Holmes. 18268-18279 [doi]

A Unified Approach to Fair Online Learning via Blackwell ApproachabilityEvgenii Chzhen, Christophe Giraud 0002, Gilles Stoltz. 18280-18292 [doi]

Training Neural Networks is ER-completeMikkel Abrahamsen, Linda Kleist, Tillmann Miltzow. 18293-18306 [doi]

Understanding the Under-Coverage Bias in Uncertainty EstimationYu Bai, Song Mei, Huan Wang, Caiming Xiong. 18307-18319 [doi]

Decentralized Q-learning in Zero-sum Markov GamesMuhammed O. Sayin, Kaiqing Zhang, David S. Leslie, Tamer Basar, Asuman E. Ozdaglar. 18320-18334 [doi]

Fast Certified Robust Training with Short WarmupZhouxing Shi, Yihan Wang, Huan Zhang 0001, Jinfeng Yi, Cho-Jui Hsieh. 18335-18349 [doi]

Vector-valued Distance and Gyrocalculus on the Space of Symmetric Positive Definite MatricesFederico López, Beatrice Pozzetti, Steve Trettel, Michael Strube 0001, Anna Wienhard. 18350-18366 [doi]

Improved Transformer for High-Resolution GANsLong Zhao 0003, Zizhao Zhang, Ting Chen, Dimitris N. Metaxas, Han Zhang 0010. 18367-18380 [doi]

Learning High-Precision Bounding Box for Rotated Object Detection via Kullback-Leibler DivergenceXue Yang 0005, Xiaojiang Yang, Jirui Yang, Qi Ming, Wentao Wang, Qi Tian 0001, Junchi Yan. 18381-18394 [doi]

On Locality of Local Explanation ModelsSahra Ghalebikesabi, Lucile Ter-Minassian, Karla DiazOrdaz, Chris C. Holmes. 18395-18407 [doi]

FlexMatch: Boosting Semi-Supervised Learning with Curriculum Pseudo LabelingBowen Zhang, Yidong Wang, Wenxin Hou, Hao Wu, Jindong Wang 0001, Manabu Okumura, Takahiro Shinozaki. 18408-18419 [doi]

Relative Flatness and GeneralizationHenning Petzka, Michael Kamp, Linara Adilova, Cristian Sminchisescu, Mario Boley. 18420-18432 [doi]

The Image Local Autoregressive TransformerChenjie Cao, Yuxin Hong, Xiang Li, Chengrong Wang, Chengming Xu 0001, Yanwei Fu, Xiangyang Xue. 18433-18445 [doi]

Towards Multi-Grained Explainability for Graph Neural NetworksXiang Wang 0010, Ying Xin Wu, An Zhang, Xiangnan He 0001, Tat-Seng Chua. 18446-18458 [doi]

Behavior From the Void: Unsupervised Active Pre-TrainingHao Liu, Pieter Abbeel. 18459-18473 [doi]

Autonomous Reinforcement Learning via Subgoal CurriculaArchit Sharma, Abhishek Gupta 0004, Sergey Levine, Karol Hausman, Chelsea Finn. 18474-18486 [doi]

Statistically and Computationally Efficient Linear Meta-representation LearningKiran Koshy Thekumparampil, Prateek Jain 0002, Praneeth Netrapalli, Sewoong Oh. 18487-18500 [doi]

Decentralized Learning in Online Queuing SystemsFlore Sentenac, Etienne Boursier, Vianney Perchet. 18501-18512 [doi]

Explainable Semantic Space by Grounding Language to Vision with Cross-Modal Contrastive LearningYizhen Zhang, Minkyu Choi, Kuan Han, Zhongming Liu. 18513-18526 [doi]

BulletTrain: Accelerating Robust Neural Network Training via Boundary Example MiningWeizhe Hua, Yichi Zhang, Chuan Guo, Zhiru Zhang, G. Edward Suh. 18527-18538 [doi]

Neural Distance Embeddings for Biological SequencesGabriele Corso, Zhitao Ying, Michal Pándy, Petar Velickovic, Jure Leskovec, Pietro Liò. 18539-18551 [doi]

Fitting summary statistics of neural data with a differentiable spiking network simulatorGuillaume Bellec, Shuqi Wang, Alireza Modirshanechi, Johanni Brea, Wulfram Gerstner. 18552-18563 [doi]

PerSim: Data-Efficient Offline Reinforcement Learning with Heterogeneous Agents via Personalized SimulatorsAnish Agarwal, Abdullah Alomar, Varkey Alumootil, Devavrat Shah, Dennis Shen, Zhi Xu, Cindy Yang. 18564-18576 [doi]

Online Sign Identification: Minimization of the Number of Errors in Thresholding BanditsReda Ouhamma, Odalric-Ambrym Maillard, Vianney Perchet. 18577-18589 [doi]

All Tokens Matter: Token Labeling for Training Better Vision TransformersZihang Jiang, Qibin Hou, Li Yuan 0007, Daquan Zhou, Yujun Shi, Xiaojie Jin, Anran Wang, Jiashi Feng. 18590-18602 [doi]

Partition and Code: learning how to compress graphsGiorgos Bouritsas, Andreas Loukas, Nikolaos Karalias, Michael M. Bronstein. 18603-18619 [doi]

Knowledge-inspired 3D Scene Graph Prediction in Point CloudShoulong Zhang, Shuai Li 0001, Aimin Hao, Hong Qin. 18620-18632 [doi]

Online Variational Filtering and Parameter LearningAndrew Campbell, Yuyang Shi, Thomas Rainforth, Arnaud Doucet. 18633-18645 [doi]

Heavy Ball Neural Ordinary Differential EquationsHedi Xia, Vai Suliafu, Hangjie Ji, Tan M. Nguyen, Andrea L. Bertozzi, Stanley J. Osher, Bao Wang. 18646-18659 [doi]

Structure learning in polynomial time: Greedy algorithms, Bregman information, and exponential familiesGoutham Rajendran, Bohdan Kivva, Ming Gao, Bryon Aragam. 18660-18672 [doi]

On the Sample Complexity of Learning under Geometric StabilityAlberto Bietti, Luca Venturi, Joan Bruna. 18673-18684 [doi]

SIMILAR: Submodular Information Measures Based Active Learning In Realistic ScenariosSuraj Kothawade, Nathan Beck, KrishnaTeja Killamsetty, Rishabh K. Iyer. 18685-18697 [doi]

Monte Carlo Tree Search With Iteratively Refining State AbstractionsSamuel Sokota, Caleb Ho, Zaheen Farraz Ahmad, J. Zico Kolter. 18698-18709 [doi]

Flattening Sharpness for Dynamic Gradient Projection Memory Benefits Continual LearningDanruo Deng, Guangyong Chen, Jianye Hao, Qiong Wang 0001, Pheng-Ann Heng. 18710-18721 [doi]

Taxonomizing local versus global structure in neural network loss landscapesYaoqing Yang, Liam Hodgkinson, Ryan Theisen, Joe Zou, Joseph E. Gonzalez, Kannan Ramchandran, Michael W. Mahoney. 18722-18733 [doi]

Learning Models for Actionable RecourseAlexis Ross, Himabindu Lakkaraju, Osbert Bastani. 18734-18746 [doi]

Efficient and Accurate Gradients for Neural SDEsPatrick Kidger, James Foster, Xuechen Li, Terry J. Lyons. 18747-18761 [doi]

EIGNN: Efficient Infinite-Depth Graph Neural NetworksJuncheng Liu, Kenji Kawaguchi, Bryan Hooi, Yiwei Wang 0001, Xiaokui Xiao. 18762-18773 [doi]

Fractal Structure and Generalization Properties of Stochastic Optimization AlgorithmsAlexander Camuto, George Deligiannidis, Murat A. Erdogdu, Mert Gürbüzbalaban, Umut Simsekli, Lingjiong Zhu. 18774-18788 [doi]

An Infinite-Feature Extension for Bayesian ReLU Nets That Fixes Their Asymptotic OverconfidenceAgustinus Kristiadi, Matthias Hein 0001, Philipp Hennig. 18789-18800 [doi]

Bandit Phase RetrievalTor Lattimore, Botao Hao. 18801-18811 [doi]

Lower Bounds on Metropolized Sampling Methods for Well-Conditioned DistributionsYin Tat Lee, Ruoqi Shen, Kevin Tian. 18812-18824 [doi]

Taming Communication and Sample Complexities in Decentralized Policy Evaluation for Cooperative Multi-Agent Reinforcement LearningXin Zhang 0054, Zhuqing Liu, Jia Liu 0002, Zhengyuan Zhu, Songtao Lu. 18825-18838 [doi]

Federated Graph Classification over Non-IID GraphsHan Xie, Jing Ma, Li Xiong 0001, Carl Yang. 18839-18852 [doi]

SubTab: Subsetting Features of Tabular Data for Self-Supervised Representation LearningTalip Ucar, Ehsan Hajiramezanali, Lindsay Edwards. 18853-18865 [doi]

Convergence Rates of Stochastic Gradient Descent under Infinite Noise VarianceHongjian Wang, Mert Gürbüzbalaban, Lingjiong Zhu, Umut Simsekli, Murat A. Erdogdu. 18866-18877 [doi]

Conflict-Averse Gradient Descent for Multi-task learningBo Liu, Xingchao Liu, Xiaojie Jin, Peter Stone, Qiang Liu 0001. 18878-18890 [doi]

Amortized Synthesis of Constrained Configurations Using a Differentiable SurrogateXingyuan Sun, Tianju Xue, Szymon Rusinkiewicz, Ryan P. Adams. 18891-18906 [doi]

Efficient First-Order Contextual Bandits: Prediction, Allocation, and Triangular DiscriminationDylan J. Foster, Akshay Krishnamurthy. 18907-18919 [doi]

Distributed Estimation with Multiple Samples per User: Sharp Rates and Phase TransitionJayadev Acharya, Clément L. Canonne, Yuhan Liu, Ziteng Sun, Himanshu Tyagi. 18920-18931 [doi]

Revisiting Deep Learning Models for Tabular DataYury Gorishniy, Ivan Rubachev, Valentin Khrulkov, Artem Babenko. 18932-18943 [doi]

Backdoor Attack with Imperceptible Input and Latent ModificationKhoa Doan, Yingjie Lao, Ping Li 0001. 18944-18957 [doi]

SOPE: Spectrum of Off-Policy EstimatorsChristina J. Yuan, Yash Chandak, Stephen Giguere 0001, Philip S. Thomas, Scott Niekum. 18958-18969 [doi]

Label-Imbalanced and Group-Sensitive Classification under OverparameterizationGanesh Ramachandra Kini, Orestis Paraskevas, Samet Oymak, Christos Thrampoulidis. 18970-18983 [doi]

Neural Program Generation Modulo Static AnalysisRohan Mukherjee 0001, Yeming Wen, Dipak Chaudhari, Thomas W. Reps, Swarat Chaudhuri, Christopher M. Jermaine. 18984-18996 [doi]

Unfolding Taylor's Approximations for Image RestorationMan Zhou, Xueyang Fu, Zeyu Xiao, Gang Yang, Aiping Liu, Zhiwei Xiong. 18997-19009 [doi]

Metropolis-Hastings Data Augmentation for Graph Neural NetworksHyeon-Jin Park, Seunghun Lee, Sihyeon Kim, Jinyoung Park, Jisu Jeong, Kyung Min Kim, Jung-Woo Ha 0001, Hyunwoo J. Kim. 19010-19020 [doi]

Strategic Behavior is Bliss: Iterative Voting Improves Social WelfareJoshua Kavner, Lirong Xia. 19021-19032 [doi]

Agnostic Reinforcement Learning with Low-Rank MDPs and Rich ObservationsAyush Sekhari, Christoph Dann, Mehryar Mohri, Yishay Mansour, Karthik Sridharan. 19033-19045 [doi]

Functional Regularization for Reinforcement Learning via Learned Fourier FeaturesAlexander C. Li, Deepak Pathak. 19046-19055 [doi]

Adaptive First-Order Methods Revisited: Convex Minimization without Lipschitz RequirementsKimon Antonakopoulos, Panayotis Mertikopoulos. 19056-19068 [doi]

Adapting to function difficulty and growth conditions in private optimizationHilal Asi, Daniel Levy, John C. Duchi. 19069-19081 [doi]

Support Recovery of Sparse Signals from a Mixture of Linear MeasurementsSoumyabrata Pal, Arya Mazumdar, Venkata Gandikota. 19082-19094 [doi]

Stochastic Gradient Descent-Ascent and Consensus Optimization for Smooth Games: Convergence Analysis under Expected Co-coercivityNicolas Loizou, Hugo Berard, Gauthier Gidel, Ioannis Mitliagkas, Simon Lacoste-Julien. 19095-19108 [doi]

Tighter Expected Generalization Error Bounds via Wasserstein DistanceBorja Rodríguez Gálvez, Germán Bassi, Ragnar Thobaben, Mikael Skoglund. 19109-19121 [doi]

Unifying Width-Reduced Methods for Quasi-Self-Concordant OptimizationDeeksha Adil, Brian Bullins, Sushant Sachdeva. 19122-19133 [doi]

Bridging the Imitation Gap by Adaptive InsubordinationLuca Weihs, Unnat Jain, Iou-Jen Liu, Jordi Salvador, Svetlana Lazebnik, Aniruddha Kembhavi, Alexander G. Schwing. 19134-19146 [doi]

Adversarial Robustness with Non-uniform PerturbationsEcenaz Erdemir, Jeffrey Bickford, Luca Melis, Sergül Aydöre. 19147-19159 [doi]

Container: Context Aggregation NetworksPeng Gao, Jiasen Lu, Hongsheng Li, Roozbeh Mottaghi, Aniruddha Kembhavi. 19160-19171 [doi]

ConE: Cone Embeddings for Multi-Hop Reasoning over Knowledge GraphsZhanqiu Zhang, Jie Wang 0005, Jiajun Chen, Shuiwang Ji, Feng Wu. 19172-19183 [doi]

Federated Hyperparameter Tuning: Challenges, Baselines, and Connections to Weight-SharingMikhail Khodak, Renbo Tu, Tian Li 0005, Liam Li, Maria-Florina Balcan, Virginia Smith, Ameet Talwalkar. 19184-19197 [doi]

Training for the Future: A Simple Gradient Interpolation Loss to Generalize Along TimeAnshul Nasery, Soumyadeep Thakur, Vihari Piratla, Abir De, Sunita Sarawagi. 19198-19209 [doi]

Agent Modelling under Partial Observability for Deep Reinforcement LearningGeorgios Papoudakis, Filippos Christianos, Stefano V. Albrecht. 19210-19222 [doi]

Leveraging Distribution Alignment via Stein Path for Cross-Domain Cold-Start RecommendationWeiming Liu, Jiajie Su, Chaochao Chen 0001, Xiaolin Zheng. 19223-19234 [doi]

Conservative Offline Distributional Reinforcement LearningYecheng Jason Ma, Dinesh Jayaraman, Osbert Bastani. 19235-19247 [doi]

Separation Results between Fixed-Kernel and Feature-Learning Probability MetricsCarles Domingo-Enrich, Youssef Mroueh. 19248-19260 [doi]

Risk Minimization from Adaptively Collected Data: Guarantees for Supervised and Policy LearningAurélien Bibaut, Nathan Kallus, Maria Dimakopoulou, Antoine Chambaz, Mark J. van der Laan. 19261-19273 [doi]

Bayesian Optimization with High-Dimensional OutputsWesley J. Maddox, Maximilian Balandat, Andrew Gordon Wilson, Eytan Bakshy. 19274-19287 [doi]

Finding Optimal Tangent Points for Reducing Distortions of Hard-label AttacksChen Ma 0003, Xiangyu Guo, Li Chen, Jun-Hai Yong, Yisen Wang 0001. 19288-19300 [doi]

Scalable Diverse Model Selection for Accessible Transfer LearningDaniel Bolya, Rohit Mittapalli, Judy Hoffman. 19301-19312 [doi]

Light Field Networks: Neural Scene Representations with Single-Evaluation RenderingVincent Sitzmann, Semon Rezchikov, Bill Freeman, Josh Tenenbaum 0001, Frédo Durand. 19313-19325 [doi]

ViSER: Video-Specific Surface Embeddings for Articulated 3D Shape ReconstructionGengshan Yang, Deqing Sun, Varun Jampani, Daniel Vlasic, Forrester Cole, Ce Liu, Deva Ramanan. 19326-19338 [doi]

Understanding the Effect of Stochasticity in Policy OptimizationJincheng Mei, Bo Dai, Chenjun Xiao, Csaba Szepesvári, Dale Schuurmans. 19339-19351 [doi]

Fine-Grained Zero-Shot Learning with DNA as Side InformationSarkhan Badirli, Zeynep Akata, George O. Mohler, Christine Picard, Murat Dundar. 19352-19362 [doi]

Optimal Underdamped Langevin MCMC MethodZhengmian Hu, Feihu Huang, Heng Huang. 19363-19374 [doi]

Scheduling jobs with stochastic holding costsDabeen Lee, Milan Vojnovic. 19375-19384 [doi]

REMIPS: Physically Consistent 3D Reconstruction of Multiple Interacting People under Weak SupervisionMihai Fieraru, Mihai Zanfir, Teodor Szente, Eduard Gabriel Bazavan, Vlad Olaru, Cristian Sminchisescu. 19385-19397 [doi]

Differentiable Annealed Importance Sampling and the Perils of Gradient NoiseGuodong Zhang, Kyle Hsu, Jianing Li, Chelsea Finn, Roger B. Grosse. 19398-19410 [doi]

PSD Representations for Effective Probability ModelsAlessandro Rudi, Carlo Ciliberto. 19411-19422 [doi]

Exploiting a Zoo of Checkpoints for Unseen TasksJiaji Huang, Qiang Qiu, Kenneth Church 0001. 19423-19434 [doi]

Towards Open-World Feature Extrapolation: An Inductive Graph Learning ApproachQitian Wu, Chenxiao Yang, Junchi Yan. 19435-19447 [doi]

Adversarial Teacher-Student Representation Learning for Domain GeneralizationFu-En Yang, Yuan-Chia Cheng, Zu-Yun Shiau, Yu-Chiang Frank Wang. 19448-19460 [doi]

Stochastic bandits with groups of similar armsFabien Pesquerel, Hassan Saber, Odalric-Ambrym Maillard. 19461-19472 [doi]

Tracking Without Re-recognition in Humans and MachinesDrew Linsley, Girik Malik, Junkyung Kim, Lakshmi Narasimhan Govindarajan, Ennio Mingolla, Thomas Serre. 19473-19486 [doi]

Rethinking conditional GAN training: An approach using geometrically structured latent manifoldsSameera Ramasinghe, Moshiur R. Farazi, Salman H. Khan 0001, Nick Barnes, Stephen Gould. 19487-19499 [doi]

How to transfer algorithmic reasoning knowledge to learn new algorithms?Louis-Pascal A. C. Xhonneux, Andreea Deac, Petar Velickovic, Jian Tang 0005. 19500-19512 [doi]

Fast Axiomatic Attribution for Neural NetworksRobin Hesse, Simone Schaub-Meyer, Stefan Roth 0001. 19513-19524 [doi]

OSOA: One-Shot Online Adaptation of Deep Generative Models for Lossless CompressionChen Zhang, Shifeng Zhang, Fabio Maria Carlucci, Zhenguo Li. 19525-19537 [doi]

Compressive Visual RepresentationsKuang-Huei Lee, Anurag Arnab, Sergio Guadarrama, John F. Canny, Ian Fischer. 19538-19552 [doi]

Multi-Armed Bandits with Bounded Arm-Memory: Near-Optimal Guarantees for Best-Arm Identification and Regret MinimizationArnab Maiti, Vishakha Patil, Arindam Khan 0001. 19553-19565 [doi]

Grounding inductive biases in natural images: invariance stems from variations in dataDiane Bouchacourt, Mark Ibrahim, Ari S. Morcos. 19566-19579 [doi]

Directed Graph Contrastive LearningZekun Tong, Yuxuan Liang, Henghui Ding, Yongxing Dai, Xinke Li, Changhu Wang. 19580-19593 [doi]

Space-time Mixing Attention for Video TransformerAdrian Bulat, Juan-Manuel Pérez-Rúa, Swathikiran Sudhakaran, Brais Martínez, Georgios Tzimiropoulos. 19594-19607 [doi]

Particle Dual Averaging: Optimization of Mean Field Neural Network with Global Convergence Rate AnalysisAtsushi Nitanda, Denny Wu, Taiji Suzuki. 19608-19621 [doi]

Learning Tree Interpretation from Object Representation for Deep Reinforcement LearningGuiliang Liu, Xiangyu Sun, Oliver Schulte, Pascal Poupart. 19622-19636 [doi]

Only Train Once: A One-Shot Neural Network Training And Pruning FrameworkTianyi Chen, Bo Ji, Tianyu Ding, Biyi Fang, Guanyi Wang, Zhihui Zhu, Luming Liang, Yixin Shi, Sheng Yi, Xiao Tu. 19637-19651 [doi]

Referring Transformer: A One-step Approach to Multi-task Visual GroundingMuchen Li, Leonid Sigal. 19652-19664 [doi]

Decoupling the Depth and Scope of Graph Neural NetworksHanqing Zeng, Muhan Zhang, Yinglong Xia, Ajitesh Srivastava, Andrey Malevich, Rajgopal Kannan, Viktor K. Prasanna, Long Jin, Ren Chen. 19665-19679 [doi]

Fast and Memory Efficient Differentially Private-SGD via JL ProjectionsZhiqi Bu, Sivakanth Gopi, Janardhan Kulkarni, Yin Tat Lee, Judy Hanwen Shen, Uthaipon Tantipongpipat. 19680-19691 [doi]

Formalizing Generalization and Adversarial Robustness of Neural Networks to Weight PerturbationsYu-Lin Tsai, Chia-Yi Hsu, Chia-Mu Yu, Pin-Yu Chen. 19692-19704 [doi]

Pipeline Combinators for Gradual AutoMLGuillaume Baudart, Martin Hirzel, Kiran Kate, Parikshit Ram, Avraham Shinnar, Jason Tsay. 19705-19718 [doi]

Boost Neural Networks by CheckpointsFeng Wang, Guoyizhe Wei, Qiao Liu, Jinxiang Ou, Xian Wei, Hairong Lv. 19719-19729 [doi]

Model Selection for Bayesian AutoencodersBa-Hien Tran, Simone Rossi, Dimitrios Milios, Pietro Michiardi, Edwin V. Bonilla, Maurizio Filippone. 19730-19742 [doi]

Three Operator Splitting with Subgradients, Stochastic Gradients, and Adaptive Learning RatesAlp Yurtsever, Alex Gu, Suvrit Sra. 19743-19756 [doi]

Knowledge-Adaptation PriorsMohammad Emtiyaz Khan, Siddharth Swaroop. 19757-19770 [doi]

Provably efficient multi-task reinforcement learning with model transferChicheng Zhang, Zhi Wang 0013. 19771-19783 [doi]

Predicting Molecular Conformation via Dynamic Graph Score MatchingShitong Luo, Chence Shi, Minkai Xu, Jian Tang 0005. 19784-19795 [doi]

When in Doubt: Neural Non-Parametric Uncertainty Quantification for Epidemic ForecastingHarshavardhan Kamarthi, Lingkai Kong, Alexander Rodríguez, Chao Zhang 0014, B. Aditya Prakash. 19796-19807 [doi]

Bounds all around: training energy-based models with bidirectional boundsCong Geng, Jia Wang, Zhiyong Gao, Jes Frellsen, Søren Hauberg. 19808-19821 [doi]

CogView: Mastering Text-to-Image Generation via TransformersMing Ding, Zhuoyi Yang, Wenyi Hong, Wendi Zheng, Chang Zhou, Da Yin, Junyang Lin, Xu Zou, Zhou Shao, Hongxia Yang, Jie Tang 0001. 19822-19835 [doi]

Time-independent Generalization Bounds for SGLD in Non-convex SettingsTyler Farghly, Patrick Rebeschini. 19836-19846 [doi]

Nonuniform Negative Sampling and Log Odds Correction with Rare Events DataHaiying Wang, Aonan Zhang, Chong Wang 0002. 19847-19859 [doi]

Algorithmic stability and generalization of an unsupervised feature selection algorithmXinxing Wu, Qiang Cheng. 19860-19875 [doi]

On learning sparse vectors from mixture of responsesNikita Polyanskii. 19876-19887 [doi]

Convergence and Alignment of Gradient Descent with Random Backpropagation WeightsGanlin Song, Ruitu Xu, John Lafferty. 19888-19898 [doi]

Adder Attention for Vision TransformerHan Shu, Jiahao Wang, Hanting Chen, Lin Li, Yujiu Yang, Yunhe Wang 0001. 19899-19909 [doi]

Reverse engineering learned optimizers reveals known and novel mechanismsNiru Maheswaranathan, David Sussillo, Luke Metz, Ruoxi Sun, Jascha Sohl-Dickstein. 19910-19922 [doi]

Matching a Desired Causal State via Shift InterventionsJiaqi Zhang, Chandler Squires, Caroline Uhler. 19923-19934 [doi]

Unsupervised Noise Adaptive Speech Enhancement by Discriminator-Constrained Optimal TransportHsin-Yi Lin, Huan-Hsin Tseng, Xugang Lu, Yu Tsao 0001. 19935-19946 [doi]

Optimality of variational inference for stochasticblock model with missing linksSolenne Gaucher, Olga Klopp. 19947-19959 [doi]

Policy Learning Using Weak SupervisionJingkang Wang, Hongyi Guo, Zhaowei Zhu, Yang Liu 0018. 19960-19973 [doi]

Chasing Sparsity in Vision Transformers: An End-to-End ExplorationTianlong Chen, Yu Cheng 0001, Zhe Gan, Lu Yuan, Lei Zhang 0001, Zhangyang Wang. 19974-19988 [doi]

Graphical Models in Heavy-Tailed MarketsJosé Vinícius de Miranda Cardoso, Jiaxi Ying, Daniel P. Palomar. 19989-20001 [doi]

A Shading-Guided Generative Implicit Model for Shape-Accurate 3D-Aware Image SynthesisXingang Pan, Xudong Xu, Chen Change Loy, Christian Theobalt, Bo Dai. 20002-20013 [doi]

XCiT: Cross-Covariance Image TransformersAlaaeldin Ali, Hugo Touvron, Mathilde Caron, Piotr Bojanowski, Matthijs Douze, Armand Joulin, Ivan Laptev, Natalia Neverova, Gabriel Synnaeve, Jakob Verbeek, Hervé Jégou. 20014-20027 [doi]

Row-clustering of a Point Process-valued MatrixLihao Yin, Ganggang Xu, Huiyan Sang, Yongtao Guan. 20028-20039 [doi]

Fine-Grained Neural Network Explanation by Identifying Input Features with Predictive InformationYang Zhang, Ashkan Khakzar, Yawei Li, Azade Farshad, Seong Tae Kim 0001, Nassir Navab. 20040-20051 [doi]

Fast Minimum-norm Adversarial Attacks through Adaptive Norm ConstraintsMaura Pintor, Fabio Roli, Wieland Brendel, Battista Biggio. 20052-20062 [doi]

Uncertainty Quantification and Deep EnsemblesRahul Rahaman, Alexandre H. Thiéry. 20063-20075 [doi]

Directed Probabilistic WatershedEnrique Fita Sanmartin, Sebastian Damrich, Fred A. Hamprecht. 20076-20088 [doi]

Laplace Redux - Effortless Bayesian Deep LearningErik Daxberger, Agustinus Kristiadi, Alexander Immer, Runa Eschenhagen, Matthias Bauer, Philipp Hennig. 20089-20103 [doi]

Hessian Eigenspectra of More Realistic Nonlinear ModelsZhenyu Liao 0001, Michael W. Mahoney. 20104-20117 [doi]

Explicable Reward Design for Reinforcement Learning AgentsRati Devidze, Goran Radanovic, Parameswaran Kamalaruban, Adish Singla. 20118-20131 [doi]

A Minimalist Approach to Offline Reinforcement LearningScott Fujimoto, Shixiang Shane Gu. 20132-20145 [doi]

SIMONe: View-Invariant, Temporally-Abstracted Object Representations via Unsupervised Video DecompositionRishabh Kabra, Daniel Zoran, Goker Erdogan, Loic Matthey, Antonia Creswell, Matt M. Botvinick, Alexander Lerchner, Christopher P. Burgess. 20146-20159 [doi]

Simple Stochastic and Online Gradient Descent Algorithms for Pairwise LearningZhenhuan Yang, Yunwen Lei, Puyu Wang, Tianbao Yang, Yiming Ying. 20160-20171 [doi]

User-Level Differentially Private Learning via Correlated SamplingBadih Ghazi, Ravi Kumar 0001, Pasin Manurangsi. 20172-20184 [doi]

Asynchronous Decentralized Online LearningJiyan Jiang, Wenpeng Zhang 0003, Jinjie Gu, Wenwu Zhu 0001. 20185-20196 [doi]

Multi-Step Budgeted Bayesian Optimization with Unknown Evaluation CostsRaul Astudillo, Daniel R. Jiang, Maximilian Balandat, Eytan Bakshy, Peter I. Frazier. 20197-20209 [doi]

Model-Based Domain GeneralizationAlexander Robey, George J. Pappas, Hamed Hassani. 20210-20229 [doi]

$\alpha$-IoU: A Family of Power Intersection over Union Losses for Bounding Box RegressionJiabo He, Sarah M. Erfani, Xingjun Ma, James Bailey 0001, Ying Chi, Xian-Sheng Hua 0001. 20230-20242 [doi]

Practical Large-Scale Linear Programming using Primal-Dual Hybrid GradientDavid L. Applegate, Mateo Díaz, Oliver Hinder, Haihao Lu, Miles Lubin, Brendan O'Donoghue, Warren Schudy. 20243-20257 [doi]

On the Provable Generalization of Recurrent Neural NetworksLifu Wang, Bo Shen, Bo Hu, Xing Cao. 20258-20269 [doi]

Differentiable Spline ApproximationsMinsu Cho, Aditya Balu, Ameya Joshi, Anjana Deva Prasad, Biswajit Khara, Soumik Sarkar, Baskar Ganapathysubramanian, Adarsh Krishnamurthy, Chinmay Hegde. 20270-20282 [doi]

Rate-Optimal Subspace Estimation on Random GraphsZhixin Zhou, Fan Zhou, Ping Li 0001, Cun-Hui Zhang. 20283-20294 [doi]

Estimating the Unique Information of Continuous VariablesAri Pakman, Amin Nejatbakhsh, Dar Gilboa, Abdullah Makkeh, Luca Mazzucato, Michael Wibral, Elad Schneidman. 20295-20307 [doi]

Reliable Causal Discovery with Improved Exact Search and Weaker AssumptionsIgnavier Ng, Yujia Zheng, Jiji Zhang, Kun Zhang 0001. 20308-20320 [doi]

Node Dependent Local Smoothing for Scalable Graph LearningWentao Zhang, Mingyu Yang, Zeang Sheng, Yang Li 0106, Wen Ouyang, Yangyu Tao, Zhi Yang 0001, Bin Cui 0001. 20321-20332 [doi]

Parallel and Efficient Hierarchical k-Median ClusteringVincent Cohen-Addad, Silvio Lattanzi, Ashkan Norouzi-Fard, Christian Sohler, Ola Svensson. 20333-20345 [doi]

Human-Adversarial Visual Question AnsweringSasha Sheng, Amanpreet Singh, Vedanuj Goswami, Jose Alberto Lopez Magana, Tristan Thrush, Wojciech Galuba, Devi Parikh, Douwe Kiela. 20346-20359 [doi]

Across-animal odor decoding by probabilistic manifold alignmentPedro Herrero-Vidal, Dmitry Rinberg, Cristina Savin. 20360-20372 [doi]

Excess Capacity and Backdoor PoisoningNaren Manoj, Avrim Blum. 20373-20384 [doi]

A Convergence Analysis of Gradient Descent on Graph Neural NetworksPranjal Awasthi, Abhimanyu Das, Sreenivas Gollapudi. 20385-20397 [doi]

Differentiable rendering with perturbed optimizersQuentin Le Lidec, Ivan Laptev, Cordelia Schmid, Justin Carpentier. 20398-20409 [doi]

BCORLE(λ): An Offline Reinforcement Learning and Evaluation Framework for Coupons Allocation in E-commerce MarketYang Zhang, Bo Tang, Qingyu Yang, Dou An, Hongyin Tang, Chenyang Xi, Xueying Li, Feiyu Xiong. 20410-20422 [doi]

Nested Variational InferenceHeiko Zimmermann, Hao Wu 0020, Babak Esmaeili 0001, Jan-Willem van de Meent. 20423-20435 [doi]

Exponential Bellman Equation and Improved Regret Bounds for Risk-Sensitive Reinforcement LearningYingjie Fei, Zhuoran Yang, Yudong Chen 0001, Zhaoran Wang. 20436-20446 [doi]

On sensitivity of meta-learning to support dataMayank Agarwal, Mikhail Yurochkin, Yuekai Sun. 20447-20460 [doi]

On Large-Cohort Training for Federated LearningZachary Charles, Zachary Garrett, Zhouyuan Huo, Sergei Shmulyian, Virginia Smith. 20461-20475 [doi]

Generic Neural Architecture Search via RegressionYuhong Li, Cong Hao, Pan Li, Jinjun Xiong, Deming Chen. 20476-20490 [doi]

The best of both worlds: stochastic and adversarial episodic MDPs with unknown transitionTiancheng Jin, Longbo Huang, Haipeng Luo. 20491-20502 [doi]

Private learning implies quantum stabilityYihui Quek, Srinivasan Arunachalam, John A. Smolin. 20503-20515 [doi]

Interesting Object, Curious Agent: Learning Task-Agnostic ExplorationSimone Parisi, Victoria Dean, Deepak Pathak, Abhinav Gupta 0001. 20516-20530 [doi]

SimiGrad: Fine-Grained Adaptive Batching for Large Scale Training using Gradient Similarity MeasurementHeyang Qin, Samyam Rajbhandari, Olatunji Ruwase, Feng Yan 0001, Lei Yang 0001, Yuxiong He. 20531-20544 [doi]

Variational Inference for Continuous-Time Switching Dynamical SystemsLukas Köhs, Bastian Alt, Heinz Koeppl. 20545-20557 [doi]

Implicit Regularization in Matrix Sensing via Mirror DescentFan Wu 0010, Patrick Rebeschini. 20558-20570 [doi]

STORM+: Fully Adaptive SGD with Recursive Momentum for Nonconvex OptimizationKfir Y. Levy, Ali Kavis, Volkan Cevher. 20571-20582 [doi]

Skipping the Frame-Level: Event-Based Piano Transcription With Neural Semi-CRFsYujia Yan, Frank Cwitkowitz, Zhiyao Duan. 20583-20595 [doi]

Deep Learning on a Data Diet: Finding Important Examples Early in TrainingMansheej Paul, Surya Ganguli, Gintare Karolina Dziugaite. 20596-20607 [doi]

BNS: Building Network Structures Dynamically for Continual LearningQi Qin, Wenpeng Hu, Han Peng, Dongyan Zhao 0001, Bing Liu 0001. 20608-20620 [doi]

Auditing Black-Box Prediction Models for Data Minimization ComplianceBashir Rastegarpanah, Krishna P. Gummadi, Mark Crovella. 20621-20632 [doi]

Dueling Bandits with Team ComparisonsLee Cohen, Ulrike Schmidt-Kraepelin, Yishay Mansour. 20633-20644 [doi]

Meta Internal LearningRaphael Bensadoun, Shir Gur, Tomer Galanti, Lior Wolf. 20645-20656 [doi]

Uniform Convergence of Interpolators: Gaussian Width, Norm Bounds and Benign OverfittingFrederic Koehler, Lijia Zhou, Danica J. Sutherland, Nathan Srebro. 20657-20668 [doi]

Adaptive wavelet distillation from neural networks through interpretationsWooseok Ha, Chandan Singh, Francois Lanusse, Srigokul Upadhyayula, Bin Yu 0001. 20669-20682 [doi]

Generative Occupancy Fields for 3D Surface-Aware Image SynthesisXudong Xu, Xingang Pan, Dahua Lin, Bo Dai. 20683-20695 [doi]

Relaxed Marginal Consistency for Differentially Private Query AnsweringRyan Mckenna, Siddhant Pradhan, Daniel Sheldon, Gerome Miklau. 20696-20707 [doi]

Local policy search with Bayesian optimizationSarah Müller, Alexander von Rohr, Sebastian Trimpe. 20708-20720 [doi]

DominoSearch: Find layer-wise fine-grained N: M sparse schemes from dense neural networksWei Sun, Aojun Zhou, Sander Stuijk, Rob Wijnhoven, Andrew Nelson 0001, Hongsheng Li 0001, Henk Corporaal. 20721-20732 [doi]

Techniques for Symbol Grounding with SATNetSever Topan, David Rolnick, Xujie Si. 20733-20744 [doi]

Object DGCNN: 3D Object Detection using Dynamic GraphsYue Wang, Justin M. Solomon. 20745-20758 [doi]

Safe Policy Optimization with Local Generalized Linear Function ApproximationsAkifumi Wachi, Yunyue Wei, Yanan Sui. 20759-20771 [doi]

Symplectic Adjoint Method for Exact Gradient of Neural ODE with Minimal MemoryTakashi Matsubara 0001, Yuto Miyatake, Takaharu Yaguchi. 20772-20784 [doi]

Exponential Separation between Two Learning Models and Adversarial RobustnessGrzegorz Gluch, Rüdiger L. Urbanke. 20785-20797 [doi]

The balancing principle for parameter choice in distance-regularized domain adaptationWerner Zellinger, Natalia Shepeleva, Marius-Constantin Dinu, Hamid Eghbal-zadeh, Hoan Duc Nguyen, Bernhard Nessler, Sergei V. Pereverzyev, Bernhard Alois Moser. 20798-20811 [doi]

Gaussian Kernel Mixture Network for Single Image Defocus DeblurringYuhui Quan, Zicong Wu, Hui Ji. 20812-20824 [doi]

Cockpit: A Practical Debugging Tool for the Training of Deep Neural NetworksFrank Schneider, Felix Dangel, Philipp Hennig. 20825-20837 [doi]

MEST: Accurate and Fast Memory-Economic Sparse Training Framework on the EdgeGeng Yuan, Xiaolong Ma, Wei Niu, Zhengang Li, Zhenglun Kong, Ning Liu, Yifan Gong 0004, Zheng Zhan 0001, Chaoyang He 0001, Qing Jin, Siyue Wang, Minghai Qin, Bin Ren, Yanzhi Wang, Sijia Liu 0001, Xue Lin. 20838-20850 [doi]

Precise characterization of the prior predictive distribution of deep ReLU networksLorenzo Noci, Gregor Bachmann, Kevin Roth, Sebastian Nowozin, Thomas Hofmann. 20851-20862 [doi]

RED : Looking for Redundancies for Data-FreeStructured Compression of Deep Neural NetworksEdouard Yvinec, Arnaud Dapogny, Matthieu Cord, Kevin Bailly. 20863-20873 [doi]

TestRank: Bringing Order into Unlabeled Test Instances for Deep Learning TasksYu Li 0007, Min Li 0019, Qiuxia Lai, Yannan Liu, Qiang Xu 0001. 20874-20886 [doi]

Large Scale Learning on Non-Homophilous Graphs: New Benchmarks and Strong Simple MethodsDerek Lim, Felix Hohne, Xiuyu Li, Sijia Linda Huang, Vaishnavi Gupta, Omkar Bhalerao, Ser-Nam Lim. 20887-20902 [doi]

Reinforcement Learning based Disease Progression Model for Alzheimer's DiseaseKrishnakant V. Saboo, Anirudh Choudhary, Yurui Cao, Gregory A. Worrell, David T. Jones, Ravishankar K. Iyer. 20903-20915 [doi]

Catch-A-Waveform: Learning to Generate Audio from a Single Short ExampleGal Greshler, Tamar Rott Shaham, Tomer Michaeli. 20916-20928 [doi]

Explanation-based Data Augmentation for Image ClassificationSandareka Wickramanayake, Wynne Hsu, Mong-Li Lee. 20929-20940 [doi]

Data-Efficient GAN Training Beyond (Just) Augmentations: A Lottery Ticket PerspectiveTianlong Chen, Yu Cheng 0001, Zhe Gan, Jingjing Liu 0001, Zhangyang Wang. 20941-20955 [doi]

When Are Solutions Connected in Deep Networks?Quynh Nguyen, Pierre Bréchet, Marco Mondelli. 20956-20969 [doi]

TOHAN: A One-step Approach towards Few-shot Hypothesis AdaptationHaoang Chi, Feng Liu 0003, Wenjing Yang 0002, Long Lan, Tongliang Liu, Bo Han 0003, William K. Cheung, James T. Kwok. 20970-20982 [doi]

Learning Graph Cellular AutomataDaniele Grattarola, Lorenzo Livi, Cesare Alippi. 20983-20994 [doi]

Efficient Online Estimation of Causal Effects by Deciding What to ObserveShantanu Gupta, Zachary C. Lipton, David Childers. 20995-21007 [doi]

Perturbation Theory for the Information BottleneckVudtiwat Ngampruetikorn, David J. Schwab. 21008-21018 [doi]

Deconvolutional Networks on Graph DataJia Li, Jiajin Li, Yang Liu, Jianwei Yu, Yueting Li, Hong Cheng 0001. 21019-21030 [doi]

Variational Multi-Task Learning with Gumbel-Softmax PriorsJiayi Shen, Xiantong Zhen, Marcel Worring, Ling Shao. 21031-21042 [doi]

Accelerating Quadratic Optimization with Reinforcement LearningJeffrey Ichnowski, Paras Jain 0001, Bartolomeo Stellato, Goran Banjac, Michael Luo, Francesco Borrelli, Joseph E. Gonzalez, Ion Stoica, Ken Goldberg. 21043-21055 [doi]

Deep Residual Learning in Spiking Neural NetworksWei Fang, Zhaofei Yu, Yanqi Chen, Tiejun Huang 0001, Timothée Masquelier, Yonghong Tian 0001. 21056-21069 [doi]

Duplex Sequence-to-Sequence Learning for Reversible Machine TranslationZaixiang Zheng, Hao Zhou 0012, Shujian Huang, Jiajun Chen, Jingjing Xu, Lei Li 0005. 21070-21084 [doi]

Improved Coresets and Sublinear Algorithms for Power Means in Euclidean SpacesVincent Cohen-Addad, David Saulpic, Chris Schwiegelshohn. 21085-21098 [doi]

Accelerated Sparse Neural Training: A Provable and Efficient Method to Find N: M Transposable MasksItay Hubara, Brian Chmiel, Moshe Island, Ron Banner, Joseph Naor, Daniel Soudry. 21099-21111 [doi]

Learning and Generalization in RNNsAbhishek Panigrahi, Navin Goyal. 21112-21124 [doi]

Improving Visual Quality of Image Synthesis by A Token-based Generator with TransformersYanhong Zeng, Huan Yang 0005, Hongyang Chao, Jianbo Wang, Jianlong Fu. 21125-21137 [doi]

The Effect of the Intrinsic Dimension on the Generalization of Quadratic ClassifiersFabian Latorre, Leello Tadesse Dadi, Paul Rolland, Volkan Cevher. 21138-21149 [doi]

DeepReduce: A Sparse-tensor Communication Framework for Federated Deep LearningHang Xu, Kelly Kostopoulou, Aritra Dutta, Xin Li, Alexandros Ntoulas, Panos Kalnis. 21150-21163 [doi]

Provably Efficient Causal Reinforcement Learning with Confounded Observational DataLingxiao Wang, Zhuoran Yang, Zhaoran Wang. 21164-21175 [doi]

Predicting Deep Neural Network Generalization with Perturbation Response CurvesYair Schiff, Brian Quanz, Payel Das, Pin-Yu Chen. 21176-21188 [doi]

Exploiting Domain-Specific Features to Enhance Domain GeneralizationManh-Ha Bui, Toan Tran, Anh Tran, Dinh Q. Phung. 21189-21201 [doi]

Optimal Order Simple Regret for Gaussian Process BanditsSattar Vakili, Nacime Bouziani, Sepehr Jalali, Alberto Bernacchia, Da-shan Shiu. 21202-21215 [doi]

Generalization Guarantee of SGD for Pairwise LearningYunwen Lei, Mingrui Liu, Yiming Ying. 21216-21228 [doi]

Supercharging Imbalanced Data Learning With Energy-based Contrastive Representation TransferJunya Chen, Zidi Xiu, Benjamin Goldstein, Ricardo Henao, Lawrence Carin, Chenyang Tao. 21229-21243 [doi]

Heavy Ball Momentum for Conditional GradientBingcong Li, Alireza Sadeghi, Georgios B. Giannakis. 21244-21255 [doi]

PARP: Prune, Adjust and Re-Prune for Self-Supervised Speech RecognitionCheng-I Jeff Lai, Yang Zhang, Alexander H. Liu, Shiyu Chang, Yi-Lun Liao, Yung-Sung Chuang, Kaizhi Qian, Sameer Khurana, David D. Cox, Jim Glass. 21256-21272 [doi]

Robust Learning of Optimal AuctionsWenshuo Guo, Michael I. Jordan, Emmanouil Zampetakis. 21273-21284 [doi]

Disrupting Deep Uncertainty Estimation Without Harming AccuracyIdo Galil, Ran El-Yaniv. 21285-21296 [doi]

SOFT: Softmax-free Transformer with Linear ComplexityJiachen Lu, Jinghan Yao, Junge Zhang, Xiatian Zhu, Hang Xu, Weiguo Gao, Chunjing Xu, Tao Xiang, Li Zhang. 21297-21309 [doi]

Task-Adaptive Neural Network Search with Meta-Contrastive LearningWonyong Jeong, Hayeon Lee, Geon Park, Eunyoung Hyung, Jinheon Baek, Sung Ju Hwang. 21310-21324 [doi]

Neural Flows: Efficient Alternative to Neural ODEsMarin Bilos, Johanna Sommer, Syama Sundar Rangapuram, Tim Januschowski, Stephan Günnemann. 21325-21337 [doi]

Multi-Objective Meta LearningFeiyang Ye, Baijiong Lin, Zhixiong Yue, Pengxin Guo, Qiao Xiao, Yu Zhang 0006. 21338-21351 [doi]

A self consistent theory of Gaussian Processes captures feature learning effects in finite CNNsGadi Naveh, Zohar Ringel. 21352-21364 [doi]

Mini-Batch Consistent Slot Set Encoder for Scalable Set EncodingAndreis Bruno, Jeffrey Willette, Juho Lee 0001, Sung Ju Hwang. 21365-21374 [doi]

Efficient and Local Parallel Random WalksMichael Kapralov, Silvio Lattanzi, Navid Nouri, Jakab Tardos. 21375-21387 [doi]

Amortized Variational Inference for Simple Hierarchical ModelsAbhinav Agrawal 0001, Justin Domke. 21388-21399 [doi]

Online Matching in Sparse Random Graphs: Non-Asymptotic Performances of Greedy AlgorithmNathan Noiry, Vianney Perchet, Flore Sentenac. 21400-21412 [doi]

End-to-end reconstruction meets data-driven regularization for inverse problemsSubhadip Mukherjee, Marcello Carioni, Ozan Öktem, Carola-Bibiane Schönlieb. 21413-21425 [doi]

An online passive-aggressive algorithm for difference-of-squares classificationLawrence K. Saul. 21426-21439 [doi]

Finite-Sample Analysis of Off-Policy TD-Learning via Generalized Bellman OperatorsZaiwei Chen, Siva Theja Maguluri, Sanjay Shakkottai, Karthikeyan Shanmugam. 21440-21452 [doi]

A Bi-Level Framework for Learning to Solve Combinatorial Optimization on GraphsRunzhong Wang, Zhigang Hua, Gan Liu, Jiayi Zhang, Junchi Yan, Feng Qi 0005, Shuang Yang, Jun Zhou 0011, Xiaokang Yang. 21453-21466 [doi]

Improved Learning Rates of a Functional Lasso-type SVM with Sparse Multi-Kernel RepresentationShaogao Lv, Junhui Wang, Jiankun Liu, Yong Liu. 21467-21479 [doi]

When does Contrastive Learning Preserve Adversarial Robustness from Pretraining to Finetuning?Lijie Fan, Sijia Liu, Pin-Yu Chen, Gaoyuan Zhang, Chuang Gan. 21480-21492 [doi]

Learning Transferable Features for Point Cloud Detection via 3D Contrastive Co-trainingYihan Zeng, Chunwei Wang, Yunbo Wang, Hang Xu, Chaoqiang Ye, Zhen Yang, Chao Ma 0004. 21493-21504 [doi]

SILG: The Multi-domain Symbolic Interactive Language Grounding BenchmarkVictor Zhong, Austin W. Hanjie, Sida I. Wang, Karthik Narasimhan, Luke Zettlemoyer. 21505-21519 [doi]

A Surrogate Objective Framework for Prediction+Programming with Soft ConstraintsKai Yan, Jie Yan, Chuan Luo, Liting Chen, Qingwei Lin, Dongmei Zhang. 21520-21532 [doi]

Learning to Predict Trustworthiness with Steep Slope LossYan Luo, Yongkang Wong, Mohan S. Kankanhalli, Qi Zhao 0001. 21533-21544 [doi]

On the Periodic Behavior of Neural Network Training with Batch Normalization and Weight DecayEkaterina Lobacheva, Maxim Kodryan, Nadezhda Chirkova, Andrey Malinin, Dmitry P. Vetrov. 21545-21556 [doi]

NeRV: Neural Representations for VideosHao Chen, Bo He, Hanyu Wang, Yixuan Ren, Ser-Nam Lim, Abhinav Shrivastava. 21557-21568 [doi]

Surrogate Regret Bounds for Polyhedral LossesRafael M. Frongillo, Bo Waggoner. 21569-21580 [doi]

Last iterate convergence of SGD for Least-Squares in the Interpolation regimeAditya Vardhan Varre, Loucas Pillaud-Vivien, Nicolas Flammarion. 21581-21591 [doi]

Generative vs. Discriminative: Rethinking The Meta-Continual LearningMohammadamin Banayeeanzade, Rasoul Mirzaiezadeh, Hosein Hasani, Mahdieh Soleymani. 21592-21604 [doi]

Model, sample, and epoch-wise descents: exact solution of gradient flow in the random feature modelAntoine Bodin, Nicolas Macris. 21605-21617 [doi]

Rethinking Graph Transformers with Spectral AttentionDevin Kreuzer, Dominique Beaini, William L. Hamilton, Vincent Létourneau, Prudencio Tossou. 21618-21629 [doi]

Perceptual Score: What Data Modalities Does Your Model Perceive?Itai Gat, Idan Schwartz, Alexander G. Schwing. 21630-21643 [doi]

PiRank: Scalable Learning To Rank via Differentiable SortingRobin M. E. Swezey, Aditya Grover, Bruno Charron, Stefano Ermon. 21644-21654 [doi]

Deceive D: Adaptive Pseudo Augmentation for GAN Training with Limited DataLiming Jiang, Bo Dai, Wayne Wu, Chen Change Loy. 21655-21667 [doi]

CoFrNets: Interpretable Neural Architecture Inspired by Continued FractionsIsha Puri, Amit Dhurandhar, Tejaswini Pedapati, Karthikeyan Shanmugam, Dennis Wei, Kush R. Varshney. 21668-21680 [doi]

Iterative Teaching by Label SynthesisWeiyang Liu, Zhen Liu 0019, Hanchen Wang, Liam Paull, Bernhard Schölkopf, Adrian Weller. 21681-21695 [doi]

On Density Estimation with Diffusion ModelsDiederik P. Kingma, Tim Salimans, Ben Poole, Jonathan Ho. 21696-21707 [doi]

FastCorrect: Fast Error Correction with Edit Alignment for Automatic Speech RecognitionYichong Leng, Xu Tan 0003, Linchen Zhu, Jin Xu 0010, Renqian Luo, Linquan Liu, Tao Qin, Xiangyang Li 0001, Edward Lin, Tie-Yan Liu. 21708-21719 [doi]

Kernelized Heterogeneous Risk MinimizationJiashuo Liu, Zheyuan Hu, Peng Cui 0001, Bo Li 0064, Zheyan Shen. 21720-21731 [doi]

Hierarchical Reinforcement Learning with Timed SubgoalsNico Gürtler, Dieter Büchler, Georg Martius. 21732-21743 [doi]

Fair Scheduling for Time-dependent ResourcesBo Li 0037, Minming Li, Ruilong Zhang. 21744-21756 [doi]

SNIPS: Solving Noisy Inverse Problems StochasticallyBahjat Kawar, Gregory Vaksman, Michael Elad. 21757-21769 [doi]

Stateful ODE-Nets using Basis Function ExpansionsAlejandro Queiruga, N. Benjamin Erichson, Liam Hodgkinson, Michael W. Mahoney. 21770-21781 [doi]

Beyond the Signs: Nonparametric Tensor Completion via Sign SeriesChanwoo Lee, Miaoyan Wang. 21782-21794 [doi]

Functional Variational Inference based on Stochastic Process GeneratorsChao Ma 0019, José Miguel Hernández-Lobato. 21795-21807 [doi]

TTT++: When Does Self-Supervised Test-Time Training Fail or Thrive?Yuejiang Liu, Parth Kothari, Bastien van Delft, Baptiste Bellot-Gurlet, Taylor Mordan, Alexandre Alahi. 21808-21820 [doi]

Double Machine Learning Density Estimation for Local Treatment Effects with InstrumentsYonghan Jung, Jin Tian 0001, Elias Bareinboim. 21821-21833 [doi]

Dirichlet Energy Constrained Learning for Deep Graph Neural NetworksKaixiong Zhou, Xiao Huang 0001, Daochen Zha, Rui Chen 0012, Li Li, Soo Hyun Choi, Xia Hu. 21834-21846 [doi]

Accelerating Robotic Reinforcement Learning via Parameterized Action PrimitivesMurtaza Dalal, Deepak Pathak, Ruslan Salakhutdinov. 21847-21859 [doi]

Boosted CVaR ClassificationRuntian Zhai, Chen Dan 0001, Arun Sai Suggala, J. Zico Kolter, Pradeep Ravikumar. 21860-21871 [doi]

Disentangled Contrastive Learning on GraphsHaoyang Li, Xin Wang, Ziwei Zhang, Zehuan Yuan, Hang Li, Wenwu Zhu 0001. 21872-21884 [doi]

Widening the Pipeline in Human-Guided Reinforcement Learning with Explanation and Context-Aware Data AugmentationLin Guan, Mudit Verma, Sihang Guo, Ruohan Zhang, Subbarao Kambhampati. 21885-21897 [doi]

SOLQ: Segmenting Objects by Learning QueriesBin Dong, Fangao Zeng, Tiancai Wang, Xiangyu Zhang 0005, Yichen Wei. 21898-21909 [doi]

Extending Lagrangian and Hamiltonian Neural Networks with Differentiable Contact ModelsYaofeng Desmond Zhong, Biswadip Dey, Amit Chakraborty. 21910-21922 [doi]

Best-case lower bounds in online learningCristóbal Guzmán, Nishant A. Mehta, Ali Mortazavi. 21923-21934 [doi]

A Comprehensively Tight Analysis of Gradient Descent for PCAZhiqiang Xu, Ping Li. 21935-21946 [doi]

On Robust Optimal Transport: Computational Complexity and Barycenter ComputationKhang Le, Huy Nguyen, Quang Minh Nguyen, Tung Pham 0001, Hung Bui, Nhat Ho. 21947-21959 [doi]

Asymptotically Best Causal Effect Identification with Multi-Armed BanditsAlan Malek, Silvia Chiappa. 21960-21971 [doi]

Learning rule influences recurrent network representations but not attractor structure in decision-making tasksBrandon McMahan, Michael Kleinman, Jonathan C. Kao. 21972-21983 [doi]

Few-Shot Segmentation via Cycle-Consistent TransformerGengwei Zhang, Guoliang Kang, Yi Yang 0001, Yunchao Wei. 21984-21996 [doi]

DropGNN: Random Dropouts Increase the Expressiveness of Graph Neural NetworksPál András Papp, Karolis Martinkus, Lukas Faber, Roger Wattenhofer. 21997-22009 [doi]

Photonic Differential Privacy with Direct Feedback AlignmentRuben Ohana, Hamlet Jesse Medina Ruiz, Julien Launay, Alessandro Cappelli, Iacopo Poli, Liva Ralaivola, Alain Rakotomamonjy. 22010-22020 [doi]

Searching Parameterized AP Loss for Object DetectionChenxin Tao, Zizhang Li, Xizhou Zhu, Gao Huang, Yong Liu, Jifeng Dai. 22021-22033 [doi]

Fair Exploration via Axiomatic BargainingJackie Baek, Vivek F. Farias. 22034-22045 [doi]

Unifying lower bounds on prediction dimension of convex surrogatesJessica Finocchiaro, Rafael M. Frongillo, Bo Waggoner. 22046-22057 [doi]

Ultrahyperbolic Neural NetworksMarc Law. 22058-22069 [doi]

NeuroMLR: Robust & Reliable Route Recommendation on Road NetworksJayant Jain, Vrittika Bagadia, Sahil Manchanda, Sayan Ranu. 22070-22082 [doi]

Risk Bounds and Calibration for a Smart Predict-then-Optimize MethodHeyuan Liu, Paul Grigas. 22083-22094 [doi]

Three-dimensional spike localization and improved motion correction for Neuropixels recordingsJulien Boussard, Erdem Varol, Hyun-Dong Lee, Nishchal Dethe, Liam Paninski. 22095-22105 [doi]

Semi-Supervised Semantic Segmentation via Adaptive Equalization LearningHanzhe Hu, Fangyun Wei, Han Hu 0004, Qiwei Ye, Jinshi Cui, Liwei Wang 0001. 22106-22118 [doi]

On the Bias-Variance-Cost Tradeoff of Stochastic OptimizationYifan Hu, Xin Chen, Niao He. 22119-22131 [doi]

Averaging on the Bures-Wasserstein manifold: dimension-free convergence of gradient descentJason M. Altschuler, Sinho Chewi, Patrik Gerber, Austin Stromme. 22132-22145 [doi]

Reinforcement Learning in Newcomblike EnvironmentsJames Bell 0001, Linda Linsefors, Caspar Oesterheld, Joar Skalse. 22146-22157 [doi]

Comprehensive Knowledge Distillation with Causal InterventionXiang Deng 0002, Zhongfei Zhang. 22158-22170 [doi]

Reinforcement Learning with Latent FlowWenling Shang, Xiaofei Wang 0008, Aravind Srinivas, Aravind Rajeswaran, Yang Gao, Pieter Abbeel, Michael Laskin. 22171-22183 [doi]

Understanding How Encoder-Decoder Architectures AttendKyle Aitken, Vinay V. Ramasesh, Yuan Cao, Niru Maheswaranathan. 22184-22195 [doi]

Latent Execution for Neural Program Synthesis Beyond Domain-Specific LanguagesXinyun Chen, Dawn Song, Yuandong Tian. 22196-22208 [doi]

Two steps to risk sensitivityChris Gagne 0001, Peter Dayan. 22209-22220 [doi]

DECAF: Generating Fair Synthetic Data Using Causally-Aware Generative NetworksBoris van Breugel, Trent Kyono, Jeroen Berrevoets, Mihaela van der Schaar. 22221-22233 [doi]

EvoGrad: Efficient Gradient-Based Meta-Learning and Hyperparameter OptimizationOndrej Bohdal, Yongxin Yang, Timothy M. Hospedales. 22234-22246 [doi]

Biological key-value memory networksDanil Tyulmankov, Ching Fang, Annapurna Vadaparty, Guangyu Robert Yang. 22247-22258 [doi]

Correlated Stochastic Block Models: Exact Graph Matching with Applications to Recovering CommunitiesMiklós Z. Rácz, Anirudh Sridhar. 22259-22273 [doi]

Twice regularized MDPs and the equivalence between robustness and regularizationEsther Derman, Matthieu Geist, Shie Mannor. 22274-22287 [doi]

Nearly Minimax Optimal Reinforcement Learning for Discounted MDPsJiafan He, Dongruo Zhou, Quanquan Gu. 22288-22300 [doi]

Sparse Deep Learning: A New Framework Immune to Local Traps and MiscalibrationYan Sun, Wenjun Xiong, Faming Liang. 22301-22312 [doi]

Calibrating Predictions to Decisions: A Novel Approach to Multi-Class CalibrationShengjia Zhao, Michael P. Kim, Roshni Sahoo, Tengyu Ma 0001, Stefano Ermon. 22313-22324 [doi]

Lower Bounds and Optimal Algorithms for Smooth and Strongly Convex Decentralized Optimization Over Time-Varying NetworksDmitry Kovalev, Elnur Gasanov, Alexander V. Gasnikov, Peter Richtárik. 22325-22335 [doi]

Testing Probabilistic CircuitsYash Pote, Kuldeep S. Meel. 22336-22347 [doi]

Pseudo-Spherical Contrastive DivergenceLantao Yu, Jiaming Song, Yang Song 0011, Stefano Ermon. 22348-22362 [doi]

NORESQA: A Framework for Speech Quality Assessment using Non-Matching ReferencesPranay Manocha, Buye Xu, Anurag Kumar 0003. 22363-22378 [doi]

AFEC: Active Forgetting of Negative Transfer in Continual LearningLiyuan Wang, Mingtian Zhang, Zhongfan Jia, Qian Li, Chenglong Bao, Kaisheng Ma, Jun Zhu 0001, Yi Zhong. 22379-22391 [doi]

Heterogeneous Multi-player Multi-armed Bandits: Closing the Gap and GeneralizationChengshuai Shi, Wei Xiong, Cong Shen, Jing Yang 0002. 22392-22404 [doi]

SWAD: Domain Generalization by Seeking Flat MinimaJunbum Cha, Sanghyuk Chun, Kyungjae Lee, Han-Cheol Cho, Seunghyun Park, Yunsung Lee, Sungrae Park. 22405-22418 [doi]

Autoformer: Decomposition Transformers with Auto-Correlation for Long-Term Series ForecastingHaixu Wu, Jiehui Xu, Jianmin Wang 0001, Mingsheng Long. 22419-22430 [doi]

Predicting Event Memorability from Contextual Visual SemanticsQianli Xu, Fen Fang, Ana Garcia del Molino, Vigneshwaran Subbaraju, Joo-Hwee Lim. 22431-22442 [doi]

Achieving Forgetting Prevention and Knowledge Transfer in Continual LearningZixuan Ke, Bing Liu 0001, Nianzu Ma, Hu Xu 0001, Lei Shu 0004. 22443-22456 [doi]

Bandits with many optimal armsRianne de Heide, James Cheshire, Pierre Ménard, Alexandra Carpentier. 22457-22469 [doi]

Combiner: Full Attention Transformer with Sparse Computation CostHongyu Ren, Hanjun Dai, Zihang Dai, Mengjiao Yang, Jure Leskovec, Dale Schuurmans, Bo Dai. 22470-22482 [doi]

Geometry Processing with Neural FieldsGuandao Yang, Serge J. Belongie, Bharath Hariharan, Vladlen Koltun. 22483-22497 [doi]

Contextual Recommendations and Low-Regret Cutting-Plane AlgorithmsSreenivas Gollapudi, Guru Guruganesh, Kostas Kollias, Pasin Manurangsi, Renato Paes Leme, Jon Schneider. 22498-22508 [doi]

Speech Separation Using an Asynchronous Fully Recurrent Convolutional Neural NetworkXiaolin Hu 0001, Kai Li, Weiyi Zhang, Yi Luo, Jean-Marie Lemercier, Timo Gerkmann. 22509-22522 [doi]

Reinforcement Learning Enhanced Explainer for Graph Neural NetworksCaihua Shan, Yifei Shen, Yao Zhang, Xiang Li 0067, Dongsheng Li 0002. 22523-22533 [doi]

NAS-Bench-x11 and the Power of Learning CurvesShen Yan, Colin White, Yash Savani, Frank Hutter. 22534-22549 [doi]

Observation-Free Attacks on Stochastic BanditsYinglun Xu, Bhuvesh Kumar, Jacob D. Abernethy. 22550-22561 [doi]

Learning Disentangled Behavior EmbeddingsChanghao Shi, Sivan Schwartz, Shahar Levy, Shay Achvat, Maisan Abboud, Amir Ghanayim, Jackie Schiller, Gal Mishne. 22562-22573 [doi]

The Sensory Neuron as a Transformer: Permutation-Invariant Neural Networks for Reinforcement LearningYujin Tang, David Ha. 22574-22587 [doi]

Fast Extra Gradient Methods for Smooth Structured Nonconvex-Nonconcave Minimax ProblemsSucheol Lee, Donghwan Kim. 22588-22600 [doi]

Analysis of Sensing Spectral for Signal Recovery under a Generalized Linear ModelJunjie Ma 0001, Ji Xu, Arian Maleki. 22601-22613 [doi]

Revisiting ResNets: Improved Training and Scaling StrategiesIrwan Bello, William Fedus, Xianzhi Du, Ekin Dogus Cubuk, Aravind Srinivas, Tsung-Yi Lin, Jonathon Shlens, Barret Zoph. 22614-22627 [doi]

Sparse Flows: Pruning Continuous-depth ModelsLucas Liebenwein, Ramin M. Hasani, Alexander Amini, Daniela Rus. 22628-22642 [doi]

Spectrum-to-Kernel Translation for Accurate Blind Image Super-ResolutionGuangpin Tao, Xiaozhong Ji, Wenzhuo Wang, Shuo Chen 0003, Chuming Lin, Yun Cao, Tong Lu, Donghao Luo, Ying Tai. 22643-22654 [doi]

On the Rate of Convergence of Regularized Learning in Games: From Bandits and Uncertainty to Optimism and BeyondAngeliki Giannou, Emmanouil-Vasileios Vlatakis-Gkaragkounis, Panayotis Mertikopoulos. 22655-22666 [doi]

SLAPS: Self-Supervision Improves Structure Learning for Graph Neural NetworksBahare Fatemi, Layla El Asri, Seyed Mehran Kazemi. 22667-22681 [doi]

Aligning Pretraining for Detection via Object-Level Contrastive LearningFangyun Wei, Yue Gao, Zhirong Wu, Han Hu 0004, Stephen Lin. 22682-22694 [doi]

Double/Debiased Machine Learning for Dynamic Treatment EffectsGreg Lewis, Vasilis Syrgkanis. 22695-22707 [doi]

Local Disentanglement in Variational Auto-Encoders Using Jacobian $L_1$ RegularizationTravers Rhodes, Daniel D. Lee. 22708-22719 [doi]

Design of Experiments for Stochastic Contextual Linear BanditsAndrea Zanette, Kefan Dong, Jonathan N. Lee, Emma Brunskill. 22720-22731 [doi]

Encoding Spatial Distribution of Convolutional Features for Texture RepresentationYong Xu 0007, Feng Li, Zhile Chen, Jinxiu Liang, Yuhui Quan. 22732-22744 [doi]

Training Certifiably Robust Neural Networks with Efficient Local Lipschitz BoundsYujia Huang, Huan Zhang, Yuanyuan Shi, J. Zico Kolter, Anima Anandkumar. 22745-22757 [doi]

Average-Reward Learning and Planning with OptionsYi Wan, Abhishek Naik, Richard S. Sutton. 22758-22769 [doi]

SSAL: Synergizing between Self-Training and Adversarial Learning for Domain Adaptive Object DetectionMuhammad Akhtar Munir, Muhammad Haris Khan, M. Saquib Sarfraz, Mohsen Ali. 22770-22782 [doi]

Counterexample Guided RL Policy Refinement Using Bayesian OptimizationBriti Gangopadhyay, Pallab Dasgupta. 22783-22794 [doi]

Stable, Fast and Accurate: Kernelized Attention with Relative Positional EncodingShengjie Luo, Shanda Li, Tianle Cai, Di He, Dinglan Peng, Shuxin Zheng, Guolin Ke, Liwei Wang 0001, Tie-Yan Liu. 22795-22807 [doi]

Learning in Non-Cooperative Configurable Markov Decision ProcessesGiorgia Ramponi, Alberto Maria Metelli, Alessandro Concetti, Marcello Restelli. 22808-22821 [doi]

Identification of Partially Observed Linear Causal Models: Graphical Conditions for the Non-Gaussian and Heterogeneous CasesJeffrey Adams, Niels Hansen, Kun Zhang. 22822-22833 [doi]

DIB-R++: Learning to Predict Lighting and Material with a Hybrid Differentiable RendererWenzheng Chen, Joey Litalien, Jun Gao, Zian Wang, Clement Fuji Tsang, Sameh Khamis, Or Litany, Sanja Fidler. 22834-22848 [doi]

Coresets for Time Series ClusteringLingxiao Huang, K. Sudhir, Nisheeth K. Vishnoi. 22849-22862 [doi]

A Variational Perspective on Diffusion-Based Generative Models and Score MatchingChin-Wei Huang, Jae Hyun Lim 0001, Aaron C. Courville. 22863-22876 [doi]

Online Active Learning with Surrogate Loss FunctionsGiulia DeSalvo, Claudio Gentile, Tobias Sommer Thune. 22877-22889 [doi]

Does Preprocessing Help Training Over-parameterized Neural Networks?Zhao Song 0002, Shuo Yang, Ruizhe Zhang 0001. 22890-22904 [doi]

Causal Influence Detection for Improving Efficiency in Reinforcement LearningMaximilian Seitzer, Bernhard Schölkopf, Georg Martius. 22905-22918 [doi]

LADA: Look-Ahead Data Acquisition via Augmentation for Deep Active LearningYoon-Yeong Kim, Kyungwoo Song, JoonHo Jang, Il-Chul Moon. 22919-22930 [doi]

Policy Optimization in Adversarial MDPs: Improved Exploration via Dilated BonusesHaipeng Luo, Chen-Yu Wei, Chung-wei Lee. 22931-22942 [doi]

Multiclass versus Binary Differentially Private PAC LearningSatchit Sivakumar, Mark Bun, Marco Gaboardi. 22943-22954 [doi]

Adversarially Robust Change Point DetectionMengchu Li, Yi Yu. 22955-22967 [doi]

Cycle Self-Training for Domain AdaptationHong Liu, Jianmin Wang 0001, Mingsheng Long. 22968-22981 [doi]

Novel Visual Category Discovery with Dual Ranking Statistics and Mutual Knowledge DistillationBingchen Zhao, Kai Han. 22982-22994 [doi]

Stochastic Anderson Mixing for Nonconvex Stochastic OptimizationFuchao Wei, Chenglong Bao, Yang Liu 0005. 22995-23008 [doi]

Sample-Efficient Reinforcement Learning for Linearly-Parameterized MDPs with a Generative ModelBingyan Wang, Yuling Yan, Jianqing Fan. 23009-23022 [doi]

NN-Baker: A Neural-network Infused Algorithmic Framework for Optimization Problems on Geometric Intersection GraphsEvan McCarty, Qi Zhao 0007, Anastasios Sidiropoulos, Yusu Wang. 23023-23035 [doi]

A Note on Sparse Generalized Eigenvalue ProblemYunfeng Cai, Guanhua Fang, Ping Li. 23036-23048 [doi]

RMIX: Learning Risk-Sensitive Policies for Cooperative Reinforcement Learning AgentsWei Qiu 0001, Xinrun Wang, Runsheng Yu, Rundong Wang, Xu He, Bo An 0001, Svetlana Obraztsova, Zinovi Rabinovich. 23049-23062 [doi]

Optimal Policies Tend To Seek PowerAlexander Matt Turner, Logan Smith, Rohin Shah, Andrew Critch, Prasad Tadepalli. 23063-23074 [doi]

Catalytic Role Of Noise And Necessity Of Inductive Biases In The Emergence Of Compositional CommunicationLukasz Kucinski, Tomasz Korbak, Pawel Kolodziej, Piotr Milos. 23075-23088 [doi]

PLUR: A Unifying, Graph-Based View of Program Learning, Understanding, and RepairZimin Chen, Vincent J. Hellendoorn, Pascal Lamblin, Petros Maniatis, Pierre-Antoine Manzagol, Daniel Tarlow, Subhodeep Moitra. 23089-23101 [doi]

COCO-LM: Correcting and Contrasting Text Sequences for Language Model PretrainingYu Meng 0001, Chenyan Xiong, Payal Bajaj, Saurabh Tiwary, Paul Bennett 0001, Jiawei Han 0001, Xia Song. 23102-23114 [doi]

Minibatch and Momentum Model-based Methods for Stochastic Weakly Convex OptimizationQi Deng, Wenzhi Gao. 23115-23127 [doi]

XDO: A Double Oracle Algorithm for Extensive-Form GamesStephen McAleer, John B. Lanier, Kevin A. Wang, Pierre Baldi, Roy Fox. 23128-23139 [doi]

Active Assessment of Prediction Services as Accuracy Surface Over Attribute CombinationsVihari Piratla, Soumen Chakrabarti, Sunita Sarawagi. 23140-23151 [doi]

A mechanistic multi-area recurrent network model of decision-makingMichael Kleinman, Chandramouli Chandrasekaran, Jonathan C. Kao. 23152-23165 [doi]

Learning to Compose Visual RelationsNan Liu, Shuang Li, Yilun Du, Josh Tenenbaum 0001, Antonio Torralba 0001. 23166-23178 [doi]

Identity testing for Mallows modelRóbert Busa-Fekete, Dimitris Fotakis 0001, Balázs Szörényi, Emmanouil Zampetakis. 23179-23190 [doi]

Bandits with Knapsacks beyond the Worst CaseKarthik Abinav Sankararaman, Aleksandrs Slivkins. 23191-23204 [doi]

Closing the loop in medical decision support by understanding clinical decision-making: A case study on organ transplantationYuchao Qin, Fergus Imrie, Alihan Hüyük, Daniel Jarrett, Alexander Gimson, Mihaela van der Schaar. 23205-23217 [doi]

Change Point Detection via Multivariate Singular Spectrum AnalysisArwa Alanqary, Abdullah Alomar, Devavrat Shah. 23218-23230 [doi]

Meta-learning to Improve Pre-trainingAniruddh Raghu, Jonathan Lorraine, Simon Kornblith, Matthew McDermott, David Duvenaud. 23231-23244 [doi]

Fair Sparse Regression with Clustering: An Invex Relaxation for a Combinatorial ProblemAdarsh Barik, Jean Honorio. 23245-23257 [doi]

Probabilistic Margins for Instance Reweighting in Adversarial TrainingQizhou Wang, Feng Liu 0003, Bo Han 0003, Tongliang Liu, Chen Gong 0002, Gang Niu 0001, Mingyuan Zhou, Masashi Sugiyama. 23258-23269 [doi]

Unbalanced Optimal Transport through Non-negative Penalized Linear RegressionLaetitia Chapel, Rémi Flamary, Haoran Wu, Cédric Févotte, Gilles Gasso. 23270-23282 [doi]

The Difficulty of Passive Learning in Deep Reinforcement LearningGeorg Ostrovski, Pablo Samuel Castro, Will Dabney. 23283-23295 [doi]

Intriguing Properties of Vision TransformersMuzammal Naseer, Kanchana Ranasinghe, Salman Khan 0001, Munawar Hayat, Fahad Shahbaz Khan, Ming-Hsuan Yang 0001. 23296-23308 [doi]

PartialFed: Cross-Domain Personalized Federated Learning via Partial InitializationBenyuan Sun, Hongxing Huo, Yi Yang, Bo Bai. 23309-23320 [doi]

Adaptive Diffusion in Graph Neural NetworksJialin Zhao, Yuxiao Dong, Ming Ding, Evgeny Kharlamov, Jie Tang 0001. 23321-23333 [doi]

Recurrent Submodular Welfare and Matroid Blocking Semi-BanditsOrestis Papadigenopoulos, Constantine Caramanis. 23334-23346 [doi]

Representer Point Selection via Local Jacobian Expansion for Post-hoc Classifier Explanation of Deep Neural Networks and Ensemble ModelsYi Sui, Ga Wu, Scott Sanner. 23347-23358 [doi]

Editing a classifier by rewriting its prediction rulesShibani Santurkar, Dimitris Tsipras, Mahalaxmi Elango, David Bau, Antonio Torralba 0001, Aleksander Madry. 23359-23373 [doi]

How Modular should Neural Module Networks Be for Systematic Generalization?Vanessa D'Amario, Tomotake Sasaki, Xavier Boix. 23374-23385 [doi]

Contrast and Mix: Temporal Contrastive Video Domain Adaptation with Background MixingAadarsh Sahoo, Rutav Shah, Rameswar Panda, Kate Saenko, Abir Das. 23386-23400 [doi]

The Flip Side of the Reweighted Coin: Duality of Adaptive Dropout and RegularizationDaniel LeJeune, Hamid Javadi, Richard G. Baraniuk. 23401-23412 [doi]

Active Learning of Convex Halfspaces on GraphsMaximilian Thiessen, Thomas Gaertner. 23413-23425 [doi]

Differentiable Spike: Rethinking Gradient-Descent for Training Spiking Neural NetworksYuhang Li, Yufei Guo, Shanghang Zhang, Shikuang Deng, Yongqing Hai, Shi Gu. 23426-23439 [doi]

Probabilistic Entity Representation Model for Reasoning over Knowledge GraphsNurendra Choudhary, Nikhil Rao 0001, Sumeet Katariya, Karthik Subbian, Chandan K. Reddy. 23440-23451 [doi]

Black Box Probabilistic NumericsOnur Teymur, Christopher N. Foley, Philip G. Breen, Toni Karvonen, Chris J. Oates. 23452-23464 [doi]

Interpolation can hurt robust generalization even when there is no noiseKonstantin Donhauser, Alexandru Tifrea, Michael Aerni, Reinhard Heckel, Fanny Yang. 23465-23477 [doi]

On the Equivalence between Neural Network and Support Vector MachineYilan Chen, Wei Huang, Lam M. Nguyen, Tsui-Wei Weng. 23478-23490 [doi]

Learning Semantic Representations to Verify Hardware DesignsShobha Vasudevan, Wenjie Jiang 0001, David Bieber, Rishabh Singh, Hamid Shojaei, Richard Ho 0001, Charles Sutton. 23491-23504 [doi]

Rebooting ACGAN: Auxiliary Classifier GANs with Stable TrainingMinguk Kang, Woohyeon Shim, Minsu Cho, Jaesik Park. 23505-23518 [doi]

Towards a Theoretical Framework of Out-of-Distribution GeneralizationHaotian Ye, Chuanlong Xie, Tianle Cai, Ruichen Li, Zhenguo Li, Liwei Wang 0001. 23519-23531 [doi]

Slice Sampling Reparameterization GradientsDavid M. Zoltowski, Diana Cai, Ryan P. Adams. 23532-23544 [doi]

Multi-Label Learning with Pairwise Relevance OrderingMing-Kun Xie, Sheng-Jun Huang. 23545-23556 [doi]

Sampling with Trusthworthy Constraints: A Variational Gradient FrameworkXingchao Liu, Xin Tong, Qiang Liu 0001. 23557-23568 [doi]

Robust and Decomposable Average Precision for Image RetrievalElias Ramzi, Nicolas Thome, Clément Rambour, Nicolas Audebert, Xavier Bitot. 23569-23581 [doi]

Fast rates for prediction with limited expert adviceEl Mehdi Saad, Gilles Blanchard. 23582-23591 [doi]

Probabilistic Transformer For Time Series AnalysisBinh Tang, David S. Matteson. 23592-23608 [doi]

A Hierarchical Reinforcement Learning Based Optimization Framework for Large-scale Dynamic Pickup and Delivery ProblemsYi Ma, Xiaotian Hao, Jianye Hao, Jiawen Lu, Xing Liu, Xialiang Tong, Mingxuan Yuan, Zhigang Li, Jie Tang 0001, Zhaopeng Meng. 23609-23620 [doi]

Spatio-Temporal Variational Gaussian ProcessesOliver Hamelijnck, William J. Wilkinson, Niki A. Loppi, Arno Solin, Theodoros Damoulas. 23621-23633 [doi]

MERLOT: Multimodal Neural Script Knowledge ModelsRowan Zellers, Ximing Lu, Jack Hessel, Youngjae Yu, Jae Sung Park, Jize Cao, Ali Farhadi, Yejin Choi. 23634-23651 [doi]

Fast Approximate Dynamic Programming for Infinite-Horizon Markov Decision ProcessesMohamad Amin Sharifi Kolarijani, G. F. Max, Peyman Mohajerin Mohajerin Esfahani. 23652-23663 [doi]

Adaptive Risk Minimization: Learning to Adapt to Domain ShiftMarvin Zhang, Henrik Marklund, Nikita Dhawan, Abhishek Gupta, Sergey Levine, Chelsea Finn. 23664-23678 [doi]

Learning State Representations from Random Deep Action-conditional PredictionsZeyu Zheng, Vivek Veeriah, Risto Vuorio, Richard L. Lewis, Satinder Singh 0001. 23679-23691 [doi]

Mixability made efficient: Fast online multiclass logistic regressionRémi Jézéquel, Pierre Gaillard, Alessandro Rudi. 23692-23702 [doi]

Tracking People with 3D RepresentationsJathushan Rajasegaran, Georgios Pavlakos, Angjoo Kanazawa, Jitendra Malik. 23703-23713 [doi]

Off-Policy Risk Assessment in Contextual BanditsAudrey Huang, Liu Leqi, Zachary C. Lipton, Kamyar Azizzadenesheli. 23714-23726 [doi]

Adaptive Denoising via GainTuningSreyas Mohan, Joshua L. Vincent, Ramon Manzorro, Peter A. Crozier, Carlos Fernandez-Granda, Eero P. Simoncelli. 23727-23740 [doi]

Optimal Sketching for Trace EstimationShuli Jiang, Hai Pham, David P. Woodruff, Qiuyi (Richard) Zhang. 23741-23753 [doi]

Estimating Multi-cause Treatment Effects via Single-cause PerturbationZhaozhi Qian, Alicia Curth, Mihaela van der Schaar. 23754-23767 [doi]

Be Confident! Towards Trustworthy Graph Neural Networks via Confidence CalibrationXiao Wang 0017, Hongrui Liu, Chuan Shi, Cheng Yang 0002. 23768-23779 [doi]

Learning Riemannian metric for disease progression modelingSamuel Gruffaz, Pierre-Emmanuel Poulet, Etienne Maheux, Bruno Jedynak, Stanley Durrleman. 23780-23792 [doi]

Bias and variance of the Bayesian-mean decoderArthur Prat-Carrabin, Michael Woodford. 23793-23805 [doi]

MIRACLE: Causally-Aware Imputation via Learning Missing Data MechanismsTrent Kyono, Yao Zhang, Alexis Bellot, Mihaela van der Schaar. 23806-23817 [doi]

Efficient Training of Visual Transformers with Small DatasetsYahui Liu, Enver Sangineto, Wei Bi, Nicu Sebe, Bruno Lepri, Marco De Nadai. 23818-23830 [doi]

Small random initialization is akin to spectral learning: Optimization and generalization guarantees for overparameterized low-rank matrix reconstructionDominik Stöger, Mahdi Soltanolkotabi. 23831-23843 [doi]

Efficient Combination of Rematerialization and Offloading for Training DNNsOlivier Beaumont, Lionel Eyraud-Dubois, Alena Shilova. 23844-23857 [doi]

Particle Cloud Generation with Message Passing Generative Adversarial NetworksRaghav Kansal, Javier M. Duarte, Hao Su, Breno Orzari, Thiago Tomei, Maurizio Pierini, Mary Touranakou, Jean-Roch Vlimant, Dimitrios Gunopulos. 23858-23871 [doi]

CoFiNet: Reliable Coarse-to-fine Correspondences for Robust PointCloud RegistrationHao Yu, Fu Li, Mahdi Saleh, Benjamin Busam, Slobodan Ilic. 23872-23884 [doi]

Partial success in closing the gap between human and machine visionRobert Geirhos, Kantharaju Narayanappa, Benjamin Mitzkus, Tizian Thieringer, Matthias Bethge, Felix A. Wichmann, Wieland Brendel. 23885-23899 [doi]

LLC: Accurate, Multi-purpose Learnt Low-dimensional Binary CodesAditya Kusupati, Matthew Wallingford, Vivek Ramanujan, Raghav Somani, Jae Sung Park, Krishna Pillutla, Prateek Jain 0002, Sham M. Kakade, Ali Farhadi. 23900-23913 [doi]

Analytic Insights into Structure and Rank of Neural Network Hessian MapsSidak Pal Singh, Gregor Bachmann, Thomas Hofmann. 23914-23927 [doi]

Well-tuned Simple Nets Excel on Tabular DatasetsArlind Kadra, Marius Lindauer, Frank Hutter, Josif Grabocka. 23928-23941 [doi]

POODLE: Improving Few-shot Learning via Penalizing Out-of-Distribution SamplesDuong H. Le 0001, Khoi Duc Nguyen, Khoi Nguyen, Quoc Huy Tran, Rang Nguyen, Binh-Son Hua. 23942-23955 [doi]

Combinatorial Pure Exploration with Bottleneck Reward FunctionYihan Du, Yuko Kuroki, Wei Chen 0013. 23956-23967 [doi]

Densely connected normalizing flowsMatej Grcic, Ivan Grubisic, Sinisa Segvic. 23968-23982 [doi]

Snowflake: Scaling GNNs to high-dimensional continuous control via parameter freezingCharles Blake, Vitaly Kurin, Maximilian Igl, Shimon Whiteson. 23983-23992 [doi]

Subgame solving without common knowledgeBrian Hu Zhang, Tuomas Sandholm. 23993-24004 [doi]

Fair Algorithms for Multi-Agent Multi-Armed BanditsSafwan Hossain, Evi Micha, Nisarg Shah 0001. 24005-24017 [doi]

VAST: Value Function Factorization with Variable Agent Sub-TeamsThomy Phan, Fabian Ritz, Lenz Belzner, Philipp Altmann, Thomas Gabor, Claudia Linnhoff-Popien. 24018-24032 [doi]

On the Stochastic Stability of Deep Markov ModelsJán Drgona, Sayak Mukherjee, Jiaxin Zhang 0005, Frank Liu, Mahantesh Halappanavar. 24033-24047 [doi]

Multiwavelet-based Operator Learning for Differential EquationsGaurav Gupta, Xiongye Xiao, Paul Bogdan. 24048-24062 [doi]

Intermediate Layers Matter in Momentum Contrastive Self Supervised LearningAakash Kaku, Sahana Upadhya, Narges Razavian. 24063-24074 [doi]

An Efficient Pessimistic-Optimistic Algorithm for Stochastic Linear Bandits with General ConstraintsXin Liu 0049, Bin Li 0014, Pengyi Shi, Lei Ying. 24075-24086 [doi]

Efficiently Learning One Hidden Layer ReLU Networks From QueriesSitan Chen, Adam R. Klivans, Raghu Meka. 24087-24098 [doi]

Learning Nonparametric Volterra Kernels with Gaussian ProcessesMagnus Ross, Michael T. Smith 0003, Mauricio A. Álvarez. 24099-24110 [doi]

DiBS: Differentiable Bayesian Structure LearningLars Lorch, Jonas Rothfuss, Bernhard Schölkopf, Andreas Krause. 24111-24123 [doi]

Nonparametric estimation of continuous DPPs with kernel methodsMichaël Fanuel, Rémi Bardenet. 24124-24136 [doi]

FINE Samples for Learning with Noisy LabelsTaehyeon Kim, Jongwoo Ko, Sangwook Cho, Jinhwan Choi, Se-Young Yun. 24137-24149 [doi]

Residual2Vec: Debiasing graph embedding with random graphsSadamori Kojaku, Jisung Yoon, Isabel Constantino, Yong-Yeol Ahn. 24150-24163 [doi]

Benign Overfitting in Multiclass Classification: All Roads Lead to InterpolationKe Wang, Vidya Muthukumar, Christos Thrampoulidis. 24164-24179 [doi]

Instance-Dependent Bounds for Zeroth-order Lipschitz Optimization with Error CertificatesFrançois Bachoc, Tommaso Cesari, Sébastien Gerchinovitz. 24180-24192 [doi]

Training Neural Networks with Fixed Sparse MasksYi-Lin Sung, Varun Nair, Colin Raffel. 24193-24205 [doi]

VATT: Transformers for Multimodal Self-Supervised Learning from Raw Video, Audio and TextHassan Akbari, Liangzhe Yuan, Rui Qian, Wei-Hong Chuang, Shih-Fu Chang, Yin Cui, Boqing Gong. 24206-24221 [doi]

Analyzing the Generalization Capability of SGLD Using Properties of Gaussian ChannelsHao Wang 0063, Yizhe Huang, Rui Gao, Flávio P. Calmon. 24222-24234 [doi]

Learning to Schedule Heuristics in Branch and BoundAntonia Chmiela, Elias Khalil, Ambros M. Gleixner, Andrea Lodi 0001, Sebastian Pokutta. 24235-24246 [doi]

On Training Implicit ModelsZhengyang Geng, Xin-yu Zhang, Shaojie Bai, Yisen Wang 0001, Zhouchen Lin. 24247-24260 [doi]

MLP-Mixer: An all-MLP Architecture for VisionIlya O. Tolstikhin, Neil Houlsby, Alexander Kolesnikov 0001, Lucas Beyer, Xiaohua Zhai, Thomas Unterthiner, Jessica Yung, Andreas Steiner, Daniel Keysers, Jakob Uszkoreit, Mario Lucic, Alexey Dosovitskiy. 24261-24272 [doi]

A Framework to Learn with InterpretationJayneel Parekh, Pavlo Mozharovskyi, Florence d'Alché-Buc. 24273-24285 [doi]

One Loss for All: Deep Hashing with a Single Cosine Similarity based Learning ObjectiveJiun Tian Hoe, Kam Woh Ng, Tianyu Zhang, Chee Seng Chan, Yi-Zhe Song, Tao Xiang. 24286-24298 [doi]

Fast and accurate randomized algorithms for low-rank tensor decompositionsLinjian Ma, Edgar Solomonik. 24299-24312 [doi]

Communication-efficient SGD: From Local SGD to One-Shot AveragingArtin Spiridonoff, Alex Olshevsky, Yannis Paschalidis. 24313-24326 [doi]

Memory Efficient Meta-Learning with Large ImagesJohn Bronskill, Daniela Massiceti, Massimiliano Patacchiola, Katja Hofmann, Sebastian Nowozin, Richard Turner. 24327-24339 [doi]

On the Power of Differentiable Learning versus PAC and SQ LearningEmmanuel Abbe, Pritish Kamath, Eran Malach, Colin Sandon, Nathan Srebro. 24340-24351 [doi]

Can we globally optimize cross-validation loss? Quasiconvexity in ridge regressionWilliam T. Stephenson, Zachary Frangella, Madeleine Udell, Tamara Broderick. 24352-24364 [doi]

Adaptive Proximal Gradient Methods for Structured Neural NetworksJihun Yun, Aurelie C. Lozano, Eunho Yang. 24365-24378 [doi]

Discovering and Achieving Goals via World ModelsRussell Mendonca, Oleh Rybkin, Kostas Daniilidis, Danijar Hafner, Deepak Pathak. 24379-24391 [doi]

Understanding and Improving Early Stopping for Learning with Noisy LabelsYingbin Bai, Erkun Yang, Bo Han 0003, Yanhua Yang, Jiatong Li, Yinian Mao, Gang Niu 0001, Tongliang Liu. 24392-24403 [doi]

Distributionally Robust Imitation LearningMohammad Ali Bashiri, Brian D. Ziebart, Xinhua Zhang. 24404-24417 [doi]

On the Power of Edge Independent Graph ModelsSudhanshu Chanpuriya, Cameron Musco, Konstantinos Sotiropoulos, Charalampos E. Tsourakakis. 24418-24429 [doi]

Stochastic Online Linear Regression: the Forward Algorithm to Replace RidgeReda Ouhamma, Odalric-Ambrym Maillard, Vianney Perchet. 24430-24441 [doi]

Dr Jekyll & Mr Hyde: the strange case of off-policy policy updatesRomain Laroche, Remi Tachet des Combes. 24442-24454 [doi]

Understanding Adaptive, Multiscale Temporal Integration In Deep Speech Recognition SystemsMenoua Keshishian, Samuel Norman-Haignere, Nima Mesgarani. 24455-24467 [doi]

VidLanKD: Improving Language Understanding via Video-Distilled Knowledge TransferZineng Tang, Jaemin Cho 0001, Hao Tan, Mohit Bansal. 24468-24481 [doi]

Detecting Individual Decision-Making Style: Exploring Behavioral Stylometry in ChessReid McIlroy-Young, Yu Wang, Siddhartha Sen 0001, Jon M. Kleinberg, Ashton Anderson. 24482-24497 [doi]

Coupled Gradient Estimators for Discrete Latent VariablesZhe Dong, Andriy Mnih, George Tucker. 24498-24508 [doi]

AutoGEL: An Automated Graph Neural Network with Explicit Link InformationZhili Wang, Shimin Di, Lei Chen. 24509-24522 [doi]

RL for Latent MDPs: Regret Guarantees and a Lower BoundJeongyeol Kwon, Yonathan Efroni, Constantine Caramanis, Shie Mannor. 24523-24534 [doi]

Adaptive Sampling for Minimax Fair ClassificationShubhanshu Shekhar, Greg Fields, Mohammad Ghavamzadeh, Tara Javidi. 24535-24544 [doi]

Structured in Space, Randomized in Time: Leveraging Dropout in RNNs for Efficient TrainingAnup Sarma, Sonali Singh, Huaipan Jiang, Rui Zhang 0037, Mahmut T. Kandemir, Chita R. Das. 24545-24555 [doi]

Variational Continual Bayesian Meta-LearningQiang Zhang 0026, Jinyuan Fang, Zaiqiao Meng, Shangsong Liang, Emine Yilmaz. 24556-24568 [doi]

Recognizing Vector Graphics without RasterizationXinyang Jiang, Lu Liu, Caihua Shan, Yifei Shen, Xuanyi Dong, Dongsheng Li 0002. 24569-24580 [doi]

On Episodes, Prototypical Networks, and Few-Shot LearningSteinar Laenen, Luca Bertinetto. 24581-24592 [doi]

Pointwise Bounds for Distribution Estimation under Communication ConstraintsWei-Ning Chen, Peter Kairouz, Ayfer Özgür. 24593-24603 [doi]

CHIP: CHannel Independence-based Pruning for Compact Neural NetworksYang Sui, Miao Yin, Yi Xie 0001, Huy Phan, Saman A. Zonouz, Bo Yuan 0001. 24604-24616 [doi]

Federated Split Task-Agnostic Vision Transformer for COVID-19 CXR DiagnosisSangjoon Park, Gwanghyun Kim, Jeongsol Kim, Boah Kim, Jong Chul Ye. 24617-24630 [doi]

Active Offline Policy SelectionKsenia Konyushkova, Yutian Chen, Thomas Paine, Çaglar Gülçehre, Cosmin Paduraru, Daniel J. Mankowitz, Misha Denil, Nando de Freitas. 24631-24644 [doi]

Unsupervised Representation Transfer for Small Networks: I Believe I Can Distill On-the-FlyHee Min Choi, Hyoa Kang, Dokwan Oh. 24645-24658 [doi]

Understanding Bandits with Graph FeedbackHoushuang Chen, Zengfeng Huang, Shuai Li 0010, Chihao Zhang 0001. 24659-24669 [doi]

Information-theoretic generalization bounds for black-box learning algorithmsHrayr Harutyunyan, Maxim Raginsky, Greg Ver Steeg, Aram Galstyan. 24670-24682 [doi]

Trash or Treasure? An Interactive Dual-Stream Strategy for Single Image Reflection SeparationQiming Hu, Xiaojie Guo 0001. 24683-24694 [doi]

Rot-Pro: Modeling Transitivity by Projection in Knowledge Graph EmbeddingTengwei Song, Jie Luo 0004, Lei Huang. 24695-24706 [doi]

Planning from Pixels in Environments with Combinatorially Hard Search SpacesMarco Bagatella, Miroslav Olsák, Michal Rolínek, Georg Martius. 24707-24718 [doi]

PLUGIn: A simple algorithm for inverting generative models with recovery guaranteesBabhru Joshi, Xiaowei Li 0008, Yaniv Plan, Özgür Yilmaz. 24719-24729 [doi]

Modular Gaussian Processes for Transfer LearningPablo Moreno-Muñoz, Antonio Artés-Rodríguez, Mauricio A. Álvarez. 24730-24740 [doi]

Neural Human Performer: Learning Generalizable Radiance Fields for Human Performance RenderingYoungjoong Kwon, Dahun Kim, Duygu Ceylan, Henry Fuchs. 24741-24752 [doi]

Locally differentially private estimation of functionals of discrete distributionsCristina Butucea, Yann Issartel. 24753-24764 [doi]

Asymptotics of representation learning in finite Bayesian neural networksJacob A. Zavatone-Veth, Abdulkadir Canatar, Benjamin S. Ruben, Cengiz Pehlevan. 24765-24777 [doi]

Adaptive Ensemble Q-learning: Minimizing Estimation Bias via Error FeedbackHang Wang, Sen Lin, Junshan Zhang. 24778-24790 [doi]

Domain Adaptation with Invariant Representation Learning: What Transformations to Learn?Petar Stojanov, Zijian Li 0001, Mingming Gong, Ruichu Cai, Jaime G. Carbonell, Kun Zhang 0001. 24791-24803 [doi]

CSDI: Conditional Score-based Diffusion Models for Probabilistic Time Series ImputationYusuke Tashiro, Jiaming Song, Yang Song 0011, Stefano Ermon. 24804-24816 [doi]

Causal Bandits with Unknown Graph StructureYangyi Lu, Amirhossein Meisami, Ambuj Tewari. 24817-24828 [doi]

Piper: Multidimensional Planner for DNN ParallelizationJakub Tarnawski, Deepak Narayanan, Amar Phanishayee. 24829-24840 [doi]

Causal Effect Inference for Structured TreatmentsJean Kaddour, Yuchen Zhu, Qi Liu, Matt J. Kusner, Ricardo Silva. 24841-24854 [doi]

Efficient hierarchical Bayesian inference for spatio-temporal regression models in neuroimagingAli Hashemi 0001, Yijing Gao, Chang Cai, Sanjay Ghosh, Klaus-Robert Müller, Srikantan Nagarajan, Stefan Haufe. 24855-24870 [doi]

Topological Attention for Time Series ForecastingSebastian Zeng, Florian Graf, Christoph Hofer, Roland Kwitt. 24871-24882 [doi]

Local Signal Adaptivity: Provable Feature Learning in Neural Networks Beyond KernelsStefani Karp, Ezra Winston, Yuanzhi Li, Aarti Singh. 24883-24897 [doi]

IA-RED$^2$: Interpretability-Aware Redundancy Reduction for Vision TransformersBowen Pan, Rameswar Panda, Yifan Jiang 0001, Zhangyang Wang, Rogério Feris, Aude Oliva. 24898-24911 [doi]

Symbolic Regression via Deep Reinforcement Learning Enhanced Genetic Programming SeedingT. Nathan Mundhenk, Mikel Landajuela, Ruben Glatt, Cláudio P. Santiago, Daniel M. Faissol, Brenden K. Petersen. 24912-24923 [doi]

Choose a Transformer: Fourier or GalerkinShuhao Cao. 24924-24940 [doi]

A Causal Lens for Controllable Text GenerationZhiting Hu, Li Erran Li. 24941-24955 [doi]

Differentially Private Multi-Armed Bandits in the Shuffle ModelJay Tenenbaum, Haim Kaplan, Yishay Mansour, Uri Stemmer. 24956-24967 [doi]

Dual Adaptivity: A Universal Algorithm for Minimizing the Adaptive Regret of Convex FunctionsLijun Zhang 0005, Guanghui Wang 0006, Wei-Wei Tu, Wei Jiang, Zhi-Hua Zhou. 24968-24980 [doi]

Learning Hard Optimization Problems: A Data Generation PerspectiveJames Kotary, Ferdinando Fioretto, Pascal Van Hentenryck. 24981-24992 [doi]

Canonical Capsules: Self-Supervised Capsules in Canonical PoseWeiwei Sun, Andrea Tagliasacchi, Boyang Deng, Sara Sabour, Soroosh Yazdani, Geoffrey E. Hinton, Kwang Moo Yi. 24993-25005 [doi]

Characterizing Generalization under Out-Of-Distribution Shifts in Deep Metric LearningTimo Milbich, Karsten Roth, Samarth Sinha, Ludwig Schmidt, Marzyeh Ghassemi, Bjorn Ommer. 25006-25018 [doi]

Dynamics-regulated kinematic policy for egocentric pose estimationZhengyi Luo 0002, Ryo Hachiuma, Ye Yuan 0007, Kris Kitani. 25019-25032 [doi]

Never Go Full Batch (in Stochastic Convex Optimization)Idan Amir, Yair Carmon, Tomer Koren, Roi Livni. 25033-25043 [doi]

Collaborative Learning in the Jungle (Decentralized, Byzantine, Heterogeneous, Asynchronous and Nonconvex Learning)El Mahdi El Mhamdi, Sadegh Farhadkhani, Rachid Guerraoui, Arsany Guirguis, Lê Nguyên Hoang, Sébastien Rouault. 25044-25057 [doi]

Not All Low-Pass Filters are Robust in Graph Convolutional NetworksHeng Chang, Yu Rong, Tingyang Xu, Yatao Bian, Shiji Zhou, Xin Wang, JunZhou Huang, Wenwu Zhu 0001. 25058-25071 [doi]

Counterfactual Maximum Likelihood Estimation for Training Deep NetworksXinyi Wang, Wenhu Chen, Michael Saxon, William Yang Wang. 25072-25085 [doi]

Robust Optimization for Multilingual Translation with Imbalanced DataXian Li, Hongyu Gong. 25086-25099 [doi]

A/B/n Testing with Control in the Presence of SubpopulationsYoan Russac, Christina Katsimerou, Dennis Bohle, Olivier Cappé, Aurélien Garivier, Wouter M. Koolen. 25100-25110 [doi]

Using Random Effects to Account for High-Cardinality Categorical Features and Repeated Measures in Deep Neural NetworksGiora Simchoni, Saharon Rosset. 25111-25122 [doi]

Learning Debiased Representation via Disentangled Feature AugmentationJungsoo Lee, Eungyeup Kim, Juyoung Lee, Jihyeon Lee, Jaegul Choo. 25123-25133 [doi]

Scallop: From Probabilistic Deductive Databases to Scalable Differentiable ReasoningJiani Huang, Ziyang Li, Binghong Chen, Karan Samel, Mayur Naik, Le Song, Xujie Si. 25134-25145 [doi]

Learning to Synthesize Programs as Interpretable and Generalizable PoliciesDweep Trivedi, Jesse Zhang, Shao-Hua Sun, Joseph J. Lim. 25146-25163 [doi]

The functional specialization of visual cortex emerges from training parallel pathways with self-supervised predictive learningShahab Bakhtiari, Patrick J. Mineault, Timothy P. Lillicrap, Christopher C. Pack, Blake Richards. 25164-25178 [doi]

Adversarial Training Helps Transfer Learning via Better RepresentationsZhun Deng, Linjun Zhang, Kailas Vodrahalli, Kenji Kawaguchi, James Y. Zou. 25179-25191 [doi]

Improving Coherence and Consistency in Neural Sequence Models with Dual-System, Neuro-Symbolic ReasoningMaxwell I. Nye, Michael Henry Tessler, Joshua B. Tenenbaum, Brenden M. Lake. 25192-25204 [doi]

Learning the optimal Tikhonov regularizer for inverse problemsGiovanni S. Alberti, Ernesto De Vito, Matti Lassas, Luca Ratti, Matteo Santacesaria. 25205-25216 [doi]

NovelD: A Simple yet Effective Exploration CriterionTianjun Zhang, Huazhe Xu, Xiaolong Wang 0004, Yi Wu, Kurt Keutzer, Joseph E. Gonzalez, Yuandong Tian. 25217-25230 [doi]

On Margin-Based Cluster Recovery with Oracle QueriesMarco Bressan 0002, Nicolò Cesa-Bianchi, Silvio Lattanzi, Andrea Paudice. 25231-25243 [doi]

Multi-Scale Representation Learning on ProteinsVignesh Ram Somnath, Charlotte Bunne, Andreas Krause. 25244-25255 [doi]

Sparse Quadratic Optimisation over the Stiefel Manifold with Application to Permutation SynchronisationFlorian Bernard, Daniel Cremers, Johan Thunberg. 25256-25266 [doi]

Second-Order Neural ODE OptimizerGuan-Horng Liu, Tianrong Chen, Evangelos A. Theodorou. 25267-25279 [doi]

Graph Neural Networks with Local Graph ParametersPablo Barceló, Floris Geerts, Juan L. Reutter, Maksimilian Ryschkov. 25280-25293 [doi]

Closing the Gap: Tighter Analysis of Alternating Stochastic Gradient Methods for Bilevel ProblemsTianyi Chen, Yuejiao Sun, Wotao Yin. 25294-25307 [doi]

Dense Unsupervised Learning for Video SegmentationNikita Araslanov, Simone Schaub-Meyer, Stefan Roth 0001. 25308-25319 [doi]

Charting and Navigating the Space of Solutions for Recurrent Neural NetworksElia Turner, Kabir V. Dabholkar, Omri Barak. 25320-25333 [doi]

Fast Training Method for Stochastic Compositional Optimization ProblemsHongchang Gao, Heng Huang. 25334-25345 [doi]

Dual-stream Network for Visual RecognitionMingyuan Mao, Peng Gao, Renrui Zhang, Honghui Zheng, Teli Ma, Yan Peng, Errui Ding, Baochang Zhang, Shumin Han. 25346-25358 [doi]

Estimating High Order Gradients of the Data Distribution by DenoisingChenlin Meng, Yang Song 0011, Wenzhe Li, Stefano Ermon. 25359-25369 [doi]

Machine versus Human Attention in Deep Reinforcement Learning TasksSihang Guo, Ruohan Zhang, Bo Liu, Yifeng Zhu, Dana H. Ballard, Mary M. Hayhoe, Peter Stone. 25370-25385 [doi]

Reusing Combinatorial Structure: Faster Iterative Projections over Submodular Base PolytopesJai Moondra, Hassan Mortagy, Swati Gupta. 25386-25399 [doi]

Constrained Optimization to Train Neural Networks on Critical and Under-Represented ClassesSara Sangalli, Ertunc Erdil, Andreas M. Hötker, Olivio Donati, Ender Konukoglu. 25400-25411 [doi]

Collapsed Variational Bounds for Bayesian Neural NetworksMarcin Tomczak, Siddharth Swaroop, Andrew Y. K. Foong, Richard E. Turner. 25412-25426 [doi]

Consistent Estimation for PCA and Sparse Regression with Oblivious OutliersTommaso d'Orsi, Chih-Hung Liu 0001, Rajai Nasser, Gleb Novikov, David Steurer, Stefan Tiegel. 25427-25438 [doi]

Offline Constrained Multi-Objective Reinforcement Learning via Pessimistic Dual Value IterationRunzhe Wu, Yufeng Zhang 0007, Zhuoran Yang, Zhaoran Wang. 25439-25451 [doi]

Absolute Neighbour Difference based Correlation Test for Detecting Heteroscedastic RelationshipsLifeng Zhang. 25452-25462 [doi]

Batch Multi-Fidelity Bayesian Optimization with Deep Auto-Regressive NetworksShibo Li, Robert M. Kirby, Shandian Zhe. 25463-25475 [doi]

Mastering Atari Games with Limited DataWeirui Ye, Shaohuai Liu, Thanard Kurutach, Pieter Abbeel, Yang Gao. 25476-25488 [doi]

Dealing With Misspecification In Fixed-Confidence Linear Top-m IdentificationClémence Réda, Andrea Tirinzoni, Rémy Degenne. 25489-25501 [doi]

Why Generalization in RL is Difficult: Epistemic POMDPs and Implicit Partial ObservabilityDibya Ghosh, Jad Rahme, Aviral Kumar, Amy Zhang 0001, Ryan P. Adams, Sergey Levine. 25502-25515 [doi]

Set Prediction in the Latent SpaceKonpat Preechakul, Chawan Piansaddhayanon, Burin Naowarat, Tirasan Khandhawit, Sira Sriswasdi, Ekapol Chuangsuwanich. 25516-25527 [doi]

Best of Both Worlds: Practical and Theoretically Optimal Submodular Maximization in ParallelYixin Chen, Tonmoy Dey, Alan Kuhnle. 25528-25539 [doi]

Fine-grained Generalization Analysis of Inductive Matrix CompletionAntoine Ledent, Rodrigo Alves, Yunwen Lei, Marius Kloft. 25540-25552 [doi]

Learning Frequency Domain Approximation for Binary Neural NetworksYixing Xu, Kai Han, Chang Xu 0002, Yehui Tang, Chunjing Xu, Yunhe Wang 0001. 25553-25565 [doi]

Reformulating Zero-shot Action Recognition for Multi-label ActionsAlec Kerrigan, Kevin Duarte, Yogesh S. Rawat, Mubarak Shah. 25566-25577 [doi]

Optimal Best-Arm Identification Methods for Tail-Risk MeasuresShubhada Agrawal, Wouter M. Koolen, Sandeep Juneja. 25578-25590 [doi]

SyMetric: Measuring the Quality of Learnt Hamiltonian Dynamics Inferred from VisionIrina Higgins, Peter Wirnsberger, Andrew Jaegle, Aleksandar Botev. 25591-25605 [doi]

Learning with Holographic Reduced RepresentationsAshwinkumar Ganesan, Hang Gao, Sunil Gandhi, Edward Raff, Tim Oates, James Holt, Mark McLean. 25606-25620 [doi]

Learning Barrier Certificates: Towards Safe Reinforcement Learning with Zero Training-time ViolationsYuping Luo, Tengyu Ma 0001. 25621-25632 [doi]

On the Second-order Convergence Properties of Random Search MethodsAurélien Lucchi, Antonio Orvieto, Adamos Solomou. 25633-25645 [doi]

Noether's Learning Dynamics: Role of Symmetry Breaking in Neural NetworksHidenori Tanaka, Daniel Kunin. 25646-25660 [doi]

A Theory of the Distortion-Perception Tradeoff in Wasserstein SpaceDror Freirich, Tomer Michaeli, Ron Meir. 25661-25672 [doi]

Neural Production SystemsAniket Didolkar, Anirudh Goyal, Nan Rosemary Ke, Charles Blundell, Philippe Beaudoin, Nicolas Heess, Michael Mozer, Yoshua Bengio. 25673-25687 [doi]

Smoothness Matrices Beat Smoothness Constants: Better Communication Compression Techniques for Distributed OptimizationMher Safaryan, Filip Hanzely, Peter Richtárik. 25688-25702 [doi]

Increasing Liquid State Machine Performance with Edge-of-Chaos Dynamics Organized by Astrocyte-modulated PlasticityVladimir Ivanov, Konstantinos Michmizos. 25703-25719 [doi]

Fair Sortition Made TransparentBailey Flanigan, Gregory Kehne, Ariel D. Procaccia. 25720-25731 [doi]

A Max-Min Entropy Framework for Reinforcement LearningSeungyul Han, Youngchul Sung. 25732-25745 [doi]

Reward is enough for convex MDPsTom Zahavy, Brendan O'Donoghue, Guillaume Desjardins, Satinder Singh 0001. 25746-25759 [doi]

Fast Doubly-Adaptive MCMC to Estimate the Gibbs Partition Function with Weak Mixing Time BoundsShahrzad Haddadan, Yue Zhuang, Cyrus Cousins, Eli Upfal. 25760-25772 [doi]

Does enforcing fairness mitigate biases caused by subpopulation shift?Subha Maity, Debarghya Mukherjee, Mikhail Yurochkin, Yuekai Sun. 25773-25784 [doi]

Implicit Deep Adaptive Design: Policy-Based Experimental Design without LikelihoodsDesi R. Ivanova, Adam Foster, Steven Kleinegesse, Michael U. Gutmann, Thomas Rainforth. 25785-25798 [doi]

Sample-Efficient Learning of Stackelberg Equilibria in General-Sum GamesYu Bai, Chi Jin, Huan Wang, Caiming Xiong. 25799-25811 [doi]

Non-approximate Inference for Collective Graphical Models on Path Graphs via Discrete Difference of Convex AlgorithmYasunori Akagi, Naoki Marumo, Hideaki Kim, Takeshi Kurashima, Hiroyuki Toda. 25812-25823 [doi]

Implicit Task-Driven Probability Discrepancy Measure for Unsupervised Domain AdaptationMao Li, Kaiqi Jiang, Xinhua Zhang. 25824-25838 [doi]

SBO-RNN: Reformulating Recurrent Neural Networks via Stochastic Bilevel OptimizationZiming Zhang, Yun Yue, Guojun Wu, Yanhua Li, Haichong K. Zhang. 25839-25851 [doi]

Navigating to the Best Policy in Markov Decision ProcessesAymen Al Marjani, Aurélien Garivier, Alexandre Proutière. 25852-25864 [doi]

A Faster Decentralized Algorithm for Nonconvex Minimax ProblemsWenhan Xian, Feihu Huang, Yanfu Zhang, Heng Huang. 25865-25877 [doi]

Generalization Bounds For Meta-Learning: An Information-Theoretic AnalysisQi Chen, Changjian Shui, Mario Marchand. 25878-25890 [doi]

ReLU Regression with Massart NoiseIlias Diakonikolas, Jong Ho Park, Christos Tzamos. 25891-25903 [doi]

Identification of the Generalized Condorcet Winner in Multi-dueling BanditsBjörn Haddenhorst, Viktor Bengs, Eyke Hüllermeier. 25904-25916 [doi]

Robust Inverse Reinforcement Learning under Transition Dynamics MismatchLuca Viano, Yu-Ting Huang, Parameswaran Kamalaruban, Adrian Weller, Volkan Cevher. 25917-25931 [doi]

Re-ranking for image retrieval and transductive few-shot classificationXi Shen, Yang Xiao 0009, Shell Xu Hu, Othman Sbai, Mathieu Aubry. 25932-25943 [doi]

Post-processing for Individual FairnessFelix Petersen, Debarghya Mukherjee, Yuekai Sun, Mikhail Yurochkin. 25944-25955 [doi]

OpenMatch: Open-Set Semi-supervised Learning with Open-set Consistency RegularizationKuniaki Saito, Donghyun Kim, Kate Saenko. 25956-25967 [doi]

End-to-End Training of Multi-Document Reader and Retriever for Open-Domain Question AnsweringDevendra Singh Sachan, Siva Reddy, William L. Hamilton, Chris Dyer, Dani Yogatama. 25968-25981 [doi]

Fast Algorithms for $L_\infty$-constrained S-rectangular Robust MDPsBahram Behzadian, Marek Petrik, Chin Pang Ho. 25982-25992 [doi]

Instance-optimal Mean Estimation Under Differential PrivacyZiyue Huang, Yuting Liang, Ke Yi 0001. 25993-26004 [doi]

Look at the Variance! Efficient Black-box Explanations with Sobol-based Sensitivity AnalysisThomas Fel, Rémi Cadène, Mathieu Chalvidal, Matthieu Cord, David Vigouroux, Thomas Serre. 26005-26014 [doi]

PatchGame: Learning to Signal Mid-level Patches in Referential GamesKamal Gupta 0002, Gowthami Somepalli, Anubhav Gupta, Vinoj Yasanga Jayasundara Magalle Hewa, Matthias Zwicker, Abhinav Shrivastava. 26015-26027 [doi]

Implicit Generative CopulasTim Janke, Mohamed Ghanmi, Florian Steinke. 26028-26039 [doi]

Tensor Normal Training for Deep Learning ModelsYi Ren 0007, Donald Goldfarb. 26040-26052 [doi]

Unintended Selection: Persistent Qualification Rate Disparities and InterventionsReilly Raab, Yang Liu 0018. 26053-26065 [doi]

Revisiting 3D Object Detection From an Egocentric PerspectiveBoyang Deng, Charles R. Qi, Mahyar Najibi, Thomas A. Funkhouser, Yin Zhou, Dragomir Anguelov. 26066-26079 [doi]

Optimizing Information-theoretical Generalization Bound via Anisotropic Noise of SGLDBohan Wang, Huishuai Zhang, Jieyu Zhang, Qi Meng, Wei Chen 0034, Tie-Yan Liu. 26080-26090 [doi]

Addressing Algorithmic Disparity and Performance Inconsistency in Federated LearningSen Cui, Weishen Pan, Jian Liang, Changshui Zhang, Fei Wang 0001. 26091-26102 [doi]

A Mathematical Framework for Quantifying Transferability in Multi-source Transfer LearningXinyi Tong, Xiangxiang Xu 0001, Shao-Lun Huang, Lizhong Zheng. 26103-26116 [doi]

Morié Attack (MA): A New Potential Risk of Screen PhotosDantong Niu, Ruohao Guo, Yisen Wang 0001. 26117-26129 [doi]

Fast Bayesian Inference for Gaussian Cox Processes via Path Integral FormulationHideaki Kim. 26130-26142 [doi]

Lattice partition recovery with dyadic CARTOscar Hernan Madrid Padilla, Yi Yu, Alessandro Rinaldo. 26143-26155 [doi]

Robust Deep Reinforcement Learning through Adversarial LossTuomas P. Oikarinen, Wang Zhang, Alexandre Megretski, Luca Daniel, Tsui-Wei Weng. 26156-26167 [doi]

Provable Model-based Nonlinear Bandit and Reinforcement Learning: Shelve Optimism, Embrace Virtual CurvatureKefan Dong, Jiaqi Yang, Tengyu Ma 0001. 26168-26182 [doi]

You Only Look at One Sequence: Rethinking Transformer in Vision through Object DetectionYuxin Fang, Bencheng Liao, Xinggang Wang, Jiemin Fang, Jiyang Qi, Rui Wu, Jianwei Niu 0004, Wenyu Liu 0001. 26183-26197 [doi]

Learning to delegate for large-scale vehicle routingSirui Li, Zhongxia Yan 0001, Cathy Wu 0002. 26198-26211 [doi]

Effective Meta-Regularization by Kernelized Proximal RegularizationWeisen Jiang, James Kwok, Yu Zhang 0006. 26212-26222 [doi]

Towards Context-Agnostic Learning Using Synthetic DataCharles Jin, Martin C. Rinard. 26223-26236 [doi]

Minimax Optimal Quantile and Semi-Adversarial Regret via Root-Logarithmic RegularizersJeffrey Negrea, Blair Bilodeau, Nicolò Campolongo, Francesco Orabona, Dan Roy. 26237-26249 [doi]

Gradient-Free Adversarial Training Against Image Corruption for Learning-based SteeringYu Shen, Laura Y. Zheng, Manli Shu, Weizi Li, Tom Goldstein, Ming C. Lin. 26250-26263 [doi]

Deep Proxy Causal Learning and its Application to Confounded Bandit Policy EvaluationLiyuan Xu, Heishiro Kanagawa, Arthur Gretton. 26264-26275 [doi]

Certifying Robustness to Programmable Data Bias in Decision TreesAnna P. Meyer, Aws Albarghouthi, Loris D'Antoni. 26276-26288 [doi]

TöRF: Time-of-Flight Radiance Fields for Dynamic Scene View SynthesisBenjamin Attal, Eliot Laidlaw, Aaron Gokaslan, Changil Kim 0001, Christian Richardt, James Tompkin, Matthew O'Toole. 26289-26301 [doi]

Sequence-to-Sequence Learning with Latent Neural GrammarsYoon Kim. 26302-26317 [doi]

Exploration-Exploitation in Multi-Agent Competition: Convergence with Bounded RationalityStefanos Leonardos, Georgios Piliouras, Kelly Spendlove. 26318-26331 [doi]

Low-Rank Extragradient Method for Nonsmooth and Low-Rank Matrix Optimization ProblemsAtara Kaplan, Dan Garber. 26332-26344 [doi]

Which Mutual-Information Representation Learning Objectives are Sufficient for Control?Kate Rakelly, Abhishek Gupta, Carlos Florensa, Sergey Levine. 26345-26357 [doi]

A Geometric Perspective towards Neural Calibration via Sensitivity DecompositionJunjiao Tian, Dylan Yung, Yen-Chang Hsu, Zsolt Kira. 26358-26369 [doi]

Towards a Unified Information-Theoretic Framework for GeneralizationMahdi Haghifam, Gintare Karolina Dziugaite, Shay Moran, Dan Roy. 26370-26381 [doi]

Bayesian decision-making under misspecified priors with applications to meta-learningMax Simchowitz, Christopher Tosh, Akshay Krishnamurthy, Daniel J. Hsu, Thodoris Lykouris, Miroslav Dudík, Robert E. Schapire. 26382-26394 [doi]

Neural Trees for Learning on GraphsRajat Talak, Siyi Hu, Lisa Peng, Luca Carlone. 26395-26408 [doi]

Enabling Fast Differentially Private SGD via Just-in-Time Compilation and VectorizationPranav Subramani, Nicholas Vadivelu, Gautam Kamath 0001. 26409-26421 [doi]

The effectiveness of feature attribution methods and its correlation with automatic evaluation scoresGiang Nguyen 0004, Daeyoung Kim 0001, Anh Nguyen. 26422-26436 [doi]

Coordinated Proximal Policy OptimizationZifan Wu, Chao Yu, Deheng Ye, Junge Zhang, Haiyin Piao, Hankz Hankui Zhuo. 26437-26448 [doi]

Unbiased Classification through Bias-Contrastive and Bias-Balanced LearningYoungkyu Hong, Eunho Yang. 26449-26461 [doi]

Learning from Inside: Self-driven Siamese Sampling and Reasoning for Video Question AnsweringWeijiang Yu, Haoteng Zheng, Mengfei Li, Lei Ji, Lijun Wu, Nong Xiao, Nan Duan. 26462-26474 [doi]

Identification and Estimation of Joint Probabilities of Potential Outcomes in Observational Studies with Covariate InformationRyusei Shingaki, Manabu Kuroki. 26475-26486 [doi]

Online false discovery rate control for anomaly detection in time seriesQuentin Rebjock, Baris Kurt, Tim Januschowski, Laurent Callot. 26487-26498 [doi]

Pragmatic Image Compression for Human-in-the-Loop Decision-MakingSid Reddy, Anca Dragan, Sergey Levine. 26499-26510 [doi]

Generalized Linear Bandits with Local Differential PrivacyYuxuan Han, Zhipeng Liang, Yang Wang 0020, Jiheng Zhang. 26511-26522 [doi]

On the Algorithmic Stability of Adversarial TrainingYue Xing, Qifan Song, Guang Cheng. 26523-26535 [doi]

Width-based Lookaheads with Learnt Base Policies and Heuristics Over the Atari-2600 BenchmarkStefan O'Toole, Nir Lipovetzky, Miquel Ramírez, Adrian R. Pearce. 26536-26547 [doi]

Characterizing possible failure modes in physics-informed neural networksAditi S. Krishnapriyan, Amir Gholami, Shandian Zhe, Robert M. Kirby, Michael W. Mahoney. 26548-26560 [doi]

Artistic Style Transfer with Internal-external Learning and Contrastive LearningHaibo Chen 0006, Lei Zhao, Zhizhong Wang, Huiming Zhang, Zhiwen Zuo, Ailin Li, Wei Xing, Dongming Lu. 26561-26573 [doi]

Fast Abductive Learning by Similarity-based Consistency OptimizationYu-Xuan Huang, Wang-Zhou Dai, Le-Wen Cai, Stephen H. Muggleton, Yuan Jiang 0001. 26574-26584 [doi]

To Beam Or Not To Beam: That is a Question of Cooperation for Language GANsThomas Scialom, Paul-Alexis Dray, Jacopo Staiano, Sylvain Lamprier, Benjamin Piwowarski. 26585-26597 [doi]

Shapley Residuals: Quantifying the limits of the Shapley value for explanationsIndra Kumar, Carlos Scheidegger, Suresh Venkatasubramanian, Sorelle A. Friedler. 26598-26608 [doi]

The Elastic Lottery Ticket HypothesisXiaohan Chen, Yu Cheng 0001, Shuohang Wang, Zhe Gan, Jingjing Liu 0001, Zhangyang Wang. 26609-26621 [doi]

Joint Inference for Neural Network Depth and Dropout RegularizationKishan K. C, Rui Li, MohammadMahdi Gilany. 26622-26634 [doi]

Tractable Density Estimation on Learned Manifolds with Conformal Embedding FlowsBrendan Leigh Ross, Jesse C. Cresswell. 26635-26648 [doi]

The Limits of Optimal Pricing in the DarkQuinlan Dawkins, Minbiao Han, Haifeng Xu. 26649-26660 [doi]

No RL, No Simulation: Learning to Navigate without NavigatingMeera Hahn, Devendra Singh Chaplot, Shubham Tulsiani, Mustafa Mukadam, James M. Rehg, Abhinav Gupta 0001. 26661-26673 [doi]

Analogous to Evolutionary Algorithm: Designing a Unified Sequence ModelJiangning Zhang, Chao Xu, Jian Li, Wenzhou Chen, Yabiao Wang, Ying Tai, Shuo Chen 0003, Chengjie Wang, Feiyue Huang, Yong Liu. 26674-26688 [doi]

Improving Compositionality of Neural Networks by Decoding Representations to InputsMike Wu, Noah Goodman, Stefano Ermon. 26689-26700 [doi]

The Hardness Analysis of Thompson Sampling for Combinatorial Semi-bandits with Greedy OracleFang Kong 0002, Yueran Yang, Wei Chen 0013, Shuai Li 0010. 26701-26713 [doi]

Universal Semi-Supervised LearningZhuo Huang, Chao Xue, Bo Han 0003, Jian Yang 0003, Chen Gong 0002. 26714-26725 [doi]

Improving Deep Learning Interpretability by Saliency Guided TrainingAya Abdelsalam Ismail, Héctor Corrada Bravo, Soheil Feizi. 26726-26739 [doi]

SurvITE: Learning Heterogeneous Treatment Effects from Time-to-Event DataAlicia Curth, ChangHee Lee, Mihaela van der Schaar. 26740-26753 [doi]

Optimal Rates for Nonparametric Density Estimation under Communication ConstraintsJayadev Acharya, Clément L. Canonne, Aditya Vikram Singh, Himanshu Tyagi. 26754-26766 [doi]

Rank Overspecified Robust Matrix Recovery: Subgradient Method and Exact RecoveryLijun Ding, Liwei Jiang, Yudong Chen 0001, Qing Qu 0001, Zhihui Zhu. 26767-26778 [doi]

Improving Computational Efficiency in Visual Reinforcement Learning via Stored EmbeddingsLili Chen, Kimin Lee, Aravind Srinivas, Pieter Abbeel. 26779-26791 [doi]

Learning Generalized Gumbel-max Causal MechanismsGuy Lorberbom, Daniel D. Johnson 0001, Chris J. Maddison, Daniel Tarlow, Tamir Hazan. 26792-26803 [doi]

Bandit Learning with Delayed Impact of ActionsWei Tang, Chien-Ju Ho, Yang Liu 0018. 26804-26817 [doi]

A Stochastic Newton Algorithm for Distributed Convex OptimizationBrian Bullins, Kumar Kshitij Patel, Ohad Shamir, Nathan Srebro, Blake E. Woodworth. 26818-26830 [doi]

Are Transformers more robust than CNNs?Yutong Bai, Jieru Mei, Alan L. Yuille, Cihang Xie. 26831-26843 [doi]

Towards Sharper Generalization Bounds for Structured PredictionShaojie Li, Yong Liu. 26844-26857 [doi]

Automated Discovery of Adaptive Attacks on Adversarial DefensesChengyuan Yao, Pavol Bielik, Petar Tsankov, Martin T. Vechev. 26858-26870 [doi]

PolarStream: Streaming Object Detection and Segmentation with Polar PillarsQi Chen, Sourabh Vora, Oscar Beijbom. 26871-26883 [doi]

Representation Costs of Linear Neural Networks: Analysis and DesignZhen Dai, Mina Karzand, Nathan Srebro. 26884-26896 [doi]

Teaching via Best-Case Counterexamples in the Learning-with-Equivalence-Queries ParadigmAkash Kumar 0006, Yuxin Chen 0001, Adish Singla. 26897-26910 [doi]

Distilling Meta Knowledge on Heterogeneous Graph for Illicit Drug Trafficker Detection on Social MediaYiyue Qian, Yiming Zhang 0002, Yanfang Ye, Chuxu Zhang. 26911-26923 [doi]

Curriculum Disentangled Recommendation with Noisy Multi-feedbackHong Chen, Yudong Chen 0003, Xin Wang 0019, Ruobing Xie, Rui Wang 0068, Feng Xia 0006, Wenwu Zhu 0001. 26924-26936 [doi]

Interpretable agent communication from scratch (with a generic visual processor emerging on the side)Roberto Dessì, Eugene Kharitonov, Marco Baroni. 26937-26949 [doi]

MAU: A Motion-Aware Unit for Video Prediction and BeyondZheng Chang 0002, Xinfeng Zhang 0001, Shanshe Wang, Siwei Ma, Yan Ye, Xiang Xinguang, Wen Gao 0001. 26950-26962 [doi]

Successor Feature Landmarks for Long-Horizon Goal-Conditioned Reinforcement LearningChristopher Hoang, Sungryull Sohn, Jongwook Choi, Wilka Carvalho, Honglak Lee. 26963-26975 [doi]

Streaming Belief Propagation for Community DetectionYuchen Wu, Jakab Tardos, MohammadHossein Bateni, André Linhares, Filipe Miguel Gonçalves de Almeida, Andrea Montanari, Ashkan Norouzi-Fard. 26976-26988 [doi]

The staircase property: How hierarchical structure can guide deep learningEmmanuel Abbe, Enric Boix-Adserà, Matthew S. Brennan, Guy Bresler, Dheeraj Nagaraj. 26989-27002 [doi]

MagNet: A Neural Network for Directed GraphsXitong Zhang, Yixuan He, Nathan Brugnone, Michael Perlmutter, Matthew J. Hirn. 27003-27015 [doi]

Hardware-adaptive Efficient Latency Prediction for NAS via Meta-LearningHayeon Lee, Sewoong Lee, Song Chong, Sung Ju Hwang. 27016-27028 [doi]

Topological Relational Learning on GraphsYuzhou Chen, Baris Coskunuzer, Yulia R. Gel. 27029-27042 [doi]

Learning Theory Can (Sometimes) Explain Generalisation in Graph Neural NetworksPascal Mattia Esser, Leena C. Vankadara, Debarghya Ghoshdastidar. 27043-27056 [doi]

Federated Linear Contextual BanditsRuiquan Huang, Weiqiang Wu, Jing Yang 0002, Cong Shen. 27057-27068 [doi]

Least Square Calibration for Peer ReviewsSijun Tan, Jibang Wu, Xiaohui Bei, Haifeng Xu. 27069-27080 [doi]

Scaling Up Exact Neural Network Compression by ReLU StabilityThiago Serra, Xin Yu 0003, Abhinav Kumar 0004, Srikumar Ramalingam. 27081-27093 [doi]

Passive attention in artificial neural networks predicts human visual selectivityThomas A. Langlois, H. Charles Zhao, Erin Grant, Ishita Dasgupta, Thomas L. Griffiths, Nori Jacoby. 27094-27106 [doi]

GRIN: Generative Relation and Intention Network for Multi-agent Trajectory PredictionLongyuan Li, Jian Yao, Li Wenliang, Tong He, Tianjun Xiao, Junchi Yan, David Wipf, Zheng Zhang 0001. 27107-27118 [doi]

Instance-Dependent Partial Label LearningNing Xu 0009, Congyu Qiao, Xin Geng, Min-Ling Zhang. 27119-27130 [doi]

Deep Learning with Label Differential PrivacyBadih Ghazi, Noah Golowich, Ravi Kumar, Pasin Manurangsi, Chiyuan Zhang. 27131-27145 [doi]

Semialgebraic Representation of Monotone Deep Equilibrium Models and Applications to CertificationTong Chen 0002, Jean B. Lasserre, Victor Magron, Edouard Pauwels. 27146-27159 [doi]

The Role of Global Labels in Few-Shot Classification and How to Infer ThemRuohan Wang, Massimiliano Pontil, Carlo Ciliberto. 27160-27170 [doi]

NeuS: Learning Neural Implicit Surfaces by Volume Rendering for Multi-view ReconstructionPeng Wang 0099, Lingjie Liu, Yuan Liu, Christian Theobalt, Taku Komura, Wenping Wang. 27171-27183 [doi]

Improved Guarantees for Offline Stochastic Matching via new Ordered Contention Resolution SchemesBrian Brubach, Nathaniel Grammel, Will Ma, Aravind Srinivasan. 27184-27195 [doi]

UFC-BERT: Unifying Multi-Modal Controls for Conditional Image SynthesisZhu Zhang, Jianxin Ma, Chang Zhou, Rui Men, Zhikang Li, Ming Ding, Jie Tang 0001, Jingren Zhou, Hongxia Yang. 27196-27208 [doi]

Is Bang-Bang Control All You Need? Solving Continuous Control with Bernoulli PoliciesTim Seyde, Igor Gilitschenski, Wilko Schwarting, Bartolomeo Stellato, Martin A. Riedmiller, Markus Wulfmeier, Daniela Rus. 27209-27221 [doi]

Improving Generalization in Meta-RL with Imaginary Tasks from Latent Dynamics MixtureSuyoung Lee, Sae-Young Chung. 27222-27235 [doi]

Localization with Sampling-ArgmaxJiefeng Li, Tong Chen, Ruiqi Shi, Yujing Lou, Yong-Lu Li, Cewu Lu. 27236-27248 [doi]

Improved Regularization and Robustness for Fine-tuning in Neural NetworksDongyue Li, Hongyang R. Zhang. 27249-27262 [doi]

BARTScore: Evaluating Generated Text as Text GenerationWeizhe Yuan, Graham Neubig, Pengfei Liu 0003. 27263-27277 [doi]

An analysis of Ermakov-Zolotukhin quadrature using kernelsAyoub Belhadji. 27278-27289 [doi]

Towards Understanding Why Lookahead Generalizes Better Than SGD and BeyondPan Zhou, Hanshu Yan, Xiaotong Yuan, Jiashi Feng, Shuicheng Yan. 27290-27304 [doi]

Online Market Equilibrium with Application to Fair DivisionYuan Gao, Alex Peysakhovich, Christian Kroer. 27305-27318 [doi]

Dynamic Resolution NetworkMingjian Zhu, Kai Han 0002, Enhua Wu, Qiulin Zhang, Ying Nie, Zhenzhong Lan, Yunhe Wang 0001. 27319-27330 [doi]

Gauge Equivariant TransformerLingshen He, Yiming Dong, Yisen Wang 0001, Dacheng Tao, Zhouchen Lin. 27331-27343 [doi]

Unsupervised Object-Based Transition Models For 3D Partially Observable EnvironmentsAntonia Creswell, Rishabh Kabra, Christopher P. Burgess, Murray Shanahan. 27344-27355 [doi]

Robust Contrastive Learning Using Negative Samples with Diminished SemanticsSongwei Ge, Shlok Mishra, Chun-Liang Li, Haohan Wang, David Jacobs. 27356-27368 [doi]

General Low-rank Matrix Optimization: Geometric Analysis and Sharper BoundsHaixiang Zhang, Yingjie Bi, Javad Lavaei. 27369-27380 [doi]

Flow Network based Generative Models for Non-Iterative Diverse Candidate GenerationEmmanuel Bengio, Moksh Jain, Maksym Korablyov, Doina Precup, Yoshua Bengio. 27381-27394 [doi]

Policy Finetuning: Bridging Sample-Efficient Offline and Online Reinforcement LearningTengyang Xie, Nan Jiang, Huan Wang, Caiming Xiong, Yu Bai. 27395-27407 [doi]

Reducing Information Bottleneck for Weakly Supervised Semantic SegmentationJungbeom Lee, Jooyoung Choi, Jisoo Mok, Sungroh Yoon. 27408-27421 [doi]

SGD: The Role of Implicit Regularization, Batch-size and Multiple-epochsAyush Sekhari, Karthik Sridharan, Satyen Kale. 27422-27433 [doi]

AC-GC: Lossy Activation Compression with Guaranteed ConvergenceR. David Evans, Tor M. Aamodt. 27434-27448 [doi]

Label Noise SGD Provably Prefers Flat Global MinimizersAlex Damian, Tengyu Ma 0001, Jason D. Lee. 27449-27461 [doi]

Can we have it all? On the Trade-off between Spatial and Adversarial Robustness of Neural NetworksSandesh Kamath, Amit Deshpande, Subrahmanyam Kambhampati Venkata, Vineeth N. Balasubramanian. 27462-27474 [doi]

Universal Off-Policy EvaluationYash Chandak, Scott Niekum, Bruno C. da Silva 0001, Erik G. Learned-Miller, Emma Brunskill, Philip S. Thomas. 27475-27490 [doi]

A Non-commutative Extension of Lee-Seung's Algorithm for Positive Semidefinite FactorizationsYong Sheng Soh, Antonios Varvitsiotis. 27491-27502 [doi]

Efficiently Identifying Task Groupings for Multi-Task LearningChris Fifty, Ehsan Amid, Zhe Zhao, Tianhe Yu, Rohan Anil, Chelsea Finn. 27503-27516 [doi]

Instance-Conditioned GANArantxa Casanova, Marlène Careil, Jakob Verbeek, Michal Drozdzal, Adriana Romero-Soriano. 27517-27529 [doi]

DeepSITH: Efficient Learning via Decomposition of What and When Across Time ScalesBrandon G. Jacques, Zoran Tiganj, Marc W. Howard, Per B. Sederberg. 27530-27541 [doi]

A Gaussian Process-Bayesian Bernoulli Mixture Model for Multi-Label Active LearningWeishi Shi, Dayou Yu, Qi Yu 0001. 27542-27554 [doi]

Differentially Private Empirical Risk Minimization under the Fairness LensCuong Tran 0007, My H. Dinh, Ferdinando Fioretto. 27555-27565 [doi]

A Unified View of cGANs with and without ClassifiersSi-An Chen, Chun-Liang Li, Hsuan-Tien Lin. 27566-27579 [doi]

Online and Offline Reinforcement Learning by Planning with a Learned ModelJulian Schrittwieser, Thomas Hubert, Amol Mandhane, Mohammadamin Barekatain, Ioannis Antonoglou, David Silver. 27580-27591 [doi]

Stochastic Multi-Armed Bandits with Control VariatesArun Verma, Manjesh Kumar Hanawal. 27592-27603 [doi]

Near-Optimal No-Regret Learning in General GamesConstantinos Daskalakis, Maxwell Fishelson, Noah Golowich. 27604-27616 [doi]

Improving Self-supervised Learning with Automated Unsupervised Outlier ArbitrationYu Wang 0102, Jingyang Lin, Jingjing Zou, Yingwei Pan, Ting Yao, Tao Mei 0001. 27617-27630 [doi]

Improving Anytime Prediction with Parallel Cascaded Networks and a Temporal-Difference LossMichael L. Iuzzolino, Michael C. Mozer, Samy Bengio. 27631-27644 [doi]

Identifiable Generative models for Missing Not at Random Data ImputationChao Ma 0019, Cheng Zhang 0005. 27645-27658 [doi]

DNN-based Topology Optimisation: Spatial Invariance and Neural Tangent KernelBenjamin Dupuis, Arthur Jacot. 27659-27669 [doi]

Baleen: Robust Multi-Hop Reasoning at Scale via Condensed RetrievalOmar Khattab, Christopher Potts, Matei A. Zaharia. 27670-27682 [doi]

Local Hyper-Flow DiffusionKimon Fountoulakis, Pan Li, Shenghao Yang 0002. 27683-27694 [doi]

Permuton-induced Chinese Restaurant ProcessMasahiro Nakano, Yasuhiro Fujiwara, Akisato Kimura, Takeshi Yamada, Naonori Ueda. 27695-27708 [doi]

Faster Algorithms and Constant Lower Bounds for the Worst-Case Expected ErrorJonah Brown-Cohen. 27709-27719 [doi]

On Learning Domain-Invariant Representations for Transfer Learning with Multiple SourcesTrung Phung, Trung Le, Long Vuong, Toan Tran, Anh Tran, Hung Bui, Dinh Q. Phung. 27720-27733 [doi]

You Never Cluster AloneYuming Shen, Ziyi Shen, Menghan Wang, Jie Qin, Philip H. S. Torr, Ling Shao 0001. 27734-27746 [doi]

Dynamic COVID risk assessment accounting for community virus exposure from a spatial-temporal transmission modelYuan Chen, Wenbo Fei, Qinxia Wang, Donglin Zeng, Yuanjia Wang. 27747-27760 [doi]

Dueling Bandits with Adversarial SleepingAadirupa Saha, Pierre Gaillard. 27761-27771 [doi]

Beware of the Simulated DAG! Causal Discovery Benchmarks May Be Easy to GameAlexander G. Reisach, Christof Seiler, Sebastian Weichwald. 27772-27784 [doi]

Automated Dynamic Mechanism DesignHanrui Zhang, Vincent Conitzer. 27785-27797 [doi]

A generative nonparametric Bayesian model for whole genomesAlan Amin, Eli N. Weinstein, Debora Marks. 27798-27812 [doi]

Robust Predictable ControlBen Eysenbach, Ruslan Salakhutdinov, Sergey Levine. 27813-27825 [doi]

Unsupervised Speech RecognitionAlexei Baevski, Wei-Ning Hsu, Alexis Conneau, Michael Auli. 27826-27839 [doi]

Robustness between the worst and average caseLeslie Rice, Anna Bair, Huan Zhang, J. Zico Kolter. 27840-27851 [doi]

Online Learning and Control of Complex Dynamical Systems from Sensory InputOumayma Bounou, Jean Ponce, Justin Carpentier. 27852-27864 [doi]

Self-Supervised Bug Detection and RepairMiltiadis Allamanis, Henry Jackson-Flux, Marc Brockschmidt. 27865-27876 [doi]

Faster Neural Network Training with Approximate Tensor OperationsMenachem Adelman, Kfir Y. Levy, Ido Hakimi, Mark Silberstein. 27877-27889 [doi]

Learning Interpretable Decision Rule Sets: A Submodular Optimization ApproachFan Yang, Kai He, Linxiao Yang, Hongxia Du, Jingbang Yang, Bo Yang 0045, Liang Sun 0001. 27890-27902 [doi]

Spatial-Temporal Super-Resolution of Satellite Imagery via Conditional Pixel SynthesisYutong He, Dingjie Wang, Nicholas Lai, William Zhang, Chenlin Meng, Marshall Burke, David B. Lobell, Stefano Ermon. 27903-27915 [doi]

On Memorization in Probabilistic Deep Generative ModelsGerrit van den Burg, Chris Williams. 27916-27928 [doi]

You Are the Best Reviewer of Your Own Papers: An Owner-Assisted Scoring MechanismWeijie J. Su. 27929-27939 [doi]

Garment4D: Garment Reconstruction from Point Cloud SequencesFangzhou Hong, Liang Pan, Zhongang Cai, Ziwei Liu. 27940-27951 [doi]

Fast Policy Extragradient Methods for Competitive Games with Entropy RegularizationShicong Cen, Yuting Wei, Yuejie Chi. 27952-27964 [doi]

Shift-Robust GNNs: Overcoming the Limitations of Localized Graph Training dataQi Zhu, Natalia Ponomareva, Jiawei Han 0001, Bryan Perozzi. 27965-27977 [doi]

RIM: Reliable Influence-based Active Learning on GraphsWentao Zhang, Yexin Wang, Zhenbang You, Meng Cao, Ping Huang, Jiulong Shan, Zhi Yang 0001, Bin Cui 0001. 27978-27990 [doi]

Dynamical Wasserstein Barycenters for Time-series ModelingKevin C. Cheng, Shuchin Aeron, Michael C. Hughes, Eric L. Miller 0001. 27991-28003 [doi]

RelaySum for Decentralized Deep Learning on Heterogeneous DataThijs Vogels, Lie He, Anastasia Koloskova, Sai Praneeth Karimireddy, Tao Lin 0004, Sebastian U. Stich, Martin Jaggi. 28004-28015 [doi]

Transformers Generalize DeepSets and Can be Extended to Graphs & HypergraphsJinwoo Kim, Saeyoon Oh, Seunghoon Hong. 28016-28028 [doi]

No Regrets for Learning the Prior in BanditsSoumya Basu 0001, Branislav Kveton, Manzil Zaheer, Csaba Szepesvári. 28029-28041 [doi]

Encoding Robustness to Image Style via Adversarial Feature PerturbationsManli Shu, Zuxuan Wu, Micah Goldblum, Tom Goldstein. 28042-28053 [doi]

Continuized Accelerations of Deterministic and Stochastic Gradient Descents, and of Gossip AlgorithmsMathieu Even, Raphaël Berthier, Francis Bach, Nicolas Flammarion, Hadrien Hendrikx, Pierre Gaillard, Laurent Massoulié, Adrien Taylor. 28054-28066 [doi]

Natural continual learning: success is a journey, not (just) a destinationTa-Chu Kao, Kristopher T. Jensen, Gido van de Ven, Alberto Bernacchia, Guillaume Hennequin. 28067-28079 [doi]

Individual Privacy Accounting via a Rényi FilterVitaly Feldman, Tijana Zrnic. 28080-28091 [doi]

Post-Training Quantization for Vision TransformerZhenhua Liu 0003, Yunhe Wang 0001, Kai Han 0002, Wei Zhang 0196, Siwei Ma, Wen Gao 0001. 28092-28103 [doi]

Unsupervised Part Discovery from Contrastive ReconstructionSubhabrata Choudhury, Iro Laina, Christian Rupprecht 0001, Andrea Vedaldi. 28104-28118 [doi]

ASSANet: An Anisotropic Separable Set Abstraction for Efficient Point Cloud Representation LearningGuocheng Qian, Hasan Hammoud, Guohao Li, Ali K. Thabet, Bernard Ghanem. 28119-28130 [doi]

An Empirical Investigation of Domain Generalization with Empirical Risk MinimizersRamakrishna Vedantam, David Lopez-Paz, David J. Schwab. 28131-28143 [doi]

Fair Sequential Selection Using Supervised Learning ModelsMohammad Mahdi Khalili, Xueru Zhang, Mahed Abroshan. 28144-28155 [doi]

Towards Sample-efficient Overparameterized Meta-learningYue Sun, Adhyyan Narang, Halil Ibrahim Gulluk, Samet Oymak, Maryam Fazel. 28156-28168 [doi]

ScaleCert: Scalable Certified Defense against Adversarial Patches with Sparse Superficial LayersHusheng Han, Kaidi Xu, Xing Hu 0001, Xiaobing Chen, Ling Liang, Zidong Du, Qi Guo 0001, Yanzhi Wang, Yunji Chen. 28169-28181 [doi]

Towards mental time travel: a hierarchical memory for reinforcement learning agentsAndrew K. Lampinen, Stephanie C. Y. Chan, Andrea Banino, Felix Hill. 28182-28195 [doi]

Beyond Tikhonov: faster learning with self-concordant losses, via iterative regularizationGaspard Beugnot, Julien Mairal, Alessandro Rudi. 28196-28207 [doi]

Variational Bayesian Reinforcement Learning with Regret BoundsBrendan O'Donoghue. 28208-28221 [doi]

Logarithmic Regret from Sublinear HintsAditya Bhaskara, Ashok Cutkosky, Ravi Kumar 0001, Manish Purohit. 28222-28232 [doi]

Independent mechanism analysis, a new concept?Luigi Gresele, Julius von Kügelgen, Vincent Stimper, Bernhard Schölkopf, Michel Besserve. 28233-28248 [doi]

Momentum Centering and Asynchronous Update for Adaptive Gradient MethodsJuntang Zhuang, Yifan Ding, Tommy Tang, Nicha C. Dvornek, Sekhar Tatikonda, James S. Duncan. 28249-28260 [doi]

Robustness via Uncertainty-aware Cycle ConsistencyUddeshya Upadhyay, Yanbei Chen, Zeynep Akata. 28261-28273 [doi]

CBP: backpropagation with constraint on weight precision using a pseudo-Lagrange multiplier methodGuhyun Kim, Doo Seok Jeong. 28274-28285 [doi]

On the Sample Complexity of Privately Learning Axis-Aligned RectanglesMenachem Sadigurschi, Uri Stemmer. 28286-28297 [doi]

Implicit Sparse Regularization: The Impact of Depth and Early StoppingJiangyuan Li, Thanh V. Nguyen, Chinmay Hegde, Ka-wai Wong. 28298-28309 [doi]

Efficient Generalization with Distributionally Robust LearningSoumyadip Ghosh, Mark S. Squillante, Ebisa D. Wollega. 28310-28322 [doi]

No-regret Online Learning over Riemannian ManifoldsXi Wang, Zhipeng Tu, Yiguang Hong, Yingyi Wu, Guodong Shi. 28323-28335 [doi]

Landmark-Guided Subgoal Generation in Hierarchical Reinforcement LearningJunsu Kim, Younggyo Seo, Jinwoo Shin. 28336-28349 [doi]

Minimax Regret for Stochastic Shortest PathAlon Cohen, Yonathan Efroni, Yishay Mansour, Aviv Rosenberg 0002. 28350-28361 [doi]

Parametrized Quantum Policies for Reinforcement LearningSofiène Jerbi, Casper Gyurik, Simon Marshall, Hans-J. Briegel, Vedran Dunjko. 28362-28375 [doi]

On Pathologies in KL-Regularized Reinforcement Learning from Expert DemonstrationsTim G. J. Rudner, Cong Lu, Michael A. Osborne, Yarin Gal, Yee Teh. 28376-28389 [doi]

Conditional Generation Using Polynomial ExpansionsGrigorios Chrysos 0002, Markos Georgopoulos, Yannis Panagakis. 28390-28404 [doi]

Efficient constrained sampling via the mirror-Langevin algorithmKwangjun Ahn, Sinho Chewi. 28405-28418 [doi]

Adaptive Online Packing-guided Search for POMDPsChenyang Wu, Guoyu Yang, Zongzhang Zhang, Yang Yu 0001, Dong Li 0030, Wulong Liu, Jianye Hao. 28419-28430 [doi]

Turing Completeness of Bounded-Precision Recurrent Neural NetworksStephen Chung, Hava T. Siegelmann. 28431-28441 [doi]

End-to-end Multi-modal Video Temporal GroundingYi-Wen Chen, Yi-Hsuan Tsai, Ming-Hsuan Yang 0001. 28442-28453 [doi]

How Powerful are Performance Predictors in Neural Architecture Search?Colin White, Arber Zela, Robin Ru, Yang Liu, Frank Hutter. 28454-28469 [doi]

Stylized Dialogue Generation with Multi-Pass Dual LearningJinpeng Li, Yingce Xia, Rui Yan, Hongda Sun, Dongyan Zhao 0001, Tie-Yan Liu. 28470-28481 [doi]

Entropy-based adaptive Hamiltonian Monte CarloMarcel Hirt, Michalis K. Titsias, Petros Dellaportas. 28482-28495 [doi]

Continual World: A Robotic Benchmark For Continual Reinforcement LearningMaciej Wolczyk, Michal Zajac 0005, Razvan Pascanu, Lukasz Kucinski, Piotr Milos. 28496-28510 [doi]

Towards Best-of-All-Worlds Online Learning with Feedback GraphsLiad Erez, Tomer Koren. 28511-28521 [doi]

ViTAE: Vision Transformer Advanced by Exploring Intrinsic Inductive BiasYufei Xu, Qiming Zhang, Jing Zhang 0037, Dacheng Tao. 28522-28535 [doi]

Open Rule InductionWanyun Cui, Xingran Chen. 28536-28547 [doi]

Post-Contextual-Bandit InferenceAurélien Bibaut, Maria Dimakopoulou, Nathan Kallus, Antoine Chambaz, Mark J. van der Laan. 28548-28559 [doi]

Revisiting Discriminator in GAN Compression: A Generator-discriminator Cooperative Compression SchemeShaojie Li, Jie Wu, XueFeng Xiao, Fei Chao 0001, Xudong Mao, Rongrong Ji. 28560-28572 [doi]

Asymptotically Exact Error Characterization of Offline Policy Evaluation with Misspecified Linear ModelsKohei Miyaguchi. 28573-28584 [doi]

Topographic VAEs learn Equivariant CapsulesT. Anderson Keller, Max Welling. 28585-28597 [doi]

MobILE: Model-Based Imitation Learning From Observation AloneRahul Kidambi, Jonathan Chang, Wen Sun. 28598-28611 [doi]

Few-Round Learning for Federated LearningYounghyun Park, Dong-Jun Han, Do Yeon Kim, Jun Seo, Jaekyun Moon. 28612-28622 [doi]

On Path Integration of Grid Cells: Group Representation and Isotropic ScalingRuiQi Gao, Jianwen Xie, Xue-Xin Wei, Song Chun Zhu, Ying Nian Wu. 28623-28635 [doi]

Online Convex Optimization with Continuous Switching ConstraintGuanghui Wang 0006, Yuanyu Wan, Tianbao Yang, Lijun Zhang 0005. 28636-28647 [doi]

Why Do Better Loss Functions Lead to Less Transferable Features?Simon Kornblith, Ting Chen, Honglak Lee, Mohammad Norouzi 0002. 28648-28662 [doi]

Breaking the centralized barrier for cross-device federated learningSai Praneeth Karimireddy, Martin Jaggi, Satyen Kale, Mehryar Mohri, Sashank J. Reddi, Sebastian U. Stich, Ananda Theertha Suresh. 28663-28676 [doi]

Adversarially robust learning for security-constrained optimal power flowPriya L. Donti, Aayushya Agarwal, Neeraj Vijay Bedmutha, Larry T. Pileggi, J. Zico Kolter. 28677-28689 [doi]

Learning a Single Neuron with Bias Using Gradient DescentGal Vardi, Gilad Yehudai, Ohad Shamir. 28690-28700 [doi]

Making a (Counterfactual) Difference One Rationale at a TimeMitchell Plyler, Michael Green, Min Chi. 28701-28713 [doi]

3D Siamese Voxel-to-BEV Tracker for Sparse Point CloudsLe Hui, Lingpeng Wang, Mingmei Cheng, Jin Xie, Jian Yang 0003. 28714-28727 [doi]

Stateful Strategic RegressionKeegan Harris, Hoda Heidari, Steven Z. Wu. 28728-28741 [doi]

Self-Attention Between Datapoints: Going Beyond Individual Input-Output Pairs in Deep LearningJannik Kossen, Neil Band, Clare Lyle, Aidan N. Gomez, Thomas Rainforth, Yarin Gal. 28742-28756 [doi]

Your head is there to move you around: Goal-driven models of the primate dorsal pathwayPatrick J. Mineault, Shahab Bakhtiari, Blake A. Richards, Christopher C. Pack. 28757-28771 [doi]

Achieving Rotational Invariance with Bessel-Convolutional Neural NetworksValentin Delchevalerie, Adrien Bibal, Benoît Frénay, Alexandre Mayer. 28772-28783 [doi]

Unsupervised Domain Adaptation with Dynamics-Aware Rewards in Reinforcement LearningJinxin Liu, Hao Shen, Donglin Wang, Yachen Kang, Qiangxing Tian. 28784-28797 [doi]

GraphFormers: GNN-nested Transformers for Representation Learning on Textual GraphJunhan Yang, Zheng Liu, Shitao Xiao, Chaozhuo Li, Defu Lian, Sanjay Agrawal, Amit Singh, Guangzhong Sun, Xing Xie 0001. 28798-28810 [doi]

A Universal Law of Robustness via IsoperimetrySébastien Bubeck, Mark Sellke. 28811-28822 [doi]

On Contrastive Representations of Stochastic ProcessesEmile Mathieu, Adam Foster, Yee Teh. 28823-28835 [doi]

A Domain-Shrinking based Bayesian Optimization Algorithm with Order-Optimal Regret PerformanceSudeep Salgia, Sattar Vakili, Qing Zhao 0001. 28836-28847 [doi]

Scalars are universal: Equivariant machine learning, structured like classical physicsSoledad Villar, David W. Hogg, Kate Storey-Fisher, Weichi Yao, Ben Blum-Smith. 28848-28863 [doi]

Unsupervised Object-Level Representation Learning from Scene ImagesJiahao Xie 0002, Xiaohang Zhan, Ziwei Liu 0002, Yew-Soon Ong, Chen Change Loy. 28864-28876 [doi]

Do Transformers Really Perform Badly for Graph Representation?Chengxuan Ying, Tianle Cai, Shengjie Luo, Shuxin Zheng, Guolin Ke, Di He, Yanming Shen, Tie-Yan Liu. 28877-28888 [doi]

Powerpropagation: A sparsity inducing weight reparameterisationJonathan Schwarz, Siddhant M. Jayakumar, Razvan Pascanu, Peter E. Latham, Yee Teh. 28889-28903 [doi]

Stronger NAS with Weaker PredictorsJunru Wu, Xiyang Dai, Dongdong Chen 0001, Yinpeng Chen, Mengchen Liu, Ye Yu, Zhangyang Wang, Zicheng Liu 0001, Mei Chen, Lu Yuan. 28904-28918 [doi]

Convolutional Normalization: Improving Deep Convolutional Network Robustness and TrainingSheng Liu, Xiao Li 0026, Yuexiang Zhai, Chong You, Zhihui Zhu, Carlos Fernandez-Granda, Qing Qu 0001. 28919-28928 [doi]

Nearly-Tight and Oblivious Algorithms for Explainable ClusteringBuddhima Gamlath, Xinrui Jia 0001, Adam Polak 0001, Ola Svensson. 28929-28939 [doi]

Deep Networks Provably Classify Data on CurvesTingran Wang, Sam Buchanan, Dar Gilboa, John Wright 0001. 28940-28953 [doi]

COMBO: Conservative Offline Model-Based Policy OptimizationTianhe Yu, Aviral Kumar, Rafael Rafailov, Aravind Rajeswaran, Sergey Levine, Chelsea Finn. 28954-28967 [doi]

Time-series Generation by Contrastive ImitationDaniel Jarrett, Ioana Bica, Mihaela van der Schaar. 28968-28982 [doi]

Differentially Private Sampling from DistributionsSofya Raskhodnikova, Satchit Sivakumar, Adam Smith, Marika Swanberg. 28983-28994 [doi]

On the Expected Complexity of Maxout NetworksHanna Tseran, Guido Montúfar. 28995-29008 [doi]

Cross-view Geo-localization with Layer-to-Layer TransformerHongji Yang, Xiufan Lu, Yingying Zhu 0001. 29009-29020 [doi]

TAAC: Temporally Abstract Actor-Critic for Continuous ControlHaonan Yu, Wei Xu 0017, Haichao Zhang. 29021-29033 [doi]

Learning Robust Hierarchical Patterns of Human Brain across Many fMRI StudiesDushyant Sahoo, Christos Davatzikos. 29034-29048 [doi]

Global Convergence to Local Minmax Equilibrium in Classes of Nonconvex Zero-Sum GamesTanner Fiez, Lillian J. Ratliff, Eric Mazumdar, Evan Faulkner, Adhyyan Narang. 29049-29063 [doi]

Bandit Quickest Changepoint DetectionAditya Gopalan, Braghadeesh Lakshminarayanan, Venkatesh Saligrama. 29064-29073 [doi]

Can multi-label classification networks know what they don't know?Haoran Wang, Weitang Liu, Alex Bocchieri, Yixuan Li. 29074-29087 [doi]

Balanced Chamfer Distance as a Comprehensive Metric for Point Cloud CompletionTong Wu, Liang Pan, Junzhe Zhang, Tai Wang, Ziwei Liu 0002, Dahua Lin. 29088-29100 [doi]

Optimal Gradient-based Algorithms for Non-concave Bandit OptimizationBaihe Huang, Kaixuan Huang, Sham M. Kakade, Jason D. Lee, Qi Lei, Runzhe Wang, Jiaqi Yang. 29101-29115 [doi]

On Optimal Interpolation in Linear RegressionEduard Oravkin, Patrick Rebeschini. 29116-29128 [doi]

Differentiable Optimization of Generalized Nondecomposable Functions using Linear ProgramsZihang Meng, Lopamudra Mukherjee, Yichao Wu, Vikas Singh, Sathya N. Ravi. 29129-29141 [doi]

Towards Understanding Cooperative Multi-Agent Q-Learning with Value FactorizationJianhao Wang, Zhizhou Ren, Beining Han, Jianing Ye, Chongjie Zhang. 29142-29155 [doi]

Margin-Independent Online Multiclass Learning via Convex GeometryGuru Guruganesh, Allen Liu, Jon Schneider, Joshua R. Wang. 29156-29167 [doi]

STEP: Out-of-Distribution Detection in the Presence of Limited In-Distribution Labeled DataZhi Zhou 0006, Lan-Zhe Guo, Zhanzhan Cheng, Yu-Feng Li, Shiliang Pu. 29168-29180 [doi]

Renyi Differential Privacy of The Subsampled Shuffle Model In Distributed LearningAntonious M. Girgis, Deepesh Data, Suhas N. Diggavi. 29181-29192 [doi]

Gradient-based Editing of Memory Examples for Online Task-free Continual LearningXisen Jin, Arka Sadhu, Junyi Du, Xiang Ren. 29193-29205 [doi]

Tailoring: encoding inductive biases by optimizing unsupervised objectives at prediction timeFerran Alet, Maria Bauzá, Kenji Kawaguchi, Nurullah Giray Kuru, Tomás Lozano-Pérez, Leslie Pack Kaelbling. 29206-29217 [doi]

Implicit Bias of SGD for Diagonal Linear Networks: a Provable Benefit of StochasticityScott Pesme, Loucas Pillaud-Vivien, Nicolas Flammarion. 29218-29230 [doi]

Iterative Teacher-Aware LearningLuyao Yuan, Dongruo Zhou, Junhong Shen, Jingdong Gao, Jeffrey L. Chen, Quanquan Gu, Ying Nian Wu, Song Chun Zhu. 29231-29245 [doi]

Clockwork Variational AutoencodersVaibhav Saxena, Jimmy Ba, Danijar Hafner. 29246-29257 [doi]

How Does it Sound?Kun Su, Xiulong Liu, Eli Shlizerman. 29258-29273 [doi]

Stabilizing Dynamical Systems via Policy Gradient MethodsJuan C. Perdomo, Jack Umenberger, Max Simchowitz. 29274-29286 [doi]

Language models enable zero-shot prediction of the effects of mutations on protein functionJoshua Meier, Roshan Rao, Robert Verkuil, Jason Liu, Tom Sercu, Alexander Rives. 29287-29303 [doi]

Deep Reinforcement Learning at the Edge of the Statistical PrecipiceRishabh Agarwal, Max Schwarzer, Pablo Samuel Castro, Aaron C. Courville, Marc G. Bellemare. 29304-29320 [doi]

DRONE: Data-aware Low-rank Compression for Large NLP ModelsPatrick H. Chen, Hsiang-Fu Yu, Inderjit S. Dhillon, Cho-Jui Hsieh. 29321-29334 [doi]

DSelect-k: Differentiable Selection in the Mixture of Experts with Applications to Multi-Task LearningHussein Hazimeh 0001, Zhe Zhao, Aakanksha Chowdhery, Maheswaran Sathiamoorthy, Yihua Chen, Rahul Mazumder, Lichan Hong, Ed H. Chi. 29335-29347 [doi]

Mind the Gap: Assessing Temporal Generalization in Neural Language ModelsAngeliki Lazaridou, Adhiguna Kuncoro, Elena Gribovskaya, Devang Agrawal, Adam Liska, Tayfun Terzi, Mai Gimenez, Cyprien de Masson d'Autume, Tomás Kocisky, Sebastian Ruder, Dani Yogatama, Kris Cao, Susannah Young, Phil Blunsom. 29348-29363 [doi]

Heavy Tails in SGD and Compressibility of Overparametrized Neural NetworksMelih Barsbey, Milad Sefidgaran, Murat A. Erdogdu, Gaël Richard, Umut Simsekli. 29364-29378 [doi]

Targeted Neural Dynamical ModelingCole L. Hurwitz, Akash Srivastava, Kai Xu, Justin Jude, Matthew G. Perich, Lee E. Miller, Matthias H. Hennig. 29379-29392 [doi]

Exploiting the Intrinsic Neighborhood Structure for Source-free Domain AdaptationShiqi Yang, Yaxing Wang, Joost van de Weijer 0001, Luis Herranz, Shangling Jui. 29393-29405 [doi]

Learning with Noisy Correspondence for Cross-modal MatchingZhenyu Huang, Guocheng Niu, Xiao Liu, Wenbiao Ding, Xinyan Xiao, Hua Wu 0003, Xi Peng. 29406-29419 [doi]

Offline Reinforcement Learning with Reverse Model-based ImaginationJianhao Wang, Wenzhe Li, Haozhe Jiang, Guangxiang Zhu, Siyuan Li, Chongjie Zhang. 29420-29432 [doi]

Parameter Prediction for Unseen Deep ArchitecturesBoris Knyazev, Michal Drozdzal, Graham W. Taylor, Adriana Romero-Soriano. 29433-29448 [doi]

FMMformer: Efficient and Flexible Transformer via Decomposed Near-field and Far-field AttentionTan M. Nguyen, Vai Suliafu, Stanley J. Osher, Long Chen, Bao Wang. 29449-29463 [doi]

Square Root Principal Component Pursuit: Tuning-Free Noisy Robust Matrix RecoveryJunhui Zhang, Jingkai Yan, John Wright. 29464-29475 [doi]

Neural Bellman-Ford Networks: A General Graph Neural Network Framework for Link PredictionZhaocheng Zhu, Zuobai Zhang, Louis-Pascal A. C. Xhonneux, Jian Tang 0005. 29476-29490 [doi]

CorticalFlow: A Diffeomorphic Mesh Transformer Network for Cortical Surface ReconstructionLéo Lebrat, Rodrigo Santa Cruz, Frédéric de Gournay, Darren Fu, Pierrick Bourgeat, Jurgen Fripp, Clinton Fookes, Olivier Salvado. 29491-29505 [doi]

Bridging the Gap Between Practice and PAC-Bayes Theory in Few-Shot Meta-LearningNan Ding 0002, Xi Chen, Tomer Levinboim, Sebastian Goodman, Radu Soricut. 29506-29516 [doi]

SLOE: A Faster Method for Statistical Inference in High-Dimensional Logistic RegressionSteve Yadlowsky, Taedong Yun, Cory Y. McLean, Alexander D'Amour. 29517-29528 [doi]

ELLA: Exploration through Learned Language AbstractionSuvir Mirchandani, Siddharth Karamcheti, Dorsa Sadigh. 29529-29540 [doi]

Learning Distilled Collaboration Graph for Multi-Agent PerceptionYiming Li 0003, Shunli Ren, Pengxiang Wu, Siheng Chen, Chen Feng 0002, Wenjun Zhang. 29541-29552 [doi]

Federated-EM with heterogeneity mitigation and variance reductionAymeric Dieuleveut, Gersende Fort, Eric Moulines, Geneviève Robin. 29553-29566 [doi]

On the Role of Optimization in Double Descent: A Least Squares StudyIlja Kuzborskij, Csaba Szepesvári, Omar Rivasplata, Amal Rannen Triki, Razvan Pascanu. 29567-29577 [doi]

Neural Architecture Dilation for Adversarial RobustnessYanxi Li 0001, Zhaohui Yang, Yunhe Wang 0001, Chang Xu 0002. 29578-29589 [doi]

Clustering Effect of Adversarial Robust ModelsYang Bai, Xin Yan, Yong Jiang 0001, Shu-Tao Xia, Yisen Wang 0001. 29590-29601 [doi]

On the Cryptographic Hardness of Learning Single Periodic NeuronsMin Jae Song, Ilias Zadik, Joan Bruna. 29602-29615 [doi]

PCA Initialization for Approximate Message Passing in Rotationally Invariant ModelsMarco Mondelli, Ramji Venkataramanan. 29616-29629 [doi]

Automatic and Harmless Regularization with Constrained and Lexicographic Optimization: A Dynamic Barrier ApproachChengYue Gong, Xingchao Liu, Qiang Liu 0001. 29630-29642 [doi]

Corruption Robust Active LearningYifang Chen, Simon S. Du, Kevin G. Jamieson. 29643-29654 [doi]

Metadata-based Multi-Task Bandits with Bayesian Hierarchical ModelsRunzhe Wan, Lin Ge, Rui Song 0006. 29655-29668 [doi]

Program Synthesis Guided Reinforcement Learning for Partially Observed EnvironmentsYichen Yang 0008, Jeevana Priya Inala, Osbert Bastani, Yewen Pu, Armando Solar-Lezama, Martin C. Rinard. 29669-29683 [doi]

Robust Allocations with Diversity ConstraintsZeyu Shen, Lodewijk Gelauff, Ashish Goel, Aleksandra Korolova, Kamesh Munagala. 29684-29696 [doi]

Activation Sharing with Asymmetric Paths Solves Weight Transport Problem without Bidirectional ConnectionSunghyeon Woo, Jeongwoo Park, Jiwoo Hong, Dongsuk Jeon. 29697-29709 [doi]

BlendGAN: Implicitly GAN Blending for Arbitrary Stylized Face GenerationMingcong Liu, Qiang Li 0024, Zekui Qin, Guoxin Zhang, Pengfei Wan, Wen Zheng. 29710-29722 [doi]

Differentially Private Model PersonalizationPrateek Jain 0002, John Rush, Adam D. Smith, Shuang Song 0001, Abhradeep Guha Thakurta. 29723-29735 [doi]

Rates of Estimation of Optimal Transport Maps using Plug-in Estimators via Barycentric ProjectionsNabarun Deb, Promit Ghosal, Bodhisattva Sen. 29736-29753 [doi]

Robust Generalization despite Distribution Shift via Minimum Discriminating InformationTobias Sutter, Andreas Krause, Daniel Kuhn. 29754-29767 [doi]

Soft Calibration Objectives for Neural NetworksArchit Karandikar, Nicholas Cain, Dustin Tran, Balaji Lakshminarayanan, Jonathon Shlens, Michael C. Mozer, Becca Roelofs. 29768-29779 [doi]

Distributional Gradient Matching for Learning Uncertain Neural Dynamics ModelsLenart Treven, Philippe Wenk, Florian Dörfler, Andreas Krause 0001. 29780-29793 [doi]

Shaping embodied agent behavior with activity-context priors from egocentric videoTushar Nagarajan, Kristen Grauman. 29794-29805 [doi]

Adjusting for Autocorrelated Errors in Neural Networks for Time SeriesFan-Keng Sun, Christopher I. Lang, Duane S. Boning. 29806-29819 [doi]

A Geometric Analysis of Neural Collapse with Unconstrained FeaturesZhihui Zhu, Tianyu Ding, Jinxin Zhou, Xiao Li 0026, Chong You, Jeremias Sulam, Qing Qu 0001. 29820-29834 [doi]

NeRS: Neural Reflectance Surfaces for Sparse-view 3D Reconstruction in the WildJason Zhang, Gengshan Yang, Shubham Tulsiani, Deva Ramanan. 29835-29847 [doi]

Unleashing the Power of Contrastive Self-Supervised Visual Models via Contrast-Regularized Fine-TuningYifan Zhang, Bryan Hooi, Dapeng Hu, Jian Liang, Jiashi Feng. 29848-29860 [doi]

Discovery of Options via Meta-Learned SubgoalsVivek Veeriah, Tom Zahavy, Matteo Hessel, Zhongwen Xu, Junhyuk Oh, Iurii Kemaev, Hado van Hasselt, David Silver, Satinder Singh 0001. 29861-29873 [doi]

Near-Optimal Lower Bounds For Convex Optimization For All Orders of SmoothnessAnkit Garg, Robin Kothari, Praneeth Netrapalli, Suhail Sherif. 29874-29884 [doi]

Topology-Imbalance Learning for Semi-Supervised Node ClassificationDeli Chen, Yankai Lin, Guangxiang Zhao, Xuancheng Ren, Peng Li 0030, Jie Zhou, Xu Sun. 29885-29897 [doi]

Gradient Inversion with Generative Image PriorJinwoo Jeon, Jaechang Kim, Kangwook Lee 0001, Sewoong Oh, Jungseul Ok. 29898-29908 [doi]

Beta-CROWN: Efficient Bound Propagation with Per-neuron Split Constraints for Neural Network Robustness VerificationShiqi Wang 0002, Huan Zhang 0001, Kaidi Xu, Xue Lin, Suman Jana, Cho-Jui Hsieh, J. Zico Kolter. 29909-29921 [doi]

Autobahn: Automorphism-based Graph Neural NetsErik H. Thiede, Wenda Zhou, Risi Kondor. 29922-29934 [doi]

Data Augmentation Can Improve RobustnessSylvestre-Alvise Rebuffi, Sven Gowal, Dan Andrei Calian, Florian Stimberg, Olivia Wiles, Timothy A. Mann. 29935-29948 [doi]

Deep Explicit Duration Switching Models for Time SeriesAbdul Fatir Ansari, Konstantinos Benidis, Richard Kurle, Ali Caner Türkmen, Harold Soh, Alexander J. Smola, Bernie Wang, Tim Januschowski. 29949-29961 [doi]

Shared Independent Component Analysis for Multi-Subject NeuroimagingHugo Richard, Pierre Ablin, Bertrand Thirion, Alexandre Gramfort, Aapo Hyvärinen. 29962-29971 [doi]

Shape from Blur: Recovering Textured 3D Shape and Motion of Fast Moving ObjectsDenys Rozumnyi, Martin R. Oswald, Vittorio Ferrari, Marc Pollefeys. 29972-29983 [doi]

Batched Thompson SamplingCem Kalkanli, Ayfer Özgür. 29984-29994 [doi]

Delayed Gradient Averaging: Tolerate the Communication Latency for Federated LearningLigeng Zhu, Hongzhou Lin, Yao Lu, Yujun Lin 0001, Song Han 0003. 29995-30007 [doi]

Focal Attention for Long-Range Interactions in Vision TransformersJianwei Yang, Chunyuan Li, Pengchuan Zhang, Xiyang Dai, Bin Xiao, Lu Yuan, Jianfeng Gao. 30008-30022 [doi]

Scalable and Stable Surrogates for Flexible Classifiers with Fairness ConstraintsHarry Bendekgey, Erik B. Sudderth. 30023-30036 [doi]

Residual Pathway Priors for Soft Equivariance ConstraintsMarc Finzi, Greg Benton, Andrew Gordon Wilson. 30037-30049 [doi]

Optimal Algorithms for Stochastic Contextual Preference BanditsAadirupa Saha. 30050-30062 [doi]

Tight High Probability Bounds for Linear Stochastic Approximation with Fixed StepsizeAlain Durmus, Eric Moulines, Alexey Naumov, Sergey Samsonov, Kevin Scaman, Hoi-To Wai. 30063-30074 [doi]

Learning Large Neighborhood Search Policy for Integer ProgrammingYaoxin Wu, Wen Song, Zhiguang Cao, Jie Zhang. 30075-30087 [doi]

Dynamic Trace EstimationPrathamesh Dharangutte, Christopher Musco. 30088-30099 [doi]

Provable Representation Learning for Imitation with Contrastive Fourier FeaturesOfir Nachum, Mengjiao Yang. 30100-30112 [doi]

MICo: Improved representations via sampling-based state similarity for Markov decision processesPablo Samuel Castro, Tyler Kastner, Prakash Panangaden, Mark Rowland. 30113-30126 [doi]

Counterfactual Explanations in Sequential Decision Making Under UncertaintyStratis Tsirtsis, Abir De, Manuel Rodriguez. 30127-30139 [doi]

Streaming Linear System Identification with Reverse Experience ReplayPrateek Jain 0002, Suhas S. Kowshik, Dheeraj Nagaraj, Praneeth Netrapalli. 30140-30152 [doi]

SmoothMix: Training Confidence-calibrated Smoothed Classifiers for Certified RobustnessJongheon Jeong, Sejun Park, Minkyu Kim 0004, Heung-Chang Lee, Do-Guk Kim, Jinwoo Shin. 30153-30168 [doi]

Action-guided 3D Human Motion PredictionJiangxin Sun, Zihang Lin, Xintong Han, Jian-Fang Hu, Jia Xu, Wei-Shi Zheng. 30169-30180 [doi]

Meta-Learning the Search Distribution of Black-Box Random Search Based Adversarial AttacksMaksym Yatsura, Jan Hendrik Metzen, Matthias Hein 0001. 30181-30195 [doi]

Validating the Lottery Ticket Hypothesis with Inertial Manifold TheoryZeru Zhang, Jiayin Jin, Zijie Zhang, Yang Zhou 0001, Xin Zhao, Jiaxiang Ren, Ji Liu 0003, Lingfei Wu, Ruoming Jin, Dejing Dou. 30196-30210 [doi]

Are My Deep Learning Systems Fair? An Empirical Study of Fixed-Seed TrainingShangshu Qian, Hung Viet Pham, Thibaud Lutellier, Zeou Hu, Jungwon Kim, Lin Tan 0001, Yaoliang Yu, Jiahao Chen, Sameena Shah. 30211-30227 [doi]

Rectangular Flows for Manifold LearningAnthony L. Caterini, Gabriel Loaiza-Ganem, Geoff Pleiss, John P. Cunningham. 30228-30241 [doi]

On the Generative Utility of Cyclic ConditionalsChang Liu 0030, Haoyue Tang, Tao Qin, Jintao Wang, Tie-Yan Liu. 30242-30256 [doi]

Structural Credit Assignment in Neural Networks using Reinforcement LearningDhawal Gupta, Gabor Mihucz, Matthew Schlegel, James E. Kostas, Philip S. Thomas, Martha White. 30257-30270 [doi]

A Near-Optimal Algorithm for Stochastic Bilevel Optimization via Double-MomentumPrashant Khanduri, Siliang Zeng, Mingyi Hong, Hoi-To Wai, Zhaoran Wang, Zhuoran Yang. 30271-30283 [doi]

Generalized Jensen-Shannon Divergence Loss for Learning with Noisy LabelsErik Englesson, Hossein Azizpour. 30284-30297 [doi]

Continual Learning via Local Module CompositionOleksiy Ostapenko, Pau Rodríguez, Massimo Caccia, Laurent Charlin. 30298-30312 [doi]

Model-Based Episodic Memory Induces Dynamic Hybrid ControlsHung Le, Thommen George Karimpanal, Majid Abdolshah, Truyen Tran 0001, Svetha Venkatesh. 30313-30325 [doi]

FedDR - Randomized Douglas-Rachford Splitting Algorithms for Nonconvex Federated Composite OptimizationQuoc Tran-Dinh, Nhan H. Pham, Dzung T. Phan, Lam M. Nguyen. 30326-30338 [doi]

Adversarial Examples Make Strong PoisonsLiam Fowl, Micah Goldblum, Ping-Yeh Chiang, Jonas Geiping, Wojciech Czaja, Tom Goldstein. 30339-30351 [doi]

Coresets for Decision Trees of SignalsIbrahim Jubran, Ernesto Evgeniy Sanches Shayda, Ilan Newman, Dan Feldman. 30352-30364 [doi]

Local plasticity rules can learn deep representations using self-supervised contrastive predictionsBernd Illing, Jean Ventura, Guillaume Bellec, Wulfram Gerstner. 30365-30379 [doi]

MobTCast: Leveraging Auxiliary Trajectory Forecasting for Human Mobility PredictionHao Xue 0001, Flora D. Salim, Yongli Ren, Nuria Oliver. 30380-30391 [doi]

Early Convolutions Help Transformers See BetterTete Xiao, Mannat Singh, Eric Mintun, Trevor Darrell, Piotr Dollár, Ross B. Girshick. 30392-30400 [doi]

Error Compensated Distributed SGD Can Be AcceleratedXun Qian, Peter Richtárik, Tong Zhang. 30401-30413 [doi]

InfoGCL: Information-Aware Graph Contrastive LearningDongkuan Xu, Wei Cheng 0002, Dongsheng Luo, Haifeng Chen, Xiang Zhang 0001. 30414-30425 [doi]

Meta-Learning for Relative Density-Ratio EstimationAtsutoshi Kumagai, Tomoharu Iwata, Yasuhiro Fujiwara. 30426-30438 [doi]

Overcoming the curse of dimensionality with Laplacian regularization in semi-supervised learningVivien Cabannes, Loucas Pillaud-Vivien, Francis Bach, Alessandro Rudi. 30439-30451 [doi]

Unlabeled Principal Component AnalysisYunzhen Yao, Liangzu Peng, Manolis C. Tsakiris. 30452-30464 [doi]

Causal-BALD: Deep Bayesian Active Learning of Outcomes to Infer Treatment-Effects from Observational DataAndrew Jesson, Panagiotis Tigas, Joost van Amersfoort, Andreas Kirsch 0002, Uri Shalit, Yarin Gal. 30465-30478 [doi]

Scalable Rule-Based Representation Learning for Interpretable ClassificationZhuo Wang 0006, Wei Zhang 0056, Ning Liu 0014, Jianyong Wang 0001. 30479-30491 [doi]

Bridging Non Co-occurrence with Unlabeled In-the-wild Data for Incremental Object DetectionNa Dong, Yongqiang Zhang 0007, Mingli Ding, Gim Hee Lee. 30492-30503 [doi]

A Regression Approach to Learning-Augmented Online AlgorithmsKeerti Anand, Rong Ge, Amit Kumar 0001, Debmalya Panigrahi. 30504-30517 [doi]

runs on WebDSL