The Eleventh International Conference on Learning Representations, ICLR 2023, Kigali, Rwanda, May 1-5, 2023

researchr

You are not signed in
Sign in
Sign up

The Eleventh International Conference on Learning Representations, ICLR 2023, Kigali, Rwanda, May 1-5, 2023. OpenReview.net, 2023. [doi]

Conference: iclr2023

Abstract is missing.

FedSpeed: Larger Local Interval, Less Communication Round, and Higher Generalization AccuracyYan Sun, Li Shen 0008, Tiansheng Huang, Liang Ding 0006, Dacheng Tao. [doi]

ContraNorm: A Contrastive Learning Perspective on Oversmoothing and BeyondXiaojun Guo, Yifei Wang 0001, Tianqi Du, Yisen Wang 0001. [doi]

Learning ReLU networks to high uniform accuracy is intractableJulius Berner, Philipp Grohs, Felix Voigtländer. [doi]

Transferable Unlearnable ExamplesJie Ren, Han Xu 0002, Yuxuan Wan, Xingjun Ma, Lichao Sun 0001, Jiliang Tang. [doi]

On the Soft-Subnetwork for Few-Shot Class Incremental LearningHaeyong Kang, Jaehong Yoon, Sultan Rizky Hikmawan Madjid, Sung Ju Hwang, Chang D. Yoo. [doi]

Achieving Sub-linear Regret in Infinite Horizon Average Reward Constrained MDP with Linear Function ApproximationArnob Ghosh, Xingyu Zhou 0001, Ness B. Shroff. [doi]

Context-enriched molecule representations improve few-shot drug discoveryJohannes Schimunek, Philipp Seidl, Lukas Friedrich, Daniel Kuhn, Friedrich Rippmann, Sepp Hochreiter, Günter Klambauer. [doi]

The Role of ImageNet Classes in Fréchet Inception DistanceTuomas Kynkäänniemi, Tero Karras, Miika Aittala, Timo Aila, Jaakko Lehtinen. [doi]

PaLI: A Jointly-Scaled Multilingual Language-Image ModelXi Chen, Xiao Wang 0038, Soravit Changpinyo, A. J. Piergiovanni, Piotr Padlewski, Daniel Salz, Sebastian Goodman, Adam Grycner, Basil Mustafa, Lucas Beyer, Alexander Kolesnikov 0003, Joan Puigcerver, Nan Ding 0002, Keran Rong, Hassan Akbari, Gaurav Mishra, Linting Xue, Ashish V. Thapliyal, James Bradbury, Weicheng Kuo. [doi]

Sparse Token Transformer with Attention Back TrackingHeejun Lee, Minki Kang, Youngwan Lee, Sung Ju Hwang. [doi]

Embedding Fourier for Ultra-High-Definition Low-Light Image EnhancementChongyi Li, Chun-Le Guo, Man Zhou, Zhexin Liang, Shangchen Zhou, Ruicheng Feng, Chen Change Loy. [doi]

Canary in a Coalmine: Better Membership Inference with Ensembled Adversarial QueriesYuxin Wen, Arpit Bansal, Hamid Kazemi, Eitan Borgnia, Micah Goldblum, Jonas Geiping, Tom Goldstein. [doi]

Exploring Low-Rank Property in Multiple Instance Learning for Whole Slide Image ClassificationJinxi Xiang, Jun Zhang 0018. [doi]

Cheap Talk Discovery and Utilization in Multi-Agent Reinforcement LearningYat Long Lo, Christian Schröder de Witt, Samuel Sokota, Jakob Nicolaus Foerster, Shimon Whiteson. [doi]

Human alignment of neural network representationsLukas Muttenthaler, Jonas Dippel, Lorenz Linhardt, Robert A. Vandermeulen, Simon Kornblith. [doi]

VIP: Towards Universal Visual Reward and Representation via Value-Implicit Pre-TrainingYecheng Jason Ma, Shagun Sodhani, Dinesh Jayaraman, Osbert Bastani, Vikash Kumar, Amy Zhang 0001. [doi]

Generative Modeling Helps Weak Supervision (and Vice Versa)Benedikt Boecking, Nicholas Roberts, Willie Neiswanger, Stefano Ermon, Frederic Sala, Artur Dubrawski. [doi]

Block and Subword-Scaling Floating-Point (BSFP) : An Efficient Non-Uniform Quantization For Low Precision InferenceYun-Chen Lo, Tse-Kuang Lee, Ren-Shuo Liu. [doi]

Humanly Certifying Superhuman ClassifiersQiongkai Xu, Christian Walder, Chenchen Xu. [doi]

Valid P-Value for Deep Learning-driven Salient RegionDaiki Miwa, Vo Nguyen Le Duy, Ichiro Takeuchi. [doi]

Voxurf: Voxel-based Efficient and Accurate Neural Surface ReconstructionTong Wu, Jiaqi Wang, Xingang Pan, Xudong Xu, Christian Theobalt, Ziwei Liu, Dahua Lin. [doi]

Massively Scaling Heteroscedastic ClassifiersMark Collier, Rodolphe Jenatton, Basil Mustafa, Neil Houlsby, Jesse Berent, Effrosyni Kokiopoulou. [doi]

$\Lambda$-DARTS: Mitigating Performance Collapse by Harmonizing Operation Selection among CellsSajad Movahedi, Melika Adabinejad, Ayyoob Imani, Arezou Keshavarz, Mostafa Dehghani 0001, Azadeh Shakery, Babak Nadjar Araabi. [doi]

Preference Transformer: Modeling Human Preferences using Transformers for RLChangyeon Kim, Jongjin Park, Jinwoo Shin, Honglak Lee, Pieter Abbeel, Kimin Lee. [doi]

Brain-like representational straightening of natural movies in robust feedforward neural networksTahereh Toosi, Elias Issa. [doi]

A Convergent Single-Loop Algorithm for Relaxation of Gromov-Wasserstein in Graph DataJiajin Li, Jianheng Tang, Lemin Kong, Huikang Liu, Jia Li, Anthony Man-Cho So, Jose H. Blanchet. [doi]

Rethinking the Expressive Power of GNNs via Graph BiconnectivityBohang Zhang, Shengjie Luo, Liwei Wang 0001, Di He. [doi]

A view of mini-batch SGD via generating functions: conditions of convergence, phase transitions, benefit from negative momentaMaksim Velikanov, Denis Kuznedelev, Dmitry Yarotsky. [doi]

When Data Geometry Meets Deep Function: Generalizing Offline Reinforcement LearningJianxiong Li, Xianyuan Zhan, Haoran Xu, Xiangyu Zhu, Jingjing Liu, Ya-Qin Zhang. [doi]

What Do Self-Supervised Vision Transformers Learn?Namuk Park, Wonjae Kim, Byeongho Heo, Taekyung Kim 0005, Sangdoo Yun. [doi]

Diffusion Probabilistic FieldsPeiye Zhuang, Samira Abnar, Jiatao Gu, Alexander G. Schwing, Joshua M. Susskind, Miguel Ángel Bautista 0001. [doi]

Meta Knowledge Condensation for Federated LearningPing Liu, Xin Yu, Joey Tianyi Zhou. [doi]

Latent Variable Representation for Reinforcement LearningTongzheng Ren, Chenjun Xiao, Tianjun Zhang, Na Li 0002, Zhaoran Wang, Sujay Sanghavi, Dale Schuurmans, Bo Dai 0001. [doi]

Distilling Cognitive Backdoor Patterns within an ImageHanxun Huang, Xingjun Ma, Sarah Monazam Erfani, James Bailey 0001. [doi]

Statistical Theory of Differentially Private Marginal-based Data Synthesis AlgorithmsXiMing Li, Chendi Wang, Guang Cheng. [doi]

More ConvNets in the 2020s: Scaling up Kernels Beyond 51x51 using SparsityShiwei Liu, Tianlong Chen, Xiaohan Chen, Xuxi Chen, Qiao Xiao, Boqian Wu, Tommi Kärkkäinen, Mykola Pechenizkiy, Decebal Constantin Mocanu, Zhangyang Wang. [doi]

Imitating Graph-Based Planning with Goal-Conditioned PoliciesJunsu Kim, Younggyo Seo, Sungsoo Ahn, Kyunghwan Son, Jinwoo Shin. [doi]

Learning Symbolic Models for Graph-structured Physical MechanismHongzhi Shi, Jingtao Ding, Yufan Cao, Quanming Yao, Li Liu, Yong Li 0008. [doi]

A Time Series is Worth 64 Words: Long-term Forecasting with TransformersYuqi Nie, Nam H. Nguyen, Phanwadee Sinthong, Jayant Kalagnanam. [doi]

Sample-Efficient Reinforcement Learning by Breaking the Replay Ratio BarrierPierluca D'Oro, Max Schwarzer, Evgenii Nikishin, Pierre-Luc Bacon, Marc G. Bellemare, Aaron C. Courville. [doi]

Enhancing the Inductive Biases of Graph Neural ODE for Modeling Physical SystemsSuresh Bishnoi, Ravinder Bhattoo, Jayadeva, Sayan Ranu, N. M. Anoop Krishnan. [doi]

Neural ePDOs: Spatially Adaptive Equivariant Partial Differential Operator Based NetworksLingshen He, Yuxuan Chen, Zhengyang Shen, Yibo Yang, Zhouchen Lin. [doi]

Moving Forward by Moving Backward: Embedding Action Impact over Action SemanticsKuo-Hao Zeng, Luca Weihs, Roozbeh Mottaghi, Ali Farhadi. [doi]

Replicable BanditsHossein Esfandiari, Alkis Kalavasis, Amin Karbasi, Andreas Krause 0001, Vahab Mirrokni, Grigoris Velegkas. [doi]

TranSpeech: Speech-to-Speech Translation With Bilateral PerturbationRongjie Huang, Jinglin Liu, Huadai Liu, Yi Ren 0006, Lichao Zhang, Jinzheng He, Zhou Zhao. [doi]

Bort: Towards Explainable Neural Networks with Bounded Orthogonal ConstraintBorui Zhang, Wenzhao Zheng, Jie Zhou 0001, Jiwen Lu. [doi]

Understanding Edge-of-Stability Training Dynamics with a Minimalist ExampleXingyu Zhu 0003, Zixuan Wang, Xiang Wang 0011, Mo Zhou, Rong Ge 0001. [doi]

Recon: Reducing Conflicting Gradients From the Root For Multi-Task LearningGuangyuan Shi, Qimai Li, Wenlong Zhang, Jiaxin Chen, Xiao-Ming Wu 0003. [doi]

Transfer Learning with Deep Tabular ModelsRoman Levin, Valeriia Cherepanova, Avi Schwarzschild, Arpit Bansal, C. Bayan Bruss, Tom Goldstein, Andrew Gordon Wilson, Micah Goldblum. [doi]

MECTA: Memory-Economic Continual Test-Time Model AdaptationJunyuan Hong, Lingjuan Lyu, Jiayu Zhou, Michael Spranger. [doi]

Stochastic No-regret Learning for General Games with Variance ReductionYichi Zhou, Fang Kong 0002, Shuai Li 0010. [doi]

Semi-supervised learning with a principled likelihood from a generative model of data curationStoil Ganev, Laurence Aitchison. [doi]

Cycle-consistent Masked AutoEncoder for Unsupervised Domain GeneralizationHaiyang Yang, Xiaotong Li, Shixiang Tang, Feng Zhu 0006, Yizhou Wang, Meilin Chen, Lei Bai 0001, Rui Zhao 0001, Wanli Ouyang. [doi]

Re-calibrating Feature Attributions for Model InterpretationPeiyu Yang, Naveed Akhtar, Zeyi Wen, Mubarak Shah, Ajmal Saeed Mian. [doi]

Distributionally Robust Post-hoc Classifiers under Prior ShiftsJiaheng Wei, Harikrishna Narasimhan, Ehsan Amid, Wen-Sheng Chu, Yang Liu 0018, Abhishek Kumar. [doi]

Domain Generalization via Heckman-type Selection ModelsHyungu Kahng, Hyungrok Do, Judy Zhong. [doi]

LilNetX: Lightweight Networks with EXtreme Model Compression and Structured SparsificationSharath Girish, Kamal Gupta 0002, Saurabh Singh, Abhinav Shrivastava. [doi]

GAMR: A Guided Attention Model for (visual) ReasoningMohit Vaishnav, Thomas Serre. [doi]

Hierarchical Sliced Wasserstein DistanceKhai Nguyen, Tongzheng Ren, Huy Nguyen, Litu Rout, Tan Minh Nguyen, Nhat Ho. [doi]

Solving Constrained Variational Inequalities via a First-order Interior Point-based MethodTong Yang, Michael I. Jordan, Tatjana Chavdarova. [doi]

Policy Expansion for Bridging Offline-to-Online Reinforcement LearningHaichao Zhang, Wei Xu 0017, Haonan Yu. [doi]

LightGCL: Simple Yet Effective Graph Contrastive Learning for RecommendationXuheng Cai, Chao Huang 0001, Lianghao Xia, Xubin Ren. [doi]

BrainBERT: Self-supervised representation learning for intracranial recordingsChristopher Wang, Vighnesh Subramaniam, Adam Uri Yaari, Gabriel Kreiman, Boris Katz, Ignacio Cases, Andrei Barbu. [doi]

The Role of Coverage in Online Reinforcement LearningTengyang Xie, Dylan J. Foster, Yu Bai 0017, Nan Jiang 0008, Sham M. Kakade. [doi]

Link Prediction with Non-Contrastive LearningWilliam Shiao, Zhichun Guo, Tong Zhao 0003, Evangelos E. Papalexakis, Yozen Liu, Neil Shah. [doi]

Robust Fair Clustering: A Novel Fairness Attack and Defense FrameworkAnshuman Chhabra, Peizhao Li, Prasant Mohapatra, Hongfu Liu. [doi]

Learning to Generate Columns with Application to Vertex ColoringYuan Sun 0003, Andreas T. Ernst, Xiaodong Li 0001, Jake Weiner. [doi]

FIFA: Making Fairness More Generalizable in Classifiers Trained on Imbalanced DataZhun Deng, Jiayao Zhang 0001, Linjun Zhang, Ting Ye, Yates Coley, Weijie J. Su, James Zou 0001. [doi]

Information-Theoretic Analysis of Unsupervised Domain AdaptationZiqiao Wang, Yongyi Mao. [doi]

Anisotropic Message Passing: Graph Neural Networks with Directional and Long-Range InteractionsMoritz Thürlemann, Sereina Riniker. [doi]

Thalamus: a brain-inspired algorithm for biologically-plausible continual learning and disentangled representationsAli Hummos. [doi]

Optimal Transport for Offline Imitation LearningYicheng Luo, Zhengyao Jiang, Samuel Cohen, Edward Grefenstette, Marc Peter Deisenroth. [doi]

KnowDA: All-in-One Knowledge Mixture Model for Data Augmentation in Low-Resource NLPYufei Wang 0003, Jiayi Zheng, Can Xu, Xiubo Geng, Tao Shen 0001, Chongyang Tao, Daxin Jiang. [doi]

Boosting Causal Discovery via Adaptive Sample ReweightingAn Zhang 0003, Fangfu Liu, Wenchang Ma, Zhibo Cai, Xiang Wang 0010, Tat-Seng Chua. [doi]

SeaFormer: Squeeze-enhanced Axial Transformer for Mobile Semantic SegmentationQiang Wan, Zilong Huang, Jiachen Lu, Gang Yu, Li Zhang 0001. [doi]

Mosaic Representation Learning for Self-supervised Visual Pre-trainingZhaoqing Wang, Ziyu Chen, Yaqian Li, Yandong Guo, Jun Yu 0002, Mingming Gong, Tongliang Liu. [doi]

Fast and Precise: Adjusting Planning Horizon with Adaptive Subgoal SearchMichal Zawalski, Michal Tyrolski, Konrad Czechowski, Tomasz Odrzygózdz, Damian Stachura, Piotr Piekos, Yuhuai Wu, Lukasz Kucinski, Piotr Milos. [doi]

Memory Gym: Partially Observable Challenges to Memory-Based AgentsMarco Pleines, Matthias Pallasch, Frank Zimmer, Mike Preuss. [doi]

Causal Reasoning in the Presence of Latent Confounders via Neural ADMG LearningMatthew Ashman, Chao Ma 0019, Agrin Hilmkil, Joel Jennings, Cheng Zhang. [doi]

Long-Tailed Partial Label Learning via Dynamic RebalancingFeng Hong 0004, Jiangchao Yao, Zhihan Zhou 0002, Ya Zhang 0002, Yanfeng Wang. [doi]

The hidden uniform cluster prior in self-supervised learningMido Assran, Randall Balestriero, Quentin Duval, Florian Bordes, Ishan Misra, Piotr Bojanowski, Pascal Vincent, Michael G. Rabbat, Nicolas Ballas. [doi]

Understanding Why Generalized Reweighting Does Not Improve Over ERMRuntian Zhai, Chen Dan 0001, J. Zico Kolter, Pradeep Kumar Ravikumar. [doi]

Learning to Extrapolate: A Transductive ApproachAviv Netanyahu, Abhishek Gupta 0004, Max Simchowitz, Kaiqing Zhang, Pulkit Agrawal. [doi]

Multi-task Self-supervised Graph Neural Networks Enable Stronger Task GeneralizationMingxuan Ju, Tong Zhao 0003, Qianlong Wen, Wenhao Yu 0002, Neil Shah, Yanfang Ye 0001, Chuxu Zhang. [doi]

Diffusion Policies as an Expressive Policy Class for Offline Reinforcement LearningZhendong Wang, Jonathan J. Hunt, Mingyuan Zhou. [doi]

Basic Binary Convolution Unit for Binarized Image Restoration NetworkBin Xia, Yulun Zhang, Yitong Wang, Yapeng Tian, Wenming Yang, Radu Timofte, Luc Van Gool. [doi]

Expressive Monotonic Neural NetworksNiklas Nolte, Ouail Kitouni, Mike Williams. [doi]

Revisiting the Assumption of Latent Separability for Backdoor DefensesXiangyu Qi, Tinghao Xie, Yiming Li, Saeed Mahloujifar, Prateek Mittal. [doi]

Understanding DDPM Latent Codes Through Optimal TransportValentin Khrulkov, Gleb V. Ryzhakov, Andrei Chertkov, Ivan V. Oseledets. [doi]

Protein Sequence and Structure Co-Design with Equivariant TranslationChence Shi, Chuanrui Wang, Jiarui Lu, Bozitao Zhong, Jian Tang 0005. [doi]

Is Synthetic Data from Generative Models Ready for Image Recognition?Ruifei He, Shuyang Sun, Xin Yu 0004, Chuhui Xue, Wenqing Zhang, Philip H. S. Torr, Song Bai, Xiaojuan Qi. [doi]

Complexity-Based Prompting for Multi-step ReasoningYao Fu, Hao Peng, Ashish Sabharwal, Peter Clark, Tushar Khot. [doi]

Accelerating Guided Diffusion Sampling with Splitting Numerical MethodsSuttisak Wizadwongsa, Supasorn Suwajanakorn. [doi]

Autoregressive Conditional Neural ProcessesWessel P. Bruinsma, Stratis Markou, James Requeima, Andrew Y. K. Foong, Tom R. Andersson, Anna Vaughan, Anthony Buonomo, J. Scott Hosking, Richard E. Turner. [doi]

Online Low Rank Matrix CompletionSoumyabrata Pal, Prateek Jain 0002. [doi]

Deep Ensembles for Graphs with Higher-order DependenciesSteven J. Krieg, William C. Burgis, Patrick M. Soga, Nitesh V. Chawla. [doi]

Classically Approximating Variational Quantum Machine Learning with Random Fourier FeaturesJonas Landman, Slimane Thabet, Constantin Dalyac, Hela Mhiri, Elham Kashefi. [doi]

BC-IRL: Learning Generalizable Reward Functions from DemonstrationsAndrew Szot, Amy Zhang 0001, Dhruv Batra, Zsolt Kira, Franziska Meier. [doi]

Making Substitute Models More Bayesian Can Enhance Transferability of Adversarial ExamplesQizhang Li, Yiwen Guo, Wangmeng Zuo, Hao Chen 0003. [doi]

Relational Attention: Generalizing Transformers for Graph-Structured TasksCameron Diao, Ricky Loynd. [doi]

Online Boundary-Free Continual Learning by Scheduled Data PriorHyunseo Koh, Minhyuk Seo, Jihwan Bang, Hwanjun Song, Deokki Hong, Seulki Park, Jung-Woo Ha 0001, Jonghyun Choi. [doi]

Part-Based Models Improve Adversarial RobustnessChawin Sitawarin, Kornrapat Pongmala, Yizheng Chen 0001, Nicholas Carlini, David A. Wagner 0001. [doi]

FedDAR: Federated Domain-Aware Representation LearningAoxiao Zhong, Hao He, Zhaolin Ren, Na Li 0002, Quanzheng Li. [doi]

Offline Q-learning on Diverse Multi-Task Data Both Scales And GeneralizesAviral Kumar, Rishabh Agarwal, Xinyang Geng, George Tucker, Sergey Levine. [doi]

Revisiting Graph Adversarial Attack and Defense From a Data Distribution PerspectiveKuan Li, Yang Liu 0200, Xiang Ao 0001, Qing He 0003. [doi]

Learning Hierarchical Protein Representations via Complete 3D Graph NetworksLimei Wang, Haoran Liu, Yi Liu, Jerry Kurtin, Shuiwang Ji. [doi]

Matching receptor to odorant with protein language and graph neural networksMatej Hladis, Maxence Lalis, Sébastien Fiorucci, Jérémie Topin. [doi]

Learning Simultaneous Navigation and Construction in Grid WorldsWenyu Han, Haoran Wu, Eisuke Hirota, Alexander Gao, Lerrel Pinto, Ludovic Righetti, Chen Feng 0002. [doi]

Building Normalizing Flows with Stochastic InterpolantsMichael S. Albergo, Eric Vanden-Eijnden. [doi]

Better Generative Replay for Continual Federated LearningDaiqing Qi, Handong Zhao, Sheng Li 0001. [doi]

PLOT: Prompt Learning with Optimal Transport for Vision-Language ModelsGuangyi Chen 0002, Weiran Yao, Xiangchen Song, Xinyue Li, Yongming Rao, Kun Zhang 0001. [doi]

Is Forgetting Less a Good Inductive Bias for Forward Transfer?Jiefeng Chen 0001, Timothy Nguyen, Dilan Görür, Arslan Chaudhry. [doi]

Why adversarial training can hurt robust accuracyJacob Clarysse, Julia Hörrmann, Fanny Yang. [doi]

DySR: Adaptive Super-Resolution via Algorithm and System Co-designSyed Zawad, Cheng Li 0001, Zhewei Yao, Elton Zheng, Yuxiong He, Feng Yan 0001. [doi]

Re-parameterizing Your Optimizers rather than ArchitecturesXiaohan Ding, Honghao Chen, Xiangyu Zhang 0005, Kaiqi Huang, Jungong Han, Guiguang Ding. [doi]

MocoSFL: enabling cross-client collaborative self-supervised learningJingtao Li, Lingjuan Lyu, Daisuke Iso, Chaitali Chakrabarti, Michael Spranger. [doi]

Mole-BERT: Rethinking Pre-training Graph Neural Networks for MoleculesJun Xia, Chengshuai Zhao, Bozhen Hu, Zhangyang Gao, Cheng Tan 0012, Yue Liu, Siyuan Li, Stan Z. Li. [doi]

Leveraging Importance Weights in Subset SelectionGui Citovsky, Giulia DeSalvo, Sanjiv Kumar, Srikumar Ramalingam, Afshin Rostamizadeh, Yunjuan Wang. [doi]

Deep Learning on Implicit Neural Representations of ShapesLuca De Luigi, Adriano Cardace, Riccardo Spezialetti, Pierluigi Zama Ramirez, Samuele Salti, Luigi di Stefano. [doi]

Single-shot General Hyper-parameter Optimization for Federated LearningYi Zhou 0015, Parikshit Ram, Theodoros Salonidis, Nathalie Baracaldo, Horst Samulowitz, Heiko Ludwig. [doi]

Out-of-distribution Detection with Implicit Outlier TransformationQizhou Wang, Junjie Ye, Feng Liu 0003, Quanyu Dai, Marcus Kalander, Tongliang Liu, Jianye Hao, Bo Han 0003. [doi]

Revisiting the Entropy Semiring for Neural Speech RecognitionOscar Chang, Dongseong Hwang, Olivier Siohan. [doi]

What Makes Convolutional Models Great on Long Sequence Modeling?Yuhong Li, Tianle Cai, Yi Zhang, Deming Chen, Debadeepta Dey. [doi]

Benchmarking Offline Reinforcement Learning on Real-Robot HardwareNico Gürtler, Sebastian Blaes, Pavel Kolev, Felix Widmaier, Manuel Wuthrich, Stefan Bauer, Bernhard Schölkopf, Georg Martius. [doi]

Dataset Pruning: Reducing Training Data by Examining Generalization InfluenceShuo Yang 0006, Zeke Xie, Hanyu Peng, Min Xu 0001, Mingming Sun, Ping Li 0001. [doi]

STREET: A Multi-Task Structured Reasoning and Explanation BenchmarkDanilo Neves Ribeiro, Shen Wang 0005, Xiaofei Ma, Henghui Zhu, Rui Dong, Deguang Kong, Juliette Burger, Anjelica Ramos, Zhiheng Huang, William Yang Wang, George Karypis, Bing Xiang, Dan Roth. [doi]

Distributional Meta-Gradient Reinforcement LearningHaiyan Yin, Shuicheng Yan, Zhongwen Xu. [doi]

The Provable Benefit of Unsupervised Data Sharing for Offline Reinforcement LearningHao Hu 0006, Yiqin Yang, Qianchuan Zhao, Chongjie Zhang. [doi]

Learning Math Reasoning from Self-Sampled Correct and Partially-Correct SolutionsAnsong Ni, Jeevana Priya Inala, Chenglong Wang, Alex Polozov, Christopher Meek, Dragomir Radev, Jianfeng Gao. [doi]

On the Sensitivity of Reward Inference to Misspecified Human ModelsJoey Hong, Kush Bhatia, Anca D. Dragan. [doi]

Dirichlet-based Uncertainty Calibration for Active Domain AdaptationMixue Xie, Shuang Li 0008, Rui Zhang, Chi Harold Liu. [doi]

Flow Matching for Generative ModelingYaron Lipman, Ricky T. Q. Chen, Heli Ben Hamu, Maximilian Nickel, Matthew Le. [doi]

Neural Agents Struggle to Take Turns in Bidirectional Emergent CommunicationValentin Taillandier, Dieuwke Hupkes, Benoît Sagot, Emmanuel Dupoux, Paul Michel. [doi]

E-CRF: Embedded Conditional Random Field for Boundary-caused Class Weights Confusion in Semantic SegmentationJie Zhu, Huabin Huang, Banghuai Li, Leye Wang. [doi]

UL2: Unifying Language Learning ParadigmsYi Tay, Mostafa Dehghani 0001, Vinh Q. Tran 0002, Xavier Garcia, Jason Wei, Xuezhi Wang 0002, Hyung Won Chung, Dara Bahri, Tal Schuster, Huaixiu Steven Zheng, Denny Zhou, Neil Houlsby, Donald Metzler. [doi]

Imitating Human Behaviour with Diffusion ModelsTim Pearce, Tabish Rashid, Anssi Kanervisto, David Bignell, Mingfei Sun, Raluca Georgescu, Sergio Valcarcel Macua, Shan Zheng Tan, Ida Momennejad, Katja Hofmann, Sam Devlin. [doi]

Scaling Pareto-Efficient Decision Making via Offline Multi-Objective RLBaiting Zhu, Meihua Dang, Aditya Grover. [doi]

Jointly Learning Visual and Auditory Speech Representations from Raw DataAlexandros Haliassos, Pingchuan Ma 0001, Rodrigo Mira, Stavros Petridis, Maja Pantic. [doi]

Memorization Capacity of Neural Networks with Conditional ComputationErdem Koyuncu. [doi]

Soft Neighbors are Positive Supporters in Contrastive Visual Representation LearningChongjian Ge, Jiangliu Wang, Zhan Tong, Shoufa Chen, Yibing Song, Ping Luo 0002. [doi]

Spherical Sliced-WassersteinClément Bonet, Paul Berg, Nicolas Courty, François Septier, Lucas Drumetz, Minh-Tan Pham. [doi]

Fairness-aware Contrastive Learning with Partially Annotated Sensitive AttributesFengda Zhang, Kun Kuang, Long Chen 0016, Yuxuan Liu, Chao Wu 0001, Jun Xiao 0001. [doi]

BEEF: Bi-Compatible Class-Incremental Learning via Energy-Based Expansion and FusionFu-Yun Wang, Da-Wei Zhou 0001, Liu Liu, Han-Jia Ye, Yatao Bian, De-Chuan Zhan, Peilin Zhao. [doi]

How I Learned to Stop Worrying and Love RetrainingMax Zimmer, Christoph Spiegel 0002, Sebastian Pokutta. [doi]

Learning where and when to reason in neuro-symbolic inferenceCristina Cornelio, Jan Stuehmer, Shell Xu Hu, Timothy M. Hospedales. [doi]

Generating Sequences by Learning to Self-CorrectSean Welleck, Ximing Lu, Peter West, Faeze Brahman, Tianxiao Shen, Daniel Khashabi, Yejin Choi 0001. [doi]

Representation Learning for Low-rank General-sum Markov GamesChengzhuo Ni, Yuda Song 0001, Xuezhou Zhang, Zihan Ding, Chi Jin, Mengdi Wang. [doi]

Pruning Deep Neural Networks from a Sparsity PerspectiveEnmao Diao, Ganghua Wang, Jiawei Zhang, Yuhong Yang 0002, Jie Ding 0002, Vahid Tarokh. [doi]

Protein Representation Learning by Geometric Structure PretrainingZuobai Zhang, Minghao Xu, Arian Rokkum Jamasb, Vijil Chenthamarakshan, Aurélie C. Lozano, Payel Das, Jian Tang 0005. [doi]

Learning Cut Selection for Mixed-Integer Linear Programming via Hierarchical Sequence ModelZhihai Wang, Xijun Li, Jie Wang 0005, Yufei Kuang, Mingxuan Yuan, Jia Zeng, Yongdong Zhang 0001, Feng Wu 0001. [doi]

Human Motion Diffusion ModelGuy Tevet, Sigal Raab, Brian Gordon, Yonatan Shafir, Daniel Cohen-Or, Amit Haim Bermano. [doi]

Learning Label Encodings for Deep RegressionDeval Shah, Tor M. Aamodt. [doi]

Kernel Neural Optimal TransportAlexander Korotin, Daniil Selikhanovych, Evgeny Burnaev. [doi]

Continuized Acceleration for Quasar Convex Functions in Non-Convex OptimizationJun-Kun Wang, Andre Wibisono. [doi]

CLIP-ViP: Adapting Pre-trained Image-Text Model to Video-Language AlignmentHongwei Xue, Yuchong Sun, Bei Liu 0001, Jianlong Fu, Ruihua Song, Houqiang Li, Jiebo Luo. [doi]

Is Adversarial Training Really a Silver Bullet for Mitigating Data Poisoning?Rui Wen 0002, Zhengyu Zhao 0001, Zhuoran Liu 0001, Michael Backes 0001, Tianhao Wang 0001, Yang Zhang 0016. [doi]

A Graph Neural Network Approach to Automated Model Building in Cryo-EM MapsKiarash Jamali, Dari Kimanius, Sjors H. W. Scheres. [doi]

Learning Harmonic Molecular Representations on Riemannian ManifoldYiqun Wang, Yuning Shen, Shi Chen, Lihao Wang, Fei Ye, Hao Zhou. [doi]

A new characterization of the edge of stability based on a sharpness measure aware of batch gradient distributionSungyoon Lee, Cheongjae Jang. [doi]

In-sample Actor Critic for Offline Reinforcement LearningHongchang Zhang, Yixiu Mao, Boyuan Wang, Shuncheng He, Yi Xu, Xiangyang Ji. [doi]

Self-Supervised Category-Level Articulated Object Pose Estimation with Part-Level SE(3) EquivarianceXueyi Liu, Ji Zhang, Ruizhen Hu, Haibin Huang, He Wang 0010, Li Yi. [doi]

Population-size-Aware Policy Optimization for Mean-Field GamesPengdeng Li, Xinrun Wang, Shuxin Li, Hau Chan, Bo An 0001. [doi]

Approximate Vanishing Ideal Computations at ScaleElias Samuel Wirth, Hiroshi Kera, Sebastian Pokutta. [doi]

Energy-Based Test Sample Adaptation for Domain GeneralizationZehao Xiao, Xiantong Zhen, ShengCai Liao, Cees G. M. Snoek. [doi]

Phase2vec: dynamical systems embedding with a physics-informed convolutional networkMatthew Ricci, Noa Moriel, Zoe Piran, Mor Nitzan. [doi]

CodeGen: An Open Large Language Model for Code with Multi-Turn Program SynthesisErik Nijkamp, Bo Pang, Hiroaki Hayashi, Lifu Tu, Huan Wang, Yingbo Zhou, Silvio Savarese, Caiming Xiong. [doi]

Efficient Certified Training and Robustness Verification of Neural ODEsMustafa Zeqiri, Mark Niklas Müller, Marc Fischer 0002, Martin T. Vechev. [doi]

Machine Unlearning of Federated ClustersChao Pan 0003, Jin Sima, Saurav Prakash, Vishal Rana, Olgica Milenkovic. [doi]

Fooling SHAP with Stealthily Biased SamplingGabriel Laberge, Ulrich Aïvodji, Satoshi Hara 0001, Mario Marchand, Foutse Khomh. [doi]

Learning with Stochastic OrdersCarles Domingo-Enrich, Yair Schiff, Youssef Mroueh. [doi]

BEVDistill: Cross-Modal BEV Distillation for Multi-View 3D Object DetectionZehui Chen, Zhenyu Li, Shiquan Zhang, Liangji Fang, Qinhong Jiang, Feng Zhao. [doi]

A Higher Precision Algorithm for Computing the $1$-Wasserstein DistancePankaj K. Agarwal, Sharath Raghvendra, Pouyan Shirzadian, Rachita Sowle. [doi]

Measuring Forgetting of Memorized Training ExamplesMatthew Jagielski, Om Thakkar 0001, Florian Tramèr, Daphne Ippolito, Katherine Lee, Nicholas Carlini, Eric Wallace, Shuang Song 0001, Abhradeep Guha Thakurta, Nicolas Papernot, Chiyuan Zhang. [doi]

Scaleformer: Iterative Multi-scale Refining Transformers for Time Series ForecastingMohammad Amin Shabani, Amir H. Abdi, Lili Meng, Tristan Sylvain. [doi]

Towards Better Selective ClassificationLeo Feng, Mohamed Osama Ahmed, Hossein Hajimirsadeghi, Amir H. Abdi. [doi]

A Kernel Perspective of Skip Connections in Convolutional NetworksDaniel Barzilai, Amnon Geifman, Meirav Galun, Ronen Basri. [doi]

Semi-Parametric Inducing Point Networks and Neural ProcessesRicha Rastogi, Yair Schiff, Alon Hacohen, Zhaozhi Li, Ian Lee, Yuntian Deng, Mert R. Sabuncu, Volodymyr Kuleshov. [doi]

A law of adversarial risk, interpolation, and label noiseDaniel Paleka, Amartya Sanyal. [doi]

Proposal-Contrastive Pretraining for Object Detection from Fewer DataQuentin Bouniot, Romaric Audigier, Angélique Loesch, Amaury Habrard. [doi]

Automated Data Augmentations for Graph ClassificationYouzhi Luo, Michael McThrow, Wing Yee Au, Tao Komikado, Kanji Uchino, Koji Maruhashi, Shuiwang Ji. [doi]

Robust Algorithms on Adaptive Inputs from Bounded AdversariesYeshwanth Cherapanamjeri, Sandeep Silwal, David P. Woodruff, Fred Zhang, Qiuyi Zhang 0001, Samson Zhou. [doi]

Diffusion Models Already Have A Semantic Latent SpaceMingi Kwon, Jaeseok Jeong, Youngjung Uh. [doi]

Measuring axiomatic soundness of counterfactual image modelsMiguel Monteiro, Fabio De Sousa Ribeiro, Nick Pawlowski, Daniel C. Castro, Ben Glocker. [doi]

Adaptive Robust Evidential Optimization For Open Set Detection from Imbalanced DataHitesh Sapkota, Qi Yu 0001. [doi]

Multimodal Analogical Reasoning over Knowledge GraphsNingyu Zhang 0001, Lei Li 0040, Xiang Chen 0016, Xiaozhuan Liang, Shumin Deng, Huajun Chen. [doi]

Sequential Attention for Feature SelectionTaisuke Yasuda 0002, Mohammad Hossein Bateni 0001, Lin Chen, Matthew Fahrbach, Gang Fu, Vahab Mirrokni. [doi]

A System for Morphology-Task Generalization via Unified Representation and Behavior DistillationHiroki Furuta, Yusuke Iwasawa, Yutaka Matsuo, Shixiang Shane Gu. [doi]

FairGBM: Gradient Boosting with Fairness ConstraintsAndré Ferreira Cruz, Catarina Belém, João Bravo, Pedro Saleiro, Pedro Bizarro. [doi]

Learning to Linearize Deep Neural Networks for Secure and Efficient Private InferenceSouvik Kundu 0002, Shunlin Lu, Yuke Zhang, Jacqueline Tiffany Liu, Peter A. Beerel. [doi]

Characterizing the spectrum of the NTK via a power series expansionMichael Murray, Hui Jin, Benjamin Bowman, Guido Montúfar. [doi]

3D generation on ImageNetIvan Skorokhodov, Aliaksandr Siarohin, Yinghao Xu, Jian Ren, Hsin-Ying Lee, Peter Wonka, Sergey Tulyakov. [doi]

Rotamer Density Estimator is an Unsupervised Learner of the Effect of Mutations on Protein-Protein InteractionShitong Luo, Yufeng Su, Zuofan Wu, Chenpeng Su, Jian Peng 0001, Jianzhu Ma. [doi]

Continual Pre-training of Language ModelsZixuan Ke, Yijia Shao, Haowei Lin, Tatsuya Konishi, Gyuhak Kim, Bing Liu 0001. [doi]

Text Summarization with Oracle ExpectationYumo Xu, Mirella Lapata. [doi]

CO3: Cooperative Unsupervised 3D Representation Learning for Autonomous DrivingRunjian Chen, Yao Mu, Runsen Xu, Wenqi Shao, Chenhan Jiang, Hang Xu, Yu Qiao 0001, Zhenguo Li, Ping Luo 0002. [doi]

DINO: DETR with Improved DeNoising Anchor Boxes for End-to-End Object DetectionHao Zhang 0097, Feng Li, Shilong Liu, Lei Zhang 0001, Hang Su 0006, Jun Zhu 0001, Lionel M. Ni, Heung-Yeung Shum. [doi]

D4AM: A General Denoising Framework for Downstream Acoustic ModelsChi-Chang Lee, Yu Tsao 0001, Hsin-Min Wang, Chu-Song Chen. [doi]

Towards convergence to Nash equilibria in two-team zero-sum gamesFivos Kalogiannis, Ioannis Panageas, Emmanouil-Vasileios Vlatakis-Gkaragkounis. [doi]

MEDICAL IMAGE UNDERSTANDING WITH PRETRAINED VISION LANGUAGE MODELS: A COMPREHENSIVE STUDYZiyuan Qin, Huahui Yi, Qicheng Lao, Kang Li 0006. [doi]

Does Zero-Shot Reinforcement Learning Exist?Ahmed Touati, Jérémy Rapin, Yann Ollivier. [doi]

Impossibly Good Experts and How to Follow ThemAaron Walsman, Muru Zhang, Sanjiban Choudhury, Dieter Fox, Ali Farhadi. [doi]

Hierarchical Abstraction for Combinatorial Generalization in Object RearrangementMichael Chang 0003, Alyssa L. Dayan, Franziska Meier, Thomas L. Griffiths 0001, Sergey Levine, Amy Zhang 0001. [doi]

One Transformer Can Understand Both 2D & 3D Molecular DataShengjie Luo, Tianlang Chen, Yixian Xu, Shuxin Zheng, Tie-Yan Liu, Liwei Wang 0001, Di He. [doi]

Learning to reason over visual objectsShanka Subhra Mondal, Taylor Whittington Webb, Jonathan Cohen 0003. [doi]

GFlowNets and variational inferenceNikolay Malkin, Salem Lahlou, Tristan Deleu, Xu Ji, Edward J. Hu, Katie Everett, Dinghuai Zhang, Yoshua Bengio. [doi]

PerFedMask: Personalized Federated Learning with Optimized Masking VectorsMehdi Setayesh, Xiaoxiao Li, Vincent W. S. Wong 0001. [doi]

Model-based Causal Bayesian OptimizationScott Sussex, Anastasia Makarova, Andreas Krause 0001. [doi]

Finding Actual Descent Directions for Adversarial TrainingFabian Latorre, Igor Krawczuk, Leello Tadesse Dadi, Thomas Pethick, Volkan Cevher. [doi]

Promptagator: Few-shot Dense Retrieval From 8 ExamplesZhuyun Dai, Vincent Y. Zhao, Ji Ma, Yi Luan, Jianmo Ni, Jing Lu, Anton Bakalov, Kelvin Guu, Keith B. Hall, Ming-Wei Chang. [doi]

LAVA: Data Valuation without Pre-Specified Learning AlgorithmsHoang Anh Just, Feiyang Kang, Tianhao Wang 0013, Yi Zeng, Myeongseob Ko, Ming Jin 0002, Ruoxi Jia. [doi]

Rethinking Self-Supervised Visual Representation Learning in Pre-training for 3D Human Pose and Shape EstimationHongsuk Choi, Hyeongjin Nam, Taeryung Lee, Gyeongsik Moon, Kyoung Mu Lee. [doi]

On The Inadequacy of Optimizing Alignment and Uniformity in Contrastive Learning of Sentence RepresentationsZhijie Nie, Richong Zhang, Yongyi Mao. [doi]

Betty: An Automatic Differentiation Library for Multilevel OptimizationSang Keun Choe, Willie Neiswanger, Pengtao Xie, Eric P. Xing. [doi]

Optimizing Bi-Encoder for Named Entity Recognition via Contrastive LearningSheng Zhang 0012, Hao Cheng 0002, Jianfeng Gao, Hoifung Poon. [doi]

Learning Uncertainty for Unknown Domains with Zero-Target-AssumptionYu Yu 0004, Hassan Sajjad, Jia Xu 0004. [doi]

Scale-invariant Bayesian Neural Networks with Connectivity Tangent KernelSungyub Kim, Sihwan Park, Kyung-Su Kim 0002, Eunho Yang. [doi]

Reliability of CKA as a Similarity Measure in Deep LearningMohammadReza Davari, Stefan Horoi, Amine Natik, Guillaume Lajoie, Guy Wolf, Eugene Belilovsky. [doi]

Continuous PDE Dynamics Forecasting with Implicit Neural RepresentationsYuan Yin, Matthieu Kirchmeyer, Jean-Yves Franceschi, Alain Rakotomamonjy, Patrick Gallinari. [doi]

Monocular Scene Reconstruction with 3D SDF TransformersWeihao Yuan, Xiaodong Gu 0004, Heng Li, Zilong Dong, Siyu Zhu 0001. [doi]

A Simple Approach for Visual Room Rearrangement: 3D Mapping and Semantic SearchBrandon Trabucco, Gunnar A. Sigurdsson, Robinson Piramuthu, Gaurav S. Sukhatme, Ruslan Salakhutdinov. [doi]

Self-Distillation for Further Pre-training of TransformersSeanie Lee, Minki Kang, Juho Lee 0001, Sung Ju Hwang, Kenji Kawaguchi. [doi]

Understanding the Generalization of Adam in Learning Neural Networks with Proper RegularizationDifan Zou, Yuan Cao 0006, Yuanzhi Li, Quanquan Gu. [doi]

Test-Time Robust Personalization for Federated LearningLiangze Jiang, Tao Lin. [doi]

Zeroth-Order Optimization with Trajectory-Informed Derivative EstimationYao Shu, Zhongxiang Dai, Weicong Sng, Arun Verma, Patrick Jaillet, Bryan Kian Hsiang Low. [doi]

Self-Supervised Geometric Correspondence for Category-Level 6D Object Pose Estimation in the WildKaifeng Zhang, Yang Fu, Shubhankar Borse, Hong Cai, Fatih Porikli, Xiaolong Wang 0004. [doi]

Implicit regularization in Heavy-ball momentum accelerated stochastic gradient descentAvrajit Ghosh, He Lyu, Xitong Zhang, Rongrong Wang. [doi]

SE(3)-Equivariant Attention Networks for Shape Reconstruction in Function SpaceEvangelos Chatzipantazis, Stefanos Pertigkiozoglou, Edgar Dobriban, Kostas Daniilidis. [doi]

Uniform-in-time propagation of chaos for the mean-field gradient Langevin dynamicsTaiji Suzuki, Atsushi Nitanda, Denny Wu. [doi]

Learning Continuous Normalizing Flows For Faster Convergence To Target Distribution via Ascent RegularizationsShuangshuang Chen, Sihao Ding 0002, Yiannis Karayiannidis, Mårten Björkman. [doi]

Learning About Progress From ExpertsJake Bruce, Ankit Anand, Bogdan Mazoure, Rob Fergus. [doi]

Pseudoinverse-Guided Diffusion Models for Inverse ProblemsJiaming Song, Arash Vahdat, Morteza Mardani, Jan Kautz. [doi]

SCoMoE: Efficient Mixtures of Experts with Structured CommunicationZhiyuan Zeng, Deyi Xiong. [doi]

Emergence of Maps in the Memories of Blind Navigation AgentsErik Wijmans, Manolis Savva, Irfan Essa, Stefan Lee, Ari S. Morcos, Dhruv Batra. [doi]

AudioGen: Textually Guided Audio GenerationFelix Kreuk, Gabriel Synnaeve, Adam Polyak, Uriel Singer, Alexandre Défossez, Jade Copet, Devi Parikh, Yaniv Taigman, Yossi Adi. [doi]

Improved Sample Complexity for Reward-free Reinforcement Learning under Low-rank MDPsYuan Cheng, Ruiquan Huang, Yingbin Liang, Jing Yang 0002. [doi]

Provable Defense Against Geometric TransformationsRem Yang, Jacob Laurel, Sasa Misailovic, Gagandeep Singh 0001. [doi]

Planning with Large Language Models for Code GenerationShun Zhang, Zhenfang Chen, Yikang Shen, Mingyu Ding, Joshua B. Tenenbaum, Chuang Gan. [doi]

Confidence Estimation Using Unlabeled DataChen Li, Xiaoling Hu, Chao Chen 0012. [doi]

How gradient estimator variance and bias impact learning in neural networksArna Ghosh, Yuhan Helena Liu, Guillaume Lajoie, Konrad P. Körding, Blake Aaron Richards. [doi]

BigVGAN: A Universal Neural Vocoder with Large-Scale TrainingSang Gil Lee, Wei Ping, Boris Ginsburg, Bryan Catanzaro, Sungroh Yoon. [doi]

Temporal Disentanglement of Representations for Improved Generalisation in Reinforcement LearningMhairi Dunion, Trevor McInroe, Kevin Sebastian Luck, Josiah P. Hanna, Stefano V. Albrecht. [doi]

E3Bind: An End-to-End Equivariant Network for Protein-Ligand DockingYangtian Zhang, Huiyu Cai, Chence Shi, Jian Tang 0005. [doi]

S-NeRF: Neural Radiance Fields for Street ViewsZiyang Xie, Junge Zhang, Wenye Li 0002, Feihu Zhang, Li Zhang 0001. [doi]

Accurate Bayesian Meta-Learning by Accurate Task Posterior InferenceMichael Volpp, Philipp Dahlinger, Philipp Becker, Christian Daniel, Gerhard Neumann. [doi]

Delving into Semantic Scale ImbalanceYanbiao Ma, Licheng Jiao, Fang Liu 0001, Yuxin Li, Shuyuan Yang, Xu Liu 0006. [doi]

Critic Sequential Monte CarloVasileios Lioutas, Jonathan Wilder Lavington, Justice Sefas, Matthew Niedoba, Yunpeng Liu 0007, Berend Zwartsenberg, Setareh Dabiri, Frank Wood, Adam Scibior. [doi]

Lossless Adaptation of Pretrained Vision Models For Robotic ManipulationMohit Sharma, Claudio Fantacci, Yuxiang Zhou, Skanda Koppula, Nicolas Heess, Jon Scholz, Yusuf Aytar. [doi]

-1 Convergence of Optimistic-Follow-the-Regularized-Leader in Two-Player Zero-Sum Markov GamesYuepeng Yang, Cong Ma. [doi]

Faster federated optimization under second-order similarityAhmed Khaled 0001, Chi Jin 0001. [doi]

FedFA: Federated Feature AugmentationTianfei Zhou, Ender Konukoglu. [doi]

A Control-Centric Benchmark for Video PredictionStephen Tian, Chelsea Finn, Jiajun Wu 0001. [doi]

StyleMorph: Disentangled 3D-Aware Image Synthesis with a 3D Morphable StyleGANEric-Tuan Le, Edward Bartrum, Iasonas Kokkinos. [doi]

Feature selection and low test error in shallow low-rotation ReLU networksMatus Telgarsky. [doi]

Self-Guided Noise-Free Data Generation for Efficient Zero-Shot LearningJiahui Gao, Renjie Pi, Yong Lin, Hang Xu, Jiacheng Ye, Zhiyong Wu 0003, Weizhong Zhang, Xiaodan Liang, Zhenguo Li, Lingpeng Kong. [doi]

Novel View Synthesis with Diffusion ModelsDaniel Watson, William Chan, Ricardo Martin-Brualla, Jonathan Ho, Andrea Tagliasacchi, Mohammad Norouzi 0002. [doi]

Toeplitz Neural Network for Sequence ModelingZhen Qin, Xiaodong Han, Weixuan Sun, Bowen He, Dong Li, Dongxu Li, Yuchao Dai, Lingpeng Kong, Yiran Zhong. [doi]

Error Sensitivity Modulation based Experience Replay: Mitigating Abrupt Representation Drift in Continual LearningFahad Sarfraz, Elahe Arani, Bahram Zonooz. [doi]

Iterative Patch Selection for High-Resolution Image RecognitionBenjamin Bergner, Christoph Lippert, Aravindh Mahendran. [doi]

Latent Bottlenecked Attentive Neural ProcessesLeo Feng, Hossein Hajimirsadeghi, Yoshua Bengio, Mohamed Osama Ahmed. [doi]

Offline Congestion Games: How Feedback Type Affects Data Coverage RequirementHaozhe Jiang, Qiwen Cui, Zhihan Xiong, Maryam Fazel, Simon Shaolei Du. [doi]

Conservative Bayesian Model-Based Value Expansion for Offline Policy OptimizationJihwan Jeong, Xiaoyu Wang, Michael Gimelfarb, Hyunwoo Kim, Baher Abdulhai, Scott Sanner. [doi]

Treeformer: Dense Gradient Trees for Efficient Attention ComputationLovish Madaan, Srinadh Bhojanapalli, Himanshu Jain, Prateek Jain 0002. [doi]

Approximate Bayesian Inference with Stein Functional Variational Gradient DescentTobias Pielok, Bernd Bischl, David Rügamer. [doi]

NANSY++: Unified Voice Synthesis with Neural Analysis and SynthesisHyeong-Seok Choi, Jinhyeok Yang, Juheon Lee, Hyeongju Kim. [doi]

Agnostic Learning of General ReLU Activation Using Gradient DescentPranjal Awasthi, Alex Tang, Aravindan Vijayaraghavan. [doi]

RandProx: Primal-Dual Optimization Algorithms with Randomized Proximal UpdatesLaurent Condat, Peter Richtárik. [doi]

Generate rather than Retrieve: Large Language Models are Strong Context GeneratorsWenhao Yu 0002, Dan Iter, Shuohang Wang, Yichong Xu, Mingxuan Ju, Soumya Sanyal 0001, Chenguang Zhu 0001, Michael Zeng 0001, Meng Jiang 0001. [doi]

Decomposed Prompting: A Modular Approach for Solving Complex TasksTushar Khot, Harsh Trivedi, Matthew Finlayson, Yao Fu, Kyle Richardson 0001, Peter Clark, Ashish Sabharwal. [doi]

Hybrid RL: Using both offline and online data can make RL efficientYuda Song 0001, Yifei Zhou, Ayush Sekhari, Drew Bagnell, Akshay Krishnamurthy, Wen Sun 0002. [doi]

Synthetic Data Generation of Many-to-Many Datasets via Random Graph GenerationKai Xu, Georgi Ganev, Emile Joubert, Rees Davison, Olivier Van Acker, Luke Robinson. [doi]

What shapes the loss landscape of self supervised learning?Ziyin Liu, Ekdeep Singh Lubana, Masahito Ueda, Hidenori Tanaka. [doi]

Riemannian Metric Learning via Optimal TransportChristopher Scarvelis, Justin Solomon 0001. [doi]

Learning to Estimate Shapley Values with Vision TransformersIan Connick Covert, Chanwoo Kim 0002, Su-In Lee. [doi]

Human-level Atari 200x fasterSteven Kapturowski, Victor Campos 0001, Ray Jiang, Nemanja Rakicevic, Hado van Hasselt, Charles Blundell, Adrià Puigdomènech Badia. [doi]

Equivariance-aware Architectural Optimization of Neural NetworksKaitlin Maile, Dennis George Wilson, Patrick Forré. [doi]

Confidential-PROFITT: Confidential PROof of FaIr Training of TreesAli Shahin Shamsabadi, Sierra Calanda Wyllie, Nicholas Franzese, Natalie Dullerud, Sébastien Gambs, Nicolas Papernot, Xiao Wang 0012, Adrian Weller. [doi]

Visual Classification via Description from Large Language ModelsSachit Menon, Carl Vondrick. [doi]

Projective Proximal Gradient Descent for Nonconvex Nonsmooth Optimization: Fast Convergence Without Kurdyka-Lojasiewicz (KL) PropertyYingzhen Yang, Ping Li 0001. [doi]

Multi-lingual Evaluation of Code Generation ModelsBen Athiwaratkun, Sanjay Krishna Gouda, Zijian Wang, Xiaopeng Li, Yuchen Tian, Ming Tan, Wasi Uddin Ahmad, Shiqi Wang 0002, Qing Sun, Mingyue Shang, Sujan Kumar Gonugondla, Hantian Ding, Varun Kumar, Nathan Fulton, Arash Farahani, Siddhartha Jain 0001, Robert Giaquinto, Haifeng Qian, Murali Krishna Ramanathan, Ramesh Nallapati. [doi]

Supervision Complexity and its Role in Knowledge DistillationHrayr Harutyunyan, Ankit Singh Rawat, Aditya Krishna Menon, Seungyeon Kim, Sanjiv Kumar. [doi]

Estimating individual treatment effects under unobserved confounding using binary instrumentsDennis Frauen, Stefan Feuerriegel. [doi]

Dual Student Networks for Data-Free Model StealingJames Beetham, Navid Kardan, Ajmal Saeed Mian, Mubarak Shah. [doi]

The Best of Both Worlds: Accurate Global and Personalized Models through Federated Learning with Data-Free Hyper-Knowledge DistillationHuancheng Chen, Chaining Wang, Haris Vikalo. [doi]

A framework for benchmarking Class-out-of-distribution detection and its application to ImageNetIdo Galil, Mohammed Dabbah, Ran El-Yaniv. [doi]

Learning Hyper Label Model for Programmatic Weak SupervisionRenzhi Wu, Shen-En Chen, Jieyu Zhang, Xu Chu. [doi]

Associative Memory Augmented Asynchronous Spatiotemporal Representation Learning for Event-based PerceptionUday Kamal, Saurabh Dash, Saibal Mukhopadhyay. [doi]

Truthful Self-PlayShohei Ohsawa. [doi]

PowerQuant: Automorphism Search for Non-Uniform QuantizationEdouard Yvinec, Arnaud Dapogny, Matthieu Cord, Kevin Bailly. [doi]

Diminishing Return of Value Expansion Methods in Model-Based Reinforcement LearningDaniel Palenicek, Michael Lutter, Joao Carvalho, Jan Peters 0001. [doi]

TabPFN: A Transformer That Solves Small Tabular Classification Problems in a SecondNoah Hollmann, Samuel Müller 0005, Katharina Eggensperger, Frank Hutter. [doi]

TiAda: A Time-scale Adaptive Algorithm for Nonconvex Minimax OptimizationXiang Li, Junchi Yang, Niao He. [doi]

Graph Neural Network-Inspired Kernels for Gaussian Processes in Semi-Supervised LearningZehao Niu, Mihai Anitescu, Jie Chen 0007. [doi]

Wasserstein Auto-encoded MDPs: Formal Verification of Efficiently Distilled RL Policies with Many-sided GuaranteesFlorent Delgrange, Ann Nowé, Guillermo A. Pérez 0001. [doi]

A General Framework For Proving The Equivariant Strong Lottery Ticket HypothesisDamien Ferbach, Christos Tsirigotis, Gauthier Gidel, Avishek Joey Bose. [doi]

The Onset of Variance-Limited Behavior for Networks in the Lazy and Rich RegimesAlexander Atanasov, Blake Bordelon, Sabarish Sainathan, Cengiz Pehlevan. [doi]

DocPrompting: Generating Code by Retrieving the DocsShuyan Zhou, Uri Alon 0002, Frank F. Xu, Zhengbao Jiang, Graham Neubig. [doi]

Sound Randomized Smoothing in Floating-Point ArithmeticVáclav Vorácek, Matthias Hein 0001. [doi]

Preserving Pre-trained Features Helps Calibrate Fine-tuned Language ModelsGuande He, Jianfei Chen, Jun Zhu. [doi]

GLM-130B: An Open Bilingual Pre-trained ModelAohan Zeng, Xiao Liu, Zhengxiao Du, Zihan Wang, Hanyu Lai, Ming Ding 0004, Zhuoyi Yang, Yifan Xu, Wendi Zheng, Xiao Xia, Weng Lam Tam, Zixuan Ma, Yufei Xue, Jidong Zhai, Wenguang Chen, Zhiyuan Liu, Peng Zhang, Yuxiao Dong, Jie Tang 0001. [doi]

Disentangling Learning Representations with Density EstimationEric C. Yeats, Frank Y. Liu, Hai Li. [doi]

Towards Understanding and Mitigating Dimensional Collapse in Heterogeneous Federated LearningYujun Shi, Jian Liang, Wenqing Zhang, Vincent Y. F. Tan, Song Bai. [doi]

Learning topology-preserving data representationsIlya Trofimov, Daniil Cherniavskii, Eduard Tulchinskii, Nikita Balabin, Evgeny Burnaev, Serguei Barannikov. [doi]

Fundamental Limits in Formal Verification of Message-Passing Neural NetworksMarco Sälzer, Martin Lange. [doi]

Quasi-optimal Reinforcement Learning with Continuous ActionsYuhan Li, Wenzhuo Zhou, Ruoqing Zhu. [doi]

Generalizing and Decoupling Neural Collapse via Hyperspherical Uniformity GapWeiyang Liu, Longhui Yu, Adrian Weller, Bernhard Schölkopf. [doi]

Accurate Neural Training with 4-bit Matrix Multiplications at Standard FormatsBrian Chmiel, Ron Banner, Elad Hoffer, Hilla Ben-Yaacov, Daniel Soudry. [doi]

Evidential Uncertainty and Diversity Guided Active Learning for Scene Graph GenerationShuzhou Sun, Shuaifeng Zhi, Janne Heikkilä, Li Liu. [doi]

Dilated convolution with learnable spacingsIsmail Khalfaoui Hassani, Thomas Pellegrini, Timothée Masquelier. [doi]

Minimum Description Length ControlTed Moskovitz, Ta-Chu Kao, Maneesh Sahani, Matt M. Botvinick. [doi]

Interaction-Based Disentanglement of Entities for Object-Centric World ModelsAkihiro Nakano, Masahiro Suzuki, Yutaka Matsuo. [doi]

Liquid Structural State-Space ModelsRamin M. Hasani, Mathias Lechner, Tsun-Hsuan Wang, Makram Chahine, Alexander Amini, Daniela Rus. [doi]

Integrating Symmetry into Differentiable Planning with Steerable ConvolutionsLinfeng Zhao, Xupeng Zhu, Lingzhi Kong, Robin Walters, Lawson L. S. Wong. [doi]

NTK-SAP: Improving neural network pruning by aligning training dynamicsYite Wang, Dawei Li, Ruoyu Sun 0001. [doi]

Guiding continuous operator learning through Physics-based boundary constraintsNadim Saad, Gaurav Gupta, Shima Alizadeh, Danielle C. Maddix. [doi]

Real-time variational method for learning neural trajectory and its dynamicsMatthew Dowling, Yuan Zhao 0004, Il Memming Park. [doi]

Sequential Latent Variable Models for Few-Shot High-Dimensional Time-Series ForecastingXiajun Jiang, Ryan Missel, Zhiyuan Li, Linwei Wang. [doi]

Spatial Attention Kinetic Networks with E(n)-EquivarianceYuanqing Wang, John D. Chodera. [doi]

Transformer-based model for symbolic regression via joint supervised learningWenqiang Li, Weijun Li, Linjun Sun, Min Wu, Lina Yu, Jingyi Liu, Yanjie Li, Songsong Tian. [doi]

WiNeRT: Towards Neural Ray Tracing for Wireless Channel Modelling and Differentiable SimulationsTribhuvanesh Orekondy, Kumar Pratik, Shreya Kadambi, Hao Ye, Joseph Soriaga, Arash Behboodi. [doi]

Timing is Everything: Learning to Act Selectively with Costly Actions and Budgetary ConstraintsDavid Henry Mguni, Aivar Sootla, Juliusz Ziomek, Oliver Slumbers, Zipeng Dai, Kun Shao, Jun Wang 0012. [doi]

Self-Stabilization: The Implicit Bias of Gradient Descent at the Edge of StabilityAlex Damian, Eshaan Nichani, Jason D. Lee. [doi]

MICN: Multi-scale Local and Global Context Modeling for Long-term Series ForecastingHuiqiang Wang, Jian Peng 0002, Feihu Huang, Jince Wang, Junhui Chen, Yifei Xiao. [doi]

How Informative is the Approximation Error from Tensor Decomposition for Neural Network Compression?Jetze Schuurmans, Kim Batselier, Julian F. P. Kooij. [doi]

Nonlinear Reconstruction for Operator Learning of PDEs with DiscontinuitiesSamuel Lanthaler, Roberto Molinaro, Patrik Hadorn, Siddhartha Mishra. [doi]

Incremental Learning of Structured Memory via Closed-Loop TranscriptionShengbang Tong, Xili Dai, Ziyang Wu, Mingyang Li, Brent Yi, Yi Ma 0001. [doi]

TEMPERA: Test-Time Prompt Editing via Reinforcement LearningTianjun Zhang, Xuezhi Wang 0002, Denny Zhou, Dale Schuurmans, Joseph E. Gonzalez. [doi]

PGrad: Learning Principal Gradients For Domain GeneralizationZhe Wang 0025, Jake Grigsby, Yanjun Qi. [doi]

Hungry Hungry Hippos: Towards Language Modeling with State Space ModelsDaniel Y. Fu, Tri Dao, Khaled Kamal Saab, Armin W. Thomas, Atri Rudra, Christopher Ré. [doi]

Real-Time Image Demoiréing on Mobile DevicesYuxin Zhang 0002, Mingbao Lin, Xunchao Li, Han Liu, Guozhi Wang, Fei Chao 0001, Shuai Ren, Yafei Wen, Xiaoxin Chen, Rongrong Ji. [doi]

Vision Transformer Adapter for Dense PredictionsZhe Chen, Yuchen Duan, Wenhai Wang, Junjun He, Tong Lu, Jifeng Dai, Yu Qiao. [doi]

From Play to Policy: Conditional Behavior Generation from Uncurated Robot DataZichen Jeff Cui, Yibin Wang, Nur Muhammad (Mahi) Shafiullah, Lerrel Pinto. [doi]

Adaptive Optimization in the ∞-Width LimitEtai Littwin, Greg Yang. [doi]

Excess Risk of Two-Layer ReLU Neural Networks in Teacher-Student Settings and its Superiority to Kernel MethodsShunta Akiyama, Taiji Suzuki. [doi]

Multifactor Sequential Disentanglement via Structured Koopman AutoencodersNimrod Berman, Ilan Naiman, Omri Azencot. [doi]

Spectral Decomposition Representation for Reinforcement LearningTongzheng Ren, Tianjun Zhang, Lisa Lee, Joseph E. Gonzalez, Dale Schuurmans, Bo Dai 0001. [doi]

On The Specialization of Neural ModulesDevon Jarvis, Richard Klein, Benjamin Rosman, Andrew M. Saxe. [doi]

TVSPrune - Pruning Non-discriminative filters via Total Variation separability of intermediate representations without fine tuningChaitanya Murti, Tanay Narshana, Chiranjib Bhattacharyya. [doi]

Hyper-Decision Transformer for Efficient Online Policy AdaptationMengdi Xu, Yuchen Lu, Yikang Shen, Shun Zhang, Ding Zhao, Chuang Gan. [doi]

Open-Vocabulary Object Detection upon Frozen Vision and Language ModelsWeicheng Kuo, Yin Cui, Xiuye Gu, A. J. Piergiovanni, Anelia Angelova. [doi]

Binding Language Models in Symbolic LanguagesZhoujun Cheng, Tianbao Xie, Peng Shi 0010, Chengzu Li, Rahul Nadkarni, Yushi Hu, Caiming Xiong, Dragomir Radev, Mari Ostendorf, Luke Zettlemoyer, Noah A. Smith, Tao Yu 0009. [doi]

Approximation and non-parametric estimation of functions over high-dimensional spheres via deep ReLU networksNamjoon Suh, Tian-Yi Zhou, Xiaoming Huo. [doi]

SIMPLE: A Gradient Estimator for k-Subset SamplingKareem Ahmed, Zhe Zeng, Mathias Niepert, Guy Van den Broeck. [doi]

Backstepping Temporal Difference LearningHan-Dong Lim, Donghwan Lee 0002. [doi]

Federated Neural BanditsZhongxiang Dai, Yao Shu, Arun Verma, Flint Xiaofeng Fan, Bryan Kian Hsiang Low, Patrick Jaillet. [doi]

On Compositional Uncertainty Quantification for Seq2seq Graph ParsingZi Lin, Du Phan, Panupong Pasupat, Jeremiah Zhe Liu, Jingbo Shang. [doi]

Learning to Compose Soft Prompts for Compositional Zero-Shot LearningNihal V. Nayak, Peilin Yu, Stephen H. Bach. [doi]

Bridging the Gap between ANNs and SNNs by Calibrating Offset SpikesZecheng Hao, Jianhao Ding, Tong Bu, Tiejun Huang 0001, Zhaofei Yu. [doi]

On the Perils of Cascading Robust ClassifiersRavi Mangal, Zifan Wang, Chi Zhang, Klas Leino, Corina S. Pasareanu, Matt Fredrikson. [doi]

Image to Sphere: Learning Equivariant Features for Efficient Pose PredictionDavid Klee, Ondrej Biza, Robert Platt, Robin Walters. [doi]

Generalization Bounds for Federated Learning: Fast Rates, Unparticipating Clients and Unbounded LossesXiaolin Hu, Shaojie Li, Yong Liu. [doi]

Does Deep Learning Learn to Abstract? A Systematic Probing FrameworkShengnan An, Zeqi Lin, Bei Chen, Qiang Fu, Nanning Zheng 0001, Jian-Guang Lou. [doi]

FoSR: First-order spectral rewiring for addressing oversquashing in GNNsKedar Karhadkar, Pradeep Kr. Banerjee, Guido Montúfar. [doi]

Graph Contrastive Learning for Skeleton-based Action RecognitionXiaohu Huang, Hao Zhou, Jian Wang, Haocheng Feng, Junyu Han, Errui Ding, Jingdong Wang 0001, Xinggang Wang, Wenyu Liu 0001, Bin Feng 0001. [doi]

Quantifying Memorization Across Neural Language ModelsNicholas Carlini, Daphne Ippolito, Matthew Jagielski, Katherine Lee, Florian Tramèr, Chiyuan Zhang. [doi]

Self-supervision through Random Segments with Autoregressive Coding (RandSAC)Tianyu Hua, Yonglong Tian, Sucheng Ren, Michalis Raptis, Hang Zhao, Leonid Sigal. [doi]

Graph-based Deterministic Policy Gradient for Repetitive Combinatorial Optimization ProblemsZhongyuan Zhao 0002, Ananthram Swami, Santiago Segarra. [doi]

Learning Probabilistic Topological Representations Using Discrete Morse TheoryXiaoling Hu 0002, Dimitris Samaras, Chao Chen 0012. [doi]

Discovering Informative and Robust Positives for Video Domain AdaptationChang Liu 0022, Kunpeng Li, Michael Stopa, Jun Amano, Yun Fu 0001. [doi]

Sampling-free Inference for Ab-Initio Potential Energy Surface NetworksNicholas Gao, Stephan Günnemann. [doi]

Copy is All You NeedTian Lan, Deng Cai 0002, Yan Wang, Heyan Huang, Xian-Ling Mao. [doi]

Performance Bounds for Model and Policy Transfer in Hidden-parameter MDPsHaotian Fu, Jiayu Yao, Omer Gottesman, Finale Doshi-Velez, George Konidaris 0001. [doi]

DiGress: Discrete Denoising diffusion for graph generationClément Vignac, Igor Krawczuk, Antoine Siraudin, Bohan Wang, Volkan Cevher, Pascal Frossard. [doi]

Neuromechanical Autoencoders: Learning to Couple Elastic and Neural Network NonlinearityDeniz Oktay, Mehran Mirramezani, Eder Medina, Ryan P. Adams. [doi]

Transformer-based World Models Are Happy With 100k InteractionsJan Robine, Marc Höftmann, Tobias Uelwer, Stefan Harmeling. [doi]

Sub-Task Decomposition Enables Learning in Sequence to Sequence TasksNoam Wies, Yoav Levine, Amnon Shashua. [doi]

Towards Inferential Reproducibility of Machine Learning ResearchMichael Hagmann, Philipp Meier, Stefan Riezler. [doi]

Faster Gradient-Free Methods for Escaping Saddle PointsHualin Zhang, Bin Gu 0001. [doi]

Backpropagation through Combinatorial Algorithms: Identity with Projection WorksSubham Sekhar Sahoo, Anselm Paulus, Marin Vlastelica, Vít Musil, Volodymyr Kuleshov, Georg Martius. [doi]

CUDA: Curriculum of Data Augmentation for Long-tailed RecognitionSumyeong Ahn, Jongwoo Ko, Se-Young Yun. [doi]

Asymptotic Instance-Optimal Algorithms for Interactive Decision MakingKefan Dong, Tengyu Ma 0001. [doi]

Anti-Symmetric DGN: a stable architecture for Deep Graph NetworksAlessio Gravina, Davide Bacciu, Claudio Gallicchio. [doi]

Sequential Gradient Coding For Straggler MitigationMuralee Nikhil Krishnan, MohammadReza Ebrahimi, Ashish J. Khisti. [doi]

Long Range Language Modeling via Gated State SpacesHarsh Mehta, Ankit Gupta 0001, Ashok Cutkosky, Behnam Neyshabur. [doi]

Learning Diffusion Bridges on Constrained DomainsXingchao Liu, Lemeng Wu, Mao Ye 0006, Qiang Liu. [doi]

Moderate Coreset: A Universal Method of Data Selection for Real-world Data-efficient Deep LearningXiaobo Xia, Jiale Liu, Jun Yu 0001, Xu Shen, Bo Han 0003, Tongliang Liu. [doi]

One-Pixel Shortcut: On the Learning Preference of Deep Neural NetworksShutong Wu, Sizhe Chen, Cihang Xie, Xiaolin Huang. [doi]

Spotlight: Mobile UI Understanding using Vision-Language Models with a FocusGang Li, Yang Li. [doi]

First Steps Toward Understanding the Extrapolation of Nonlinear Models to Unseen DomainsKefan Dong, Tengyu Ma 0001. [doi]

Particle-based Variational Inference with Preconditioned Functional Gradient FlowHanze Dong, Xi Wang, Yong Lin, Tong Zhang 0001. [doi]

EPISODE: Episodic Gradient Clipping with Periodic Resampled Corrections for Federated Learning with Heterogeneous DataMichael Crawshaw, Yajie Bao, Mingrui Liu. [doi]

Model ensemble instead of prompt fusion: a sample-specific knowledge transfer method for few-shot prompt tuningXiangyu Peng, Chen Xing, Prafulla Kumar Choubey, Chien-Sheng Wu, Caiming Xiong. [doi]

GReTo: Remedying dynamic graph topology-task discordance via target homophilyZhengyang Zhou, Qihe Huang, Gengyu Lin, Yang Kuo, Lei Bai 0001, Yang Wang 0015. [doi]

TrojText: Test-time Invisible Textual Trojan InsertionQian Lou, Yepeng Liu, Bo Feng. [doi]

Understanding Influence Functions and Datamodels via Harmonic AnalysisNikunj Saunshi, Arushi Gupta, Mark Braverman, Sanjeev Arora. [doi]

The Modality Focusing Hypothesis: Towards Understanding Crossmodal Knowledge DistillationZihui Xue, Zhengqi Gao, Sucheng Ren, Hang Zhao. [doi]

When and Why Vision-Language Models Behave like Bags-Of-Words, and What to Do About It?Mert Yüksekgönül, Federico Bianchi 0001, Pratyusha Kalluri, Dan Jurafsky, James Zou 0001. [doi]

Dynamic Prompt Learning via Policy Gradient for Semi-structured Mathematical ReasoningPan Lu, Liang Qiu 0001, Kai-Wei Chang, Ying Nian Wu, Song Chun Zhu, Tanmay Rajpurohit, Peter Clark, Ashwin Kalyan. [doi]

MIMT: Masked Image Modeling Transformer for Video CompressionJinxi Xiang, Kuan Tian, Jun Zhang. [doi]

How to Train your HIPPO: State Space Models with Generalized Orthogonal Basis ProjectionsAlbert Gu, Isys Johnson, Aman Timalsina, Atri Rudra, Christopher Ré. [doi]

Neural DAG Scheduling via One-Shot Priority SamplingWonseok Jeon, Mukul Gagrani, Burak Bartan, Weiliang Will Zeng, Harris Teague, Piero Zappi, Christopher Lott. [doi]

Universal Vision-Language Dense Retrieval: Learning A Unified Representation Space for Multi-Modal RetrievalZhenghao Liu, Chenyan Xiong, Yuanhuiyi Lv, Zhiyuan Liu 0001, Ge Yu 0001. [doi]

Is Conditional Generative Modeling all you need for Decision Making?Anurag Ajay, Yilun Du, Abhi Gupta, Joshua B. Tenenbaum, Tommi S. Jaakkola, Pulkit Agrawal. [doi]

Learning without Prejudices: Continual Unbiased Learning via Benign and Malignant ForgettingMyeongho Jeon, Hyoje Lee, Yedarm Seong, Myungjoo Kang. [doi]

Switch-NeRF: Learning Scene Decomposition with Mixture of Experts for Large-scale Neural Radiance FieldsZhenxing Mi, Dan Xu 0002. [doi]

MultiViz: Towards Visualizing and Understanding Multimodal ModelsPaul Pu Liang, Yiwei Lyu, Gunjan Chhablani, Nihal Jain, Zihao Deng, Xingbo Wang 0001, Louis-Philippe Morency, Ruslan Salakhutdinov. [doi]

Multi-domain image generation and translation with identifiability guaranteesShaoan Xie, Lingjing Kong, Mingming Gong, Kun Zhang 0001. [doi]

On the Robustness of Safe Reinforcement Learning under Observational PerturbationsZuxin Liu, Zijian Guo, Zhepeng Cen, Huan Zhang, Jie Tan, Bo Li 0026, Ding Zhao. [doi]

Neural Optimal TransportAlexander Korotin, Daniil Selikhanovych, Evgeny Burnaev. [doi]

DecAF: Joint Decoding of Answers and Logical Forms for Question Answering over Knowledge BasesDonghan Yu, Sheng Zhang, Patrick Ng, Henghui Zhu, Alexander Hanbo Li, Jun Wang 0122, Yiqun Hu, William Yang Wang, Zhiguo Wang, Bing Xiang. [doi]

Hyperbolic Self-paced Learning for Self-supervised Skeleton-based Action RepresentationsLuca Franco, Paolo Mandica, Bharti Munjal, Fabio Galasso. [doi]

Learning to Grow Pretrained Models for Efficient Transformer TrainingPeihao Wang, Rameswar Panda, Lucas Torroba Hennigen, Philip Greengard, Leonid Karlinsky, Rogério Feris, David Daniel Cox, Zhangyang Wang, Yoon Kim. [doi]

Quantized Compressed Sensing with Score-Based Generative ModelsXiangming Meng, Yoshiyuki Kabashima. [doi]

AANG : Automating Auxiliary LearningLucio M. Dery, Paul Michel, Mikhail Khodak, Graham Neubig, Ameet Talwalkar. [doi]

Understanding Embodied Reference with Touch-Line TransformerYang Li 0178, Xiaoxue Chen, Hao Zhao 0002, Jiangtao Gong, Guyue Zhou, Federico Rossano, Yixin Zhu. [doi]

SP2 : A Second Order Stochastic Polyak MethodShuang Li 0003, William J. Swartworth, Martin Takác 0001, Deanna Needell, Robert M. Gower. [doi]

LexMAE: Lexicon-Bottlenecked Pretraining for Large-Scale RetrievalTao Shen 0001, Xiubo Geng, Chongyang Tao, Can Xu, Xiaolong Huang, Binxing Jiao, Linjun Yang, Daxin Jiang. [doi]

Consolidator: Mergable Adapter with Group Connections for Visual AdaptationTianxiang Hao, Hui Chen 0013, Yuchen Guo, Guiguang Ding. [doi]

HiT-MDP: Learning the SMDP option framework on MDPs with Hidden Temporal EmbeddingsChang Li, Dongjin Song, Dacheng Tao. [doi]

Improving Out-of-distribution Generalization with Indirection RepresentationsKha Pham, Hung Le, Man Ngo, Truyen Tran 0001. [doi]

Discovering Evolution Strategies via Meta-Black-Box OptimizationRobert Tjarko Lange, Tom Schaul, Yutian Chen, Tom Zahavy, Valentin Dalibard, Chris Lu 0001, Satinder Singh 0001, Sebastian Flennerhag. [doi]

BALTO: fast tensor program optimization with diversity-based active learningJun Bi, Xiaqing Li, Qi Guo 0001, Rui Zhang 0040, Yuanbo Wen, Xing Hu 0001, Zidong Du, Xinkai Song, Yifan Hao, Yunji Chen. [doi]

Explaining Temporal Graph Models through an Explorer-Navigator FrameworkWenwen Xia, Mincai Lai, Caihua Shan, Yao Zhang 0009, Xinnan Dai, Xiang Li 0067, Dongsheng Li 0002. [doi]

PV3D: A 3D Generative Model for Portrait Video GenerationEric Zhongcong Xu, Jianfeng Zhang, Jun Hao Liew, Wenqing Zhang, Song Bai, Jiashi Feng, Mike Zheng Shou. [doi]

Energy-Inspired Self-Supervised Pretraining for Vision ModelsZe Wang, Jiang Wang, Zicheng Liu 0001, Qiang Qiu. [doi]

Structure by Architecture: Structured Representations without RegularizationFelix Leeb, Giulia Lanzillotta, Yashas Annadani, Michel Besserve, Stefan Bauer, Bernhard Schölkopf. [doi]

∞-adversarial training, and its unrealized threatsRanjie Duan, Yuefeng Chen, Yao Zhu, Xiaojun Jia, Rong Zhang, Hui Xue 0001. [doi]

Prompting GPT-3 To Be ReliableChenglei Si, Zhe Gan, Zhengyuan Yang, Shuohang Wang, Jianfeng Wang, Jordan L. Boyd-Graber, Lijuan Wang. [doi]

Empowering Networks With Scale and Rotation Equivariance Using A Similarity ConvolutionZikai Sun, Thierry Blu. [doi]

GAIN: On the Generalization of Instructional Action UnderstandingJunlong Li, Guangyi Chen 0002, Yansong Tang, Jinan Bao, Kun Zhang, Jie Zhou 0001, Jiwen Lu. [doi]

Can We Faithfully Represent Absence States to Compute Shapley Values on a DNN?Jie Ren 0018, Zhanpeng Zhou, Qirui Chen, Quanshi Zhang. [doi]

Short-Term Memory ConvolutionsGrzegorz Stefanski, Krzysztof Arendt, Pawel Daniluk, Bartlomiej Jasik, Artur Szumaczuk. [doi]

Building a Subspace of Policies for Scalable Continual LearningJean-Baptiste Gaya, Thang Doan, Lucas Caccia, Laure Soulier, Ludovic Denoyer, Roberta Raileanu. [doi]

RLx2: Training a Sparse Deep Reinforcement Learning Model from ScratchYiqin Tan, Pihe Hu, Ling Pan, Jiatai Huang, Longbo Huang. [doi]

Mastering the Game of No-Press Diplomacy via Human-Regularized Reinforcement Learning and PlanningAnton Bakhtin, David J. Wu 0002, Adam Lerer, Jonathan Gray, Athul Paul Jacob, Gabriele Farina, Alexander H. Miller, Noam Brown. [doi]

Lower Bounds on the Depth of Integral ReLU Neural Networks via Lattice PolytopesChristian Haase 0001, Christoph Hertrich, Georg Loho. [doi]

Provable Robustness against Wasserstein Distribution Shifts via Input RandomizationAounon Kumar, Alexander Levine 0001, Tom Goldstein, Soheil Feizi. [doi]

Learning Fair Graph Representations via Automated Data AugmentationsHongyi Ling, Zhimeng Jiang, Youzhi Luo, Shuiwang Ji, Na Zou. [doi]

Breaking Correlation Shift via Conditional Invariant RegularizerMingyang Yi, Ruoyu Wang 0016, Jiacheng Sun, Zhenguo Li, Zhi-Ming Ma. [doi]

Diffusion Posterior Sampling for General Noisy Inverse ProblemsHyungjin Chung, Jeongsol Kim, Michael Thompson McCann, Marc Louis Klasky, Jong Chul Ye. [doi]

Phase transition for detecting a small community in a large networkJiashun Jin, Zheng Tracy Ke, Paxton Turner, Anru Zhang. [doi]

DiffMimic: Efficient Motion Mimicking with Differentiable PhysicsJiawei Ren, Cunjun Yu, Siwei Chen, Xiao Ma 0006, Liang Pan, Ziwei Liu 0002. [doi]

Analog Bits: Generating Discrete Data using Diffusion Models with Self-ConditioningTing Chen, Ruixiang Zhang, Geoffrey E. Hinton. [doi]

Adversarial Imitation Learning with PreferencesAleksandar Taranovic, Andras Gabor Kupcsik, Niklas Freymuth, Gerhard Neumann. [doi]

Bag of Tricks for Unsupervised Text-to-SpeechYi Ren 0006, Chen Zhang 0020, Shuicheng Yan. [doi]

Hebbian and Gradient-based Plasticity Enables Robust Memory and Rapid Learning in RNNsYu Duan, Zhongfan Jia, Qian Li, Yi Zhong, Kaisheng Ma. [doi]

SAM as an Optimal Relaxation of BayesThomas Möllenhoff, Mohammad Emtiyaz Khan. [doi]

Faster Last-iterate Convergence of Policy Optimization in Zero-Sum Markov GamesShicong Cen, Yuejie Chi, Simon Shaolei Du, Lin Xiao. [doi]

Verifying the Union of Manifolds Hypothesis for Image DataBradley C. A. Brown, Anthony L. Caterini, Brendan Leigh Ross, Jesse C. Cresswell, Gabriel Loaiza-Ganem. [doi]

Learning with Auxiliary Activation for Memory-Efficient TrainingSunghyeon Woo, Dongsuk Jeon. [doi]

Rethinking Graph Lottery Tickets: Graph Sparsity MattersBo Hui, Da Yan 0001, Xiaolong Ma, Wei-Shinn Ku. [doi]

Mitigating Dataset Bias by Using Per-Sample GradientSumyeong Ahn, Seongyoon Kim, Se-Young Yun. [doi]

Learning Object-Language Alignments for Open-Vocabulary Object DetectionChuang Lin, Peize Sun, Yi Jiang, Ping Luo 0002, Lizhen Qu, Gholamreza Haffari, Zehuan Yuan, Jianfei Cai 0001. [doi]

Improving Deep Regression with Ordinal EntropyShihao Zhang, Linlin Yang, Michael Bi Mi, Xiaoxu Zheng, Angela Yao. [doi]

PatchDCT: Patch Refinement for High Quality Instance SegmentationQinrou Wen, Jirui Yang, Xue Yang 0005, Kewei Liang. [doi]

Differentially Private Adaptive Optimization with Delayed PreconditionersTian Li 0005, Manzil Zaheer, Ken Liu, Sashank J. Reddi, Hugh Brendan McMahan, Virginia Smith. [doi]

Benign Overfitting in Classification: Provably Counter Label Noise with Larger ModelsKaiyue Wen, Jiaye Teng, Jingzhao Zhang. [doi]

Ollivier-Ricci Curvature for Hypergraphs: A Unified FrameworkCorinna Coupette, Sebastian Dalleiger, Bastian Rieck. [doi]

Editing models with task arithmeticGabriel Ilharco, Marco Túlio Ribeiro, Mitchell Wortsman, Ludwig Schmidt, Hannaneh Hajishirzi, Ali Farhadi. [doi]

Learning rigid dynamics with face interaction graph networksKelsey R. Allen, Yulia Rubanova, Tatiana Lopez-Guevara, William Whitney 0001, Alvaro Sanchez-Gonzalez, Peter W. Battaglia, Tobias Pfaff. [doi]

Improving Object-centric Learning with Query OptimizationBaoxiong Jia, Yu Liu, Siyuan Huang. [doi]

Beyond calibration: estimating the grouping loss of modern neural networksAlexandre Perez-Lebel, Marine Le Morvan, Gaël Varoquaux. [doi]

Win: Weight-Decay-Integrated Nesterov Acceleration for Adaptive Gradient AlgorithmsPan Zhou, Xingyu Xie, Shuicheng Yan. [doi]

Are More Layers Beneficial to Graph Transformers?Haiteng Zhao, Shuming Ma, Dongdong Zhang 0001, Zhi-Hong Deng, Furu Wei. [doi]

Backpropagation at the Infinitesimal Inference Limit of Energy-Based Models: Unifying Predictive Coding, Equilibrium Propagation, and Contrastive Hebbian LearningBeren Millidge, Yuhang Song 0001, Tommaso Salvatori, Thomas Lukasiewicz, Rafal Bogacz. [doi]

On the complexity of nonsmooth automatic differentiationJérôme Bolte, Ryan Boustany, Edouard Pauwels, Béatrice Pesquet-Popescu. [doi]

TILP: Differentiable Learning of Temporal Logical Rules on Knowledge GraphsSiheng Xiong, Yuan Yang, Faramarz Fekri, James Clayton Kerce. [doi]

On Representing Linear Programs by Graph Neural NetworksZiang Chen, Jialin Liu 0003, Xinshang Wang, Wotao Yin. [doi]

Edge Guided GANs with Contrastive Learning for Semantic Image SynthesisHao Tang 0005, Xiaojuan Qi, Guolei Sun, Dan Xu 0002, Nicu Sebe, Radu Timofte, Luc Van Gool. [doi]

Robust Graph Dictionary LearningWeijie Liu 0006, Jiahao Xie 0001, Chao Zhang 0029, Makoto Yamada, Nenggan Zheng, Hui Qian 0001. [doi]

CUTS: Neural Causal Discovery from Irregular Time-Series DataYuxiao Cheng, Runzhao Yang, Tingxiong Xiao, Zongren Li, Jinli Suo, Kunlun He, Qionghai Dai. [doi]

Sparse Distributed Memory is a Continual LearnerTrenton Bricken, Xander Davies, Deepak Singh, Dmitry Krotov, Gabriel Kreiman. [doi]

Reversible Column NetworksYuxuan Cai, Yizhuang Zhou, Qi Han, Jianjian Sun, Xiangwen Kong, Jun Li, Xiangyu Zhang. [doi]

Near-Optimal Deployment Efficiency in Reward-Free Reinforcement Learning with Linear Function ApproximationDan Qiao 0002, Yu-Xiang Wang 0003. [doi]

The Surprising Effectiveness of Equivariant Models in Domains with Latent SymmetryDian Wang 0001, Jung Yeon Park, Neel Sortur, Lawson L. S. Wong, Robin Walters, Robert Platt. [doi]

Leveraging Future Relationship Reasoning for Vehicle Trajectory PredictionDaehee Park, Hobin Ryu, Yunseo Yang, Jegyeong Cho, Jiwon Kim, Kuk-Jin Yoon. [doi]

Self-supervised learning with rotation-invariant kernelsLéon Zheng, Gilles Puy, Elisa Riccietti, Patrick Pérez, Rémi Gribonval. [doi]

DexDeform: Dexterous Deformable Object Manipulation with Human Demonstrations and Differentiable PhysicsSizhe Li, Zhiao Huang, Tao Chen 0046, Tao Du 0001, Hao Su 0001, Joshua B. Tenenbaum, Chuang Gan. [doi]

A Self-Attention Ansatz for Ab-initio Quantum ChemistryIngrid von Glehn, James S. Spencer, David Pfau. [doi]

HiViT: A Simpler and More Efficient Design of Hierarchical Vision TransformerXiaosong Zhang 0004, Yunjie Tian, Lingxi Xie, Wei Huang, Qi Dai, Qixiang Ye, Qi Tian 0001. [doi]

Active Learning in Bayesian Neural Networks with Balanced Entropy Learning PrincipleJae Oh Woo. [doi]

ImageNet-X: Understanding Model Mistakes with Factor of Variation AnnotationsBadr Youbi Idrissi, Diane Bouchacourt, Randall Balestriero, Ivan Evtimov, Caner Hazirbas, Nicolas Ballas, Pascal Vincent, Michal Drozdzal, David Lopez-Paz, Mark Ibrahim. [doi]

Effective passive membership inference attacks in federated learning against overparameterized modelsJiacheng Li, Ninghui Li, Bruno Ribeiro 0001. [doi]

Image as Set of PointsXu Ma 0005, YuQian Zhou, Huan Wang 0014, Can Qin, Bin Sun 0002, Chang Liu 0022, Yun Fu 0001. [doi]

Differentially Private $L_2$-Heavy Hitters in the Sliding Window ModelJeremiah Blocki, Seunghoon Lee, Tamalika Mukherjee, Samson Zhou. [doi]

Boosting the Cycle Counting Power of Graph Neural Networks with I$^2$-GNNsYinan Huang, Xingang Peng, Jianzhu Ma, Muhan Zhang. [doi]

InPL: Pseudo-labeling the Inliers First for Imbalanced Semi-supervised LearningZhuoran Yu, Yin Li, Yong Jae Lee. [doi]

Towards Interpretable Deep Reinforcement Learning with Human-Friendly PrototypesEoin M. Kenny, Mycal Tucker, Julie Shah. [doi]

On the duality between contrastive and non-contrastive self-supervised learningQuentin Garrido, Yubei Chen, Adrien Bardes, Laurent Najman, Yann LeCun. [doi]

Bit-Pruning: A Sparse Multiplication-Less Dot-ProductYusuke Sekikawa, Shingo Yashima. [doi]

Learning to Solve Constraint Satisfaction Problems with Recurrent TransformerZhun Yang, Adam Ishay, Joohyung Lee 0002. [doi]

Neural Bregman Divergences for Distance LearningFred Lu, Edward Raff, Francis Ferraro. [doi]

Maximizing Spatio-Temporal Entropy of Deep 3D CNNs for Efficient Video RecognitionJunyan Wang, Zhenhong Sun, Yichen Qian, Dong Gong, Xiuyu Sun, Ming Lin, Maurice Pagnucco, Yang Song 0001. [doi]

ESCHER: Eschewing Importance Sampling in Games by Computing a History Value Function to Estimate RegretStephen Marcus McAleer, Gabriele Farina, Marc Lanctot, Tuomas Sandholm. [doi]

Deep Variational Implicit ProcessesLuis A. Ortega, Simón Rodríguez Santana, Daniel Hernández-Lobato. [doi]

Nearly Minimax Optimal Offline Reinforcement Learning with Linear Function Approximation: Single-Agent MDP and Markov GameWei Xiong 0015, Han Zhong 0001, Chengshuai Shi, Cong Shen 0001, Liwei Wang 0001, Tong Zhang 0001. [doi]

Modeling Sequential Sentence Relation to Improve Cross-lingual Dense RetrievalShunyu Zhang, Yaobo Liang, Ming Gong, Daxin Jiang, Nan Duan. [doi]

Order Matters: Agent-by-agent Policy OptimizationXihuai Wang, Zheng Tian 0002, Ziyu Wan, Ying Wen 0001, Jun Wang 0012, Weinan Zhang 0001. [doi]

Latent Graph Inference using Product ManifoldsHaitz Sáez de Ocáriz Borde, Anees Kazi, Federico Barbero, Pietro Liò. [doi]

Solving stochastic weak Minty variational inequalities without increasing batch sizeThomas Pethick, Olivier Fercoq, Puya Latafat, Panagiotis Patrinos, Volkan Cevher. [doi]

Towards Robust Object Detection Invariant to Real-World Domain ShiftsQi Fan, Mattia Segù, Yu-Wing Tai, Fisher Yu, Chi-Keung Tang, Bernt Schiele, Dengxin Dai. [doi]

Combinatorial-Probabilistic Trade-Off: P-Values of Community Properties Test in the Stochastic Block ModelsShuting Shen, Junwei Lu. [doi]

PAC-NeRF: Physics Augmented Continuum Neural Radiance Fields for Geometry-Agnostic System IdentificationXuan Li, Yi-Ling Qiao, Peter Yichen Chen, Krishna Murthy Jatavallabhula, Ming Lin, Chenfanfu Jiang, Chuang Gan. [doi]

Globally Optimal Training of Neural Networks with Threshold Activation FunctionsTolga Ergen, Halil Ibrahim Gulluk, Jonathan Lacotte, Mert Pilanci. [doi]

Tailoring Language Generation Models under Total Variation DistanceHaozhe Ji, Pei Ke, Zhipeng Hu, Rongsheng Zhang, Minlie Huang. [doi]

Partial Label Unsupervised Domain Adaptation with Class-Prototype AlignmentYan Yan, Yuhong Guo. [doi]

Dichotomy of Control: Separating What You Can Control from What You CannotSherry Yang, Dale Schuurmans, Pieter Abbeel, Ofir Nachum. [doi]

Mitigating Gradient Bias in Multi-objective Learning: A Provably Convergent ApproachHeshan Devaka Fernando, Han Shen, Miao Liu, Subhajit Chaudhury, Keerthiram Murugesan, Tianyi Chen. [doi]

Causality Compensated Attention for Contextual Biased Visual RecognitionRuyang Liu, Jingjia Huang, Thomas H. Li, Ge Li 0002. [doi]

Stochastic Differentially Private and Fair LearningAndrew Lowy, Devansh Gupta, Meisam Razaviyayn. [doi]

Solving Continuous Control via Q-learningTim Seyde, Peter Werner, Wilko Schwarting, Igor Gilitschenski, Martin A. Riedmiller, Daniela Rus, Markus Wulfmeier. [doi]

The Implicit Bias of Minima Stability in Multivariate Shallow ReLU NetworksMor Shpigel Nacson, Rotem Mulayoff, Greg Ongie, Tomer Michaeli, Daniel Soudry. [doi]

Optimistic Exploration with Learned Features Provably Solves Markov Decision Processes with Neural DynamicsSirui Zheng, Lingxiao Wang 0003, Shuang Qiu, Zuyue Fu, Zhuoran Yang, Csaba Szepesvári, Zhaoran Wang. [doi]

Sampling is as easy as learning the score: theory for diffusion models with minimal data assumptionsSitan Chen, Sinho Chewi, Jerry Li 0001, Yuanzhi Li, Adil Salim, Anru Zhang. [doi]

A Learning Based Hypothesis Test for Harmful Covariate ShiftTom Ginsberg, Zhongyuan Liang, Rahul G. Krishnan. [doi]

A Theoretical Framework for Inference and Learning in Predictive Coding NetworksBeren Millidge, Yuhang Song 0001, Tommaso Salvatori, Thomas Lukasiewicz, Rafal Bogacz. [doi]

Offline Reinforcement Learning with Differentiable Function Approximation is Provably EfficientMing Yin, Mengdi Wang, Yu-Xiang Wang. [doi]

Neural-based classification rule learning for sequential dataMarine Collery, Philippe Bonnard, François Fages, Remy Kusters. [doi]

SYNC: Safety-Aware Neural Control for Stabilizing Stochastic Delay-Differential EquationsJingdong Zhang, Qunxi Zhu, Wei Yang, Wei Lin 0003. [doi]

This Looks Like It Rather Than That: ProtoKNN For Similarity-Based ClassifiersYuki Ukai, Tsubasa Hirakawa, Takayoshi Yamashita, Hironobu Fujiyoshi. [doi]

AIM: Adapting Image Models for Efficient Video Action RecognitionTaojiannan Yang, Yi Zhu, Yusheng Xie, Aston Zhang, Chen Chen, Mu Li 0003. [doi]

Asynchronous Distributed Bilevel OptimizationYang Jiao, Kai Yang 0001, Tiancheng Wu, Dongjin Song, Chengtao Jian. [doi]

Revisiting Populations in multi-agent CommunicationPaul Michel, Mathieu Rita, Kory Wallace Mathewson, Olivier Tieleman, Angeliki Lazaridou. [doi]

Winning Both the Accuracy of Floating Point Activation and the Simplicity of Integer ArithmeticYulhwa Kim, Jaeyong Jang, Jehun Lee, JiHoon Park, Jeonghoon Kim, Byeongwook Kim, Baeseong Park, Se Jung Kwon, Dongsoo Lee, Jae-Joon Kim. [doi]

Truncated Diffusion Probabilistic Models and Diffusion-based Adversarial Auto-EncodersHuangjie Zheng, Pengcheng He, Weizhu Chen, Mingyuan Zhou. [doi]

Generating Diverse Cooperative Agents by Learning Incompatible PoliciesRujikorn Charakorn, Poramate Manoonpong, Nat Dilokthanakul. [doi]

Graph Signal Sampling for Inductive One-Bit Matrix Completion: a Closed-form SolutionChao Chen, Haoyu Geng, Gang Zeng, Zhaobing Han, Hua Chai, Xiaokang Yang, Junchi Yan. [doi]

The Power of Regularization in Solving Extensive-Form GamesMingyang Liu, Asuman E. Ozdaglar, Tiancheng Yu, Kaiqing Zhang. [doi]

Specformer: Spectral Graph Neural Networks Meet TransformersDeyu Bo, Chuan Shi, Lele Wang, Renjie Liao. [doi]

DiffEdit: Diffusion-based semantic image editing with mask guidanceGuillaume Couairon, Jakob Verbeek, Holger Schwenk, Matthieu Cord. [doi]

MA-BERT: Towards Matrix Arithmetic-only BERT Inference by Eliminating Complex Non-Linear FunctionsNeo Wei Ming, Zhehui Wang, Cheng Liu 0008, Rick Siow Mong Goh, Tao Luo 0014. [doi]

Semi-supervised Community Detection via Structural Similarity MetricsYicong Jiang, Tracy Ke. [doi]

What learning algorithm is in-context learning? Investigations with linear modelsEkin Akyürek, Dale Schuurmans, Jacob Andreas, Tengyu Ma 0001, Denny Zhou. [doi]

Artificial Neuronal Ensembles with Learned Context Dependent GatingMatthew J. Tilley, Michelle Miller 0007, David Freedman. [doi]

Investigating Multi-task Pretraining and Generalization in Reinforcement LearningAdrien Ali Taïga, Rishabh Agarwal, Jesse Farebrother, Aaron C. Courville, Marc G. Bellemare. [doi]

Asynchronous Gradient Play in Zero-Sum Multi-agent GamesRuicheng Ao, Shicong Cen, Yuejie Chi. [doi]

Quantile Risk Control: A Flexible Framework for Bounding the Probability of High-Loss PredictionsJake Snell, Thomas P. Zollo, Zhun Deng, Toniann Pitassi, Richard S. Zemel. [doi]

Transfer NAS with Meta-learned Bayesian SurrogatesGresa Shala, Thomas Elsken, Frank Hutter, Josif Grabocka. [doi]

Linearly Mapping from Image to Text SpaceJack Merullo, Louis Castricato, Carsten Eickhoff, Ellie Pavlick. [doi]

How robust is unsupervised representation learning to distribution shift?Yuge Shi, Imant Daunhawer, Julia E. Vogt, Philip H. S. Torr, Amartya Sanyal. [doi]

Robust Active DistillationCenk Baykal, Khoa Trinh, Fotis Iliopoulos, Gaurav Menghani, Erik Vee. [doi]

Effective Self-supervised Pre-training on Low-compute Networks without DistillationFuwen Tan, Fatemeh Sadat Saleh, Brais Martínez. [doi]

Video Scene Graph Generation from Single-Frame Weak SupervisionSiqi Chen, Jun Xiao 0001, Long Chen. [doi]

Towards Understanding Ensemble, Knowledge Distillation and Self-Distillation in Deep LearningZeyuan Allen Zhu, Yuanzhi Li. [doi]

3D Segmenter: 3D Transformer based Semantic Segmentation via 2D Panoramic DistillationZhennan Wu, Yang Li, Yifei Huang, Lin Gu 0003, Tatsuya Harada, Hiroyuki Sato. [doi]

Cycle to Clique (Cy2C) Graph Neural Network: A Sight to See beyond Neighborhood AggregationYun Young Choi, Sun-Woo Park, Youngho Woo, U. Jin Choi. [doi]

REPAIR: REnormalizing Permuted Activations for Interpolation RepairKeller Jordan, Hanie Sedghi, Olga Saukh, Rahim Entezari, Behnam Neyshabur. [doi]

Factorized Fourier Neural OperatorsAlasdair Tran, Alexander Patrick Mathews, Lexing Xie, Cheng Soon Ong. [doi]

DFPC: Data flow driven pruning of coupled channels without dataTanay Narshana, Chaitanya Murti, Chiranjib Bhattacharyya. [doi]

2: Self-Supervised Diffusion MRI Denoising with Generative Diffusion ModelsTiange Xiang, Mahmut Yurt, Ali B. Syed, Kawin Setsompop, Akshay Chaudhari. [doi]

Augmentation Component Analysis: Modeling Similarity via the Augmentation OverlapsLu Han, Han-Jia Ye, De-Chuan Zhan. [doi]

Near-optimal Coresets for Robust ClusteringLingxiao Huang, Shaofeng H.-C. Jiang, Jianing Lou, Xuan Wu 0002. [doi]

NTFields: Neural Time Fields for Physics-Informed Robot Motion PlanningRuiqi Ni, Ahmed H. Qureshi. [doi]

Learning Soft Constraints From Constrained Expert DemonstrationsAshish Gaurav, Kasra Rezaee, Guiliang Liu, Pascal Poupart. [doi]

RGI: robust GAN-inversion for mask-free image inpainting and unsupervised pixel-wise anomaly detectionShancong Mou, Xiaoyi Gu, Meng Cao, Haoping Bai, Ping Huang, Jiulong Shan, Jianjun Shi. [doi]

Evaluating Long-Term Memory in 3D MazesJurgis Pasukonis, Timothy P. Lillicrap, Danijar Hafner. [doi]

Improved Training of Physics-Informed Neural Networks Using Energy-Based Priors: a Study on Electrical Impedance TomographyAkarsh Pokkunuru, Pedram Rooshenas, Thilo Strauss, Anuj Abhishek, Taufiquar Khan. [doi]

Offline Reinforcement Learning via High-Fidelity Generative Behavior ModelingHuayu Chen, Cheng Lu 0011, Chengyang Ying, Hang Su 0006, Jun Zhu 0001. [doi]

On The Relative Error of Random Fourier Features for Preserving Kernel DistanceKuan Cheng, Shaofeng H.-C. Jiang, Luojian Wei, Zhide Wei. [doi]

Plateau in Monotonic Linear Interpolation - A "Biased" View of Loss Landscape for Deep NetworksXiang Wang 0011, Annie N. Wang, Mo Zhou, Rong Ge 0001. [doi]

Guiding Safe Exploration with Weakest PreconditionsGreg Anderson 0003, Swarat Chaudhuri, Isil Dillig. [doi]

A probabilistic framework for task-aligned intra- and inter-area neural manifold estimationEdoardo Balzani, Jean-Paul Noel, Pedro Herrero-Vidal, Dora E. Angelaki, Cristina Savin. [doi]

Contrastive Meta-Learning for Partially Observable Few-Shot LearningAdam Jelley, Amos J. Storkey, Antreas Antoniou, Sam Devlin. [doi]

Implicit Bias in Leaky ReLU Networks Trained on High-Dimensional DataSpencer Frei, Gal Vardi, Peter L. Bartlett, Nathan Srebro, Wei Hu. [doi]

Learning the Positions in CountSketchYi Li 0002, Honghao Lin, Simin Liu, Ali Vakilian, David P. Woodruff. [doi]

Arbitrary Virtual Try-on Network: Characteristics Representation and Trade-off between Body and ClothingYu Liu, Mingbo Zhao, Zhao Zhang 0001, Jicong Fan, Yang Lou, Shuicheng Yan. [doi]

Recitation-Augmented Language ModelsZhiqing Sun, Xuezhi Wang 0002, Yi Tay, Yiming Yang, Denny Zhou. [doi]

Continuous-Discrete Convolution for Geometry-Sequence Modeling in ProteinsHehe Fan, Zhangyang Wang, Yi Yang 0001, Mohan S. Kankanhalli. [doi]

ChiroDiff: Modelling chirographic data with Diffusion ModelsAyan Das 0003, Yongxin Yang, Timothy M. Hospedales, Tao Xiang, Yi-Zhe Song. [doi]

Decompose to Generalize: Species-Generalized Animal Pose EstimationGuangrui Li 0005, Yifan Sun 0003, Zongxin Yang, Yi Yang 0001. [doi]

Markup-to-Image Diffusion Models with Scheduled SamplingYuntian Deng, Noriyuki Kojima, Alexander M. Rush. [doi]

Visual Recognition with Deep Nearest CentroidsWenguan Wang, Cheng Han, Tianfei Zhou, Dongfang Liu. [doi]

Efficient Discrete Multi Marginal Optimal Transport RegularizationRonak Mehta, Jeffery Kline, Vishnu Suresh Lokhande, Glenn Fung, Vikas Singh. [doi]

Images as Weight Matrices: Sequential Image Generation Through Synaptic Learning RulesKazuki Irie, Jürgen Schmidhuber. [doi]

Sparse tree-based Initialization for Neural NetworksPatrick Lutz, Ludovic Arnould, Claire Boyer, Erwan Scornet. [doi]

Prototypical Calibration for Few-shot Learning of Language ModelsZhixiong Han, Yaru Hao, Li Dong 0004, Yutao Sun, Furu Wei. [doi]

HypeR: Multitask Hyper-Prompted Training Enables Large-Scale Retrieval GeneralizationZeFeng Cai, Chongyang Tao, Tao Shen 0001, Can Xu, Xiubo Geng, Xin Alex Lin, Liang He 0001, Daxin Jiang. [doi]

Discovering Latent Knowledge in Language Models Without SupervisionCollin Burns, Haotian Ye, Dan Klein, Jacob Steinhardt. [doi]

Clean-image Backdoor: Attacking Multi-label Models with Poisoned Labels OnlyKangjie Chen, Xiaoxuan Lou, Guowen Xu, Jiwei Li 0001, Tianwei Zhang 0004. [doi]

Pink Noise Is All You Need: Colored Noise Exploration in Deep Reinforcement LearningOnno Eberhard, Jakob Hollenstein, Cristina Pinneri, Georg Martius. [doi]

Fuzzy Alignments in Directed Acyclic Graph for Non-Autoregressive Machine TranslationZhengrui Ma, Chenze Shao, Shangtong Gui, Min Zhang, Yang Feng 0004. [doi]

EVA3D: Compositional 3D Human Generation from 2D Image CollectionsFangzhou Hong, Zhaoxi Chen 0009, Yushi Lan, Liang Pan, Ziwei Liu 0002. [doi]

Pareto Invariant Risk Minimization: Towards Mitigating the Optimization Dilemma in Out-of-Distribution GeneralizationYongqiang Chen 0002, Kaiwen Zhou, Yatao Bian, Binghui Xie, Bingzhe Wu, Yonggang Zhang, Kaili Ma 0001, Han Yang 0002, Peilin Zhao, Bo Han 0003, James Cheng. [doi]

Hebbian Deep Learning Without FeedbackAdrien Journé, Hector Garcia Rodriguez, Qinghai Guo, Timoleon Moraitis. [doi]

Statistical Inference for Fisher Market EquilibriumLuofeng Liao, Yuan Gao, Christian Kroer. [doi]

A General Rank Preserving Framework for Asymmetric Image RetrievalHui Wu, Min Wang 0019, Wengang Zhou, Houqiang Li. [doi]

De Novo Molecular Generation via Connection-aware Motif MiningZijie Geng, Shufang Xie 0003, Yingce Xia, Lijun Wu, Tao Qin, Jie Wang 0005, Yongdong Zhang 0001, Feng Wu 0001, Tie-Yan Liu. [doi]

MoDem: Accelerating Visual Model-Based Reinforcement Learning with DemonstrationsNicklas Hansen 0001, Yixin Lin, Hao Su 0001, Xiaolong Wang 0004, Vikash Kumar, Aravind Rajeswaran. [doi]

An Additive Instance-Wise Approach to Multi-class Model InterpretationVy Vo, Van Nguyen 0002, Trung Le, Quan Hung Tran, Reza Haf, Seyit Camtepe, Dinh Phung 0001. [doi]

Individual Privacy Accounting with Gaussian Differential PrivacyAntti Koskela, Marlon Tobaben, Antti Honkela. [doi]

Neural Causal Models for Counterfactual Identification and EstimationKevin Muyuan Xia, Yushu Pan, Elias Bareinboim. [doi]

Fisher-Legendre (FishLeg) optimization of deep neural networksJezabel R. Garcia, Federica Freddi, Stathi Fotiadis, Maolin Li, Sattar Vakili, Alberto Bernacchia, Guillaume Hennequin. [doi]

Divide to Adapt: Mitigating Confirmation Bias for Domain Adaptation of Black-Box PredictorsJianfei Yang, Xiangyu Peng, Kai Wang 0036, Zheng Zhu, Jiashi Feng, Lihua Xie, Yang You 0001. [doi]

Better Teacher Better Student: Dynamic Prior Knowledge for Knowledge DistillationMartin Zong, Zengyu Qiu, Xinzhu Ma, Kunlin Yang, Chunya Liu, Jun Hou, Shuai Yi, Wanli Ouyang. [doi]

DepthFL : Depthwise Federated Learning for Heterogeneous ClientsMinjae Kim, Sangyoon Yu, Suhyun Kim, Soo-Mook Moon. [doi]

ManyDG: Many-domain Generalization for Healthcare ApplicationsChaoqi Yang, M. Brandon Westover, Jimeng Sun 0001. [doi]

Don't forget the nullspace! Nullspace occupancy as a mechanism for out of distribution failureDaksh Idnani, Vivek Madan, Naman Goyal, David J. Schwab, Ramakrishna Vedantam. [doi]

Searching Lottery Tickets in Graph Neural Networks: A Dual PerspectiveKun Wang, Yuxuan Liang, Pengkun Wang, Xu Wang, Pengfei Gu, Junfeng Fang, Yang Wang 0015. [doi]

Spikformer: When Spiking Neural Network Meets TransformerZhaokun Zhou, Yuesheng Zhu, Chao He, Yaowei Wang, Shuicheng Yan, Yonghong Tian 0001, Li Yuan 0007. [doi]

Concept Gradient: Concept-based Interpretation Without Linear AssumptionAndrew Bai, Chih-Kuan Yeh, Neil Y. C. Lin, Pradeep Kumar Ravikumar, Cho-Jui Hsieh. [doi]

Learning MLPs on Graphs: A Unified View of Effectiveness, Robustness, and EfficiencyYijun Tian 0001, Chuxu Zhang, Zhichun Guo, Xiangliang Zhang 0001, Nitesh V. Chawla. [doi]

A VAE for Transformers with Nonparametric Variational Information BottleneckJames Henderson, Fabio Fehr. [doi]

Compositional Semantic Parsing with Large Language ModelsAndrew Drozdov, Nathanael Schärli, Ekin Akyürek, Nathan Scales, Xinying Song, Xinyun Chen, Olivier Bousquet, Denny Zhou. [doi]

Automatic Chain of Thought Prompting in Large Language ModelsZhuosheng Zhang 0001, Aston Zhang, Mu Li 0003, Alex Smola. [doi]

Static Prediction of Runtime Errors by Learning to Execute Programs with External Resource DescriptionsDavid Bieber, Rishab Goel, Daniel Zheng, Hugo Larochelle, Daniel Tarlow. [doi]

Behavior Prior Representation learning for Offline Reinforcement LearningHongyu Zang, Xin Li 0033, Jie Yu, Chen Liu, Riashat Islam, Remi Tachet des Combes, Romain Laroche. [doi]

Perfectly Secure Steganography Using Minimum Entropy CouplingChristian Schröder de Witt, Samuel Sokota, J. Zico Kolter, Jakob Nicolaus Foerster, Martin Strohmeier. [doi]

Robust Multivariate Time-Series Forecasting: Adversarial Attacks and Defense MechanismsLinbo Liu, Youngsuk Park, Trong Nghia Hoang, Hilaf Hasson, Luke Huan. [doi]

Learning Fast and Slow for Online Time Series ForecastingQuang Pham, Chenghao Liu, Doyen Sahoo, Steven C. H. Hoi. [doi]

Share Your Representation Only: Guaranteed Improvement of the Privacy-Utility Tradeoff in Federated LearningZebang Shen, Jiayuan Ye 0001, Anmin Kang, Hamed Hassani, Reza Shokri. [doi]

Rethinking the Effect of Data Augmentation in Adversarial Contrastive LearningRundong Luo, Yifei Wang 0001, Yisen Wang 0001. [doi]

Tuning Frequency Bias in Neural Network Training with Nonuniform DataAnnan Yu, Yunan Yang, Alex Townsend. [doi]

Programmatically Grounded, Compositionally Generalizable Robotic ManipulationRenhao Wang, Jiayuan Mao, Joy Hsu, Hang Zhao, Jiajun Wu 0001, Yang Gao. [doi]

Revisiting Intrinsic Reward for Exploration in Procedurally Generated EnvironmentsKaixin Wang, Kuangqi Zhou, Bingyi Kang, Jiashi Feng, Shuicheng Yan. [doi]

The Asymmetric Maximum Margin Bias of Quasi-Homogeneous Neural NetworksDaniel Kunin, Atsushi Yamamura, Chao Ma, Surya Ganguli. [doi]

Simplified State Space Layers for Sequence ModelingJimmy T. H. Smith, Andrew Warrington, Scott W. Linderman. [doi]

Geometrically regularized autoencoders for non-Euclidean dataCheongjae Jang, Yonghyeon Lee, Yung-Kyun Noh, Frank C. Park 0001. [doi]

TimesNet: Temporal 2D-Variation Modeling for General Time Series AnalysisHaixu Wu, Tengge Hu, Yong Liu, Hang Zhou, Jianmin Wang 0001, Mingsheng Long. [doi]

HomoDistil: Homotopic Task-Agnostic Distillation of Pre-trained TransformersChen Liang, Haoming Jiang, Zheng Li, Xianfeng Tang, Bing Yin, Tuo Zhao. [doi]

Logical Message Passing Networks with One-hop Inference on Atomic FormulasZihao Wang, Yangqiu Song, Ginny Y. Wong, Simon See. [doi]

Unmasking the Lottery Ticket Hypothesis: What's Encoded in a Winning Ticket's Mask?Mansheej Paul, Feng Chen, Brett W. Larsen, Jonathan Frankle, Surya Ganguli, Gintare Karolina Dziugaite. [doi]

Representational Dissimilarity Metric Spaces for Stochastic Neural NetworksLyndon R. Duong, Jingyang Zhou, Josue Nassar, Jules Berman, Jeroen Olieslagers, Alex H. Williams. [doi]

MCAL: Minimum Cost Human-Machine Active LabelingHang Qiu, Krishna Chintalapudi, Ramesh Govindan. [doi]

Interpretable Geometric Deep Learning via Learnable Randomness InjectionSiqi Miao 0001, Yunan Luo, Mia Liu, Pan Li. [doi]

UNICORN: A Unified Backdoor Trigger Inversion FrameworkZhenting Wang, Kai Mei, Juan Zhai, ShiQing Ma. [doi]

Is the Performance of My Deep Network Too Good to Be True? A Direct Approach to Estimating the Bayes Error in Binary ClassificationTakashi Ishida 0001, Ikko Yamane, Nontawat Charoenphakdee, Gang Niu 0001, Masashi Sugiyama. [doi]

Leveraging Unlabeled Data to Track MemorizationMahsa Forouzesh, Hanie Sedghi, Patrick Thiran. [doi]

FedExP: Speeding Up Federated Averaging via ExtrapolationDivyansh Jhunjhunwala, Shiqiang Wang 0001, Gauri Joshi. [doi]

Self-Ensemble Protection: Training Checkpoints Are Good Data ProtectorsSizhe Chen, Geng Yuan, Xinwen Cheng, Yifan Gong 0004, Minghai Qin, Yanzhi Wang, Xiaolin Huang. [doi]

PD-MORL: Preference-Driven Multi-Objective Reinforcement Learning AlgorithmToygun Basaklar, Suat Gumussoy, Ümit Y. Ogras. [doi]

In-Situ Text-Only Adaptation of Speech Models with Low-Overhead Speech ImputationsAshish R. Mittal, Sunita Sarawagi, Preethi Jyothi. [doi]

Sparse Random Networks for Communication-Efficient Federated LearningBerivan Isik, Francesco Pase, Deniz Gündüz, Tsachy Weissman, Michele Zorzi. [doi]

Contrastive Learning Can Find An Optimal Basis For Approximately View-Invariant FunctionsDaniel D. Johnson 0001, Ayoub El Hanchi, Chris J. Maddison. [doi]

Generalized Precision Matrix for Scalable Estimation of Nonparametric Markov NetworksYujia Zheng, Ignavier Ng, Yewen Fan, Kun Zhang 0001. [doi]

Surgical Fine-Tuning Improves Adaptation to Distribution ShiftsYoonho Lee 0001, Annie S. Chen, Fahim Tajwar, Ananya Kumar, Huaxiu Yao, Percy Liang, Chelsea Finn. [doi]

Predictive Inference with Feature Conformal PredictionJiaye Teng, Chuan Wen, Dinghuai Zhang, Yoshua Bengio, Yang Gao 0029, Yang Yuan. [doi]

Disentanglement of Correlated Factors via Hausdorff Factorized SupportKarsten Roth, Mark Ibrahim, Zeynep Akata, Pascal Vincent, Diane Bouchacourt. [doi]

Learning Kernelized Contextual Bandits in a Distributed and Asynchronous EnvironmentChuanhao Li, Huazheng Wang, Mengdi Wang, Hongning Wang. [doi]

Compressing multidimensional weather and climate data into neural networksLangwen Huang, Torsten Hoefler. [doi]

ESD: Expected Squared Difference as a Tuning-Free Trainable Calibration MeasureHee Suk Yoon, Joshua Tian Jin Tee, Eunseop Yoon, Sunjae Yoon, GwangSu Kim, Yingzhen Li, Chang D. Yoo. [doi]

Can discrete information extraction prompts generalize across language models?Nathanaël Carraz Rakotonirina, Roberto Dessì, Fabio Petroni, Sebastian Riedel 0001, Marco Baroni. [doi]

Mid-Vision FeedbackMichael Maynord, Eadom Dessalene, Cornelia Fermüller, Yiannis Aloimonos. [doi]

Teacher Guided Training: An Efficient Framework for Knowledge TransferManzil Zaheer, Ankit Singh Rawat, Seungyeon Kim, Chong You, Himanshu Jain, Andreas Veit, Rob Fergus, Sanjiv Kumar. [doi]

Unified Detoxifying and Debiasing in Language Generation via Inference-time Adaptive OptimizationZonghan Yang, Xiaoyuan Yi, Peng Li, Yang Liu, Xing Xie 0001. [doi]

An Exact Poly-Time Membership-Queries Algorithm for Extracting a Three-Layer ReLU NetworkAmit Daniely, Elad Granot. [doi]

Extreme Q-Learning: MaxEnt RL without EntropyDivyansh Garg, Joey Hejna, Matthieu Geist, Stefano Ermon. [doi]

Towards Effective and Interpretable Human-Agent Collaboration in MOBA Games: A Communication PerspectiveYiming Gao 0007, Feiyu Liu, Liang Wang, Zhenjie Lian, Weixuan Wang, Siqin Li, Xianliang Wang, Xianhan Zeng, Rundong Wang, Jiawei Wang, Qiang Fu, Wei Yang 0032, Lanxiao Huang, Wei Liu. [doi]

FaiREE: fair classification with finite-sample and distribution-free guaranteePuheng Li, James Zou 0001, Linjun Zhang. [doi]

Selective Frequency Network for Image RestorationYuning Cui 0001, Yi Tao, Zhenshan Bing, Wenqi Ren, Xinwei Gao, Xiaochun Cao, Kai Huang 0001, Alois Knoll. [doi]

Decoupled Training for Long-Tailed Classification With Stochastic RepresentationsGiung Nam, Sunguk Jang, Juho Lee 0001. [doi]

Uni-Mol: A Universal 3D Molecular Representation Learning FrameworkGengmo Zhou, Zhifeng Gao, Qiankun Ding, Hang Zheng, Hongteng Xu, Zhewei Wei, Linfeng Zhang, Guolin Ke. [doi]

Equivariant Energy-Guided SDE for Inverse Molecular DesignFan Bao, Min Zhao 0008, Zhongkai Hao, Peiyao Li, Chongxuan Li, Jun Zhu 0001. [doi]

Powderworld: A Platform for Understanding Generalization via Rich Task DistributionsKevin Frans, Phillip Isola. [doi]

PEER: A Collaborative Language ModelTimo Schick, Jane A. Yu, Zhengbao Jiang, Fabio Petroni, Patrick S. H. Lewis, Gautier Izacard, Qingfei You, Christoforos Nalmpantis, Edouard Grave, Sebastian Riedel 0001. [doi]

ReAct: Synergizing Reasoning and Acting in Language ModelsShunyu Yao, Jeffrey Zhao, Dian Yu, Nan Du, Izhak Shafran, Karthik R. Narasimhan, Yuan Cao 0007. [doi]

Scaffolding a Student to Instill KnowledgeAnil Kag, Durmus Alp Emre Acar, Aditya Gangrade, Venkatesh Saligrama. [doi]

Rhino: Deep Causal Temporal Relationship Learning with History-dependent NoiseWenbo Gong 0001, Joel Jennings, Cheng Zhang 0005, Nick Pawlowski. [doi]

Batch Multivalid Conformal PredictionChristopher Jung 0001, Georgy Noarov, Ramya Ramalingam, Aaron Roth 0001. [doi]

The Devil is in the Wrongly-classified Samples: Towards Unified Open-set RecognitionJun Cen, Di Luan, Shiwei Zhang, Yixuan Pei, Yingya Zhang, Deli Zhao, Shaojie Shen, Qifeng Chen. [doi]

MAST: Masked Augmentation Subspace Training for Generalizable Self-Supervised PriorsChen Huang 0001, Hanlin Goh, Jiatao Gu, Joshua M. Susskind. [doi]

Relative representations enable zero-shot latent space communicationLuca Moschella, Valentino Maiorca, Marco Fumero, Antonio Norelli, Francesco Locatello, Emanuele Rodolà. [doi]

Understanding Train-Validation Split in Meta-Learning with Neural NetworksXinzhe Zuo, Zixiang Chen, Huaxiu Yao, Yuan Cao 0006, Quanquan Gu. [doi]

Training-Free Structured Diffusion Guidance for Compositional Text-to-Image SynthesisWeixi Feng, Xuehai He, Tsu-Jui Fu, Varun Jampani, Arjun R. Akula, Pradyumna Narayana, Sugato Basu, Xin Eric Wang, William Yang Wang. [doi]

Average Sensitivity of Decision Tree LearningSatoshi Hara 0001, Yuichi Yoshida. [doi]

Characterizing the Influence of Graph ElementsZizhang Chen, Peizhao Li, Hongfu Liu, Pengyu Hong. [doi]

VIPeR: Provably Efficient Algorithm for Offline RL with Neural Function ApproximationThanh Nguyen-Tang, Raman Arora. [doi]

Extracting Robust Models with Uncertain ExamplesGuanlin Li, Guowen Xu, Shangwei Guo, Han Qiu 0001, Jiwei Li 0001, Tianwei Zhang 0004. [doi]

FastFill: Efficient Compatible Model UpdateFlorian Jaeckle, Fartash Faghri, Ali Farhadi, Oncel Tuzel, Hadi Pouransari. [doi]

A Unified Framework for Soft Threshold PruningYanqi Chen, Zhengyu Ma, Wei Fang, Xiawu Zheng, Zhaofei Yu, Yonghong Tian 0001. [doi]

Minimum Variance Unbiased N: M Sparsity for the Neural GradientsBrian Chmiel, Itay Hubara, Ron Banner, Daniel Soudry. [doi]

Is Model Ensemble Necessary? Model-based RL via a Single Model with Lipschitz Regularized Value FunctionRuijie Zheng, Xiyao Wang, Huazhe Xu, Furong Huang. [doi]

GRACE-C: Generalized Rate Agnostic Causal Estimation via ConstraintsMohammadsajad Abavisani, David Danks, Sergey M. Plis. [doi]

Where to Begin? On the Impact of Pre-Training and Initialization in Federated LearningJohn Nguyen, Jianyu Wang, Kshitiz Malik, Maziar Sanjabi, Michael G. Rabbat. [doi]

Strategic Classification with Graph Neural NetworksItay Eilat, Ben Finkelshtein, Chaim Baskin, Nir Rosenfeld. [doi]

Auto-Encoding Goodness of FitAaron Palmer, Zhiyi Chi, Derek Aguiar, Jinbo Bi. [doi]

DeCap: Decoding CLIP Latents for Zero-Shot Captioning via Text-Only TrainingWei Li, Linchao Zhu, Longyin Wen, Yi Yang 0001. [doi]

Neural Compositional Rule Learning for Knowledge Graph ReasoningKewei Cheng, Nesreen K. Ahmed, Yizhou Sun. [doi]

Unified Discrete Diffusion for Simultaneous Vision-Language GenerationMinghui Hu 0001, Chuanxia Zheng, Zuopeng Yang, Tat-Jen Cham, Heliang Zheng, Chaoyue Wang, Dacheng Tao, Ponnuthurai N. Suganthan. [doi]

Learning Zero-Shot Cooperation with Humans, Assuming Humans Are BiasedChao Yu 0005, Jiaxuan Gao, Weilin Liu, Botian Xu, Hao Tang, Jiaqi Yang, Yu Wang, Yi Wu. [doi]

Causal Representation Learning for Instantaneous and Temporal Effects in Interactive SystemsPhillip Lippe, Sara Magliacane, Sindy Löwe, Yuki M. Asano, Taco Cohen, Efstratios Gavves. [doi]

Topology-aware Robust Optimization for Out-of-Distribution GeneralizationFengchun Qiao, Xi Peng 0005. [doi]

Suppressing the Heterogeneity: A Strong Feature Extractor for Few-shot SegmentationZhengdong Hu, Yifan Sun 0003, Yi Yang 0001. [doi]

DIFFormer: Scalable (Graph) Transformers Induced by Energy Constrained DiffusionQitian Wu, Chenxiao Yang, Wentao Zhao, Yixuan He, David Wipf, Junchi Yan. [doi]

GOGGLE: Generative Modelling for Tabular Data by Learning Relational StructureTennison Liu, Zhaozhi Qian, Jeroen Berrevoets, Mihaela van der Schaar. [doi]

Contextual Convolutional NetworksShuxian Liang, Xu Shen, Tongliang Liu, Xian-Sheng Hua 0001. [doi]

Weighted Clock Logic Point ProcessRuixuan Yan, Yunshi Wen, Debarun Bhattacharjya, Ronny Luss, Tengfei Ma 0001, Achille Fokoue, Anak Agung Julius. [doi]

On Accelerated Perceptrons and BeyondGuanghui Wang, Rafael Hanashiro, Etash Kumar Guha, Jacob D. Abernethy. [doi]

GNNInterpreter: A Probabilistic Generative Model-Level Explanation for Graph Neural NetworksXiaoqi Wang, Han-Wei Shen. [doi]

SIMPLE: Specialized Model-Sample Matching for Domain GeneralizationZiyue Li, Kan Ren, Xinyang Jiang, Yifei Shen, Haipeng Zhang, Dongsheng Li 0002. [doi]

Pitfalls of Gaussians as a noise distribution in NCEHolden Lee, Chirag Pabbaraju, Anish Prasad Sevekari, Andrej Risteski. [doi]

On Achieving Optimal Adversarial Test ErrorJustin D. Li, Matus Telgarsky. [doi]

Calibrating the Rigged Lottery: Making All Tickets ReliableBowen Lei, Ruqi Zhang, Dongkuan Xu, Bani K. Mallick. [doi]

A Theoretical Understanding of Shallow Vision Transformers: Learning, Generalization, and Sample ComplexityHongkang Li, Meng Wang 0003, Sijia Liu 0001, Pin-Yu Chen. [doi]

A Non-monotonic Self-terminating Language ModelEugene Choi, KyungHyun Cho, Cheolhyoung Lee. [doi]

Meta-prediction Model for Distillation-Aware NAS on Unseen DatasetsHayeon Lee, Sohyun An, Minseon Kim, Sung Ju Hwang. [doi]

Decompositional Generation Process for Instance-Dependent Partial Label LearningCongyu Qiao, Ning Xu 0009, Xin Geng. [doi]

Diagnosing and Rectifying Vision Models using LanguageYuhui Zhang, Jeff Z. HaoChen, Shih-Cheng Huang, Kuan-Chieh Wang, James Zou 0001, Serena Yeung. [doi]

A Multi-Grained Self-Interpretable Symbolic-Neural Model For Single/Multi-Labeled Text ClassificationXiang Hu, Xinyu Kong, Kewei Tu. [doi]

Mutual Partial Label Learning with Competitive Label NoiseYan Yan, Yuhong Guo. [doi]

Interneurons accelerate learning dynamics in recurrent neural networks for statistical adaptationDavid Lipshutz, Cengiz Pehlevan, Dmitri B. Chklovskii. [doi]

Agree to Disagree: Diversity through Disagreement for Better TransferabilityMatteo Pagliardini, Martin Jaggi, François Fleuret, Sai Praneeth Karimireddy. [doi]

SmartFRZ: An Efficient Training Framework using Attention-Based Layer FreezingSheng Li, Geng Yuan, Yue Dai, Youtao Zhang, Yanzhi Wang, Xulong Tang. [doi]

Last Layer Re-Training is Sufficient for Robustness to Spurious CorrelationsPolina Kirichenko, Pavel Izmailov, Andrew Gordon Wilson. [doi]

LPT: Long-tailed Prompt Tuning for Image ClassificationBowen Dong, Pan Zhou, Shuicheng Yan, Wangmeng Zuo. [doi]

Neural Architecture Design and Robustness: A DatasetSteffen Jung 0001, Jovita Lukasik, Margret Keuper. [doi]

Planckian Jitter: countering the color-crippling effects of color jitter on self-supervised trainingSimone Zini, Alex Gomez-Villa, Marco Buzzelli, Bartlomiej Twardowski, Andrew D. Bagdanov, Joost van de Weijer 0001. [doi]

Understanding Zero-shot Adversarial Robustness for Large-Scale ModelsChengzhi Mao, Scott Geng, Junfeng Yang, Xin Wang, Carl Vondrick. [doi]

LMC: Fast Training of GNNs via Subgraph Sampling with Provable ConvergenceZhihao Shi, Xize Liang, Jie Wang 0005. [doi]

Personalized Reward Learning with Interaction-Grounded Learning (IGL)Jessica Maghakian, Paul Mineiro, Kishan Panaganti, Mark Rucker, Akanksha Saran, Cheng Tan. [doi]

FunkNN: Neural Interpolation for Functional GenerationAmirEhsan Khorashadizadeh, Anadi Chaman, Valentin Debarnot, Ivan Dokmanic. [doi]

Evolving Populations of Diverse RL Agents with MAP-ElitesThomas Pierrot, Arthur Flajolet. [doi]

Bi-level Physics-Informed Neural Networks for PDE Constrained Optimization using Broyden's HypergradientsZhongkai Hao, Chengyang Ying, Hang Su 0006, Jun Zhu 0001, Jian Song, Ze Cheng. [doi]

Hyperbolic Deep Reinforcement LearningEdoardo Cetin, Benjamin Paul Chamberlain, Michael M. Bronstein, Jonathan J. Hunt. [doi]

The Influence of Learning Rule on Representation Dynamics in Wide Neural NetworksBlake Bordelon, Cengiz Pehlevan. [doi]

AutoTransfer: AutoML with Knowledge Transfer - An Application to Graph Neural NetworksKaidi Cao, Jiaxuan You, Jiaju Liu, Jure Leskovec. [doi]

Gray-Box Gaussian Processes for Automated Reinforcement LearningGresa Shala, André Biedenkapp, Frank Hutter, Josif Grabocka. [doi]

Self-Consistency Improves Chain of Thought Reasoning in Language ModelsXuezhi Wang 0002, Jason Wei, Dale Schuurmans, Quoc V. Le, Ed H. Chi, Sharan Narang, Aakanksha Chowdhery, Denny Zhou. [doi]

Time to augment self-supervised visual representation learningArthur Aubret, Markus Roland Ernst, Céline Teulière, Jochen Triesch. [doi]

GOOD: Exploring geometric cues for detecting objects in an open worldHaiwen Huang, Andreas Geiger 0001, Dan Zhang. [doi]

Near-Optimal Adversarial Reinforcement Learning with Switching CostsMing Shi, Yingbin Liang, Ness B. Shroff. [doi]

Masked Unsupervised Self-training for Label-free Image ClassificationJunnan Li 0001, Silvio Savarese, Steven C. H. Hoi. [doi]

Contrastive Audio-Visual Masked AutoencoderYuan Gong, Andrew Rouditchenko, Alexander H. Liu, David Harwath, Leonid Karlinsky, Hilde Kuehne, James R. Glass. [doi]

Learning to Segment from Noisy Annotations: A Spatial Correction ApproachJiachen Yao, Yikai Zhang, Songzhu Zheng, Mayank Goswami 0001, Prateek Prasanna, Chao Chen 0012. [doi]

Random Laplacian Features for Learning with Hyperbolic SpaceTao Yu, Christopher De Sa. [doi]

Meta Temporal Point ProcessesWonho Bae, Mohamed Osama Ahmed, Frederick Tung, Gabriel L. Oliveira. [doi]

EquiMod: An Equivariance Module to Improve Visual Instance DiscriminationAlexandre Devillers, Mathieu Lefort. [doi]

CrAM: A Compression-Aware MinimizerAlexandra Peste, Adrian Vladu, Eldar Kurtic, Christoph H. Lampert, Dan Alistarh. [doi]

TabCaps: A Capsule Neural Network for Tabular Data Classification with BoW RoutingJintai Chen, Kuanlun Liao, Yanwen Fang, Danny Z. Chen, Jian Wu 0001. [doi]

MaskFusion: Feature Augmentation for Click-Through Rate Prediction via Input-adaptive Mask FusionChao Liao, Jianchao Tan, Jiyuan Jia, Yi Guo, Chengru Song. [doi]

Simplifying Model-based RL: Learning Representations, Latent-space Models, and Policies with One ObjectiveRaj Ghugare, Homanga Bharadhwaj, Benjamin Eysenbach, Sergey Levine, Russ Salakhutdinov. [doi]

Adversarial Diversity in HanabiBrandon Cui, Andrei Lupu, Samuel Sokota, Hengyuan Hu, David J. Wu 0002, Jakob Nicolaus Foerster. [doi]

Deconstructing Distributions: A Pointwise Framework of LearningGal Kaplun, Nikhil Ghosh, Saurabh Garg, Boaz Barak, Preetum Nakkiran. [doi]

On amortizing convex conjugates for optimal transportBrandon Amos. [doi]

Does Learning from Decentralized Non-IID Unlabeled Data Benefit from Self Supervision?Lirui Wang, Kaiqing Zhang, Yunzhu Li, Yonglong Tian, Russ Tedrake. [doi]

TaskPrompter: Spatial-Channel Multi-Task Prompting for Dense Scene UnderstandingHanrong Ye, Dan Xu. [doi]

Bayes-MIL: A New Probabilistic Perspective on Attention-based Multiple Instance Learning for Whole Slide ImagesYufei Cui, Ziquan Liu, Xiangyu Liu, Xue Liu 0001, Cong Wang 0001, Tei-Wei Kuo, Chun Jason Xue, Antoni B. Chan. [doi]

Tier Balancing: Towards Dynamic Fairness over Underlying Causal FactorsZeyu Tang, Yatong Chen, Yang Liu, Kun Zhang 0001. [doi]

Strong inductive biases provably prevent harmless interpolationMichael Aerni, Marco Milanta, Konstantin Donhauser, Fanny Yang. [doi]

Revisit Finetuning strategy for Few-Shot Learning to Transfer the EmdeddingsHeng Wang, Tan Yue, Xiang Ye, Zihang He, Bohan Li, Yong Li 0025. [doi]

Neuro-Symbolic Procedural Planning with Commonsense PromptingYujie Lu, Weixi Feng, Wanrong Zhu, Wenda Xu, Xin Eric Wang, Miguel P. Eckstein, William Yang Wang. [doi]

Cross-Layer Retrospective Retrieving via Layer AttentionYanwen Fang, Yuxi Cai, Jintai Chen, Jingyu Zhao 0001, Guangjian Tian, Guodong Li. [doi]

Selective Annotation Makes Language Models Better Few-Shot LearnersHongjin Su, Jungo Kasai, Chen Henry Wu, Weijia Shi, Tianlu Wang, Jiayi Xin, Rui Zhang 0037, Mari Ostendorf, Luke Zettlemoyer, Noah A. Smith, Tao Yu 0009. [doi]

Scaling Laws for a Multi-Agent Reinforcement Learning ModelOren Neumann, Claudius Gros. [doi]

Robust Scheduling with GFlowNetsDavid W. Zhang, Corrado Rainone, Markus Peschl, Roberto Bondesan. [doi]

On the Effectiveness of Out-of-Distribution Data in Self-Supervised Long-Tail LearningJianhong Bai, Zuozhu Liu, Hualiang Wang, Jin Hao, Yang Feng, Huanpeng Chu, Haoji Hu. [doi]

The KFIoU Loss for Rotated Object DetectionXue Yang 0005, Yue Zhou 0005, Gefan Zhang, Jirui Yang, Wentao Wang, Junchi Yan, Xiaopeng Zhang 0008, Qi Tian 0001. [doi]

Masked Image Modeling with Denoising ContrastKun Yi, Yixiao Ge, Xiaotong Li, Shusheng Yang, Dian Li, Jianping Wu, Ying Shan, Xiaohu Qie. [doi]

Diffusion-GAN: Training GANs with DiffusionZhendong Wang, Huangjie Zheng, Pengcheng He, Weizhu Chen, Mingyuan Zhou. [doi]

Temporal Dependencies in Feature Importance for Time Series PredictionKin Kwan Leung, Clayton Rooke, Jonathan Smith, Saba Zuberi, Maksims Volkovs. [doi]

Direct Embedding of Temporal Network Edges via Time-Decayed Line GraphsSudhanshu Chanpuriya, Ryan A. Rossi, SungChul Kim, Tong Yu 0001, Jane Hoffswell, Nedim Lipka, Shunan Guo, Cameron Musco. [doi]

What Can we Learn From The Selective Prediction And Uncertainty Estimation Performance Of 523 Imagenet Classifiers?Ido Galil, Mohammed Dabbah, Ran El-Yaniv. [doi]

Subsampling in Large Graphs Using Ricci CurvatureShushan Wu, Huimin Cheng, Jiazhang Cai, Ping Ma, Wenxuan Zhong. [doi]

Revisiting Robustness in Graph Machine LearningLukas Gosch, Daniel Sturm 0002, Simon Geisler, Stephan Günnemann. [doi]

Neuroevolution is a Competitive Alternative to Reinforcement Learning for Skill DiscoveryFélix Chalumeau, Raphaël Boige, Bryan Lim, Valentin Macé, Maxime Allard, Arthur Flajolet, Antoine Cully, Thomas Pierrot. [doi]

Weakly-supervised HOI Detection via Prior-guided Bi-level Representation LearningBo Wan, Yongfei Liu, Desen Zhou, Tinne Tuytelaars, Xuming He 0001. [doi]

Bispectral Neural NetworksSophia Sanborn, Christian Shewmake, Bruno A. Olshausen, Christopher J. Hillar. [doi]

Simple Emergent Action Representations from Multi-Task Policy TrainingPu-Hua, Yubei Chen, Huazhe Xu. [doi]

Depth Separation with Multilayer Mean-Field NetworksYunwei Ren, Mo Zhou, Rong Ge 0001. [doi]

Systematic Rectification of Language Models via Dead-end AnalysisMeng Cao, Mehdi Fatemi, Jackie CK Cheung, Samira Shabanian. [doi]

Localized Randomized Smoothing for Collective Robustness CertificationJan Schuchardt, Tom Wollschläger, Aleksandar Bojchevski, Stephan Günnemann. [doi]

Implicit Regularization for Group SparsityJiangyuan Li, Thanh V. Nguyen, Chinmay Hegde, Raymond K. W. Wong. [doi]

Adversarial Training of Self-supervised Monocular Depth Estimation against Physical-World AttacksZhiyuan Cheng 0010, James Liang, Guanhong Tao, Dongfang Liu, Xiangyu Zhang 0001. [doi]

Graph Neural Networks are Inherently Good Generalizers: Insights by Bridging GNNs and MLPsChenxiao Yang, Qitian Wu, Jiahua Wang, Junchi Yan. [doi]

Evolve Smoothly, Fit Consistently: Learning Smooth Latent Dynamics For Advection-Dominated SystemsZhong Yi Wan, Leonardo Zepeda-Núñez, Anudhyan Boral, Fei Sha. [doi]

Hierarchical Relational Learning for Few-Shot Knowledge Graph CompletionHan Wu, Jie Yin, Bala Rajaratnam, Jianyuan Guo. [doi]

Distributionally Robust Recourse ActionDuy Nguyen, Ngoc Bui, Viet Anh Nguyen. [doi]

Multivariate Time-series Imputation with Disentangled Temporal RepresentationsShuai Liu, Xiucheng Li, Gao Cong, Yile Chen, Yue Jiang. [doi]

Efficient recurrent architectures through activity sparsity and sparse back-propagation through timeAnand Subramoney, Khaleelulla Khan Nazeer, Mark Schöne, Christian Mayr 0001, David Kappel. [doi]

simpleKT: A Simple But Tough-to-Beat Baseline for Knowledge TracingZitao Liu 0001, Qiongqiong Liu, Jiahao Chen 0006, Shuyan Huang, Weiqi Luo 0002. [doi]

Understanding weight-magnitude hyperparameters in training binary networksJoris Quist, Yunqiang Li, Jan van Gemert. [doi]

DynaMS: Dyanmic Margin Selection for Efficient Deep LearningJiaxing Wang, Yong Li, Jingwei Zhuo, Xupeng Shi, Weizhong Zhang, Lixing Gong, Tong Tao, Pengzhang Liu, Yongjun Bao, Weipeng Yan. [doi]

Deep Transformers without Shortcuts: Modifying Self-attention for Faithful Signal PropagationBobby He, James Martens, Guodong Zhang, Aleksandar Botev, Andrew Brock, Samuel L. Smith, Yee Whye Teh. [doi]

A Model or 603 Exemplars: Towards Memory-Efficient Class-Incremental LearningDa-Wei Zhou 0001, Qi-Wei Wang, Han-Jia Ye, De-Chuan Zhan. [doi]

Spectral Augmentation for Self-Supervised Learning on GraphsLu Lin, Jinghui Chen, Hongning Wang. [doi]

H2RBox: Horizontal Box Annotation is All You Need for Oriented Object DetectionXue Yang 0005, Gefan Zhang, Wentong Li, Yue Zhou 0005, Xuehui Wang, Junchi Yan. [doi]

Denoising Diffusion SamplersFrancisco Vargas, Will Sussman Grathwohl, Arnaud Doucet. [doi]

Predictor-corrector algorithms for stochastic optimization under gradual distribution shiftSubha Maity, Debarghya Mukherjee, Moulinath Banerjee, Yuekai Sun. [doi]

Achieving Near-Optimal Individual Regret & Low Communications in Multi-Agent BanditsXuchuang Wang, Lin Yang, Yu-Zhen Janice Chen, Xutong Liu 0002, Mohammad Hajiesmaili, Don Towsley, John C. S. Lui. [doi]

Generative Modelling with Inverse Heat DissipationSeveri Rissanen, Markus Heinonen, Arno Solin. [doi]

DiffusER: Diffusion via Edit-based ReconstructionMachel Reid, Vincent Josua Hellendoorn, Graham Neubig. [doi]

Stable Target Field for Reduced Variance Score Estimation in Diffusion ModelsYilun Xu, Shangyuan Tong, Tommi S. Jaakkola. [doi]

Broken Neural Scaling LawsEthan Caballero, Kshitij Gupta, Irina Rish, David Krueger. [doi]

Provable Memorization Capacity of TransformersJunghwan Kim, Michelle Kim, Barzan Mozafari. [doi]

Efficient Deep Reinforcement Learning Requires Regulating OverfittingQiyang Li, Aviral Kumar, Ilya Kostrikov, Sergey Levine. [doi]

Unbiased Supervised Contrastive LearningCarlo Alberto Barbano, Benoit Dufumier, Enzo Tartaglione, Marco Grangetto, Pietro Gori. [doi]

MAESTRO: Open-Ended Environment Design for Multi-Agent Reinforcement LearningMikayel Samvelyan, Akbir Khan, Michael Dennis 0001, Minqi Jiang, Jack Parker-Holder, Jakob Nicolaus Foerster, Roberta Raileanu, Tim Rocktäschel. [doi]

Universal Few-shot Learning of Dense Prediction Tasks with Visual Token MatchingDonggyun Kim, Jinwoo Kim, Seongwoong Cho, Chong Luo, Seunghoon Hong. [doi]

Contrastive Corpus Attribution for Explaining RepresentationsChris Lin, Hugh Chen, Chanwoo Kim 0002, Su-In Lee. [doi]

UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question Answering Over Knowledge GraphJinhao Jiang, Kun Zhou, Xin Zhao 0018, Ji-Rong Wen. [doi]

Multi-level Protein Structure Pre-training via Prompt LearningZeyuan Wang, Qiang Zhang, Shuangwei Hu, Haoran Yu, Xurui Jin, Zhichen Gong, Huajun Chen. [doi]

Which Layer is Learning Faster? A Systematic Exploration of Layer-wise Convergence Rate for Deep Neural NetworksYixiong Chen, Alan L. Yuille, Zongwei Zhou. [doi]

Malign Overfitting: Interpolation and Invariance are Fundamentally at OddsYoav Wald, Gal Yona, Uri Shalit, Yair Carmon. [doi]

Learning Adversarial Linear Mixture Markov Decision Processes with Bandit Feedback and Unknown TransitionCanzhe Zhao, Ruofeng Yang, Baoxiang Wang 0001, Shuai Li 0010. [doi]

Warping the Space: Weight Space Rotation for Class-Incremental Few-Shot LearningDo Yeon Kim, Dong-Jun Han, Jun Seo, Jaekyun Moon. [doi]

On Representing Mixed-Integer Linear Programs by Graph Neural NetworksZiang Chen, Jialin Liu 0003, Xinshang Wang, Wotao Yin. [doi]

wav2tok: Deep Sequence Tokenizer for Audio RetrievalAdhiraj Banerjee, Vipul Arora 0001. [doi]

Concept-level Debugging of Part-Prototype NetworksAndrea Bontempelli, Stefano Teso, Katya Tentori, Fausto Giunchiglia, Andrea Passerini. [doi]

MixPro: Data Augmentation with MaskMix and Progressive Attention Labeling for Vision TransformerQiHao Zhao, Yangyu Huang, Wei Hu 0004, Fan Zhang 0007, Jun Liu 0036. [doi]

Learnable Graph Convolutional Attention NetworksAdrián Javaloy, Pablo Sánchez-Martín, Amit Levi, Isabel Valera. [doi]

Post-hoc Concept Bottleneck ModelsMert Yüksekgönül, Maggie Wang, James Zou 0001. [doi]

Statistical Efficiency of Score Matching: The View from IsoperimetryFrederic Koehler, Alexander Heckett, Andrej Risteski. [doi]

Addressing Parameter Choice Issues in Unsupervised Domain Adaptation by AggregationMarius-Constantin Dinu, Markus Holzleitner, Maximilian Beck, Hoan Duc Nguyen, Andrea Huber, Hamid Eghbal-zadeh, Bernhard Alois Moser, Sergei V. Pereverzyev, Sepp Hochreiter, Werner Zellinger. [doi]

Compositionality with Variation Reliably Emerges in Neural NetworksHenry Conklin, Kenny Smith. [doi]

Fast Nonlinear Vector Quantile RegressionAviv A. Rosenberg, Sanketh Vedula, Yaniv Romano, Alexander M. Bronstein. [doi]

Learning Sparse Group Models Through Boolean RelaxationYijie Wang, Yuan Zhou, Xiaoqing Huang, Kun Huang, Jie Zhang, Jianzhu Ma. [doi]

VA-DepthNet: A Variational Approach to Single Image Depth PredictionCe Liu, Suryansh Kumar, Shuhang Gu, Radu Timofte, Luc Van Gool. [doi]

How to prepare your task head for finetuningYi Ren, Shangmin Guo, Wonho Bae, Danica J. Sutherland. [doi]

Flow Straight and Fast: Learning to Generate and Transfer Data with Rectified FlowXingchao Liu, ChengYue Gong, Qiang Liu 0001. [doi]

When to Make and Break Commitments?Alihan Hüyük, Zhaozhi Qian, Mihaela van der Schaar. [doi]

Fundamental limits on the robustness of image classifiersZheng Dai, David Gifford 0001. [doi]

Unsupervised Learning for Combinatorial Optimization Needs Meta LearningHaoyu Peter Wang, Pan Li. [doi]

Unsupervised 3D Object Learning through Neuron Activity aware PlasticityBeomseok Kang, Biswadeep Chakraborty, Saibal Mukhopadhyay. [doi]

Is Attention All That NeRF Needs?Mukund Varma T, Peihao Wang, Xuxi Chen, Tianlong Chen, Subhashini Venugopalan, Zhangyang Wang. [doi]

Scalable Subset Sampling with Neural Conditional Poisson NetworksAdeel Pervez, Phillip Lippe, Efstratios Gavves. [doi]

A Unified Approach to Reinforcement Learning, Quantal Response Equilibria, and Two-Player Zero-Sum GamesSamuel Sokota, Ryan D'Orazio, J. Zico Kolter, Nicolas Loizou, Marc Lanctot, Ioannis Mitliagkas, Noam Brown, Christian Kroer. [doi]

Hard-Meta-Dataset++: Towards Understanding Few-Shot Performance on Difficult TasksSamyadeep Basu, Megan Stanley, John Bronskill, Soheil Feizi, Daniela Massiceti. [doi]

Equiformer: Equivariant Graph Attention Transformer for 3D Atomistic GraphsYi-Lun Liao, Tess E. Smidt. [doi]

Identifiability Results for Multimodal Contrastive LearningImant Daunhawer, Alice Bizeul, Emanuele Palumbo, Alexander Marx, Julia E. Vogt. [doi]

Understanding the Role of Nonlinearity in Training Dynamics of Contrastive LearningYuandong Tian. [doi]

LDMIC: Learning-based Distributed Multi-view Image CodingXinjie Zhang, Jiawei Shao, Jun Zhang. [doi]

WikiWhy: Answering and Explaining Cause-and-Effect QuestionsMatthew Ho, Aditya Sharma, Justin Chang, Michael Saxon, Sharon Levy, Yujie Lu, William Yang Wang. [doi]

Learning Structured Representations by Embedding Class HierarchySiqi Zeng, Remi Tachet des Combes, Han Zhao 0002. [doi]

Panning for Gold in Federated Learning: Targeted Text Extraction under Arbitrarily Large-Scale AggregationHong-Min Chu, Jonas Geiping, Liam H. Fowl, Micah Goldblum, Tom Goldstein. [doi]

Characteristic Neural Ordinary Differential EquationXingzi Xu, Ali-Hasan, Khalil Elkhalil, Jie Ding 0002, Vahid Tarokh. [doi]

Long-Tailed Learning Requires Feature LearningThomas Laurent 0001, James von Brecht, Xavier Bresson. [doi]

Federated Learning from Small DatasetsMichael Kamp, Jonas Fischer, Jilles Vreeken. [doi]

Multimodal Federated Learning via Contrastive Representation EnsembleQiying Yu, Yang Liu, Yimu Wang, Ke Xu, Jingjing Liu. [doi]

Progress measures for grokking via mechanistic interpretabilityNeel Nanda, Lawrence Chan, Tom Lieberum, Jess Smith, Jacob Steinhardt. [doi]

Characterizing intrinsic compositionality in transformers with Tree ProjectionsShikhar Murty, Pratyusha Sharma, Jacob Andreas, Christopher D. Manning. [doi]

The Lie Derivative for Measuring Learned EquivarianceNate Gruver, Marc Anton Finzi, Micah Goldblum, Andrew Gordon Wilson. [doi]

GPViT: A High Resolution Non-Hierarchical Vision Transformer with Group PropagationChenhongyi Yang, Jiarui Xu, Shalini De Mello, Elliot J. Crowley, Xiaolong Wang 0004. [doi]

Contrastive Learning for Unsupervised Domain Adaptation of Time SeriesYilmazcan Özyurt, Stefan Feuerriegel, Ce Zhang 0001. [doi]

CogVideo: Large-scale Pretraining for Text-to-Video Generation via TransformersWenyi Hong, Ming Ding 0004, Wendi Zheng, Xinghan Liu, Jie Tang 0001. [doi]

Free Lunch for Domain Adversarial Training: Environment Label SmoothingYifan Zhang, Xue Wang, Jian Liang, Zhang Zhang 0001, Liang Wang, Rong Jin 0001, Tieniu Tan. [doi]

SimPer: Simple Self-Supervised Learning of Periodic TargetsYuzhe Yang, Xin Liu 0061, Jiang Wu, Silviu Borac, Dina Katabi, Ming-Zher Poh, Daniel McDuff. [doi]

Learning on Large-scale Text-attributed Graphs via Variational InferenceJianan Zhao 0002, Meng Qu, Chaozhuo Li, Hao Yan, Qian Liu, Rui Li 0086, Xing Xie 0001, Jian Tang 0005. [doi]

Learning Heterogeneous Interaction Strengths by Trajectory Prediction with Graph Neural NetworkSeungwoong Ha, Hawoong Jeong. [doi]

Non-parametric Outlier SynthesisLeitian Tao, Xuefeng Du, Jerry Zhu, Yixuan Li 0001. [doi]

Generalization and Estimation Error Bounds for Model-based Neural NetworksAvner Shultzman, Eyar Azar, Miguel R. D. Rodrigues, Yonina C. Eldar. [doi]

Offline RL with No OOD Actions: In-Sample Learning via Implicit Value RegularizationHaoran Xu, Li Jiang 0008, Jianxiong Li, Zhuoran Yang, Zhaoran Wang, Wai Kin Victor Chan, Xianyuan Zhan. [doi]

Scaling Forward Gradient With Local LossesMengye Ren, Simon Kornblith, Renjie Liao, Geoffrey E. Hinton. [doi]

Deep Generative Symbolic RegressionSamuel Holt, Zhaozhi Qian, Mihaela van der Schaar. [doi]

Edgeformers: Graph-Empowered Transformers for Representation Learning on Textual-Edge NetworksBowen Jin, Yu Zhang 0044, Yu Meng 0001, Jiawei Han 0001. [doi]

The In-Sample Softmax for Offline Reinforcement LearningChenjun Xiao, Han Wang, Yangchen Pan, Adam White 0001, Martha White. [doi]

When Source-Free Domain Adaptation Meets Learning with Noisy LabelsLi Yi, Gezheng Xu, Pengcheng Xu, Jiaqi Li 0005, Ruizhi Pu, Charles Ling 0001, A. Ian McLeod, Boyu Wang 0004. [doi]

Exploring The Role of Mean Teachers in Self-supervised Masked Auto-EncodersYoungwan Lee, Jeffrey Ryan Willette, Jonghee Kim, Juho Lee 0001, Sung Ju Hwang. [doi]

Analogy-Forming Transformers for Few-Shot 3D ParsingNikolaos Gkanatsios, Mayank Singh 0016, Zhaoyuan Fang, Shubham Tulsiani, Katerina Fragkiadaki. [doi]

Planning Goals for ExplorationEdward S. Hu, Richard Chang, Oleh Rybkin, Dinesh Jayaraman. [doi]

Discrete Contrastive Diffusion for Cross-Modal Music and Image GenerationYe Zhu, Yu Wu 0011, Kyle Olszewski, Jian Ren, Sergey Tulyakov, Yan Yan 0002. [doi]

Measure the Predictive HeterogeneityJiashuo Liu, Jiayun Wu, Renjie Pi, Renzhe Xu, Xingxuan Zhang, Bo Li 0064, Peng Cui 0001. [doi]

Language Models are Realistic Tabular Data GeneratorsVadim Borisov, Kathrin Seßler, Tobias Leemann, Martin Pawelczyk, Gjergji Kasneci. [doi]

Equivariant Descriptor Fields: SE(3)-Equivariant Energy-Based Models for End-to-End Visual Robotic Manipulation LearningHyunwoo Ryu, Hong-in Lee, Jeong-Hoon Lee, Jongeun Choi. [doi]

Red PANDA: Disambiguating Image Anomaly Detection by Removing Nuisance FactorsNiv Cohen, Jonathan Kahana, Yedid Hoshen. [doi]

Temperature Schedules for self-supervised contrastive methods on long-tail dataAnna Kukleva, Moritz Böhle, Bernt Schiele, Hilde Kuehne, Christian Rupprecht 0001. [doi]

Choreographer: Learning and Adapting Skills in ImaginationPietro Mazzaglia, Tim Verbelen, Bart Dhoedt, Alexandre Lacoste, Sai Rajeswar. [doi]

AGRO: Adversarial discovery of error-prone Groups for Robust OptimizationBhargavi Paranjape, Pradeep Dasigi, Vivek Srikumar, Luke Zettlemoyer, Hannaneh Hajishirzi. [doi]

A View From Somewhere: Human-Centric Face RepresentationsJerone Theodore Alexander Andrews, Przemyslaw Joniak, Alice Xiang. [doi]

DINO as a von Mises-Fisher mixture modelHariprasath Govindarajan, Per Sidén, Jacob Roll, Fredrik Lindsten. [doi]

d: Beyond Convexity, Non-Asymptotic Rate and AccelerationZijian Liu, Ta Duy Nguyen, Alina Ene, Huy L. Nguyen. [doi]

Bias Propagation in Federated LearningHongyan Chang, Reza Shokri. [doi]

Alternating Differentiation for Optimization LayersHaixiang Sun, Ye Shi 0001, Jingya Wang, Hoang Duong Tuan, H. Vincent Poor, Dacheng Tao. [doi]

Can Neural Networks Learn Implicit Logic from Physical Reasoning?Aaron Traylor, Roman Feiman, Ellie Pavlick. [doi]

Neural Implicit Shape Editing using Boundary SensitivityArturs Berzins, Moritz Ibing, Leif Kobbelt. [doi]

LS-IQ: Implicit Reward Regularization for Inverse Reinforcement LearningFiras Al-Hafez, Davide Tateo, Oleg Arenz, Guoping Zhao, Jan Peters 0001. [doi]

Minimax Optimal Kernel Operator Learning via Multilevel TrainingJikai Jin, Yiping Lu 0001, José H. Blanchet, Lexing Ying. [doi]

RoPAWS: Robust Semi-supervised Representation Learning from Uncurated DataSangwoo Mo, Jong-Chyi Su, Chih-Yao Ma, Mido Assran, Ishan Misra, Licheng Yu, Sean Bell. [doi]

Fairness and Accuracy under Domain GeneralizationThai-Hoang Pham, Xueru Zhang, Ping Zhang 0016. [doi]

Towards Lightweight, Model-Agnostic and Diversity-Aware Active Anomaly DetectionXu Zhang, Yuan Zhao, Ziang Cui, Liqun Li, Shilin He, Qingwei Lin, Yingnong Dang, Saravan Rajmohan, Dongmei Zhang 0001. [doi]

On the Feasibility of Cross-Task Transfer with Model-Based Reinforcement LearningYifan Xu, Nicklas Hansen 0001, Zirui Wang, Yung-Chieh Chan, Hao Su 0001, Zhuowen Tu. [doi]

MLPInit: Embarrassingly Simple GNN Training Acceleration with MLP InitializationXiaotian Han, Tong Zhao 0003, Yozen Liu, Xia Hu, Neil Shah. [doi]

EUCLID: Towards Efficient Unsupervised Reinforcement Learning with Multi-choice Dynamics ModelYifu Yuan, Jianye Hao, Fei Ni, Yao Mu, Yan Zheng, Yujing Hu, Jinyi Liu, Yingfeng Chen, Changjie Fan. [doi]

Min-Max Multi-objective Bilevel Optimization with Applications in Robust Machine LearningAlex Gu, Songtao Lu, Parikshit Ram, Tsui-Wei Weng. [doi]

Chasing All-Round Graph Representation Robustness: Model, Training, and OptimizationChunhui Zhang, Yijun Tian 0001, Mingxuan Ju, Zheyuan Liu 0010, Yanfang Ye 0001, Nitesh V. Chawla, Chuxu Zhang. [doi]

A Statistical Framework for Personalized Federated Learning and Estimation: Theory, Algorithms, and PrivacyKaan Ozkara, Antonious M. Girgis, Deepesh Data, Suhas N. Diggavi. [doi]

Mind the Pool: Convolutional Neural Networks Can Overfit Input SizeBilal Alsallakh, David Yan, Narine Kokhlikyan, Vivek Miglani, Orion Reblitz-Richardson, Pamela Bhattacharya. [doi]

A Minimalist Dataset for Systematic Generalization of Perception, Syntax, and SemanticsQing Li 0003, Siyuan Huang, Yining Hong, Yixin Zhu, Ying Nian Wu, Song Chun Zhu. [doi]

Can We Find Nash Equilibria at a Linear Rate in Markov Games?Zhuoqing Song, Jason D. Lee, Zhuoran Yang. [doi]

Exploring the Limits of Differentially Private Deep Learning with Group-wise ClippingJiyan He, Xuechen Li, Da Yu, Huishuai Zhang, Janardhan Kulkarni, Yin Tat Lee, Arturs Backurs, Nenghai Yu, Jiang Bian 0002. [doi]

Do We Really Need Complicated Model Architectures For Temporal Networks?Weilin Cong, Si Zhang, Jian Kang, Baichuan Yuan, Hao Wu, Xin Zhou, Hanghang Tong, Mehrdad Mahdavi. [doi]

Finding the Global Semantic Representation in GAN through Fréchet MeanJaewoong Choi, Geonho Hwang, Hyunsoo Cho, Myungjoo Kang. [doi]

Over-parameterized Model Optimization with Polyak-Łojasiewicz ConditionYixuan Chen 0003, Yubin Shi, Mingzhi Dong, Xiaochen Yang, Dongsheng Li 0002, Yujiang Wang 0001, Robert P. Dick, Qin Lv, Yingying Zhao, Fan Yang 0001, Ning Gu, Li Shang. [doi]

An efficient encoder-decoder architecture with top-down attention for speech separationKai Li, Runxuan Yang, Xiaolin Hu 0001. [doi]

Augmentation with Projection: Towards an Effective and Efficient Data Augmentation Paradigm for DistillationZiqi Wang 0003, Yuexin Wu, Frederick Liu, Daogao Liu, Le Hou, Hongkun Yu, Jing Li, Heng Ji. [doi]

Sign and Basis Invariant Networks for Spectral Graph Representation LearningDerek Lim, Joshua David Robinson, Lingxiao Zhao, Tess E. Smidt, Suvrit Sra, Haggai Maron, Stefanie Jegelka. [doi]

Transformer Meets Boundary Value Inverse ProblemsRuchi Guo, Shuhao Cao, Long Chen 0002. [doi]

Exploring perceptual straightness in learned visual representationsAnne Harrington, Vasha Dutell, Ayush Tewari, Mark Hamilton, Simon Stent, Ruth Rosenholtz, William T. Freeman. [doi]

ViewCo: Discovering Text-Supervised Segmentation Masks via Multi-View Semantic ConsistencyPengzhen Ren, Changlin Li, Hang Xu, Yi Zhu 0004, Guangrun Wang, Jianzhuang Liu, Xiaojun Chang, Xiaodan Liang. [doi]

Unicom: Universal and Compact Representation Learning for Image RetrievalXiang An, Jiankang deng, Kaicheng Yang, Jaiwei Li, Ziyong Feng, Jia Guo, Jing Yang 0038, Tongliang Liu. [doi]

Federated Nearest Neighbor Machine TranslationYichao Du, Zhirui Zhang, Bingzhe Wu, Lemao Liu, Tong Xu 0001, Enhong Chen. [doi]

On the Word Boundaries of Emergent Languages Based on Harris's Articulation SchemeRyo Ueda, Taiga Ishii, Yusuke Miyao. [doi]

CodeBPE: Investigating Subtokenization Options for Large Language Model Pretraining on Source CodeNadezhda Chirkova, Sergey Troshin. [doi]

Reward Design with Language ModelsMinae Kwon, Sang Michael Xie, Kalesha Bullard, Dorsa Sadigh. [doi]

Taking a Step Back with KCal: Multi-Class Kernel-Based Calibration for Deep Neural NetworksZhen Lin, Shubhendu Trivedi, Jimeng Sun 0001. [doi]

Diffusion Adversarial Representation Learning for Self-supervised Vessel SegmentationBoah Kim, Yujin Oh, Jong Chul Ye. [doi]

Compositional Law Parsing with Latent Random FunctionsFan Shi, Bin Li 0015, Xiangyang Xue. [doi]

Voint Cloud: Multi-View Point Cloud Representation for 3D UnderstandingAbdullah Hamdi, Silvio Giancola, Bernard Ghanem. [doi]

Defending against Adversarial Audio via Diffusion ModelShutong Wu, Jiongxiao Wang, Wei Ping, Weili Nie, Chaowei Xiao. [doi]

Learning Language Representations with Logical Inductive BiasJianshu Chen. [doi]

Fair Attribute Completion on Graph with Missing AttributesDongliang Guo, Zhixuan Chu, Sheng Li 0001. [doi]

Causal Confusion and Reward Misidentification in Preference-Based Reward LearningJeremy Tien, Jerry Zhi-Yang He, Zackory Erickson, Anca D. Dragan, Daniel S. Brown. [doi]

Certified Training: Small Boxes are All You NeedMark Niklas Müller, Franziska Eckert, Marc Fischer 0002, Martin T. Vechev. [doi]

LMSeg: Language-guided Multi-dataset SegmentationQiang Zhou, Yuang Liu, Chaohui Yu, Jingliang Li, Zhibin Wang, Fan Wang. [doi]

Sparse Mixture-of-Experts are Domain Generalizable LearnersBo Li, Yifei Shen, Jingkang Yang, Yezhen Wang, Jiawei Ren, Tong Che, Jun Zhang, Ziwei Liu 0002. [doi]

MapTR: Structured Modeling and Learning for Online Vectorized HD Map ConstructionBencheng Liao, Shaoyu Chen, Xinggang Wang, Tianheng Cheng, Qian Zhang 0009, Wenyu Liu 0001, Chang Huang. [doi]

A Theory of Dynamic BenchmarksAli Shirali, Rediet Abebe, Moritz Hardt. [doi]

Neural Image-based Avatars: Generalizable Radiance Fields for Human Avatar ModelingYoungjoong Kwon, Dahun Kim, Duygu Ceylan, Henry Fuchs. [doi]

Score-based Continuous-time Discrete Diffusion ModelsHaoran Sun, Lijun Yu, Bo Dai 0001, Dale Schuurmans, Hanjun Dai. [doi]

DaxBench: Benchmarking Deformable Object Manipulation with Differentiable PhysicsSiwei Chen, Yiqing Xu, Cunjun Yu, Linfeng Li, Xiao Ma 0006, Zhongwen Xu, David Hsu. [doi]

Trading Information between Latents in Hierarchical Variational AutoencodersTim Z. Xiao, Robert Bamler. [doi]

MetaGL: Evaluation-Free Selection of Graph Learning Models via Meta-LearningNamyong Park, Ryan A. Rossi, Nesreen K. Ahmed, Christos Faloutsos. [doi]

Joint Edge-Model Sparse Learning is Provably Efficient for Graph Neural NetworksShuai Zhang 0015, Meng Wang 0003, Pin-Yu Chen, Sijia Liu 0001, Songtao Lu, Miao Liu. [doi]

Towards Robustness Certification Against Universal PerturbationsYi Zeng, Zhouxing Shi, Ming Jin 0002, Feiyang Kang, Lingjuan Lyu, Cho-Jui Hsieh, Ruoxi Jia. [doi]

Unsupervised Model Selection for Time Series Anomaly DetectionMononito Goswami, Cristian I. Challu, Laurent Callot, Lenon Minorics, Andrey Kan. [doi]

Improved Learning-augmented Algorithms for k-means and k-medians ClusteringThy Dinh Nguyen, Anamay Chaturvedi, Huy L. Nguyen. [doi]

FreeMatch: Self-adaptive Thresholding for Semi-supervised LearningYidong Wang, Hao Chen 0102, Qiang Heng, Wenxin Hou, Yue Fan, Zhen Wu, Jindong Wang 0001, Marios Savvides, Takahiro Shinozaki, Bhiksha Raj, Bernt Schiele, Xing Xie 0001. [doi]

Constraining Representations Yields Models That Know What They Don't KnowJoao Monteiro, Pau Rodríguez, Pierre-André Noël, Issam H. Laradji, David Vázquez 0001. [doi]

Unbiased Stochastic Proximal Solver for Graph Neural Networks with Equilibrium StatesMingjie Li, Yifei Wang 0001, Yisen Wang 0001, Zhouchen Lin. [doi]

Semi-Implicit Variational Inference via Score MatchingLonglin Yu, Cheng Zhang. [doi]

Noise-Robust De-Duplication at ScaleEmily Silcock, Luca D'Amico-Wong, Jinglin Yang, Melissa Dell. [doi]

Scalable Batch-Mode Deep Bayesian Active Learning via Equivalence Class AnnealingRenyu Zhang, Aly A. Khan, Robert L. Grossman, Yuxin Chen 0001. [doi]

Adaptive Budget Allocation for Parameter-Efficient Fine-TuningQingru Zhang, Minshuo Chen, Alexander Bukharin, Pengcheng He, Yu Cheng 0001, Weizhu Chen, Tuo Zhao. [doi]

MaskViT: Masked Visual Pre-Training for Video PredictionAgrim Gupta, Stephen Tian, Yunzhi Zhang, Jiajun Wu 0001, Roberto Martín-Martín, Li Fei-Fei 0001. [doi]

CLIP-Dissect: Automatic Description of Neuron Representations in Deep Vision NetworksTuomas P. Oikarinen, Tsui-Wei Weng. [doi]

Causal Estimation for Text Data with (Apparent) Overlap ViolationsLin Gui, Victor Veitch. [doi]

Multi-objective optimization via equivariant deep hypervolume approximationJim Boelrijk, Bernd Ensing, Patrick Forré. [doi]

Correlative Information Maximization Based Biologically Plausible Neural Networks for Correlated Source SeparationBariscan Bozkurt, Ates Isfendiyaroglu, Cengiz Pehlevan, Alper Tunga Erdogan. [doi]

Designing BERT for Convolutional Networks: Sparse and Hierarchical Masked ModelingKeyu Tian, Yi Jiang, Qishuai Diao, Chen Lin 0003, Liwei Wang, Zehuan Yuan. [doi]

Knowledge-in-Context: Towards Knowledgeable Semi-Parametric Language ModelsXiaoman Pan, Wenlin Yao, Hongming Zhang, Dian Yu 0001, Dong Yu 0001, Jianshu Chen. [doi]

Proto-Value Networks: Scaling Representation Learning with Auxiliary TasksJesse Farebrother, Joshua Greaves, Rishabh Agarwal, Charline Le Lan, Ross Goroshin, Pablo Samuel Castro, Marc G. Bellemare. [doi]

MPCFORMER: Fast, Performant and Provate Transformer Inference with MPCDacheng Li, Hongyi Wang, Rulin Shao, Han Guo, Eric P. Xing, Hao Zhang. [doi]

Almost Linear Constant-Factor Sketching for $\ell_1$ and Logistic RegressionAlexander Munteanu, Simon Omlor, David P. Woodruff. [doi]

Towards Open Temporal Graph Neural NetworksKaituo Feng, Changsheng Li, Xiaolu Zhang, Jun Zhou 0011. [doi]

TempCLR: Temporal Alignment Representation with Contrastive LearningYuncong Yang, Jiawei Ma, Shiyuan Huang, Long Chen 0016, Xudong Lin 0003, Guangxing Han, Shih-Fu Chang. [doi]

Partially Observable RL with B-Stability: Unified Structural Condition and Sharp Sample-Efficient AlgorithmsFan Chen, Yu Bai 0017, Song Mei. [doi]

Packed Ensembles for efficient uncertainty estimationOlivier Laurent, Adrien Lafage, Enzo Tartaglione, Geoffrey Daniel, Jean-Marc Martinez, Andrei Bursuc, Gianni Franchi. [doi]

Continual Transformers: Redundancy-Free Attention for Online InferenceLukas Hedegaard, Arian Bakhtiarnia, Alexandros Iosifidis. [doi]

Dense RGB Slam with Neural Implicit MapsHeng Li, Xiaodong Gu 0004, Weihao Yuan, Luwei Yang, Zilong Dong, Ping Tan. [doi]

No Reason for No Supervision: Improved Generalization in Supervised ModelsMert Bülent Sariyildiz, Yannis Kalantidis, Karteek Alahari, Diane Larlus. [doi]

Variance-Aware Sparse Linear BanditsYan Dai 0002, Ruosong Wang, Simon Shaolei Du. [doi]

ROCO: A General Framework for Evaluating Robustness of Combinatorial Optimization Solvers on GraphsHan Lu, Zenan Li, Runzhong Wang, Qibing Ren, Xijun Li, Mingxuan Yuan, Jia Zeng, Xiaokang Yang, Junchi Yan. [doi]

A Non-Asymptotic Analysis of Oversmoothing in Graph Neural NetworksXinyi Wu, Zhengdao Chen, William Wei Wang, Ali Jadbabaie. [doi]

Relative Behavioral Attributes: Filling the Gap between Symbolic Goal Specification and Reward Learning from Human PreferencesLin Guan, Karthik Valmeekam, Subbarao Kambhampati. [doi]

Federated Learning as Variational Inference: A Scalable Expectation Propagation ApproachHan Guo, Philip Greengard, Hongyi Wang, Andrew Gelman, Yoon Kim, Eric P. Xing. [doi]

Data Valuation Without Training of a ModelNohyun Ki, Hoyong Choi, Hye Won Chung. [doi]

Bridging the Gap to Real-World Object-Centric LearningMaximilian Seitzer, Max Horn, Andrii Zadaianchuk, Dominik Zietlow, Tianjun Xiao, Carl-Johann Simon-Gabriel, Tong He 0002, Zheng Zhang 0001, Bernhard Schölkopf, Thomas Brox, Francesco Locatello. [doi]

Rethinking Symbolic Regression: Morphology and Adaptability in the Context of Evolutionary AlgorithmsKei Sen Fong, Shelvia Wongso, Mehul Motani. [doi]

Accurate Image Restoration with Attention Retractable TransformerJiale Zhang, Yulun Zhang, Jinjin Gu, Yongbing Zhang, Linghe Kong, Xin Yuan 0002. [doi]

A Laplace-inspired Distribution on SO(3) for Probabilistic Rotation EstimationYingda Yin, Yang Wang, He Wang 0010, Baoquan Chen. [doi]

Language Modelling with PixelsPhillip Rust, Jonas F. Lotz, Emanuele Bugliarello, Elizabeth Salesky, Miryam de Lhoneux, Desmond Elliott. [doi]

Mitigating Memorization of Noisy Labels via Regularization between RepresentationsHao Cheng 0012, Zhaowei Zhu, Xing Sun, Yang Liu. [doi]

Distilling Model Failures as Directions in Latent SpaceSaachi Jain, Hannah Lawrence, Ankur Moitra, Aleksander Madry. [doi]

Trainability Preserving Neural PruningHuan Wang, Yun Fu 0001. [doi]

Holistic Adversarially Robust PruningQi Zhao, Christian Wressnegger. [doi]

Toward Adversarial Training on Contextualized Language RepresentationHongqiu Wu, Yongxiang Liu, Hanwen Shi, Hai Zhao, Min Zhang. [doi]

Summarization Programs: Interpretable Abstractive Summarization with Neural Modular TreesSwarnadeep Saha, Shiyue Zhang, Peter Hase, Mohit Bansal. [doi]

A Differential Geometric View and Explainability of GNN on Evolving GraphsYazheng Liu, Xi Zhang 0008, Sihong Xie. [doi]

Learning Vortex Dynamics for Fluid Inference and PredictionYitong Deng, Hong-Xing Yu, Jiajun Wu 0001, Bo Zhu 0002. [doi]

Fantastic Rewards and How to Tame Them: A Case Study on Reward Learning for Task-oriented Dialogue SystemsYihao Feng, Shentao Yang, Shujian Zhang, Jianguo Zhang 0005, Caiming Xiong, Mingyuan Zhou, Huan Wang. [doi]

Out-of-distribution Representation Learning for Time Series ClassificationWang Lu, Jindong Wang 0001, Xinwei Sun 0001, Yiqiang Chen, Xing Xie 0001. [doi]

Masked Vision and Language Modeling for Multi-modal Representation LearningGukyeong Kwon, Zhaowei Cai, Avinash Ravichandran, Erhan Bas, Rahul Bhotika, Stefano Soatto. [doi]

EAGLE: Large-scale Learning of Turbulent Fluid Dynamics with Mesh TransformersSteeven Janny, Aurélien Béneteau, Madiha Nadri, Julie Digne, Nicolas Thome, Christian Wolf 0001. [doi]

Extremely Simple Activation Shaping for Out-of-Distribution DetectionAndrija Djurisic, Nebojsa Bozanic, Arjun Ashok, Rosanne Liu. [doi]

Generalize Learned Heuristics to Solve Large-scale Vehicle Routing Problems in Real-timeQingchun Hou, Jingwei Yang, Yiqiang Su, Xiaoqing Wang, Yuming Deng. [doi]

CLIPSep: Learning Text-queried Sound Separation with Noisy Unlabeled VideosHao-Wen Dong, Naoya Takahashi, Yuki Mitsufuji, Julian J. McAuley, Taylor Berg-Kirkpatrick. [doi]

Exploring Temporally Dynamic Data Augmentation for Video RecognitionTaeoh Kim, Jinhyung Kim, Minho Shim, Sangdoo Yun, Myunggu Kang, Dongyoon Wee, Sangyoun Lee. [doi]

Using Language to Extend to Unseen DomainsLisa Dunlap, Clara Mohri, Devin Guillory, Han Zhang, Trevor Darrell, Joseph E. Gonzalez, Aditi Raghunathan, Anna Rohrbach. [doi]

Learning to Estimate Single-View Volumetric Flow Motions without 3D SupervisionErik Franz, Barbara Solenthaler, Nils Thuerey. [doi]

STUNT: Few-shot Tabular Learning with Self-generated Tasks from Unlabeled TablesJaehyun Nam, Jihoon Tack, Kyungmin Lee, Hankook Lee, Jinwoo Shin. [doi]

Neural Groundplans: Persistent Neural Scene Representations from a Single ImagePrafull Sharma, Ayush Tewari, Yilun Du, Sergey Zakharov, Rares Andrei Ambrus, Adrien Gaidon, William T. Freeman, Frédo Durand, Joshua B. Tenenbaum, Vincent Sitzmann. [doi]

Modeling Multimodal Aleatoric Uncertainty in Segmentation with Mixture of Stochastic ExpertsZhitong Gao, Yucong Chen, Chuyu Zhang, Xuming He 0001. [doi]

Forward Super-Resolution: How Can GANs Learn Hierarchical Generative Models for Real-World DistributionsZeyuan Allen Zhu, Yuanzhi Li. [doi]

Become a Proficient Player with Limited Data through Watching Pure VideosWeirui Ye, Yunsheng Zhang, Pieter Abbeel, Yang Gao. [doi]

Re-weighting Based Group Fairness Regularization via Classwise Robust OptimizationSangwon Jung, Taeeon Park, Sanghyuk Chun, Taesup Moon. [doi]

Visual Imitation Learning with Patch RewardsMinghuan Liu, Tairan He, Weinan Zhang 0001, Shuicheng Yan, Zhongwen Xu. [doi]

Global Explainability of GNNs via Logic Combination of Learned ConceptsSteve Azzolin, Antonio Longa, Pietro Barbiero, Pietro Liò, Andrea Passerini. [doi]

Instance-wise Batch Label Restoration via Gradients in Federated LearningKailang Ma, Yu Sun 0015, Jian Cui, Dawei Li, Zhenyu Guan, Jianwei Liu 0001. [doi]

Noise Injection Node Regularization for Robust LearningNoam Levi, Itay M. Bloch, Marat Freytsis, Tomer Volansky. [doi]

A Unified Algebraic Perspective on Lipschitz Neural NetworksAlexandre Araujo, Aaron J. Havens, Blaise Delattre, Alexandre Allauzen, Bin Hu 0002. [doi]

ACMP: Allen-Cahn Message Passing with Attractive and Repulsive Forces for Graph Neural NetworksYuelin Wang, Kai Yi, Xinliang Liu, Yu Guang Wang, Shi Jin. [doi]

Autoencoders as Cross-Modal Teachers: Can Pretrained 2D Image Transformers Help 3D Representation Learning?Runpei Dong, Zekun Qi, Linfeng Zhang, Junbo Zhang, Jianjian Sun, Zheng Ge, Li Yi, Kaisheng Ma. [doi]

That Label's got Style: Handling Label Style Bias for Uncertain Image SegmentationKilian Zepf, Eike Petersen, Jes Frellsen, Aasa Feragen. [doi]

Bidirectional Language Models Are Also Few-shot LearnersAjay Patel, Bryan Li, Mohammad Sadegh Rasooli, Noah Constant, Colin Raffel, Chris Callison-Burch. [doi]

Towards Smooth Video CompositionQihang Zhang, Ceyuan Yang, Yujun Shen, Yinghao Xu, Bolei Zhou. [doi]

Equivariant Hypergraph Diffusion Neural OperatorsPeihao Wang, Shenghao Yang, Yunyu Liu, Zhangyang Wang, Pan Li. [doi]

ExpressivE: A Spatio-Functional Embedding For Knowledge Graph CompletionAleksandar Pavlovic 0002, Emanuel Sallinger. [doi]

Restricted Strong Convexity of Deep Learning Models with Smooth ActivationsArindam Banerjee, Pedro Cisneros-Velarde, Libin Zhu, Misha Belkin. [doi]

Quantifying and Mitigating the Impact of Label Errors on Model Disparity MetricsJulius Adebayo, Melissa Hall, Bowen Yu, Bobbie Chern. [doi]

Sampling with Mollified Interaction Energy DescentLingxiao Li, Qiang Liu, Anna Korba, Mikhail Yurochkin, Justin Solomon 0001. [doi]

Parameter-Efficient Fine-Tuning Design SpacesJiaao Chen, Aston Zhang, Xingjian Shi, Mu Li 0003, Alex Smola, Diyi Yang. [doi]

Imbalanced Semi-supervised Learning with Bias Adaptive ClassifierRenzhen Wang, Xixi Jia, Quanziang Wang, Yichen Wu, Deyu Meng. [doi]

Calibrating Sequence likelihood Improves Conditional Language GenerationYao Zhao, Misha Khalman, Rishabh Joshi, Shashi Narayan, Mohammad Saleh, Peter J. Liu. [doi]

Unsupervised visualization of image datasets using contrastive learningJan Niklas Böhm, Philipp Berens, Dmitry Kobak. [doi]

Turning the Curse of Heterogeneity in Federated Learning into a Blessing for Out-of-Distribution DetectionShuyang Yu, Junyuan Hong, Haotao Wang, Zhangyang Wang, Jiayu Zhou. [doi]

Spatio-temporal point processes with deep non-stationary kernelsZheng Dong, Xiuyuan Cheng, Yao Xie 0002. [doi]

Budgeted Training for Vision TransformerZhuofan Xia, Xuran Pan, Xuan Jin, Yuan He 0011, Hui Xue 0001, Shiji Song, Gao Huang. [doi]

Coupled Multiwavelet Operator Learning for Coupled Differential EquationsXiongye Xiao, Defu Cao, Ruochen Yang, Gaurav Gupta, Gengshuo Liu, Chenzhong Yin, Radu Balan, Paul Bogdan. [doi]

Sequential Learning of Neural Networks for Prequential MDLJörg Bornschein, Yazhe Li, Marcus Hutter. [doi]

TANGOS: Regularizing Tabular Neural Networks through Gradient Orthogonalization and SpecializationAlan Jeffares, Tennison Liu, Jonathan Crabbé, Fergus Imrie, Mihaela van der Schaar. [doi]

CFlowNets: Continuous Control with Generative Flow NetworksYinchuan Li, Shuang Luo, Haozhi Wang, Jianye Hao. [doi]

Distributed Differential Privacy in Multi-Armed BanditsSayak Ray Chowdhury, Xingyu Zhou 0001. [doi]

Personalized Federated Learning with Feature Alignment and Classifier CollaborationJian Xu, Xinyi Tong, Shao-Lun Huang. [doi]

Reparameterization through Spatial Gradient ScalingAlexander Detkov, Mohammad Salameh, Muhammad Fetrat Qharabagh, Jialin Zhang, Robin Luwei, Shangling Jui, Di Niu. [doi]

kNN-Diffusion: Image Generation via Large-Scale RetrievalShelly Sheynin, Oron Ashual, Adam Polyak, Uriel Singer, Oran Gafni, Eliya Nachmani, Yaniv Taigman. [doi]

Improved Convergence of Differential Private SGD with Gradient ClippingHuang Fang, Xiaoyun Li, Chenglin Fan, Ping Li 0001. [doi]

Graph Domain Adaptation via Theory-Grounded Spectral RegularizationYuning You, Tianlong Chen, Zhangyang Wang, Yang Shen. [doi]

OPTQ: Accurate Quantization for Generative Pre-trained TransformersElias Frantar, Saleh Ashkboos, Torsten Hoefler, Dan Alistarh. [doi]

Accelerated Single-Call Methods for Constrained Min-Max OptimizationYang Cai 0001, Weiqiang Zheng. [doi]

f-DM: A Multi-stage Diffusion Model via Progressive Signal TransformationJiatao Gu, Shuangfei Zhai, Yizhe Zhang 0002, Miguel Ángel Bautista 0001, Joshua M. Susskind. [doi]

Conditional Antibody Design as 3D Equivariant Graph TranslationXiangzhe Kong, Wenbing Huang 0001, Yang Liu 0005. [doi]

Learning Multimodal Data Augmentation in Feature SpaceZichang Liu, Zhiqiang Tang 0001, Xingjian Shi, Aston Zhang, Mu Li 0003, Anshumali Shrivastava, Andrew Gordon Wilson. [doi]

Not All Tasks Are Born Equal: Understanding Zero-Shot GeneralizationJing Zhou, Zongyu Lin, Yanan Zheng, Jian Li, Zhilin Yang. [doi]

Learning Input-agnostic Manipulation Directions in StyleGAN with Text GuidanceYoonjeon Kim, Hyunsu Kim, Junho Kim, Yunjey Choi, Eunho Yang. [doi]

Spiking Convolutional Neural Networks for Text ClassificationChangze Lv, Jianhan Xu, Xiaoqing Zheng. [doi]

Conditional Positional Encodings for Vision TransformersXiangxiang Chu, Zhi Tian, Bo Zhang 0046, Xinlong Wang, Chunhua Shen. [doi]

Language Models Are Greedy Reasoners: A Systematic Formal Analysis of Chain-of-ThoughtAbulhair Saparov, He He 0001. [doi]

CktGNN: Circuit Graph Neural Network for Electronic Design AutomationZehao Dong, Weidong Cao, Muhan Zhang, Dacheng Tao, Yixin Chen 0001, Xuan Zhang. [doi]

ZiCo: Zero-shot NAS via inverse Coefficient of Variation on GradientsGuihong Li, Yuedong Yang, Kartikeya Bhardwaj, Radu Marculescu. [doi]

CodeT: Code Generation with Generated TestsBei Chen, Fengji Zhang, Anh Nguyen, Daoguang Zan, Zeqi Lin, Jian-Guang Lou, Weizhu Chen. [doi]

Out-of-Distribution Detection based on In-Distribution Data Patterns Memorization with Modern Hopfield EnergyJinsong Zhang, Qiang Fu, Xu Chen 0022, Lun Du, Zelin Li, Gang Wang, Xiaoguang Liu, Shi Han, Dongmei Zhang 0001. [doi]

Learning differentiable solvers for systems with hard constraintsGeoffrey Négiar, Michael W. Mahoney, Aditi S. Krishnapriyan. [doi]

Task-Aware Information Routing from Common Representation Space in Lifelong LearningPrashant Shivaram Bhat, Bahram Zonooz, Elahe Arani. [doi]

Least-to-Most Prompting Enables Complex Reasoning in Large Language ModelsDenny Zhou, Nathanael Schärli, Le Hou, Jason Wei, Nathan Scales, Xuezhi Wang 0002, Dale Schuurmans, Claire Cui, Olivier Bousquet, Quoc V. Le, Ed H. Chi. [doi]

Bridge the Inference Gaps of Neural Processes via Expectation MaximizationQi Wang, Marco Federici, Herke van Hoof. [doi]

Molecular Geometry Pretraining with SE(3)-Invariant Denoising Distance MatchingShengchao Liu, Hongyu Guo, Jian Tang 0005. [doi]

Exploring Active 3D Object Detection from a Generalization PerspectiveYadan Luo, Zhuoxiao Chen, Zijian Wang, Xin Yu, Zi Huang, Mahsa Baktashmotlagh. [doi]

Seeing Differently, Acting Similarly: Heterogeneously Observable Imitation LearningXin-Qiang Cai, Yao-Xiang Ding, Zi-Xuan Chen, Yuan Jiang 0001, Masashi Sugiyama, Zhi-Hua Zhou. [doi]

SWIFT: Rapid Decentralized Federated Learning via Wait-Free Model CommunicationMarco Bornstein, Tahseen Rabbani, Evan Wang, Amrit S. Bedi, Furong Huang. [doi]

In-context Reinforcement Learning with Algorithm DistillationMichael Laskin, Luyu Wang, Junhyuk Oh, Emilio Parisotto, Stephen Spencer, Richie Steigerwald, DJ Strouse, Steven Stenberg Hansen, Angelos Filos, Ethan A. Brooks, Maxime Gazeau, Himanshu Sahni, Satinder Singh 0001, Volodymyr Mnih. [doi]

Continual Unsupervised Disentangling of Self-Organizing RepresentationsZhiyuan Li, Xiajun Jiang, Ryan Missel, Prashnna Kumar Gyawali, Nilesh Kumar, Linwei Wang. [doi]

Actionable Neural Representations: Grid Cells from Minimal ConstraintsWill Dorrell, Peter E. Latham, Tim E. J. Behrens, James C. R. Whittington. [doi]

Confidence-Conditioned Value Functions for Offline Reinforcement LearningJoey Hong, Aviral Kumar, Sergey Levine. [doi]

A theoretical study of inductive biases in contrastive learningJeff Z. HaoChen, Tengyu Ma 0001. [doi]

ODAM: Gradient-based Instance-Specific Visual Explanations for Object DetectionChenyang Zhao, Antoni B. Chan. [doi]

MARS: Meta-learning as Score Matching in the Function SpaceKrunoslav Lehman Pavasovic, Jonas Rothfuss, Andreas Krause 0001. [doi]

The Augmented Image Prior: Distilling 1000 Classes by Extrapolating from a Single ImageYuki M. Asano, Aaqib Saeed. [doi]

Making Better Decision by Directly Planning in Continuous ControlJinhua Zhu, Yue Wang 0017, Lijun Wu, Tao Qin, Wengang Zhou, Tie-Yan Liu, Houqiang Li. [doi]

Pessimism in the Face of Confounders: Provably Efficient Offline Reinforcement Learning in Partially Observable Markov Decision ProcessesMiao Lu, Yifei Min, Zhaoran Wang, Zhuoran Yang. [doi]

Scenario-based Question Answering with Interacting Contextual PropertiesHaitian Sun, William W. Cohen, Ruslan Salakhutdinov. [doi]

Human-Guided Fair Classification for Natural Language ProcessingFlorian E. Dorner, Momchil Peychev, Nikola Konstantinov, Naman Goel, Elliott Ash, Martin T. Vechev. [doi]

Aligning Model and Macaque Inferior Temporal Cortex Representations Improves Model-to-Human Behavioral Alignment and Adversarial RobustnessJoel Dapello, Kohitij Kar, Martin Schrimpf, Robert Baldwin Geary, Michael Ferguson, David Daniel Cox, James J. DiCarlo. [doi]

PAC Reinforcement Learning for Predictive State RepresentationsWenhao Zhan, Masatoshi Uehara, Wen Sun 0002, Jason D. Lee. [doi]

Don't fear the unlabelled: safe semi-supervised learning via debiasingHugo Schmutz, Olivier Humbert, Pierre-Alexandre Mattei. [doi]

Modeling content creator incentives on algorithm-curated platformsJiri Hron, Karl Krauth, Michael I. Jordan, Niki Kilbertus, Sarah Dean. [doi]

Explicitly Minimizing the Blur Error of Variational AutoencodersGustav Bredell, Kyriakos Flouris, Krishna Chaitanya, Ertunc Erdil, Ender Konukoglu. [doi]

Large Language Models are Human-Level Prompt EngineersYongchao Zhou, Andrei Ioan Muresanu, Ziwen Han, Keiran Paster, Silviu Pitis, Harris Chan, Jimmy Ba. [doi]

Selection-Inference: Exploiting Large Language Models for Interpretable Logical ReasoningAntonia Creswell, Murray Shanahan, Irina Higgins. [doi]

How Much Data Are Augmentations Worth? An Investigation into Scaling Laws, Invariance, and Implicit RegularizationJonas Geiping, Micah Goldblum, Gowthami Somepalli, Ravid Shwartz-Ziv, Tom Goldstein, Andrew Gordon Wilson. [doi]

Grounding Graph Network Simulators using Physical Sensor ObservationsJonas Linkerhägner, Niklas Freymuth, Paul Maria Scheikl, Franziska Mathis-Ullrich, Gerhard Neumann. [doi]

Mind the Gap: Offline Policy Optimization for Imperfect RewardsJianxiong Li, Xiao Hu, Haoran Xu, Jingjing Liu, Xianyuan Zhan, Qing-Shan Jia, Ya-Qin Zhang. [doi]

Scaling up and Stabilizing Differentiable Planning with Implicit DifferentiationLinfeng Zhao, Huazhe Xu, Lawson L. S. Wong. [doi]

Advancing Radiograph Representation Learning with Masked Record ModelingHong-Yu Zhou, Chenyu Lian, Liansheng Wang, Yizhou Yu. [doi]

ArCL: Enhancing Contrastive Learning with Augmentation-Robust RepresentationsXuyang Zhao, Tianqi Du, Yisen Wang 0001, Jun Yao, Weiran Huang 0001. [doi]

Contrastive Alignment of Vision to Language Through Parameter-Efficient Transfer LearningZaid Khan 0001, Yun Fu 0001. [doi]

Sharper Bounds for Uniformly Stable Algorithms with Stationary Mixing ProcessShi Fu, Yunwen Lei, Qiong Cao, Xinmei Tian 0001, Dacheng Tao. [doi]

Approximate Nearest Neighbor Search through Modern Error-Correcting CodesNoam Touitou, Nissim Halabi. [doi]

Label-free Concept Bottleneck ModelsTuomas P. Oikarinen, Subhro Das, Lam M. Nguyen, Tsui-Wei Weng. [doi]

MACTA: A Multi-agent Reinforcement Learning Approach for Cache Timing Attacks and DetectionJiaxun Cui, Xiaomeng Yang, Mulong Luo, Geunbae Lee, Peter Stone, Hsien-Hsin S. Lee, Benjamin Lee, G. Edward Suh, Wenjie Xiong 0001, Yuandong Tian. [doi]

Diffusion Probabilistic Modeling of Protein Backbones in 3D for the motif-scaffolding problemBrian L. Trippe, Jason Yim, Doug Tischer, David Baker, Tamara Broderick, Regina Barzilay, Tommi S. Jaakkola. [doi]

Stateful Active Facilitator: Coordination and Environmental Heterogeneity in Cooperative Multi-Agent Reinforcement LearningDianbo Liu, Vedant Shah, Oussama Boussif, Cristian Meo, Anirudh Goyal, Tianmin Shu, Michael Curtis Mozer, Nicolas Heess, Yoshua Bengio. [doi]

Transformers are Sample-Efficient World ModelsVincent Micheli, Eloi Alonso, François Fleuret. [doi]

Masked Frequency Modeling for Self-Supervised Visual Pre-TrainingJiahao Xie 0002, Wei Li, Xiaohang Zhan, Ziwei Liu 0002, Yew-Soon Ong, Chen Change Loy. [doi]

Enhancing Meta Learning via Multi-Objective Soft Improvement FunctionsRunsheng Yu, Weiyu Chen, Xinrun Wang, James Kwok. [doi]

RPM: Generalizable Multi-Agent Policies for Multi-Agent Reinforcement LearningWei Qiu 0001, Xiao Ma 0006, Bo An 0001, Svetlana Obraztsova, Shuicheng Yan, Zhongwen Xu. [doi]

Diversify and Disambiguate: Out-of-Distribution Robustness via DisagreementYoonho Lee 0001, Huaxiu Yao, Chelsea Finn. [doi]

Stay Moral and Explore: Learn to Behave Morally in Text-based GamesZijing Shi, Meng Fang, Yunqiu Xu, Ling Chen 0006, Yali Du 0001. [doi]

Towards Addressing Label Skews in One-Shot Federated LearningYiqun Diao, Qinbin Li, Bingsheng He. [doi]

Greedy Actor-Critic: A New Conditional Cross-Entropy Method for Policy ImprovementSamuel Neumann, Sungsu Lim, Ajin George Joseph, Yangchen Pan, Adam White 0001, Martha White. [doi]

A critical look at the evaluation of GNNs under heterophily: Are we really making progress?Oleg Platonov, Denis Kuznedelev, Michael Diskin, Artem Babenko, Liudmila Prokhorenkova. [doi]

Versatile Neural Processes for Learning Implicit Neural RepresentationsZongyu Guo, Cuiling Lan, Zhizheng Zhang 0004, Yan Lu, Zhibo Chen 0001. [doi]

Diffusion Models for Causal Discovery via Topological OrderingPedro Sanchez, Xiao Liu, Alison Q. O'Neil, Sotirios A. Tsaftaris. [doi]

Composing Task Knowledge With Modular Successor Feature ApproximatorsWilka Carvalho, Angelos Filos, Richard L. Lewis, Honglak Lee, Satinder Singh 0001. [doi]

A Closer Look at Model Adaptation using Feature Distortion and Simplicity BiasPuja Trivedi, Danai Koutra, Jayaraman J. Thiagarajan. [doi]

SMART: Self-supervised Multi-task pretrAining with contRol TransformersYanchao Sun, Shuang Ma, Ratnesh Madaan, Rogerio Bonatti, Furong Huang, Ashish Kapoor. [doi]

On the Importance and Applicability of Pre-Training for Federated LearningHong-You Chen, Cheng-Hao Tu 0004, Ziwei Li, Han-Wei Shen, Wei-Lun Chao. [doi]

Towards Understanding Why Mask Reconstruction Pretraining Helps in Downstream TasksJiachun Pan, Pan Zhou, Shuicheng Yan. [doi]

Multi-skill Mobile Manipulation for Object RearrangementJiayuan Gu, Devendra Singh Chaplot, Hao Su 0001, Jitendra Malik. [doi]

Equivariant Shape-Conditioned Generation of 3D Molecules for Ligand-Based Drug DesignKeir Adams, Connor W. Coley. [doi]

The Tilted Variational Autoencoder: Improving Out-of-Distribution DetectionGriffin Floto, Stefan Kremer, Mihai Nica. [doi]

Provably Auditing Ordinary Least Squares in Low DimensionsAnkur Moitra, Dhruv Rohatgi. [doi]

Encoding Recurrence into TransformersFeiqing Huang, Kexin Lu, Yuxi Cai, Zhen Qin, Yanwen Fang, Guangjian Tian, Guodong Li. [doi]

General Neural Gauge FieldsFangneng Zhan, Lingjie Liu, Adam Kortylewski, Christian Theobalt. [doi]

More Centralized Training, Still Decentralized Execution: Multi-Agent Conditional Policy FactorizationJiangxing Wang, Deheng Ye, Zongqing Lu. [doi]

Phenaki: Variable Length Video Generation from Open Domain Textual DescriptionsRuben Villegas, Mohammad Babaeizadeh, Pieter-Jan Kindermans, Hernan Moraldo, Han Zhang 0010, Mohammad Taghi Saffar, Santiago Castro, Julius Kunze, Dumitru Erhan. [doi]

Risk-Aware Reinforcement Learning with Coherent Risk Measures and Non-linear Function ApproximationThanh Lam, Arun Verma, Bryan Kian Hsiang Low, Patrick Jaillet. [doi]

Unsupervised Manifold Alignment with Joint Multidimensional ScalingDexiong Chen, Bowen Fan, Carlos G. Oliver, Karsten M. Borgwardt. [doi]

Mega: Moving Average Equipped Gated AttentionXuezhe Ma, Chunting Zhou, Xiang Kong, Junxian He, Liangke Gui, Graham Neubig, Jonathan May, Luke Zettlemoyer. [doi]

The Trade-off between Universality and Label Efficiency of Representations from Contrastive LearningZhenmei Shi, Jiefeng Chen 0001, Kunyang Li, Jayaram Raghuram, Xi Wu 0001, Yingyu Liang, Somesh Jha. [doi]

Neural Collapse Inspired Feature-Classifier Alignment for Few-Shot Class-Incremental LearningYibo Yang, Haobo Yuan, Xiangtai Li, Zhouchen Lin, Philip H. S. Torr, Dacheng Tao. [doi]

Q-Pensieve: Boosting Sample Efficiency of Multi-Objective RL Through Memory Sharing of Q-SnapshotsWei Hung, Bo-Kai Huang, Ping-Chun Hsieh, Xi Liu 0011. [doi]

Decision Transformer under Random Frame DroppingKaizhe Hu, Ray Chen Zheng, Yang Gao 0029, Huazhe Xu. [doi]

Decision S4: Efficient Sequence-Based RL via State Spaces LayersShmuel Bar-David, Itamar Zimerman, Eliya Nachmani, Lior Wolf. [doi]

An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual InversionRinon Gal, Yuval Alaluf, Yuval Atzmon, Or Patashnik, Amit Haim Bermano, Gal Chechik, Daniel Cohen-Or. [doi]

Minimalistic Unsupervised Representation Learning with the Sparse Manifold TransformYubei Chen, Zeyu Yun, Yi Ma 0001, Bruno A. Olshausen, Yann LeCun. [doi]

Learning Controllable Adaptive Simulation for Multi-resolution PhysicsTailin Wu, Takashi Maruyama, Qingqing Zhao, Gordon Wetzstein, Jure Leskovec. [doi]

SGDA with shuffling: faster convergence for nonconvex-PŁ minimax optimizationHanseul Cho 0002, Chulhee Yun. [doi]

Data-Free One-Shot Federated Learning Under Very High Statistical HeterogeneityClare Elizabeth Heinbaugh, Emilio Luz-Ricca, Huajie Shao. [doi]

SoftZoo: A Soft Robot Co-design Benchmark For Locomotion In Diverse EnvironmentsTsun-Hsuan Wang, Pingchuan Ma 0002, Andrew Everett Spielberg, Zhou Xian, Hao Zhang, Joshua B. Tenenbaum, Daniela Rus, Chuang Gan. [doi]

Symbolic Physics Learner: Discovering governing equations via Monte Carlo tree searchFangzheng Sun, Yang Liu 0130, Jian Xun Wang, Hao Sun 0002. [doi]

Offline RL for Natural Language Generation with Implicit Language Q LearningCharlie Snell, Ilya Kostrikov, Yi Su, Sherry Yang, Sergey Levine. [doi]

Neural Radiance Field CodebooksMatthew Wallingford, Aditya Kusupati, Alex Fang, Vivek Ramanujan, Aniruddha Kembhavi, Roozbeh Mottaghi, Ali Farhadi. [doi]

SoftMatch: Addressing the Quantity-Quality Tradeoff in Semi-supervised LearningHao Chen 0102, Ran Tao, Yue Fan, Yidong Wang, Jindong Wang 0001, Bernt Schiele, Xing Xie 0001, Bhiksha Raj, Marios Savvides. [doi]

SlotFormer: Unsupervised Visual Dynamics Simulation with Object-Centric ModelsZiyi Wu, Nikita Dvornik, Klaus Greff, Thomas Kipf, Animesh Garg. [doi]

AE-FLOW: Autoencoders with Normalizing Flows for Medical Images Anomaly DetectionYuZhong Zhao, Qiaoqiao Ding, Xiaoqun Zhang. [doi]

Optimal Activation Functions for the Random Features Regression ModelJianxin Wang, José Bento 0001. [doi]

Calibration Matters: Tackling Maximization Bias in Large-scale Advertising Recommendation SystemsYewen Fan, Nian Si, Kun Zhang 0001. [doi]

Efficient Offline Policy Optimization with a Learned ModelZichen Liu, Siyi Li, Wee Sun Lee, Shuicheng Yan, Zhongwen Xu. [doi]

Understanding The Robustness of Self-supervised Learning Through Topic ModelingZeping Luo, Shiyou Wu, Cindy Weng, Mo Zhou, Rong Ge 0001. [doi]

Mass-Editing Memory in a TransformerKevin Meng, Arnab Sen Sharma, Alex J. Andonian, Yonatan Belinkov, David Bau. [doi]

Neural Networks and the Chomsky HierarchyGrégoire Delétang, Anian Ruoss, Jordi Grau-Moya, Tim Genewein, Li Kevin Wenliang, Elliot Catt, Chris Cundy, Marcus Hutter, Shane Legg, Joel Veness, Pedro A. Ortega. [doi]

TDR-CL: Targeted Doubly Robust Collaborative Learning for Debiased RecommendationsHaoxuan Li, Yan Lyu, Chunyuan Zheng, Peng Wu 0012. [doi]

Words are all you need? Language as an approximation for human similarity judgmentsRaja Marjieh, Pol van Rijn, Ilia Sucholutsky, Theodore R. Sumers, Harin Lee, Thomas L. Griffiths 0001, Nori Jacoby. [doi]

Eva: Practical Second-order Optimization with Kronecker-vectorized ApproximationLin Zhang, Shaohuai Shi, Bo Li. [doi]

Ordered GNN: Ordering Message Passing to Deal with Heterophily and Over-smoothingYunchong Song, Chenghu Zhou, Xinbing Wang, Zhouhan Lin. [doi]

Safe Exploration Incurs Nearly No Additional Sample Complexity for Reward-Free RLRuiquan Huang, Jing Yang 0002, Yingbin Liang. [doi]

Why (and When) does Local SGD Generalize Better than SGD?Xinran Gu, Kaifeng Lyu, Longbo Huang, Sanjeev Arora. [doi]

Heterogeneous Neuronal and Synaptic Dynamics for Spike-Efficient Unsupervised Learning: Theory and Design PrinciplesBiswadeep Chakraborty, Saibal Mukhopadhyay. [doi]

Parametrizing Product Shape Manifolds by Composite NetworksJosua Sassen, Klaus Hildebrandt, Martin Rumpf, Benedikt Wirth. [doi]

TextShield: Beyond Successfully Detecting Adversarial Sentences in text classificationLingfeng Shen, Ze Zhang, Haiyun Jiang, Ying Chen. [doi]

Fake It Until You Make It : Towards Accurate Near-Distribution Novelty DetectionHossein Mirzaei, Mohammadreza Salehi, Sajjad Shahabi, Efstratios Gavves, Cees G. M. Snoek, Mohammad Sabokrou, Mohammad Hossein Rohban. [doi]

Learning What and Where: Disentangling Location and Identity Tracking Without SupervisionManuel Traub, Sebastian Otte, Tobias Menge, Matthias Karlbauer, Jannik Thümmel, Martin V. Butz. [doi]

Masked Distillation with Receptive TokensTao Huang 0020, Yuan Zhang, Shan You, Fei Wang 0032, Chen Qian 0006, Jian Cao, Chang Xu. [doi]

Temporal Domain Generalization with Drift-Aware Dynamic Neural NetworksGuangji Bai, Chen Ling, Liang Zhao 0002. [doi]

Learning Sparse and Low-Rank Priors for Image Recovery via Iterative Reweighted Least Squares MinimizationStamatios Lefkimmiatis, Iaroslav Koshelev. [doi]

Computational Language Acquisition with Theory of MindAndy Liu, Hao Zhu, Emmy Liu, Yonatan Bisk, Graham Neubig. [doi]

Flow Annealed Importance Sampling BootstrapLaurence Illing Midgley, Vincent Stimper, Gregor N. C. Simm, Bernhard Schölkopf, José Miguel Hernández-Lobato. [doi]

DCI-ES: An Extended Disentanglement Framework with Connections to IdentifiabilityCian Eastwood, Andrei Liviu Nicolicioiu, Julius von Kügelgen, Armin Kekic, Frederik Träuble, Andrea Dittadi, Bernhard Schölkopf. [doi]

GEASS: Neural causal feature selection for high-dimensional biological dataMingze Dong, Yuval Kluger. [doi]

Domain Generalisation via Domain Adaptation: An Adversarial Fourier Amplitude ApproachMinyoung Kim, Da Li 0001, Timothy M. Hospedales. [doi]

Differentiable Gaussianization Layers for Inverse Problems Regularized by Deep Generative ModelsDongzhuo Li. [doi]

Targeted Hyperparameter Optimization with Lexicographic Preferences Over Multiple ObjectivesShaokun Zhang, Feiran Jia, Chi Wang 0001, Qingyun Wu. [doi]

Robust Explanation Constraints for Neural NetworksMatthew Wicker, Juyeon Heo, Luca Costabello, Adrian Weller. [doi]

Unsupervised Semantic Segmentation with Self-supervised Object-centric RepresentationsAndrii Zadaianchuk, Matthäus Kleindessner, Yi Zhu, Francesco Locatello, Thomas Brox. [doi]

UniMax: Fairer and More Effective Language Sampling for Large-Scale Multilingual PretrainingHyung Won Chung, Xavier Garcia, Adam Roberts, Yi Tay, Orhan Firat, Sharan Narang, Noah Constant. [doi]

Learning to Jointly Share and Prune Weights for Grounding Based Vision and Language ModelsShangqian Gao, Burak Uzkent, Yilin Shen, Heng Huang, Hongxia Jin. [doi]

Competitive Physics Informed NetworksQi Zeng, Yash Kothari, Spencer H. Bryngelson, Florian Schäfer. [doi]

User-Interactive Offline Reinforcement LearningPhillip Swazinna, Steffen Udluft, Thomas A. Runkler. [doi]

Understanding new tasks through the lens of training data via exponential tiltingSubha Maity, Mikhail Yurochkin, Moulinath Banerjee, Yuekai Sun. [doi]

Compositional Prompt Tuning with Motion Cues for Open-vocabulary Video Relation DetectionKaifeng Gao, Long Chen 0016, Hanwang Zhang, Jun Xiao 0001, Qianru Sun. [doi]

NAGphormer: A Tokenized Graph Transformer for Node Classification in Large GraphsJinsong Chen, Kaiyuan Gao, Gaichao Li, Kun He 0001. [doi]

Interpretable Debiasing of Vectorized Language Representations with Iterative OrthogonalizationPrince Osei Aboagye, Yan Zheng 0001, Jack Shunn, Chin-Chia Michael Yeh, JunPeng Wang, Zhongfang Zhuang, Huiyuan Chen, Liang Wang 0047, Wei Zhang 0189, Jeff M. Phillips. [doi]

DM-NeRF: 3D Scene Geometry Decomposition and Manipulation from 2D ImagesBing Wang, Lu Chen, Bo Yang 0027. [doi]

EVC: Towards Real-Time Neural Image Compression with Mask DecayGuo-Hua Wang, Jiahao Li, Bin Li 0012, Yan Lu 0001. [doi]

How to Exploit Hyperspherical Embeddings for Out-of-Distribution Detection?Yifei Ming, Yiyou Sun, Ousmane Dia, Yixuan Li 0001. [doi]

GNNDelete: A General Strategy for Unlearning in Graph Neural NetworksJiali Cheng, George Dasoulas, Huan He, Chirag Agarwal, Marinka Zitnik. [doi]

Progressively Compressed Auto-Encoder for Self-supervised Representation LearningJin Li, Yaoming Wang, Xiaopeng Zhang 0008, Yabo Chen, Dongsheng Jiang, Wenrui Dai, Chenglin Li, Hongkai Xiong, Qi Tian 0001. [doi]

SemPPL: Predicting Pseudo-Labels for Better Contrastive RepresentationsMatko Bosnjak, Pierre Harvey Richemond, Nenad Tomasev, Florian Strub, Jacob C. Walker, Felix Hill, Lars Holger Buesing, Razvan Pascanu, Charles Blundell, Jovana Mitrovic. [doi]

Deterministic training of generative autoencoders using invertible layersGianluigi Silvestri, Daan Roos, Luca Ambrogioni. [doi]

FluidLab: A Differentiable Environment for Benchmarking Complex Fluid ManipulationZhou Xian, Bo Zhu, Zhenjia Xu, Hsiao-Yu Tung, Antonio Torralba 0001, Katerina Fragkiadaki, Chuang Gan. [doi]

Learning Locality and Isotropy in Dialogue ModelingHan Wu 0004, Haochen Tan, Mingjie Zhan, Gangming Zhao, Shaoqing Lu, Ding Liang, Linqi Song. [doi]

Metadata Archaeology: Unearthing Data Subsets by Leveraging Training DynamicsShoaib Ahmed Siddiqui, Nitarshan Rajkumar, Tegan Maharaj, David Krueger, Sara Hooker. [doi]

SCALE-UP: An Efficient Black-box Input-level Backdoor Detection via Analyzing Scaled Prediction ConsistencyJunfeng Guo, Yiming Li, Xun Chen, Hanqing Guo, Lichao Sun 0001, Cong Liu 0005. [doi]

Amortised Invariance Learning for Contrastive Self-SupervisionRuchika Chavhan, Jan Stuehmer, Calum Heggan, Mehrdad Yaghoobi, Timothy M. Hospedales. [doi]

Effects of Graph Convolutions in Multi-layer NetworksAseem Baranwal, Kimon Fountoulakis, Aukosh Jagannath. [doi]

Planning with Sequence Models through Iterative Energy MinimizationHongyi Chen, Yilun Du, Yiye Chen, Joshua B. Tenenbaum, Patricio A. Vela. [doi]

Logical Entity Representation in Knowledge-Graphs for Differentiable Rule LearningChi Han, Qizheng He, Charles Yu, Xinya Du, Hanghang Tong, Heng Ji. [doi]

Combinatorial Pure Exploration of Causal BanditsNuoya Xiong, Wei Chen 0013. [doi]

CircNet: Meshing 3D Point Clouds with Circumcenter DetectionHuan Lei, Ruitao Leng, Liang Zheng 0001, Hongdong Li. [doi]

Pre-training via Denoising for Molecular Property PredictionSheheryar Zaidi, Michael Schaarschmidt, James Martens, Hyunjik Kim, Yee Whye Teh, Alvaro Sanchez-Gonzalez, Peter W. Battaglia, Razvan Pascanu, Jonathan Godwin. [doi]

Learned Index with Dynamic $\epsilon$Daoyuan Chen, Wuchao Li, Yaliang Li, Bolin Ding, Kai Zeng 0002, Defu Lian, Jingren Zhou. [doi]

Decentralized Optimistic Hyperpolicy Mirror Descent: Provably No-Regret Learning in Markov GamesWenhao Zhan, Jason D. Lee, Zhuoran Yang. [doi]

Learning Domain-Agnostic Representation for Disease DiagnosisChu-ran Wang, Jing Li 0091, Xinwei Sun 0001, Fandong Zhang, Yizhou Yu, Yizhou Wang 0001. [doi]

Sparsity-Constrained Optimal TransportTianlin Liu, Joan Puigcerver, Mathieu Blondel. [doi]

NeRF-SOS: Any-View Self-supervised Object Segmentation on Complex ScenesZhiwen Fan, Peihao Wang, Yifan Jiang 0001, Xinyu Gong, Dejia Xu, Zhangyang Wang. [doi]

An Adaptive Policy to Employ Sharpness-Aware MinimizationWeisen Jiang, Hansi Yang, Yu Zhang 0006, James T. Kwok. [doi]

BSTT: A Bayesian Spatial-Temporal Transformer for Sleep StagingYuchen Liu, Ziyu Jia. [doi]

Efficient Conditionally Invariant Representation LearningRoman Pogodin, Namrata Deka, Yazhe Li, Danica J. Sutherland, Victor Veitch, Arthur Gretton. [doi]

A Message Passing Perspective on Learning Dynamics of Contrastive LearningYifei Wang 0001, Qi Zhang, Tianqi Du, Jiansheng Yang, Zhouchen Lin, Yisen Wang 0001. [doi]

Understanding Neural Coding on Latent Manifolds by Sharing Features and Dividing EnsemblesMartin Bjerke, Lukas Schott, Kristopher T. Jensen, Claudia Battistin, David A. Klindt, Benjamin Adric Dunn. [doi]

On Pre-training Language Model for AntibodyDanqing Wang, Fei Ye, Hao Zhou 0012. [doi]

POPGym: Benchmarking Partially Observable Reinforcement LearningSteven D. Morad, Ryan Kortvelesy, Matteo Bettini, Stephan Liwicki, Amanda Prorok. [doi]

Ensuring DNN Solution Feasibility for Optimization Problems with Linear ConstraintsTianyu Zhao, Xiang Pan, Minghua Chen, Steven H. Low. [doi]

Momentum Stiefel Optimizer, with Applications to Suitably-Orthogonal Attention, and Optimal TransportLingkai Kong, Yuqing Wang, Molei Tao. [doi]

A GNN-Guided Predict-and-Search Framework for Mixed-Integer Linear ProgrammingQingyu Han, Linxin Yang, Qian Chen, Xiang Zhou, Dong Zhang, Akang Wang, Ruoyu Sun 0001, Xiaodong Luo. [doi]

A Mixture-of-Expert Approach to RL-based Dialogue ManagementYinlam Chow, Aza Tulepbergenov, Ofir Nachum, Dhawal Gupta, Moonkyung Ryu, Mohammad Ghavamzadeh, Craig Boutilier. [doi]

HyperDeepONet: learning operator with complex target function space using the limited resources via hypernetworkJae-Yong Lee, Sung Woong Cho, Hyung Ju Hwang. [doi]

Meta-learning Adaptive Deep Kernel Gaussian Processes for Molecular Property PredictionWenlin Chen, Austin Tripp, José Miguel Hernández-Lobato. [doi]

Weighted Ensemble Self-Supervised LearningYangjun Ruan, Saurabh Singh, Warren Richard Morningstar, Alexander A. Alemi, Sergey Ioffe, Ian Fischer, Joshua V. Dillon. [doi]

The Symmetric Generalized Eigenvalue Problem as a Nash EquilibriumIan Gemp, Charlie Chen, Brian McWilliams. [doi]

Compositional Task Representations for Large Language ModelsNan Shao, Zefan Cai, Hanwei Xu, Chonghua Liao, Yanan Zheng, Zhilin Yang. [doi]

FINDE: Neural Differential Equations for Finding and Preserving Invariant QuantitiesTakashi Matsubara 0001, Takaharu Yaguchi. [doi]

Multitask Prompt Tuning Enables Parameter-Efficient Transfer LearningZhen Wang, Rameswar Panda, Leonid Karlinsky, Rogério Feris, Huan Sun 0001, Yoon Kim. [doi]

How Does Semi-supervised Learning with Pseudo-labelers Work? A Case StudyYiwen Kou, Zixiang Chen, Yuan Cao 0006, Quanquan Gu. [doi]

Automating Nearest Neighbor Search Configuration with Constrained OptimizationPhilip Sun, Ruiqi Guo, Sanjiv Kumar. [doi]

Continuous pseudo-labeling from the startDan Berrebbi, Ronan Collobert, Samy Bengio, Navdeep Jaitly, Tatiana Likhomanenko. [doi]

Gromov-Wasserstein AutoencodersNao Nakagawa, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama. [doi]

On Explaining Neural Network Robustness with Activation PathZiping Jiang. [doi]

Continuous-time identification of dynamic state-space models by deep subspace encodingGerben Izaak Beintema, Maarten Schoukens, Roland Tóth. [doi]

Improving Deep Policy Gradients with Value Function SearchEnrico Marchesini, Christopher Amato. [doi]

Progressive Voronoi Diagram Subdivision Enables Accurate Data-free Class-Incremental LearningChunwei Ma, Zhanghexuan Ji, Ziyun Huang, Yan Shen, Mingchen Gao, Jinhui Xu 0001. [doi]

Domain-Indexing Variational Bayes: Interpretable Domain Index for Domain AdaptationZihao Xu, Guang-Yuan Hao, Hao He 0011, Hao Wang 0014. [doi]

Optimizing Spca-based Continual Learning: A Theoretical ApproachChunchun Yang, Malik Tiomoko, Zengfu Wang. [doi]

Function-space regularized Rényi divergencesJeremiah Birrell, Yannis Pantazis, Paul Dupuis, Luc Rey-Bellet, Markos A. Katsoulakis. [doi]

Subquadratic Algorithms for Kernel Matrices via Kernel Density EstimationAinesh Bakshi, Piotr Indyk, Praneeth Kacham, Sandeep Silwal, Samson Zhou. [doi]

Unsupervised Meta-learning via Few-shot Pseudo-supervised Contrastive LearningHuiwon Jang, Hankook Lee, Jinwoo Shin. [doi]

Sample Complexity of Nonparametric Off-Policy Evaluation on Low-Dimensional Manifolds using Deep NetworksXiang Ji, Minshuo Chen, Mengdi Wang, Tuo Zhao. [doi]

Policy Pre-training for Autonomous Driving via Self-supervised Geometric ModelingPenghao Wu, Li Chen, Hongyang Li, Xiaosong Jia, Junchi Yan, Yu Qiao 0006. [doi]

DAG Matters! GFlowNets Enhanced Explainer for Graph Neural NetworksWenqian Li, Yinchuan Li, Zhigang Li, Jianye Hao, Yan Pang. [doi]

DEP-RL: Embodied Exploration for Reinforcement Learning in Overactuated and Musculoskeletal SystemsPierre Schumacher, Daniel F. B. Haeufle, Dieter Büchler, Syn Schmitt, Georg Martius. [doi]

Interpretability in the Wild: a Circuit for Indirect Object Identification in GPT-2 SmallKevin Ro Wang, Alexandre Variengien, Arthur Conmy, Buck Shlegeris, Jacob Steinhardt. [doi]

DBQ-SSD: Dynamic Ball Query for Efficient 3D Object DetectionJinrong Yang, Lin Song, Songtao Liu, Weixin Mao, Zeming Li, Xiaoping Li, Hongbin Sun 0001, Jian Sun 0001, Nanning Zheng 0001. [doi]

Learning Group Importance using the Differentiable Hypergeometric DistributionThomas M. Sutter, Laura Manduchi, Alain Ryser, Julia E. Vogt. [doi]

Provable Sim-to-real Transfer in Continuous Domain with Partial ObservationsJiachen Hu, Han Zhong 0001, Chi Jin, Liwei Wang 0001. [doi]

Composing Ensembles of Pre-trained Models via Iterative ConsensusShuang Li, Yilun Du, Joshua B. Tenenbaum, Antonio Torralba 0001, Igor Mordatch. [doi]

Bayesian Oracle for bounding information gain in neural encoding modelsKonstantin-Klemens Lurz, Mohammad Bashiri, Edgar Y. Walker, Fabian H. Sinz. [doi]

Corrupted Image Modeling for Self-Supervised Visual Pre-TrainingYuxin Fang, Li Dong 0004, Hangbo Bao, Xinggang Wang, Furu Wei. [doi]

Variational Information Pursuit for Interpretable PredictionsAditya Chattopadhyay, Kwan Ho Ryan Chan, Benjamin David Haeffele, Donald Geman, René Vidal. [doi]

Stochastic Multi-Person 3D Motion ForecastingSirui Xu 0002, Yu-Xiong Wang, Liangyan Gui. [doi]

Re-Imagen: Retrieval-Augmented Text-to-Image GeneratorWenhu Chen, Hexiang Hu, Chitwan Saharia, William W. Cohen. [doi]

OTOv2: Automatic, Generic, User-FriendlyTianyi Chen, Luming Liang, Tianyu Ding, Zhihui Zhu, Ilya Zharkov. [doi]

A Holistic View of Label Noise Transition Matrix in Deep Learning and BeyondYong Lin, Renjie Pi, Weizhong Zhang, Xiaobo Xia, Jiahui Gao, Xiao Zhou, Tongliang Liu, Bo Han 0003. [doi]

Schema Inference for Interpretable Image ClassificationHaofei Zhang, Mengqi Xue, Xiaokang Liu, Kaixuan Chen 0004, Jie Song, Mingli Song. [doi]

Deep Ranking Ensembles for Hyperparameter OptimizationAbdus Salam Khazi, Sebastian Pineda-Arango, Josif Grabocka. [doi]

Bayes Risk CTC: Controllable CTC Alignment in Sequence-to-Sequence TasksJinchuan Tian, Brian Yan, Jianwei Yu, Chao Weng, Dong Yu 0001, Shinji Watanabe 0001. [doi]

Socratic Models: Composing Zero-Shot Multimodal Reasoning with LanguageAndy Zeng, Maria Attarian, Brian Ichter, Krzysztof Marcin Choromanski, Adrian Wong, Stefan Welker, Federico Tombari, Aveek Purohit, Michael S. Ryoo, Vikas Sindhwani, Johnny Lee, Vincent Vanhoucke, Pete Florence. [doi]

Transformer-Patcher: One Mistake Worth One NeuronZeyu Huang, Yikang Shen, Xiaofeng Zhang, Jie Zhou, Wenge Rong, Zhang Xiong 0001. [doi]

Regression with Label Differential PrivacyBadih Ghazi, Pritish Kamath, Ravi Kumar 0001, Ethan Leeman, Pasin Manurangsi, Avinash Varadarajan, Chiyuan Zhang. [doi]

Information-Theoretic DiffusionXianghao Kong, Rob Brekelmans, Greg Ver Steeg. [doi]

A CMDP-within-online framework for Meta-Safe Reinforcement LearningVanshaj Khattar, Yuhao Ding, Bilgehan Sel, Javad Lavaei, Ming Jin 0002. [doi]

PandA: Unsupervised Learning of Parts and Appearances in the Feature Maps of GANsJames Oldfield 0001, Christos Tzelepis, Yannis Panagakis, Mihalis Nicolaou, Ioannis Patras. [doi]

Test-Time Adaptation via Self-Training with Nearest Neighbor InformationMinguk Jang, Sae-Young Chung, Hye Won Chung. [doi]

Meta Learning to Bridge Vision and Language Models for Multimodal Few-Shot LearningIvona Najdenkoska, Xiantong Zhen, Marcel Worring. [doi]

Revocable Deep Reinforcement Learning with Affinity Regularization for Outlier-Robust Graph MatchingChang Liu, Zetian Jiang, Runzhong Wang, Lingxiao Huang, Pinyan Lu, Junchi Yan. [doi]

Simplicial Hopfield networksThomas F. Burns, Tomoki Fukai. [doi]

Cross-Level Distillation and Feature Denoising for Cross-Domain Few-Shot ClassificationHao Zheng, Runqi Wang, Jianzhuang Liu, Asako Kanezaki. [doi]

Policy-Based Self-Competition for Planning ProblemsJonathan Pirnay, Quirin Göttl, Jakob Burger, Dominik Gerhard Grimm. [doi]

Exploring and Exploiting Decision Boundary Dynamics for Adversarial RobustnessYuancheng Xu, Yanchao Sun, Micah Goldblum, Tom Goldstein, Furong Huang. [doi]

Deja Vu: Continual Model Generalization for Unseen DomainsChenxi Liu, Lixu Wang, Lingjuan Lyu, Chen Sun, Xiao Wang, Qi Zhu 0002. [doi]

Discovering Generalizable Multi-agent Coordination Skills from Multi-task Offline DataFuxiang Zhang, Chengxing Jia, Yi-Chen Li, Lei Yuan, Yang Yu 0001, Zongzhang Zhang. [doi]

ChordMixer: A Scalable Neural Attention Model for Sequences with Different LengthRuslan Khalitov, Tong Yu, Lei Cheng, Zhirong Yang. [doi]

DAG Learning on the PermutahedronValentina Zantedeschi, Luca Franceschi 0001, Jean Kaddour, Matt J. Kusner, Vlad Niculae. [doi]

Git Re-Basin: Merging Models modulo Permutation SymmetriesSamuel K. Ainsworth, Jonathan Hayase, Siddhartha S. Srinivasa. [doi]

Layer Grafted Pre-training: Bridging Contrastive Learning And Masked Image Modeling For Label-Efficient RepresentationsZiyu Jiang, Yinpeng Chen, Mengchen Liu, Dongdong Chen 0001, Xiyang Dai, Lu Yuan, Zicheng Liu 0001, Zhangyang Wang. [doi]

MEDFAIR: Benchmarking Fairness for Medical ImagingYongshuo Zong, Yongxin Yang, Timothy M. Hospedales. [doi]

The Curious Case of Benign MemorizationSotiris Anagnostidis, Gregor Bachmann, Lorenzo Noci, Thomas Hofmann. [doi]

Replay Memory as An Empirical MDP: Combining Conservative Estimation with Experience ReplayHongming Zhang, Chenjun Xiao, Han Wang, Jun Jin 0001, Bo Xu 0002, Martin Müller 0003. [doi]

Crossformer: Transformer Utilizing Cross-Dimension Dependency for Multivariate Time Series ForecastingYunhao Zhang, Junchi Yan. [doi]

Symmetric Pruning in Quantum Neural NetworksXinbiao Wang, Junyu Liu, Tongliang Liu, Yong Luo 0002, Yuxuan Du, Dacheng Tao. [doi]

Active Image IndexingPierre Fernandez, Matthijs Douze, Hervé Jégou, Teddy Furon. [doi]

Variance Reduction is an Antidote to Byzantines: Better Rates, Weaker Assumptions and Communication Compression as a Cherry on the TopEduard Gorbunov, Samuel Horváth, Peter Richtárik, Gauthier Gidel. [doi]

STaSy: Score-based Tabular data SynthesisJayoung Kim 0002, Chaejeong Lee, Noseong Park. [doi]

Indiscriminate Poisoning Attacks on Unsupervised Contrastive LearningHao He 0011, Kaiwen Zha, Dina Katabi. [doi]

Interpretations of Domain Adaptations via Layer Variational AnalysisHuan-Hsin Tseng, Hsin-Yi Lin, Kuo-Hsuan Hung, Yu Tsao 0001. [doi]

Human MotionFormer: Transferring Human Motions with Vision TransformersHongyu Liu, Xintong Han, Chenbin Jin, Lihui Qian 0003, Huawei Wei, Zhe Lin, Faqiang Wang, Haoye Dong, Yibing Song, Jia Xu, Qifeng Chen. [doi]

Molecule Generation For Target Protein Binding with Structural MotifsZaixi Zhang, Yaosen Min, Shuxin Zheng, Qi Liu 0003. [doi]

InCoder: A Generative Model for Code Infilling and SynthesisDaniel Fried, Armen Aghajanyan, Jessy Lin, Sida Wang 0001, Eric Wallace, Freda Shi, Ruiqi Zhong, Scott Yih, Luke Zettlemoyer, Mike Lewis. [doi]

MMVAE+: Enhancing the Generative Quality of Multimodal VAEs without CompromisesEmanuele Palumbo, Imant Daunhawer, Julia E. Vogt. [doi]

DamoFD: Digging into Backbone Design on Face DetectionYang Liu, Jiankang deng, Fei Wang, Lei Shang, Xuansong Xie, Baigui Sun. [doi]

Value Memory Graph: A Graph-Structured World Model for Offline Reinforcement LearningDeyao Zhu, Li Erran Li, Mohamed Elhoseiny. [doi]

Deep Declarative Dynamic Time Warping for End-to-End Learning of Alignment PathsMing Xu 0015, Sourav Garg, Michael Milford, Stephen Gould. [doi]

TTN: A Domain-Shift Aware Batch Normalization in Test-Time AdaptationHyesu Lim, Byeonggeun Kim, Jaegul Choo, Sungha Choi. [doi]

SpeedyZero: Mastering Atari with Limited Data and TimeYixuan Mei, Jiaxuan Gao, Weirui Ye, Shaohuai Liu, Yang Gao, Yi Wu. [doi]

Interactive Portrait HarmonizationJeya Maria Jose Valanarasu, He Zhang 0004, Jianming Zhang 0001, Yilin Wang, Zhe Lin 0001, Jose Echevarria, Yinglan Ma, Zijun Wei, Kalyan Sunkavalli, Vishal Patel 0001. [doi]

Towards Stable Test-time Adaptation in Dynamic Wild WorldShuaicheng Niu, Jiaxiang Wu 0001, Yifan Zhang 0004, Zhiquan Wen, Yaofo Chen, Peilin Zhao, Mingkui Tan. [doi]

Leveraging Large Language Models for Multiple Choice Question AnsweringJoshua Robinson, David Wingate. [doi]

Variational Latent Branching Model for Off-Policy EvaluationQitong Gao, Ge Gao, Min Chi, Miroslav Pajic. [doi]

Towards the Generalization of Contrastive Self-Supervised LearningWeiran Huang 0001, Mingyang Yi, Xuyang Zhao, Zihao Jiang. [doi]

Symmetries, Flat Minima, and the Conserved Quantities of Gradient FlowBo Zhao, Iordan Ganev, Robin Walters, Rose Yu, Nima Dehmamy. [doi]

Simple initialization and parametrization of sinusoidal networks via their kernel bandwidthFilipe de Avila Belbute-Peres, J. Zico Kolter. [doi]

Learning Low Dimensional State Spaces with Overparameterized Recurrent Neural NetsEdo Cohen-Karlik, Itamar Menuhin-Gruman, Raja Giryes, Nadav Cohen, Amir Globerson. [doi]

Deep Reinforcement Learning for Cost-Effective Medical DiagnosisZheng Yu, Yikuan Li, Joseph Kim, Kaixuan Huang, Yuan Luo 0001, Mengdi Wang. [doi]

Energy-based Out-of-Distribution Detection for Graph Neural NetworksQitian Wu, Yiting Chen, Chenxiao Yang, Junchi Yan. [doi]

Confidence-Based Feature Imputation for Graphs with Partially Known FeaturesDaeho Um, Jiwoong Park, Seulki Park, Jin Young Choi 0002. [doi]

Active Learning for Object Detection with Evidential Deep Learning and Hierarchical Uncertainty AggregationYounghyun Park, Wonjeong Choi, Soyeong Kim, Dong-Jun Han, Jaekyun Moon. [doi]

Semantic Uncertainty: Linguistic Invariances for Uncertainty Estimation in Natural Language GenerationLorenz Kuhn, Yarin Gal, Sebastian Farquhar. [doi]

Data Continuity Matters: Improving Sequence Modeling with Lipschitz RegularizerEric Qu, Xufang Luo, Dongsheng Li 0002. [doi]

Recursive Time Series Data AugmentationAmine Mohamed Aboussalah, Min-Jae Kwon, Raj G. Patel, Cheng Chi, Chi-Guhn Lee. [doi]

Interpretability with full complexity by constraining feature informationKieran A. Murphy, Danielle S. Bassett. [doi]

Task-customized Masked Autoencoder via Mixture of Cluster-conditional ExpertsZhili Liu, Kai Chen, Jianhua Han, Lanqing Hong, Hang Xu, Zhenguo Li, James T. Kwok. [doi]

The Dark Side of AutoML: Towards Architectural Backdoor SearchRen Pang, Changjiang Li, Zhaohan Xi, Shouling Ji, Ting Wang 0006. [doi]

M-L2O: Towards Generalizable Learning-to-Optimize by Test-Time Fast Self-AdaptationJunjie Yang, Xuxi Chen, Tianlong Chen, Zhangyang Wang, Yingbin Liang. [doi]

Safe Reinforcement Learning From Pixels Using a Stochastic Latent RepresentationYannick Hogewind, Thiago D. Simão, Tal Kachman, Nils Jansen 0001. [doi]

Everybody Needs Good Neighbours: An Unsupervised Locality-based Method for Bias MitigationXudong Han, Timothy Baldwin, Trevor Cohn. [doi]

Efficient Attention via Control VariatesLin Zheng, Jianbo Yuan, Chong Wang, Lingpeng Kong. [doi]

FiT: Parameter Efficient Few-shot Transfer Learning for Personalized and Federated Image ClassificationAliaksandra Shysheya, John Bronskill, Massimiliano Patacchiola, Sebastian Nowozin, Richard E. Turner. [doi]

IDEAL: Query-Efficient Data-Free Learning from Black-Box ModelsJie Zhang, Chen Chen, Lingjuan Lyu. [doi]

Improving the imputation of missing data with Markov Blanket discoveryYang Liu 0206, Anthony C. Constantinou. [doi]

Data augmentation alone can improve adversarial trainingLin Li, Michael W. Spratling. [doi]

AutoGT: Automated Graph Transformer Architecture SearchZizhao Zhang, Xin Wang 0019, Chaoyu Guan, Ziwei Zhang, Haoyang Li, Wenwu Zhu 0001. [doi]

Adversarial Attacks on Adversarial BanditsYuzhe Ma, Zhijin Zhou. [doi]

Improving Differentiable Neural Architecture Search by Encouraging TransferabilityParth Sheth, Pengtao Xie. [doi]

Koopman Neural Operator Forecaster for Time-series with Temporal Distributional ShiftsRui Wang, Yihe Dong, Sercan Ö. Arik, Rose Yu. [doi]

Online Bias Correction for Task-Free Continual LearningAristotelis Chrysakis, Marie-Francine Moens. [doi]

Agent-based Graph Neural NetworksKarolis Martinkus, Pál András Papp, Benedikt Schesch, Roger Wattenhofer. [doi]

$k$NN Prompting: Beyond-Context Learning with Calibration-Free Nearest Neighbor InferenceBenfeng Xu, Quan Wang 0002, Zhendong Mao, Yajuan Lyu, Qiaoqiao She, Yongdong Zhang 0001. [doi]

View Synthesis with Sculpted Neural PointsYiming Zuo, Jia Deng 0001. [doi]

Understanding and Adopting Rational Behavior by Bellman Score EstimationKuno Kim, Stefano Ermon. [doi]

Multiple sequence alignment as a sequence-to-sequence learning problemEdo Dotan, Yonatan Belinkov, Oren Avram, Elya Wygoda, Noa Ecker, Michael Alburquerque, Omri Keren, Gil Loewenthal, Tal Pupko. [doi]

Simplicial Embeddings in Self-Supervised Learning and Downstream ClassificationSamuel Lavoie, Christos Tsirigotis, Max Schwarzer, Ankit Vani, Michael Noukhovitch, Kenji Kawaguchi, Aaron C. Courville. [doi]

Effectively Modeling Time Series with Simple Discrete State SpacesMichael Zhang, Khaled Kamal Saab, Michael Poli, Tri Dao, Karan Goel, Christopher Ré. [doi]

Achieve the Minimum Width of Neural Networks for Universal ApproximationYongqiang Cai. [doi]

QuAnt: Quantum Annealing with Learnt CouplingsMarcel Seelbach Benkner, Maximilian Krahn, Edith Tretschk, Zorah Lähner, Michael Moeller 0001, Vladislav Golyanik. [doi]

Analyzing Tree Architectures in Ensembles via Neural Tangent KernelRyuichi Kanoh, Mahito Sugiyama. [doi]

Dr.Spider: A Diagnostic Evaluation Benchmark towards Text-to-SQL RobustnessShuaichen Chang, Jun Wang 0122, Mingwen Dong, Lin Pan, Henghui Zhu, Alexander Hanbo Li, Wuwei Lan, Sheng Zhang, Jiarong Jiang, Joseph Lilien, Steve Ash, William Yang Wang, Zhiguo Wang, Vittorio Castelli, Patrick Ng, Bing Xiang. [doi]

DFlow: Learning to Synthesize Better Optical Flow Datasets via a Differentiable PipelineByung-Ki Kwon, Nam Hyeon-Woo, Ji-Yun Kim, Tae Hyun Oh. [doi]

Causal Balancing for Domain GeneralizationXinyi Wang, Michael Saxon, Jiachen Li, Hongyang Zhang 0001, Kun Zhang 0001, William Yang Wang. [doi]

Volumetric Optimal Transportation by Fast Fourier TransformNa Lei, Dongsheng An, Min Zhang, Xiaoyin Xu, Xianfeng David Gu. [doi]

Latent Neural ODEs with Sparse Bayesian Multiple ShootingValerii Iakovlev, Çagatay Yildiz, Markus Heinonen, Harri Lähdesmäki. [doi]

Parallel Deep Neural Networks Have Zero Duality GapYifei Wang, Tolga Ergen, Mert Pilanci. [doi]

LogicDP: Creating Labels for Graph Data via Inductive Logic ProgrammingYuan Yang, Faramarz Fekri, James Clayton Kerce, Ali Payani. [doi]

EA-HAS-Bench: Energy-aware Hyperparameter and Architecture Search BenchmarkShuguang Dou, Xinyang Jiang, Cairong Zhao, Dongsheng Li 0002. [doi]

Token Merging: Your ViT But FasterDaniel Bolya, Cheng-Yang Fu, Xiaoliang Dai, Peizhao Zhang, Christoph Feichtenhofer, Judy Hoffman. [doi]

QAID: Question Answering Inspired Few-shot Intent DetectionAsaf Yehudai, Matan Vetzler, Yosi Mass, Koren Lazar, Doron Cohen, Boaz Carmeli. [doi]

Task Ambiguity in Humans and Language ModelsAlex Tamkin, Kunal Handa, Avash Shrestha, Noah D. Goodman. [doi]

Delta: Degradation-Free Fully Test-Time AdaptationBowen Zhao, Chen Chen 0015, Shu-Tao Xia. [doi]

Sparsity May Cry: Let Us Fail (Current) Sparse Neural Networks Together!Shiwei Liu, Tianlong Chen, Zhenyu Zhang, Xuxi Chen, Tianjin Huang, Ajay Kumar Jaiswal, Zhangyang Wang. [doi]

SMART: Sentences as Basic Units for Text EvaluationReinald Kim Amplayo, Peter J. Liu, Yao Zhao, Shashi Narayan. [doi]

ILA-DA: Improving Transferability of Intermediate Level Attack with Data AugmentationChiu Wai Yan, Tsz-Him Cheung, Dit-Yan Yeung. [doi]

ROSCOE: A Suite of Metrics for Scoring Step-by-Step ReasoningOlga Golovneva, Moya Chen, Spencer Poff, Martin Corredor, Luke Zettlemoyer, Maryam Fazel-Zarandi, Asli Celikyilmaz. [doi]

Neural Networks Efficiently Learn Low-Dimensional Representations with SGDAlireza Mousavi Hosseini, Sejun Park, Manuela Girotti, Ioannis Mitliagkas, Murat A. Erdogdu. [doi]

Learning to CROSS exchange to solve min-max vehicle routing problemsMinJun Kim, Junyoung Park, Jinkyoo Park. [doi]

Gradient-Guided Importance Sampling for Learning Binary Energy-Based ModelsMeng Liu, Haoran Liu, Shuiwang Ji. [doi]

Weakly Supervised Knowledge Transfer with Probabilistic Logical Reasoning for Object DetectionMartijn Oldenhof, Adam Arany, Yves Moreau, Edward De Brouwer. [doi]

Hidden Markov Transformer for Simultaneous Machine TranslationShaolei Zhang, Yang Feng. [doi]

FLIP: A Provable Defense Framework for Backdoor Mitigation in Federated LearningKaiyuan Zhang 0002, Guanhong Tao, Qiuling Xu, Siyuan Cheng 0005, Shengwei An, Yingqi Liu, Shiwei Feng 0002, Guangyu Shen, Pin-Yu Chen, ShiQing Ma, Xiangyu Zhang 0001. [doi]

Harnessing Out-Of-Distribution Examples via Augmenting Content and StyleZhuo Huang, Xiaobo Xia, Li Shen 0008, Bo Han 0003, Mingming Gong, Chen Gong 0002, Tongliang Liu. [doi]

Learning in temporally structured environmentsMatt Jones 0001, Tyler R. Scott, Mengye Ren, Gamaleldin Fathy Elsayed, Katherine Hermann, David Mayo, Michael Curtis Mozer. [doi]

Learning a Data-Driven Policy Network for Pre-Training Automated Feature EngineeringLiyao Li, Haobo Wang, Liangyu Zha, Qingyi Huang, Sai Wu, Gang Chen 0001, Junbo Zhao. [doi]

Sparse MoE as the New Dropout: Scaling Dense and Self-Slimmable TransformersTianlong Chen, Zhenyu Zhang, Ajay Kumar Jaiswal, Shiwei Liu, Zhangyang Wang. [doi]

Efficient Federated Domain TranslationZeyu Zhou, Sheikh Shams Azam, Christopher G. Brinton, David I. Inouye. [doi]

Proactive Multi-Camera Collaboration for 3D Human Pose EstimationHai Ci, Mickel Liu, Xuehai Pan, Fangwei Zhong, Yizhou Wang 0001. [doi]

Calibrating Transformers via Sparse Gaussian ProcessesWenlong Chen, Yingzhen Li. [doi]

Represent to Control Partially Observed Systems: Representation Learning with Provable Sample EfficiencyLingxiao Wang 0003, Qi Cai, Zhuoran Yang, Zhaoran Wang. [doi]

Collaborative Pure Exploration in Kernel BanditYihan Du, Wei Chen 0034, Yuko Kuroki, Longbo Huang. [doi]

CLARE: Conservative Model-Based Reward Learning for Offline Inverse Reinforcement LearningSheng Yue, Guanbo Wang, Wei Shao 0006, Zhaofeng Zhang, Sen Lin, Ju Ren, Junshan Zhang. [doi]

Latent State Marginalization as a Low-cost Approach for Improving ExplorationDinghuai Zhang, Aaron C. Courville, Yoshua Bengio, Qinqing Zheng, Amy Zhang 0001, Ricky T. Q. Chen. [doi]

CROM: Continuous Reduced-Order Modeling of PDEs Using Implicit Neural RepresentationsPeter Yichen Chen, Jinxu Xiang, Dong Heon Cho, Yue Chang, G. A. Pershing, Henrique Teles Maia, Maurizio M. Chiaramonte, Kevin T. Carlberg, Eitan Grinspun. [doi]

Near-optimal Policy Identification in Active Reinforcement LearningXiang Li, Viraj Mehta, Johannes Kirschner, Ian Char, Willie Neiswanger, Jeff Schneider 0001, Andreas Krause 0001, Ilija Bogunovic. [doi]

LipsFormer: Introducing Lipschitz Continuity to Vision TransformersXianbiao Qi, Jianan Wang, Yihao Chen, Yukai Shi, Lei Zhang. [doi]

KwikBucks: Correlation Clustering with Cheap-Weak and Expensive-Strong SignalsSandeep Silwal, Sara Ahmadian, Andrew Nystrom, Andrew McCallum, Deepak Ramachandran, Seyed Mehran Kazemi. [doi]

FIGARO: Controllable Music Generation using Learned and Expert FeaturesDimitri von Rütte, Luca Biggio, Yannic Kilcher, Thomas Hofmann. [doi]

MOAT: Alternating Mobile Convolution and Attention Brings Strong Vision ModelsChenglin Yang, Siyuan Qiao, Qihang Yu, Xiaoding Yuan, Yukun Zhu, Alan L. Yuille, Hartwig Adam, Liang-Chieh Chen. [doi]

Learnable Topological Features For Phylogenetic Inference via Graph Neural NetworksCheng Zhang. [doi]

Denoising Masked Autoencoders Help Robust ClassificationQuanlin Wu, Hang Ye, Yuntian Gu, Huishuai Zhang, Liwei Wang 0001, Di He. [doi]

PASHA: Efficient HPO and NAS with Progressive Resource AllocationOndrej Bohdal, Lukas Balles, Martin Wistuba, Beyza Ermis, Cédric Archambeau, Giovanni Zappella. [doi]

Protein Representation Learning via Knowledge Enhanced Primary Structure ReasoningHong-Yu Zhou, Yunxiang Fu, Zhicheng Zhang, Cheng Bian, Yizhou Yu. [doi]

ERL-Re$^2$: Efficient Evolutionary Reinforcement Learning with Shared State Representation and Individual Policy RepresentationJianye Hao, Pengyi Li, Hongyao Tang, Yan Zheng, Xian Fu, Zhaopeng Meng. [doi]

Efficient Edge Inference by Selective QueryAnil Kag, Igor Fedorov, Aditya Gangrade, Paul N. Whatmough, Venkatesh Saligrama. [doi]

Hyperparameter Optimization through Neural Network PartitioningBruno Mlodozeniec, Matthias Reisser, Christos Louizos. [doi]

PINTO: Faithful Language Reasoning Using Prompt-Generated RationalesPeiFeng Wang, Aaron Chan, Filip Ilievski, Muhao Chen, Xiang Ren 0001. [doi]

Is Reinforcement Learning (Not) for Natural Language Processing: Benchmarks, Baselines, and Building Blocks for Natural Language Policy OptimizationRajkumar Ramamurthy, Prithviraj Ammanabrolu, Kianté Brantley, Jack Hessel, Rafet Sifa, Christian Bauckhage, Hannaneh Hajishirzi, Yejin Choi 0001. [doi]

Explicit Box Detection Unifies End-to-End Multi-Person Pose EstimationJie Yang, Ailing Zeng, Shilong Liu, Feng Li, Ruimao Zhang, Lei Zhang 0001. [doi]

Incompatibility Clustering as a Defense Against Backdoor Poisoning AttacksCharles Jin, Melinda Sun, Martin C. Rinard. [doi]

Disentangling the Mechanisms Behind Implicit Regularization in SGDZachary Novack, Simran Kaur 0001, Tanya Marwah, Saurabh Garg, Zachary Chase Lipton. [doi]

Decepticons: Corrupted Transformers Breach Privacy in Federated Learning for Language ModelsLiam H. Fowl, Jonas Geiping, Steven Reich, Yuxin Wen, Wojciech Czaja, Micah Goldblum, Tom Goldstein. [doi]

Language Models Can Teach Themselves to Program BetterPatrick Haluptzok, Matthew Bowers, Adam Tauman Kalai. [doi]

Squeeze Training for Adversarial RobustnessQizhang Li, Yiwen Guo, Wangmeng Zuo, Hao Chen 0003. [doi]

Revisiting Pruning at Initialization Through the Lens of Ramanujan GraphDuc N. M. Hoang, Shiwei Liu, Radu Marculescu, Zhangyang Wang. [doi]

Limitless Stability for Graph Convolutional NetworksChristian Koke. [doi]

Learning Rationalizable Equilibria in Multiplayer GamesYuanhao Wang 0004, Dingwen Kong, Yu Bai 0017, Chi Jin 0001. [doi]

Generative Augmented Flow NetworksLing Pan, Dinghuai Zhang, Aaron C. Courville, Longbo Huang, Yoshua Bengio. [doi]

Time Will Tell: New Outlooks and A Baseline for Temporal Multi-View 3D Object DetectionJinhyung Park, Chenfeng Xu, Shijia Yang, Kurt Keutzer, Kris M. Kitani, Masayoshi Tomizuka, Wei Zhan. [doi]

Harnessing Mixed Offline Reinforcement Learning Datasets via Trajectory WeightingZhang-Wei Hong, Pulkit Agrawal, Remi Tachet des Combes, Romain Laroche. [doi]

On the Data-Efficiency with Contrastive Image Transformation in Reinforcement LearningSicong Liu, Xi Sheryl Zhang, Yushuo Li, Yifan Zhang, Jian Cheng 0001. [doi]

Progressive Mix-Up for Few-Shot Supervised Multi-Source Domain TransferRonghang Zhu, Ronghang Zhu, Xiang Yu, Sheng Li 0001. [doi]

Pseudo-label Training and Model Inertia in Neural Machine TranslationBenjamin Hsu, Anna Currey, Xing Niu, Maria Nadejde, Georgiana Dinu. [doi]

Bitrate-Constrained DRO: Beyond Worst Case Robustness To Unknown Group ShiftsAmrith Setlur, Don Kurian Dennis, Benjamin Eysenbach, Aditi Raghunathan, Chelsea Finn, Virginia Smith, Sergey Levine. [doi]

Formal Mathematics Statement Curriculum LearningStanislas Polu, Jesse Michael Han, Kunhao Zheng, Mantas Baksys, Igor Babuschkin, Ilya Sutskever. [doi]

UNIFIED-IO: A Unified Model for Vision, Language, and Multi-modal TasksJiasen Lu, Christopher Clark, Rowan Zellers, Roozbeh Mottaghi, Aniruddha Kembhavi. [doi]

DAVA: Disentangling Adversarial Variational AutoencoderBenjamin Estermann, Roger Wattenhofer. [doi]

Understanding the Covariance Structure of Convolutional FiltersAsher Trockman, Devin Willmott, J. Zico Kolter. [doi]

Multi-Objective Online LearningJiyan Jiang, Wenpeng Zhang 0003, Shiji Zhou, Lihong Gu, Xiaodong Zeng, Wenwu Zhu 0001. [doi]

Fast Sampling of Diffusion Models with Exponential IntegratorQinsheng Zhang, Yongxin Chen. [doi]

Continual evaluation for lifelong learning: Identifying the stability gapMatthias De Lange, Gido M. van de Ven, Tinne Tuytelaars. [doi]

Learning Achievement Structure for Structured Exploration in Domains with Sparse RewardZihan Zhou, Animesh Garg. [doi]

ImaginaryNet: Learning Object Detectors without Real Images and AnnotationsMinheng Ni, Zitong Huang, Kailai Feng, Wangmeng Zuo. [doi]

Is a Caption Worth a Thousand Images? A Study on Representation LearningShibani Santurkar, Yann Dubois, Rohan Taori, Percy Liang, Tatsunori Hashimoto. [doi]

Coverage-centric Coreset Selection for High Pruning RatesHaizhong Zheng, Rui Liu, Fan Lai, Atul Prakash 0001. [doi]

VoGE: A Differentiable Volume Renderer using Gaussian Ellipsoids for Analysis-by-SynthesisAngtian Wang, Peng Wang 0001, Jian Sun, Adam Kortylewski, Alan L. Yuille. [doi]

Knowledge Distillation based Degradation Estimation for Blind Super-ResolutionBin Xia, Yulun Zhang, Yitong Wang, Yapeng Tian, Wenming Yang, Radu Timofte, Luc Van Gool. [doi]

Evaluating Representations with Readout Model SwitchingYazhe Li, Jörg Bornschein, Marcus Hutter. [doi]

What Is Missing in IRM Training and Evaluation? Challenges and SolutionsYihua Zhang, Pranay Sharma, Parikshit Ram, Mingyi Hong, Kush R. Varshney, Sijia Liu 0001. [doi]

ISAAC Newton: Input-based Approximate Curvature for Newton's MethodFelix Petersen, Tobias Sutter, Christian Borgelt, Dongsung Huh, Hilde Kuehne, Yuekai Sun, Oliver Deussen. [doi]

Martingale Posterior Neural ProcessesHyungi Lee, Eunggu Yun, Giung Nam, Edwin Fong, Juho Lee 0001. [doi]

Spacetime Representation LearningMarc T. Law, James Lucas. [doi]

Make-A-Video: Text-to-Video Generation without Text-Video DataUriel Singer, Adam Polyak, Thomas Hayes, Xi Yin 0008, Jie An 0002, Songyang Zhang, Qiyuan Hu, Harry Yang, Oron Ashual, Oran Gafni, Devi Parikh, Sonal Gupta, Yaniv Taigman. [doi]

3D Equivariant Diffusion for Target-Aware Molecule Generation and Affinity PredictionJiaqi Guan, Wesley Wei Qian, Xingang Peng, Yufeng Su, Jian Peng 0001, Jianzhu Ma. [doi]

A Stable and Scalable Method for Solving Initial Value PDEs with Neural NetworksMarc Anton Finzi, Andres Potapczynski, Matthew Choptuik, Andrew Gordon Wilson. [doi]

Optimal Conservative Offline RL with General Function Approximation via Augmented LagrangianParia Rashidinejad, Hanlin Zhu, Kunhe Yang, Stuart Russell 0001, Jiantao Jiao. [doi]

DASHA: Distributed Nonconvex Optimization with Communication Compression and Optimal Oracle ComplexityAlexander Tyurin, Peter Richtárik. [doi]

On the Saturation Effect of Kernel Ridge RegressionYicheng Li, Haobo Zhang, Qian Lin. [doi]

Learning to Induce Causal StructureNan Rosemary Ke, Silvia Chiappa, Jane X. Wang, Jörg Bornschein, Anirudh Goyal, Mélanie Rey, Theophane Weber, Matthew M. Botvinick, Michael Curtis Mozer, Danilo Jimenez Rezende. [doi]

Robust and Controllable Object-Centric Learning through Energy-based ModelsRuixiang Zhang, Tong Che, Boris Ivanovic, Renhao Wang, Marco Pavone 0001, Yoshua Bengio, Liam Paull. [doi]

Feature Reconstruction From Outputs Can Mitigate Simplicity Bias in Neural NetworksSravanti Addepalli, Anshul Nasery, Venkatesh Babu Radhakrishnan, Praneeth Netrapalli, Prateek Jain 0002. [doi]

Write and Paint: Generative Vision-Language Models are Unified Modal LearnersShizhe Diao, Wangchunshu Zhou, Xinsong Zhang, Jiawei Wang. [doi]

Ask Me Anything: A simple strategy for prompting language modelsSimran Arora, Avanika Narayan, Mayee F. Chen, Laurel J. Orr, Neel Guha, Kush Bhatia, Ines Chami, Christopher Ré. [doi]

GeneFace: Generalized and High-Fidelity Audio-Driven 3D Talking Face SynthesisZhenhui Ye, Ziyue Jiang, Yi Ren 0006, Jinglin Liu, Jinzheng He, Zhou Zhao. [doi]

Beyond Lipschitz: Sharp Generalization and Excess Risk Bounds for Full-Batch GDKonstantinos E. Nikolakakis, Farzin Haddadpour, Amin Karbasi, Dionysios S. Kalogerias. [doi]

FIT: A Metric for Model SensitivityBen Zandonati, Adrian Alan Pol, Maurizio Pierini, Olya Sirkin, Tal Kopetz. [doi]

Graph Neural Networks for Link Prediction with Subgraph SketchingBenjamin Paul Chamberlain, Sergey Shirobokov, Emanuele Rossi, Fabrizio Frasca, Thomas Markovich, Nils Yannick Hammerla, Michael M. Bronstein, Max Hansmire. [doi]

Few-shot Backdoor Attacks via Neural Tangent KernelsJonathan Hayase, Sewoong Oh. [doi]

Neural Episodic Control with State AbstractionZhuo Li, Derui Zhu, Yujing Hu, Xiaofei Xie, Lei Ma 0003, Yan Zheng, Yan Song, Yingfeng Chen, Jianjun Zhao 0001. [doi]

How Much Space Has Been Explored? Measuring the Chemical Space Covered by Databases and Machine-Generated MoleculesYutong Xie, Ziqiao Xu, Jiaqi Ma 0001, Qiaozhu Mei. [doi]

Probabilistically Robust Recourse: Navigating the Trade-offs between Costs and Robustness in Algorithmic RecourseMartin Pawelczyk, Teresa Datta, Johannes van den Heuvel, Gjergji Kasneci, Himabindu Lakkaraju. [doi]

An Extensible Multi-modal Multi-task Object Dataset with MaterialsTrevor Scott Standley, Ruohan Gao, Dawn Chen, Jiajun Wu 0001, Silvio Savarese. [doi]

Exponential Generalization Bounds with Near-Optimal Rates for $L_q$-Stable AlgorithmsXiaotong Yuan, Ping Li 0001. [doi]

StableDR: Stabilized Doubly Robust Learning for Recommendation on Data Missing Not at RandomHaoxuan Li, Chunyuan Zheng, Peng Wu 0012. [doi]

Simple and Scalable Nearest Neighbor Machine TranslationYuhan Dai, Zhirui Zhang, Qiuzhi Liu, Qu Cui, Weihua Li, Yichao Du, Tong Xu 0001. [doi]

Unveiling the sampling density in non-uniform geometric graphsRaffaele Paolino, Aleksandar Bojchevski, Stephan Günnemann, Gitta Kutyniok, Ron Levie. [doi]

Serving Graph Compression for Graph Neural NetworksSi Si, Felix X. Yu, Ankit Singh Rawat, Cho-Jui Hsieh, Sanjiv Kumar. [doi]

Accelerating Hamiltonian Monte Carlo via Chebyshev Integration TimeJun-Kun Wang, Andre Wibisono. [doi]

Capturing the Motion of Every Joint: 3D Human Pose and Shape Estimation with Independent TokensSen Yang, Wen Heng, Gang Liu, Guozhong Luo, Wankou Yang, Gang Yu. [doi]

Learning multi-scale local conditional probability models of imagesZahra Kadkhodaie, Florentin Guth, Stéphane Mallat, Eero P. Simoncelli. [doi]

Guess the Instruction! Flipped Learning Makes Language Models Stronger Zero-Shot LearnersSeonghyeon Ye, Doyoung Kim, Joel Jang, Joongbo Shin, Minjoon Seo. [doi]

Code Translation with Compiler RepresentationsMarc Szafraniec, Baptiste Rozière, Hugh Leather, Patrick Labatut, François Charton, Gabriel Synnaeve. [doi]

Deep Generative Modeling on Limited Data with Regularization by Nontransferable Pre-trained ModelsYong Zhong, Hongtao Liu, Xiaodong Liu, Fan Bao, Weiran Shen, Chongxuan Li. [doi]

Pushing the Limits of Fewshot Anomaly Detection in Industry Vision: GraphcoreGuoyang Xie, Jinbao Wang, Jiaqi Liu, Yaochu Jin, Feng Zheng. [doi]

SLTUNET: A Simple Unified Model for Sign Language TranslationBiao Zhang 0006, Mathias Müller 0002, Rico Sennrich. [doi]

Label Propagation with Weak SupervisionRattana Pukdee, Dylan Sam, Pradeep Kumar Ravikumar, Nina Balcan. [doi]

Multi-Rate VAE: Train Once, Get the Full Rate-Distortion CurveJuhan Bae, Michael R. Zhang, Michael Ruan, Eric Wang, So Hasegawa, Jimmy Ba, Roger Baker Grosse. [doi]

Noise Is Not the Main Factor Behind the Gap Between Sgd and Adam on Transformers, But Sign Descent Might BeFrederik Kunstner, Jacques Chen, Jonathan Wilder Lavington, Mark Schmidt 0001. [doi]

Emergent World Representations: Exploring a Sequence Model Trained on a Synthetic TaskKenneth Li 0002, Aspen K. Hopkins, David Bau, Fernanda B. Viégas, Hanspeter Pfister, Martin Wattenberg. [doi]

Deep Learning From Crowdsourced Labels: Coupled Cross-Entropy Minimization, Identifiability, and RegularizationShahana Ibrahim, Tri Nguyen, Xiao Fu 0001. [doi]

SQA3D: Situated Question Answering in 3D ScenesXiaojian Ma, Silong Yong, Zilong Zheng, Qing Li 0003, Yitao Liang, Song Chun Zhu, Siyuan Huang. [doi]

PiFold: Toward effective and efficient protein inverse foldingZhangyang Gao, Cheng Tan 0012, Stan Z. Li. [doi]

Memorization-Dilation: Modeling Neural Collapse Under NoiseDuc Anh Nguyen, Ron Levie, Julian Lienen, Eyke Hüllermeier, Gitta Kutyniok. [doi]

$\rm A^2Q$: Aggregation-Aware Quantization for Graph Neural NetworksZeyu Zhu, Fanrong Li, Zitao Mo, Qinghao Hu, Gang Li 0015, Zejian Liu, Xiaoyao Liang, Jian Cheng 0001. [doi]

A Call to Reflect on Evaluation Practices for Failure Detection in Image ClassificationPaul F. Jaeger, Carsten T. Lüth, Lukas Klein, Till J. Bungert. [doi]

Transformers Learn Shortcuts to AutomataBingbin Liu, Jordan T. Ash, Surbhi Goel, Akshay Krishnamurthy, Cyril Zhang. [doi]

Towards Understanding GD with Hard and Conjugate Pseudo-labels for Test-Time AdaptationJun-Kun Wang, Andre Wibisono. [doi]

Benchmarking Constraint Inference in Inverse Reinforcement LearningGuiliang Liu, Yudong Luo, Ashish Gaurav, Kasra Rezaee, Pascal Poupart. [doi]

Provably Efficient Lifelong Reinforcement Learning with Linear RepresentationSanae Amani, Lin Yang 0011, Ching-An Cheng. [doi]

D4FT: A Deep Learning Approach to Kohn-Sham Density Functional TheoryTianbo Li, Min Lin, Zheyuan Hu, Kunhao Zheng, Giovanni Vignale, Kenji Kawaguchi, A. H. Castro Neto, Kostya S. Novoselov, Shuicheng Yan. [doi]

Few-Shot Domain Adaptation For End-to-End CommunicationJayaram Raghuram, Yijing Zeng, Dolores García 0001, Rafael Ruiz 0001, Somesh Jha, Joerg Widmer, Suman Banerjee 0001. [doi]

Efficiently Controlling Multiple Risks with Pareto TestingBracha Laufer-Goldshtein, Adam Fisch, Regina Barzilay, Tommi S. Jaakkola. [doi]

CoRTX: Contrastive Framework for Real-time ExplanationYu-Neng Chuang, Guanchu Wang, Fan Yang 0023, Quan Zhou, Pushkar Tripathi, Xuanting Cai, Xia Hu. [doi]

DiffDock: Diffusion Steps, Twists, and Turns for Molecular DockingGabriele Corso, Hannes Stärk, Bowen Jing, Regina Barzilay, Tommi S. Jaakkola. [doi]

An Equal-Size Hard EM Algorithm for Diverse Dialogue GenerationYuqiao Wen, Yongchang Hao, Yanshuai Cao, Lili Mou. [doi]

Prompt-to-Prompt Image Editing with Cross-Attention ControlAmir Hertz, Ron Mokady, Jay Tenenbaum, Kfir Aberman, Yael Pritch, Daniel Cohen-Or. [doi]

Loss Landscapes are All You Need: Neural Network Generalization Can Be Explained Without the Implicit Bias of Gradient DescentPing-Yeh Chiang, Renkun Ni, David Yu Miller, Arpit Bansal, Jonas Geiping, Micah Goldblum, Tom Goldstein. [doi]

GoBigger: A Scalable Platform for Cooperative-Competitive Multi-Agent Interactive SimulationMing Zhang, Shenghan Zhang, Zhenjie Yang, Lekai Chen, Jinliang Zheng, Chao Yang, Chuming Li, Hang Zhou, Yazhe Niu, Yu Liu. [doi]

Meta-Learning in GamesKeegan Harris, Ioannis Anagnostides, Gabriele Farina, Mikhail Khodak, Steven Wu 0001, Tuomas Sandholm. [doi]

Pushing the Accuracy-Group Robustness Frontier with Introspective Self-playJeremiah Zhe Liu, Krishnamurthy (Dj) Dvijotham, Jihyeon Lee, Quan Yuan, Balaji Lakshminarayanan, Deepak Ramachandran. [doi]

Disparate Impact in Differential Privacy from Gradient MisalignmentMaria S. Esipova, Atiyeh Ashari Ghomi, Yaqiao Luo, Jesse C. Cresswell. [doi]

Efficient approximation of neural population structure and correlations with probabilistic circuitsKoosha Khalvati, Samantha Johnson, Stefan Mihalas, Michael A. Buice. [doi]

TypeT5: Seq2seq Type Inference using Static AnalysisJiayi Wei, Greg Durrett, Isil Dillig. [doi]

NeRN: Learning Neural Representations for Neural NetworksMaor Ashkenazi, Zohar Rimon, Ron Vainshtein, Shir Levi, Elad Richardson, Pinchas Mintz, Eran Treister. [doi]

Neural Design for Genetic Perturbation ExperimentsAldo Pacchiano, Drausin Wulsin, Robert A. Barton, Luis F. Voloch. [doi]

Dual Diffusion Implicit Bridges for Image-to-Image TranslationXuan Su, Jiaming Song, Chenlin Meng, Stefano Ermon. [doi]

Efficiently Computing Nash Equilibria in Adversarial Team Markov GamesFivos Kalogiannis, Ioannis Anagnostides, Ioannis Panageas, Emmanouil-Vasileios Vlatakis-Gkaragkounis, Vaggos Chatziafratis, Stelios Andrew Stavroulakis. [doi]

The Lazy Neuron Phenomenon: On Emergence of Activation Sparsity in TransformersZonglin Li, Chong You, Srinadh Bhojanapalli, Daliang Li, Ankit Singh Rawat, Sashank J. Reddi, Ke Ye, Felix Chern, Felix X. Yu, Ruiqi Guo, Sanjiv Kumar. [doi]

Over-Training with Mixup May Hurt GeneralizationZixuan Liu, Ziqiao Wang, Hongyu Guo, Yongyi Mao. [doi]

Computing all Optimal Partial TransportsAbhijeet Phatak, Sharath Raghvendra, Chittaranjan Tripathy, Kaiyi Zhang. [doi]

Modelling Long Range Dependencies in $N$D: From Task-Specific to a General Purpose CNNDavid M. Knigge, David W. Romero, Albert Gu, Efstratios Gavves, Erik J. Bekkers, Jakub Mikolaj Tomczak, Mark Hoogendoorn, Jan-Jakob Sonke. [doi]

Certified Defences Against Adversarial Patch Attacks on Semantic SegmentationMaksym Yatsura, Kaspar Sakmann, N. Grace Hua, Matthias Hein 0001, Jan Hendrik Metzen. [doi]

Max-Margin Works while Large Margin Fails: Generalization without Uniform ConvergenceMargalit Glasgow, Colin Wei, Mary Wootters, Tengyu Ma 0001. [doi]

Dataless Knowledge Fusion by Merging Weights of Language ModelsXisen Jin, Xiang Ren 0001, Daniel Preotiuc-Pietro, Pengxiang Cheng 0001. [doi]

Discrete Predictor-Corrector Diffusion Models for Image SynthesisJosé Lezama, Tim Salimans, Lu Jiang 0004, Huiwen Chang, Jonathan Ho, Irfan Essa. [doi]

Contextual bandits with concave rewards, and an application to fair rankingVirginie Do, Elvis Dohmatob, Matteo Pirotta, Alessandro Lazaric, Nicolas Usunier. [doi]

Discovering Policies with DOMiNO: Diversity Optimization Maintaining Near OptimalityTom Zahavy, Yannick Schroecker, Feryal M. P. Behbahani, Kate Baumli, Sebastian Flennerhag, Shaobo Hou, Satinder Singh 0001. [doi]

Omnigrok: Grokking Beyond Algorithmic DataZiming Liu, Eric J. Michaud, Max Tegmark. [doi]

Explaining RL Decisions with TrajectoriesShripad Vilasrao Deshmukh, Arpan Dasgupta, Balaji Krishnamurthy, Nan Jiang, Chirag Agarwal, Georgios Theocharous, Jayakumar Subramanian. [doi]

Certifiably Robust Policy Learning against Adversarial Multi-Agent CommunicationYanchao Sun, Ruijie Zheng, Parisa Hassanzadeh, Yongyuan Liang, Soheil Feizi, Sumitra Ganesh, Furong Huang. [doi]

Scaling Laws For Deep Learning Based Image ReconstructionTobit Klug, Reinhard Heckel. [doi]

Your Contrastive Learning Is Secretly Doing Stochastic Neighbor EmbeddingTianyang Hu, Zhili Liu, Fengwei Zhou, Wenjia Wang, Weiran Huang 0001. [doi]

Robustness to corruption in pre-trained Bayesian neural networksXi Wang, Laurence Aitchison. [doi]

Scalable and Equivariant Spherical CNNs by Discrete-Continuous (DISCO) ConvolutionsJeremy Ocampo, Matthew A. Price, Jason D. McEwen. [doi]

Clifford Neural Layers for PDE ModelingJohannes Brandstetter, Rianne van den Berg, Max Welling, Jayesh K. Gupta. [doi]

Curriculum-based Co-design of Morphology and Control of Voxel-based Soft RobotsYuxing Wang, Shuang Wu, Haobo Fu, Qiang Fu, Tiantian Zhang 0002, Yongzhe Chang, Xueqian Wang. [doi]

On the Performance of Temporal Difference Learning With Neural NetworksHaoxing Tian, Ioannis Ch. Paschalidis, Alex Olshevsky. [doi]

DreamFusion: Text-to-3D using 2D DiffusionBen Poole, Ajay Jain, Jonathan T. Barron, Ben Mildenhall. [doi]

Few-shot Cross-domain Image Generation via Inference-time Latent-code LearningArnab Kumar Mondal, Piyush Tiwary, Parag Singla, Prathosh AP. [doi]

Provably Efficient Risk-Sensitive Reinforcement Learning: Iterated CVaR and Worst PathYihan Du, Siwei Wang, Longbo Huang. [doi]

Multi-Objective Reinforcement Learning: Convexity, Stationarity and Pareto OptimalityHaoye Lu, Daniel Herman, Yaoliang Yu. [doi]

TextGrad: Advancing Robustness Evaluation in NLP by Gradient-Driven OptimizationBairu Hou, Jinghan Jia, Yihua Zhang, Guanhua Zhang, Yang Zhang 0001, Sijia Liu 0001, Shiyu Chang. [doi]

Visually-Augmented Language ModelingWeizhi Wang, Li Dong 0004, Hao Cheng 0002, Haoyu Song 0002, Xiaodong Liu 0003, Xifeng Yan, Jianfeng Gao, Furu Wei. [doi]

Theoretical Characterization of the Generalization Performance of Overfitted Meta-LearningPeizhong Ju, Yingbin Liang, Ness B. Shroff. [doi]

Gradient Gating for Deep Multi-Rate Learning on GraphsT. Konstantin Rusch, Benjamin Paul Chamberlain, Michael W. Mahoney, Michael M. Bronstein, Siddhartha Mishra. [doi]

Guarded Policy Optimization with Imperfect Online DemonstrationsZhenghai Xue, Zhenghao Peng, Quanyi Li, Zhihan Liu, Bolei Zhou. [doi]

Function-Consistent Feature DistillationDongyang Liu, Meina Kan, Shiguang Shan, Xilin Chen 0001. [doi]

Anamnesic Neural Differential Equations with Orthogonal Polynomial ProjectionsEdward De Brouwer, Rahul G. Krishnan. [doi]

A General Framework for Sample-Efficient Function Approximation in Reinforcement LearningZixiang Chen, Chris Junchi Li, Huizhuo Yuan, Quanquan Gu, Michael I. Jordan. [doi]

AnyDA: Anytime Domain AdaptationOmprakash Chakraborty, Aadarsh Sahoo, Rameswar Panda, Abir Das. [doi]

Gradient Boosting Performs Gaussian Process InferenceAleksei Ustimenko, Artem Beliakov, Liudmila Prokhorenkova. [doi]

MeshDiffusion: Score-based Generative 3D Mesh ModelingZhen Liu, Yao Feng, Michael J. Black, Derek Nowrouzezahrai, Liam Paull, Weiyang Liu. [doi]

NERDS: A General Framework to Train Camera Denoisers from Raw-RGB Noisy Image PairsHeewon Kim, Kyoung Mu Lee. [doi]

HiCLIP: Contrastive Language-Image Pretraining with Hierarchy-aware AttentionShijie Geng, Jianbo Yuan, Yu Tian, Yuxiao Chen 0002, Yongfeng Zhang. [doi]

Rethinking skip connection model as a learnable Markov chainDengsheng Chen, Jie Hu, Wenwen Qiang, Xiaoming Wei, Enhua Wu. [doi]

Temporal Coherent Test Time Optimization for Robust Video ClassificationChenyu Yi, Siyuan Yang, Yufei Wang, Haoliang Li, Yap-Peng Tan, Alex C. Kot. [doi]

ResAct: Reinforcing Long-term Engagement in Sequential Recommendation with Residual ActorWanqi Xue, Qingpeng Cai 0001, Ruohan Zhan, Dong Zheng, Peng Jiang 0002, Kun Gai, Bo An 0001. [doi]

NORM: Knowledge Distillation via N-to-One Representation MatchingXiaolong Liu, Lujun Li, Chao Li, Anbang Yao. [doi]

3D UX-Net: A Large Kernel Volumetric ConvNet Modernizing Hierarchical Transformer for Medical Image SegmentationHo Hin Lee, Shunxing Bao, Yuankai Huo, Bennett A. Landman. [doi]

Easy Differentially Private Linear RegressionKareem Amin 0002, Matthew Joseph, Mónica Ribero, Sergei Vassilvitskii. [doi]

HotProtein: A Novel Framework for Protein Thermostability Prediction and EditingTianlong Chen, ChengYue Gong, Daniel Jesus Diaz, Xuxi Chen, Jordan Tyler Wells, Qiang Liu 0001, Zhangyang Wang, Andrew D. Ellington, Alex Dimakis, Adam R. Klivans. [doi]

DualAfford: Learning Collaborative Visual Affordance for Dual-gripper ManipulationYan Zhao 0035, Ruihai Wu, Zhehuan Chen, Yourong Zhang, Qingnan Fan, Kaichun Mo, Hao Dong 0003. [doi]

Iterative Circuit Repair Against Formal SpecificationsMatthias Cosler, Frederik Schmitt, Christopher Hahn, Bernd Finkbeiner. [doi]

Learning Iterative Neural Optimizers for Image SteganographyXiangyu Chen, Varsha Kishore, Kilian Q. Weinberger. [doi]

DiffuSeq: Sequence to Sequence Text Generation with Diffusion ModelsShansan Gong, Mukai Li, JiangTao Feng, Zhiyong Wu 0003, Lingpeng Kong. [doi]

Guiding Energy-based Models via Contrastive Latent VariablesHankook Lee, Jongheon Jeong, Sejun Park, Jinwoo Shin. [doi]

On the Trade-Off between Actionable Explanations and the Right to be ForgottenMartin Pawelczyk, Tobias Leemann, Asia Biega, Gjergji Kasneci. [doi]

Zero-Shot Image Restoration Using Denoising Diffusion Null-Space ModelYinhuai Wang, Jiwen Yu, Jian Zhang. [doi]

Tensor-Based Sketching Method for the Low-Rank Approximation of Data StreamsCuiyu Liu, Chuanfu Xiao, Mingshuo Ding, Chao Yang. [doi]

CASR: Generating Complex Sequences with Autoregressive Self-Boost RefinementHongwei Han, Mengyu Zhou, Shi Han, Xiu Li, Dongmei Zhang 0001. [doi]

Priors, Hierarchy, and Information Asymmetry for Skill Transfer in Reinforcement LearningSasha Salter, Kristian Hartikainen, Walter Goodwin, Ingmar Posner. [doi]

A Primal-Dual Framework for Transformers and Neural NetworksTan Minh Nguyen, Tam Minh Nguyen, Nhat Ho, Andrea L. Bertozzi, Richard G. Baraniuk, Stanley J. Osher. [doi]

Differentiable Mathematical Programming for Object-Centric Representation LearningAdeel Pervez, Phillip Lippe, Efstratios Gavves. [doi]

Outcome-directed Reinforcement Learning by Uncertainty \& Temporal Distance-Aware Curriculum Goal GenerationDaesol Cho, Seungjae Lee, H. Jin Kim. [doi]

Boosting Adversarial Transferability using Dynamic CuesMuzammal Naseer, Ahmad Mahmood, Salman Khan 0001, Fahad Shahbaz Khan. [doi]

Blurring Diffusion ModelsEmiel Hoogeboom, Tim Salimans. [doi]

Dual Algorithmic ReasoningDanilo Numeroso, Davide Bacciu, Petar Velickovic. [doi]

Deep Learning meets Nonparametric Regression: Are Weight-Decayed DNNs Locally Adaptive?Kaiqi Zhang, Yu-Xiang Wang. [doi]

Neural Lagrangian Schrödinger Bridge: Diffusion Modeling for Population DynamicsTakeshi Koshizuka, Issei Sato. [doi]

StrucTexTv2: Masked Visual-Textual Prediction for Document Image Pre-trainingYuechen Yu, Yulin Li, Chengquan Zhang, Xiaoqiang Zhang, Zengyuan Guo, Xiameng Qin, Kun Yao, Junyu Han, Errui Ding, Jingdong Wang 0001. [doi]

Light Sampling Field and BRDF Representation for Physically-based Neural RenderingJing Yang, Hanyuan Xiao, Wenbin Teng, Yunxuan Cai, Yajie Zhao. [doi]

Where to Diffuse, How to Diffuse, and How to Get Back: Automated Learning for Multivariate DiffusionsRaghav Singhal, Mark Goldstein, Rajesh Ranganath. [doi]

Patch-Level Contrasting without Patch Correspondence for Accurate and Dense Contrastive Representation LearningShaofeng Zhang, Feng Zhu 0006, Rui Zhao 0001, Junchi Yan. [doi]

Learnable Behavior Control: Breaking Atari Human World Records via Sample-Efficient Behavior SelectionJiajun Fan, Yuzheng Zhuang, Yuecheng Liu, Jianye Hao, Bin Wang 0034, Jiangcheng Zhu, Hao Wang, Shu-Tao Xia. [doi]

From $t$-SNE to UMAP with contrastive learningSebastian Damrich, Jan Niklas Böhm, Fred A. Hamprecht, Dmitry Kobak. [doi]

Can CNNs Be More Robust Than Transformers?Zeyu Wang 0008, Yutong Bai, Yuyin Zhou, Cihang Xie. [doi]

Progressive Prompts: Continual Learning for Language ModelsAnastasia Razdaibiedina, Yuning Mao, Rui Hou, Madian Khabsa, Mike Lewis, Amjad Almahairi. [doi]

Softened Symbol Grounding for Neuro-symbolic SystemsZenan Li, Yuan Yao 0001, Taolue Chen, Jingwei Xu 0001, Chun Cao, Xiaoxing Ma, Jian Lü 0001. [doi]

Linear Connectivity Reveals Generalization StrategiesJeevesh Juneja, Rachit Bansal, KyungHyun Cho, João Sedoc, Naomi Saphra. [doi]

Mini-batch k-means terminates within O(d/ϵ) iterationsGregory Schwartzman. [doi]

Equal Improvability: A New Fairness Notion Considering the Long-term ImpactOzgur Guldogan, Yuchen Zeng, Jy-yong Sohn, Ramtin Pedarsani, Kangwook Lee 0001. [doi]

Behind the Scenes of Gradient Descent: A Trajectory Analysis via Basis Function DecompositionJianhao Ma, Lingjun Guo, Salar Fattahi. [doi]

Information Plane Analysis for Dropout Neural NetworksLinara Adilova, Bernhard C. Geiger, Asja Fischer. [doi]

Empowering Graph Representation Learning with Test-Time Graph TransformationWei Jin 0009, Tong Zhao 0003, Jiayuan Ding, Yozen Liu, Jiliang Tang, Neil Shah. [doi]

Modeling the Data-Generating Process is Necessary for Out-of-Distribution GeneralizationJivat Neet Kaur, Emre Kiciman, Amit Sharma 0007. [doi]

Dynamic Update-to-Data Ratio: Minimizing World Model OverfittingNicolai Dorka, Tim Welschehold, Wolfram Burgard. [doi]

Trainable Weight Averaging: Efficient Training by Optimizing Historical SolutionsTao Li, Zhehao Huang, Qinghua Tao, Yingwen Wu, Xiaolin Huang. [doi]

New Insights for the Stability-Plasticity Dilemma in Online Continual LearningDahuin Jung, DongJin Lee, Sunwon Hong, Hyemi Jang, Ho Bae, Sungroh Yoon. [doi]

A Neural Mean Embedding Approach for Back-door and Front-door AdjustmentLiyuan Xu, Arthur Gretton. [doi]

ISS: Image as Stepping Stone for Text-Guided 3D Shape GenerationZhengzhe Liu, Peng Dai, Ruihui Li, Xiaojuan Qi, Chi-Wing Fu. [doi]

ManiSkill2: A Unified Benchmark for Generalizable Manipulation SkillsJiayuan Gu, Fanbo Xiang, Xuanlin Li, Zhan Ling, Xiqiang Liu, Tongzhou Mu, Yihe Tang, Stone Tao, Xinyue Wei, Yunchao Yao, Xiaodi Yuan, Pengwei Xie, Zhiao Huang, Rui Chen, Hao Su 0001. [doi]

Maximizing Communication Efficiency for Large-scale Training via 0/1 AdamYucheng Lu, Conglong Li, Minjia Zhang, Christopher De Sa, Yuxiong He. [doi]

Draft, Sketch, and Prove: Guiding Formal Theorem Provers with Informal ProofsAlbert Qiaochu Jiang, Sean Welleck, Jin Peng Zhou, Timothée Lacroix, Jiacheng Liu 0010, Wenda Li, Mateja Jamnik, Guillaume Lample, Yuhuai Wu. [doi]

Sampling-based inference for large linear models, with application to linearised LaplaceJavier Antorán, Shreyas Padhy, Riccardo Barbano, Eric T. Nalisnick, David Janz, José Miguel Hernández-Lobato. [doi]

Constructive TT-representation of the tensors given as index interaction functions with applicationsGleb V. Ryzhakov, Ivan V. Oseledets. [doi]

Can Agents Run Relay Race with Strangers? Generalization of RL to Out-of-Distribution TrajectoriesLi-Cheng Lan, Huan Zhang 0001, Cho-Jui Hsieh. [doi]

Mind's Eye: Grounded Language Model Reasoning through SimulationRuibo Liu, Jason Wei, Shixiang Shane Gu, Te-Yen Wu, Soroush Vosoughi, Claire Cui, Denny Zhou, Andrew M. Dai. [doi]

Linear Convergence of Natural Policy Gradient Methods with Log-Linear PoliciesRui Yuan, Simon Shaolei Du, Robert M. Gower, Alessandro Lazaric, Lin Xiao. [doi]

Statistical Guarantees for Consensus ClusteringZhixin Zhou, Gautam Dudeja, Arash A. Amini. [doi]

The Surprising Computational Power of Nondeterministic Stack RNNsBrian DuSell, David Chiang 0001. [doi]

Language models are multilingual chain-of-thought reasonersFreda Shi, Mirac Suzgun, Markus Freitag, Xuezhi Wang 0002, Suraj Srivats, Soroush Vosoughi, Hyung Won Chung, Yi Tay, Sebastian Ruder, Denny Zhou, Dipanjan Das 0001, Jason Wei. [doi]

Contextual Image Masking Modeling via Synergized Contrasting without View Augmentation for Faster and Better Visual PretrainingShaofeng Zhang, Feng Zhu 0006, Rui Zhao 0001, Junchi Yan. [doi]

Efficient Planning in a Compact Latent Action SpaceZhengyao Jiang, Tianjun Zhang, Michael Janner, Yueying Li, Tim Rocktäschel, Edward Grefenstette, Yuandong Tian. [doi]

Towards a Unified Theoretical Understanding of Non-contrastive Learning via Rank Differential MechanismZhijian Zhuo, Yifei Wang 0001, Jinwen Ma, Yisen Wang 0001. [doi]

Rarity Score : A New Metric to Evaluate the Uncommonness of Synthesized ImagesJiyeon Han, Hwanil Choi, Yunjey Choi, Junho Kim, Jung-Woo Ha 0001, Jaesik Choi. [doi]

Behavior Proximal Policy OptimizationZifeng Zhuang, Kun Lei, Jinxin Liu, Donglin Wang, Yilang Guo. [doi]

Retrieval-based Controllable Molecule GenerationZichao Wang 0001, Weili Nie, Zhuoran Qiao, Chaowei Xiao, Richard G. Baraniuk, Anima Anandkumar. [doi]

Boosting Multiagent Reinforcement Learning via Permutation Invariant and Permutation Equivariant NetworksJianye Hao, Xiaotian Hao, Hangyu Mao, Weixun Wang, Yaodong Yang 0002, Dong Li 0030, Yan Zheng, Zhen Wang. [doi]

A Simple Yet Powerful Deep Active Learning With Snapshots EnsemblesSeohyeon Jung, Sanghyun Kim, Juho Lee. [doi]

LiftedCL: Lifting Contrastive Learning for Human-Centric PerceptionZiwei Chen, Qiang Li, Xiaofeng Wang, Wankou Yang. [doi]

Revisiting adapters with adversarial trainingSylvestre-Alvise Rebuffi, Francesco Croce, Sven Gowal. [doi]

Can BERT Refrain from Forgetting on Sequential Tasks? A Probing StudyMingxu Tao, Yansong Feng, Dongyan Zhao 0001. [doi]

Training language models to summarize narratives improves brain alignmentKhai Loong Aw, Mariya Toneva. [doi]

DropIT: Dropping Intermediate Tensors for Memory-Efficient DNN TrainingJoya Chen, Kai Xu, Yuhui Wang, Yifei Cheng, Angela Yao. [doi]

Weakly Supervised Explainable Phrasal Reasoning with Neural Fuzzy LogicZijun Wu, Zi-Xuan Zhang, Atharva Naik, Zhijian Mei, Mauajama Firdaus, Lili Mou. [doi]

Causal Imitation Learning via Inverse Reinforcement LearningKangrui Ruan, Junzhe Zhang, Xuan Di, Elias Bareinboim. [doi]

Disentanglement with Biological Constraints: A Theory of Functional Cell TypesJames C. R. Whittington, Will Dorrell, Surya Ganguli, Timothy Behrens. [doi]

SketchKnitter: Vectorized Sketch Generation with Diffusion ModelsQiang Wang, Haoge Deng, Yonggang Qi, Da Li 0001, Yi-Zhe Song. [doi]

Distributed Extra-gradient with Optimal Complexity and Communication GuaranteesAli Ramezani-Kebrya, Kimon Antonakopoulos, Igor Krawczuk, Justin Deschenaux, Volkan Cevher. [doi]

Avoiding spurious correlations via logit correctionSheng Liu, Xu Zhang, Nitesh Sekhar, Yue Wu, Prateek Singhal, Carlos Fernandez-Granda. [doi]

Denoising Diffusion Error Correction CodesYoni Choukroun, Lior Wolf. [doi]

Filter-Recovery Network for Multi-Speaker Audio-Visual Speech SeparationHaoyue Cheng, Zhaoyang Liu, Wayne Wu, Limin Wang 0002. [doi]

Self-Supervised Set Representation Learning for Unsupervised Meta-LearningDong-Bok Lee, Seanie Lee, Kenji Kawaguchi, Yunji Kim, Jihwan Bang, Jung-Woo Ha 0001, Sung Ju Hwang. [doi]

Quality-Similar Diversity via Population Based Reinforcement LearningShuang Wu, Jian Yao, Haobo Fu, Ye Tian, Chao Qian 0001, Yaodong Yang 0001, Qiang Fu, Wei Yang 0032. [doi]

Learning to Decompose Visual Features with Latent Textual PromptsFeng Wang 0047, Manling Li, Xudong Lin 0003, Hairong Lv, Alexander G. Schwing, Heng Ji. [doi]

Any-scale Balanced Samplers for Discrete SpaceHaoran Sun, Bo Dai 0001, Charles Sutton, Dale Schuurmans, Hanjun Dai. [doi]

Using Both Demonstrations and Language Instructions to Efficiently Learn Robotic TasksAlbert Yu 0002, Raymond J. Mooney. [doi]

CANIFE: Crafting Canaries for Empirical Privacy Measurement in Federated LearningSamuel Maddock, Alexandre Sablayrolles, Pierre Stock. [doi]

(Certified!!) Adversarial Robustness for Free!Nicholas Carlini, Florian Tramèr, Krishnamurthy (Dj) Dvijotham, Leslie Rice, Mingjie Sun, J. Zico Kolter. [doi]

Learning Human-Compatible Representations for Case-Based Decision SupportHan Liu, Yizhou Tian, Chacha Chen, Shi Feng, Yuxin Chen, Chenhao Tan. [doi]

Out-of-Distribution Detection and Selective Generation for Conditional Language ModelsJie Ren 0006, Jiaming Luo, Yao Zhao, Kundan Krishna, Mohammad Saleh, Balaji Lakshminarayanan, Peter J. Liu. [doi]

Towards Minimax Optimal Reward-free Reinforcement Learning in Linear MDPsPihe Hu, Yu Chen, Longbo Huang. [doi]

Neural Systematic BinderGautam Singh, Yeongbin Kim, Sungjin Ahn. [doi]

On the Usefulness of Embeddings, Clusters and Strings for Text Generation EvaluationTiago Pimentel, Clara Meister, Ryan Cotterell. [doi]

How Sharpness-Aware Minimization Minimizes Sharpness?Kaiyue Wen, Tengyu Ma 0001, Zhiyuan Li. [doi]

Private Federated Learning Without a Trusted Server: Optimal Algorithms for Convex LossesAndrew Lowy, Meisam Razaviyayn. [doi]

Sparse Upcycling: Training Mixture-of-Experts from Dense CheckpointsAran Komatsuzaki, Joan Puigcerver, James Lee-Thorp, Carlos Riquelme Ruiz, Basil Mustafa, Joshua Ainslie, Yi Tay, Mostafa Dehghani 0001, Neil Houlsby. [doi]

Efficient Model Updates for Approximate Unlearning of Graph-Structured DataEli Chien, Chao Pan 0003, Olgica Milenkovic. [doi]

DensePure: Understanding Diffusion Models for Adversarial RobustnessChaowei Xiao, Zhongzhu Chen, Kun Jin, Jiongxiao Wang, Weili Nie, Mingyan Liu, Anima Anandkumar, Bo Li 0026, Dawn Song. [doi]

Scaling Up Probabilistic Circuits by Latent Variable DistillationAnji Liu, Honghua Zhang, Guy Van den Broeck. [doi]

gDDIM: Generalized denoising diffusion implicit modelsQinsheng Zhang, Molei Tao, Yongxin Chen. [doi]

Learning with Logical Constraints but without Shortcut SatisfactionZenan Li, Zehua Liu, Yuan Yao 0001, Jingwei Xu 0001, Taolue Chen, Xiaoxing Ma, Jian Lü 0001. [doi]

Predicting Cellular Responses with Variational Causal Inference and Refined Relational InformationYulun Wu, Robert A. Barton, Zichen Wang, Vassilis N. Ioannidis, Carlo De Donno, Layne C. Price, Luis F. Voloch, George Karypis. [doi]

Diffusion-based Image Translation using disentangled style and content representationGihyun Kwon, Jong Chul Ye. [doi]

Learning Proximal Operators to Discover Multiple OptimaLingxiao Li, Noam Aigerman, Vladimir G. Kim, Jiajin Li, Kristjan H. Greenewald, Mikhail Yurochkin, Justin Solomon 0001. [doi]

Towards One-shot Neural Combinatorial Solvers: Theoretical and Empirical Notes on the Cardinality-Constrained CaseRunzhong Wang, Li Shen, Yiting Chen, Xiaokang Yang, Dacheng Tao, Junchi Yan. [doi]

Composite Slice Transformer: An Efficient Transformer with Composition of Multi-Scale Multi-Range AttentionsMingu Lee, Saurabh Pitre, Tianyu Jiang, Pierre-David Letourneau, Matthew J. Morse, Kanghwan Jang, Joseph Soriaga, Parham Noorzad, Hsin-Pai Cheng, Christopher Lott. [doi]

Combating Exacerbated Heterogeneity for Robust Models in Federated LearningJianing Zhu, Jiangchao Yao, Tongliang Liu, Quanming Yao, Jianliang Xu, Bo Han 0003. [doi]

DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-Disentangled Embedding SharingPengcheng He, Jianfeng Gao, Weizhu Chen. [doi]

Implicit Bias of Large Depth Networks: a Notion of Rank for Nonlinear FunctionsArthur Jacot. [doi]

External Links

Cite Key

Statistics

PDF

Researchr

The Eleventh International Conference on Learning Representations, ICLR 2023, Kigali, Rwanda, May 1-5, 2023

Abstract

Table of Contents