Advances in Neural Information Processing Systems 32: Annual Conference on Neural Information Processing Systems 2019, NeurIPS 2019, 8-14 December 2019, Vancouver, BC, Canada - researchr publication

researchr

You are not signed in
Sign in
Sign up

Hanna M. Wallach, Hugo Larochelle, Alina Beygelzimer, Florence d'Alché-Buc, Edward A. Fox, Roman Garnett, editors, Advances in Neural Information Processing Systems 32: Annual Conference on Neural Information Processing Systems 2019, NeurIPS 2019, 8-14 December 2019, Vancouver, BC, Canada. 2019. [doi]

Conference: nips2019

Abstract is missing.

Multimodal Model-Agnostic Meta-Learning via Task-Aware ModulationRisto Vuorio, Shao-Hua Sun, Hexiang Hu, Joseph J. Lim. 1-12 [doi]

ViLBERT: Pretraining Task-Agnostic Visiolinguistic Representations for Vision-and-Language TasksJiasen Lu, Dhruv Batra, Devi Parikh, Stefan Lee. 13-23 [doi]

Stochastic Shared Embeddings: Data-driven Regularization of Embedding LayersLiwei Wu, Shuqing Li, Cho-Jui Hsieh, James L. Sharpnack. 24-34 [doi]

Unsupervised Scale-consistent Depth and Ego-motion Learning from Monocular VideoJiawang Bian, Zhichao Li, Naiyan Wang, Huangying Zhan, Chunhua Shen, Ming-Ming Cheng, Ian D. Reid 0001. 35-45 [doi]

Zero-shot Learning via Simultaneous Generating and LearningHyeonwoo Yu, Beomhee Lee. 46-56 [doi]

Ask not what AI can do, but what AI should do: Towards a framework of task delegabilityBrian Lubars, Chenhao Tan. 57-67 [doi]

Stand-Alone Self-Attention in Vision ModelsNiki Parmar, Prajit Ramachandran, Ashish Vaswani, Irwan Bello, Anselm Levskaya, Jon Shlens. 68-80 [doi]

High Fidelity Video Prediction with Large Stochastic Recurrent Neural NetworksRuben Villegas, Arkanath Pathak, Harini Kannan, Dumitru Erhan, Quoc V. Le, Honglak Lee. 81-91 [doi]

Unsupervised learning of object structure and dynamics from videosMatthias Minderer, Chen Sun, Ruben Villegas, Forrester Cole, Kevin P. Murphy, Honglak Lee. 92-102 [doi]

GPipe: Efficient Training of Giant Neural Networks using Pipeline ParallelismYanping Huang, Youlong Cheng, Ankur Bapna, Orhan Firat, Dehao Chen, Mia Xu Chen, HyoukJoong Lee, Jiquan Ngiam, Quoc V. Le, Yonghui Wu, Zhifeng Chen. 103-112 [doi]

Meta-Learning with Implicit GradientsAravind Rajeswaran, Chelsea Finn, Sham M. Kakade, Sergey Levine. 113-124 [doi]

Adversarial Examples Are Not Bugs, They Are FeaturesAndrew Ilyas, Shibani Santurkar, Dimitris Tsipras, Logan Engstrom, Brandon Tran, Aleksander Madry. 125-136 [doi]

Social-BiGAT: Multimodal Trajectory Forecasting using Bicycle-GAN and Graph Attention NetworksVineet Kosaraju, Amir Sadeghian, Roberto Martín-Martín, Ian D. Reid 0001, Hamid Rezatofighi, Silvio Savarese. 137-146 [doi]

FreeAnchor: Learning to Match Anchors for Visual Object DetectionXiaosong Zhang, Fang Wan, Chang Liu, Rongrong Ji, Qixiang Ye. 147-155 [doi]

Private Hypothesis SelectionMark Bun, Gautam Kamath 0001, Thomas Steinke, Steven Z. Wu. 156-167 [doi]

Differentially Private Algorithms for Learning Mixtures of Separated GaussiansGautam Kamath 0001, Or Sheffet, Vikrant Singhal, Jonathan Ullman. 168-180 [doi]

Average-Case Averages: Private Algorithms for Smooth Sensitivity and Mean EstimationMark Bun, Thomas Steinke. 181-191 [doi]

Multi-Resolution Weak Supervision for Sequential DataParoma Varma, Frederic Sala, Shiori Sagawa, Jason Alan Fries, Daniel Y. Fu, Saelig Khattar, Ashwini Ramamoorthy, Ke Xiao, Kayvon Fatahalian, James Priest, Christopher Ré. 192-203 [doi]

DeepUSPS: Deep Robust Unsupervised Saliency Prediction via Self-supervisionDuc Tam Nguyen, Maximilian Dax, Chaithanya Kumar Mummadi, Thi-Phuong-Nhung Ngo, Thi Hoai Phuong Nguyen, Zhongyu Lou, Thomas Brox. 204-214 [doi]

The Point Where Reality Meets Fantasy: Mixed Adversarial Generators for Image Splice DetectionVladimir V. Kniaz, Vladimir A. Knyaz, Fabio Remondino. 215-226 [doi]

You Only Propagate Once: Accelerating Adversarial Training via Maximal PrincipleDinghuai Zhang, Tianyuan Zhang, Yiping Lu, Zhanxing Zhu, Bin Dong 0001. 227-238 [doi]

Imitation Learning from Observations by Minimizing Inverse Dynamics DisagreementChao Yang, Xiaojian Ma, Wenbing Huang, Fuchun Sun, Huaping Liu 0001, JunZhou Huang, Chuang Gan. 239-249 [doi]

Asymptotic Guarantees for Learning Generative Models with the Sliced-Wasserstein DistanceKimia Nadjahi, Alain Durmus, Umut Simsekli, Roland Badeau. 250-260 [doi]

Generalized Sliced Wasserstein DistancesSoheil Kolouri, Kimia Nadjahi, Umut Simsekli, Roland Badeau, Gustavo K. Rohde. 261-272 [doi]

First Exit Time Analysis of Stochastic Gradient Descent Under Heavy-Tailed Gradient NoiseThanh Huy Nguyen, Umut Simsekli, Mert Gürbüzbalaban, Gaël Richard. 273-283 [doi]

Blind Super-Resolution Kernel Estimation using an Internal-GANSefi Bell-Kligler, Assaf Shocher, Michal Irani. 284-293 [doi]

Noise-tolerant fair classificationAlexandre Louis Lamy, Ziyuan Zhong. 294-305 [doi]

Generalization in Generative Adversarial Networks: A Novel Perspective from Privacy ProtectionBingzhe Wu, Shiwan Zhao, Chaochao Chen, Haoyang Xu, Li Wang, Xiaolu Zhang, Guangyu Sun 0003, Jun Zhou. 306-316 [doi]

Joint-task Self-supervised Learning for Temporal CorrespondenceXueting Li, Sifei Liu, Shalini De Mello, Xiaolong Wang, Jan Kautz, Ming-Hsuan Yang 0001. 317-327 [doi]

Provable Gradient Variance Guarantees for Black-Box Variational InferenceJustin Domke. 328-337 [doi]

Divide and Couple: Using Monte Carlo Variational Objectives for Posterior ApproximationJustin Domke, Daniel R. Sheldon. 338-347 [doi]

Experience Replay for Continual LearningDavid Rolnick, Arun Ahuja, Jonathan Schwarz, Timothy P. Lillicrap, Gregory Wayne. 348-358 [doi]

Deep ReLU Networks Have Surprisingly Few Activation PatternsBoris Hanin, David Rolnick. 359-368 [doi]

Chasing Ghosts: Instruction Following as Bayesian State TrackingPeter Anderson, Ayush Shrivastava, Devi Parikh, Dhruv Batra, Stefan Lee. 369-379 [doi]

Block Coordinate Regularization by DenoisingYu Sun 0022, Jiaming Liu, Ulugbek Kamilov. 380-390 [doi]

Reducing Noise in GAN Training with Variance Reduced ExtragradientTatjana Chavdarova, Gauthier Gidel, François Fleuret, Simon Lacoste-Julien. 391-401 [doi]

Learning Erdos-Renyi Random Graphs via Edge Detecting QueriesZihan Li, Matthias Fresacher, Jonathan Scarlett. 402-412 [doi]

A Primal-Dual link between GANs and AutoencodersHisham Husain, Richard Nock, Robert C. Williamson. 413-422 [doi]

muSSP: Efficient Min-cost Flow Algorithm for Multi-object TrackingCongchao Wang, Yizhi Wang, Yinxue Wang, Chiung-Ting Wu, Guoqiang Yu. 423-432 [doi]

Category Anchor-Guided Unsupervised Domain Adaptation for Semantic SegmentationQiming Zhang, Jing Zhang, Wei Liu 0005, Dacheng Tao. 433-443 [doi]

Invert to Learn to InvertPatrick Putzky, Max Welling. 444-454 [doi]

Equitable Stable Matchings in Quadratic TimeNikolaos Tziavelis, Ioannis Giannakopoulos, Katerina Doka, Nectarios Koziris, Panagiotis Karras. 455-465 [doi]

Zero-Shot Semantic SegmentationMaxime Bucher, Tuan-Hung Vu, Matthieu Cord, Patrick Pérez. 466-477 [doi]

Metric Learning for Adversarial RobustnessChengzhi Mao, Ziyuan Zhong, Junfeng Yang, Carl Vondrick, Baishakhi Ray. 478-489 [doi]

DISN: Deep Implicit Surface Network for High-quality Single-view 3D ReconstructionQiangeng Xu, Weiyue Wang, Duygu Ceylan, Radomír Mech, Ulrich Neumann. 490-500 [doi]

Batched Multi-armed Bandits ProblemZijun Gao, Yanjun Han, Zhimei Ren, Zhengqing Zhou. 501-511 [doi]

vGraph: A Generative Model for Joint Community Detection and Node Representation LearningFan-Yun Sun, Meng Qu, Jordan Hoffmann, Chin-Wei Huang, Jian Tang 0005. 512-522 [doi]

Differentially Private Bayesian Linear RegressionGarrett Bernstein, Daniel R. Sheldon. 523-533 [doi]

Semantic Conditioned Dynamic Modulation for Temporal Sentence Grounding in VideosYitian Yuan, Lin Ma, Jingwen Wang, Wei Liu, Wenwu Zhu 0001. 534-544 [doi]

AGEM: Solving Linear Inverse Problems via Deep Priors and SamplingBichuan Guo, Yuxing Han, Jiangtao Wen. 545-556 [doi]

CPM-Nets: Cross Partial Multi-View NetworksChangqing Zhang, Zongbo Han, yajie cui, Huazhu Fu, Joey Tianyi Zhou, Qinghua Hu. 557-567 [doi]

Learning to Predict Layout-to-image Conditional Convolutions for Semantic Image SynthesisXihui Liu, Guojun Yin, Jing Shao, Xiaogang Wang 0001, Hongsheng Li. 568-578 [doi]

Staying up to Date with Online Content Changes Using Reinforcement Learning for SchedulingAndrey Kolobov, Yuval Peres, Cheng Lu, Eric Joel Horvitz. 579-589 [doi]

SySCD: A System-Aware Parallel Coordinate Descent AlgorithmNikolas Ioannou, Celestine Mendler-Dünner, Thomas P. Parnell. 590-600 [doi]

Importance Weighted Hierarchical Variational InferenceArtem Sobolev, Dmitry P. Vetrov. 601-613 [doi]

RSN: Randomized Subspace NewtonRobert M. Gower, Dmitry Kovalev, Felix Lieder, Peter Richtárik. 614-623 [doi]

Trust Region-Guided Proximal Policy OptimizationYuhui Wang, Hao He, Xiaoyang Tan, Yaozhong Gan. 624-634 [doi]

Adversarial Self-Defense for Cycle-Consistent GANsDina Bashkirova, Ben Usman, Kate Saenko. 635-645 [doi]

Towards closing the gap between the theory and practice of SVRGOthmane Sebbouh, Nidham Gazagnadou, Samy Jelassi, Francis Bach, Robert M. Gower. 646-656 [doi]

Uniform Error Bounds for Gaussian Process Regression with Application to Safe ControlArmin Lederer, Jonas Umlauft, Sandra Hirche. 657-667 [doi]

ETNet: Error Transition Network for Arbitrary Style TransferChunjin Song, Zhijie Wu, Yang Zhou, Minglun Gong, Hui Huang 0004. 668-677 [doi]

No Pressure! Addressing the Problem of Local Minima in Manifold Learning AlgorithmsMax Vladymyrov. 678-687 [doi]

Deep Equilibrium ModelsShaojie Bai, J. Zico Kolter, Vladlen Koltun. 688-699 [doi]

Saccader: Improving Accuracy of Hard Attention Models for VisionGamaleldin F. Elsayed, Simon Kornblith, Quoc V. Le. 700-712 [doi]

Multiway clustering via tensor block modelsMiaoyan Wang, Yuchen Zeng. 713-723 [doi]

Regret Minimization for Reinforcement Learning with Vectorial Feedback and Complex ObjectivesWang Chi Cheung. 724-734 [doi]

NAT: Neural Architecture Transformer for Accurate and Compact ArchitecturesYong Guo, Yin Zheng, Mingkui Tan, Qi Chen, Jian Chen 0011, Peilin Zhao, JunZhou Huang. 735-747 [doi]

Selecting Optimal Decisions via Distributionally Robust Nearest-Neighbor RegressionRuidi Chen, Ioannis Ch. Paschalidis. 748-758 [doi]

Network Pruning via Transformable Architecture SearchXuanyi Dong, Yi Yang 0001. 759-770 [doi]

Differentiable Cloth Simulation for Inverse ProblemsJunbang Liang, Ming C. Lin, Vladlen Koltun. 771-780 [doi]

Poisson-Randomized Gamma Dynamical SystemsAaron Schein, Scott W. Linderman, Mingyuan Zhou, David M. Blei, Hanna M. Wallach. 781-792 [doi]

Volumetric Correspondence Networks for Optical FlowGengshan Yang, Deva Ramanan. 793-803 [doi]

Learning Conditional Deformable Templates with Convolutional NetworksAdrian V. Dalca, Marianne Rakic, John V. Guttag, Mert R. Sabuncu. 804-816 [doi]

Fast Low-rank Metric Learning for Large-scale and High-dimensional DataHan Liu, Zhizhong Han, Yu-Shen Liu, Ming Gu 0001. 817-827 [doi]

Efficient Symmetric Norm Regression via Linear SketchingZhao Song, Ruosong Wang, Lin Yang, Hongyang Zhang, Peilin Zhong. 828-838 [doi]

RUBi: Reducing Unimodal Biases for Visual Question AnsweringRémi Cadène, Corentin Dancette, Hedi Ben-younes, Matthieu Cord, Devi Parikh. 839-850 [doi]

Why Can't I Dance in the Mall? Learning to Mitigate Scene Bias in Action RecognitionJinwoo Choi, Chen Gao, Joseph C. E. Messou, Jia-Bin Huang. 851-863 [doi]

NeurVPS: Neural Vanishing Point Scanning via Conic ConvolutionYichao Zhou, Haozhi Qi, Jingwei Huang, Yi Ma. 864-873 [doi]

DATA: Differentiable ArchiTecture ApproximationJianlong Chang, Xinbang Zhang, Yiwen Guo, Gaofeng Meng, Shiming Xiang, Chunhong Pan. 874-884 [doi]

Learn, Imagine and Create: Text-to-Image Generation from Prior KnowledgeTingting Qiao, Jing Zhang, Duanqing Xu, Dacheng Tao. 885-895 [doi]

Memory-oriented Decoder for Light Field Salient Object DetectionMiao Zhang, Jingjing Li, Ji Wei, Yongri Piao, Huchuan Lu. 896-906 [doi]

Multi-label Co-regularization for Semi-supervised Facial Action Unit RecognitionXuesong Niu, Hu Han, Shiguang Shan, Xilin Chen. 907-917 [doi]

Correlated Uncertainty for Learning Dense Correspondences from Noisy LabelsNatalia Neverova, David Novotný, Andrea Vedaldi. 918-926 [doi]

Powerset Convolutional Neural NetworksChris Wendler, Markus Püschel, Dan Alistarh. 927-938 [doi]

Optimal Pricing in Repeated Posted-Price Auctions with Different Patience of the Seller and the BuyerArsenii Vanunts, Alexey Drutsa. 939-951 [doi]

An Accelerated Decentralized Stochastic Proximal Algorithm for Finite SumsHadrien Hendrikx, Francis Bach, Laurent Massoulié. 952-962 [doi]

Point-Voxel CNN for Efficient 3D Deep LearningZhijian Liu, Haotian Tang, Yujun Lin, Song Han. 963-973 [doi]

Deep Learning without Weight TransportMohamed Akrout, Collin Wilson, Peter C. Humphreys, Timothy P. Lillicrap, Douglas B. Tweed. 974-982 [doi]

Combinatorial Bandits with Relative FeedbackAadirupa Saha, Aditya Gopalan. 983-993 [doi]

General Proximal Incremental Aggregated Gradient Algorithms: Better and Novel Results under General SchemeTao Sun, Yuejiao Sun, Dongsheng Li, Qing Liao 0001. 994-1004 [doi]

A Condition Number for Joint Optimization of Cycle-Consistent NetworksLeonidas J. Guibas, Qixing Huang, Zhenxiao Liang. 1005-1015 [doi]

Explicit Disentanglement of Appearance and Perspective in Generative ModelsNicki Skafte Detlefsen, Søren Hauberg. 1016-1026 [doi]

Polynomial Cost of Adaptation for X-Armed BanditsHédi Hadiji. 1027-1036 [doi]

Learning to Propagate for Graph Meta-LearningLu Liu, Tianyi Zhou, Guodong Long, Jing Jiang, Chengqi Zhang. 1037-1048 [doi]

Secretary Ranking with Minimal InversionsSepehr Assadi, Eric Balkanski, Renato Paes Leme. 1049-1061 [doi]

Nonparametric Regressive Point Processes Based on Conditional Gaussian ProcessesSiqi Liu, Milos Hauskrecht. 1062-1072 [doi]

Learning Perceptual Inference by ContrastingChi Zhang, Baoxiong Jia, Feng Gao, Yixin Zhu, Hongjing Lu, Song Chun Zhu. 1073-1085 [doi]

Selecting the independent coordinates of manifolds with large aspect ratiosYu-Chia Chen, Marina Meila. 1086-1095 [doi]

Region-specific Diffeomorphic Metric MappingZhengyang Shen, François-Xavier Vialard, Marc Niethammer. 1096-1106 [doi]

Deep Supervised Summarization: Algorithm and Application to Learning InstructionsChengguang Xu, Ehsan Elhamifar. 1107-1118 [doi]

Scene Representation Networks: Continuous 3D-Structure-Aware Neural Scene RepresentationsVincent Sitzmann, Michael Zollhöfer, Gordon Wetzstein. 1119-1130 [doi]

Reconciling λ-Returns with Experience ReplayBrett Daley, Christopher Amato. 1131-1140 [doi]

Control Batch Size and Learning Rate to Generalize Well: Theoretical and Empirical EvidenceFengxiang He, Tongliang Liu, Dacheng Tao. 1141-1150 [doi]

Non-Asymptotic Gap-Dependent Regret Bounds for Tabular MDPsMax Simchowitz, Kevin G. Jamieson. 1151-1160 [doi]

A Graph Theoretic Framework of Recomputation Algorithms for Memory-Efficient BackpropagationMitsuru Kusumoto, Takuya Inoue, Gentaro Watanabe, Takuya Akiba, Masanori Koyama. 1161-1170 [doi]

Combinatorial Inference against Label NoisePaul Hongsuck Seo, Geeho Kim, Bohyung Han. 1171-1181 [doi]

Value Propagation for Decentralized Networked Deep Multi-agent Reinforcement LearningChao Qu, Shie Mannor, Huan Xu, Yuan Qi, Le Song, Junwu Xiong. 1182-1191 [doi]

Convolution with even-sized kernels and symmetric paddingShuang Wu, Guanrui Wang, Pei Tang, Feng Chen, Luping Shi. 1192-1203 [doi]

On The Classification-Distortion-Perception TradeoffDong Liu, Haochen Zhang, Zhiwei Xiong. 1204-1213 [doi]

Optimal Statistical Rates for Decentralised Non-Parametric Regression with Linear Speed-UpDominic Richards, Patrick Rebeschini. 1214-1225 [doi]

Online sampling from log-concave distributionsHolden Lee, Oren Mangoubi, Nisheeth K. Vishnoi. 1226-1237 [doi]

Envy-Free ClassificationMaria-Florina Balcan, Travis Dick, Ritesh Noothigattu, Ariel D. Procaccia. 1238-1248 [doi]

Finding Friend and Foe in Multi-Agent GamesJack Serrino, Max Kleiman-Weiner, David C. Parkes, Josh Tenenbaum. 1249-1259 [doi]

Image Synthesis with a Single (Robust) ClassifierShibani Santurkar, Andrew Ilyas, Dimitris Tsipras, Logan Engstrom, Brandon Tran, Aleksander Madry. 1260-1271 [doi]

Model Compression with Adversarial Robustness: A Unified Optimization FrameworkShupeng Gui, Haotao Wang, Haichuan Yang, Chen Yu, Zhangyang Wang, Ji Liu 0002. 1283-1294 [doi]

Cross-channel Communication NetworksJianwei Yang, Zhile Ren, Chuang Gan, Hongyuan Zhu, Devi Parikh. 1295-1304 [doi]

CondConv: Conditionally Parameterized Convolutions for Efficient InferenceBrandon Yang, Gabriel Bender, Quoc V. Le, Jiquan Ngiam. 1305-1316 [doi]

Regression Planning NetworksDanfei Xu, Roberto Martín-Martín, De-An Huang, Yuke Zhu, Silvio Savarese, Li F. Fei-Fei. 1317-1327 [doi]

Twin Auxilary Classifiers GANMingming Gong, Yanwu Xu, Chunyuan Li, Kun Zhang 0001, Kayhan Batmanghelich. 1328-1337 [doi]

Conditional Structure Generation through Graph Variational Generative Adversarial NetsCarl Yang, Peiye Zhuang, Wenhan Shi, Alan Luu, Pan Li 0005. 1338-1349 [doi]

Distributional Policy Optimization: An Alternative Approach for Continuous ControlChen Tessler, Guy Tennenholtz, Shie Mannor. 1350-1360 [doi]

Sampling Sketches for Concave Sublinear Functions of FrequenciesEdith Cohen, Ofir Geri. 1361-1371 [doi]

Deliberative Explanations: visualizing network insecuritiesPei Wang, Nuno Nasconcelos. 1372-1383 [doi]

Computing Full Conformal Prediction Set with Approximate HomotopyEugène Ndiaye, Ichiro Takeuchi. 1384-1393 [doi]

Failing Loudly: An Empirical Study of Methods for Detecting Dataset ShiftStephan Rabanser, Stephan Günnemann, Zachary C. Lipton. 1394-1406 [doi]

Hierarchical Reinforcement Learning with Advantage-Based Auxiliary RewardsSiyuan Li, Rui Wang, Minxue Tang, Chongjie Zhang. 1407-1417 [doi]

Multi-View Reinforcement LearningMinne Li, Lisheng Wu, Jun Wang 0012, Haitham Bou-Ammar. 1418-1429 [doi]

Cascade RPN: Delving into High-Quality Region Proposal Network with Adaptive ConvolutionThang Vu, Hyunjun Jang, Trung X. Pham, Chang Dong Yoo. 1430-1440 [doi]

Neural Diffusion Distance for Image SegmentationJian Sun 0009, ZongBen Xu. 1441-1451 [doi]

Fine-grained Optimization of Deep Neural NetworksMete Ozay. 1452-1462 [doi]

Extending Stein's unbiased risk estimator to train deep denoisers with correlated pairs of noisy imagesMagauiya Zhussip, Shakarim Soltanayev, Se Young Chun. 1463-1473 [doi]

Fixing Implicit Derivatives: Trust-Region Based Learning of Continuous Energy FunctionsChris Russell 0001, Matteo Toso, Neill Campbell. 1474-1484 [doi]

Hyperspherical Prototype NetworksPascal Mettes, Elise van der Pol, Cees Snoek. 1485-1495 [doi]

Expressive power of tensor-network factorizations for probabilistic modelingIvan Glasser, Ryan Sweke, Nicola Pancotti, Jens Eisert, J. Ignacio Cirac. 1496-1508 [doi]

HyperGCN: A New Method For Training Graph Convolutional Networks on HypergraphsNaganand Yadati, Madhav Nimishakavi, Prateek Yadav, Vikram Nitin, Anand Louis, Partha P. Talukdar. 1509-1520 [doi]

SSRGD: Simple Stochastic Recursive Gradient Descent for Escaping Saddle PointsZhize Li. 1521-1531 [doi]

Efficient Meta Learning via Minibatch Proximal UpdatePan Zhou, Xiaotong Yuan, Huan Xu, Shuicheng Yan, Jiashi Feng. 1532-1542 [doi]

Unconstrained Monotonic Neural NetworksAntoine Wehenkel, Gilles Louppe. 1543-1553 [doi]

Guided Similarity Separation for Image RetrievalChundi Liu, Guang Wei Yu, Maksims Volkovs, Cheng Chang, Himanshu Rai, Junwei Ma, Satya Krishna Gorti. 1554-1564 [doi]

Learning Imbalanced Datasets with Label-Distribution-Aware Margin LossKaidi Cao, Colin Wei, Adrien Gaidon, Nikos Aréchiga, Tengyu Ma. 1565-1576 [doi]

Strategizing against No-regret LearnersYuan Deng, Jon Schneider, Balasubramanian Sivan. 1577-1585 [doi]

D-VAE: A Variational Autoencoder for Directed Acyclic GraphsMuhan Zhang, Shali Jiang, Zhicheng Cui, Roman Garnett, Yixin Chen. 1586-1598 [doi]

Hierarchical Optimal Transport for Document RepresentationMikhail Yurochkin, Sebastian Claici, Edward Chien, Farzaneh Mirzazadeh, Justin M. Solomon. 1599-1609 [doi]

Multivariate Sparse Coding of Nonstationary Covariances with Gaussian ProcessesRui Li. 1610-1619 [doi]

Positional NormalizationBoyi Li, Felix Wu, Kilian Q. Weinberger, Serge J. Belongie. 1620-1632 [doi]

A New Defense Against Adversarial Images: Turning a Weakness into a StrengthShengyuan Hu, Tao Yu, Chuan Guo, Wei-Lun Chao, Kilian Q. Weinberger. 1633-1644 [doi]

Quadratic Video InterpolationXiangyu Xu, Li Si-Yao, Wenxiu Sun, Qian Yin, Ming-Hsuan Yang 0001. 1645-1654 [doi]

ResNets Ensemble via the Feynman-Kac Formalism to Improve Natural and Robust AccuraciesBao Wang, Zuoqiang Shi, Stanley J. Osher. 1655-1665 [doi]

Incremental Scene SynthesisBenjamin Planche, Xuejian Rong, Ziyan Wu, Srikrishna Karanam, Harald Kosch, Yingli Tian, Jan Ernst, Andreas Hutter. 1666-1676 [doi]

Self-Supervised Generalisation with Meta Auxiliary LearningShikun Liu, Andrew J. Davison, Edward Johns. 1677-1687 [doi]

Variational Denoising Network: Toward Blind Noise Modeling and RemovalZongsheng Yue, Hongwei Yong, Qian Zhao, Deyu Meng, Lei Zhang 0006. 1688-1699 [doi]

Fast Sparse Group LassoYasutoshi Ida, Yasuhiro Fujiwara, Hisashi Kashima. 1700-1708 [doi]

Learnable Tree Filter for Structure-preserving Feature TransformLin Song, Yanwei Li, Zeming Li, Gang Yu, Hongbin Sun 0001, Jian Sun 0015, Nanning Zheng. 1709-1719 [doi]

Data-Dependence of Plateau Phenomenon in Learning with Neural Network - Statistical Mechanical AnalysisYuki Yoshida, Masato Okada. 1720-1728 [doi]

Coordinated hippocampal-entorhinal replay as structural inferenceTalfan Evans, Neil Burgess. 1729-1741 [doi]

Cascaded Dilated Dense Network with Two-step Data Consistency for MRI ReconstructionHao Zheng, Faming Fang, Guixu Zhang. 1742-1752 [doi]

On the Ineffectiveness of Variance Reduced Optimization for Deep LearningAaron Defazio, Léon Bottou. 1753-1763 [doi]

On the Curved Geometry of Accelerated OptimizationAaron Defazio. 1764-1773 [doi]

Multi-marginal Wasserstein GANJiezhang Cao, Langyuan Mo, Yifan Zhang 0004, Kui Jia, Chunhua Shen, Mingkui Tan. 1774-1784 [doi]

Better Exploration with Optimistic Actor CriticKamil Ciosek, Quan Vuong, Robert Loftin, Katja Hofmann. 1785-1796 [doi]

Importance Resampling for Off-policy PredictionMatthew Schlegel, Wesley Chung, Daniel Graves, Jian Qian, Martha White. 1797-1807 [doi]

The Label Complexity of Active Learning from Observational DataSongbai Yan, Kamalika Chaudhuri, Tara Javidi. 1808-1817 [doi]

Meta-Learning Representations for Continual LearningKhurram Javed, Martha White. 1818-1828 [doi]

Defense Against Adversarial Attacks Using Feature Scattering-based Adversarial TrainingHaichao Zhang, Jianyu Wang. 1829-1839 [doi]

Visualizing the PHATE of Neural NetworksScott Gigante, Adam S. Charles, Smita Krishnaswamy, Gal Mishne. 1840-1851 [doi]

The Cells Out of Sample (COOS) dataset and benchmarks for measuring out-of-sample generalization of image classifiersAlex X. Lu, Amy X. Lu, Wiebke Schormann, Marzyeh Ghassemi, David W. Andrews, Alan M. Moses. 1852-1860 [doi]

Nonconvex Low-Rank Tensor Completion from Noisy DataChangxiao Cai, Gen Li, H. Vincent Poor, Yuxin Chen 0002. 1861-1872 [doi]

Beyond Online Balanced Descent: An Optimal Algorithm for Smoothed Online OptimizationGautam Goel, Yiheng Lin, Haoyuan Sun, Adam Wierman. 1873-1883 [doi]

Channel Gating Neural NetworksWeizhe Hua, Yuan Zhou, Christopher De Sa, Zhiru Zhang, G. Edward Suh. 1884-1894 [doi]

Neural networks grown and self-organized by noiseGuruprasad Raghavan, Matt Thomson. 1895-1905 [doi]

Catastrophic Forgetting Meets Negative Transfer: Batch Spectral Shrinkage for Safe Transfer LearningXinyang Chen, Sinan Wang, Bo Fu, Mingsheng Long, Jianmin Wang. 1906-1916 [doi]

Meta-Weight-Net: Learning an Explicit Mapping For Sample WeightingJun Shu, Qi Xie, Lixuan Yi, Qian Zhao 0002, Sanping Zhou, ZongBen Xu, Deyu Meng. 1917-1928 [doi]

Variational Structured Semantic Inference for Diverse Image CaptioningFuhai Chen, Rongrong Ji, Jiayi Ji, Xiaoshuai Sun, Baochang Zhang, Xuri Ge, Yongjian Wu, Feiyue Huang, Yan Wang. 1929-1939 [doi]

Mapping State Space using Landmarks for Universal Goal ReachingZhiao Huang, Fangchen Liu, Hao Su. 1940-1950 [doi]

Transferable Normalization: Towards Improving Transferability of Deep Neural NetworksXimei Wang, Ying Jin, Mingsheng Long, Jianmin Wang, Michael I. Jordan. 1951-1961 [doi]

Random deep neural networks are biased towards simple functionsGiacomo De Palma, Bobak Toussi Kiani, Seth Lloyd. 1962-1974 [doi]

XNAS: Neural Architecture Search with Expert AdviceNiv Nayman, Asaf Noy, Tal Ridnik, Itamar Friedman, Rong Jin, Lihi Zelnik-Manor. 1975-1985 [doi]

2: Viewpoint Generalization via a Binocular VisionWei-Da Chen, Shan-Hung Wu. 1986-1998 [doi]

Generalized Off-Policy Actor-CriticShangtong Zhang, Wendelin Boehmer, Shimon Whiteson. 1999-2009 [doi]

DAC: The Double Actor-Critic Architecture for Learning OptionsShangtong Zhang, Shimon Whiteson. 2010-2020 [doi]

Numerically Accurate Hyperbolic Embeddings Using Tiling-Based ModelsTao Yu, Christopher De Sa. 2021-2031 [doi]

Controlling Neural Level SetsMatan Atzmon, Niv Haim, Lior Yariv, Ofer Israelov, Haggai Maron, Yaron Lipman. 2032-2041 [doi]

Blended Matching PursuitCyrille W. Combettes, Sebastian Pokutta. 2042-2052 [doi]

An Improved Analysis of Training Over-parameterized Deep Neural NetworksDifan Zou, Quanquan Gu. 2053-2062 [doi]

Controllable Text-to-Image GenerationBowen Li, Xiaojuan Qi, Thomas Lukasiewicz, Philip H. S. Torr. 2063-2073 [doi]

Improving Textual Network Learning with Variational Homophilic EmbeddingsWenlin Wang, Chenyang Tao, Zhe Gan, Guoyin Wang, Liqun Chen, Xinyuan Zhang, Ruiyi Zhang, Qian Yang, Ricardo Henao, Lawrence Carin. 2074-2085 [doi]

Rethinking Generative Mode Coverage: A Pointwise Guaranteed ApproachPeilin Zhong, Yuchen Mo, Chang Xiao, Pengyu Chen, Changxi Zheng. 2086-2097 [doi]

The Randomized Midpoint Method for Log-Concave SamplingRuoqi Shen, Yin Tat Lee. 2098-2109 [doi]

Sample-Efficient Deep Reinforcement Learning via Episodic Backward UpdateSu-Young Lee, SungIk Choi, Sae-Young Chung. 2110-2119 [doi]

Fully Neural Network based Model for General Temporal Point ProcessesTakahiro Omi, Naonori Ueda, Kazuyuki Aihara. 2120-2129 [doi]

Gate Decorator: Global Filter Pruning Method for Accelerating Deep Convolutional Neural NetworksZhonghui You, Kun Yan, Jinmian Ye, Meng Ma, Ping Wang 0003. 2130-2141 [doi]

Discrimination in Online Markets: Effects of Social Bias on Learning from Reviews and Policy DesignFaidra Georgia Monachou, Itai Ashlagi. 2142-2152 [doi]

Provably Powerful Graph NetworksHaggai Maron, Heli Ben Hamu, Hadar Serviansky, Yaron Lipman. 2153-2164 [doi]

Order Optimal One-Shot Distributed LearningArsalan Sharif-Nassab, Saber Salehkaleybar, S. Jamaloddin Golestani. 2165-2174 [doi]

Information Competing Process for Learning Diversified RepresentationsJie Hu, Rongrong Ji, Shengchuan Zhang, Xiaoshuai Sun, Qixiang Ye, Chia-Wen Lin, Qi Tian 0002. 2175-2186 [doi]

GENO - GENeric Optimization for Classical Machine LearningSören Laue, Matthias Mitterreiter, Joachim Giesen. 2187-2198 [doi]

Conditional Independence Testing using Generative Adversarial NetworksAlexis Bellot, Mihaela van der Schaar. 2199-2208 [doi]

Online Stochastic Shortest Path with Bandit Feedback and Unknown Transition FunctionAviv Rosenberg 0002, Yishay Mansour. 2209-2218 [doi]

Partitioning Structure Learning for Segmented Linear Regression TreesXiangyu Zheng, Song Xi Chen. 2219-2228 [doi]

A Tensorized Transformer for Language ModelingXindian Ma, Peng Zhang, Shuai Zhang, Nan Duan, Yuexian Hou, Ming Zhou, Dawei Song 0001. 2229-2239 [doi]

Kernel Stein Tests for Multiple Model ComparisonJen Ning Lim, Makoto Yamada, Bernhard Schölkopf, Wittawat Jitkrittum. 2240-2250 [doi]

Disentangled behavioural representationsAmir Dezfouli, Hassan Ashtiani, Omar Ghattas, Richard Nock, Peter Dayan, Cheng Soon Ong. 2251-2260 [doi]

More Is Less: Learning Efficient Video Representations by Big-Little Network and Depthwise Temporal AggregationQuanfu Fan, Chun-Fu (Richard) Chen, Hilde Kuehne, Marco Pistoia, David Cox. 2261-2270 [doi]

Rethinking the CSC Model for Natural ImagesDror Simon, Michael Elad. 2271-2281 [doi]

Integrating Bayesian and Discriminative Sparse Kernel Machines for Multi-class Active LearningWeishi Shi, Qi Yu 0001. 2282-2291 [doi]

Learning to Control Self-Assembling Morphologies: A Study of Generalization via ModularityDeepak Pathak, Christopher Lu, Trevor Darrell, Phillip Isola, Alexei A. Efros. 2292-2302 [doi]

Perceiving the arrow of time in autoregressive motionKristof Meding, Dominik Janzing, Bernhard Schölkopf, Felix A. Wichmann. 2303-2314 [doi]

DualDICE: Behavior-Agnostic Estimation of Discounted Stationary Distribution CorrectionsOfir Nachum, Yinlam Chow, Bo Dai, Lihong Li 0001. 2315-2325 [doi]

Hyper-Graph-Network Decoders for Block CodesEliya Nachmani, Lior Wolf. 2326-2336 [doi]

Large Scale Markov Decision Processes with Changing RewardsAdrian Rivera Cardoso, He Wang, Huan Xu. 2337-2347 [doi]

Multiview Aggregation for Learning Category-Specific Shape ReconstructionSrinath Sridhar 0002, Davis Rempe, Julien Valentin, Sofien Bouaziz, Leonidas J. Guibas. 2348-2359 [doi]

Semi-Parametric Dynamic Contextual PricingVirag Shah, Ramesh Johari, Jose H. Blanchet. 2360-2370 [doi]

Interlaced Greedy Algorithm for Maximization of Submodular Functions in Nearly Linear TimeAlan Kuhnle. 2371-2381 [doi]

Initialization of ReLUs for Dynamical IsometryRebekka Burkholz, Alina Dubatovka. 2382-2392 [doi]

Gradient Information for Representation and ModelingJie Ding, A. Robert Calderbank, Vahid Tarokh. 2393-2402 [doi]

SpiderBoost and Momentum: Faster Variance Reduction AlgorithmsZhe Wang, Kaiyi Ji, Yi Zhou, Yingbin Liang, Vahid Tarokh. 2403-2413 [doi]

Minimax Optimal Estimation of Approximate Differential Privacy on Neighboring DatabasesXiyang Liu, Sewoong Oh. 2414-2425 [doi]

Backprop with Approximate Activations for Memory-efficient Network TrainingAyan Chakrabarti, Benjamin Moseley. 2426-2435 [doi]

Training Image Estimators without Image Ground TruthZhihao Xia, Ayan Chakrabarti. 2436-2446 [doi]

Deep Structured Prediction for Facial Landmark DetectionLisha Chen, Hui Su, Qiang Ji. 2447-2457 [doi]

Information-Theoretic Confidence Bounds for Reinforcement LearningXiuyuan Lu, Benjamin Van Roy. 2458-2466 [doi]

Transfer Anomaly Detection by Inferring Latent Domain RepresentationsAtsutoshi Kumagai, Tomoharu Iwata, Yasuhiro Fujiwara. 2467-2477 [doi]

Total Least Squares Regression in Input Sparsity TimeHuaian Diao, Zhao Song, David P. Woodruff, Xin Yang. 2478-2489 [doi]

Park: An Open Platform for Learning-Augmented Computer SystemsHongzi Mao, Parimarjan Negi, Akshay Narayan, Hanrui Wang 0002, Jiacheng Yang, Haonan Wang, Ryan Marcus, Ravichandra Addanki, Mehrdad Khani Shirkoohi, Songtao He, Vikram Nathan, Frank Cangialosi, Shaileshh Bojja Venkatakrishnan, Wei-Hung Weng, Song Han, Tim Kraska, Mohammad Alizadeh. 2490-2502 [doi]

Adapting Neural Networks for the Estimation of Treatment EffectsClaudia Shi, David M. Blei, Victor Veitch. 2503-2513 [doi]

Learning Transferable Graph ExplorationHanjun Dai, Yujia Li, Chenglong Wang, Rishabh Singh, Po-Sen Huang, Pushmeet Kohli. 2514-2525 [doi]

Conformal Prediction Under Covariate ShiftRyan J. Tibshirani, Rina Foygel Barber, Emmanuel J. Candès, Aaditya Ramdas. 2526-2536 [doi]

Optimal Analysis of Subset-Selection Based L_p Low-Rank ApproximationChen Dan, Hong Wang, Hongyang Zhang, Yuchen Zhou, Pradeep Ravikumar. 2537-2548 [doi]

Asymmetric Valleys: Beyond Sharp and Flat Local MinimaHaowei He, Gao Huang, Yang Yuan. 2549-2560 [doi]

Positive-Unlabeled Compression on the CloudYixing Xu, Yunhe Wang, Hanting Chen, Kai Han, Chunjing Xu, Dacheng Tao, Chang Xu 0002. 2561-2570 [doi]

Direct Estimation of Differential Functional Graphical ModelsBoxin Zhao, Y. Samuel Wang, Mladen Kolar. 2571-2581 [doi]

On the Calibration of Multiclass Classification with RejectionChenri Ni, Nontawat Charoenphakdee, Junya Honda, Masashi Sugiyama. 2582-2592 [doi]

Third-Person Visual Imitation Learning via Decoupled Hierarchical ControllerPratyusha Sharma, Deepak Pathak, Abhinav Gupta 0001. 2593-2603 [doi]

Stagewise Training Accelerates Convergence of Testing Error Over SGDZhuoning Yuan, Yan Yan 0006, Rong Jin, Tianbao Yang. 2604-2614 [doi]

Learning Robust Options by Conditional Value at Risk OptimizationTakuya Hiraoka, Takahisa Imagawa, Tatsuya Mori, Takashi Onishi, Yoshimasa Tsuruoka. 2615-2625 [doi]

Non-asymptotic Analysis of Stochastic Methods for Non-Smooth Non-Convex Regularized ProblemsYi Xu, Rong Jin, Tianbao Yang. 2626-2636 [doi]

On Learning Over-parameterized Neural Networks: A Functional Approximation PerspectiveLili Su, Pengkun Yang. 2637-2646 [doi]

Drill-down: Interactive Retrieval of Complex Scenes using Natural Language QueriesFuwen Tan, Paola Cascante-Bonilla, Xiaoxiao Guo, Hui Wu, Song Feng, Vicente Ordonez. 2647-2657 [doi]

Dual Variational Generation for Low Shot Heterogeneous Face RecognitionChaoyou Fu, Xiang Wu 0001, Yibo Hu, Huaibo Huang, Ran He. 2670-2679 [doi]

Discovering Neural WiringsMitchell Wortsman, Ali Farhadi, Mohammad Rastegari. 2680-2690 [doi]

On the Optimality of Perturbations in Stochastic and Adversarial Multi-armed Bandit ProblemsBaekjin Kim, Ambuj Tewari. 2691-2700 [doi]

Knowledge Extraction with No Observable DataJaemin Yoo, Minyong Cho, Taebum Kim, U Kang. 2701-2710 [doi]

PAC-Bayes under potentially heavy tailsMatthew Holland. 2711-2720 [doi]

One-Shot Object Detection with Co-Attention and Co-ExcitationTing-I Hsieh, Yi-Chen Lo, Hwann-Tzong Chen, Tyng-Luh Liu. 2721-2730 [doi]

Quaternion Knowledge Graph EmbeddingsShuai Zhang 0007, Yi Tay, Lina Yao, Qi Liu. 2731-2741 [doi]

Glyce: Glyph-vectors for Chinese Character RepresentationsYuxian Meng, Wei Wu, Fei Wang, Xiaoya Li, Ping Nie, Fan Yin, Muyu Li, Qinghong Han, Xiaofei Sun, Jiwei Li. 2742-2753 [doi]

Turbo Autoencoder: Deep learning based channel codes for point-to-point communication channelsYihan Jiang, Hyeji Kim, Himanshu Asnani, Sreeram Kannan, Sewoong Oh, Pramod Viswanath. 2754-2764 [doi]

Heterogeneous Graph Learning for Visual Commonsense ReasoningWeijiang Yu, Jingwen Zhou, Weihao Yu, Xiaodan Liang, Nong Xiao. 2765-2775 [doi]

Probabilistic Watershed: Sampling all spanning forests for seeded segmentation and semi-supervised learningEnrique Fita Sanmartin, Sebastian Damrich, Fred A. Hamprecht. 2776-2787 [doi]

Classification-by-Components: Probabilistic Modeling of Reasoning over a Set of ComponentsSascha Saralajew, Lars Holdijk, Maike Rees, Ebubekir Asan, Thomas Villmann. 2788-2799 [doi]

Identifying Causal Effects via Context-specific Independence RelationsSanttu Tikka, Antti Hyttinen, Juha Karvanen. 2800-2810 [doi]

Bridging Machine Learning and Logical Reasoning by Abductive LearningWang-Zhou Dai, Qiu-Ling Xu, Yang Yu 0001, Zhi-Hua Zhou. 2811-2822 [doi]

Regret Minimization for Reinforcement Learning by Evaluating the Optimal Bias FunctionZihan Zhang, Xiangyang Ji. 2823-2832 [doi]

On the Global Convergence of (Fast) Incremental Expectation Maximization MethodsBelhal Karimi, Hoi-To Wai, Eric Moulines, Marc Lavielle. 2833-2843 [doi]

A Linearly Convergent Proximal Gradient Algorithm for Decentralized OptimizationSulaiman A. Alghunaim, Kun Yuan, Ali H. Sayed. 2844-2854 [doi]

Regularizing Trajectory Optimization with Denoising AutoencodersRinu Boney, Norman Di Palo, Mathias Berglund, Alexander Ilin, Juho Kannala, Antti Rasmus, Harri Valpola. 2855-2865 [doi]

Learning Hierarchical Priors in VAEsAlexej Klushyn, Nutan Chen, Richard Kurle, Botond Cseke, Patrick van der Smagt. 2866-2875 [doi]

Epsilon-Best-Arm Identification in Pay-Per-Reward Multi-Armed BanditsSivan Sabato. 2876-2886 [doi]

Safe Exploration for Interactive Machine LearningMatteo Turchetta, Felix Berkenkamp, Andreas Krause 0001. 2887-2897 [doi]

Addressing Failure Prediction by Learning Model ConfidenceCharles Corbière, Nicolas Thome, Avner Bar-Hen, Matthieu Cord, Patrick Pérez. 2898-2909 [doi]

Combinatorial Bayesian Optimization using the Graph Cartesian ProductChangYong Oh, Jakub M. Tomczak, Efstratios Gavves, Max Welling. 2910-2920 [doi]

Fooling Neural Network Interpretations via Adversarial Model ManipulationJuyeon Heo, Sunghwan Joo, Taesup Moon. 2921-2932 [doi]

On Lazy Training in Differentiable ProgrammingLénaïc Chizat, Edouard Oyallon, Francis Bach. 2933-2943 [doi]

Quality Aware Generative Adversarial NetworksParimala Kancharla, Sumohana S. Channappayya. 2944-2954 [doi]

Copula-like Variational InferenceMarcel Hirt, Petros Dellaportas, Alain Durmus. 2955-2967 [doi]

Implicit Regularization for Optimal Sparse RecoveryTomas Vaskevicius, Varun Kanade, Patrick Rebeschini. 2968-2979 [doi]

Locally Private Gaussian EstimationMatthew Joseph, Janardhan Kulkarni, Jieming Mao, Steven Z. Wu. 2980-2989 [doi]

Multi-mapping Image-to-Image Translation via Learning DisentanglementXiaoming Yu, Yuanqi Chen, Shan Liu, Thomas H. Li, Ge Li. 2990-2999 [doi]

Spatially Aggregated Gaussian Processes with Multivariate Areal OutputsYusuke Tanaka 0002, Toshiyuki Tanaka, Tomoharu Iwata, Takeshi Kurashima, Maya Okawa, Yasunori Akagi, Hiroyuki Toda. 3000-3010 [doi]

Fast Structured Decoding for Sequence ModelsZhiqing Sun, Zhuohan Li, Haoqing Wang, Di He, Zi Lin, Zhi-Hong Deng. 3011-3020 [doi]

Learning Temporal Pose Estimation from Sparsely-Labeled VideosGedas Bertasius, Christoph Feichtenhofer, Du Tran, Jianbo Shi, Lorenzo Torresani. 3021-3032 [doi]

Putting An End to End-to-End: Gradient-Isolated Learning of RepresentationsSindy Löwe, Peter O'Connor, Bastiaan S. Veeling. 3033-3045 [doi]

Scalable Gromov-Wasserstein Learning for Graph Partitioning and MatchingHongteng Xu, Dixin Luo, Lawrence Carin. 3046-3056 [doi]

Meta-Reinforced Synthetic Data for One-Shot Fine-Grained Visual RecognitionSatoshi Tsutsui, Yanwei Fu, David J. Crandall. 3057-3066 [doi]

Real-Time Reinforcement LearningSimon Ramstedt, Chris Pal. 3067-3076 [doi]

Robust Multi-agent Counterfactual PredictionAlexander Peysakhovich, Christian Kroer, Adam Lerer. 3077-3087 [doi]

Approximate Inference Turns Deep Networks into Gaussian ProcessesMohammad Emtiyaz Khan, Alexander Immer, Ehsan Abedi, Maciej Korzepa. 3088-3098 [doi]

Deep Signature TransformsPatrick Kidger, Patric Bonnier, Imanol Perez Arribas, Cristopher Salvi, Terry Lyons. 3099-3109 [doi]

Individual Regret in Cooperative Nonstochastic Multi-Armed BanditsYogev Bar-On, Yishay Mansour. 3110-3120 [doi]

Convergent Policy Optimization for Safe Reinforcement LearningMing Yu, Zhuoran Yang, Mladen Kolar, Zhaoran Wang. 3121-3133 [doi]

Augmented Neural ODEsEmilien Dupont, Arnaud Doucet, Yee Whye Teh. 3134-3144 [doi]

Thompson Sampling for Multinomial Logit Contextual BanditsMin-hwan Oh, Garud Iyengar. 3145-3155 [doi]

Backpropagation-Friendly EigendecompositionWei Wang 0108, Zheng Dang, Yinlin Hu, Pascal Fua, Mathieu Salzmann. 3156-3164 [doi]

FastSpeech: Fast, Robust and Controllable Text to SpeechYi Ren, Yangjun Ruan, Xu Tan, Tao Qin, Sheng Zhao, Zhou Zhao, Tie-Yan Liu. 3165-3174 [doi]

Ultrametric Fitting by Gradient DescentGiovanni Chierchia, Benjamin Perret. 3175-3186 [doi]

Distinguishing Distributions When Samples Are Strategically TransformedHanrui Zhang, Yu Cheng 0002, Vincent Conitzer. 3187-3195 [doi]

Implicit Regularization of Discrete Gradient Dynamics in Linear Neural NetworksGauthier Gidel, Francis Bach, Simon Lacoste-Julien. 3196-3206 [doi]

Deep Set Prediction NetworksYan Zhang, Jonathon S. Hare, Adam Prügel-Bennett. 3207-3217 [doi]

DppNet: Approximating Determinantal Point Processes with Deep NetworksZelda E. Mariet, Yaniv Ovadia, Jasper Snoek. 3218-3229 [doi]

Efficient Communication in Multi-Agent Reinforcement Learning via Variance Based ControlSai Qian Zhang, Qi Zhang, Jieyu Lin. 3230-3239 [doi]

Neural Lyapunov ControlYa-Chien Chang, Nima Roohi, Sicun Gao. 3240-3249 [doi]

Fully Dynamic Consistent Facility LocationVincent Cohen-Addad, Niklas Hjuler, Nikos Parotsidis, David Saulpic, Chris Schwiegelshohn. 3250-3260 [doi]

SuperGLUE: A Stickier Benchmark for General-Purpose Language Understanding SystemsAlex Wang, Yada Pruksachatkun, Nikita Nangia, Amanpreet Singh, Julian Michael, Felix Hill, Omer Levy, Samuel R. Bowman. 3261-3275 [doi]

A Flexible Generative Framework for Graph-based Semi-supervised LearningJiaqi Ma, Weijing Tang, Ji Zhu, Qiaozhu Mei. 3276-3285 [doi]

Inherent Weight Normalization in Stochastic Neural NetworksGeorgios Detorakis, Sourav Dutta, Abhishek Khanna, Matthew Jerry, Suman Datta, Emre Neftci. 3286-3297 [doi]

Optimal Decision Tree with Noisy OutcomesSu Jia, Viswanath Nagarajan, Fatemeh Navidi, R. Ravi. 3298-3308 [doi]

Meta-CurvatureEunbyung Park, Junier B. Oliva. 3309-3319 [doi]

Intrinsically Efficient, Stable, and Bounded Off-Policy Evaluation for Reinforcement LearningNathan Kallus, Masatoshi Uehara. 3320-3329 [doi]

KerGM: Kernelized Graph MatchingZhen Zhang 0007, Yijian Xiang, Lingfei Wu, Bing Xue, Arye Nehorai. 3330-3341 [doi]

Transfusion: Understanding Transfer Learning for Medical ImagingMaithra Raghu, Chiyuan Zhang, Jon M. Kleinberg, Samy Bengio. 3342-3352 [doi]

Adversarial training for free!Ali Shafahi, Mahyar Najibi, Amin Ghiasi, Zheng Xu 0002, John P. Dickerson, Christoph Studer, Larry S. Davis, Gavin Taylor, Tom Goldstein. 3353-3364 [doi]

Communication-Efficient Distributed Learning via Lazily Aggregated Quantized GradientsJun Sun, Tianyi Chen, Georgios B. Giannakis, Zaiyue Yang. 3365-3375 [doi]

Implicitly learning to reason in first-order logicVaishak Belle, Brendan Juba. 3376-3386 [doi]

Kernel-Based Approaches for Sequence Modeling: Connections to Neural MethodsKevin J. Liang, Guoyin Wang, Yitong Li, Ricardo Henao, Lawrence Carin. 3387-3398 [doi]

PC-Fairness: A Unified Framework for Measuring Causality-based FairnessYongkai Wu, Lu Zhang 0021, Xintao Wu, Hanghang Tong. 3399-3409 [doi]

Arbicon-Net: Arbitrary Continuous Geometric Transformation Networks for Image RegistrationJianchun Chen, Lingjing Wang, Xiang Li, Yi Fang. 3410-3420 [doi]

Assessing Disparate Impact of Personalized Interventions: Identifiability and BoundsNathan Kallus, Angela Zhou. 3421-3432 [doi]

The Fairness of Risk Scores Beyond Classification: Bipartite Ranking and the XAUC MetricNathan Kallus, Angela Zhou. 3433-3443 [doi]

HYPE: A Benchmark for Human eYe Perceptual Evaluation of Generative ModelsSharon Zhou, Mitchell L. Gordon, Ranjay Krishna, Austin Narcomey, Li F. Fei-Fei, Michael Bernstein. 3444-3456 [doi]

First order expansion of convex regularized estimatorsPierre C. Bellec, Arun K. Kuchibhotla. 3457-3468 [doi]

Capacity Bounded Differential PrivacyKamalika Chaudhuri, Jacob Imola, Ashwin Machanavajjhala. 3469-3478 [doi]

Universal Boosting Variational InferenceTrevor Campbell, Xinglong Li. 3479-3490 [doi]

SGD on Neural Networks Learns Functions of Increasing ComplexityDimitris Kalimeris, Gal Kaplun, Preetum Nakkiran, Benjamin L. Edelman, Tristan Yang, Boaz Barak, Haofeng Zhang. 3491-3501 [doi]

The Landscape of Non-convex Empirical Risk with Degenerate Population RiskShuang Li 0003, Gongguo Tang, Michael B. Wakin. 3502-3512 [doi]

Making AI Forget You: Data Deletion in Machine LearningAntonio Ginart, Melody Y. Guan, Gregory Valiant, James Zou. 3513-3526 [doi]

Practical Differentially Private Top-k Selection with Pay-what-you-get CompositionDavid Durfee, Ryan M. Rogers. 3527-3537 [doi]

Conformalized Quantile RegressionYaniv Romano, Evan Patterson, Emmanuel J. Candès. 3538-3548 [doi]

Thompson Sampling with Information Relaxation PenaltiesSeungki Min, Costis Maglaras, Ciamac C. Moallemi. 3549-3558 [doi]

Deep Generalized Method of Moments for Instrumental Variable AnalysisAndrew Bennett, Nathan Kallus, Tobias Schnabel. 3559-3569 [doi]

Learning Sample-Specific Models with Low-Rank Personalized RegressionBenjamin J. Lengerich, Bryon Aragam, Eric P. Xing. 3570-3580 [doi]

Dancing to MusicHsin-Ying Lee, Xiaodong Yang, Ming-Yu Liu 0001, Ting-chun Wang, Yu-Ding Lu, Ming-Hsuan Yang, Jan Kautz. 3581-3591 [doi]

Deconstructing Lottery Tickets: Zeros, Signs, and the SupermaskHattie Zhou, Janice Lan, Rosanne Liu, Jason Yosinski. 3592-3602 [doi]

Implicit Generation and Modeling with Energy Based ModelsYilun Du, Igor Mordatch. 3603-3613 [doi]

LCA: Loss Change Allocation for Neural Network TrainingJanice Lan, Rosanne Liu, Hattie Zhou, Jason Yosinski. 3614-3624 [doi]

Predicting the Politics of an Image Using Webly Supervised DataChristopher Thomas 0004, Adriana Kovashka. 3625-3637 [doi]

Adaptive GNN for Image Analysis and EditingLingyu Liang, Lianwen Jin, Yong Xu. 3638-3649 [doi]

Ultra Fast Medoid Identification via Correlated Sequential HalvingTavor Z. Baharav, David Tse. 3650-3659 [doi]

Tight Dimension Independent Lower Bound on the Expected Convergence Rate for Diminishing Step Sizes in SGDPhuong Ha Nguyen, Lam M. Nguyen, Marten van Dijk. 3660-3669 [doi]

Asymptotics for Sketching in Least Squares RegressionEdgar Dobriban, SiFan Liu. 3670-3680 [doi]

MCP: Learning Composable Hierarchical Control with Multiplicative Compositional PoliciesXue Bin Peng, Michael Chang 0003, Grace Zhang, Pieter Abbeel, Sergey Levine. 3681-3692 [doi]

Exact inference in structured predictionKevin Bello, Jean Honorio. 3693-3702 [doi]

Coda: An End-to-End Neural Program DecompilerCheng Fu, Huili Chen, Haolan Liu, Xinyun Chen, Yuandong Tian, Farinaz Koushanfar, Jishen Zhao. 3703-3714 [doi]

Bat-G net: Bat-inspired High-Resolution 3D Image Reconstruction using Ultrasonic EchoesGunpil Hwang, Seohyeon Kim, Hyeon-Min Bae. 3715-3726 [doi]

Painless Stochastic Gradient: Interpolation, Line-Search, and Convergence RatesSharan Vaswani, Aaron Mishkin, Issam H. Laradji, Mark Schmidt, Gauthier Gidel, Simon Lacoste-Julien. 3727-3740 [doi]

Scalable Structure Learning of Continuous-Time Bayesian Networks from Incomplete DataDominik Linzner, Michael Schmidt, Heinz Koeppl. 3741-3751 [doi]

Privacy-Preserving Classification of Personal Text Messages with Secure Multi-Party ComputationDevin Reich, Ariel Todoki, Rafael Dowsley, Martine De Cock, Anderson C. A. Nascimento. 3752-3764 [doi]

Efficiently Estimating Erdos-Renyi Graphs with Node Differential PrivacyJonathan Ullman, Adam Sealfon. 3765-3775 [doi]

Learning Representations for Time Series ClusteringQianli Ma, Jiawei Zheng, Sen Li, Gary W. Cottrell. 3776-3786 [doi]

Verified Uncertainty CalibrationAnanya Kumar, Percy Liang, Tengyu Ma. 3787-3798 [doi]

A Normative Theory for Causal Inference and Bayes Factor Computation in Neural CircuitsWenhao Zhang 0002, Si Wu, Brent Doiron, Tai Sing Lee. 3799-3808 [doi]

Unsupervised Keypoint Learning for Guiding Class-Conditional Video PredictionYunji Kim, Seonghyeon Nam, In Cho, Seon Joo Kim. 3809-3819 [doi]

Subspace Attack: Exploiting Promising Subspaces for Query-Efficient Black-box AttacksYiwen Guo, Ziang Yan, Changshui Zhang. 3820-3829 [doi]

Stochastic Gradient Hamiltonian Monte Carlo Methods with Recursive Variance ReductionDifan Zou, Pan Xu 0002, Quanquan Gu. 3830-3841 [doi]

Learning Latent Process from High-Dimensional Event Sequences via Efficient SamplingQitian Wu, Zixuan Zhang, Xiaofeng Gao, Junchi Yan, Guihai Chen. 3842-3851 [doi]

Cross-sectional Learning of Extremal Dependence among Financial AssetsXing Yan, Qi Wu, Wen Zhang. 3852-3862 [doi]

Principal Component Projection and Regression in Nearly Linear Time through Asymmetric SVRGYujia Jin, Aaron Sidford. 3863-3873 [doi]

Compression with Flows via Local Bits-Back CodingJonathan Ho, Evan Lohn, Pieter Abbeel. 3874-3883 [doi]

Exact Rate-Distortion in Autoencoders via Echo NoiseRob Brekelmans, Daniel Moyer, Aram Galstyan, Greg Ver Steeg. 3884-3895 [doi]

iSplit LBI: Individualized Partial Ranking with Ties via Split LBIQianqian Xu, Xinwei Sun 0001, Zhiyong Yang, Xiaochun Cao, Qingming Huang, Yuan Yao. 3896-3906 [doi]

Domes to Drones: Self-Supervised Active Triangulation for 3D Human Pose ReconstructionAleksis Pirinen, Erik Gärtner, Cristian Sminchisescu. 3907-3917 [doi]

MetaQuant: Learning to Quantize by Learning to Penetrate Non-differentiable QuantizationShangyu Chen, Wenya Wang, Sinno Jialin Pan. 3918-3928 [doi]

Improved Precision and Recall Metric for Assessing Generative ModelsTuomas Kynkäänniemi, Tero Karras, Samuli Laine, Jaakko Lehtinen, Timo Aila. 3929-3938 [doi]

A First-Order Algorithmic Framework for Distributionally Robust Logistic RegressionJiajin Li, Sen Huang, Anthony Man-Cho So. 3939-3949 [doi]

PasteGAN: A Semi-Parametric Method to Generate Image from Scene GraphYikang Li, Tao Ma, Yeqi Bai, Nan Duan, Sining Wei, Xiaogang Wang. 3950-3960 [doi]

Handling correlated and repeated measurements with the smoothed multivariate square-root LassoQuentin Bertrand, Mathurin Massias, Alexandre Gramfort, Joseph Salmon. 3961-3972 [doi]

Joint Optimization of Tree-based Index and Deep Model for Recommender SystemsHan Zhu, Daqing Chang, Ziru Xu, Pengye Zhang, Xiang Li, Jie He, Han Li, Jian Xu, Kun Gai. 3973-3982 [doi]

Learning Generalizable Device Placement Algorithms for Distributed Machine LearningRavichandra Addanki, Shaileshh Bojja Venkatakrishnan, Shreyan Gupta, Hongzi Mao, Mohammad Alizadeh. 3983-3993 [doi]

Uncoupled Regression from Pairwise Comparison DataLiyuan Xu, Junya Honda, Gang Niu, Masashi Sugiyama. 3994-4004 [doi]

Cross Attention Network for Few-shot ClassificationRuibing Hou, Hong Chang, Bingpeng Ma, Shiguang Shan, Xilin Chen. 4005-4016 [doi]

A Nonconvex Approach for Exact and Efficient Multichannel Sparse Blind DeconvolutionQing Qu, Xiao Li, Zhihui Zhu. 4017-4028 [doi]

SCAN: A Scalable Neural Networks Framework Towards Compact and Efficient ModelsLinfeng Zhang, Zhanhong Tan, Jiebo Song, Jingwei Chen, Chenglong Bao, Kaisheng Ma. 4029-4038 [doi]

Revisiting the Bethe-Hessian: Improved Community Detection in Sparse Heterogeneous GraphsLorenzo Dall'Amico, Romain Couillet, Nicolas Tremblay. 4039-4049 [doi]

Teaching Multiple Concepts to a Forgetful LearnerAnette Hunziker, Yuxin Chen 0001, Oisin Mac Aodha, Manuel Gomez-Rodriguez, Andreas Krause 0001, Pietro Perona, Yisong Yue, Adish Singla. 4050-4060 [doi]

Regularized Weighted Low Rank ApproximationFrank Ban, David P. Woodruff, Richard Zhang. 4061-4071 [doi]

Practical and Consistent Estimation of f-DivergencesPaul K. Rubenstein, Olivier Bousquet, Josip Djolonga, Carlos Riquelme, Ilya O. Tolstikhin. 4072-4082 [doi]

Approximation Ratios of Graph Neural Networks for Combinatorial ProblemsRyoma Sato, Makoto Yamada, Hisashi Kashima. 4083-4092 [doi]

Thinning for Accelerating the Learning of Point ProcessesTianbo Li, Yiping Ke. 4093-4103 [doi]

A Prior of a Googol Gaussians: a Tensor Ring Induced Prior for Generative ModelsMaxim Kuznetsov, Daniil Polykovskiy, Dmitry P. Vetrov, Alexander Zhebrak. 4104-4114 [doi]

Differentially Private Markov Chain Monte CarloMikko A. Heikkilä, Joonas Jälkö, Onur Dikmen, Antti Honkela. 4115-4125 [doi]

Full-Gradient Representation for Neural Network VisualizationSuraj Srinivas, François Fleuret. 4126-4135 [doi]

q-means: A quantum algorithm for unsupervised machine learningIordanis Kerenidis, Jonas Landman, Alessandro Luongo, Anupam Prakash. 4136-4146 [doi]

Learner-aware Teaching: Inverse Reinforcement Learning with Preferences and ConstraintsSebastian Tschiatschek, Ahana Ghosh, Luis Haug, Rati Devidze, Adish Singla. 4147-4157 [doi]

Limitations of the empirical Fisher approximation for natural gradient descentFrederik Kunstner, Philipp Hennig, Lukas Balles. 4158-4169 [doi]

Flow-based Image-to-Image Translation with Feature DisentanglementRuho Kondo, Keisuke Kawano, Satoshi Koide, Takuro Kutsuna. 4170-4180 [doi]

Learning dynamic polynomial proofsAlhussein Fawzi, Mateusz Malinowski, Hamza Fawzi, Omar Fawzi. 4181-4190 [doi]

Shape and Time Distortion Loss for Training Deep Time Series Forecasting ModelsVincent Le Guen, Nicolas Thome. 4191-4203 [doi]

Understanding Attention and Generalization in Graph Neural NetworksBoris Knyazev, Graham W. Taylor, Mohamed R. Amer. 4204-4214 [doi]

Data Cleansing for Models Trained with SGDSatoshi Hara, Atsushi Nitanda, Takanori Maehara. 4215-4224 [doi]

Curvilinear Distance Metric LearningShuo Chen 0003, Lei Luo, Jian Yang 0003, Chen Gong 0002, Jun Li, Heng Huang. 4225-4234 [doi]

Embedding Symbolic Knowledge into Deep NetworksYaqi Xie, Ziwei Xu, Kuldeep Meel, Mohan S. Kankanhalli, Harold Soh. 4235-4245 [doi]

Modeling Uncertainty by Learning a Hierarchy of Deep Neural ConnectionsRaanan Y. Yehezkel Rohekar, Yaniv Gurwicz, Shami Nisimov, Gal Novik. 4246-4256 [doi]

Efficient Graph Generation with Graph Recurrent Attention NetworksRenjie Liao, Yujia Li, Yang Song, Shenlong Wang, William L. Hamilton, David Duvenaud, Raquel Urtasun, Richard S. Zemel. 4257-4267 [doi]

Beyond Alternating Updates for Matrix Factorization with Inertial Bregman Proximal Gradient AlgorithmsMahesh Chandra Mukkamala, Peter Ochs. 4268-4278 [doi]

Learning Deep Bilinear Transformation for Fine-grained Image RepresentationHeliang Zheng, Jianlong Fu, Zheng-Jun Zha, Jiebo Luo. 4279-4288 [doi]

Practical Deep Learning with Bayesian PrinciplesKazuki Osawa, Siddharth Swaroop, Mohammad Emtiyaz Khan, Anirudh Jain, Runa Eschenhagen, Richard E. Turner, Rio Yokota. 4289-4301 [doi]

Training Language GANs from ScratchCyprien de Masson d'Autume, Shakir Mohamed, Mihaela Rosca, Jack W. Rae. 4302-4313 [doi]

Pseudo-Extended Markov chain Monte CarloChristopher Nemeth, Fredrik Lindsten, Maurizio Filippone, James Hensman. 4314-4324 [doi]

Differentially Private Bagging: Improved utility and cheaper privacy than subsample-and-aggregateJames Jordon, Jinsung Yoon, Mihaela van der Schaar. 4325-4334 [doi]

Propagating Uncertainty in Reinforcement Learning via Wasserstein BarycentersAlberto Maria Metelli, Amarildo Likmeta, Marcello Restelli. 4335-4347 [doi]

On Adversarial Mixup ResynthesisChristopher Beckham, Sina Honari, Vikas Verma, Alex Lamb, Farnoosh Ghadiri, R. Devon Hjelm, Yoshua Bengio, Chris Pal. 4348-4359 [doi]

A Geometric Perspective on Optimal Representations for Reinforcement LearningMarc G. Bellemare, Will Dabney, Robert Dadashi, Adrien Ali Taïga, Pablo Samuel Castro, Nicolas Le Roux, Dale Schuurmans, Tor Lattimore, Clare Lyle. 4360-4371 [doi]

Learning New Tricks From Old Dogs: Multi-Source Transfer Learning From Pre-Trained NetworksJoshua Lee, Prasanna Sattigeri, Gregory W. Wornell. 4372-4382 [doi]

Understanding and Improving Layer NormalizationJingjing Xu, Xu Sun 0001, Zhiyuan Zhang, Guangxiang Zhao, Junyang Lin. 4383-4393 [doi]

Uncertainty-based Continual Learning with Adaptive RegularizationHongjoon Ahn, Sungmin Cha, Donggyu Lee, Taesup Moon. 4394-4404 [doi]

LIIR: Learning Individual Intrinsic Reward in Multi-Agent Reinforcement LearningYali Du, Lei Han, Meng Fang, Ji Liu, Tianhong Dai, Dacheng Tao. 4405-4416 [doi]

U-Time: A Fully Convolutional Network for Time Series Segmentation Applied to Sleep StagingMathias Perslev, Michael Jensen, Sune Darkner, Poul Jørgen Jennum, Christian Igel. 4417-4428 [doi]

Massively scalable Sinkhorn distances via the Nyström methodJason Altschuler, Francis Bach, Alessandro Rudi, Jonathan Niles-Weed. 4429-4439 [doi]

Double Quantization for Communication-Efficient Distributed OptimizationYue Yu, Jiaxiang Wu, Longbo Huang. 4440-4451 [doi]

Globally optimal score-based learning of directed acyclic graphs in high-dimensionsBryon Aragam, Arash A. Amini, Qing Zhou. 4452-4464 [doi]

Multi-relational Poincaré Graph EmbeddingsIvana Balazevic, Carl Allen, Timothy M. Hospedales. 4465-4475 [doi]

No-Press Diplomacy: Modeling Multi-Agent GameplayPhilip Paquette, Yuchen Lu, Steven Bocco, Max O. Smith, Satya Ortiz-Gagne, Jonathan K. Kummerfeld, Joelle Pineau, Satinder Singh, Aaron C. Courville. 4476-4487 [doi]

State Aggregation Learning from Markov Transition DataYaqi Duan, Zheng Tracy Ke, Mengdi Wang. 4488-4497 [doi]

Disentangling Influence: Using disentangled representations to audit model predictionsCharles T. Marx, Richard L. Phillips, Sorelle A. Friedler, Carlos Scheidegger, Suresh Venkatasubramanian. 4498-4508 [doi]

Successor Uncertainties: Exploration and Uncertainty in Temporal Difference LearningDavid Janz, Jiri Hron, Przemyslaw Mazur, Katja Hofmann, José Miguel Hernández-Lobato, Sebastian Tschiatschek. 4509-4518 [doi]

Partially Encrypted Deep Learning using Functional EncryptionTheo Ryffel, David Pointcheval, Francis Bach, Edouard Dufour Sans, Romain Gay. 4519-4530 [doi]

Decentralized Cooperative Stochastic BanditsDavid Martínez-Rubio, Varun Kanade, Patrick Rebeschini. 4531-4542 [doi]

Statistical bounds for entropic optimal transport: sample complexity and the central limit theoremGonzalo Mena, Jonathan Niles-Weed. 4543-4553 [doi]

Efficient Deep Approximation of GMMsShirin Jalali, Carl J. Nuzman, Iraj Saniee. 4554-4562 [doi]

Learning low-dimensional state embeddings and metastable clusters from time series dataYifan Sun, Yaqi Duan, Hao Gong, Mengdi Wang. 4563-4572 [doi]

Exploiting Local and Global Structure for Point Cloud Semantic Segmentation with Contextual Point RepresentationsXu Wang, Jingming He, Lin Ma. 4573-4583 [doi]

Scalable Bayesian dynamic covariance modeling with variational Wishart and inverse Wishart processesCreighton Heaukulani, Mark van der Wilk. 4584-4594 [doi]

Kernel Instrumental Variable RegressionRahul Singh, Maneesh Sahani, Arthur Gretton. 4595-4607 [doi]

Symmetry-Based Disentangled Representation Learning requires Interaction with EnvironmentsHugo Caselles-Dupré, Michaël Garcia Ortiz, David Filliat. 4608-4617 [doi]

Fast Efficient Hyperparameter Tuning for Policy Gradient MethodsSupratik Paul, Vitaly Kurin, Shimon Whiteson. 4618-4628 [doi]

Offline Contextual Bayesian OptimizationIan Char, Youngseog Chung, Willie Neiswanger, Kirthevasan Kandasamy, Oak Nelson, Mark Boyer, Egemen Kolemen. 4629-4640 [doi]

Making the Cut: A Bandit-based Approach to Tiered InterviewingCandice Schumann, Zhi Lang, Jeffrey S. Foster, John P. Dickerson. 4641-4651 [doi]

Unsupervised Scalable Representation Learning for Multivariate Time SeriesJean-Yves Franceschi, Aymeric Dieuleveut, Martin Jaggi. 4652-4663 [doi]

A state-space model for inferring effective connectivity of latent neural dynamics from simultaneous EEG/fMRITao Tu, John Paisley, Stefan Haufe, Paul Sajda. 4664-4673 [doi]

End to end learning and optimization on graphsBryan Wilder, Eric Ewing, Bistra Dilkina, Milind Tambe. 4674-4685 [doi]

Game Design for Eliciting Distinguishable BehaviorFan Yang, Liu Leqi, Yifan Wu, Zachary Chase Lipton, Pradeep Ravikumar, Tom M. Mitchell, William W. Cohen. 4686-4695 [doi]

When does label smoothing help?Rafael Müller, Simon Kornblith, Geoffrey E. Hinton. 4696-4705 [doi]

Finite-Time Performance Bounds and Adaptive Learning Rate Selection for Two Time-Scale Reinforcement LearningHarsh Gupta, R. Srikant 0001, Lei Ying. 4706-4715 [doi]

Rethinking Deep Neural Network Ownership Verification: Embedding Passports to Defeat Ambiguity AttacksLixin Fan, KamWoh Ng, Chee Seng Chan. 4716-4725 [doi]

Scalable Spike Source Localization in Extracellular Recordings using Amortized Variational InferenceCole L. Hurwitz, Kai Xu, Akash Srivastava, Alessio Paolo Buccino, Matthias Hennig. 4726-4738 [doi]

Optimal Sketching for Kronecker Product Regression and Low Rank ApproximationHuaian Diao, Rajesh Jayaram, Zhao Song, Wen Sun, David P. Woodruff. 4739-4750 [doi]

Distribution-Independent PAC Learning of Halfspaces with Massart NoiseIlias Diakonikolas, Themis Gouleakis, Christos Tzamos. 4751-4762 [doi]

The Convergence Rate of Neural Networks for Learned Functions of Different FrequenciesRonen Basri, David W. Jacobs, Yoni Kasten, Shira Kritchman. 4763-4772 [doi]

Adaptive Auxiliary Task Weighting for Reinforcement LearningXingyu Lin, Harjatin Singh Baweja, George Kantor, David Held. 4773-4784 [doi]

Blocking BanditsSoumya Basu, Rajat Sen, Sujay Sanghavi, Sanjay Shakkottai. 4785-4794 [doi]

Global Convergence of Least Squares EM for Demixing Two Log-Concave DensitiesWei Qian, Yuqian Zhang, Yudong Chen. 4795-4803 [doi]

Prior-Free Dynamic Auctions with Low Regret BuyersYuan Deng, Jon Schneider, Balasubramanian Sivan. 4804-4814 [doi]

On Single Source Robustness in Deep Fusion ModelsTaewan Kim, Joydeep Ghosh. 4815-4826 [doi]

Policy Evaluation with Latent Confounders via Optimal BalanceAndrew Bennett, Nathan Kallus. 4827-4837 [doi]

Think Globally, Act Locally: A Deep Neural Network Approach to High-Dimensional Time Series ForecastingRajat Sen, Hsiang-Fu Yu, Inderjit S. Dhillon. 4838-4847 [doi]

Adaptive Cross-Modal Few-shot LearningChen Xing, Negar Rostamzadeh, Boris N. Oreshkin, Pedro O. Pinheiro. 4848-4858 [doi]

Spectral Modification of Graphs for Improved Spectral ClusteringIoannis Koutis, Huong Le. 4859-4868 [doi]

Hyperbolic Graph Convolutional Neural NetworksInes Chami, Zhitao Ying, Christopher Ré, Jure Leskovec. 4869-4880 [doi]

Cost Effective Active SearchShali Jiang, Roman Garnett, Benjamin Moseley. 4881-4890 [doi]

Exploration Bonus for Regret Minimization in Discrete and Continuous Average Reward MDPsJian Qian, Ronan Fruit, Matteo Pirotta, Alessandro Lazaric. 4891-4900 [doi]

Hybrid 8-bit Floating Point (HFP8) Training and Inference for Deep Neural NetworksXiao Sun, Jungwook Choi, Chia-Yu Chen, Naigang Wang, Swagath Venkataramani, Vijayalakshmi Srinivasan, Xiaodong Cui, Wei Zhang, Kailash Gopalakrishnan. 4901-4910 [doi]

Tight Certificates of Adversarial Robustness for Randomly Smoothed ClassifiersGuang-He Lee, Yang Yuan, Shiyu Chang, Tommi S. Jaakkola. 4911-4922 [doi]

Poisson-Minibatching for Gibbs Sampling with Convergence Rate GuaranteesRuqi Zhang, Christopher De Sa. 4923-4932 [doi]

One ticket to win them all: generalizing lottery ticket initializations across datasets and optimizersAri S. Morcos, Haonan Yu, Michela Paganini, Yuandong Tian. 4933-4943 [doi]

Breaking the Glass Ceiling for Embedding-Based Classifiers for Large Output SpacesChuan Guo, Ali Mousavi, Xiang Wu, Daniel Niels Holtmann-Rice, Satyen Kale, Sashank J. Reddi, Sanjiv Kumar. 4944-4954 [doi]

Fair Algorithms for ClusteringSuman Kalyan Bera, Deeparnab Chakrabarty, Nicolas Flores, Maryam Negahbani. 4955-4966 [doi]

Learning Mean-Field GamesXin Guo, Anran Hu, Renyuan Xu, Junzi Zhang. 4967-4977 [doi]

SpArSe: Sparse Architecture Search for CNNs on Resource-Constrained MicrocontrollersIgor Fedorov, Ryan P. Adams, Matthew Mattina, Paul N. Whatmough. 4978-4990 [doi]

Deep imitation learning for molecular inverse problemsEric Jonas. 4991-5001 [doi]

Visual Concept-Metaconcept LearningChi Han, Jiayuan Mao, Chuang Gan, Josh Tenenbaum, Jiajun Wu 0001. 5002-5013 [doi]

Few-shot Video-to-Video SynthesisTing-chun Wang, Ming-Yu Liu 0001, Andrew Tao, Guilin Liu, Bryan Catanzaro, Jan Kautz. 5014-5025 [doi]

Neural Similarity LearningWeiyang Liu, Zhen Liu, James M. Rehg, Le Song. 5026-5037 [doi]

Ordered MemoryYikang Shen, Shawn Tan, Seyed Arian Hosseini, Zhouhan Lin, Alessandro Sordoni, Aaron C. Courville. 5038-5049 [doi]

MixMatch: A Holistic Approach to Semi-Supervised LearningDavid Berthelot, Nicholas Carlini, Ian J. Goodfellow, Nicolas Papernot, Avital Oliver, Colin Raffel. 5050-5060 [doi]

Multivariate Triangular Quantile Maps for Novelty DetectionJingjing Wang, Sun Sun, Yaoliang Yu. 5061-5072 [doi]

Fast Parallel Algorithms for Statistical Subset Selection ProblemsSharon Qian, Yaron Singer. 5073-5082 [doi]

PHYRE: A New Benchmark for Physical ReasoningAnton Bakhtin, Laurens van der Maaten, Justin Johnson 0001, Laura Gustafson, Ross B. Girshick. 5083-5094 [doi]

On the number of variables to use in principal component regressionJi Xu, Daniel J. Hsu. 5095-5104 [doi]

Factor Group-Sparse Regularization for Efficient Low-Rank Matrix RecoveryJicong Fan, Lijun Ding, Yudong Chen 0001, Madeleine Udell. 5105-5115 [doi]

Mutually Regressive Point ProcessesIfigeneia Apostolopoulou, Scott Linderman, Kyle Miller, Artur Dubrawski. 5116-5127 [doi]

Data-driven Estimation of Sinusoid FrequenciesGautier Izacard, Sreyas Mohan, Carlos Fernandez-Granda. 5128-5138 [doi]

E2-Train: Training State-of-the-art CNNs with Over 80% Energy SavingsYue Wang, Ziyu Jiang, Xiaohan Chen, Pengfei Xu 0011, Yang Zhao, Yingyan Lin, Zhangyang Wang. 5139-5151 [doi]

ANODEV2: A Coupled Neural ODE FrameworkTianjun Zhang, Zhewei Yao, Amir Gholami, Joseph E. Gonzalez, Kurt Keutzer, Michael W. Mahoney, George Biros. 5152-5162 [doi]

Estimating Entropy of Distributions in Constant SpaceJayadev Acharya, Sourbh Bhadane, Piotr Indyk, Ziteng Sun. 5163-5174 [doi]

On the Utility of Learning about Humans for Human-AI CoordinationMicah Carroll, Rohin Shah, Mark K. Ho, Tom Griffiths, Sanjit A. Seshia, Pieter Abbeel, Anca D. Dragan. 5175-5186 [doi]

Efficient Regret Minimization Algorithm for Extensive-Form Correlated EquilibriumGabriele Farina, Chun Kai Ling, Fei Fang, Tuomas Sandholm. 5187-5197 [doi]

Learning in Generalized Linear Contextual Bandits with Stochastic DelaysZhengyuan Zhou, Renyuan Xu, Jose Blanchet. 5198-5209 [doi]

Empirically Measuring Concentration: Fundamental Limits on Intrinsic RobustnessSaeed Mahloujifar, Xiao Zhang, Mohammad Mahmoody, David Evans 0001. 5210-5221 [doi]

Optimistic Regret Minimization for Extensive-Form Games via Dilated Distance-Generating FunctionsGabriele Farina, Christian Kroer, Tuomas Sandholm. 5222-5232 [doi]

Learning Non-Convergent Non-Persistent Short-Run MCMC Toward Energy-Based ModelErik Nijkamp, Mitch Hill, Song Chun Zhu, Ying Nian Wu. 5233-5243 [doi]

Enhancing the Locality and Breaking the Memory Bottleneck of Transformer on Time Series ForecastingShiyang Li, Xiaoyong Jin, Yao Xuan, Xiyou Zhou, Wenhu Chen, Yu-Xiang Wang, Xifeng Yan. 5244-5254 [doi]

On the Accuracy of Influence Functions for Measuring Group EffectsPang Wei Koh, Kai-Siang Ang, Hubert H. K. Teo, Percy Liang. 5255-5265 [doi]

Face Reconstruction from Voice using Generative Adversarial NetworksYanDong Wen, Bhiksha Raj, Rita Singh. 5266-5275 [doi]

Incremental Few-Shot Learning with Attention Attractor NetworksMengye Ren, Renjie Liao, Ethan Fetaya, Richard S. Zemel. 5276-5286 [doi]

On Testing for Biases in Peer ReviewIvan Stelmakh, Nihar B. Shah, Aarti Singh. 5287-5297 [doi]

Learning Disentangled Representation for Robust Person Re-identificationChanho Eom, Bumsub Ham. 5298-5309 [doi]

Balancing Efficiency and Fairness in On-Demand RidesourcingNixie S. Lesmana, Xuan Zhang, Xiaohui Bei. 5310-5320 [doi]

Latent Ordinary Differential Equations for Irregularly-Sampled Time SeriesYulia Rubanova, Tian Qi Chen, David Duvenaud. 5321-5331 [doi]

Deep RGB-D Canonical Correlation Analysis For Sparse Depth CompletionYiqi Zhong, Cho-Ying Wu, Suya You, Ulrich Neumann. 5332-5342 [doi]

Input Similarity from the Neural Network PerspectiveGuillaume Charpiat, Nicolas Girard, Loris Felardos, Yuliya Tarabalka. 5343-5352 [doi]

Adaptive Sequence SubmodularityMarko Mitrovic, Ehsan Kazemi 0001, Moran Feldman, Andreas Krause 0001, Amin Karbasi. 5353-5364 [doi]

Weight Agnostic Neural NetworksAdam Gaier, David Ha. 5365-5379 [doi]

Learning to Predict Without Looking Ahead: World Models Without Forward PredictionC. Daniel Freeman, David Ha, Luke Metz. 5380-5391 [doi]

Reducing the variance in online optimization by transporting past gradientsSébastien M. R. Arnold, Pierre-Antoine Manzagol, Reza Babanezhad, Ioannis Mitliagkas, Nicolas Le Roux. 5392-5403 [doi]

Characterizing Bias in Classifiers using Generative ModelsDaniel J. McDuff, Shuang Ma, Yale Song, Ashish Kapoor. 5404-5415 [doi]

Optimal Stochastic and Online Learning with Individual IteratesYunwen Lei, Peng Yang 0008, Ke Tang, Ding-Xuan Zhou. 5416-5426 [doi]

Policy Learning for Fairness in RankingAshudeep Singh, Thorsten Joachims. 5427-5437 [doi]

Off-Policy Evaluation via Off-Policy ClassificationAlexander Irpan, Kanishka Rao, Konstantinos Bousmalis, Chris Harris, Julian Ibarz, Sergey Levine. 5438-5449 [doi]

Regularized Gradient BoostingCorinna Cortes, Mehryar Mohri, Dmitry Storcheus. 5450-5459 [doi]

Efficient Probabilistic Inference in the Quest for Physics Beyond the Standard ModelAtilim Gunes Baydin, Lei Shao, Wahid Bhimji, Lukas Heinrich, Saeid Naderiparizi, Andreas Munk, Jialin Liu 0002, Bradley Gram-Hansen, Gilles Louppe, Lawrence Meadows, Philip H. S. Torr, Victor W. Lee, Kyle Cranmer, Prabhat, Frank Wood. 5460-5473 [doi]

Markov Random Fields for Collaborative FilteringHarald Steck. 5474-5485 [doi]

A Step Toward Quantifying Independently Reproducible Machine Learning ResearchEdward Raff. 5486-5496 [doi]

Scalable Global Optimization via Local Bayesian OptimizationDavid Eriksson, Michael Pearce, Jacob R. Gardner, Ryan Turner, Matthias Poloczek. 5497-5508 [doi]

Time-series Generative Adversarial NetworksJinsung Yoon, Daniel Jarrett, Mihaela van der Schaar. 5509-5519 [doi]

Ouroboros: On Accelerating Training of Transformer-Based Language ModelsQian Yang, Zhouyuan Huo, Wenlin Wang, Lawrence Carin. 5520-5530 [doi]

A Refined Margin Distribution Analysis for Forest Representation LearningShen-Huan Lyu, Liang Yang, Zhi-Hua Zhou. 5531-5541 [doi]

Robustness to Adversarial Perturbations in Learning from Incomplete DataAmir Najafi, Shin-ichi Maeda, Masanori Koyama, Takeru Miyato. 5542-5552 [doi]

Exploring Unexplored Tensor Network Decompositions for Convolutional Neural NetworksKohei Hayashi, Taiki Yamaguchi, Yohei Sugawara, Shin-ichi Maeda. 5553-5563 [doi]

An Adaptive Empirical Bayesian Method for Sparse Deep LearningWei Deng, Xiao Zhang, Faming Liang, Guang Lin. 5564-5574 [doi]

Adaptive Influence Maximization with Myopic FeedbackBinghui Peng, Wei Chen. 5575-5584 [doi]

Focused Quantization for Sparse CNNsYiren Zhao, Xitong Gao, Daniel Bates, Robert Mullins, Cheng-Zhong Xu 0001. 5585-5594 [doi]

Quantum Embedding of Knowledge for ReasoningDinesh Garg, Shajith Ikbal, Santosh K. Srivastava, Harit Vishwakarma, Hima P. Karanam, L. Venkata Subramaniam. 5595-5605 [doi]

Optimal Best Markovian Arm Identification with Fixed ConfidenceVrettos Moulos. 5606-5615 [doi]

Limiting Extrapolation in Linear Approximate Value IterationAndrea Zanette, Alessandro Lazaric, Mykel J. Kochenderfer, Emma Brunskill. 5616-5625 [doi]

Almost Horizon-Free Structure-Aware Best Policy Identification with a Generative ModelAndrea Zanette, Mykel J. Kochenderfer, Emma Brunskill. 5626-5635 [doi]

Invertible Convolutional FlowMahdi Karami, Dale Schuurmans, Jascha Sohl-Dickstein, Laurent Dinh, Daniel Duckworth. 5636-5646 [doi]

A Latent Variational Framework for Stochastic OptimizationPhilippe Casgrain. 5647-5657 [doi]

Topology-Preserving Deep Image SegmentationXiaoling Hu, Fuxin Li, Dimitris Samaras, Chao Chen. 5658-5669 [doi]

Connective Cognition Network for Directional Visual Commonsense ReasoningAming Wu, Linchao Zhu, Yahong Han, Yi Yang. 5670-5680 [doi]

Online Markov Decoding: Lower Bounds and Near-Optimal Approximation AlgorithmsVikas K. Garg, Tamar Pichkhadze. 5681-5691 [doi]

A Meta-MDP Approach to Exploration for Lifelong Reinforcement LearningFrancisco M. Garcia, Philip S. Thomas. 5692-5701 [doi]

Push-pull Feedback Implements Hierarchical Information Retrieval EfficientlyXiao Liu, Xiaolong Zou, Zilong Ji, Gengshuo Tian, Yuanyuan Mi, Tiejun Huang, K. Y. Michael Wong, Si Wu. 5702-5711 [doi]

Learning Disentangled Representations for RecommendationJianxin Ma, Chang Zhou, Peng Cui 0001, Hongxia Yang, Wenwu Zhu 0001. 5712-5723 [doi]

Graph Neural Tangent Kernel: Fusing Graph Neural Networks with Graph KernelsSimon S. Du, Kangcheng Hou, Ruslan Salakhutdinov, Barnabás Póczos, Ruosong Wang, Keyulu Xu. 5724-5734 [doi]

In-Place Zero-Space Memory Protection for CNNHui Guan, Lin Ning, Zhen Lin, Xipeng Shen, Huiyang Zhou, Seung-Hwan Lim. 5735-5744 [doi]

Acceleration via Symplectic Discretization of High-Resolution Differential EquationsBin Shi, Simon S. Du, Weijie J. Su, Michael I. Jordan. 5745-5753 [doi]

XLNet: Generalized Autoregressive Pretraining for Language UnderstandingZhilin Yang, Zihang Dai, Yiming Yang, Jaime G. Carbonell, Russlan Salakhutdinov, Quoc V. Le. 5754-5764 [doi]

Comparison Against Task Driven Artificial Neural Networks Reveals Functional Properties in Mouse Visual CortexJianghong Shi, Eric Shea-Brown, Michael A. Buice. 5765-5775 [doi]

Variance Reduced Policy Evaluation with Smooth Function ApproximationHoi-To Wai, Mingyi Hong, Zhuoran Yang, Zhaoran Wang, Kexin Tang. 5776-5787 [doi]

Learning GANs and Ensembles Using DiscrepancyBen Adlam, Corinna Cortes, Mehryar Mohri, Ningshan Zhang. 5788-5799 [doi]

Co-Generation with GANs using AIS based HMCTiantian Fang, Alexander G. Schwing. 5800-5811 [doi]

AttentionXML: Label Tree-based Attention-Aware Deep Model for High-Performance Extreme Multi-Label Text ClassificationRonghui You, Zihan Zhang, Ziye Wang, Suyang Dai, Hiroshi Mamitsuka, Shanfeng Zhu. 5812-5822 [doi]

Addressing Sample Complexity in Visual Tasks Using HER and Hallucinatory GANsHimanshu Sahni, Toby Buckley, Pieter Abbeel, Ilya Kuzovkin. 5823-5833 [doi]

Abstract Reasoning with Distracting FeaturesKecheng Zheng, Zheng-Jun Zha, Wei Wei. 5834-5845 [doi]

Generalized Block-Diagonal Structure Pursuit: Learning Soft Latent Task Assignment against Negative TransferZhiyong Yang, Qianqian Xu, Yangbangyan Jiang, Xiaochun Cao, Qingming Huang. 5846-5857 [doi]

Adversarial Training and Robustness for Multiple PerturbationsFlorian Tramèr, Dan Boneh. 5858-5868 [doi]

Doubly-Robust Lasso BanditGi-Soo Kim, Myunghee Cho Paik. 5869-5879 [doi]

DM2C: Deep Mixed-Modal ClusteringYangbangyan Jiang, Qianqian Xu, Zhiyong Yang, Xiaochun Cao, Qingming Huang. 5880-5890 [doi]

MaCow: Masked Convolutional Generative FlowXuezhe Ma, Xiang Kong, Shanghang Zhang, Eduard H. Hovy. 5891-5900 [doi]

Learning by Abstraction: The Neural State MachineDrew A. Hudson, Christopher D. Manning. 5901-5914 [doi]

Adaptive Gradient-Based Meta-Learning MethodsMikhail Khodak, Maria-Florina Balcan, Ameet S. Talwalkar. 5915-5926 [doi]

Equipping Experts/Bandits with Long-term MemoryKai Zheng, Haipeng Luo, Ilias Diakonikolas, Liwei Wang. 5927-5937 [doi]

A Regularized Approach to Sparse Optimal Policy in Reinforcement LearningWenhao Yang, Xiang Li, Zhihua Zhang. 5938-5948 [doi]

Scalable inference of topic evolution via models for latent geometric structuresMikhail Yurochkin, Zhiwei Fan, Aritra Guha, Paraschos Koutris, XuanLong Nguyen. 5949-5959 [doi]

Effective End-to-end Unsupervised Outlier Detection via Inlier Priority of Discriminative NetworkSiqi Wang, Yijie Zeng, Xinwang Liu, En Zhu, Jianping Yin, Chuanfu Xu, Marius Kloft. 5960-5973 [doi]

Deep Active Learning with a Neural Architecture SearchYonatan Geifman, Ran El-Yaniv. 5974-5984 [doi]

Efficiently escaping saddle points on manifoldsChris Criscitiello, Nicolas Boumal. 5985-5995 [doi]

AutoAssist: A Framework to Accelerate Training of Deep Neural NetworksJiong Zhang, Hsiang-Fu Yu, Inderjit S. Dhillon. 5996-6006 [doi]

DFNets: Spectral CNNs for Graphs with Feedback-Looped FiltersAsiri Wijesinghe, Qing Wang. 6007-6018 [doi]

Learning Dynamics of Attention: Human Prior for Interpretable Machine ReasoningWonjae Kim, Yoonho Lee. 6019-6030 [doi]

Comparing Unsupervised Word Translation Methods Step by StepMareike Hartmann, Yova Kementchedjhieva, Anders Søgaard. 6031-6041 [doi]

Learning from Bad Data via GenerationTianyu Guo, Chang Xu 0002, Boxin Shi, Chao Xu 0006, Dacheng Tao. 6042-6053 [doi]

Constrained deep neural network architecture search for IoT devices accounting for hardware calibrationFlorian Scheidegger, Luca Benini, Costas Bekas, A. Cristiano I. Malossi. 6054-6064 [doi]

Quantum Entropy Scoring for Fast Robust Mean Estimation and Improved Outlier DetectionYihe Dong, Samuel B. Hopkins, Jerry Li 0001. 6065-6075 [doi]

Iterative Least Trimmed Squares for Mixed Linear RegressionYanyao Shen, Sujay Sanghavi. 6076-6086 [doi]

Dynamic Ensemble Modeling Approach to Nonstationary Neural Decoding in Brain-Computer InterfacesYu Qi, Bin Liu, Yueming Wang, Gang Pan 0001. 6087-6096 [doi]

Divergence-Augmented Policy OptimizationQing Wang, Yingru Li, Jiechao Xiong, Tong Zhang. 6097-6108 [doi]

Intrinsic dimension of data representations in deep neural networksAlessio Ansuini, Alessandro Laio, Jakob H. Macke, Davide Zoccolan. 6109-6119 [doi]

Towards a Zero-One Law for Column Subset SelectionZhao Song, David P. Woodruff, Peilin Zhong. 6120-6131 [doi]

Compositional De-Attention NetworksYi Tay, Anh Tuan Luu, Aston Zhang, Shuohang Wang, Siu Cheung Hui. 6132-6142 [doi]

Dual Adversarial Semantics-Consistent Network for Generalized Zero-Shot LearningJian Ni, Shanghang Zhang, Haiyong Xie 0001. 6143-6154 [doi]

Learning and Generalization in Overparameterized Neural Networks, Going Beyond Two LayersZeyuan Allen Zhu, Yuanzhi Li, Yingyu Liang. 6155-6166 [doi]

Mining GOLD Samples for Conditional GANsSangwoo Mo, Chiheon Kim, Sungwoong Kim, Minsu Cho, Jinwoo Shin. 6167-6178 [doi]

Deep Model Transferability from Attribution MapsJie Song, Yixin Chen, Xinchao Wang, Chengchao Shen, Mingli Song. 6179-6189 [doi]

Fully Parameterized Quantile Function for Distributional Reinforcement LearningDerek Yang, Li Zhao, Zichuan Lin, Tao Qin, Jiang Bian 0002, Tie-Yan Liu. 6190-6199 [doi]

Direct Optimization through arg max for Discrete Variational Auto-EncoderGuy Lorberbom, Tommi S. Jaakkola, Andreea Gane, Tamir Hazan. 6200-6211 [doi]

Distributional Reward Decomposition for Reinforcement LearningZichuan Lin, Li Zhao, Derek Yang, Tao Qin, Tie-Yan Liu, Guangwen Yang. 6212-6221 [doi]

L_DMI: A Novel Information-theoretic Loss Function for Training Deep Nets Robust to Label NoiseYilun Xu, Peng Cao, Yuqing Kong, Yizhou Wang. 6222-6233 [doi]

Convergence Guarantees for Adaptive Bayesian Quadrature MethodsMotonobu Kanagawa, Philipp Hennig. 6234-6245 [doi]

Progressive Augmentation of GANsDan Zhang, Anna Khoreva. 6246-6256 [doi]

UniXGrad: A Universal, Adaptive Algorithm with Optimal Guarantees for Constrained OptimizationAli Kavis, Kfir Y. Levy, Francis Bach, Volkan Cevher. 6257-6266 [doi]

Meta-Surrogate Benchmarking for Hyperparameter OptimizationAaron Klein, Zhenwen Dai, Frank Hutter, Neil D. Lawrence, Javier Gonzalez. 6267-6277 [doi]

Learning to Perform Local Rewriting for Combinatorial OptimizationXinyun Chen, Yuandong Tian. 6278-6289 [doi]

Anti-efficient encoding in emergent communicationRahma Chaabouni, Eugene Kharitonov, Emmanuel Dupoux, Marco Baroni. 6290-6300 [doi]

Singleshot : a scalable Tucker tensor decompositionAbraham Traore, Maxime Berar, Alain Rakotomamonjy. 6301-6312 [doi]

Neural Machine Translation with Soft PrototypeYiren Wang, Yingce Xia, Fei Tian, Fei Gao, Tao Qin, ChengXiang Zhai, Tie-Yan Liu. 6313-6322 [doi]

Reliable training and estimation of variance networksNicki Skafte Detlefsen, Martin Jørgensen, Søren Hauberg. 6323-6333 [doi]

Copula Multi-label LearningWeiwei Liu. 6334-6343 [doi]

Bayesian Learning of Sum-Product NetworksMartin Trapp, Robert Peharz, Hong Ge, Franz Pernkopf, Zoubin Ghahramani. 6344-6355 [doi]

Bayesian Batch Active Learning as Sparse Subset ApproximationRobert Pinsler, Jonathan Gordon 0003, Eric T. Nalisnick, José Miguel Hernández-Lobato. 6356-6367 [doi]

Optimal Sparsity-Sensitive Bounds for Distributed Mean EstimationZengfeng Huang, Ziyue Huang, Yilei Wang, Ke Yi 0001. 6368-6378 [doi]

Global Sparse Momentum SGD for Pruning Very Deep Neural NetworksXiaohan Ding, Guiguang Ding, Xiangxin Zhou, Yuchen Guo, Jungong Han, Ji Liu. 6379-6391 [doi]

Variational Bayesian Decision-making for Continuous UtilitiesTomasz Kusmierczyk, Joseph Sakaya, Arto Klami. 6392-6402 [doi]

The Normalization Method for Alleviating Pathological Sharpness in Wide Neural NetworksRyo Karakida, Shotaro Akaho, Shun-ichi Amari. 6403-6413 [doi]

Single-Model Uncertainties for Deep LearningNatasa Tagasovska, David Lopez-Paz. 6414-6425 [doi]

Is Deeper Better only when Shallow is Good?Eran Malach, Shai Shalev-Shwartz. 6426-6435 [doi]

Wasserstein Weisfeiler-Lehman Graph KernelsMatteo Togninalli, M. Elisabetta Ghisu, Felipe Llinares-López, Bastian Rieck, Karsten M. Borgwardt. 6436-6446 [doi]

Domain Generalization via Model-Agnostic Learning of Semantic FeaturesQi Dou, Daniel Coelho de Castro, Konstantinos Kamnitsas, Ben Glocker. 6447-6458 [doi]

Grid Saliency for Context Explanations of Semantic SegmentationLukas Hoyer, Mauricio Munoz, Prateek Katiyar, Anna Khoreva, Volker Fischer. 6459-6470 [doi]

First-order methods almost always avoid saddle points: The case of vanishing step-sizesIoannis Panageas, Georgios Piliouras, Xiao Wang. 6471-6480 [doi]

Maximum Mean Discrepancy Gradient FlowMichael Arbel, Anna Korba, Adil Salim, Arthur Gretton. 6481-6491 [doi]

Oblivious Sampling Algorithms for Private Data AnalysisSajin Sasy, Olga Ohrimenko. 6492-6503 [doi]

Semi-supervisedly Co-embedding Attributed NetworksZaiqiao Meng, Shangsong Liang, Jinyuan Fang, Teng Xiao. 6504-6513 [doi]

From voxels to pixels and back: Self-supervision in natural-image reconstruction from fMRIRoman Beliy, Guy Gaziv, Assaf Hoogi, Francesca Strappini, Tal Golan, Michal Irani. 6514-6524 [doi]

Copulas as High-Dimensional Generative Models: Vine Copula AutoencodersNatasa Tagasovska, Damien Ackerer, Thibault Vatter. 6525-6537 [doi]

Nonstochastic Multiarmed Bandits with Unrestricted DelaysTobias Sommer Thune, Nicolò Cesa-Bianchi, Yevgeny Seldin. 6538-6547 [doi]

BIVA: A Very Deep Hierarchy of Latent Variables for Generative ModelingLars Maaløe, Marco Fraccaro, Valentin Liévin, Ole Winther. 6548-6558 [doi]

Code Generation as a Dual Task of Code SummarizationBolin Wei, Ge Li, Xin Xia 0001, Zhiyi Fu, Zhi Jin. 6559-6569 [doi]

Diffeomorphic Temporal Alignment NetsRon Shapira Weber, Matan Eyal, Nicki Skafte Detlefsen, Oren Shriki, Oren Freifeld. 6570-6581 [doi]

Weakly Supervised Instance Segmentation using the Bounding Box Tightness PriorCheng-chun Hsu, Kuang-Jui Hsu, Chung-Chi Tsai, Yen-Yu Lin, Yung-Yu Chuang. 6582-6593 [doi]

On the Power and Limitations of Random Features for Understanding Neural NetworksGilad Yehudai, Ohad Shamir. 6594-6604 [doi]

Efficient Pure Exploration in Adaptive Round modelTianyuan Jin, Jieming Shi, Xiaokui Xiao, Enhong Chen. 6605-6614 [doi]

Multi-objects Generation with Amortized Structural RegularizationTaufik Xu, Chongxuan Li, Jun Zhu, Bo Zhang 0010. 6615-6625 [doi]

Neural Shuffle-Exchange Networks - Sequence Processing in O(n log n) TimeKarlis Freivalds, Emils Ozolins, Agris Sostaks. 6626-6637 [doi]

DetNAS: Backbone Search for Object DetectionYukang Chen, Tong Yang, Xiangyu Zhang, Gaofeng Meng, Xinyu Xiao, Jian Sun. 6638-6648 [doi]

Stochastic Proximal Langevin Algorithm: Potential Splitting and Nonasymptotic RatesAdil Salim, Dmitry Koralev, Peter Richtárik. 6649-6661 [doi]

Fast AutoAugmentSungbin Lim, Ildoo Kim, Taesup Kim, Chiheon Kim, Sungwoong Kim. 6662-6672 [doi]

On the Convergence Rate of Training Recurrent Neural NetworksZeyuan Allen Zhu, Yuanzhi Li, Zhao Song. 6673-6685 [doi]

Interval timing in deep reinforcement learning agentsBen Deverett, Ryan Faulkner, Meire Fortunato, Gregory Wayne, Joel Z. Leibo. 6686-6695 [doi]

Graph-based Discriminators: Sample Complexity and ExpressivenessRoi Livni, Yishay Mansour. 6696-6705 [doi]

Large Scale Structure of Neural Network Loss LandscapesStanislav Fort, Stanislaw Jastrzebski. 6706-6714 [doi]

Learning Nonsymmetric Determinantal Point ProcessesMike Gartrell, Victor-Emmanuel Brunel, Elvis Dohmatob, Syrine Krichene. 6715-6725 [doi]

Hypothesis Set Stability and GeneralizationDylan J. Foster, Spencer Greenberg, Satyen Kale, Haipeng Luo, Mehryar Mohri, Karthik Sridharan. 6726-6736 [doi]

Learning Object Bounding Boxes for 3D Instance Segmentation on Point CloudsBo Yang, Jianan Wang, Ronald Clark, Qingyong Hu, Sen Wang, Andrew Markham, Niki Trigoni. 6737-6746 [doi]

Precision-Recall Balanced Topic ModellingSeppo Virtanen, Mark A. Girolami. 6747-6756 [doi]

Learning Sparse Distributions using Iterative Hard ThresholdingJacky Y. Zhang, Rajiv Khanna, Anastasios Kyrillidis, Oluwasanmi Koyejo. 6757-6766 [doi]

Discriminative Topic Modeling with Logistic LDAIryna Korshunova, Hanchen Xiong, Mateusz Fedoryszak, Lucas Theis. 6767-6777 [doi]

Quantum Wasserstein Generative Adversarial NetworksShouvanik Chakrabarti, Yiming Huang, Tongyang Li, Soheil Feizi, Xiaodi Wu. 6778-6789 [doi]

Blow: a single-scale hyperconditioned flow for non-parallel raw-audio voice conversionJoan Serrà, Santiago Pascual, Carlos Segura. 6790-6800 [doi]

Hyperparameter Learning via Distributional TransferHo Chung Leon Law, Peilin Zhao, Leung Sing Chan, JunZhou Huang, Dino Sejdinovic. 6801-6812 [doi]

Discriminator optimal transportAkinori Tanaka. 6813-6823 [doi]

High-dimensional multivariate forecasting with low-rank Gaussian Copula ProcessesDavid Salinas, Michael Bohlke-Schneider, Laurent Callot, Roberto Medico, Jan Gasthaus. 6824-6834 [doi]

Are Anchor Points Really Indispensable in Label-Noise Learning?Xiaobo Xia, Tongliang Liu, Nannan Wang, Bo Han 0003, Chen Gong 0002, Gang Niu, Masashi Sugiyama. 6835-6846 [doi]

Aligning Visual Regions and Textual Concepts for Semantic-Grounded Image RepresentationsFenglin Liu, Yuanxin Liu, Xuancheng Ren, Xiaodong He, Xu Sun 0001. 6847-6857 [doi]

Differentiable Ranking and Sorting using Optimal TransportMarco Cuturi, Olivier Teboul, Jean-Philippe Vert. 6858-6868 [doi]

Dichotomize and Generalize: PAC-Bayesian Binary Activated Deep Neural NetworksGaël Letarte, Pascal Germain, Benjamin Guedj, François Laviolette. 6869-6879 [doi]

Likelihood-Free Overcomplete ICA and Applications In Causal DiscoveryChenwei Ding, Mingming Gong, Kun Zhang, Dacheng Tao. 6880-6890 [doi]

Interior-Point Methods Strike Back: Solving the Wasserstein Barycenter ProblemDongdong Ge, Haoyue Wang, Zikai Xiong, Yinyu Ye. 6891-6902 [doi]

Beyond Vector Spaces: Compact Data Representation as Differentiable Weighted GraphsDenis Mazur, Vage Egiazarian, Stanislav Morozov, Artem Babenko. 6903-6913 [doi]

Subspace Detours: Building Transport Plans that are Optimal on Subspace ProjectionsBoris Muzellec, Marco Cuturi. 6914-6925 [doi]

Efficient Smooth Non-Convex Stochastic Compositional Optimization via Stochastic Recursive Gradient DescentHuizhuo Yuan, Xiangru Lian, Chris Junchi Li, Ji Liu, Wenqing Hu. 6926-6935 [doi]

On the convergence of single-call stochastic extra-gradient methodsYu-Guan Hsieh, Franck Iutzeler, Jérôme Malick, Panayotis Mertikopoulos. 6936-6946 [doi]

Infra-slow brain dynamics as a marker for cognitive function and declineShagun Ajmera, Shreya Rajagopal, Razi Rehman, Devarajan Sridharan. 6947-6958 [doi]

Robust Principal Component Analysis with Adaptive NeighborsRui Zhang 0017, Hanghang Tong. 6959-6967 [doi]

High-Quality Self-Supervised Deep Image DenoisingSamuli Laine, Tero Karras, Jaakko Lehtinen, Timo Aila. 6968-6978 [doi]

Dynamics of stochastic gradient descent for two-layer neural networks in the teacher-student setupSebastian Goldt, Madhu Advani, Andrew M. Saxe, Florent Krzakala, Lenka Zdeborová. 6979-6989 [doi]

GIFT: Learning Transformation-Invariant Dense Visual Descriptors via Group CNNsYuan Liu, Zehong Shen, Zhixuan Lin, Sida Peng, Hujun Bao, Xiaowei Zhou. 6990-7001 [doi]

Online Prediction of Switching Graph Labelings with Cluster SpecialistsMark Herbster, James Robinson. 7002-7012 [doi]

Graph-Based Semi-Supervised Learning with Non-ignorable Non-responseFan Zhou 0003, Tengfei Li, Haibo Zhou, Hongtu Zhu, Jieping Ye. 7013-7023 [doi]

BatchBALD: Efficient and Diverse Batch Acquisition for Deep Bayesian Active LearningAndreas Kirsch, Joost van Amersfoort, Yarin Gal. 7024-7035 [doi]

A Mean Field Theory of Quantized Deep Networks: The Quantization-Depth Trade-OffYaniv Blumenfeld, Dar Gilboa, Daniel Soudry. 7036-7046 [doi]

Beyond Confidence Regions: Tight Bayesian Ambiguity Sets for Robust MDPsMarek Petrik, Reazul Hasan Russel. 7047-7056 [doi]

Cross-lingual Language Model PretrainingAlexis Conneau, Guillaume Lample. 7057-7067 [doi]

Approximate Bayesian Inference for a Mechanistic Model of Vesicle Release at a Ribbon SynapseCornelius Schröder, Ben James, Leon Lagnado, Philipp Berens. 7068-7078 [doi]

Updates of Equilibrium Prop Match Gradients of Backprop Through Time in an RNN with Static InputMaxence Ernoult, Julie Grollier, Damien Querlioz, Yoshua Bengio, Benjamin Scellier. 7079-7089 [doi]

Universal Invariant and Equivariant Graph Neural NetworksNicolas Keriven, Gabriel Peyré. 7090-7099 [doi]

Are sample means in multi-armed bandits positively or negatively biased?Jaehyeok Shin, Aaditya Ramdas, Alessandro Rinaldo. 7100-7109 [doi]

On the Correctness and Sample Complexity of Inverse Reinforcement LearningAbi Komanduru, Jean Honorio. 7110-7119 [doi]

VIREL: A Variational Inference Framework for Reinforcement LearningMatthew Fellows, Anuj Mahajan, Tim G. J. Rudner, Shimon Whiteson. 7120-7134 [doi]

First Order Motion Model for Image AnimationAliaksandr Siarohin, Stéphane Lathuilière, Sergey Tulyakov, Elisa Ricci 0001, Nicu Sebe. 7135-7145 [doi]

Tensor Monte Carlo: Particle Methods for the GPU eraLaurence Aitchison. 7146-7155 [doi]

Unsupervised Emergence of Egocentric Spatial Structure from Sensorimotor PredictionAlban Laflaquière, Michaël Garcia Ortiz. 7156-7166 [doi]

Learning from Label Proportions with Generative Adversarial NetworksJiabin Liu, Bo Wang, Zhiquan Qi, Yingjie Tian, Yong Shi. 7167-7177 [doi]

Efficient and Thrifty Voting by Any Means NecessaryDebmalya Mandal, Ariel D. Procaccia, Nisarg Shah 0001, David P. Woodruff. 7178-7189 [doi]

PointDAN: A Multi-Scale 3D Domain Adaption Network for Point Cloud RepresentationCan Qin, Haoxuan You, Lichen Wang, C. C. Jay Kuo, Yun Fu 0001. 7190-7201 [doi]

ZO-AdaMM: Zeroth-Order Adaptive Momentum Method for Black-Box OptimizationXiangyi Chen, Sijia Liu 0001, Kaidi Xu, Xingguo Li, Xue Lin, Mingyi Hong, David Cox. 7202-7213 [doi]

Non-Stationary Markov Decision Processes, a Worst-Case Approach using Model-Based Reinforcement LearningErwan Lecarpentier, Emmanuel Rachelson. 7214-7223 [doi]

Depth-First Proof-Number Search with Heuristic Edge Cost and Application to Chemical Synthesis PlanningAkihiro Kishimoto, Beat Buesser, Bei Chen, Adi Botea. 7224-7234 [doi]

Toward a Characterization of Loss Functions for Distribution LearningNika Haghtalab, Cameron Musco, Bo Waggoner. 7235-7244 [doi]

Coresets for Archetypal AnalysisSebastian Mair, Ulf Brefeld. 7245-7253 [doi]

Emergence of Object Segmentation in Perturbed Generative ModelsAdam Bielski, Paolo Favaro. 7254-7264 [doi]

Optimal Sparse Decision TreesXiyang Hu, Cynthia Rudin, Margo Seltzer. 7265-7273 [doi]

Escaping from saddle points on Riemannian manifoldsYue Sun, Nicolas Flammarion, Maryam Fazel. 7274-7284 [doi]

Multi-source Domain Adaptation for Semantic SegmentationSicheng Zhao, Bo Li, Xiangyu Yue, Yang Gu, Pengfei Xu 0013, Runbo Hu, Hua Chai, Kurt Keutzer. 7285-7298 [doi]

Localized Structured PredictionCarlo Ciliberto, Francis Bach, Alessandro Rudi. 7299-7309 [doi]

Nonzero-sum Adversarial Hypothesis Testing GamesSarath Yasodharan, Patrick Loiseau. 7310-7320 [doi]

Manifold-regression to predict from MEG/EEG brain signals without source modelingDavid Sabbagh, Pierre Ablin, Gaël Varoquaux, Alexandre Gramfort, Denis A. Engemann. 7321-7332 [doi]

Modeling Tabular data using Conditional GANLei Xu, Maria Skoularidou, Alfredo Cuesta-Infante, Kalyan Veeramachaneni. 7333-7343 [doi]

Normalization Helps Training of Quantized LSTMLu Hou, Jinhua Zhu, James T. Kwok, Fei Gao, Tao Qin, Tie-Yan Liu. 7344-7354 [doi]

Trajectory of Alternating Direction Method of Multipliers and Adaptive AccelerationClarice Poon, Jingwei Liang. 7355-7363 [doi]

Deep Scale-spaces: Equivariance Over ScaleDaniel E. Worrall, Max Welling. 7364-7376 [doi]

GRU-ODE-Bayes: Continuous Modeling of Sporadically-Observed Time SeriesEdward De Brouwer, Jaak Simm, Adam Arany, Yves Moreau. 7377-7388 [doi]

Estimating Convergence of Markov chains with L-Lag CouplingsNiloy Biswas, Pierre E. Jacob, Paul Vanetti. 7389-7399 [doi]

Learning-Based Low-Rank ApproximationsPiotr Indyk, Ali Vakilian, Yang Yuan. 7400-7410 [doi]

Implicit Regularization in Deep Matrix FactorizationSanjeev Arora, Nadav Cohen, Wei Hu, Yuping Luo. 7411-7422 [doi]

List-decodable Linear RegressionSushrut Karmalkar, Adam R. Klivans, Pravesh Kothari. 7423-7432 [doi]

Learning elementary structures for 3D shape generation and matchingTheo Deprelle, Thibault Groueix, Matthew Fisher, Vladimir G. Kim, Bryan C. Russell, Mathieu Aubry. 7433-7443 [doi]

On the Hardness of Robust ClassificationPascale Gourdeau, Varun Kanade, Marta Kwiatkowska, James Worrell 0001. 7444-7453 [doi]

Foundations of Comparison-Based Hierarchical ClusteringDebarghya Ghoshdastidar, Michaël Perrot, Ulrike von Luxburg. 7454-7464 [doi]

What the Vec? Towards Probabilistically Grounded EmbeddingsCarl Allen, Ivana Balazevic, Timothy M. Hospedales. 7465-7475 [doi]

Minimizers of the Empirical Risk and Risk MonotonicityMarco Loog, Tom J. Viering, Alexander Mey. 7476-7485 [doi]

Explicit Planning for Efficient Exploration in Reinforcement LearningLiangpeng Zhang, Ke Tang, Xin Yao 0001. 7486-7495 [doi]

Lower Bounds on Adversarial Robustness from Optimal TransportArjun Nitin Bhagoji, Daniel Cullina, Prateek Mittal. 7496-7508 [doi]

Neural Spline FlowsConor Durkan, Artur Bekasov, Iain Murray 0001, George Papamakarios. 7509-7520 [doi]

Phase Transitions and Cyclic Phenomena in Bandits with Switching ConstraintsDavid Simchi-Levi, Yunzong Xu. 7521-7530 [doi]

Latent Weights Do Not Exist: Rethinking Binarized Neural Network OptimizationKoen Helwegen, James Widdicombe, Lukas Geiger, Zechun Liu, Kwang-Ting Cheng, Roeland Nusselder. 7531-7542 [doi]

Nonlinear scaling of resource allocation in sensory bottlenecksLaura Rose Edmondson, Alejandro Jiménez-Rodriguez, Hannes P. Saal. 7543-7552 [doi]

Constrained Reinforcement Learning Has Zero Duality GapSantiago Paternain, Luiz F. O. Chamon, Miguel Calvo-Fullana, Alejandro Ribeiro. 7553-7563 [doi]

Symmetry-adapted generation of 3d point sets for the targeted discovery of moleculesNiklas W. A. Gebauer, Michael Gastegger, Kristof Schütt. 7564-7576 [doi]

An adaptive nearest neighbor rule for classificationAkshay Balsubramani, Sanjoy Dasgupta, Yoav Freund, Shay Moran. 7577-7586 [doi]

Coresets for Clustering with Fairness ConstraintsLingxiao Huang, Shaofeng H.-C. Jiang, Nisheeth K. Vishnoi. 7587-7598 [doi]

PerspectiveNet: A Scene-consistent Image Generator for New View Synthesis in Real Indoor EnvironmentsDavid Novotný, Benjamin Graham, Jeremy Reizenstein. 7599-7610 [doi]

MAVEN: Multi-Agent Variational ExplorationAnuj Mahajan, Tabish Rashid, Mikayel Samvelyan, Shimon Whiteson. 7611-7622 [doi]

Competitive Gradient DescentFlorian Schäfer, Anima Anandkumar. 7623-7633 [doi]

Globally Convergent Newton Methods for Ill-conditioned Generalized Self-concordant LossesUlysse Marteau-Ferey, Francis Bach, Alessandro Rudi. 7634-7644 [doi]

Continual Unsupervised Representation LearningDushyant Rao, Francesco Visin, Andrei A. Rusu, Razvan Pascanu, Yee Whye Teh, Raia Hadsell. 7645-7655 [doi]

Self-Routing Capsule NetworksTaeyoung Hahn, Myeongjang Pyeon, Gunhee Kim. 7656-7665 [doi]

The Parameterized Complexity of Cascading Portfolio SchedulingEduard Eiben, Robert Ganian, Iyad Kanj, Stefan Szeider. 7666-7676 [doi]

Maximum Expected Hitting Cost of a Markov Decision Process and Informativeness of RewardsFalcon Z. Dai, Matthew R. Walter. 7677-7685 [doi]

Bipartite expander Hopfield networks as self-decoding high-capacity error correcting codesRishidev Chaudhuri, Ila Fiete. 7686-7697 [doi]

Sequence Modeling with Unconstrained Generation OrderDmitrii Emelianenko, Elena Voita, Pavel Serdyukov. 7698-7709 [doi]

Probabilistic Logic Neural Networks for ReasoningMeng Qu, Jian Tang 0005. 7710-7720 [doi]

A Polynomial Time Algorithm for Log-Concave Maximum Likelihood via Locally Exponential FamiliesBrian Axelrod, Ilias Diakonikolas, Alistair Stewart, Anastasios Sidiropoulos, Gregory Valiant. 7721-7733 [doi]

A Unifying Framework for Spectrum-Preserving Graph Sparsification and CoarseningGecia Bravo Hermsdorff, Lee M. Gunderson. 7734-7745 [doi]

Stochastic Runge-Kutta Accelerates Langevin Monte Carlo and BeyondXuechen Li, Yi Wu, Lester Mackey. 7746-7758 [doi]

The Implicit Bias of AdaGrad on Separable DataQian Qian, Xiaoyuan Qian. 7759-7767 [doi]

On two ways to use determinantal point processes for Monte Carlo integrationGuillaume Gautier, Rémi Bardenet, Michal Valko. 7768-7777 [doi]

LiteEval: A Coarse-to-Fine Framework for Resource Efficient Video RecognitionZuxuan Wu, Caiming Xiong, Yu-Gang Jiang, Larry S. Davis. 7778-7787 [doi]

How degenerate is the parametrization of neural networks with the ReLU activation function?Dennis Elbrächter, Julius Berner, Philipp Grohs. 7788-7799 [doi]

Spike-Train Level Backpropagation for Training Deep Recurrent Spiking Neural NetworksWenrui Zhang, Peng Li. 7800-7811 [doi]

Re-examination of the Role of Latent Variables in Sequence ModelingGuokun Lai, Zihang Dai, Yiming Yang, Shinjae Yoo. 7812-7822 [doi]

Max-value Entropy Search for Multi-Objective Bayesian OptimizationSyrine Belakaria, Aryan Deshwal, Janardhan Rao Doppa. 7823-7833 [doi]

Stein Variational Gradient Descent With Matrix-Valued KernelsDilin Wang, Ziyang Tang, Chandrajit Bajaj, Qiang Liu 0001. 7834-7844 [doi]

Crowdsourcing via Pairwise Co-occurrences: Identifiability and AlgorithmsShahana Ibrahim, Xiao Fu 0001, Nikolaos Kargas, Kejun Huang. 7845-7855 [doi]

Detecting Overfitting via Adversarial ExamplesRoman Werpachowski, András György, Csaba Szepesvári. 7856-7866 [doi]

A Unified Bellman Optimality Principle Combining Reward Maximization and EmpowermentFelix Leibfried, Sergio Pascual-Diaz, Jordi Grau-Moya. 7867-7878 [doi]

SMILe: Scalable Meta Inverse Reinforcement Learning through Context-Conditional PoliciesSeyed Kamyar Seyed Ghasemipour, Shixiang Gu, Richard S. Zemel. 7879-7889 [doi]

Towards Understanding the Importance of Shortcut Connections in Residual NetworksTianyi Liu, Minshuo Chen, Mo Zhou, Simon S. Du, Enlu Zhou, Tuo Zhao. 7890-7900 [doi]

Modular Universal Reparameterization: Deep Multi-task Learning Across Diverse DomainsElliot Meyerson, Risto Miikkulainen. 7901-7912 [doi]

Solving Interpretable Kernel Dimensionality ReductionChieh Wu, Jared Miller, Yale Chang, Mario Sznaier, Jennifer G. Dy. 7913-7923 [doi]

Interaction Hard Thresholding: Consistent Sparse Quadratic Regression in Sub-quadratic Time and SpaceShuo Yang, Yanyao Shen, Sujay Sanghavi. 7924-7934 [doi]

A Model to Search for Synthesizable MoleculesJohn Bradshaw, Brooks Paige, Matt J. Kusner, Marwin H. S. Segler, José Miguel Hernández-Lobato. 7935-7947 [doi]

Post training 4-bit quantization of convolutional networks for rapid-deploymentRon Banner, Yury Nahshan, Daniel Soudry. 7948-7956 [doi]

Fast and Flexible Multi-Task Classification using Conditional Neural Adaptive ProcessesJames Requeima, Jonathan Gordon 0003, John Bronskill, Sebastian Nowozin, Richard E. Turner. 7957-7968 [doi]

Differentially Private Anonymized HistogramsAnanda Theertha Suresh. 7969-7979 [doi]

Dynamic Local Regret for Non-convex Online ForecastingSergül Aydöre, Tianhao Zhu, Dean P. Foster. 7980-7989 [doi]

Learning Local Search Heuristics for Boolean SatisfiabilityEmre Yolcu, Barnabás Póczos. 7990-8001 [doi]

Provably Efficient Q-Learning with Low Switching CostYu Bai, Tengyang Xie, Nan Jiang, Yu-Xiang Wang. 8002-8011 [doi]

Solving graph compression via optimal transportVikas K. Garg, Tommi S. Jaakkola. 8012-8023 [doi]

PyTorch: An Imperative Style, High-Performance Deep Learning LibraryAdam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Köpf, Edward Yang, Zachary Devito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, Soumith Chintala. 8024-8035 [doi]

Stability of Graph Scattering TransformsFernando Gama, Alejandro Ribeiro, Joan Bruna. 8036-8046 [doi]

A Debiased MDI Feature Importance Measure for Random ForestsXiao Li, Yu Wang, Sumanta Basu, Karl Kumbier, Bin Yu. 8047-8057 [doi]

Provably Efficient Q-learning with Function Approximation via Distribution Shift Error Checking OracleSimon S. Du, Yuping Luo, Ruosong Wang, Hanrui Zhang. 8058-8068 [doi]

Sparse Logistic Regression Learns All Discrete Pairwise Graphical ModelsShanshan Wu, Sujay Sanghavi, Alexandros G. Dimakis. 8069-8079 [doi]

Fast Convergence of Natural Gradient Descent for Over-Parameterized Neural NetworksGuodong Zhang, James Martens, Roger B. Grosse. 8080-8091 [doi]

Rapid Convergence of the Unadjusted Langevin Algorithm: Isoperimetry SufficesSantosh S. Vempala, Andre Wibisono. 8092-8104 [doi]

Learning Distributions Generated by One-Layer ReLU NetworksShanshan Wu, Alexandros G. Dimakis, Sujay Sanghavi. 8105-8115 [doi]

Large-scale optimal transport map estimation using projection pursuitCheng Meng, Yuan Ke, Jingyi Zhang, Mengrui Zhang, Wenxuan Zhong, Ping Ma. 8116-8127 [doi]

A Structured Prediction Approach for Generalization in Cooperative Multi-Agent Reinforcement LearningNicolas Carion, Nicolas Usunier, Gabriel Synnaeve, Alessandro Lazaric. 8128-8138 [doi]

On Exact Computation with an Infinitely Wide Neural NetSanjeev Arora, Simon S. Du, Wei Hu, Zhiyuan Li 0005, Russlan Salakhutdinov, Ruosong Wang. 8139-8148 [doi]

Loaded DiCE: Trading off Bias and Variance in Any-Order Score Function Gradient Estimators for Reinforcement LearningGregory Farquhar, Shimon Whiteson, Jakob N. Foerster. 8149-8160 [doi]

Chirality Nets for Human Pose RegressionRaymond A. Yeh, Yuan-Ting Hu, Alexander G. Schwing. 8161-8171 [doi]

Efficient Approximation of Deep ReLU Networks for Functions on Low Dimensional ManifoldsMinshuo Chen, Haoming Jiang, Wenjing Liao, Tuo Zhao. 8172-8182 [doi]

Fast Decomposable Submodular Function Minimization using Constrained Total VariationSenanayak Sesh Kumar Karri, Francis Bach, Thomas Pock. 8183-8193 [doi]

Which Algorithmic Choices Matter at Which Batch Sizes? Insights From a Noisy Quadratic ModelGuodong Zhang, Lala Li, Zachary Nado, James Martens, Sushant Sachdeva, George E. Dahl, Christopher J. Shallue, Roger B. Grosse. 8194-8205 [doi]

Spherical Text EmbeddingYu Meng, Jiaxin Huang, Guangyuan Wang, Chao Zhang, Honglei Zhuang, Lance M. Kaplan, Jiawei Han 0001. 8206-8215 [doi]

Möbius Transformation for Fast Inner Product Search on GraphZhixin Zhou, Shulong Tan, Zhaozhuo Xu, Ping Li 0001. 8216-8227 [doi]

Hyperbolic Graph Neural NetworksQi Liu, Maximilian Nickel, Douwe Kiela. 8228-8239 [doi]

Average Individual Fairness: Algorithms, Generalization and ExperimentsSaeed Sharifi-Malvajerdi, Michael J. Kearns, Aaron Roth 0001. 8240-8249 [doi]

Fixing the train-test resolution discrepancyHugo Touvron, Andrea Vedaldi, Matthijs Douze, Hervé Jégou. 8250-8260 [doi]

Modeling Dynamic Functional Connectivity with Latent Factor Gaussian ProcessesLingge Li, Dustin Pluta, Babak Shahbaba, Norbert Fortin, Hernando Ombao, Pierre Baldi. 8261-8271 [doi]

Manipulating a Learning Defender and Ways to CounteractJiarui Gan, Qingyu Guo, Long Tran-Thanh, Bo An, Michael J. Wooldridge. 8272-8281 [doi]

Learning-In-The-Loop Optimization: End-To-End Control And Co-Design Of Soft Robots Through Learned Deep Latent RepresentationsAndrew Spielberg, Allan Zhao, Yuanming Hu, Tao Du, Wojciech Matusik, Daniela Rus. 8282-8292 [doi]

Learning to Infer Implicit Surfaces without 3D SupervisionShichen Liu, Shunsuke Saito, Weikai Chen 0001, Hao Li. 8293-8304 [doi]

Fast and Accurate Least-Mean-Squares SolversAlaa Maalouf, Ibrahim Jubran, Dan Feldman. 8305-8316 [doi]

Certifiable Robustness to Graph PerturbationsAleksandar Bojchevski, Stephan Günnemann. 8317-8328 [doi]

Fast Convergence of Belief Propagation to Global Optima: Beyond Correlation DecayFrederic Koehler. 8329-8339 [doi]

Paradoxes in Fair Machine LearningPaul Gölz, Anson Kahng, Ariel D. Procaccia. 8340-8350 [doi]

Provably Global Convergence of Actor-Critic: A Case for Linear Quadratic Regulator with Ergodic CostZhuoran Yang, Yongxin Chen, Mingyi Hong, Zhaoran Wang. 8351-8363 [doi]

The spiked matrix model with generative priorsBenjamin Aubin, Bruno Loureiro, Antoine Maillard, Florent Krzakala, Lenka Zdeborová. 8364-8375 [doi]

Gradient Dynamics of Shallow Univariate ReLU NetworksFrancis Williams, Matthew Trager, Daniele Panozzo, Cláudio T. Silva, Denis Zorin, Joan Bruna. 8376-8385 [doi]

Robust and Communication-Efficient Collaborative LearningAmirhossein Reisizadeh, Hossein Taheri, Aryan Mokhtari, Hamed Hassani, Ramtin Pedarsani. 8386-8397 [doi]

Multiclass Learning from ContradictionsSauptik Dhar, Vladimir Cherkassky, Mohak Shah. 8398-8408 [doi]

Learning from Trajectories via Subgoal DiscoverySujoy Paul, Jeroen van Baar, Amit K. Roy Chowdhury. 8409-8419 [doi]

Distributed Low-rank Matrix Factorization With Exact ConsensusZhihui Zhu, Qiuwei Li, Xinshuo Yang, Gongguo Tang, Michael B. Wakin. 8420-8430 [doi]

Online Normalization for Training Neural NetworksVitaliy Chiley, Ilya Sharapov, Atli Kosson, Urs Köster, Ryan Reece, Sofia Samaniego de la Fuente, Vishal Subbiah, Michael James. 8431-8441 [doi]

The Synthesis of XNOR Recurrent Neural Networks with Stochastic LogicArash Ardakani, Zhengyun Ji, Amir Ardakani, Warren J. Gross. 8442-8452 [doi]

An adaptive Mirror-Prox method for variational inequalities with singular operatorsKimon Antonakopoulos, Elena Veronica Belmega, Panayotis Mertikopoulos. 8453-8463 [doi]

N-Gram Graph: Simple Unsupervised Representation for Graphs, with Applications to MoleculesShengchao Liu, Mehmet Furkan Demirel, Yingyu Liang. 8464-8476 [doi]

Characterizing the Exact Behaviors of Temporal Difference Learning Algorithms Using Markov Jump Linear System TheoryBin Hu, Usman Ahmed Syed. 8477-8488 [doi]

Facility Location Problem in Differential Privacy Model RevisitedYunus Esencayi, Marco Gaboardi, Shi Li, Di Wang. 8489-8498 [doi]

Energy-Inspired Models: Learning with Sampler-Induced DistributionsJohn Lawson, George Tucker, Bo Dai, Rajesh Ranganath. 8499-8511 [doi]

Finite-time Analysis of Approximate Policy Iteration for the Linear Quadratic RegulatorKarl Krauth, Stephen Tu, Benjamin Recht. 8512-8522 [doi]

A Universally Optimal Multistage Accelerated Stochastic Gradient MethodNecdet Serhat Aybat, Alireza Fallah, Mert Gürbüzbalaban, Asuman E. Ozdaglar. 8523-8534 [doi]

From deep learning to mechanistic understanding in neuroscience: the structure of retinal predictionHidenori Tanaka, Aran Nayebi, Niru Maheswaranathan, Lane McIntosh, Stephen Baccus, Surya Ganguli. 8535-8545 [doi]

Large Memory Layers with Product KeysGuillaume Lample, Alexandre Sablayrolles, Marc'Aurelio Ranzato, Ludovic Denoyer, Hervé Jégou. 8546-8557 [doi]

Learning Deterministic Weighted Automata with Queries and CounterexamplesGail Weiss, Yoav Goldberg, Eran Yahav. 8558-8569 [doi]

Wide Neural Networks of Any Depth Evolve as Linear Models Under Gradient DescentJaehoon Lee, Lechao Xiao, Samuel S. Schoenholz, Yasaman Bahri, Roman Novak, Jascha Sohl-Dickstein, Jeffrey Pennington. 8570-8581 [doi]

Time/Accuracy Tradeoffs for Learning a ReLU with respect to Gaussian MarginalsSurbhi Goel, Sushrut Karmalkar, Adam R. Klivans. 8582-8591 [doi]

Visualizing and Measuring the Geometry of BERTEmily Reif, Ann Yuan, Martin Wattenberg, Fernanda B. Viégas, Andy Coenen, Adam Pearce, Been Kim. 8592-8600 [doi]

Self-Critical Reasoning for Robust Visual Question AnsweringJialin Wu, Raymond J. Mooney. 8601-8611 [doi]

Learning to ScreenAlon Cohen, Avinatan Hassidim, Haim Kaplan, Yishay Mansour, Shay Moran. 8612-8621 [doi]

A Communication Efficient Stochastic Multi-Block Alternating Direction Method of MultipliersHao Yu. 8622-8631 [doi]

A Little Is Enough: Circumventing Defenses For Distributed LearningGilad Baruch, Moran Baruch, Yoav Goldberg. 8632-8642 [doi]

Error Correcting Output Codes Improve Probability Estimation and Adversarial Robustness of Deep Neural NetworksGunjan Verma, Ananthram Swami. 8643-8653 [doi]

A Robust Non-Clairvoyant Dynamic Mechanism for Contextual AuctionsYuan Deng, Sébastien Lahaie, Vahab S. Mirrokni. 8654-8664 [doi]

Finite-Sample Analysis for SARSA with Linear Function ApproximationShaofeng Zou, Tengyu Xu, Yingbin Liang. 8665-8675 [doi]

Who is Afraid of Big Bad Minima? Analysis of gradient-flow in spiked matrix-tensor modelsStefano Sarao Mannelli, Giulio Biroli, Chiara Cammarota, Florent Krzakala, Lenka Zdeborová. 8676-8686 [doi]

Graph Structured Prediction Energy NetworksColin Graber, Alexander G. Schwing. 8687-8698 [doi]

Private Learning Implies Online Learning: An Efficient ReductionAlon Gonen, Elad Hazan, Shay Moran. 8699-8709 [doi]

Graph Agreement Models for Semi-Supervised LearningOtilia Stretcu, Krishnamurthy Viswanathan, Dana Movshovitz-Attias, Emmanouil A. Platanios, Sujith Ravi, Andrew Tomkins. 8710-8720 [doi]

Latent distance estimation for random geometric graphsErnesto Araya Valdivia, Yohann de Castro. 8721-8731 [doi]

Seeing the Wind: Visual Wind Speed Prediction with a Coupled Convolutional and Recurrent Neural NetworkJennifer L. Cardona, Michael F. Howland, John O. Dabiri. 8732-8742 [doi]

The Functional Neural ProcessChristos Louizos, Xiahan Shi, Klamer Schutte, Max Welling. 8743-8754 [doi]

Recurrent Registration Neural Networks for Deformable Image RegistrationRobin Sandkühler, Simon Andermatt, Grzegorz Bauman, Sylvia Nyilas, Christoph Jud, Philippe C. Cattin. 8755-8765 [doi]

Unsupervised State Representation Learning in AtariAnkesh Anand, Evan Racah, Sherjil Ozair, Yoshua Bengio, Marc-Alexandre Côté, R. Devon Hjelm. 8766-8779 [doi]

Unlocking Fairness: a Trade-off RevisitedMichael Wick, Swetasudha Panda, Jean-Baptiste Tristan. 8780-8789 [doi]

Fisher Efficient Inference of Intractable ModelsSong Liu 0002, Takafumi Kanamori, Wittawat Jitkrittum, Yu Chen. 8790-8800 [doi]

Thompson Sampling and Approximate InferenceMy Phan, Yasin Abbasi-Yadkori, Justin Domke. 8801-8811 [doi]

PRNet: Self-Supervised Learning for Partial-to-Partial RegistrationYue Wang, Justin M. Solomon. 8812-8824 [doi]

Surrogate Objectives for Batch Policy Optimization in One-step Decision MakingMinmin Chen, Ramki Gummadi, Chris Harris, Dale Schuurmans. 8825-8835 [doi]

Modelling heterogeneous distributions with an Uncountable Mixture of Asymmetric LaplaciansAxel Brando, José A. Rodríguez-Serrano, Jordi Vitrià, Alberto Rubio. 8836-8846 [doi]

Learning Macroscopic Brain Connectomes via Group-Sparse FactorizationFarzane Aminmansour, Andrew Patterson, Lei Le, Yisu Peng, Daniel Mitchell, Franco Pestilli, Cesar F. Caiafa, Russell Greiner, Martha White. 8847-8857 [doi]

Approximating the Permanent by Sampling from Adaptive PartitionsJonathan Kuck, Tri Dao, Hamid Rezatofighi, Ashish Sabharwal, Stefano Ermon. 8858-8869 [doi]

Retrosynthesis Prediction with Conditional Graph Logic NetworkHanjun Dai, Chengtao Li, Connor Coley, Bo Dai, Le Song. 8870-8880 [doi]

Procrastinating with Confidence: Near-Optimal, Anytime, Adaptive Algorithm ConfigurationRobert Kleinberg, Kevin Leyton-Brown, Brendan Lucier, Devon R. Graham. 8881-8891 [doi]

Online Learning via the Differential Privacy LensJacob D. Abernethy, Young-Hun Jung, Chansoo Lee, Audra McMillan, Ambuj Tewari. 8892-8902 [doi]

PerspectiveNet: 3D Object Detection from a Single RGB Image via Perspective PointsSiyuan Huang, Yixin Chen, Tao Yuan, Siyuan Qi, Yixin Zhu, Song Chun Zhu. 8903-8915 [doi]

Parameter elimination in particle Gibbs samplingAnna Wigren, Riccardo Sven Risuleo, Lawrence Murray, Fredrik Lindsten. 8916-8927 [doi]

This Looks Like That: Deep Learning for Interpretable Image RecognitionChaofan Chen, Oscar Li, Daniel Tao, Alina Barnett, Cynthia Rudin, Jonathan Su. 8928-8939 [doi]

Adaptively Aligned Image Captioning via Adaptive Attention TimeLun Huang, Wenmin Wang, Yaxian Xia, Jie Chen. 8940-8949 [doi]

Accurate Uncertainty Estimation and Decomposition in Ensemble LearningJeremiah Z. Liu, John W. Paisley, Marianthi-Anna Kioumourtzoglou, Brent Coull. 8950-8961 [doi]

Learning Bayesian Networks with Low Rank Conditional Probability TablesAdarsh Barik, Jean Honorio. 8962-8971 [doi]

Equal Opportunity in Online Classification with Partial FeedbackYahav Bechavod, Katrina Ligett, Aaron Roth 0001, Bo Waggoner, Steven Z. Wu. 8972-8982 [doi]

Modeling Expectation Violation in Intuitive Physics with Coarse Probabilistic Object RepresentationsKevin Smith, Lingjie Mei, Shunyu Yao, Jiajun Wu 0001, Elizabeth S. Spelke, Josh Tenenbaum, Tomer Ullman. 8983-8993 [doi]

Neural Multisensory Scene InferenceJae Hyun Lim, Pedro O. Pinheiro, Negar Rostamzadeh, Chris Pal, Sungjin Ahn. 8994-9004 [doi]

Regret Bounds for Thompson Sampling in Episodic Restless Bandit ProblemsYoung-Hun Jung, Ambuj Tewari. 9005-9014 [doi]

What Can ResNet Learn Efficiently, Going Beyond Kernels?Zeyuan Allen Zhu, Yuanzhi Li. 9015-9025 [doi]

Better Transfer Learning with Inferred Successor MapsTamas Madarasz, Tim E. J. Behrens. 9026-9037 [doi]

Unsupervised Co-Learning on G-Manifolds Across Irreducible RepresentationsYifeng Fan, Tingran Gao, Zhizhen Zhao. 9038-9050 [doi]

Defending Against Neural Fake NewsRowan Zellers, Ari Holtzman, Hannah Rashkin, Yonatan Bisk, Ali Farhadi, Franziska Roesner, Yejin Choi. 9051-9062 [doi]

Sample Adaptive MCMCMichael Zhu. 9063-9074 [doi]

A Stochastic Composite Gradient Method with Incremental Variance ReductionJunyu Zhang, Lin Xiao. 9075-9085 [doi]

Nonparametric Density Estimation & Convergence Rates for GANs under Besov IPM LossesAnanya Uppal, Shashank Singh 0005, Barnabás Póczos. 9086-9097 [doi]

STAR-Caps: Capsule Networks with Straight-Through Attentive RoutingKarim Ahmed, Lorenzo Torresani. 9098-9107 [doi]

Limitations of Lazy Training of Two-layers Neural NetworkBehrooz Ghorbani, Song Mei, Theodor Misiakiewicz, Andrea Montanari. 9108-9118 [doi]

Reconciling meta-learning and continual learning with online mixtures of tasksGhassen Jerfel, Erin Grant, Tom Griffiths, Katherine A. Heller. 9119-9130 [doi]

Distributionally Robust Optimization and Generalization in Kernel MethodsMatthew Staib, Stefanie Jegelka. 9131-9141 [doi]

A General Theory of Equivariant CNNs on Homogeneous SpacesTaco S. Cohen, Mario Geiger, Maurice Weiler. 9142-9153 [doi]

Trivializations for Gradient-Based Optimization on ManifoldsMario Lezcano Casado. 9154-9164 [doi]

Write, Execute, Assess: Program Synthesis with a REPLKevin Ellis, Maxwell I. Nye, Yewen Pu, Felix Sosa, Josh Tenenbaum, Armando Solar-Lezama. 9165-9174 [doi]

A Meta-Analysis of Overfitting in Machine LearningRebecca Roelofs, Vaishaal Shankar, Benjamin Recht, Sara Fridovich-Keil, Moritz Hardt, John Miller, Ludwig Schmidt. 9175-9185 [doi]

(Nearly) Efficient Algorithms for the Graph Matching Problem on Correlated Random GraphsBoaz Barak, Chi-Ning Chou, Zhixian Lei, Tselil Schramm, Yueqi Sheng. 9186-9194 [doi]

Preference-Based Batch and Sequential Teaching: Towards a Unified View of ModelsFarnam Mansouri, Yuxin Chen 0001, Ara Vartanian, Xiaojin (Jerry) Zhu, Adish Singla. 9195-9205 [doi]

Online Continuous Submodular Maximization: From Full-Information to Bandit FeedbackMingrui Zhang, Lin Chen 0003, Hamed Hassani, Amin Karbasi. 9206-9217 [doi]

Sampling Networks and Aggregate Simulation for Online POMDP PlanningHao Cui, Roni Khardon. 9218-9228 [doi]

Correlation in Extensive-Form Games: Saddle-Point Formulation and BenchmarksGabriele Farina, Chun Kai Ling, Fei Fang, Tuomas Sandholm. 9229-9239 [doi]

GNNExplainer: Generating Explanations for Graph Neural NetworksZhitao Ying, Dylan Bourgeois, Jiaxuan You, Marinka Zitnik, Jure Leskovec. 9240-9251 [doi]

Linear Stochastic Bandits Under Safety ConstraintsSanae Amani, Mahnoosh Alizadeh, Christos Thrampoulidis. 9252-9262 [doi]

A coupled autoencoder approach for multi-modal analysis of cell typesRohan Gala, Nathan Gouwens, Zizhen Yao, Agata Budzillo, Osnat Penn, Bosiljka Tasic, Gabe Murphy, Hongkui Zeng, Uygar Sümbül. 9263-9272 [doi]

Towards Automatic Concept-based ExplanationsAmirata Ghorbani, James Wexler, James Y. Zou, Been Kim. 9273-9282 [doi]

Deep Generative Video CompressionSalvator Lombardo, Jun Han, Christopher Schroers, Stephan Mandt. 9283-9294 [doi]

Budgeted Reinforcement Learning in Continuous State SpaceNicolas Carrara, Edouard Leurent, Romain Laroche, Tanguy Urvoy, Odalric-Ambrym Maillard, Olivier Pietquin. 9295-9305 [doi]

Discovery of Useful Questions as Auxiliary TasksVivek Veeriah, Matteo Hessel, Zhongwen Xu, Janarthanan Rajendran, Richard L. Lewis, Junhyuk Oh, Hado van Hasselt, David Silver, Satinder Singh. 9306-9317 [doi]

Sinkhorn Barycenters with Free Support via Frank-Wolfe AlgorithmGiulia Luise, Saverio Salzo, Massimiliano Pontil, Carlo Ciliberto. 9318-9329 [doi]

Finding the Needle in the Haystack with Convolutions: on the benefits of architectural biasStéphane d'Ascoli, Levent Sagun, Giulio Biroli, Joan Bruna. 9330-9340 [doi]

Correlation clustering with local objectivesSanchit Kalhan, Konstantin Makarychev, Timothy Zhou. 9341-9350 [doi]

Multiclass Performance Metric ElicitationGaurush Hiranandani, Shant Boodaghians, Ruta Mehta, Oluwasanmi Koyejo. 9351-9360 [doi]

Algorithmic Analysis and Statistical Estimation of SLOPE via Approximate Message PassingZhiqi Bu, Jason Klusowski, Cynthia Rush, Weijie Su. 9361-9371 [doi]

Explicit Explore-Exploit Algorithms in Continuous State SpacesMikael Henaff. 9372-9382 [doi]

ADDIS: an adaptive discarding algorithm for online FDR control with conservative nullsJinjin Tian, Aaditya Ramdas. 9383-9391 [doi]

Slice-based Learning: A Programming Model for Residual Learning in Critical Data SlicesVincent Chen, Sen Wu 0002, Alexander J. Ratner, Jen Weng, Christopher Ré. 9392-9402 [doi]

Don't Blame the ELBO! A Linear VAE Perspective on Posterior CollapseJames Lucas, George Tucker, Roger B. Grosse, Mohammad Norouzi 0002. 9403-9413 [doi]

Language as an Abstraction for Hierarchical Deep Reinforcement LearningYiding Jiang, Shixiang Gu, Kevin Murphy, Chelsea Finn. 9414-9426 [doi]

Efficient online learning with kernels for adversarial large scale problemsRémi Jézéquel, Pierre Gaillard, Alessandro Rudi. 9427-9436 [doi]

A Linearly Convergent Method for Non-Smooth Non-Convex Optimization on the Grassmannian with Applications to Robust Subspace and Dictionary LearningZhihui Zhu, Tianyu Ding, Daniel P. Robinson, Manolis C. Tsakiris, René Vidal. 9437-9447 [doi]

ObjectNet: A large-scale bias-controlled dataset for pushing the limits of object recognition modelsAndrei Barbu, David Mayo, Julian Alverio, William Luo, Christopher Wang, Dan Gutfreund, Josh Tenenbaum, Boris Katz. 9448-9458 [doi]

Certified Adversarial Robustness with Additive NoiseBai Li, Changyou Chen, Wenlin Wang, Lawrence Carin. 9459-9469 [doi]

Tight Dimensionality Reduction for Sketching Low Degree Polynomial KernelsMichela Meister, Tamás Sarlós, David P. Woodruff. 9470-9481 [doi]

Non-Cooperative Inverse Reinforcement LearningXiangyuan Zhang, Kaiqing Zhang, Erik Miehling, Tamer Basar. 9482-9493 [doi]

DINGO: Distributed Newton-Type Method for Gradient-Norm OptimizationRixon Crane, Fred Roosta. 9494-9504 [doi]

Sobolev Independence CriterionYoussef Mroueh, Tom Sercu, Mattia Rigotti, Inkit Padhi, Cícero Nogueira dos Santos. 9505-9515 [doi]

Maximum Entropy Monte-Carlo PlanningChenjun Xiao, Ruitong Huang, Jincheng Mei, Dale Schuurmans, Martin Müller 0003. 9516-9524 [doi]

Learning from brains how to regularize machinesZhe Li 0007, Wieland Brendel, Edgar Y. Walker, Erick Cobos, Taliah Muhammad, Jacob Reimer, Matthias Bethge, Fabian H. Sinz, Zachary Pitkow, Andreas S. Tolias. 9525-9535 [doi]

Using Statistics to Automate Stochastic OptimizationHunter Lang, Lin Xiao, Pengchuan Zhang. 9536-9546 [doi]

Zero-shot Knowledge Transfer via Adversarial Belief MatchingPaul Micaelli, Amos J. Storkey. 9547-9557 [doi]

Differentiable Convex Optimization LayersAkshay Agrawal, Brandon Amos, Shane T. Barratt, Stephen P. Boyd, Steven Diamond, J. Zico Kolter. 9558-9570 [doi]

Random Tessellation ForestsShufei Ge, Shijia Wang, Yee Whye Teh, Liangliang Wang, Lloyd T. Elliott. 9571-9581 [doi]

Learning Nearest Neighbor Graphs from Noisy Distance SamplesBlake Mason, Ardhendu Tripathy, Robert D. Nowak. 9582-9592 [doi]

Lookahead Optimizer: k steps forward, 1 step backMichael R. Zhang, James Lucas, Jimmy Ba, Geoffrey E. Hinton. 9593-9604 [doi]

Learning to Predict 3D Objects with an Interpolation-based Differentiable RendererWenzheng Chen, Huan Ling, Jun Gao, Edward J. Smith, Jaakko Lehtinen, Alec Jacobson, Sanja Fidler. 9605-9616 [doi]

Covariate-Powered Empirical Bayes EstimationNikolaos Ignatiadis, Stefan Wager. 9617-9629 [doi]

Understanding the Role of Momentum in Stochastic Gradient MethodsIgor Gitman, Hunter Lang, Pengchuan Zhang, Lin Xiao. 9630-9640 [doi]

A neurally plausible model for online recognition and postdiction in a dynamical environmentLi Kevin Wenliang, Maneesh Sahani. 9641-9652 [doi]

Guided Meta-Policy SearchRussell Mendonca, Abhishek Gupta 0004, Rosen Kralev, Pieter Abbeel, Sergey Levine, Chelsea Finn. 9653-9664 [doi]

Towards Optimal Off-Policy Evaluation for Reinforcement Learning with Marginalized Importance SamplingTengyang Xie, Yifei Ma, Yu-Xiang Wang. 9665-9675 [doi]

Contextual Bandits with Cross-LearningSantiago R. Balseiro, Negin Golrezaei, Mohammad Mahdian, Vahab S. Mirrokni, Jon Schneider. 9676-9685 [doi]

Evaluating Protein Transfer Learning with TAPERoshan Rao, Nicholas Bhattacharya, Neil Thomas, Yan Duan, Peter Chen, John F. Canny, Pieter Abbeel, Yun S. Song. 9686-9698 [doi]

A Bayesian Theory of Conformity in Collective Decision MakingKoosha Khalvati, Saghar Mirbagheri, Seongmin A. Park, Jean-Claude Dreher, Rajesh P. Rao. 9699-9708 [doi]

Regularization Matters: Generalization and Optimization of Neural Nets v.s. their Induced KernelColin Wei, Jason D. Lee, Qiang Liu, Tengyu Ma. 9709-9721 [doi]

Data-dependent Sample Complexity of Deep Neural Networks via Lipschitz AugmentationColin Wei, Tengyu Ma. 9722-9733 [doi]

A Benchmark for Interpretability Methods in Deep Neural NetworksSara Hooker, Dumitru Erhan, Pieter-Jan Kindermans, Been Kim. 9734-9745 [doi]

Memory Efficient Adaptive OptimizationRohan Anil, Vineet Gupta 0001, Tomer Koren, Yoram Singer. 9746-9755 [doi]

Dynamic Incentive-Aware Learning: Robust Pricing in Contextual AuctionsNegin Golrezaei, Adel Javanmard, Vahab S. Mirrokni. 9756-9766 [doi]

Convergence-Rate-Matching Discretization of Accelerated Optimization Flows Through Opportunistic State-Triggered ControlMiguel Vaquero, Jorge Cortes. 9767-9776 [doi]

A Unified Framework for Data Poisoning Attack to Graph-based Semi-supervised LearningXuanqing Liu, Si Si, Jerry Zhu, Yang Li 0058, Cho-Jui Hsieh. 9777-9787 [doi]

Compositional generalization through meta sequence-to-sequence learningBrenden M. Lake. 9788-9798 [doi]

Bayesian Joint Estimation of Multiple Graphical ModelsLingrui Gan, Xinming Yang, Naveen N. Narisetty, Feng Liang. 9799-9809 [doi]

Practical Two-Step Lookahead Bayesian OptimizationJian Wu, Peter I. Frazier. 9810-9820 [doi]

Leader Stochastic Gradient Descent for Distributed Training of Deep Learning ModelsYunfei Teng, Wenbo Gao, François Chalus, Anna Choromanska, Donald Goldfarb, Adrian Weller. 9821-9831 [doi]

A Convex Relaxation Barrier to Tight Robustness Verification of Neural NetworksHadi Salman, Greg Yang, Huan Zhang 0001, Cho-Jui Hsieh, Pengchuan Zhang. 9832-9842 [doi]

Neural Jump Stochastic Differential EquationsJunteng Jia, Austin R. Benson. 9843-9854 [doi]

Learning metrics for persistence-based summaries and applications for graph classificationQi Zhao, Yusu Wang. 9855-9866 [doi]

On the Value of Target Data in Transfer LearningSteve Hanneke, Samory Kpotufe. 9867-9877 [doi]

Stochastic Variance Reduced Primal Dual Algorithms for Empirical Composition OptimizationAdithya M. Devraj, Jianshu Chen. 9878-9888 [doi]

On Robustness of Principal Component RegressionAnish Agarwal, Devavrat Shah, Dennis Shen, Dogyoon Song. 9889-9900 [doi]

Meta Learning with Relational Information for Short SequencesYujia Xie, Haoming Jiang, Feng Liu, Tuo Zhao, Hongyuan Zha. 9901-9912 [doi]

Residual Flows for Invertible Generative ModelingTian Qi Chen, Jens Behrmann, David Duvenaud, Jörn-Henrik Jacobsen. 9913-9923 [doi]

Multi-Agent Common Knowledge Reinforcement LearningChristian Schröder de Witt, Jakob N. Foerster, Gregory Farquhar, Philip H. S. Torr, Wendelin Boehmer, Shimon Whiteson. 9924-9935 [doi]

Learning to Learn By Self-CritiqueAntreas Antoniou, Amos J. Storkey. 9936-9946 [doi]

Wide Feedforward or Recurrent Neural Networks of Any Architecture are Gaussian ProcessesGreg Yang. 9947-9960 [doi]

Neural Networks with Cheap Differential OperatorsTian Qi Chen, David Duvenaud. 9961-9971 [doi]

Transductive Zero-Shot Learning with Visual Structure ConstraintZiyu Wan, Dongdong Chen, Yan Li, Xingguang Yan, Junge Zhang, Yizhou Yu, Jing Liao 0001. 9972-9982 [doi]

Dying Experts: Efficient Algorithms with Optimal Regret BoundsHamid Shayestehmanesh, Sajjad Azami, Nishant A. Mehta. 9983-9992 [doi]

Model Similarity Mitigates Test Set OveruseHoria Mania, John Miller, Ludwig Schmidt, Moritz Hardt, Benjamin Recht. 9993-10002 [doi]

A unified theory for the origin of grid cells through the lens of pattern formationBen Sorscher, Gabriel Mel, Surya Ganguli, Samuel A. Ocko. 10003-10013 [doi]

On Sample Complexity Upper and Lower Bounds for Exact Ranking from Noisy ComparisonsWenbo Ren, Jia Liu 0002, Ness B. Shroff. 10014-10024 [doi]

Hierarchical Decision Making by Generating and Following Natural Language InstructionsHengyuan Hu, Denis Yarats, Qucheng Gong, Yuandong Tian, Mike Lewis. 10025-10034 [doi]

SHE: A Fast and Accurate Deep Neural Network for Encrypted DataQian Lou, Lei Jiang 0001. 10035-10043 [doi]

Locality-Sensitive Hashing for f-Divergences: Mutual Information Loss and BeyondLin Chen, Hossein Esfandiari, Gang Fu, Vahab S. Mirrokni. 10044-10054 [doi]

A Game Theoretic Approach to Class-wise Selective RationalizationShiyu Chang, Yang Zhang, Mo Yu, Tommi S. Jaakkola. 10055-10065 [doi]

Efficiently avoiding saddle points with zero order methods: No gradients requiredEmmanouil-Vasileios Vlatakis-Gkaragkounis, Lampros Flokas, Georgios Piliouras. 10066-10077 [doi]

Metamers of neural networks reveal divergence from human perceptual systemsJenelle Feather, Alex Durango, Ray Gonzalez, Josh McDermott. 10078-10089 [doi]

Spatial-Aware Feature Aggregation for Image based Cross-View Geo-LocalizationYujiao Shi, Liu Liu 0009, Xin Yu, Hongdong Li. 10090-10100 [doi]

Decentralized sketching of low rank matricesRakshith Sharma Srinivasa, Kiryung Lee, Marius Junge, Justin Romberg. 10101-10110 [doi]

1-Norm LossZhao Song, David P. Woodruff, Peilin Zhong. 10111-10121 [doi]

Efficient Forward Architecture SearchHanzhang Hu, John Langford 0001, Rich Caruana, Saurajit Mukherjee, Eric Horvitz, Debadeepta Dey. 10122-10131 [doi]

Unsupervised Meta-Learning for Few-Shot Image ClassificationSiavash Khodadadeh, Ladislau Bölöni, Mubarak Shah. 10132-10142 [doi]

Learning Mixtures of Plackett-Luce Models from Structured Partial OrdersZhibing Zhao, Lirong Xia. 10143-10153 [doi]

Certainty Equivalence is Efficient for Linear Quadratic ControlHoria Mania, Stephen Tu, Benjamin Recht. 10154-10164 [doi]

Scalable Bayesian inference of dendritic voltage via spatiotemporal recurrent state space modelsRuoxi Sun, Scott Linderman, Ian Kinsella, Liam Paninski. 10165-10174 [doi]

Logarithmic Regret for Online ControlNaman Agarwal, Elad Hazan, Karan Singh. 10175-10184 [doi]

Elliptical Perturbations for Differential PrivacyMatthew Reimherr, Jordan Awan. 10185-10196 [doi]

Devign: Effective Vulnerability Identification by Learning Comprehensive Program Semantics via Graph Neural NetworksYaqin Zhou, Shangqing Liu, Jing Kai Siow, Xiaoning Du, Yang Liu 0003. 10197-10207 [doi]

KNG: The K-Norm Gradient MechanismMatthew Reimherr, Jordan Awan. 10208-10219 [doi]

CXPlain: Causal Explanations for Model Interpretation under UncertaintyPatrick Schwab, Walter Karlen. 10220-10230 [doi]

Regularized Anderson Acceleration for Off-Policy Deep Reinforcement LearningWenjie Shi, Shiji Song, Hui Wu, Ya-Chu Hsu, Cheng Wu, Gao Huang. 10231-10241 [doi]

STREETS: A Novel Camera Network Dataset for Traffic FlowCorey Snyder, Minh Do. 10242-10253 [doi]

Sequential Neural ProcessesGautam Singh, Jaesik Yoon, Youngsung Son, Sungjin Ahn. 10254-10264 [doi]

Policy Continuation with Hindsight Inverse DynamicsHao Sun, Zhizhong Li, Xiaotong Liu, Bolei Zhou, Dahua Lin. 10265-10275 [doi]

Learning to Self-Train for Semi-Supervised Few-Shot ClassificationXinzhe Li, Qianru Sun, Yaoyao Liu, Qin Zhou, Shibao Zheng, Tat-Seng Chua, Bernt Schiele. 10276-10286 [doi]

Temporal FiLM: Capturing Long-Range Sequence Dependencies with Feature-Wise ModulationsSawyer Birnbaum, Volodymyr Kuleshov, S. Zayd Enam, Pang Wei Koh, Stefano Ermon. 10287-10298 [doi]

From Complexity to Simplicity: Adaptive ES-Active Subspaces for Blackbox OptimizationKrzysztof Choromanski, Aldo Pacchiano, Jack Parker-Holder, Yunhao Tang, Vikas Sindhwani. 10299-10309 [doi]

On the Expressive Power of Deep Polynomial Neural NetworksJoe Kileel, Matthew Trager, Joan Bruna. 10310-10319 [doi]

DETOX: A Redundancy-based Framework for Faster and More Robust Gradient AggregationShashank Rajput, Hongyi Wang, Zachary B. Charles, Dimitris S. Papailiopoulos. 10320-10330 [doi]

Can SGD Learn Recurrent Neural Networks with Provable Generalization?Zeyuan Allen Zhu, Yuanzhi Li. 10331-10341 [doi]

Limits of Private Learning with Access to Public DataRaef Bassily, Shay Moran, Noga Alon. 10342-10352 [doi]

Discrete Object Generation with Reversible Inductive ConstructionAri Seff, Wenda Zhou, Farhan Damani, Abigail Doyle, Ryan P. Adams. 10353-10363 [doi]

Efficient Near-Optimal Testing of Community Changes in Balanced Stochastic Block ModelsAditya Gangrade, Praveen Venkatesh, Bobak Nazer, Venkatesh Saligrama. 10364-10375 [doi]

Keeping Your Distance: Solving Sparse Reward Tasks Using Self-Balancing Shaped RewardsAlexander Trott, Stephan Zheng, Caiming Xiong, Richard Socher. 10376-10386 [doi]

Superset Technique for Approximate Recovery in One-Bit Compressed SensingLarkin Flodin, Venkata Gandikota, Arya Mazumdar. 10387-10396 [doi]

Bandits with Feedback Graphs and Switching CostsRaman Arora, Teodor Vanislavov Marinov, Mehryar Mohri. 10397-10407 [doi]

Functional Adversarial AttacksCassidy Laidlaw, Soheil Feizi. 10408-10418 [doi]

Statistical-Computational Tradeoff in Single Index ModelsLingxiao Wang, Zhuoran Yang, Zhaoran Wang. 10419-10426 [doi]

On Fenchel Mini-Max LearningChenyang Tao, Liqun Chen, Shuyang Dai, Junya Chen, Ke Bai, Dong Wang, Jianfeng Feng, Wenlian Lu, Georgiy V. Bobashev, Lawrence Carin. 10427-10439 [doi]

MarginGAN: Adversarial Training in Semi-Supervised LearningJinhao Dong, Tong Lin. 10440-10449 [doi]

Poincaré Recurrence, Cycles and Spurious Equilibria in Gradient-Descent-Ascent for Non-Convex Non-Concave Zero-Sum GamesEmmanouil-Vasileios Vlatakis-Gkaragkounis, Lampros Flokas, Georgios Piliouras. 10450-10461 [doi]

A unified variance-reduced accelerated gradient method for convex optimizationGuanghui Lan, Zhize Li, Yi Zhou. 10462-10472 [doi]

Nearly Tight Bounds for Robust Proper Learning of Halfspaces with a MarginIlias Diakonikolas, Daniel Kane, Pasin Manurangsi. 10473-10484 [doi]

Same-Cluster Querying for Overlapping ClustersWasim Huleihel, Arya Mazumdar, Muriel Médard, Soumyabrata Pal. 10485-10495 [doi]

Efficient Convex Relaxations for Streaming PCARaman Arora, Teodor Vanislavov Marinov. 10496-10505 [doi]

Learning Robust Global Representations by Penalizing Local Predictive PowerHaohan Wang, Songwei Ge, Zachary C. Lipton, Eric P. Xing. 10506-10518 [doi]

Unsupervised Curricula for Visual Meta-Reinforcement LearningAllan Jabri, Kyle Hsu, Abhishek Gupta 0004, Ben Eysenbach, Sergey Levine, Chelsea Finn. 10519-10530 [doi]

Sample Complexity of Learning Mixture of Sparse Linear RegressionsAkshay Krishnamurthy, Arya Mazumdar, Andrew McGregor 0001, Soumyabrata Pal. 10531-10540 [doi]

Large Scale Adversarial Representation LearningJeff Donahue, Karen Simonyan. 10541-10551 [doi]

G2SAT: Learning to Generate SAT FormulasJiaxuan You, Haoze Wu 0001, Clark W. Barrett, Raghuram Ramanujan, Jure Leskovec. 10552-10563 [doi]

Neural Trust Region/Proximal Policy Optimization Attains Globally Optimal PolicyBoyi Liu, Qi Cai, Zhuoran Yang, Zhaoran Wang. 10564-10575 [doi]

Dimensionality reduction: theoretical perspective on practical measuresYair Bartal, Nova Fandina, Ofer Neiman. 10576-10588 [doi]

Oracle-Efficient Algorithms for Online Linear Optimization with Bandit FeedbackShinji Ito, Daisuke Hatano, Hanna Sumita, Kei Takemura, Takuro Fukunaga, Naonori Kakimura, Ken-ichi Kawarabayashi. 10589-10598 [doi]

Multilabel reductions: what is my loss optimising?10599-10610 [doi]

Tight Sample Complexity of Learning One-hidden-layer Convolutional Neural NetworksYuan Cao, Quanquan Gu. 10611-10621 [doi]

Deep Gamblers: Learning to Abstain with Portfolio TheoryZiyin Liu, Zhikang Wang, Paul Pu Liang, Russlan Salakhutdinov, Louis-Philippe Morency, Masahito Ueda. 10622-10632 [doi]

Two Time-scale Off-Policy TD Learning: Non-asymptotic Analysis over Markovian SamplesTengyu Xu, Shaofeng Zou, Yingbin Liang. 10633-10643 [doi]

Transfer Learning via Minimizing the Performance Gap Between DomainsBoyu Wang, Jorge A. Mendez, Mingbo Cai, Eric Eaton. 10644-10654 [doi]

Splitting Steepest Descent for Growing Neural ArchitecturesLemeng Wu, Dilin Wang, Qiang Liu 0001. 10655-10665 [doi]

Sequential Experimental Design for Transductive Linear BanditsTanner Fiez, Lalit Jain, Kevin G. Jamieson, Lillian J. Ratliff. 10666-10676 [doi]

Time Matters in Regularizing Deep Networks: Weight Decay and Data Augmentation Affect Early Learning Dynamics, Matter Little Near ConvergenceAditya Golatkar, Alessandro Achille, Stefano Soatto. 10677-10687 [doi]

Outlier-Robust High-Dimensional Sparse Estimation via Iterative FilteringIlias Diakonikolas, Daniel Kane, Sushrut Karmalkar, Eric Price, Alistair Stewart. 10688-10699 [doi]

Variational Graph Recurrent Neural NetworksEhsan Hajiramezanali, Arman Hasanzadeh, Krishna R. Narayanan, Nick Duffield, Mingyuan Zhou, Xiaoning Qian. 10700-10710 [doi]

Semi-Implicit Graph Variational Auto-EncodersArman Hasanzadeh, Ehsan Hajiramezanali, Krishna R. Narayanan, Nick Duffield, Mingyuan Zhou, Xiaoning Qian. 10711-10722 [doi]

Unsupervised Learning of Object Keypoints for Perception and ControlTejas D. Kulkarni, Ankush Gupta, Catalin Ionescu, Sebastian Borgeaud, Malcolm Reynolds, Andrew Zisserman, Volodymyr Mnih. 10723-10733 [doi]

A Model-Based Reinforcement Learning with Adversarial Training for Online RecommendationXueying Bai, Jian Guan, Hongning Wang. 10734-10745 [doi]

Optimizing Generalized Rate Metrics with Three PlayersHarikrishna Narasimhan, Andrew Cotter, Maya Gupta. 10746-10757 [doi]

Consistency-based Semi-supervised Learning for Object detectionJisoo Jeong, Seungeui Lee, Jeesoo Kim, Nojun Kwak. 10758-10767 [doi]

Rates of Convergence for Large-scale Nearest Neighbor ClassificationXingye Qiao, Jiexin Duan, Guang Cheng. 10768-10779 [doi]

An Embedding Framework for Consistent Polyhedral SurrogatesJessica Finocchiaro, Rafael M. Frongillo, Bo Waggoner. 10780-10790 [doi]

Cross-Modal Learning with Adversarial SamplesChao Li, Shangqian Gao, Cheng Deng, De Xie, Wei Liu. 10791-10801 [doi]

Fast-rate PAC-Bayes Generalization Bounds via Shifted Rademacher ProcessesJun Yang, Shengyang Sun, Daniel M. Roy 0001. 10802-10812 [doi]

Input-Cell Attention Reduces Vanishing Saliency of Recurrent Neural NetworksAya Abdelsalam Ismail, Mohamed K. Gunady, Luiz Pessoa, Héctor Corrada Bravo, Soheil Feizi. 10813-10823 [doi]

Program Synthesis and Semantic Parsing with Learned Code IdiomsEui Chul Richard Shin, Miltiadis Allamanis, Marc Brockschmidt, Alex Polozov. 10824-10834 [doi]

Generalization Bounds of Stochastic Gradient Descent for Wide and Deep Neural NetworksYuan Cao, Quanquan Gu. 10835-10845 [doi]

High-Dimensional Optimization in Adaptive Random SubspacesJonathan Lacotte, Mert Pilanci, Marco Pavone. 10846-10856 [doi]

Random Projections with Asymmetric QuantizationXiaoyun Li, Ping Li. 10857-10866 [doi]

Superposition of many models into oneBrian Cheung, Alexander Terekhov, Yubei Chen, Pulkit Agrawal, Bruno A. Olshausen. 10867-10876 [doi]

Private Testing of Distributions via Sample PermutationsMaryam Aliakbarpour, Ilias Diakonikolas, Daniel Kane, Ronitt Rubinfeld. 10877-10888 [doi]

McDiarmid-Type Inequalities for Graph-Dependent Variables and Stability BoundsRui Ray Zhang, Xingwu Liu, Yuyi Wang 0001, Liwei Wang. 10889-10899 [doi]

How to Initialize your Network? Robust Initialization for WeightNorm & ResNetsDevansh Arpit, Víctor Campos, Yoshua Bengio. 10900-10909 [doi]

On Making Stochastic Classifiers DeterministicAndrew Cotter, Maya R. Gupta, Harikrishna Narasimhan. 10910-10920 [doi]

Statistical Analysis of Nearest Neighbor Methods for Anomaly DetectionXiaoyi Gu, Leman Akoglu, Alessandro Rinaldo. 10921-10931 [doi]

Improving Black-box Adversarial Attacks with a Transfer-based PriorShuyu Cheng, Yinpeng Dong, Tianyu Pang, Hang Su, Jun Zhu. 10932-10942 [doi]

Break the Ceiling: Stronger Multi-scale Deep Graph Convolutional NetworksSitao Luan, Mingde Zhao, Xiao-Wen Chang, Doina Precup. 10943-10953 [doi]

Statistical Model Aggregation via Parameter MatchingMikhail Yurochkin, Mayank Agarwal, Soumya Ghosh, Kristjan H. Greenewald, Trong Nghia Hoang. 10954-10964 [doi]

On the (In)fidelity and Sensitivity of ExplanationsChih-Kuan Yeh, Cheng-Yu Hsieh, Arun Sai Suggala, David I. Inouye, Pradeep Ravikumar. 10965-10976 [doi]

Exponential Family Estimation via Adversarial Dynamics EmbeddingBo Dai, Zhen Liu, Hanjun Dai, Niao He, Arthur Gretton, Le Song, Dale Schuurmans. 10977-10988 [doi]

The Broad Optimality of Profile Maximum LikelihoodYi Hao, Alon Orlitsky. 10989-11001 [doi]

MintNet: Building Invertible Neural Networks with Masked ConvolutionsYang Song, Chenlin Meng, Stefano Ermon. 11002-11012 [doi]

Information-Theoretic Generalization Bounds for SGLD via Data-Dependent EstimatesJeffrey Negrea, Mahdi Haghifam, Gintare Karolina Dziugaite, Ashish Khisti, Daniel M. Roy 0001. 11013-11023 [doi]

On Distributed Averaging for Stochastic k-PCAAditya Bhaskara, Maheshakya Wijewardena. 11024-11033 [doi]

Controllable Unsupervised Text Attribute Transfer via Editing Entangled Latent RepresentationKe Wang, Hang Hua, Xiaojun Wan 0001. 11034-11044 [doi]

MaxGap Bandit: Adaptive Algorithms for Approximate RankingSumeet Katariya, Ardhendu Tripathy, Robert D. Nowak. 11045-11055 [doi]

Bias Correction of Learned Generative Models using Likelihood-Free Importance WeightingAditya Grover, Jiaming Song, Ashish Kapoor, Kenneth Tran, Alekh Agarwal, Eric Horvitz, Stefano Ermon. 11056-11068 [doi]

Online Forecasting of Total-Variation-bounded SequencesDheeraj Baby, Yu-Xiang Wang. 11069-11079 [doi]

Local SGD with Periodic Averaging: Tighter Analysis and Adaptive SynchronizationFarzin Haddadpour, Mohammad Mahdi Kamani, Mehrdad Mahdavi, Viveck R. Cadambe. 11080-11092 [doi]

Data Parameters: A New Family of Parameters for Learning a Differentiable CurriculumShreyas Saxena, Oncel Tuzel, Dennis DeCoste. 11093-11103 [doi]

Unified Sample-Optimal Property Estimation in Near-Linear TimeYi Hao, Alon Orlitsky. 11104-11114 [doi]

Region Mutual Information Loss for Semantic SegmentationShuai Zhao, Yang Wang 0030, Zheng Yang, Deng Cai. 11115-11125 [doi]

Learning Stable Deep Dynamics ModelsJ. Zico Kolter, Gaurav Manek. 11126-11134 [doi]

Image Captioning: Transforming Objects into WordsSimao Herdade, Armin Kappeler, Kofi Boakye, Joao Soares. 11135-11145 [doi]

Greedy Sampling for Approximate Clustering in the Presence of OutliersAditya Bhaskara, Sharvaree Vadgama, Hong Xu. 11146-11155 [doi]

Adversarial Fisher Vectors for Unsupervised Representation LearningShuangfei Zhai, Walter Talbott, Carlos Guestrin, Joshua Susskind. 11156-11166 [doi]

On Tractable Computation of Expected PredictionsPasha Khosravi, Yoojung Choi, Yitao Liang, Antonio Vergari, Guy Van den Broeck. 11167-11178 [doi]

Levenshtein TransformerJiatao Gu, Changhan Wang, Junbo Zhao. 11179-11189 [doi]

Unlabeled Data Improves Adversarial RobustnessYair Carmon, Aditi Raghunathan, Ludwig Schmidt, John C. Duchi, Percy Liang. 11190-11201 [doi]

Machine Teaching of Active Sequential LearnersTomi Peltola, Mustafa Mert Çelikok, Pedram Daee, Samuel Kaski. 11202-11213 [doi]

Gaussian-Based Pooling for Convolutional Neural NetworksTakumi Kobayashi. 11214-11224 [doi]

Meta Architecture SearchAlbert Shaw, Wei Wei, Weiyang Liu, Le Song, Bo Dai. 11225-11235 [doi]

NAOMI: Non-Autoregressive Multiresolution Sequence ImputationYukai Liu, Rose Yu, Stephan Zheng, Eric Zhan, Yisong Yue. 11236-11246 [doi]

Layer-Dependent Importance Sampling for Training Deep and Large Graph Convolutional NetworksDifan Zou, Ziniu Hu, Yewen Wang, Song Jiang, Yizhou Sun, Quanquan Gu. 11247-11256 [doi]

Two Generator Game: Learning to Sample via Linear Goodness-of-Fit TestLizhong Ding, Mengyang Yu, Li Liu, Fan Zhu 0001, Yong Liu, Yu Li, Ling Shao. 11257-11268 [doi]

Distribution oblivious, risk-aware algorithms for multi-armed bandits with unbounded rewardsAnmol Kagrecha, Jayakrishnan Nair, Krishna P. Jagannathan. 11269-11278 [doi]

Private Stochastic Convex Optimization with Optimal RatesRaef Bassily, Vitaly Feldman, Kunal Talwar, Abhradeep Guha Thakurta. 11279-11288 [doi]

Provably Robust Deep Learning via Adversarially Trained Smoothed ClassifiersHadi Salman, Jerry Li, Ilya P. Razenshteyn, Pengchuan Zhang, Huan Zhang, Sébastien Bubeck, Greg Yang. 11289-11300 [doi]

Demystifying Black-box Models with Symbolic MetamodelsAhmed M. Alaa, Mihaela van der Schaar. 11301-11311 [doi]

Neural Temporal-Difference Learning Converges to Global OptimaQi Cai, Zhuoran Yang, Jason D. Lee, Zhaoran Wang. 11312-11322 [doi]

Privacy-Preserving Q-Learning with Functional Noise in Continuous SpacesBaoxiang Wang, Nidhi Hegde. 11323-11333 [doi]

Attentive State-Space Modeling of Disease ProgressionAhmed M. Alaa, Mihaela van der Schaar. 11334-11344 [doi]

Online EXP3 Learning in Adversarial Bandits with Delayed FeedbackIlai Bistritz, Zhengyuan Zhou, Xi Chen, Nicholas Bambos, Jose Blanchet. 11345-11354 [doi]

A Direct tilde{O}(1/epsilon) Iteration Parallel Algorithm for Optimal TransportArun Jambulapati, Aaron Sidford, Kevin Tian. 11355-11366 [doi]

Faster Boosting with Smaller MemoryJulaiti Alafate, Yoav Freund. 11367-11376 [doi]

Variance Reduction for Matrix GamesYair Carmon, Yujia Jin, Aaron Sidford, Kevin Tian. 11377-11388 [doi]

Learning Neural Networks with Adaptive RegularizationHan Zhao 0002, Yao-Hung Hubert Tsai, Russlan Salakhutdinov, Geoffrey J. Gordon. 11389-11400 [doi]

Distributed estimation of the inverse Hessian by determinantal averagingMichal Derezinski, Michael W. Mahoney. 11401-11411 [doi]

Smoothing Structured Decomposable CircuitsAndy Shih, Guy Van den Broeck, Paul Beame, Antoine Amarilli. 11412-11422 [doi]

Efficient and Accurate Estimation of Lipschitz Constants for Deep Neural NetworksMahyar Fazlyab, Alexander Robey, Hamed Hassani, Manfred Morari, George J. Pappas. 11423-11434 [doi]

Provable Non-linear Inductive Matrix CompletionKai Zhong, Zhao Song, Prateek Jain 0002, Inderjit S. Dhillon. 11435-11445 [doi]

Communication-Efficient Distributed Blockwise Momentum SGD with Error-FeedbackShuai Zheng 0004, Ziyue Huang, James T. Kwok. 11446-11456 [doi]

Sparse Variational Inference: Bayesian Coresets from ScratchTrevor Campbell, Boyan Beronov. 11457-11468 [doi]

Personalizing Many Decisions with High-Dimensional CovariatesNima Hamidi, Mohsen Bayati, Kapil Gupta. 11469-11480 [doi]

A Necessary and Sufficient Stability Notion for Adaptive GeneralizationMoshe Shenfeld, Katrina Ligett. 11481-11490 [doi]

Necessary and Sufficient Geometries for Gradient MethodsDaniel Levy, John C. Duchi. 11491-11501 [doi]

Landmark Ordinal EmbeddingNikhil Ghosh, Yuxin Chen 0001, Yisong Yue. 11502-11511 [doi]

Identification of Conditional Causal Effects under Markov EquivalenceAmin Jaber, Jiji Zhang, Elias Bareinboim. 11512-11520 [doi]

The Thermodynamic Variational ObjectiveVaden Masrani, Tuan Anh Le, Frank Wood. 11521-11530 [doi]

Global Guarantees for Blind Demodulation with Generative PriorsPaul Hand, Babhru Joshi. 11531-11541 [doi]

Exact sampling of determinantal point processes with sublinear time preprocessingMichal Derezinski, Daniele Calandriello, Michal Valko. 11542-11554 [doi]

Geometry-Aware Neural RenderingJoshua Tobin, Wojciech Zaremba, Pieter Abbeel. 11555-11565 [doi]

Variational Temporal AbstractionTaesup Kim, Sungjin Ahn, Yoshua Bengio. 11566-11575 [doi]

Subquadratic High-Dimensional Hierarchical ClusteringAmir Abboud, Vincent Cohen-Addad, Hussein Houdrouge. 11576-11586 [doi]

Learning Auctions with Robust Incentive GuaranteesJacob D. Abernethy, Rachel Cummings, Bhuvesh Kumar, Sam Taggart, Jamie H. Morgenstern. 11587-11597 [doi]

Policy Optimization Provably Converges to Nash Equilibria in Zero-Sum Linear Quadratic GamesKaiqing Zhang, Zhuoran Yang, Tamer Basar. 11598-11610 [doi]

Uniform convergence may be unable to explain generalization in deep learningVaishnavh Nagarajan, J. Zico Kolter. 11611-11622 [doi]

A Zero-Positive Learning Approach for Diagnosing Software Performance RegressionsMejbah Alam, Justin Gottschlich, Nesime Tatbul, Javier S. Turek, Tim Mattson, Abdullah Muzahid. 11623-11635 [doi]

DTWNet: a Dynamic Time Warping NetworkXingyu Cai, Tingyang Xu, Jinfeng Yi, JunZhou Huang, Sanguthevar Rajasekaran. 11636-11646 [doi]

Structured Graph Learning Via Laplacian Spectral ConstraintsSandeep Kumar 0005, Jiaxi Ying, José Vinícius de Miranda Cardoso, Daniel P. Palomar. 11647-11658 [doi]

Thresholding Bandit with Optimal Aggregate RegretChao Tao, Saúl A. Blanco, Jian Peng 0001, Yuan Zhou 0007. 11659-11668 [doi]

Towards Explaining the Regularization Effect of Initial Large Learning Rate in Training Neural NetworksYuanzhi Li, Colin Wei, Tengyu Ma. 11669-11680 [doi]

Rethinking Kernel Methods for Node Representation Learning on GraphsYu Tian, Long Zhao, Xi Peng 0005, Dimitris N. Metaxas. 11681-11692 [doi]

Causal Confusion in Imitation LearningPim de Haan, Dinesh Jayaraman, Sergey Levine. 11693-11704 [doi]

Optimizing Generalized PageRank Methods for Seed-Expansion Community DetectionPan Li 0005, I (Eli) Chien, Olgica Milenkovic. 11705-11716 [doi]

The Case for Evaluating Causal Models Using Interventional Measures and Empirical DataAmanda Gentzel, Dan Garant, David Jensen. 11717-11727 [doi]

Dimension-Free Bounds for Low-Precision TrainingZheng Li, Christopher De Sa. 11728-11738 [doi]

Concentration of risk measures: A Wasserstein distance approachSanjay P. Bhat, Prashanth L. A.. 11739-11748 [doi]

Meta-Inverse Reinforcement Learning with Probabilistic Context VariablesLantao Yu, Tianhe Yu, Chelsea Finn, Stefano Ermon. 11749-11760 [doi]

Stabilizing Off-Policy Q-Learning via Bootstrapping Error ReductionAviral Kumar, Justin Fu, Matthew Soh, George Tucker, Sergey Levine. 11761-11771 [doi]

Bayesian Optimization with Unknown Search SpaceHuong Ha, Santu Rana, Sunil Gupta 0001, Thanh Nguyen, Hung Tran-The, Svetha Venkatesh. 11772-11781 [doi]

On the Downstream Performance of Compressed Word EmbeddingsAvner May, Jian Zhang, Tri Dao, Christopher Ré. 11782-11793 [doi]

Multivariate Distributionally Robust Convex Regression under Absolute Error LossJose H. Blanchet, Peter W. Glynn, Jun Yan, Zhengqing Zhou. 11794-11803 [doi]

Neural Relational Inference with Fast Modular Meta-learningFerran Alet, Erica Weng, Tomás Lozano-Pérez, Leslie Pack Kaelbling. 11804-11815 [doi]

Gradient based sample selection for online continual learningRahaf Aljundi, Min Lin, Baptiste Goujaud, Yoshua Bengio. 11816-11825 [doi]

Attribution-Based Confidence Metric For Deep Neural NetworksSusmit Jha, Sunny Raj, Steven Lawrence Fernandes, Sumit K. Jha, Somesh Jha, Brian Jalaian, Gunjan Verma, Ananthram Swami. 11826-11837 [doi]

Theoretical evidence for adversarial robustness through randomizationRafael Pinot, Laurent Meunier, Alexandre Araujo, Hisashi Kashima, Florian Yger, Cédric Gouy-Pailler, Jamal Atif. 11838-11848 [doi]

Online Continual Learning with Maximal Interfered RetrievalRahaf Aljundi, Eugene Belilovsky, Tinne Tuytelaars, Laurent Charlin, Massimo Caccia, Min Lin, Lucas Page-Caccia. 11849-11860 [doi]

Neural Attribution for Semantic Bug-Localization in Student ProgramsRahul Gupta, Aditya Kanade, Shirish K. Shevade. 11861-11871 [doi]

Adaptive Temporal-Difference Learning for Policy Evaluation with Per-State Uncertainty EstimatesCarlos Riquelme, Hugo Penedones, Damien Vincent, Hartmut Maennel, Sylvain Gelly, Timothy A. Mann, André Barreto, Gergely Neu. 11872-11882 [doi]

SPoC: Search-based Pseudocode to CodeSumith Kulal, Panupong Pasupat, Kartik Chandra, Mina Lee 0002, Oded Padon, Alex Aiken, Percy Liang. 11883-11894 [doi]

Generative Modeling by Estimating Gradients of the Data DistributionYang Song, Stefano Ermon. 11895-11907 [doi]

Adversarial Music: Real world Audio Adversary against Wake-word Detection SystemJuncheng Li 0001, Shuhui Qu, Xinjian Li, Joseph Szurley, J. Zico Kolter, Florian Metze. 11908-11918 [doi]

Prediction of Spatial Point Processes: Regularized Method with Out-of-Sample GuaranteesMuhammad Osama, Dave Zachariah, Peter Stoica. 11919-11928 [doi]

Debiased Bayesian inference for average treatment effectsKolyan Ray, Botond Szabó. 11929-11939 [doi]

Margin-Based Generalization Lower Bounds for Boosted ClassifiersAllan Grønlund, Lior Kamma, Kasper Green Larsen, Alexander Mathiasen, Jelani Nelson. 11940-11949 [doi]

Connections Between Mirror Descent, Thompson Sampling and the Information RatioJulian Zimmert, Tor Lattimore. 11950-11959 [doi]

Graph Transformer NetworksSeongjun Yun, Minbyul Jeong, Raehyun Kim, Jaewoo Kang, Hyunwoo J. Kim. 11960-11970 [doi]

Learning to Confuse: Generating Training Time Adversarial Data with Auto-EncoderJi Feng, Qi-Zhi Cai, Zhi-Hua Zhou. 11971-11981 [doi]

The Impact of Regularization on High-dimensional Logistic RegressionFariborz Salehi, Ehsan Abbasi, Babak Hassibi. 11982-11992 [doi]

Adaptive Density Estimation for Generative ModelsThomas Lucas, Konstantin Shmelkov, Karteek Alahari, Cordelia Schmid, Jakob Verbeek. 11993-12003 [doi]

Fast and Provable ADMM for Learning with Generative PriorsFabian Latorre Gómez, Armin Eftekhari, Volkan Cevher. 12004-12016 [doi]

Weighted Linear Bandits for Non-Stationary EnvironmentsYoan Russac, Claire Vernade, Olivier Cappé. 12017-12026 [doi]

Improved Regret Bounds for Bandit Combinatorial OptimizationShinji Ito, Daisuke Hatano, Hanna Sumita, Kei Takemura, Takuro Fukunaga, Naonori Kakimura, Ken-ichi Kawarabayashi. 12027-12036 [doi]

Pareto Multi-Task LearningXi Lin, Hui-Ling Zhen, Zhenhua Li 0005, Qing-Fu Zhang, Sam Kwong. 12037-12047 [doi]

SIC-MMAB: Synchronisation Involves Communication in Multiplayer Multi-Armed BanditsEtienne Boursier, Vianney Perchet. 12048-12057 [doi]

Novel positional encodings to enable tree-based transformersVighnesh Leonardo Shiv, Chris Quirk. 12058-12068 [doi]

A Domain Agnostic Measure for Monitoring and Evaluating GANsPaulina Grnarova, Kfir Y. Levy, Aurélien Lucchi, Nathanaël Perraudin, Ian Goodfellow, Thomas Hofmann, Andreas Krause 0001. 12069-12079 [doi]

Submodular Function Minimization with Noisy Evaluation OracleShinji Ito. 12080-12090 [doi]

Counting the Optimal Solutions in Graphical ModelsRadu Marinescu 0002, Rina Dechter. 12091-12101 [doi]

Modelling the Dynamics of Multiagent Q-Learning in Repeated Symmetric Games: a Mean Field Theoretic ApproachShuyue Hu, Chin-wing Leung, Ho-Fung Leung. 12102-12112 [doi]

Deep Multimodal Multilinear Fusion with High-order Polynomial PoolingMing Hou, Jiajia Tang, Jianhai Zhang, Wanzeng Kong, Qibin Zhao. 12113-12122 [doi]

Bootstrapping Upper Confidence BoundBotao Hao, Yasin Abbasi-Yadkori, Zheng Wen, Guang Cheng. 12123-12133 [doi]

Integer Discrete Flows and Lossless CompressionEmiel Hoogeboom, Jorn W. T. Peters, Rianne van den Berg, Max Welling. 12134-12144 [doi]

Structured Prediction with Projection OraclesMathieu Blondel. 12145-12156 [doi]

A Primal Dual Formulation For Deep Learning With ConstraintsYatin Nandwani, Abhishek Pathak, Mausam, Parag Singla. 12157-12168 [doi]

Screening Sinkhorn Algorithm for Regularized Optimal TransportMokhtar Z. Alaya, Maxime Berar, Gilles Gasso, Alain Rakotomamonjy. 12169-12179 [doi]

PAC-Bayes Un-Expected Bernstein InequalityZakaria Mhammedi, Peter Grünwald, Benjamin Guedj. 12180-12191 [doi]

Are Labels Required for Improving Adversarial Robustness?Jean-Baptiste Alayrac, Jonathan Uesato, Po-Sen Huang, Alhussein Fawzi, Robert Stanforth, Pushmeet Kohli. 12192-12202 [doi]

Tight Regret Bounds for Model-Based Reinforcement Learning with Greedy PoliciesYonathan Efroni, Nadav Merlis, Mohammad Ghavamzadeh, Shie Mannor. 12203-12213 [doi]

Multi-objective Bayesian optimisation with preferences over objectivesMajid Abdolshah, Alistair Shilton, Santu Rana, Sunil Gupta 0001, Svetha Venkatesh. 12214-12224 [doi]

Think out of the "Box": Generically-Constrained Asynchronous Composite Optimization and HedgingPooria Joulani, András György, Csaba Szepesvári. 12225-12235 [doi]

Calibration tests in multi-class classification: A unifying frameworkDavid Widmann, Fredrik Lindsten, Dave Zachariah. 12236-12246 [doi]

Classification Accuracy Score for Conditional Generative ModelsSuman V. Ravuri, Oriol Vinyals. 12247-12258 [doi]

Theoretical Analysis of Adversarial Learning: A Minimax ApproachZhuozhuo Tu, Jingwei Zhang, Dacheng Tao. 12259-12269 [doi]

Multiagent Evaluation under Incomplete InformationMark Rowland, Shayegan Omidshafiei, Karl Tuyls, Julien Pérolat, Michal Valko, Georgios Piliouras, Rémi Munos. 12270-12282 [doi]

Tree-Sliced Variants of Wasserstein DistancesTam Le, Makoto Yamada, Kenji Fukumizu, Marco Cuturi. 12283-12294 [doi]

Beyond temperature scaling: Obtaining well-calibrated multi-class probabilities with Dirichlet calibrationMeelis Kull, Miquel Perelló-Nieto, Markus Kängsepp, Telmo de Menezes e Silva Filho, Hao Song, Peter A. Flach. 12295-12305 [doi]

1 geometry improves kernel two-sample testingMeyer Scetbon, Gaël Varoquaux. 12306-12316 [doi]

Robustness Verification of Tree-based ModelsHongge Chen, Huan Zhang, Si Si, Yang Li 0058, Duane S. Boning, Cho-Jui Hsieh. 12317-12328 [doi]

Towards Interpretable Reinforcement Learning Using Attention Augmented AgentsAlexander Mott, Daniel Zoran, Mike Chrzanowski, Daan Wierstra, Danilo Jimenez Rezende. 12329-12338 [doi]

Fast and Accurate Stochastic Gradient EstimationBeidi Chen, Yingchen Xu, Anshumali Shrivastava. 12339-12349 [doi]

Theoretical Limits of Pipeline Parallel Optimization and Application to Distributed Deep LearningIgor Colin, Ludovic Dos Santos, Kevin Scaman. 12350-12359 [doi]

Root Mean Square Layer NormalizationBiao Zhang, Rico Sennrich. 12360-12371 [doi]

Universality in Learning from Linear MeasurementsEhsan Abbasi, Fariborz Salehi, Babak Hassibi. 12372-12382 [doi]

Planning in entropy-regularized Markov decision processes and gamesJean-Bastien grill, Omar Darwiche Domingues, Pierre Ménard, Rémi Munos, Michal Valko. 12383-12392 [doi]

Exponentially convergent stochastic k-PCA without variance reductionCheng Tang. 12393-12404 [doi]

R2D2: Reliable and Repeatable Detector and DescriptorJérôme Revaud, César Roberto de Souza, Martin Humenberger, Philippe Weinzaepfel. 12405-12415 [doi]

Selective Sampling-based Scalable Sparse Subspace ClusteringShin Matsushima, Maria Brbic. 12416-12425 [doi]

A General Framework for Symmetric Property EstimationMoses Charikar, Kirankumar Shiragur, Aaron Sidford. 12426-12436 [doi]

Structured Variational Inference in Continuous Cox Process ModelsVirginia Aglietti, Edwin V. Bonilla, Theodoros Damoulas, Sally Cripps. 12437-12447 [doi]

Generalization of Reinforcement Learners with Working and Episodic MemoryMeire Fortunato, Melissa Tan, Ryan Faulkner, Steven Hansen, Adrià Puigdomènech Badia, Gavin Buttimore, Charles Deck, Joel Z. Leibo, Charles Blundell. 12448-12457 [doi]

Distribution Learning of a Random Spatial Field with a Location-Unaware Mobile SensorMeera Pai, Animesh Kumar. 12458-12466 [doi]

Hindsight Credit AssignmentAnna Harutyunyan, Will Dabney, Thomas Mesnard, Mohammad Gheshlaghi Azar, Bilal Piot, Nicolas Heess, Hado van Hasselt, Gregory Wayne, Satinder Singh, Doina Precup, Rémi Munos. 12467-12476 [doi]

Efficient Identification in Linear Structural Causal Models with Instrumental CutsetsDaniel Kumor, Bryant Chen, Elias Bareinboim. 12477-12486 [doi]

Kernelized Bayesian Softmax for Text GenerationNing Miao, Hao Zhou, Chengqi Zhao, Wenxian Shi, Lei Li. 12487-12497 [doi]

When to Trust Your Model: Model-Based Policy OptimizationMichael Janner, Justin Fu, Marvin Zhang, Sergey Levine. 12498-12509 [doi]

Correlation Clustering with Adaptive Similarity QueriesMarco Bressan 0002, Nicolò Cesa-Bianchi, Andrea Paudice, Fabio Vitale. 12510-12519 [doi]

Control What You Can: Intrinsically Motivated Task-Planning AgentSebastian Blaes, Marin Vlastelica Pogancic, Jia-Jie Zhu, Georg Martius. 12520-12531 [doi]

Selecting causal brain features with a single conditional independence test per featureAtalanti-Anastasia Mastakouri, Bernhard Schölkopf, Dominik Janzing. 12532-12543 [doi]

Continuous Hierarchical Representations with Poincaré Variational Auto-EncodersEmile Mathieu, Charline Le Lan, Chris J. Maddison, Ryota Tomioka, Yee Whye Teh. 12544-12555 [doi]

A Generic Acceleration Framework for Stochastic Composite OptimizationAndrei Kulunchakov, Julien Mairal. 12556-12567 [doi]

Beating SGD Saturation with Tail-Averaging and MinibatchingNicole Mücke, Gergely Neu, Lorenzo Rosasco. 12568-12577 [doi]

Random Quadratic Forms with Dependence: Applications to Restricted Isometry and BeyondArindam Banerjee, Qilong Gu, Vidyashankar Sivakumar, Steven Z. Wu. 12578-12588 [doi]

Continuous-time Models for Stochastic Optimization AlgorithmsAntonio Orvieto, Aurélien Lucchi. 12589-12601 [doi]

Curriculum-guided Hindsight Experience ReplayMeng Fang, Tianyi Zhou, Yali Du, Lei Han, Zhengyou Zhang. 12602-12613 [doi]

Implicit Semantic Data Augmentation for Deep NetworksYulin Wang, Xuran Pan, Shiji Song, Hong Zhang, Gao Huang, Cheng Wu. 12614-12623 [doi]

MetaInit: Initializing learning by learning to initializeYann N. Dauphin, Samuel S. Schoenholz. 12624-12636 [doi]

Scalable Deep Generative Relational Model with High-Order Node DependenceXuhui Fan, Bin Li 0015, Caoyuan Li, Scott Sisson, Ling Chen 0006. 12637-12647 [doi]

Random Path Selection for Continual LearningJathushan Rajasegaran, Munawar Hayat, Salman H. Khan 0001, Fahad Shahbaz Khan, Ling Shao 0001. 12648-12658 [doi]

Efficient Algorithms for Smooth Minimax OptimizationKiran Koshy Thekumparampil, Prateek Jain 0002, Praneeth Netrapalli, Sewoong Oh. 12659-12670 [doi]

Shadowing Properties of Optimization AlgorithmsAntonio Orvieto, Aurélien Lucchi. 12671-12682 [doi]

Causal RegularizationDominik Janzing. 12683-12693 [doi]

Learning Hawkes Processes from a handful of eventsFarnood Salehi, William Trouleau, Matthias Grossglauser, Patrick Thiran. 12694-12704 [doi]

Unsupervised Object Segmentation by RedrawingMickaël Chen, Thierry Artières, Ludovic Denoyer. 12705-12716 [doi]

Regret Bounds for Learning State Representations in Reinforcement LearningRonald Ortner, Matteo Pirotta, Alessandro Lazaric, Ronan Fruit, Odalric-Ambrym Maillard. 12717-12727 [doi]

Band-Limited Gaussian Processes: The Sinc KernelFelipe Tobar. 12728-12738 [doi]

Leveraging Labeled and Unlabeled Data for Consistent Fair Binary ClassificationEvgenii Chzhen, Christophe Denis, Mohamed Hebiri, Luca Oneto, Massimiliano Pontil. 12739-12750 [doi]

Learning search spaces for Bayesian optimization: Another view of hyperparameter transfer learningValerio Perrone, Huibin Shen. 12751-12761 [doi]

Streaming Bayesian Inference for Crowdsourced ClassificationEdoardo Manino, Long Tran-Thanh, Nicholas R. Jennings. 12762-12772 [doi]

Neuropathic Pain Diagnosis Simulator for Causal Discovery Algorithm EvaluationRuibo Tu, Kun Zhang 0001, Bo C. Bertilson, Hedvig Kjellström, Cheng Zhang 0005. 12773-12784 [doi]

Brain-Like Object Recognition with High-Performing Shallow Recurrent ANNsJonas Kubilius, Martin Schrimpf, Ha Hong, Najib J. Majaj, Rishi Rajalingham, Elias B. Issa, Kohitij Kar, Pouya Bashivan, Jonathan Prescott-Roy, Kailyn Schmidt, Aran Nayebi, Daniel Bear, Daniel L. Yamins, James J. DiCarlo. 12785-12796 [doi]

k-Means Clustering of Lines for Big DataYair Marom, Dan Feldman. 12797-12806 [doi]

Random Projections and Sampling Algorithms for Clustering of High-Dimensional Polygonal CurvesStefan Meintrup, Alexander Munteanu, Dennis Rohde. 12807-12817 [doi]

Recurrent Space-time Graph Neural NetworksAndrei Liviu Nicolicioiu, Iulia Duta, Marius Leordeanu. 12818-12830 [doi]

Uncertainty on Asynchronous Time Event PredictionBertrand Charpentier, Marin Bilos, Stephan Günnemann. 12831-12840 [doi]

Accurate, reliable and fast robustness evaluationWieland Brendel, Jonas Rauber, Matthias Kümmerer, Ivan Ustyuzhaninov, Matthias Bethge. 12841-12851 [doi]

Sparse High-Dimensional Isotonic RegressionDavid Gamarnik, Julia Gaudio. 12852-12862 [doi]

Triad Constraints for Learning Causal Structure of Latent VariablesRuichu Cai, Feng Xie, Clark Glymour, Zhifeng Hao, Kun Zhang 0001. 12863-12872 [doi]

On the Inductive Bias of Neural Tangent KernelsAlberto Bietti, Julien Mairal. 12873-12884 [doi]

Cross-Domain Transferability of Adversarial PerturbationsMuzammal Naseer, Salman H. Khan 0001, Muhammad Haris Khan, Fahad Shahbaz Khan, Fatih Porikli. 12885-12895 [doi]

Shallow RNN: Accurate Time-series Classification on Resource Constrained DevicesDon Kurian Dennis, Durmus Alp Emre Acar, Vikram Mandikal, Vinu Sankar Sadasivan, Venkatesh Saligrama, Harsha Vardhan Simhadri, Prateek Jain. 12896-12906 [doi]

Kernel quadrature with DPPsAyoub Belhadji, Rémi Bardenet, Pierre Chainais. 12907-12917 [doi]

REM: From Structural Entropy to Community Structure DeceptionYiwei Liu, Jiamou Liu, Zijian Zhang, Liehuang Zhu, Angsheng Li. 12918-12928 [doi]

Sim2real transfer learning for 3D human pose estimation: motion to the rescueCarl Doersch, Andrew Zisserman. 12929-12941 [doi]

Self-Supervised Deep Learning on Point Clouds by Reconstructing SpaceJonathan Sauder, Bjarne Sievers. 12942-12952 [doi]

Piecewise Strong Convexity of Neural NetworksTristan Milne. 12953-12963 [doi]

Minimum Stein Discrepancy EstimatorsAlessandro Barp, François-Xavier Briol, Andrew B. Duncan, Mark A. Girolami, Lester W. Mackey. 12964-12976 [doi]

Fast and Furious Learning in Zero-Sum Games: Vanishing Regret with Non-Vanishing Step SizesJames P. Bailey, Georgios Piliouras. 12977-12987 [doi]

Generalization Bounds for Neural Networks via Approximate Description LengthAmit Daniely, Elad Granot. 12988-12996 [doi]

Provably robust boosted decision stumps and trees against adversarial attacksMaksym Andriushchenko, Matthias Hein 0001. 12997-13008 [doi]

Convergence of Adversarial Training in Overparametrized Neural NetworksRuiQi Gao, Tianle Cai, Haochuan Li, Cho-Jui Hsieh, Liwei Wang, Jason D. Lee. 13009-13020 [doi]

A Composable Specification Language for Reinforcement Learning TasksKishor Jothimurugan, Rajeev Alur, Osbert Bastani. 13021-13030 [doi]

The Option Keyboard: Combining Skills in Reinforcement LearningAndré Barreto, Diana Borsa, Shaobo Hou, Gheorghe Comanici, Eser Aygün, Philippe Hamel, Daniel Toyama, Jonathan J. Hunt, Shibl Mourad, David Silver, Doina Precup. 13031-13041 [doi]

Unified Language Model Pre-training for Natural Language Understanding and GenerationLi Dong 0004, Nan Yang 0002, Wenhui Wang, Furu Wei, Xiaodong Liu, Yu Wang, Jianfeng Gao, Ming Zhou, Hsiao-Wuen Hon. 13042-13054 [doi]

Learning to Correlate in Multi-Player General-Sum Sequential GamesAndrea Celli, Alberto Marchesi, Tommaso Bianchi, Nicola Gatti 0001. 13055-13065 [doi]

Stochastic Continuous Greedy ++: When Upper and Lower Bounds MatchAmin Karbasi, Hamed Hassani, Aryan Mokhtari, Zebang Shen. 13066-13076 [doi]

Generative Well-intentioned NetworksJustin Cosentino, Jun Zhu. 13077-13088 [doi]

Online-Within-Online Meta-LearningGiulia Denevi, Dimitris Stamos, Carlo Ciliberto, Massimiliano Pontil. 13089-13099 [doi]

Learning step sizes for unfolded sparse codingPierre Ablin, Thomas Moreau, Mathurin Massias, Alexandre Gramfort. 13100-13110 [doi]

Biases for Emergent Communication in Multi-agent Reinforcement LearningTom Eccles, Yoram Bachrach, Guy Lever, Angeliki Lazaridou, Thore Graepel. 13111-13121 [doi]

Episodic Memory in Lifelong Language LearningCyprien de Masson d'Autume, Sebastian Ruder, Lingpeng Kong, Dani Yogatama. 13122-13131 [doi]

A Simple Baseline for Bayesian Uncertainty in Deep LearningWesley J. Maddox, Pavel Izmailov, Timur Garipov, Dmitry P. Vetrov, Andrew Gordon Wilson. 13132-13143 [doi]

Communication-efficient Distributed SGD with SketchingNikita Ivkin, Daniel Rothchild, Enayat Ullah, Vladimir Braverman, Ion Stoica, Raman Arora. 13144-13154 [doi]

Modeling Conceptual Understanding in Image Reference GamesRodolfo Corona, Stephan Alaniz, Zeynep Akata. 13155-13165 [doi]

Kalman Filter, Sensor Fusion, and Constrained Regression: Equivalences and InsightsMaria Jahja, David C. Farrow, Roni Rosenfeld, Ryan J. Tibshirani. 13166-13175 [doi]

Near Neighbor: Who is the Fairest of Them All?Sariel Har-Peled, Sepideh Mahabadi. 13176-13187 [doi]

Outlier-robust estimation of a sparse linear model using \ell_1-penalized Huber's M-estimatorArnak S. Dalalyan, Philip Thompson. 13188-13198 [doi]

Learning nonlinear level sets for dimensionality reduction in function approximationGuannan Zhang, Jiaxin Zhang, Jacob Hinkle. 13199-13208 [doi]

Assessing Social and Intersectional Biases in Contextualized Word RepresentationsYi Chern Tan, L. Elisa Celis. 13209-13220 [doi]

Online Convex Matrix Factorization with Representative RegionsJianhao Peng, Olgica Milenkovic, Abhishek Agarwal. 13221-13231 [doi]

Self-supervised GAN: Analysis and Improvement with Multi-class Minimax GameNgoc-Trung Tran, Viet Hung Tran, Ngoc-Bao Nguyen, Linxiao Yang, Ngai-Man Cheung. 13232-13243 [doi]

Extreme Classification in Log Memory using Count-Min Sketch: A Case Study of Amazon Search with 50M ProductsTharun Medini, Qixuan Huang, Yiqiu Wang, Vijai Mohan, Anshumali Shrivastava. 13244-13254 [doi]

A Fourier Perspective on Model Robustness in Computer VisionDong Yin, Raphael Gontijo Lopes, Jon Shlens, Ekin Dogus Cubuk, Justin Gilmer. 13255-13265 [doi]

The continuous Bernoulli: fixing a pervasive error in variational autoencodersGabriel Loaiza-Ganem, John P. Cunningham. 13266-13276 [doi]

Privacy Amplification by Mixing and Diffusion MechanismsBorja Balle, Gilles Barthe, Marco Gaboardi, Joseph Geumlek. 13277-13287 [doi]

Variance Reduction in Bipartite Experiments through Correlation ClusteringJean Pouget-Abadie, Kevin Aydin, Warren Schudy, Kay Brodersen, Vahab Mirrokni. 13288-13298 [doi]

Gossip-based Actor-Learner Architectures for Deep Reinforcement LearningMahmoud Assran, Joshua Romoff, Nicolas Ballas, Joelle Pineau, Mike Rabbat. 13299-13309 [doi]

Metalearned Neural MemoryTsendsuren Munkhdalai, Alessandro Sordoni, Tong Wang, Adam Trischler. 13310-13321 [doi]

Learning Multiple Markov Chains via Adaptive AllocationMohammad Sadegh Talebi, Odalric-Ambrym Maillard. 13322-13332 [doi]

Diffusion Improves Graph LearningJohannes Klicpera, Stefan Weißenberger, Stephan Günnemann. 13333-13345 [doi]

Deep Random Splines for Point Process Intensity Estimation of Neural Population DataGabriel Loaiza-Ganem, Sean Perkins, Karen Schroeder, Mark M. Churchland, John P. Cunningham. 13346-13356 [doi]

Variational Bayes under Model MisspecificationYixin Wang, David M. Blei. 13357-13367 [doi]

Global Convergence of Gradient Descent for Deep Linear Residual NetworksLei Wu, Qingcan Wang, Chao Ma. 13368-13377 [doi]

On Differentially Private Graph Sparsification and ApplicationsRaman Arora, Jalaj Upadhyay. 13378-13389 [doi]

Manifold denoising by Nonlinear Robust Principal Component AnalysisHe Lyu, Ningyu Sha, Shuyang Qin, Ming Yan, Yuying Xie, Rongrong Wang. 13390-13400 [doi]

Near-Optimal Reinforcement Learning in Dynamic Treatment RegimesJunzhe Zhang, Elias Bareinboim. 13401-13411 [doi]

ODE2VAE: Deep generative second order ODEs with Bayesian neural networksCagatay Yildiz, Markus Heinonen, Harri Lähdesmäki. 13412-13421 [doi]

Optimal Sampling and Clustering in the Stochastic Block ModelSe-Young Yun, Alexandre Proutière. 13422-13430 [doi]

Recurrent Kernel NetworksDexiong Chen, Laurent Jacob, Julien Mairal. 13431-13442 [doi]

Cold Case: The Lost MNIST DigitsChhavi Yadav, Léon Bottou. 13443-13452 [doi]

Hierarchical Optimal Transport for Multimodal Distribution AlignmentJohn Lee, Max Dabagia, Eva L. Dyer, Christopher Rozell. 13453-13463 [doi]

Exploration via Hindsight Goal GenerationZhizhou Ren, Kefan Dong, Yuan Zhou 0007, Qiang Liu 0009, Jian Peng 0001. 13464-13474 [doi]

Shaping Belief States with Generative Environment Models for RLKarol Gregor, Danilo Jimenez Rezende, Frederic Besse, Yan Wu, Hamza Merzic, Aäron Van Den Oord. 13475-13487 [doi]

Globally Optimal Learning for Structured Elliptical LossesYoav Wald, Nofar Noy, Gal Elidan, Ami Wiesel. 13488-13497 [doi]

Object landmark discovery through unsupervised adaptationEnrique Sanchez, Georgios Tzimiropoulos. 13498-13509 [doi]

Specific and Shared Causal Relation Modeling and Mechanism-Based ClusteringBiwei Huang, Kun Zhang 0001, Pengtao Xie, Mingming Gong, Eric P. Xing, Clark Glymour. 13510-13521 [doi]

Search-Guided, Lightly-Supervised Training of Structured Prediction Energy NetworksAmirmohammad Rooshenas, Dongxu Zhang, Gopal Sharma, Andrew McCallum. 13522-13532 [doi]

Accelerating Rescaled Gradient Descent: Fast Optimization of Smooth FunctionsAshia C. Wilson, Lester Mackey, Andre Wibisono. 13533-13543 [doi]

RUDDER: Return Decomposition for Delayed RewardsJose A. Arjona-Medina, Michael Gillhofer, Michael Widrich, Thomas Unterthiner, Johannes Brandstetter, Sepp Hochreiter. 13544-13555 [doi]

Graph Normalizing FlowsJenny Liu, Aviral Kumar, Jimmy Ba, Jamie Kiros, Kevin Swersky. 13556-13566 [doi]

Explanations can be manipulated and geometry is to blameAnn-Kathrin Dombrowski, Maximilian Alber, Christopher J. Anders, Marcel Ackermann, Klaus-Robert Müller, Pan Kessel. 13567-13578 [doi]

Communication trade-offs for Local-SGD with large step sizeAymeric Dieuleveut, Kumar Kshitij Patel. 13579-13590 [doi]

Non-normal Recurrent Neural Network (nnRNN): learning long time dependencies while improving expressivity with transient dynamicsGiancarlo Kerg, Kyle Goyette, Maximilian Puelma Touzel, Gauthier Gidel, Eugene Vorontsov, Yoshua Bengio, Guillaume Lajoie. 13591-13601 [doi]

No-Regret Learning in Unknown Games with Correlated PayoffsPier Giuseppe Sessa, Ilija Bogunovic, Maryam Kamgarpour, Andreas Krause 0001. 13602-13611 [doi]

Alleviating Label Switching with Optimal TransportPierre Monteiller, Sebastian Claici, Edward Chien, Farzaneh Mirzazadeh, Justin M. Solomon, Mikhail Yurochkin. 13612-13622 [doi]

Paraphrase Generation with Latent Bag of WordsYao Fu, Yansong Feng, John P. Cunningham. 13623-13634 [doi]

An Algorithmic Framework For Differentially Private Data Analysis on Trusted ProcessorsJoshua Allen, Bolin Ding, Janardhan Kulkarni, Harsha Nori, Olga Ohrimenko, Sergey Yekhanin. 13635-13646 [doi]

Compacting, Picking and Growing for Unforgetting Continual LearningChing-Yi Hung, Cheng-Hao Tu 0001, Cheng-En Wu, Chien-Hung Chen, Yi-Ming Chan, Chu-Song Chen. 13647-13657 [doi]

Approximating Interactive Human Evaluation with Self-Play for Open-Domain Dialog SystemsAsma Ghandeharioun, Judy Hanwen Shen, Natasha Jaques, Craig Ferguson, Noah Jones, Àgata Lapedriza, Rosalind W. Picard. 13658-13669 [doi]

A New Distribution on the Simplex with Auto-Encoding ApplicationsAndrew Stirn, Tony Jebara, David A. Knowles. 13670-13680 [doi]

AutoPrune: Automatic Network Pruning by Regularizing Auxiliary ParametersXia Xiao, Zigeng Wang, Sanguthevar Rajasekaran. 13681-13691 [doi]

A neurally plausible model learns successor representations in partially observable environmentsEszter Vértes, Maneesh Sahani. 13692-13702 [doi]

Learning about an exponential amount of conditional distributionsMohamed Ishmael Belghazi, Maxime Oquab, David Lopez-Paz. 13703-13714 [doi]

Towards modular and programmable architecture searchRenato Negrinho, Matthew R. Gormley, Geoffrey J. Gordon, Darshan Patil, Nghia Le, Daniel Ferreira. 13715-13725 [doi]

Towards Hardware-Aware Tractable Learning of Probabilistic ModelsLaura Isabel Galindez Olascoaga, Wannes Meert, Nimish Shah, Marian Verhelst, Guy Van den Broeck. 13726-13736 [doi]

On Robustness to Adversarial Examples and Polynomial OptimizationPranjal Awasthi, Abhratanu Dutta, Aravindan Vijayaraghavan. 13737-13747 [doi]

Rand-NSG: Fast Accurate Billion-point Nearest Neighbor Search on a Single NodeSuhas Jayaram Subramanya, Fnu Devvrit, Harsha Vardhan Simhadri, Ravishankar Krishnawamy, Rohan Kadekodi. 13748-13758 [doi]

A Solvable High-Dimensional Model of GANChuang Wang, Hong Hu, Yue Lu. 13759-13768 [doi]

Using Embeddings to Correct for Unobserved Confounding in NetworksVictor Veitch, Yixin Wang, David M. Blei. 13769-13779 [doi]

MonoForest framework for tree ensemble analysisIgor Kuralenok, Vasilii Ershov, Igor Labutin. 13780-13789 [doi]

Bayesian Optimization under Heavy-tailed PayoffsSayak Ray Chowdhury, Aditya Gopalan. 13790-13801 [doi]

Combining Generative and Discriminative Models for Hybrid InferenceVictor Garcia Satorras, Max Welling, Zeynep Akata. 13802-13812 [doi]

A Graph Theoretic Additive Approximation of Optimal TransportNathaniel Lahn, Deepika Mulchandani, Sharath Raghvendra. 13813-13823 [doi]

Adversarial Robustness through Local LinearizationChongli Qin, James Martens, Sven Gowal, Dilip Krishnan, Krishnamurthy Dvijotham, Alhussein Fawzi, Soham De, Robert Stanforth, Pushmeet Kohli. 13824-13833 [doi]

Sampled Softmax with Random Fourier FeaturesAnkit Singh Rawat, Jiecao Chen, Felix X. Yu, Ananda Theertha Suresh, Sanjiv Kumar. 13834-13844 [doi]

Semi-flat minima and saddle points by embedding neural networks to overparameterizationKenji Fukumizu, Shoichiro Yamaguchi, Yoh-ichi Mototake, Mirai Tanaka. 13845-13853 [doi]

Learning Fairness in Multi-Agent SystemsJiechuan Jiang, Zongqing Lu. 13854-13865 [doi]

Primal-Dual Block Generalized Frank-WolfeQi Lei, Jiacheng Zhuo, Constantine Caramanis, Inderjit S. Dhillon, Alexandros G. Dimakis. 13866-13875 [doi]

GOT: An Optimal Transport framework for Graph comparisonHermina Petric Maretic, Mireille El Gheche, Giovanni Chierchia, Pascal Frossard. 13876-13887 [doi]

On Mixup Training: Improved Calibration and Predictive Uncertainty for Deep Neural NetworksSunil Thulasidasan, Gopinath Chennupati, Jeff A. Bilmes, Tanmoy Bhattacharya, Sarah Michalak. 13888-13899 [doi]

Complexity of Highly Parallel Non-Smooth Convex OptimizationSébastien Bubeck, Qijia Jiang, Yin Tat Lee, Yuanzhi Li, Aaron Sidford. 13900-13909 [doi]

Inverting Deep Generative models, One layer at a timeQi Lei, Ajil Jalal, Inderjit S. Dhillon, Alexandros G. Dimakis. 13910-13919 [doi]

Calculating Optimistic Likelihoods Using (Geodesically) Convex OptimizationViet Anh Nguyen, Soroosh Shafieezadeh-Abadeh, Man-Chung Yue, Daniel Kuhn, Wolfram Wiesemann. 13920-13931 [doi]

The Implicit Metropolis-Hastings AlgorithmKirill Neklyudov, Evgenii Egorov, Dmitry P. Vetrov. 13932-13942 [doi]

An Inexact Augmented Lagrangian Framework for Nonconvex Optimization with Nonlinear ConstraintsMehmet Fatih Sahin, Armin Eftekhari, Ahmet Alacaoglu, Fabian Latorre Gómez, Volkan Cevher. 13943-13955 [doi]

Generalization in Reinforcement Learning with Selective Noise Injection and Information BottleneckMaximilian Igl, Kamil Ciosek, Yingzhen Li, Sebastian Tschiatschek, Cheng Zhang, Sam Devlin, Katja Hofmann. 13956-13968 [doi]

Can you trust your model's uncertainty? Evaluating predictive uncertainty under dataset shiftJasper Snoek, Yaniv Ovadia, Emily Fertig, Balaji Lakshminarayanan, Sebastian Nowozin, D. Sculley, Joshua V. Dillon, Jie Ren, Zachary Nado. 13969-13980 [doi]

Accurate Layerwise Interpretable Competence EstimationVickram Rajendran, William LeVine. 13981-13991 [doi]

A New Perspective on Pool-Based Active Classification and False-Discovery ControlLalit Jain, Kevin G. Jamieson. 13992-14003 [doi]

Defending Neural Backdoors via Generative Distribution ModelingXiming Qiao, Yukun Yang, Hai Li. 14004-14013 [doi]

Are Sixteen Heads Really Better than One?Paul Michel, Omer Levy, Graham Neubig. 14014-14024 [doi]

Multi-resolution Multi-task Gaussian ProcessesOliver Hamelijnck, Theodoros Damoulas, Kangrui Wang, Mark A. Girolami. 14025-14035 [doi]

Variational Bayesian Optimal Experimental DesignAdam Foster, Martin Jankowiak, Eli Bingham, Paul Horsfall, Yee Whye Teh, Tom Rainforth, Noah Goodman. 14036-14047 [doi]

Universal Approximation of Input-Output Maps by Temporal Convolutional NetsJoshua Hanson, Maxim Raginsky. 14048-14058 [doi]

Provable Certificates for Adversarial Examples: Fitting a Ball in the Union of PolytopesMatt Jordan, Justin Lewis, Alexandros G. Dimakis. 14059-14069 [doi]

Reinforcement Learning with Convex ConstraintsSobhan Miryoosefi, Kianté Brantley, Hal Daumé III, Miroslav Dudík, Robert E. Schapire. 14070-14079 [doi]

User-Specified Local Differential Privacy in Unconstrained Adaptive Online LearningDirk van der Hoeven. 14080-14089 [doi]

Stochastic Bandits with Context DistributionsJohannes Kirschner, Andreas Krause 0001. 14090-14099 [doi]

Inducing brain-relevant bias in natural language processing modelsDan Schwartz, Mariya Toneva, Leila Wehbe. 14100-14110 [doi]

Using a Logarithmic Mapping to Enable Lower Discount Factors in Reinforcement LearningHarm van Seijen, Mehdi Fatemi, Arash Tavakoli. 14111-14121 [doi]

Recovering BanditsCiara Pike-Burke, Steffen Grünewälder. 14122-14131 [doi]

Computing Linear Restrictions of Neural NetworksMatthew Sotoudeh, Aditya V. Thakur. 14132-14143 [doi]

Learning Positive Functions with Pseudo Mirror DescentYingxiang Yang, Haoxiang Wang, Negar Kiyavash, Niao He. 14144-14154 [doi]

Correlation Priors for Reinforcement LearningBastian Alt, Adrian Sosic, Heinz Koeppl. 14155-14165 [doi]

Fast, Provably convergent IRLS Algorithm for p-norm Linear RegressionDeeksha Adil, Richard Peng, Sushant Sachdeva. 14166-14177 [doi]

A Similarity-preserving Network Trained on Transformed Images Recapitulates Salient Features of the Fly Motion Detection CircuitYanis Bahroun, Dmitri B. Chklovskii, Anirvan Sengupta. 14178-14189 [doi]

Differentially Private Covariance EstimationKareem Amin, Travis Dick, Alex Kulesza, Andres Muñoz Medina, Sergei Vassilvitskii. 14190-14199 [doi]

Outlier Detection and Robust PCA Using a Convex Measure of InnovationMostafa Rahmani, Ping Li 0001. 14200-14210 [doi]

Integrating Markov processes with structural causal modeling enables counterfactual inference in complex systemsRobert Osazuwa Ness, Kaushal Paneri, Olga Vitek. 14211-14221 [doi]

Are Disentangled Representations Helpful for Abstract Visual Reasoning?Sjoerd van Steenkiste, Francesco Locatello, Jürgen Schmidhuber, Olivier Bachem. 14222-14235 [doi]

PowerSGD: Practical Low-Rank Gradient Compression for Distributed OptimizationThijs Vogels, Sai Praneeth Karimireddy, Martin Jaggi. 14236-14245 [doi]

Stochastic Frank-Wolfe for Composite Convex MinimizationFrancesco Locatello, Alp Yurtsever, Olivier Fercoq, Volkan Cevher. 14246-14256 [doi]

Constraint-based Causal Structure Learning with Consistent Separating SetsHonghao Li, Vincent Cabeli, Nadir Sella, Hervé Isambert. 14257-14266 [doi]

Unsupervised Discovery of Temporal Structure in Noisy Data with Dynamical Components AnalysisDavid Clark, Jesse Livezey, Kristofer E. Bouchard. 14267-14278 [doi]

Sample Efficient Active Learning of Causal TreesKristjan Greenewald, Dmitriy Katz, Karthikeyan Shanmugam, Sara Magliacane, Murat Kocaoglu, Enric Boix-Adserà, Guy Bresler. 14279-14289 [doi]

Efficient Neural Architecture Transformation Search in Channel-Level for Object DetectionJunran Peng, Ming Sun, Zhaoxiang Zhang, Tieniu Tan, Junjie Yan. 14290-14299 [doi]

Robust Attribution RegularizationJiefeng Chen, Xi Wu 0001, Vaibhav Rastogi, Yingyu Liang, Somesh Jha. 14300-14310 [doi]

Computational Mirrors: Blind Inverse Light Transport by Deep Matrix FactorizationMiika Aittala, Prafull Sharma, Lukas Murmann, Adam B. Yedidia, Gregory W. Wornell, Bill Freeman, Frédo Durand. 14311-14321 [doi]

When to use parametric models in reinforcement learning?Hado van Hasselt, Matteo Hessel, John Aslanides. 14322-14333 [doi]

General E(2)-Equivariant Steerable CNNsMaurice Weiler, Gabriele Cesa. 14334-14345 [doi]

Characterization and Learning of Causal Graphs with Latent Variables from Soft InterventionsMurat Kocaoglu, Amin Jaber, Karthikeyan Shanmugam, Elias Bareinboim. 14346-14356 [doi]

Structure Learning with Side Information: Sample ComplexitySaurabh Sihag, Ali Tajer. 14357-14367 [doi]

Untangling in Invariant Speech RecognitionCory Stephenson, Jenelle Feather, Suchismita Padhy, Oguz H. Elibol, Hanlin Tang, Josh McDermott, SueYeon Chung. 14368-14378 [doi]

Flexible information routing in neural populations through stochastic comodulationCaroline Haimerl, Cristina Savin, Eero P. Simoncelli. 14379-14388 [doi]

Generalization Bounds in the Predict-then-Optimize FrameworkOthman El Balghiti, Adam N. Elmachtoub, Paul Grigas, Ambuj Tewari. 14389-14398 [doi]

Categorized BanditsMatthieu Jedor, Vianney Perchet, Jonathan Louëdec. 14399-14409 [doi]

Worst-Case Regret Bounds for Exploration via Randomized Value FunctionsDaniel Russo. 14410-14420 [doi]

Efficient characterization of electrically evoked responses for neural interfacesNishal P. Shah, Sasidhar Madugula, Pawel Hottowy, Alexander Sher, Alan M. Litke, Liam Paninski, E. J. Chichilnisky. 14421-14431 [doi]

Differentially Private Distributed Data Summarization under Covariate ShiftKanthi K. Sarpatwar, Karthikeyan Shanmugam, Venkata Sitaramagiridharganesh Ganapavarapu, Ashish Jagmohan, Roman Vaculín. 14432-14442 [doi]

Hamiltonian descent for composite objectivesBrendan O'Donoghue, Chris J. Maddison. 14443-14453 [doi]

Implicit Regularization of Accelerated Methods in Hilbert SpacesNicolò Pagliana, Lorenzo Rosasco. 14454-14464 [doi]

Non-Asymptotic Pure Exploration by Solving GamesRémy Degenne, Wouter M. Koolen, Pierre Ménard. 14465-14474 [doi]

Implicit Posterior Variational Inference for Deep Gaussian ProcessesHaibin Yu, Yizhou Chen, Bryan Kian Hsiang Low, Patrick Jaillet, Zhongxiang Dai. 14475-14486 [doi]

Deep Multi-State Dynamic Recurrent Neural Networks Operating on Wavelet Based Neural Features for Robust Brain Machine InterfacesBenyamin Allahgholizadeh Haghi, Spencer S. Kellis, Sahil Shah, Maitreyi Ashok, Luke Bashford, Daniel Kramer, Brian C. Lee, Charles Liu, Richard A. Andersen, Azita Emami. 14487-14498 [doi]

Censored Semi-Bandits: A Framework for Resource Allocation with Censored FeedbackArun Verma, Manjesh K. Hanawal, Arun Rajkumar, Raman Sankaran. 14499-14509 [doi]

Cormorant: Covariant Molecular Neural NetworksBrandon M. Anderson, Truong-Son Hy, Risi Kondor. 14510-14519 [doi]

Reverse KL-Divergence Training of Prior Networks: Improved Uncertainty and Adversarial RobustnessAndrey Malinin, Mark J. F. Gales. 14520-14531 [doi]

Reflection Separation using a Pair of Unpolarized and Polarized ImagesYouwei Lyu, Zhaopeng Cui, Si Li, Marc Pollefeys, Boxin Shi. 14532-14542 [doi]

Policy Poisoning in Batch Reinforcement Learning and ControlYuzhe Ma, Xuezhou Zhang, Wen Sun, Jerry Zhu. 14543-14553 [doi]

Low-Complexity Nonparametric Bayesian Online Prediction with Universal GuaranteesAlix Lhéritier, Frédéric Cazals. 14554-14563 [doi]

Pure Exploration with Multiple Correct AnswersRémy Degenne, Wouter M. Koolen. 14564-14573 [doi]

Explaining Landscape Connectivity of Low-cost Solutions for Multilayer NetsRohith Kuditipudi, Xiang Wang, Holden Lee, Yi Zhang, Zhiyuan Li, Wei Hu, Rong Ge 0001, Sanjeev Arora. 14574-14583 [doi]

On the Fairness of Disentangled RepresentationsFrancesco Locatello, Gabriele Abbati, Thomas Rainforth, Stefan Bauer, Bernhard Schölkopf, Olivier Bachem. 14584-14597 [doi]

Compiler Auto-Vectorization with Imitation LearningCharith Mendis, Cambridge Yang, Yewen Pu, Saman Amarasinghe, Michael Carbin. 14598-14609 [doi]

A Generalized Algorithm for Multi-Objective Reinforcement Learning and Policy AdaptationRunzhe Yang, Xingyuan Sun, Karthik Narasimhan. 14610-14621 [doi]

Exact Gaussian Processes on a Million Data PointsKe Alexander Wang, Geoff Pleiss, Jacob R. Gardner, Stephen Tyree, Kilian Q. Weinberger, Andrew Gordon Wilson. 14622-14632 [doi]

Bayesian Layers: A Module for Neural Network UncertaintyDustin Tran, Mike Dusenberry, Mark van der Wilk, Danijar Hafner. 14633-14645 [doi]

Learning Compositional Neural Programs with Recursive Tree Search and PlanningThomas Pierrot, Guillaume Ligner, Scott E. Reed, Olivier Sigaud, Nicolas Perrin 0001, Alexandre Laterre, David Kas, Karim Beguir, Nando de Freitas. 14646-14656 [doi]

Nonparametric Contextual Bandits in Metric Spaces with Unknown MetricNirandika Wanigasekara, Christina Lee Yu. 14657-14667 [doi]

Qsparse-local-SGD: Distributed SGD with Quantization, Sparsification and Local ComputationsDebraj Basu 0001, Deepesh Data, Can Karakus, Suhas N. Diggavi. 14668-14679 [doi]

Likelihood Ratios for Out-of-Distribution DetectionJie Ren, Peter J. Liu, Emily Fertig, Jasper Snoek, Ryan Poplin, Mark A. DePristo, Joshua V. Dillon, Balaji Lakshminarayanan. 14680-14691 [doi]

Discrete Flows: Invertible Generative Models of Discrete DataDustin Tran, Keyon Vafa, Kumar Krishna Agrawal, Laurent Dinh, Ben Poole. 14692-14701 [doi]

A Self Validation Network for Object-Level Human Attention EstimationZehua Zhang, Chen Yu 0001, David J. Crandall. 14702-14713 [doi]

Model Selection for Contextual BanditsDylan J. Foster, Akshay Krishnamurthy, Haipeng Luo. 14714-14725 [doi]

Sliced Gromov-WassersteinTitouan Vayer, Rémi Flamary, Nicolas Courty, Romain Tavenard, Laetitia Chapel. 14726-14736 [doi]

Towards Practical Alternating Least-Squares for CCAZhiqiang Xu, Ping Li. 14737-14746 [doi]

Deep Leakage from GradientsLigeng Zhu, Zhijian Liu, Song Han. 14747-14756 [doi]

Invariance-inducing regularization using worst-case transformations suffices to boost accuracy and spatial robustnessFanny Yang, Zuowen Wang, Christina Heinze-Deml. 14757-14768 [doi]

Algorithm-Dependent Generalization Bounds for Overparameterized Deep Residual NetworksSpencer Frei, Yuan Cao, Quanquan Gu. 14769-14779 [doi]

Value Function in Frequency Domain and the Characteristic Value Iteration AlgorithmAmir Massoud Farahmand. 14780-14790 [doi]

Icebreaker: Element-wise Efficient Information Acquisition with a Bayesian Deep Latent Gaussian ModelWenbo Gong, Sebastian Tschiatschek, Sebastian Nowozin, Richard E. Turner, José Miguel Hernández-Lobato, Cheng Zhang. 14791-14802 [doi]

Algorithmic Guarantees for Inverse Imaging with Untrained Network PriorsGauri Jagatap, Chinmay Hegde. 14803-14813 [doi]

Planning with Goal-Conditioned PoliciesSoroush Nasiriany, Vitchyr Pong, Steven Lin, Sergey Levine. 14814-14825 [doi]

Don't take it lightly: Phasing optical random projections with unknown operatorsSidharth Gupta, Rémi Gribonval, Laurent Daudet, Ivan Dokmanic. 14826-14836 [doi]

Generating Diverse High-Fidelity Images with VQ-VAE-2Ali Razavi, Aäron Van Den Oord, Oriol Vinyals. 14837-14847 [doi]

Generalized Matrix Means for Semi-Supervised Learning with Multilayer GraphsPedro Mercado 0001, Francesco Tudisco, Matthias Hein 0001. 14848-14857 [doi]

Online Optimal Control with Linear Dynamics and Predictions: Algorithms and Regret AnalysisYingying Li, Xin Chen, Na Li. 14858-14870 [doi]

Missing Not at Random in Matrix Completion: The Effectiveness of Estimating Missingness Probabilities Under a Low Nuclear Norm AssumptionWei Ma, George H. Chen. 14871-14880 [doi]

MelGAN: Generative Adversarial Networks for Conditional Waveform SynthesisKundan Kumar, Rithesh Kumar, Thibault de Boissiere, Lucas Gestin, Wei Zhen Teoh, Jose Sotelo, Alexandre de Brébisson, Yoshua Bengio, Aaron C. Courville. 14881-14892 [doi]

Offline Contextual Bandits with High Probability Fairness GuaranteesBlossom Metevier, Stephen Giguere, Sarah Brockman, Ari Kobren, Yuriy Brun, Emma Brunskill, Philip S. Thomas. 14893-14904 [doi]

Solving a Class of Non-Convex Min-Max Games Using Iterative First Order MethodsMaher Nouiehed, Maziar Sanjabi, Tianjian Huang, Jason D. Lee, Meisam Razaviyayn. 14905-14916 [doi]

Semantic-Guided Multi-Attention Localization for Zero-Shot LearningYizhe Zhu, Jianwen Xie, ZhiQiang Tang, Xi Peng 0005, Ahmed Elgammal. 14917-14927 [doi]

Interpreting and improving natural-language processing (in machines) with natural language-processing (in the brain)Mariya Toneva, Leila Wehbe. 14928-14938 [doi]

Function-Space Distributions over KernelsGregory W. Benton, Wesley J. Maddox, Jayson P. Salkey, Julio Albinati, Andrew Gordon Wilson. 14939-14950 [doi]

The Step Decay Schedule: A Near Optimal, Geometrically Decaying Learning Rate Procedure For Least SquaresRong Ge 0001, Sham M. Kakade, Rahul Kidambi, Praneeth Netrapalli. 14951-14962 [doi]

Compositional Plan VectorsColine Devin, Daniel Geng, Pieter Abbeel, Trevor Darrell, Sergey Levine. 14963-14974 [doi]

Locally Private Learning without Interaction Requires SeparationAmit Daniely, Vitaly Feldman. 14975-14986 [doi]

Robust Bi-Tempered Logistic Loss Based on Bregman DivergencesEhsan Amid, Manfred K. Warmuth, Rohan Anil, Tomer Koren. 14987-14996 [doi]

Computational Separations between Sampling and OptimizationKunal Talwar. 14997-15007 [doi]

Surfing: Iterative Optimization Over Incrementally Trained Deep NetworksGanlin Song, Zhou Fan, John Lafferty. 15008-15017 [doi]

Learning to Optimize in SwarmsYue Cao, Tianlong Chen, Zhangyang Wang, Yang Shen. 15018-15028 [doi]

On Human-Aligned Risk MinimizationLiu Leqi, Adarsh Prasad, Pradeep Ravikumar. 15029-15038 [doi]

Semi-Parametric Efficient Policy Learning with Continuous ActionsVictor Chernozhukov, Mert Demirer, Greg Lewis, Vasilis Syrgkanis. 15039-15049 [doi]

Multi-task Learning for Aggregated Data using Gaussian ProcessesFariba Yousefi, Michael Thomas Smith, Mauricio A. Álvarez. 15050-15060 [doi]

Minimal Variance Sampling in Stochastic Gradient BoostingBulat Ibragimov, Gleb Gusev. 15061-15071 [doi]

Beyond the Single Neuron Convex Barrier for Neural Network CertificationGagandeep Singh, Rupanshu Ganvir, Markus Püschel, Martin T. Vechev. 15072-15083 [doi]

An Algorithm to Learn Polytree Networks with Hidden NodesFiroozeh Sepehr, Donatello Materassi. 15084-15093 [doi]

Efficiently Learning Fourier Sparse Set FunctionsAndisheh Amrollahi, Amir Zandieh, Michael Kapralov, Andreas Krause. 15094-15103 [doi]

Projected Stein Variational Newton: A Fast and Scalable Bayesian Inference Method in High DimensionsPeng Chen 0024, Keyi Wu, Joshua Chen, Tom O'Leary-Roseberry, Omar Ghattas. 15104-15113 [doi]

Invariance and identifiability issues for word embeddingsRachel Carrington, Karthik Bharath, Simon Preston. 15114-15123 [doi]

Generalization Error Analysis of Quantized Compressive LearningXiaoyun Li, Ping Li. 15124-15134 [doi]

Multi-Criteria Dimensionality Reduction with Applications to FairnessUthaipon Tantipongpipat, Samira Samadi, Mohit Singh, Jamie H. Morgenstern, Santosh S. Vempala. 15135-15145 [doi]

Efficient Rematerialization for Deep NetworksRavi Kumar 0001, Manish Purohit, Zoya Svitkina, Erik Vee, Joshua Wang. 15146-15155 [doi]

Mo' States Mo' Problems: Emergency Stop Mechanisms from ObservationSamuel Ainsworth, Matt Barnes, Siddhartha S. Srinivasa. 15156-15166 [doi]

Machine Learning Estimation of Heterogeneous Treatment Effects with InstrumentsVasilis Syrgkanis, Victor Lei, Miruna Oprescu, Maggie Hei, Keith Battocchi, Greg Lewis. 15167-15176 [doi]

Understanding Sparse JL for Feature HashingMeena Jagadeesan. 15177-15187 [doi]

Text-Based Interactive Recommendation via Constraint-Augmented Reinforcement LearningRuiyi Zhang, Tong Yu, Yilin Shen, Hongxia Jin, Changyou Chen. 15188-15198 [doi]

Flexible Modeling of Diversity with Strongly Log-Concave DistributionsJoshua Robinson, Suvrit Sra, Stefanie Jegelka. 15199-15209 [doi]

Momentum-Based Variance Reduction in Non-Convex SGDAshok Cutkosky, Francesco Orabona. 15210-15219 [doi]

Search on the Replay Buffer: Bridging Planning and Reinforcement LearningBen Eysenbach, Russlan Salakhutdinov, Sergey Levine. 15220-15231 [doi]

Can Unconditional Language Models Recover Arbitrary Sentences?Nishant Subramani, Samuel R. Bowman, KyungHyun Cho. 15232-15242 [doi]

Group Retention when Using Machine Learning in Sequential Decision Making: the Interplay between User Dynamics and FairnessXueru Zhang, Mohammadmahdi Khaliligarekani, Cem Tekin, Mingyan Liu. 15243-15252 [doi]

Faster width-dependent algorithm for mixed packing and covering LPsDigvijay Boob, Saurabh Sawlani, Di Wang. 15253-15262 [doi]

Flattening a Hierarchical Clustering through Active LearningFabio Vitale, Anand Rajagopalan, Claudio Gentile. 15263-15273 [doi]

DeepWave: A Recurrent Neural-Network for Real-Time Acoustic ImagingMatthieu Simeoni, Sepand Kashani, Paul Hurley, Martin Vetterli. 15274-15286 [doi]

Certifying Geometric Robustness of Neural NetworksMislav Balunovic, Maximilian Baader, Gagandeep Singh, Timon Gehr, Martin T. Vechev. 15287-15297 [doi]

Goal-conditioned Imitation LearningYiming Ding, Carlos Florensa, Pieter Abbeel, Mariano Phielipp. 15298-15309 [doi]

Robust exploration in linear quadratic reinforcement learningJack Umenberger, Mina Ferizbegovic, Thomas B. Schön, Håkan Hjalmarsson. 15310-15320 [doi]

DRUM: End-To-End Differentiable Rule Mining On Knowledge GraphsAli Sadeghian, Mohammadreza Armandpour, Patrick Ding, Daisy Zhe Wang. 15321-15331 [doi]

Kernel Truncated Randomized Ridge Regression: Optimal Rates and Low Noise AccelerationKwang-Sung Jun, Ashok Cutkosky, Francesco Orabona. 15332-15341 [doi]

Input-Output Equivalence of Unitary and Contractive RNNsMelikasadat Emami, Mojtaba Sahraee-Ardakan, Sundeep Rangan, Alyson K. Fletcher. 15342-15352 [doi]

Hamiltonian Neural NetworksSamuel Greydanus, Misko Dzamba, Jason Yosinski. 15353-15363 [doi]

Preventing Gradient Attenuation in Lipschitz Constrained Convolutional NetworksQiyang Li, Saminul Haque, Cem Anil, James Lucas, Roger B. Grosse, Jörn-Henrik Jacobsen. 15364-15376 [doi]

Structured and Deep Similarity Matching via Structured and Deep Hebbian NetworksDina Obeid, Hugo Ramambason, Cengiz Pehlevan. 15377-15386 [doi]

Understanding the Representation Power of Graph Neural Networks in Learning Graph TopologyNima Dehmamy, Albert-László Barabási, Rose Yu. 15387-15397 [doi]

Multiple Futures PredictionYichuan Charlie Tang, Russlan Salakhutdinov. 15398-15408 [doi]

Explicitly disentangling image content from translation and rotation with spatial-VAETristan Bepler, Ellen D. Zhong, Kotaro Kelley, Edward Brignole, Bonnie Berger. 15409-15419 [doi]

Power analysis of knockoff filters for correlated designsJingbo Liu, Philippe Rigollet. 15420-15429 [doi]

A Kernel Loss for Solving the Bellman EquationYihao Feng, Lihong Li 0001, Qiang Liu 0001. 15430-15441 [doi]

Low-Rank Bandit Methods for High-Dimensional Dynamic PricingJonas Mueller, Vasilis Syrgkanis, Matt Taddy. 15442-15452 [doi]

Differential Privacy Has Disparate Impact on Model AccuracyEugene Bagdasaryan, Omid Poursaeed, Vitaly Shmatikov. 15453-15462 [doi]

Riemannian batch normalization for SPD neural networksDaniel A. Brooks, Olivier Schwander, Frédéric Barbaresco, Jean-Yves Schneider, Matthieu Cord. 15463-15474 [doi]

Neural Taskonomy: Inferring the Similarity of Task-Derived Representations from Brain ActivityAria Wang, Michael J. Tarr, Leila Wehbe. 15475-15485 [doi]

Stacked Capsule AutoencodersAdam R. Kosiorek, Sara Sabour, Yee Whye Teh, Geoffrey E. Hinton. 15486-15496 [doi]

Learning Reward Machines for Partially Observable Reinforcement LearningRodrigo Toro Icarte, Ethan Waldie, Toryn Q. Klassen, Richard Anthony Valenzano, Margarita P. Castro, Sheila A. McIlraith. 15497-15508 [doi]

Learning Representations by Maximizing Mutual Information Across ViewsPhilip Bachman, R. Devon Hjelm, William Buchwalter. 15509-15519 [doi]

Amortized Bethe Free Energy Minimization for Learning MRFsSam Wiseman, Yoon Kim. 15520-15531 [doi]

Small ReLU networks are powerful memorizers: a tight analysis of memorization capacityChulhee Yun, Suvrit Sra, Ali Jadbabaie. 15532-15543 [doi]

Legendre Memory Units: Continuous-Time Representation in Recurrent Neural NetworksAaron Voelker, Ivana Kajic, Chris Eliasmith. 15544-15553 [doi]

Exact Combinatorial Optimization with Graph Convolutional Neural NetworksMaxime Gasse, Didier Chételat, Nicola Ferroni, Laurent Charlin, Andrea Lodi 0001. 15554-15566 [doi]

Fast structure learning with modular regularizationGreg Ver Steeg, Hrayr Harutyunyan, Daniel Moyer, Aram Galstyan. 15567-15577 [doi]

Wasserstein Dependency Measure for Representation LearningSherjil Ozair, Corey Lynch, Yoshua Bengio, Aäron Van Den Oord, Sergey Levine, Pierre Sermanet. 15578-15588 [doi]

TAB-VCR: Tags and Attributes based VCR BaselinesJingxiang Lin, Unnat Jain, Alexander G. Schwing. 15589-15602 [doi]

Universality and individuality in neural dynamics across large populations of recurrent networksNiru Maheswaranathan, Alex H. Williams, Matthew D. Golub, Surya Ganguli, David Sussillo. 15603-15615 [doi]

End-to-End Learning on 3D Protein Structure for Interface PredictionRaphael J. L. Townshend, Rishi Bedi, Patricia Suriana, Ron O. Dror. 15616-15625 [doi]

A Family of Robust Stochastic Operators for Reinforcement LearningYingdong Lu, Mark S. Squillante, Chai Wah Wu. 15626-15636 [doi]

Using Self-Supervised Learning Can Improve Model Robustness and UncertaintyDan Hendrycks, Mantas Mazeika, Saurav Kadavath, Dawn Song. 15637-15648 [doi]

Inherent Tradeoffs in Learning Fair RepresentationsHan Zhao, Geoff Gordon. 15649-15659 [doi]

Are deep ResNets provably better than linear predictors?Chulhee Yun, Suvrit Sra, Ali Jadbabaie. 15660-15669 [doi]

Reverse engineering recurrent networks for sentiment classification reveals line attractor dynamicsNiru Maheswaranathan, Alex H. Williams, Matthew D. Golub, Surya Ganguli, David Sussillo. 15670-15679 [doi]

BehaveNet: nonlinear embedding and Bayesian neural decoding of behavioral videosEleanor Batty, Matthew Whiteway, Shreya Saxena, Dan Biderman, Taiga Abe, Simon Musall, Winthrop Gillis, Jeffrey Markowitz, Anne Churchland, John P. Cunningham, Sandeep R. Datta, Scott Linderman, Liam Paninski. 15680-15691 [doi]

Variational Mixture-of-Experts Autoencoders for Multi-Modal Deep Generative ModelsYuge Shi, Siddharth Narayanaswamy, Brooks Paige, Philip H. S. Torr. 15692-15703 [doi]

Gradient-based Adaptive Markov Chain Monte CarloMichalis K. Titsias, Petros Dellaportas. 15704-15713 [doi]

On the Transfer of Inductive Bias from Simulation to the Real World: a New Disentanglement DatasetMuhammad Waleed Gondal, Manuel Wuthrich, Djordje Miladinovic, Francesco Locatello, Martin Breidt, Valentin Volchkov, Joel Akpo, Olivier Bachem, Bernhard Schölkopf, Stefan Bauer. 15714-15725 [doi]

Imitation-Projected Programmatic Reinforcement LearningAbhinav Verma, Hoang Minh Le 0002, Yisong Yue, Swarat Chaudhuri. 15726-15737 [doi]

Learning Data Manipulation for Augmentation and WeightingZhiting Hu, Bowen Tan, Russlan Salakhutdinov, Tom M. Mitchell, Eric P. Xing. 15738-15749 [doi]

Exploring Algorithmic Fairness in Robust Graph Covering ProblemsAida Rahmattalabi, Phebe Vayanos, Anthony Fulginiti, Eric Rice, Bryan Wilder, Amulya Yadav, Milind Tambe. 15750-15761 [doi]

Abstraction based Output Range Analysis for Neural NetworksPavithra Prabhakar, Zahra Rahimi Afzal. 15762-15772 [doi]

Space and Time Efficient Kernel Density Estimation in High DimensionsArturs Backurs, Piotr Indyk, Tal Wagner. 15773-15782 [doi]

PIDForest: Anomaly Detection via Partial IdentificationParikshit Gopalan, Vatsal Sharan, Udi Wieder. 15783-15793 [doi]

Generative Models for Graph-Based Protein DesignJohn Ingraham, Vikas K. Garg, Regina Barzilay, Tommi S. Jaakkola. 15794-15805 [doi]

The Geometry of Deep Networks: Power Diagram SubdivisionRandall Balestriero, Romain Cosentino, Behnaam Aazhang, Richard G. Baraniuk. 15806-15815 [doi]

Approximate Feature Collisions in Neural NetsKe Li, Tianhao Zhang, Jitendra Malik. 15816-15824 [doi]

Ease-of-Teaching and Language Structure from Emergent CommunicationFushan Li, Michael Bowling. 15825-15835 [doi]

Generalization in multitask deep neural classifiers: a statistical physics approachAnthony Ndirango, Tyler Lee. 15836-15845 [doi]

Optimistic Distributionally Robust Optimization for Nonparametric Likelihood ApproximationViet Anh Nguyen, Soroosh Shafieezadeh-Abadeh, Man-Chung Yue, Daniel Kuhn, Wolfram Wiesemann. 15846-15856 [doi]

On Relating Explanations and Adversarial ExamplesAlexey Ignatiev, Nina Narodytska, Joao Marques-Silva. 15857-15867 [doi]

On the equivalence between graph isomorphism testing and function approximation with GNNsZhengdao Chen, Soledad Villar, Lei Chen, Joan Bruna. 15868-15876 [doi]

Surround Modulation: A Bio-inspired Connectivity Structure for Convolutional Neural NetworksHosein Hasani, Mahdieh Soleymani, Hamid Aghajan. 15877-15888 [doi]

Self-attention with Functional Time Representation LearningDa Xu, Chuanwei Ruan, Evren Körpeoglu, Sushant Kumar, Kannan Achan. 15889-15899 [doi]

Re-randomized Densification for One Permutation Hashing and Bin-wise Consistent Weighted SamplingPing Li, Xiaoyun Li, Cun-Hui Zhang. 15900-15910 [doi]

Enabling hyperparameter optimization in sequential autoencoders for spiking neural dataMohammad Reza Keshtkaran, Chethan Pandarinath. 15911-15921 [doi]

Mixtape: Breaking the Softmax Bottleneck EfficientlyZhilin Yang, Thang Luong, Russlan Salakhutdinov, Quoc V. Le. 15922-15930 [doi]

runs on WebDSL