The 22nd International Conference on Artificial Intelligence and Statistics, AISTATS 2019, 16-18 April 2019, Naha, Okinawa, Japan - researchr publication

researchr

You are not signed in
Sign in
Sign up

Kamalika Chaudhuri, Masashi Sugiyama, editors, The 22nd International Conference on Artificial Intelligence and Statistics, AISTATS 2019, 16-18 April 2019, Naha, Okinawa, Japan. Volume 89 of Proceedings of Machine Learning Research, PMLR, 2019. [doi]

Conference: aistats2019

Abstract is missing.

Proximal Splitting Meets Variance ReductionFabian Pedregosa, Kilian Fatras, Mattia Casotto. 1-10 [doi]

Optimal Noise-Adding Mechanism in Additive Differential PrivacyQuan Geng, Wei Ding, Ruiqi Guo, Sanjiv Kumar. 11-20 [doi]

Tossing Coins Under MonotonicityMatey Neykov. 21-30 [doi]

Gaussian Regression with Convex ConstraintsMatey Neykov. 31-38 [doi]

Risk-Averse Stochastic Convex BanditAdrian Rivera Cardoso, Huan Xu. 39-47 [doi]

Error bounds for sparse classifiers in high-dimensionsAntoine Dedieu. 48-56 [doi]

Boosting Transfer Learning with Survival Data from Heterogeneous DomainsAlexis Bellot, Mihaela van der Schaar. 57-65 [doi]

Resampled Priors for Variational AutoencodersMatthias Bauer, Andriy Mnih. 66-75 [doi]

Scalable Bayesian Learning for State Space Models using Variational Inference with SMC SamplersMarcel Hirt, Petros Dellaportas. 76-86 [doi]

Scalable Thompson Sampling via Optimal TransportRuiyi Zhang, Zheng Wen, Changyou Chen, Chen Fang, Tong Yu, Lawrence Carin. 87-96 [doi]

Inferring Multidimensional Rates of Aging from Cross-Sectional DataEmma Pierson, Pang Wei Koh, Tatsunori B. Hashimoto, Daphne Koller, Jure Leskovec, Nick Eriksson, Percy Liang. 97-107 [doi]

Interaction Detection with Bayesian Decision Tree EnsemblesJunliang Du, Antonio R. Linero. 108-117 [doi]

On the Interaction Effects Between Prediction and ClusteringMatt Barnes, Artur Dubrawski. 118-126 [doi]

Towards a Theoretical Understanding of Hashing-Based Neural NetsYibo Lin, Zhao Song, Lin F. Yang. 127-137 [doi]

Faster First-Order Methods for Stochastic Non-Convex Optimization on Riemannian ManifoldsPan Zhou, Xiao-Tong Yuan, Jiashi Feng. 138-147 [doi]

LF-PPL: A Low-Level First Order Probabilistic Programming Language for Non-Differentiable ModelsYuan Zhou, Bradley J. Gram-Hansen, Tobias Kohn, Tom Rainforth, Hongseok Yang, Frank Wood. 148-157 [doi]

Identifiability of Generalized Hypergeometric Distribution (GHD) Directed Acyclic Graphical ModelsGunwoong Park, Hyewon Park. 158-166 [doi]

Unbiased Implicit Variational InferenceMichalis K. Titsias, Francisco J. R. Ruiz. 167-176 [doi]

Efficient Linear Bandits through Matrix SketchingIlja Kuzborskij, Leonardo Cella, Nicolò Cesa-Bianchi. 177-185 [doi]

Orthogonal Estimation of Wasserstein DistancesMark Rowland, Jiri Hron, Yunhao Tang, Krzysztof Choromanski, Tamás Sarlós, Adrian Weller. 186-195 [doi]

Linear Convergence of the Primal-Dual Gradient Method for Convex-Concave Saddle Point Problems without Strong ConvexitySimon S. Du, Wei Hu. 196-205 [doi]

Greedy and IHT Algorithms for Non-convex Optimization with Monotone Costs of Non-zerosShinsaku Sakaue. 206-215 [doi]

Block Stability for MAP InferenceHunter Lang, David Sontag, Aravindan Vijayaraghavan. 216-225 [doi]

A Stein-Papangelou Goodness-of-Fit Test for Point ProcessesJiasen Yang, Vinayak Rao, Jennifer Neville. 226-235 [doi]

KAMA-NNs: Low-dimensional Rotation Based Neural NetworksKrzysztof Choromanski, Aldo Pacchiano, Jeffrey Pennington, Yunhao Tang. 236-245 [doi]

Statistical Windows in Testing for the Initial Distribution of a Reversible Markov ChainQuentin Berthet, Varun Kanade. 246-255 [doi]

Sketching for Latent Dirichlet-Categorical ModelsJoseph Tassarotti, Jean-Baptiste Tristan, Michael Wick. 256-265 [doi]

Adaptive Activity Monitoring with Uncertainty Quantification in Switching Gaussian Process ModelsRandy Ardywibowo, Guang Zhao, Zhangyang Wang, Bobak Mortazavi, Shuai Huang, Xiaoning Qian. 266-275 [doi]

Near Optimal Algorithms for Hard Submodular Programs with Discounted Cooperative CostsRishabh K. Iyer, Jeffrey A. Bilmes. 276-285 [doi]

Fast Stochastic Algorithms for Low-rank and Nonsmooth Matrix ProblemsDan Garber, Atara Kaplan. 286-294 [doi]

Logarithmic Regret for Online Gradient Descent Beyond Strong ConvexityDan Garber. 295-303 [doi]

Accelerated Coordinate Descent with Arbitrary Sampling and Best Rates for MinibatchesFilip Hanzely, Peter Richtárik. 304-312 [doi]

Globally-convergent Iteratively Reweighted Least Squares for Robust Regression ProblemsBhaskar Mukhoty, Govind Gopakumar, Prateek Jain 0002, Purushottam Kar. 313-322 [doi]

Modularity-based Sparse Soft Graph ClusteringAlexandre Hollocou, Thomas Bonald, Marc Lelarge. 323-332 [doi]

Pathwise Derivatives for Multivariate DistributionsMartin Jankowiak, Theofanis Karaletsos. 333-342 [doi]

Distributed Inexact Newton-type Pursuit for Non-convex Sparse LearningBo Liu 0005, Xiao-Tong Yuan, Lezi Wang, Qingshan Liu 0001, JunZhou Huang, Dimitris N. Metaxas. 343-352 [doi]

Vine copula structure learning via Monte Carlo tree searchBo Chang, Shenyi Pan, Harry Joe. 353-361 [doi]

Blind Demixing via Wirtinger Flow with Random InitializationJialin Dong, Yuanming Shi. 362-370 [doi]

Performance Metric Elicitation from Pairwise Classifier ComparisonsGaurush Hiranandani, Shant Boodaghians, Ruta Mehta, Oluwasanmi Koyejo. 371-379 [doi]

Analysis of Network Lasso for Semi-Supervised RegressionAlexander Jung, Natalia Vesselinova. 380-387 [doi]

Learning Mixtures of Smooth Product Distributions: Identifiability and AlgorithmNikos Kargas, Nicholas D. Sidiropoulos. 388-396 [doi]

Robust Matrix Completion from Quantized ObservationsJie Shen, Pranjal Awasthi, Ping Li. 397-407 [doi]

Foundations of Sequence-to-Sequence Modeling for Time SeriesZelda Mariet, Vitaly Kuznetsov. 408-417 [doi]

Nearly Optimal Adaptive Procedure with Change Detection for Piecewise-Stationary BanditYang Cao 0013, Zheng Wen, Branislav Kveton, Yao Xie 0002. 418-427 [doi]

An Optimal Algorithm for Stochastic Three-Composite OptimizationRenbo Zhao, William B. Haskell, Vincent Y. F. Tan. 428-437 [doi]

A Thompson Sampling Algorithm for Cascading BanditsWang Chi Cheung, Vincent Tan, Zixin Zhong. 438-447 [doi]

Lifelong Optimization with Low RegretYi-Shan Wu, Po-An Wang, Chi-Jen Lu. 448-456 [doi]

Sparse Multivariate Bernoulli Processes in High DimensionsParthe Pandit, Mojtaba Sahraee-Ardakan, Arash A. Amini, Sundeep Rangan, Alyson K. Fletcher. 457-466 [doi]

An Optimal Algorithm for Stochastic and Adversarial BanditsJulian Zimmert, Yevgeny Seldin. 467-475 [doi]

Efficient Bayesian Experimental Design for Implicit ModelsSteven Kleinegesse, Michael U. Gutmann. 476-485 [doi]

Local Saddle Point Optimization: A Curvature Exploitation ApproachLeonard Adolphs, Hadi Daneshmand, Aurélien Lucchi, Thomas Hofmann. 486-495 [doi]

Testing Conditional Independence on Discrete Data using Stochastic ComplexityAlexander Marx, Jilles Vreeken. 496-505 [doi]

Distributionally Robust Submodular MaximizationMatthew Staib, Bryan Wilder, Stefanie Jegelka. 506-516 [doi]

A Robust Zero-Sum Game Framework for Pool-based Active LearningDixian Zhu, Zhe Li 0008, Xiaoyu Wang, Boqing Gong, Tianbao Yang. 517-526 [doi]

Support and Invertibility in Domain-Invariant RepresentationsFredrik D. Johansson, David Sontag, Rajesh Ranganath. 527-536 [doi]

Efficient Inference in Multi-task Cox Process ModelsVirginia Aglietti, Theodoros Damoulas, Edwin V. Bonilla. 537-546 [doi]

Optimization of Inf-Convolution Regularized Nonconvex Composite ProblemsEmanuel Laude, Tao Wu 0006, Daniel Cremers. 547-556 [doi]

On Connecting Stochastic Gradient MCMC and Differential PrivacyBai Li, Changyou Chen, Hao Liu 0015, Lawrence Carin. 557-566 [doi]

What made you do this? Understanding black-box decisions with sufficient input subsetsBrandon Carter, Jonas Mueller, Siddhartha Jain, David K. Gifford. 567-576 [doi]

Computation Efficient Coded Linear TransformSinong Wang, Jiashang Liu, Ness B. Shroff, Pengyu Yang. 577-585 [doi]

Mixing of Hamiltonian Monte Carlo on strongly log-concave distributions 2: Numerical integratorsOren Mangoubi, Aaron Smith. 586-595 [doi]

Temporal Quilting for Survival AnalysisChangHee Lee, William R. Zame, Ahmed M. Alaa, Mihaela van der Schaar. 596-605 [doi]

Learning Classifiers with Fenchel-Young Losses: Generalized Entropies, Margins, and AlgorithmsMathieu Blondel, André F. T. Martins, Vlad Niculae. 606-615 [doi]

On Target Shift in Adversarial Domain AdaptationYitong Li, michael Murias, samantha Major, Geraldine Dawson, David E. Carlson. 616-625 [doi]

Optimal Testing in the Experiment-rich RegimeSven Schmit, Virag Shah, Ramesh Johari. 626-633 [doi]

Reversible Jump Probabilistic ProgrammingDavid A. Roberts, Marcus Gallagher, Thomas Taimre. 634-643 [doi]

Graph Embedding with Shifted Inner Product Similarity and Its Improved Approximation CapabilityAkifumi Okuno, Geewook Kim, Hidetoshi Shimodaira. 644-653 [doi]

High-dimensional Mixed Graphical Model with Ordinal Data: Parameter Estimation and Statistical InferenceHuijie Feng, Yang Ning. 654-663 [doi]

Robust Graph Embedding with Noisy Link WeightsAkifumi Okuno, Hidetoshi Shimodaira. 664-673 [doi]

Exploring Fast and Communication-Efficient Algorithms in Large-Scale Distributed NetworksYue Yu, Jiaxiang Wu, JunZhou Huang. 674-683 [doi]

Defending against Whitebox Adversarial Attacks via Randomized DiscretizationYuchen Zhang, Percy Liang. 684-693 [doi]

Fisher Information and Natural Gradient Learning in Random Deep NetworksShun-ichi Amari, Ryo Karakida, Masafumi Oizumi. 694-702 [doi]

Robust descent using smoothed multiplicative noiseMatthew J. Holland. 703-711 [doi]

Classification using margin pursuitMatthew J. Holland. 712-720 [doi]

Linear Queries Estimation with Local Differential PrivacyRaef Bassily. 721-729 [doi]

Bayesian Learning of Neural Network ArchitecturesGeorgi Dikov, Justin Bayer. 730-738 [doi]

Nonlinear Acceleration of Primal-Dual AlgorithmsRaghu Bollapragada, Damien Scieur, Alexandre d'Aspremont. 739-747 [doi]

Gaussian Process Latent Variable Alignment LearningIeva Kazlauskaite, Carl Henrik Ek, Neill D. F. Campbell. 748-757 [doi]

A Bayesian model for sparse graphs with flexible degree distribution and overlapping community structureJuho Lee, Lancelot F. James, Seungjin Choi, Francois Caron. 758-767 [doi]

Pseudo-Bayesian Learning with Kernel Fourier Transform as PriorGaël Letarte, Emilie Morvant, Pascal Germain. 768-776 [doi]

Forward Amortized Inference for Likelihood-Free Variational MarginalizationLuca Ambrogioni, Umut Güçlü, Julia Berezutskaya, Eva W. P. van den Borne, Yagmur Güçlütürk, Max Hinne, Eric Maris, Marcel van Gerven. 777-786 [doi]

SpikeCaKe: Semi-Analytic Nonparametric Bayesian Inference for Spike-Spike Neuronal ConnectivityLuca Ambrogioni, Patrick Ebel, Max Hinne, Umut Güçlü, Marcel van Gerven, Eric Maris. 787-795 [doi]

Scalable Gaussian Process Inference with Finite-data Mean and Variance GuaranteesJonathan H. Huggins, Trevor Campbell, Mikolaj Kasprzak, Tamara Broderick. 796-805 [doi]

Exponential convergence rates for Batch Normalization: The power of length-direction decoupling in non-convex optimizationJonas Moritz Kohler, Hadi Daneshmand, Aurélien Lucchi, Thomas Hofmann, Ming Zhou, Klaus Neymeyr. 806-815 [doi]

A new evaluation framework for topic modeling algorithms based on synthetic corporaHanyu Shi, Martin Gerlach, Isabel Diersen, Doug Downey, Luis A. N. Amaral. 816-826 [doi]

On Kernel Derivative Approximation with Random Fourier FeaturesZoltán Szabó 0001, Bharath K. Sriperumbudur. 827-836 [doi]

Sequential Neural Likelihood: Fast Likelihood-free Inference with Autoregressive FlowsGeorge Papamakarios, David C. Sterratt, Iain Murray 0001. 837-848 [doi]

Optimal Transport for Multi-source Domain Adaptation under Target ShiftIevgen Redko, Nicolas Courty, Rémi Flamary, Devis Tuia. 849-858 [doi]

Nonlinear ICA Using Auxiliary Variables and Generalized Contrastive LearningAapo Hyvärinen, Hiroaki Sasaki, Richard E. Turner. 859-868 [doi]

Deep Neural Networks Learn Non-Smooth Functions EffectivelyMasaaki Imaizumi, Kenji Fukumizu. 869-878 [doi]

Attenuating Bias in Word vectorsSunipa Dev, Jeff M. Phillips. 879-887 [doi]

Fisher-Rao Metric, Geometry, and Complexity of Neural NetworksTengyuan Liang, Tomaso A. Poggio, Alexander Rakhlin, James Stokes. 888-896 [doi]

Accelerated Decentralized Optimization with Local Updates for Smooth and Strongly Convex ObjectivesHadrien Hendrikx, Francis Bach, Laurent Massoulié. 897-906 [doi]

Interaction Matters: A Note on Non-asymptotic Local Convergence of Generative Adversarial NetworksTengyuan Liang, James Stokes. 907-915 [doi]

On Constrained Nonconvex Stochastic Optimization: A Case Study for Generalized Eigenvalue DecompositionZhehui Chen, Xingguo Li, Lin Yang, Jarvis D. Haupt, Tuo Zhao. 916-925 [doi]

Generalized Boltzmann Machine with Deep Neural StructureYingru Liu, Dongliang Xie, Xin Wang. 926-934 [doi]

Extreme Stochastic Variational Inference: Distributed Inference for Large Scale Mixture ModelsJiong Zhang, Parameswaran Raman, Shihao Ji, Hsiang-Fu Yu, S. V. N. Vishwanathan, Inderjit S. Dhillon. 935-943 [doi]

Correcting the bias in least squares regression with volume-rescaled samplingMichal Derezinski, Manfred K. Warmuth, Daniel Hsu 0001. 944-953 [doi]

Conservative Exploration using InterleavingSumeet Katariya, Branislav Kveton, Zheng Wen, Vamsi K. Potluru. 954-963 [doi]

Conditionally Independent Multiresolution Gaussian ProcessesJalil Taghia, Thomas B. Schön. 964-973 [doi]

Active Exploration in Markov Decision ProcessesJean Tarbouriech, Alessandro Lazaric. 974-982 [doi]

On the Convergence of Stochastic Gradient Descent with Adaptive StepsizesXiaoyu Li, Francesco Orabona. 983-992 [doi]

Bandit Online Learning with Unknown DelaysBingcong Li, Tianyi Chen, Georgios B. Giannakis. 993-1002 [doi]

Learning Invariant Representations with Kernel WarpingYingyi Ma, Vignesh Ganapathiraman, Xinhua Zhang. 1003-1012 [doi]

$β^3$-IRT: A New Item Response Model and its ApplicationsYu Chen, Telmo de Menezes e Silva Filho, Ricardo B. C. Prudêncio, Tom Diethe, Peter A. Flach. 1013-1021 [doi]

Can You Trust This Prediction? Auditing Pointwise Reliability After LearningPeter Schulam, Suchi Saria. 1022-1031 [doi]

Universal Statistics of Fisher Information in Deep Neural Networks: Mean Field ApproachRyo Karakida, Shotaro Akaho, Shun-ichi Amari. 1032-1041 [doi]

Conditional Sparse $L_p$-norm Regression With Optimal ProbabilityJohn Hainline, Brendan Juba, Hai S. Le, David P. Woodruff. 1042-1050 [doi]

On the Connection Between Learning Two-Layer Neural Networks and Tensor DecompositionMarco Mondelli, Andrea Montanari. 1051-1060 [doi]

Autoencoding any Data through Kernel AutoencodersPierre Laforgue, Stéphan Clémençon, Florence d'Alché-Buc. 1061-1069 [doi]

Towards Understanding the Generalization Bias of Two Layer Convolutional Linear Classifiers with Gradient DescentYifan Wu, Barnabás Póczos, Aarti Singh. 1070-1078 [doi]

Learning to Optimize under Non-StationarityWang Chi Cheung, David Simchi-Levi, Ruihao Zhu. 1079-1087 [doi]

SPONGE: A generalized eigenproblem for clustering signed networksMihai Cucuringu, Peter Davies, Aldo Glielmo, Hemant Tyagi. 1088-1098 [doi]

Deep Neural Networks with Multi-Branch Architectures Are Intrinsically Less Non-ConvexHongyang Zhang, Junru Shao, Ruslan Salakhutdinov. 1099-1109 [doi]

Are we there yet? Manifold identification of gradient-related proximal methodsYifan Sun, Halyun Jeong, Julie Nutini, Mark W. Schmidt. 1110-1119 [doi]

Hadamard Response: Estimating Distributions Privately, Efficiently, and with Little CommunicationJayadev Acharya, Ziteng Sun, Huanyu Zhang. 1120-1129 [doi]

XBART: Accelerated Bayesian Additive Regression TreesJingyu He, Saar Yalov, P. Richard Hahn. 1130-1138 [doi]

A Swiss Army Infinitesimal JackknifeRyan Giordano, William T. Stephenson, Runjing Liu, Michael I. Jordan, Tamara Broderick. 1139-1147 [doi]

Online Multiclass Boosting with Bandit FeedbackDaniel T. Zhang, Young-Hun Jung, Ambuj Tewari. 1148-1156 [doi]

Auto-Encoding Total Correlation ExplanationShuyang Gao, Rob Brekelmans, Greg Ver Steeg, Aram Galstyan. 1157-1166 [doi]

Towards Efficient Data Valuation Based on the Shapley ValueRuoxi Jia, David Dao, Boxin Wang, Frances Ann Hubis, Nick Hynes, Nezihe Merve Gürel, Bo Li, Ce Zhang, Dawn Song, Costas J. Spanos. 1167-1176 [doi]

Bayesian optimisation under uncertain inputsRafael Oliveira, Lionel Ott, Fabio Ramos. 1177-1184 [doi]

Optimal Minimization of the Sum of Three Convex Functions with a Linear OperatorSeyoon Ko, Joong-Ho Won. 1185-1194 [doi]

Fast and Faster Convergence of SGD for Over-Parameterized Models and an Accelerated PerceptronSharan Vaswani, Francis Bach, Mark Schmidt. 1195-1204 [doi]

No-regret algorithms for online $k$-submodular maximizationTasuku Soma. 1205-1214 [doi]

Lagrange Coded Computing: Optimal Design for Resiliency, Security, and PrivacyQian Yu, Songze Li, Netanel Raviv, Seyed Mohammadreza Mousavi Kalan, Mahdi Soltanolkotabi, Amir Salman Avestimehr. 1215-1225 [doi]

Subsampled Renyi Differential Privacy and Analytical Moments AccountantYu-Xiang Wang, Borja Balle, Shiva Prasad Kasiviswanathan. 1226-1235 [doi]

Model Consistency for Learning with Mirror-Stratifiable RegularizersJalal Fadili, Guillaume Garrigos, Jérôme Malick, Gabriel Peyré. 1236-1244 [doi]

From Cost-Sensitive to Tight F-measure BoundsKevin Bascol, Rémi Emonet, Élisa Fromont, Amaury Habrard, Guillaume Metzler, Marc Sebban. 1245-1253 [doi]

Feature subset selection for the multinomial logit model via mixed-integer optimizationShunsuke Kamiya, Ryuhei Miyashiro, Yuichi Takano. 1254-1263 [doi]

Low-Precision Random Fourier Features for Memory-constrained Kernel ApproximationJian Zhang, Avner May, Tri Dao, Christopher Ré. 1264-1274 [doi]

Restarting Frank-WolfeThomas Kerdreux, Alexandre d'Aspremont, Sebastian Pokutta. 1275-1283 [doi]

Adaptive Ensemble Prediction for Deep Neural Networks based on Confidence LevelHiroshi Inoue. 1284-1293 [doi]

Infinite Task Learning in RKHSsRomain Brault, Alex Lambert, Zoltán Szabó, Maxime Sangnier, Florence d'Alché-Buc. 1294-1302 [doi]

Detection of Planted Solutions for Flat Satisfiability ProblemsQuentin Berthet, Jordan S. Ellenberg. 1303-1312 [doi]

Markov Properties of Discrete Determinantal Point ProcessesKayvan Sadeghi, Alessandro Rinaldo. 1313-1321 [doi]

Analysis of Thompson Sampling for Combinatorial Multi-armed Bandit with Probabilistically Triggered ArmsAlihan Hüyük, Cem Tekin. 1322-1330 [doi]

Distilling Policy DistillationWojciech M. Czarnecki, Razvan Pascanu, Simon Osindero, Siddhant M. Jayakumar, Grzegorz Swirszcz, Max Jaderberg. 1331-1340 [doi]

Support Localization and the Fisher Metric for off-the-grid Sparse RegularizationClarice Poon, Nicolas Keriven, Gabriel Peyré. 1341-1350 [doi]

Fast Gaussian process based gradient matching for parameter identification in systems of nonlinear ODEsPhilippe Wenk, Alkis Gotovos, Stefan Bauer, Nico S. Gorbach, Andreas Krause 0001, Joachim M. Buhmann. 1351-1360 [doi]

Semi-Generative Modelling: Covariate-Shift Adaptation with Cause and Effect FeaturesJulius von Kügelgen, Alexander Mey, Marco Loog. 1361-1369 [doi]

A Continuous-Time View of Early Stopping for Least Squares RegressionAlnur Ali, J. Zico Kolter, Ryan J. Tibshirani. 1370-1378 [doi]

Towards Clustering High-dimensional Gaussian Mixture Clouds in Linear Running TimeDan Kushnir, Shirin Jalali, Iraj Saniee. 1379-1387 [doi]

Classifying Signals on Irregular Domains via Convolutional Cluster PoolingAngelo Porrello, Davide Abati, Simone Calderara, Rita Cucchiara. 1388-1397 [doi]

Learning Rules-First ClassifiersDeborah Cohen, Amit Daniely, Amir Globerson, Gal Elidan. 1398-1406 [doi]

Wasserstein regularization for sparse multi-task regressionHicham Janati, Marco Cuturi, Alexandre Gramfort. 1407-1416 [doi]

Stochastic Gradient Descent with Exponential Convergence Rates of Expected Classification ErrorsAtsushi Nitanda, Taiji Suzuki. 1417-1426 [doi]

Black Box Quantiles for Kernel LearningAnthony Tompkins, Ransalu Senanayake, Philippe Morere, Fabio Ramos. 1427-1437 [doi]

Adversarial Variational Optimization of Non-Differentiable SimulatorsGilles Louppe, Joeri Hermans, Kyle Cranmer. 1438-1447 [doi]

Active Probabilistic Inference on Matrices for Pre-Conditioning in Stochastic OptimizationFilip de Roos, Philipp Hennig. 1448-1457 [doi]

Projection Free Online Learning over Smooth SetsKfir Levy, Andreas Krause. 1458-1466 [doi]

Confidence Scoring Using Whitebox Meta-models with Linear Classifier ProbesTongfei Chen, Jirí Navrátil 0001, Vijay Iyengar, Karthikeyan Shanmugam. 1467-1475 [doi]

Learning Influence-Receptivity Network Structure with GuaranteeMing Yu, Varun Gupta, Mladen Kolar. 1476-1485 [doi]

Iterative Bayesian Learning for Crowdsourced RegressionJungseul Ok, Sewoong Oh, Yunhun Jang, Jinwoo Shin, Yung Yi. 1486-1495 [doi]

Nonconvex Matrix Factorization from Rank-One MeasurementsYuanxin Li, Cong Ma, Yuxin Chen 0002, Yuejie Chi. 1496-1505 [doi]

Fast and Robust Shortest Paths on Manifolds Learned from DataGeorgios Arvanitidis, Søren Hauberg, Philipp Hennig, Michael Schober. 1506-1515 [doi]

Training a Spiking Neural Network with Equilibrium PropagationPeter O'Connor, Efstratios Gavves, Max Welling. 1516-1523 [doi]

Learning One-hidden-layer ReLU Networks via Gradient DescentXiao Zhang, Yaodong Yu, Lingxiao Wang, Quanquan Gu. 1524-1534 [doi]

Gain estimation of linear dynamical systems using Thompson SamplingMatias I. Müller, Cristian R. Rojas. 1535-1543 [doi]

Universal Hypothesis Testing with Kernels: Asymptotically Optimal Tests for Goodness of FitShengyu Zhu, Biao Chen, Pengfei Yang, Zhitang Chen. 1544-1553 [doi]

Calibrating Deep Convolutional Gaussian ProcessesGia-Lac Tran, Edwin V. Bonilla, John P. Cunningham, Pietro Michiardi, Maurizio Filippone. 1554-1563 [doi]

Stochastic algorithms with descent guarantees for ICAPierre Ablin, Alexandre Gramfort, Jean-François Cardoso, Francis Bach. 1564-1573 [doi]

Sample Complexity of Sinkhorn DivergencesAude Genevay, Lénaïc Chizat, Francis Bach, Marco Cuturi, Gabriel Peyré. 1574-1583 [doi]

Adaptive Gaussian Copula ABCYanzhi Chen, Michael U. Gutmann. 1584-1592 [doi]

Top Feasible Arm IdentificationJulian Katz-Samuels, Clayton Scott. 1593-1601 [doi]

Direct Acceleration of SAGA using Sampled Negative MomentumKaiwen Zhou, Qinghua Ding, Fanhua Shang, James Cheng, Danli Li, Zhi-Quan Luo. 1602-1610 [doi]

Does data interpolation contradict statistical optimality?Mikhail Belkin, Alexander Rakhlin, Alexandre B. Tsybakov. 1611-1619 [doi]

Inverting Supervised Representations with Autoregressive Neural Density ModelsCharlie Nash, Nate Kushman, Christopher K. I. Williams. 1620-1629 [doi]

Connecting Weighted Automata and Recurrent Neural Networks through Spectral LearningGuillaume Rabusseau, Tianyu Li, Doina Precup. 1630-1639 [doi]

A Family of Exact Goodness-of-Fit Tests for High-Dimensional Discrete DistributionsFeras A. Saad, Cameron E. Freer, Nathanael L. Ackerman, Vikash K. Mansinghka. 1640-1649 [doi]

Differentially Private Online Submodular MinimizationAdrian Rivera Cardoso, Rachel Cummings. 1650-1658 [doi]

Semi-supervised clustering for de-duplicationShrinu Kushagra, Shai Ben-David, Ihab F. Ilyas. 1659-1667 [doi]

Finding the bandit in a graph: Sequential search-and-stopPierre Perrault, Vianney Perchet, Michal Valko. 1668-1677 [doi]

Statistical Learning under Nonstationary Mixing ProcessesSteve Hanneke, Liu Yang 0001. 1678-1686 [doi]

On Structure Priors for Learning Bayesian NetworksRalf Eggeling, Jussi Viinikka, Aleksis Vuoksenmaa, Mikko Koivisto. 1687-1695 [doi]

Partial Optimality of Dual Decomposition for MAP Inference in Pairwise MRFsAlexander Bauer 0001, Shinichi Nakajima, Nico Görnitz, Klaus-Robert Müller. 1696-1703 [doi]

Sparse Feature Selection in Kernel Discriminant Analysis via Optimal ScoringAlexander F. Lapanowski, Irina Gaynanova. 1704-1713 [doi]

Learning Natural Programs from a Few Examples in Real-TimeNagarajan Natarajan, Danny Simmons, Naren Datha, Prateek Jain 0002, Sumit Gulwani. 1714-1722 [doi]

Truncated Back-propagation for Bilevel OptimizationAmirreza Shaban, Ching-An Cheng, Nathan Hatch, Byron Boots. 1723-1732 [doi]

Empirical Risk Minimization and Stochastic Gradient Descent for Relational DataVictor Veitch, Morgane Austern, Wenda Zhou, David M. Blei, Peter Orbanz. 1733-1742 [doi]

Variable selection for Gaussian processes via sensitivity analysis of the posterior predictive distributionTopi Paananen, Juho Piironen, Michael Riis Andersen, Aki Vehtari. 1743-1752 [doi]

Lifted Weight Learning of Markov Logic Networks RevisitedOndrej Kuzelka, Vyacheslav Kungurtsev. 1753-1761 [doi]

Causal Discovery in the Presence of Missing DataRuibo Tu, Cheng Zhang 0005, Paul Ackermann, Karthika Mohan, Hedvig Kjellström, Kun Zhang. 1762-1770 [doi]

Learning Tree Structures from Noisy DataKonstantinos E. Nikolakakis, Dionysios S. Kalogerias, Anand D. Sarwate. 1771-1782 [doi]

Active multiple matrix completion with adaptive confidence setsAndrea Locatelli, Alexandra Carpentier, Michal Valko. 1783-1791 [doi]

Confidence-based Graph Convolutional Networks for Semi-Supervised LearningShikhar Vashishth, Prateek Yadav, Manik Bhandari, Partha Talukdar. 1792-1801 [doi]

Negative Momentum for Improved Game DynamicsGauthier Gidel, Reyhane Askari Hemmat, Mohammad Pezeshki, Rémi Le Priol, Gabriel Huang, Simon Lacoste-Julien, Ioannis Mitliagkas. 1802-1811 [doi]

Deep learning with differential Gaussian process flowsPashupati Hegde, Markus Heinonen, Harri Lähdesmäki, Samuel Kaski. 1812-1821 [doi]

Data-dependent compression of random features for large-scale kernel approximationRaj Agrawal, Trevor Campbell, Jonathan H. Huggins, Tamara Broderick. 1822-1831 [doi]

Large-Margin Classification in Hyperbolic SpaceHyunghoon Cho, Benjamin Demeo, Jian Peng 0001, Bonnie Berger. 1832-1840 [doi]

Generalizing the theory of cooperative inferencePei Wang, Pushpi Paranamana, Patrick Shafto. 1841-1850 [doi]

MaxHedge: Maximizing a Maximum OnlineStephen Pasteris, Fabio Vitale, Kevin S. Chan, Shiqiang Wang, Mark Herbster. 1851-1859 [doi]

The Gaussian Process Autoregressive Regression Model (GPAR)James Requeima, William Tebbutt, Wessel Bruinsma, Richard E. Turner. 1860-1869 [doi]

Towards Optimal Transport with Global InvariancesDavid Alvarez-Melis, Stefanie Jegelka, Tommi S. Jaakkola. 1870-1879 [doi]

Unsupervised Alignment of Embeddings with Wasserstein ProcrustesEdouard Grave, Armand Joulin, Quentin Berthet. 1880-1890 [doi]

Sequential Patient Recruitment and Allocation for Adaptive Clinical TrialsOnur Atan, William R. Zame, Mihaela van der Schaar. 1891-1900 [doi]

Probabilistic Forecasting with Spline Quantile Function RNNsJan Gasthaus, Konstantinos Benidis, Yuyang Wang, Syama Sundar Rangapuram, David Salinas, Valentin Flunkert, Tim Januschowski. 1901-1910 [doi]

Exponential Weights on the Hypercube in Polynomial TimeSudeep Raja Putta, Abhishek Shetty. 1911-1919 [doi]

Sharp Analysis of Learning with Discrete LossesAlex Nowak, Francis Bach, Alessandro Rudi. 1920-1929 [doi]

Designing Optimal Binary Rating SystemsNikhil Garg, Ramesh Johari. 1930-1939 [doi]

Stochastic Negative Mining for Learning with Large Output SpacesSashank J. Reddi, Satyen Kale, Felix X. Yu, Daniel Niels Holtmann-Rice, Jiecao Chen, Sanjiv Kumar. 1940-1949 [doi]

Learning One-hidden-layer Neural Networks under General Input DistributionsWeihao Gao, Ashok Vardhan Makkuva, Sewoong Oh, Pramod Viswanath. 1950-1959 [doi]

A Geometric Perspective on the Transferability of Adversarial DirectionsZachary B. Charles, Harrison Rosenberg, Dimitris S. Papailiopoulos. 1960-1968 [doi]

Non-linear process convolutions for multi-output Gaussian processesMauricio A. Álvarez, Wil O. C. Ward, Cristian Guarnizo. 1969-1977 [doi]

Lovasz Convolutional NetworksPrateek Yadav, Madhav Nimishakavi, Naganand Yadati, Shikhar Vashishth, Arun Rajkumar, Partha Talukdar. 1978-1987 [doi]

Bridging the gap between regret minimization and best arm identification, with application to A/B testsRémy Degenne, Thomas Nedelec, Clément Calauzènes, Vianney Perchet. 1988-1996 [doi]

Gaussian Process Modulated Cox Processes under Linear Inequality ConstraintsAndrés F. Lépez-Lopera, S. T. John, Nicolas Durrande. 1997-2006 [doi]

Implicit Kernel LearningChun-Liang Li, Wei-Cheng Chang, Youssef Mroueh, Yiming Yang, Barnabás Póczos. 2007-2016 [doi]

Bounding Inefficiency of Equilibria in Continuous Actions Games using Submodularity and CurvaturePier Giuseppe Sessa, Maryam Kamgarpour, Andreas Krause. 2017-2027 [doi]

Variational Information Planning for Sequential Decision MakingJason Pacheco, John W. Fisher III. 2028-2036 [doi]

Renyi Differentially Private ERM for Smooth ObjectivesChen Chen, Jaewoo Lee, Dan Kifer. 2037-2046 [doi]

Projection-Free Bandit Convex OptimizationLin Chen 0003, Mingrui Zhang, Amin Karbasi. 2047-2056 [doi]

Provable Robustness of ReLU networks via Maximization of Linear RegionsFrancesco Croce, Maksym Andriushchenko, Matthias Hein 0001. 2057-2066 [doi]

Test without Trust: Optimal Locally Private Distribution TestingJayadev Acharya, Clément L. Canonne, Cody Freitag, Himanshu Tyagi. 2067-2076 [doi]

Distributed Maximization of "Submodular plus Diversity" Functions for Multi-label Feature Selection on Huge DatasetsMehrdad Ghadiri, Mark Schmidt. 2077-2086 [doi]

On Euclidean k-Means Clustering with alpha-Center ProximityAmit Deshpande, Anand Louis, Apoorv Vikram Singh. 2087-2095 [doi]

Noisy Blackbox Optimization using Multi-fidelity Queries: A Tree Search ApproachRajat Sen, Kirthevasan Kandasamy, Sanjay Shakkottai. 2096-2105 [doi]

Safe Convex Learning under Uncertain ConstraintsIlnura Usmanova, Andreas Krause, Maryam Kamgarpour. 2106-2114 [doi]

The non-parametric bootstrap and spectral analysis in moderate and high-dimensionNoureddine El Karoui, Elizabeth Purdom. 2115-2124 [doi]

Knockoffs for the Mass: New Feature Importance Statistics with False Discovery GuaranteesJaime Roquero Gimenez, Amirata Ghorbani, James Y. Zou. 2125-2133 [doi]

Training Variational Autoencoders with Buffered Stochastic Variational InferenceRui Shu, Hung H. Bui, Jay Whang, Stefano Ermon. 2134-2143 [doi]

Regularized Contextual BanditsXavier Fontaine, Quentin Berthet, Vianney Perchet. 2144-2153 [doi]

Risk-Sensitive Generative Adversarial Imitation LearningJonathan Lacotte, Mohammad Ghavamzadeh, Yinlam Chow, Marco Pavone. 2154-2163 [doi]

Learning Controllable Fair RepresentationsJiaming Song, Pratyusha Kalluri, Aditya Grover, Shengjia Zhao, Stefano Ermon. 2164-2173 [doi]

Multi-Task Time Series Analysis applied to Drug Response ModellingAlex Bird, Christopher K. I. Williams, Christopher Hawthorne. 2174-2183 [doi]

Improving the Stability of the Knockoff Procedure: Multiple Simultaneous Knockoffs and Entropy MaximizationJaime Roquero Gimenez, James Y. Zou. 2184-2192 [doi]

Know Your Boundaries: Constraining Gaussian Processes by Variational Harmonic FeaturesArno Solin, Manon Kok. 2193-2202 [doi]

Distributional reinforcement learning with linear function approximationMarc G. Bellemare, Nicolas Le Roux, Pablo Samuel Castro, Subhodeep Moitra. 2203-2211 [doi]

Matroids, Matchings, and FairnessFlavio Chierichetti, Ravi Kumar 0001, Silvio Lattanzi, Sergei Vassilvitskii. 2212-2220 [doi]

Dynamical Isometry is Achieved in Residual Networks in a Universal Way for any Activation FunctionWojciech Tarnowski, Piotr Warchol, Stanislaw Jastrzebski, Jacek Tabor, Maciej A. Nowak. 2221-2230 [doi]

The Termination CriticAnna Harutyunyan, Will Dabney, Diana Borsa, Nicolas Heess, Rémi Munos, Doina Precup. 2231-2240 [doi]

Consistent Online Optimization: Convex and SubmodularMohammad Reza Karimi Jaghargh, Andreas Krause, Silvio Lattanzi, Sergei Vassilvitskii. 2241-2250 [doi]

Learning Determinantal Point Processes by Corrective Negative SamplingZelda Mariet, Mike Gartrell, Suvrit Sra. 2251-2260 [doi]

Probabilistic Semantic Inpainting with Pixel Constrained CNNsEmilien Dupont, Suhas Suresha. 2261-2270 [doi]

Least Squares Estimation of Weakly Convex FunctionsSun Sun, Yaoliang Yu. 2271-2280 [doi]

Interval Estimation of Individual-Level Causal Effects Under Unobserved ConfoundingNathan Kallus, Xiaojie Mao, Angela Zhou. 2281-2290 [doi]

Amortized Variational Inference with Graph Convolutional Networks for Gaussian ProcessesLinfeng Liu, Liping Liu. 2291-2300 [doi]

Online Decentralized Leverage Score Sampling for Streaming Multidimensional Time SeriesRui Xie, Zengyan Wang, Shuyang Bai, Ping Ma, Wenxuan Zhong. 2301-2311 [doi]

Interpretable Cascade Classifiers with AbstentionMatthieu Clertant, Nataliya Sokolovska, Yann Chevaleyre, Blaise Hanczar. 2312-2320 [doi]

Kernel Exponential Family Estimation via Doubly Dual EmbeddingBo Dai, Hanjun Dai, Arthur Gretton, Le Song, Dale Schuurmans, Niao He. 2321-2330 [doi]

Revisiting Adversarial RiskArun Sai Suggala, Adarsh Prasad, Vaishnavh Nagarajan, Pradeep Ravikumar. 2331-2339 [doi]

A Memoization Framework for Scaling Submodular Optimization to Large Scale ProblemsRishabh K. Iyer, Jeffrey A. Bilmes. 2340-2349 [doi]

Bernoulli Race Particle FiltersSebastian M. Schmon, Arnaud Doucet, George Deligiannidis. 2350-2358 [doi]

Augmented Ensemble MCMC sampling in Factorial Hidden Markov ModelsKaspar Märtens, Michalis K. Titsias, Christopher Yau. 2359-2367 [doi]

Probabilistic Riemannian submanifold learning with wrapped Gaussian process latent variable modelsAnton Mallasto, Søren Hauberg, Aasa Feragen. 2368-2377 [doi]

Unbiased Smoothing using Particle Independent Metropolis-HastingsLawrece Middleton, George Deligiannidis, Arnaud Doucet, Pierre E. Jacob. 2378-2387 [doi]

Two-temperature logistic regression based on the Tsallis divergenceEhsan Amid, Manfred K. Warmuth, Sriram Srinivasan. 2388-2396 [doi]

Avoiding Latent Variable Collapse with Generative Skip ModelsAdji B. Dieng, Yoon Kim, Alexander M. Rush, David M. Blei. 2397-2405 [doi]

SMOGS: Social Network Metrics of Game SuccessFan Bu, Sonia Xu, Katherine Heller, Alexander Volfovsky. 2406-2414 [doi]

Fast Algorithms for Sparse Reduced-Rank RegressionBenjamin Dubois, Jean-François Delmas, Guillaume Obozinski. 2415-2424 [doi]

Modeling simple structures and geometry for better stochastic optimization algorithmsHilal Asi, John C. Duchi. 2425-2434 [doi]

Online learning with feedback graphs and switching costsAnshuka Rangi, Massimo Franceschetti. 2435-2444 [doi]

Interpretable Almost-Exact Matching for Causal InferenceAwa Dieng, Yameng Liu, Sudeepa Roy, Cynthia Rudin, Alexander Volfovsky. 2445-2453 [doi]

Statistical Optimal Transport via Factored CouplingsAden Forrow, Jan-Christian Hütter, Mor Nitzan, Philippe Rigollet, Geoffrey Schiebinger, Jonathan Weed. 2454-2465 [doi]

$HS^2$: Active learning over hypergraphs with pointwise and pairwise queriesI (Eli) Chien, Huozhi Zhou, Pan Li. 2466-2475 [doi]

Clustering Time Series with Nonlinear Dynamics: A Bayesian Non-Parametric and Particle-Based ApproachAlexander Lin, Yingzhuo Zhang, Jeremy Heng, Stephen A. Allsop, Kay M. Tye, Pierre E. Jacob, Demba Ba. 2476-2484 [doi]

Efficient Nonconvex Empirical Risk Minimization via Adaptive Sample Size MethodsAryan Mokhtari, Asuman E. Ozdaglar, Ali Jadbabaie. 2485-2494 [doi]

An Optimal Control Approach to Sequential Machine TeachingLaurent Lessard, Xuezhou Zhang, Xiaojin Zhu 0001. 2495-2503 [doi]

An Online Algorithm for Smoothed Regression and LQR ControlGautam Goel, Adam Wierman. 2504-2513 [doi]

Uncertainty Autoencoders: Learning Compressed Representations via Variational Information MaximizationAditya Grover, Stefano Ermon. 2514-2524 [doi]

Structured Disentangled RepresentationsBabak Esmaeili, Hao Wu 0020, Sarthak Jain, Alican Bozkurt, N. Siddharth, Brooks Paige, Dana H. Brooks, Jennifer G. Dy, Jan-Willem van de Meent. 2525-2534 [doi]

Estimating Network Structure from Incomplete Event DataBenjamin Mark, Garvesh Raskutti, Rebecca Willett. 2535-2544 [doi]

Locally Private Mean Estimation: $Z$-test and Tight Confidence IntervalsMarco Gaboardi, Ryan Rogers 0002, Or Sheffet. 2545-2554 [doi]

Estimation of Non-Normalized Mixture ModelsTakeru Matsuda, Aapo Hyvärinen. 2555-2563 [doi]

Rotting bandits are no harder than stochastic onesJulien Seznec, Andrea Locatelli, Alexandra Carpentier, Alessandro Lazaric, Michal Valko. 2564-2572 [doi]

A Topological Regularizer for Classifiers via Persistent HomologyChao Chen, Xiuyan Ni, Qinxun Bai, Yusu Wang. 2573-2582 [doi]

Overcomplete Independent Component Analysis via SDPAnastasia Podosinnikova, Amelia Perry, Alexander S. Wein, Francis Bach, Alexandre d'Aspremont, David Sontag. 2583-2592 [doi]

Doubly Semi-Implicit Variational InferenceDmitry Molchanov, Valery Kharitonov, Artem Sobolev, Dmitry P. Vetrov. 2593-2602 [doi]

Reducing training time by efficient localized kernel regressionNicole Mücke. 2603-2610 [doi]

Scalable High-Order Gaussian Process RegressionShandian Zhe, Wei Xing, Robert M. Kirby. 2611-2620 [doi]

A Higher-Order Kolmogorov-Smirnov TestVeeranjaneyulu Sadhanala, Yu-Xiang Wang, Aaditya Ramdas, Ryan J. Tibshirani. 2621-2630 [doi]

Bayesian Learning of Conditional Kernel Mean Embeddings for Automatic Likelihood-Free InferenceKelvin Hsu, Fabio Ramos. 2631-2640 [doi]

Parallel Asynchronous Stochastic Coordinate Descent with Auxiliary VariablesHsiang-Fu Yu, Cho-Jui Hsieh, Inderjit S. Dhillon. 2641-2649 [doi]

Credit Assignment Techniques in Stochastic Computation GraphsThéophane Weber, Nicolas Heess, Lars Buesing, David Silver. 2650-2660 [doi]

Efficient Bayesian Optimization for Target Vector EstimationAnders Kirk Uhrenholt, Bjørn Sand Jensen. 2661-2670 [doi]

Correspondence Analysis Using Neural NetworksHsiang Hsu, Salman Salamatian, Flávio du Pin Calmon. 2671-2680 [doi]

Interpolating between Optimal Transport and MMD using Sinkhorn DivergencesJean Feydy, Thibault Séjourné, François-Xavier Vialard, Shun-ichi Amari, Alain Trouvé, Gabriel Peyré. 2681-2690 [doi]

Multi-Observation RegressionRafael M. Frongillo, Nishant A. Mehta, Tom Morgan, Bo Waggoner. 2691-2700 [doi]

Adaptive MCMC via Combining Local SamplersKiárash Shaloudegi, András György. 2701-2710 [doi]

Variance reduction properties of the reparameterization trickMing Xu, Matias Quiroz, Robert Kohn, Scott A. Sisson. 2711-2720 [doi]

Hierarchical Clustering for Euclidean DataMoses Charikar, Vaggos Chatziafratis, Rad Niazadeh, Grigory Yaroslavtsev. 2721-2730 [doi]

Stochastic Variance-Reduced Cubic Regularization for Nonconvex OptimizationZhe Wang, Yi Zhou, Yingbin Liang, Guanghui Lan. 2731-2740 [doi]

Variational Noise-Contrastive EstimationBenjamin Rhodes, Michael U. Gutmann. 2741-2750 [doi]

Improving Quadrature for Constrained IntegrandsHenry R. Chai, Roman Garnett. 2751-2759 [doi]

High Dimensional Inference in Partially Linear ModelsYing Zhu, Zhuqing Yu, Guang Cheng. 2760-2769 [doi]

Cost aware Inference for IoT DevicesPengkai Zhu, Durmus Alp Emre Acar, Nan Feng, Prateek Jain, Venkatesh Saligrama. 2770-2779 [doi]

Banded Matrix Operators for Gaussian Markov Models in the Automatic Differentiation EraNicolas Durrande, Vincent Adam, Lucas Bordeaux, Stefanos Eleftheriadis, James Hensman. 2780-2789 [doi]

A Unified Weight Learning Paradigm for Multi-view LearningLai Tian, Feiping Nie, Xuelong Li. 2790-2800 [doi]

Region-Based Active LearningCorinna Cortes, Giulia DeSalvo, Claudio Gentile, Mehryar Mohri, Ningshan Zhang. 2801-2809 [doi]

Precision Matrix Estimation with Noisy and Missing DataRoger Fan, Byoungwook Jang, Yuekai Sun, Shuheng Zhou. 2810-2819 [doi]

Exploring $k$ out of Top $ρ$ Fraction of Arms in Stochastic BanditsWenbo Ren, Jia Liu 0002, Ness B. Shroff. 2820-2828 [doi]

AutoML from Service Provider's Perspective: Multi-device, Multi-tenant Model Selection with GP-EIChen Yu, Bojan Karlas, Jie Zhong, Ce Zhang, Ji Liu. 2829-2838 [doi]

On Theory for BARTVeronika Rocková, Enakshi Saha. 2839-2848 [doi]

Deep Topic Models for Multi-label LearningRajat Panda, Ankit Pensia, Nikhil Mehta, Mingyuan Zhou, Piyush Rai. 2849-2857 [doi]

On the Dynamics of Gradient Descent for AutoencodersThanh V. Nguyen, Raymond K. W. Wong, Chinmay Hegde. 2858-2867 [doi]

Complexities in Projection-Free Stochastic Non-convex MinimizationZebang Shen, Cong Fang, Peilin Zhao, JunZhou Huang, Hui Qian. 2868-2876 [doi]

Differentiable Antithetic Sampling for Variance Reduction in Stochastic Variational InferenceMike Wu, Noah Goodman, Stefano Ermon. 2877-2886 [doi]

Efficient Greedy Coordinate Descent for Composite ProblemsSai Praneeth Karimireddy, Anastasia Koloskova, Sebastian U. Stich, Martin Jaggi. 2887-2896 [doi]

Decentralized Gradient Tracking for Continuous DR-Submodular MaximizationJiahao Xie, Chao Zhang, Zebang Shen, Chao Mi, Hui Qian. 2897-2906 [doi]

Adaptive Rao-Blackwellisation in Gibbs Sampling for Probabilistic Graphical ModelsCraig Kelly, Somdeb Sarkhel, Deepak Venugopal. 2907-2915 [doi]

Derivative-Free Methods for Policy Optimization: Guarantees for Linear Quadratic SystemsDhruv Malik, Ashwin Pananjady, Kush Bhatia, Koulik Khamaru, Peter Bartlett, Martin J. Wainwright. 2916-2925 [doi]

Contrasting Exploration in Parameter and Action Space: A Zeroth-Order Optimization PerspectiveAnirudh Vemula, Wen Sun 0002, J. Andrew Bagnell. 2926-2935 [doi]

Sampling from Non-Log-Concave Distributions via Variance-Reduced Gradient Langevin DynamicsDifan Zou, Pan Xu, Quanquan Gu. 2936-2945 [doi]

Graph to Graph: a Topology Aware Approach for Graph Structures Learning and GenerationMingming Sun, Ping Li. 2946-2955 [doi]

Imitation-Regularized Offline LearningYifei Ma, Yu-Xiang Wang, Balakrishnan Narayanaswamy. 2956-2965 [doi]

A maximum-mean-discrepancy goodness-of-fit test for censored dataTamara Fernandez, Arthur Gretton. 2966-2975 [doi]

Sobolev DescentYoussef Mroueh, Tom Sercu, Anant Raj. 2976-2985 [doi]

Learning the Structure of a Nonstationary Vector AutoregressionDaniel Malinsky, Peter Spirtes. 2986-2994 [doi]

Theoretical Analysis of Efficiency and Robustness of Softmax and Gap-Increasing Operators in Reinforcement LearningTadashi Kozuno, Eiji Uchibe, Kenji Doya. 2995-3003 [doi]

A Fast Sampling Algorithm for Maximum Inner Product SearchQin Ding, Hsiang-Fu Yu, Cho-Jui Hsieh. 3004-3012 [doi]

Minimum Volume Topic ModelingByoungwook Jang, Alfred Hero. 3013-3021 [doi]

Binary Space Partitioning ForestXuhui Fan, Bin Li, Scott A. Sisson. 3022-3031 [doi]

Improved Semi-Supervised Learning with Multiple GraphsKrishnamurthy Viswanathan, Sushant Sachdeva, Andrew Tomkins, Sujith Ravi. 3032-3041 [doi]

Optimizing over a Restricted Policy Class in MDPsErshad Banijamali, Yasin Abbasi-Yadkori, Mohammad Ghavamzadeh, Nikos Vlassis. 3042-3050 [doi]

Stochastic Gradient Descent on Separable Data: Exact Convergence with a Fixed Learning RateMor Shpigel Nacson, Nathan Srebro, Daniel Soudry. 3051-3059 [doi]

Deep Switch Networks for Generating Discrete Data and LanguagePayam Delgosha, Naveen Goela. 3060-3069 [doi]

A recurrent Markov state-space generative model for sequencesAnand Ramachandran, Steven S. Lumetta, Eric Klee, Deming Chen. 3070-3079 [doi]

A Potential Outcomes Calculus for Identifying Conditional Path-Specific EffectsDaniel Malinsky, Ilya Shpitser, Thomas S. Richardson 0001. 3080-3088 [doi]

Adversarial Discrete Sequence Generation without Explicit NeuralNetworks as DiscriminatorsZhongliang Li, Tian Xia, Xingyu Lou, Kaihe Xu, Shaojun Wang, Jing Xiao. 3089-3098 [doi]

Adaptive Estimation for Approximate $k$-Nearest-Neighbor ComputationsDaniel LeJeune, Reinhard Heckel, Richard G. Baraniuk. 3099-3107 [doi]

Model-Free Linear Quadratic Control via Reduction to Expert PredictionYasin Abbasi-Yadkori, Nevena Lazic, Csaba Szepesvári. 3108-3117 [doi]

Preventing Failures Due to Dataset Shift: Learning Predictive Models That TransportAdarsh Subbaswamy, Peter Schulam, Suchi Saria. 3118-3127 [doi]

Structured Robust Submodular Maximization: Offline and Online AlgorithmsNima Anari, Nika Haghtalab, Seffi Naor, Sebastian Pokutta, Mohit Singh, Alfredo Torrico. 3128-3137 [doi]

Sample-Efficient Imitation Learning via Generative Adversarial NetsLionel Blondé, Alexandros Kalousis. 3138-3148 [doi]

Probabilistic Multilevel Clustering via Composite Transportation DistanceNhat Ho, Viet Huynh, Dinh Q. Phung, Michael I. Jordan. 3149-3157 [doi]

A General Framework for Multi-fidelity Bayesian Optimization with Gaussian ProcessesJialin Song, Yuxin Chen 0001, Yisong Yue. 3158-3167 [doi]

Online Algorithm for Unsupervised Sensor SelectionArun Verma, Manjesh K. Hanawal, Csaba Szepesvári, Venkatesh Saligrama. 3168-3176 [doi]

Best of many worlds: Robust model selection for online supervised learningVidya Muthukumar, Mitas Ray, Anant Sahai, Peter Bartlett. 3177-3186 [doi]

Accelerating Imitation Learning with Predictive ModelsChing-An Cheng, Xinyan Yan, Evangelos Theodorou, Byron Boots. 3187-3196 [doi]

Online Learning in Kernelized Markov Decision ProcessesSayak Ray Chowdhury, Aditya Gopalan. 3197-3205 [doi]

Lifting high-dimensional non-linear models with Gaussian regressorsChristos Thrampoulidis, Ankit Singh Rawat. 3206-3215 [doi]

Domain-Size Aware Markov Logic NetworksHappy Mittal, Ayush Bhardwaj, Vibhav Gogate, Parag Singla. 3216-3224 [doi]

Database Alignment with Gaussian FeaturesOsman Emre Dai, Daniel Cullina, Negar Kiyavash. 3225-3233 [doi]

Size of Interventional Markov Equivalence Classes in random DAG modelsDmitriy Katz, Karthikeyan Shanmugam, Chandler Squires, Caroline Uhler. 3234-3243 [doi]

Reparameterizing Distributions on Lie GroupsLuca Falorsi, Pim de Haan, Tim R. Davidson, Patrick Forré. 3244-3253 [doi]

Revisit Batch Normalization: New Understanding and Refinement via Composition OptimizationXiangru Lian, Ji Liu. 3254-3263 [doi]

Multi-Order Information for Working Set Selection of Sequential Minimal OptimizationQimao Yang, Changrong Li, Jun Guo. 3264-3272 [doi]

Harmonizable mixture kernels with variational Fourier featuresZheyang Shen, Markus Heinonen, Samuel Kaski. 3273-3282 [doi]

Multiscale Gaussian Process Level Set EstimationShubhanshu Shekhar, Tara Javidi. 3283-3291 [doi]

The LORACs Prior for VAEs: Letting the Trees Speak for the DataSharad Vikram, Matthew D. Hoffman, Matthew J. Johnson 0002. 3292-3301 [doi]

Adversarial Learning of a Sampler Based on an Unnormalized DistributionChunyuan Li, Ke Bai, Jianqiao Li, Guoyin Wang, Changyou Chen, Lawrence Carin. 3302-3311 [doi]

Active Ranking with Subset-wise PreferencesAadirupa Saha, Aditya Gopalan. 3312-3321 [doi]

Recovery Guarantees For Quadratic Tensors With Sparse ObservationsHongyang Zhang 0001, Vatsal Sharan, Moses Charikar, Yingyu Liang. 3322-3332 [doi]

Sample Efficient Graph-Based Optimization with Noisy ObservationsThanh Tan Nguyen, Ali Shameli, Yasin Abbasi-Yadkori, Anup Rao, Branislav Kveton. 3333-3341 [doi]

Robustness Guarantees for Density ClusteringHeinrich Jiang, Jennifer Jang, Ofir Nachum. 3342-3351 [doi]

Fixing Mini-batch Sequences with Hierarchical Robust PartitioningShengjie Wang, Wenruo Bai, Chandrashekhar Lavania, Jeff A. Bilmes. 3352-3361 [doi]

Multitask Metric Learning: Theory and AlgorithmBoyu Wang, Hejia Zhang, Peng Liu, Zebang Shen, Joelle Pineau. 3362-3371 [doi]

Efficient Bayes Risk Estimation for Cost-Sensitive ClassificationDaniel Andrade, Yuzuru Okajima. 3372-3381 [doi]

Interpreting Black Box Predictions using Fisher KernelsRajiv Khanna, Been Kim, Joydeep Ghosh, Sanmi Koyejo. 3382-3390 [doi]

Representation Learning on Graphs: A Reinforcement Learning ApplicationSephora Madjiheurem, Laura Toni. 3391-3399 [doi]

ABCD-Strategy: Budgeted Experimental Design for Targeted Causal Structure DiscoveryRaj Agrawal, Chandler Squires, Karren Yang, Karthikeyan Shanmugam, Caroline Uhler. 3400-3409 [doi]

Batched Stochastic Bayesian Optimization via Combinatorial Constraints DesignKevin K. Yang, Yuxin Chen 0001, Alycia Lee, Yisong Yue. 3410-3419 [doi]

Convergence of Gradient Descent on Separable DataMor Shpigel Nacson, Jason Lee, Suriya Gunasekar, Pedro Henrique Pamplona Savarese, Nathan Srebro, Daniel Soudry. 3420-3428 [doi]

Structured Neural Topic Models for ReviewsBabak Esmaeili, Hongyi Huang, Byron C. Wallace, Jan-Willem van de Meent. 3429-3439 [doi]

Adaptive Minimax Regret against Smooth Logarithmic Losses over High-Dimensional l1-Balls via Envelope ComplexityKohei Miyaguchi, Kenji Yamanishi. 3440-3448 [doi]

Low-Dimensional Density Ratio Estimation for Covariate Shift CorrectionPetar Stojanov, Mingming Gong, Jaime G. Carbonell, Kun Zhang 0001. 3449-3458 [doi]

Evaluating model calibration in classificationJuozas Vaicenavicius, David Widmann, Carl R. Andersson, Fredrik Lindsten, Jacob Roll, Thomas B. Schön. 3459-3467 [doi]

Towards Gradient Free and Projection Free Stochastic OptimizationAnit Kumar Sahu, Manzil Zaheer, Soummya Kar. 3468-3477 [doi]

On Multi-Cause Approaches to Causal Inference with Unobserved Counfounding: Two Cautionary Failure Cases and A Promising AlternativeAlexander D'Amour. 3478-3486 [doi]

Data-Driven Approach to Multiple-Source Domain AdaptationPetar Stojanov, Mingming Gong, Jaime G. Carbonell, Kun Zhang 0001. 3487-3496 [doi]

runs on WebDSL