28th IEEE International Conference on High Performance Computing, Data, and Analytics, HiPC 2021, Bengaluru, India, December 17-20, 2021 - researchr publication

researchr

You are not signed in
Sign in
Sign up

28th IEEE International Conference on High Performance Computing, Data, and Analytics, HiPC 2021, Bengaluru, India, December 17-20, 2021. IEEE, 2021. [doi]

Conference: hipc2021

Abstract is missing.

Towards an Integral System for Processing Big Graphs at ScaleJingren Zhou. [doi]

Improving Efficiency and Performance Through Faster Scheduling MechanismsAdam Belay. [doi]

Parallel Actors and Learners: A Framework for Generating Scalable RL ImplementationsChi Zhang 0022, Sanmukh Rao Kuppannagari, Viktor K. Prasanna. 1-10 [doi]

AI4IO: A Suite of Ai-Based Tools for IO-Aware HPC Resource ManagementMichela Taufer. 1 [doi]

DEISA: Dask-Enabled In Situ AnalyticsAmal Gueroudji, Julien Bigot, Bruno Raffin. 11-20 [doi]

A Model of Graph Transactional Coverage Patterns with Applications to Drug DiscoveryA. Srinivas Reddy, P. Krishna Reddy, Anirban Mondal, U. Deva Priyakumar. 21-30 [doi]

Faster Parallel Training of Word EmbeddingsEliza Wszola, Martin Jaggi, Markus Püschel. 31-41 [doi]

CMAP-LAP: Configurable Massively Parallel Solver for Lattice ProblemsNariaki Tateiwa, Yuji Shinano, Keiichiro Yamamura, Akihiro Yoshida, Shizuo Kaji, Masaya Yasuda, Katsuki Fujisawa. 42-52 [doi]

MulConn: User-Transparent I/O Subsystem for High-Performance Parallel File SystemsHwajung Kim, Jiwoo Bang, Dong-Kyu Sung, Hyeonsang Eom, Heon Y. Yeom, Hanul Sung. 53-62 [doi]

Monte Carlo Tree Search for Task Mapping onto Heterogeneous PlatformsTa-Yang Wang, William Chang, Ajitesh Srivastava, Rajgopal Kannan, Viktor K. Prasanna. 63-70 [doi]

Shared-memory implementation of the Karp-Sipser kernelization processJohannes Langguth, Ioannis Panagiotas, Bora Uçar. 71-80 [doi]

How to Avoid Zero-Spacing in Fractionally-Strided Convolution? A Hardware-Algorithm Co-Design MethodologyYuan Meng, Sanmukh R. Kuppannagari, Rajgopal Kannan, Viktor K. Prasanna. 81-90 [doi]

PPBT: A High Performance Parallel Search TreeJiawen Guan, Rui Fan. 91-100 [doi]

Deciding Non-Compressible Blocks in Sparse Direct Solvers using Incomplete FactorizationEsragul Korkmaz, Mathieu Faverge, Pierre Ramet, Grégoire Pichon. 101-110 [doi]

Efficient Parallel Algorithms for Computing Percolation CentralityAthreya Chandramouli, Sayantan Jana, Kishore Kothapalli. 111-120 [doi]

Accelerating JPEG Decompression on GPUsAndré Weißenberger, Bertil Schmidt. 121-130 [doi]

Towards Zero-Waste Recovery and Zero-Overhead Checkpointing in Ensemble Data AssimilationKai Keller, Adrián Cristal Kestelman, Leonardo Bautista-Gomez. 131-140 [doi]

Predictive Analysis of Large-Scale Coupled CFD Simulations with the CPX Mini-AppArchie Powell, K. Choudry, A. Prabhakar, I. Z. Reguly, D. Amirante, Stephen A. Jarvis, Gihan R. Mudalige. 141-151 [doi]

The 16, 384-node Parallelism of 3D-CNN Training on An Arm CPU based SupercomputerAkihiro Tabuchi, Koichi Shirahata, Masafumi Yamazaki, Akihiko Kasagi, Takumi Honda, Kouji Kurihara, Kentaro Kawakami, Tsuguchika Tabaru, Naoto Fukumoto, Akiyoshi Kuroda, Takaaki Fukai, Kento Sato. 152-161 [doi]

iPUG for Multiple Graphcore IPUs: Optimizing Performance and Scalability of Parallel Breadth-First SearchLuk Burchard, Xing Cai, Johannes Langguth. 162-171 [doi]

Empirical Analysis of Architectural Primitives for NVRAM ConsistencyK. P. Arun, Debadatta Mishra, Biswabandan Panda. 172-181 [doi]

JACC: An OpenACC Runtime Framework with Kernel-Level and Multi-GPU ParallelizationKazuaki Matsumura, Simon Garcia De Gonzalo, Antonio J. Peña. 182-191 [doi]

Anti-Section Transitive ClosureOded Green, Zhihui Du, Sanyamee Patel, Zehui Xie, Hang Liu, David A. Bader. 192-201 [doi]

Column-Segmented Sparse Matrix-Matrix Multiplication on Multicore CPUsXiaojing An, Ümit V. Çatalyürek. 202-211 [doi]

Multi-Stage Memory Efficient Strassen's Matrix Multiplication on GPUArjun Gopala Krishnan, Dhrubajyoti Goswami. 212-221 [doi]

Optimizing k-path selection for randomized interconnection networksMd Nahid Newaz, Md Atiqul Mollah. 222-231 [doi]

Dynamic Voltage and Frequency Scaling to Improve Energy-Efficiency of Hardware AcceleratorsSiqin Liu, Avinash Karanth. 232-241 [doi]

Adaptive Placement of Data Analysis Tasks For Staging Based In-Situ ProcessingZhe Wang, Pradeep Subedi, Matthieu Dorier, Philip E. Davis, Manish Parashar. 242-251 [doi]

HEALS: A Parallel eALS Recommendation System on CPU/GPU Heterogeneous PlatformsQihan Wang, Wei Niu, Li Chen, Ruoming Jin, Bin Ren. 252-261 [doi]

Shrinking Sample Search Algorithm for Automatic Tuning of GPU KernelsXiang Li, Gagan Agrawal. 262-271 [doi]

Towards Architecture-aware Hierarchical Communication Trees on Modern HPC SystemsBharath Ramesh 0005, Jahanzeb Maqbool Hashmi, Shulei Xu, Aamir Shafi, Seyedeh Mahdieh Ghazimirsaeed, Mohammadreza Bayatpour, Hari Subramoni, Dhabaleswar K. Panda 0001. 272-281 [doi]

DistMILE: A Distributed Multi-Level Framework for Scalable Graph EmbeddingYuntian He, Saket Gurukar, Pouya Kousha, Hari Subramoni, Dhabaleswar K. Panda 0001, Srinivasan Parthasarathy 0001. 282-291 [doi]

Model-based Reinforcement Learning for Elastic Stream Processing in Edge ComputingJinlai Xu, Balaji Palanisamy. 292-301 [doi]

Layout-aware Hardware-assisted Designs for Derived Data Types in MPIKaushik Kandadi Suresh, Bharath Ramesh 0005, Chen-Chun Chen, Seyedeh Mahdieh Ghazimirsaeed, Mohammadreza Bayatpour, Aamir Shafi, Hari Subramoni, Dhabaleswar K. Panda 0001. 302-311 [doi]

Parallel Algorithms for Efficient Computation of High-Order Line Graphs of HypergraphsXu T. Liu, Jesun Firoz, Andrew Lumsdaine, Cliff A. Joslyn, Sinan Aksoy, Brenda Praggastis, Assefaw H. Gebremedhin. 312-321 [doi]

Asynchronous I/O Strategy for Large-Scale Deep Learning ApplicationsSunWoo Lee, Qiao Kang, Kewei Wang, Jan Balewski, Alex Sim, Ankit Agrawal, Alok N. Choudhary, Peter Nugent, Kesheng Wu, Wei-keng Liao. 322-331 [doi]

SYMBIOMON: A High-Performance, Composable Monitoring ServiceSrinivasan Ramesh, Robert B. Ross, Matthieu Dorier, Allen D. Malony, Philip H. Carns, Kevin A. Huck. 332-342 [doi]

Load-balancing Parallel I/O of Compressed Hierarchical LayoutsKe-fan, Duong Hoang, Steve Petruzza, Thomas Gilray, Valerio Pascucci, Sidharth Kumar. 343-353 [doi]

CUDA-DClust+: Revisiting Early GPU-Accelerated DBSCAN Clustering DesignsMadhav Poudel, Michael Gowanlock. 354-363 [doi]

Static Graphs for Coding Productivity in OpenACCLeonel Toledo, Pedro Valero-Lara, Jeffrey Vetter, Antonio J. Peña. 364-369 [doi]

Performance of Local Push Algorithms for Personalized PageRank on Multi-core PlatformsMadhav Aggarwal, Bingyi Zhang, Viktor K. Prasanna. 370-375 [doi]

BEE Orchestrator: Running Complex Scientific Workflows on Multiple SystemsJacob Tronge, Patricia Grubel, Timothy Randles, Quincy Wofford, Rusty Davis, Steven Anaya, Qiang Guan. 376-381 [doi]

OpenACC Multi-GPU Approach for WSM6 MicrophysicsHércules Cardoso da Silva, Marco Aurelio Stefanes, Vinícius Capistrano. 382-387 [doi]

Large-Message Nonblocking MPI_Iallgather and MPI Ibcast Offload via BlueField-2 DPUNick Sarkauskas, Mohammadreza Bayatpour, Tu Tran, Bharath Ramesh 0005, Hari Subramoni, Dhabaleswar K. Panda 0001. 388-393 [doi]

Optimizing Multi-Range based Error-Bounded Lossy Compression for Scientific DatasetsYuanjian Liu, Sheng Di, Kai Zhao, Sian Jin, Cheng Wang, Kyle Chard, Dingwen Tao, Ian T. Foster, Franck Cappello. 394-399 [doi]

An In-Depth I/O Pattern Analysis in HPC SystemsJiwoo Bang, Chungyong Kim, Kesheng Wu, Alex Sim, Suren Byna, Hanul Sung, Hyeonsang Eom. 400-405 [doi]

FaaSter: Accelerated Functions-as-a-Service with Heterogeneous GPUsAnshuj Garg, Purushottam Kulkarni, Umesh Bellur, Sriram Yenamandra. 406-411 [doi]

RSP-Hist: Approximate Histograms for Big Data Exploration on Hadoop ClustersSalman Salloum, Joshua Zhexue Huang. 412-417 [doi]

A Programming API Implementation for Secure Data Analytics Applications with Homomorphic Encryption on GPUsShuangsheng Lou, Gagan Agrawal. 418-423 [doi]

A Fused Inference Design for Pattern-Based Sparse CNN on Edge DevicesJia Guo, Radu Teodorescu, Gagan Agrawal. 424-429 [doi]

Cloud-Based Urgent Computing for Forest Fire Spread Prediction under Data UncertaintiesEdigley Fraga, Ana Cortés, Tomàs Margalef, Porfidio Hernández. 430-435 [doi]

Exploring Thread Coarsening on FPGAMostafa Eghbali Zarch, Reece Neff, Michela Becchi. 436-441 [doi]

PILOT: a Runtime System to Manage Multi-tenant GPU Unified Memory FootprintJohn Ravi, Tri Nguyen, Huiyang Zhou, Michela Becchi. 442-447 [doi]

A computational technique for parallel solution of diagonally dominant banded linear systemsS. Chandra Sekhara Rao, Rabia Kamra. 448-453 [doi]

runs on WebDSL