IEEE High Performance Extreme Computing Conference, HPEC 2024, Wakefield, MA, USA, September 23-27, 2024

researchr

You are not signed in
Sign in
Sign up

IEEE High Performance Extreme Computing Conference, HPEC 2024, Wakefield, MA, USA, September 23-27, 2024. IEEE, 2024. [doi]

Conference: hpec2024

Abstract is missing.

Tightly-Coupled FPGA Accelerator for Molecular Dynamics Simulation: Hardware-Software Co-Design and Fine-Grained Task ManagementZekang Cheng, Zerong He, Xi Jin 0002. 1-7 [doi]

Towards Faster Graph Partitioning via Pre-Training and Inductive InferenceMeng Qin 0002, Chaorui Zhang, Yu Gao, Yibin Ding, Weipeng Jiang, Weixi Zhang, Wei Han 0004, Bo Bai 0001. 1-7 [doi]

Hunting the Needle - The Potential of Innovation in ArchitecturePeter M. Kogge, Janice O. McMahon, Timothy J. Dysart. 1-6 [doi]

Enhanced Knowledge Graph Attention Networks for Efficient Graph LearningFernando Vera Buschmann, Zhihui Du, David A. Bader. 1-7 [doi]

Analyzing an In-line Compression on the Matrix Matrix Multiplication KernelSteven Platt, Jon C. Calhoun. 1-11 [doi]

On the Scalability of Computing Genomic Diversity Using SparkLeBLAST: A Feasibility StudyRitvik Prabhu, Bernard Moussad, Karim Youssef, Emil Vatai, Wu-chun Feng. 1-8 [doi]

Reinforcement Learning-Generated Topological Order for Dynamic Task Graph SchedulingCheng-Hsiang Chiu, Chedi Morchdi, Yi Zhou 0017, Boyang Zhang, Che Chang, Tsung-Wei Huang. 1-7 [doi]

Breakthrough Edge AI Inference Performance Using Northpole in 3U Vpx Form FactorFilipp Akopyan, William P. Risk, John V. Arthur, Andrew S. Cassidy, Michael V. DeBole, Carlos Ortega-Otero, Jun Sawada, Evan Colgan, Michael E. Criscolo, Phillip V. Mann, Heinz Baier, Kai Schleupen, Arnon Amir, Alexander Andreopoulos, Rathinakumar Appuswamy, Deepika Bablani, Peter J. Carlson, Pallab Datta, Steven K. Esser, Myron D. Flickner, Rajamohan Gandhasri, Guillaume J. Garreau, Megumi Ito, Jennifer L. Klamo, Jeffrey A. Kusnitz, Nathaniel J. McClatchey, Neil McGlohon, Jeffrey L. McKinstry, Yutaka Y. Nakamura, Tapan K. Nayak, Jay Sivagnaname, Daniel F. Smith, Rafael Sousa, Brian Taba, Ignacio Terrizzano, Takanori Ueda, Dharmendra S. Modha. 1-5 [doi]

Distributed-Memory Sparse Deep Neural Network Inference Using Global ArraysBruce Palmer, Sayan Ghosh, Andrés Márquez. 1-7 [doi]

Transformers: A Graph Processing PerspectiveManish Sri Sai Surya Routhu, Sai Dheeraj Yanduru, Nathaniel Tomczak, Sanmukh Kuppannagari. 1-7 [doi]

Mobile-Optimized Real-Time Vessel Detection for Ultrasound-Guided Surgical ProceduresMateusz Wolak, Fin Amin, Nancy DeLosa, Brian A. Telfer, Benjamin W. Roop, Lars Gjesteby. 1-7 [doi]

Comparative Analysis of GCC and LLVM for Performance Optimization on Aarch64Mriganka Bezbaruah, Samruddhi Dhakulkar, Prachi Pandey, Haribabu P, S. A. Kumar, S. D. Sudarsan. 1-6 [doi]

Extracting TCPIP Headers at High Speed for the Anonymized Network Traffic Graph ChallengeZhaoyang Han, Andrew Briasco-Stewart, Michael Zink, Miriam Leeser. 1-6 [doi]

Evaluating One-Sided Communication on Graph500 with MPI-RMA and OpenSHMEMJefferson Boothe, Alan D. George. 1-7 [doi]

Sans: Streaming Anonymized Network SensingKetai Zhao, Yuhang Zhou, Hongxu Pan, Zhibin Wang, Sheng Zhong 0002, Chen Tian 0001. 1-7 [doi]

Multiplication of Sparse Matrices and their Transpose Using Compressed Sparse DiagonalsSardar Anisul Haque, Mohammad Tanvir Parvez, Shahadat Hossain. 1-6 [doi]

MST in Incremental Graphs Through Tree ContractionsAkanksha Dwivedi, Sameer Sharma, Dip Sankar Banerjee. 1-7 [doi]

Optimizing FPGA Memory Allocation for Matrix-Matrix Multiplication Using Bayesian OptimizationMehmet Güngör, Stratis Ioannidis, Miriam Leeser. 1-7 [doi]

A Graph-Based Algorithm for Optimizing GCC Compiler Flag SettingsReza Sajjadinasab, Sanjay Arora, Ulrich Drepper, Ahmed Sanaullah, Martin C. Herbordt. 1-8 [doi]

The Genomic Computing Revolution: Defining the Next Decades of Accelerating GenomicsHarisankar Sadasivan, Artur Klauser, Jürgen Hench, Yatish Turakhia, Gagandeep Singh 0002, Alberto Zeni, Sarah J. Beecroft, Satish Narayanasamy, Jeff Nivala, Bob Robey, Onur Mutlu, Kristof Denolf, Sriranjani Sitaraman. 1-9 [doi]

HPC Network Simulation Tuning via Automatic Extraction of Hardware ParametersJoshua Suetterlein, Stephen J. Young, Jesun Firoz, Joseph B. Manzano, Nathan R. Tallent, Ryan D. Friese, Kevin J. Barker, Timothy Stavenger. 1-10 [doi]

Energy Efficiency Scaling for 2 Decades (EES2) Roadmap for ComputingT. Kaarsberg, J. Atulasimha, J. Baniecki, P. Fischer, S. Pawlowski, S. Misra, A. Bhavnagarwala, E. Salman, M. Ahmed, N. Li, R. Aggarwal, B. Hirano, T. Shah, C. Green, J. Booth, P. Sharps, T. McDonald, J. Ballard, Y. Chen, P. Nagapurkar, W. Huang, D. Kudithipudi, A. Paramonov, F. Musso, A. K. Ziabari, J. Luo, A. K. Petford-Long, D. Gopman, C. Gotama, T. Wei, S. Shaheen, Y. Zhang, I. Lu, K. Shimizu, E. Taylor, N. Johnson, R. Jones, S. Shankar. 1-3 [doi]

Batch-Parallel Compressed Sparse Row: A Locality-Optimized Dynamic-Graph RepresentationBrian Wheatman, Randal C. Burns, Helen Xu 0001. 1-8 [doi]

Constant-Memory Graph CoarseningGeorge M. Slota, Christopher Brissette. 1-7 [doi]

MESM: A Query-Agnostic and Memory-Efficient Parallel Subgraph Matching AlgorithmShubhashish Kar, Shaikh Arifuzzaman. 1-7 [doi]

Dynamic Task Scheduling with Data Dependency Awareness Using JuliaRabab Alomairy, Felipe Tome, Julian Samaroo, Alan Edelman. 1-7 [doi]

Enhancing Code Translation in Language Models with Few-Shot Learning via Retrieval-Augmented GenerationManish Bhattarai, Javier E. Santos, Shawn Jones, Ayan Biswas, Boian S. Alexandrov, Daniel O'Malley. 1-8 [doi]

OCO-GAT: An Accelerator for Graph Attention Network with Optimized Calculation OrderQi Liu 0061, Wenjin Huang, Wenlu Peng, Yihua Huang 0005. 1-7 [doi]

A Highly Scalable Parallel Design for Data CompressionS. Biplab Raut. 1-5 [doi]

A Framework for Analyzing the Performance of Sparse Matrix and Graph OperationsKhaled Abdelaal, Richard Veras. 1-7 [doi]

Hardware Trojan Detection Utilizing Graph Neural Networks and Structural CheckingHunter Nauman, Jia Di. 1-7 [doi]

Composable Mission-Critical Embedded System Architecture for High AssuranceMichael Vai, Eric Simpson, Alice Lee, Huy Nguyen, Jeffrey J. Hughes, Ben Nahill, Jeffery Lim, Roger Khazan, Sean R. O'Melia, Fred B. Schneider. 1-6 [doi]

GPU Sharing with Triples ModeChansup Byun, Albert Reuther, LaToya Anderson, William Arcand, Bill Bergeron, David Bestor, Alexander Bonn, Daniel Burrill, Vijay Gadepally, Michael Houle 0001, Matthew Hubbell, Hayden Jananthan, Michael Jones 0001, Piotr Luszczek, Peter Michaleas, Lauren Milechin, Guillermo Morales, Julie Mullen, Andrew Prout, Antonio Rosa, Charles Yee, Jeremy Kepner. 1-7 [doi]

An Efficient Multi-Core Parallel Implementation of SSSP Algorithm with Decreasing Delta-SteppingRakibul Hassan, Shaikh Arifuzzaman. 1-7 [doi]

A Multilevel Approach for Solving Large-Scale QUBO Problems with Noisy Hybrid Quantum Approximate OptimizationFilip B. Maciejewski, Bao G. Bach, Maxime Dupont, Paul Aaron Lott, Bhuvanesh Sundar, David E. Bernal Neira, Ilya Safro, Davide Venturelli. 1-10 [doi]

Persistent and Partitioned MPI for Stencil CommunicationGerald Collom, Jason Burmark, Olga Pearce, Amanda Bienz. 1-7 [doi]

Investigating Resilience of Loops in HPC Programs: A Semantic Approach with LLMsHailong Jiang, Jianfeng Zhu, Bo Fang, Chao Chen, Qiang Guan. 1-10 [doi]

Accelerating Sensor Fusion in Neuromorphic Computing: A Case Study on Loihi-2Murat Isik, Karn Tiwari, Muhammed Burak Eryilmaz, Ismail Can Dikmen. 1-7 [doi]

Predictive Performance of Photonic SRAM-Based in-Memory Computing for Tensor DecompositionSasindu Wijeratne, Sugeet Sunder, Md. Abdullah-Al Kaiser, Akhilesh Jaiswal 0001, Clynn Mathew, Ajey P. Jacob, Viktor K. Prasanna. 1-5 [doi]

VeBPF Many-Core Architecture for Network Functions in FPGA-based SmartNICs and IoTZaid Tahir, Ahmed Sanaullah, Sahan Bandara, Ulrich Drepper, Martin C. Herbordt. 1-9 [doi]

Anonymized Network Sensing Graph ChallengeHayden Jananthan, Michael Jones 0001, William Arcand, David Bestor, William Bergeron, Daniel Burrill, Aydin Buluç, Chansup Byun, Timothy Davis, Vijay Gadepally, Daniel Grant, Michael Houle 0001, Matthew Hubbell, Piotr Luszczek, Peter Michaleas, Lauren Milechin, Chasen Milner, Guillermo Morales, Andrew Morris, Julie Mullen, Ritesh Patel, Alex Pentland, Sandeep Pisharody, Andrew Prout, Albert Reuther, Antonio Rosa, Gabriel Wachman, Charles Yee, Jeremy Kepner. 1-8 [doi]

An Efficient Multi-DNN Accelerator Based on Multiple Systolic ArraysJianjun Chen, Han Jiao 0003, Wenjin Huang, Yihua Huang 0005. 1-7 [doi]

LLload: An Easy-to-Use HPC Utilization ToolChansup Byun, Albert Reuther, Julie Mullen, LaToya Anderson, William Arcand, Bill Bergeron, David Bestor, Alexander Bonn, Daniel Burrill, Vijay Gadepally, Michael Houle 0001, Matthew Hubbell, Hayden Jananthan, Michael Jones 0001, Piotr Luszczek, Peter Michaleas, Lauren Milechin, Guillermo Morales, Andrew Prout, Antonio Rosa, Charles Yee, Jeremy Kepner. 1-9 [doi]

Breakthrough Low-Latency, High-Energy-Efficiency LLM Inference Performance Using NorthPoleRathinakumar Appuswamy, Michael V. DeBole, Brian Taba, Steven K. Esser, Andrew S. Cassidy, Arnon Amir, Alexander Andreopoulos, Deepika Bablani, Pallab Datta, Jeffrey A. Kusnitz, Nathaniel J. McClatchey, Neil McGlohon, Jeffrey L. McKinstry, Tapan K. Nayak, Daniel F. Smith, Rafael Sousa, Ignacio Terrizzano, Filipp Akopyan, Peter J. Carlson, Rajamohan Gandhasri, Guillaume Garreau, Nelson M. Gonzalez, Megumi Ito, Jennifer L. Klamo, Yutaka Y. Nakamura, Carlos Ortega-Otero, William P. Risk, Jun Sawada, Kai Schleupen, Jay Sivagnaname, Matthew Stallone, Takanori Ueda, Myron D. Flickner, John V. Arthur, Rameswar Panda, David D. Cox, Dharmendra S. Modha. 1-8 [doi]

A Dynamic Weighting Strategy to Mitigate Worker Node Failure in Distributed Deep LearningYuesheng Xu, Arielle Carr. 1-6 [doi]

Hybrid Computing Architecture Based on Analog Phase-Change Memory Chips for Deep Neural Network TrainingZhenhao Jiao, Xiaogang Chen, Tao Hong, Weibang Dai, Chengcai Tu, Shunfen Li, Houpeng Chen, Zhitang Song. 1-6 [doi]

A Deployment Tool for Large Scale Graph Analytics Framework ArachneGarrett Gonzalez-Rivas, Zhihui Du, David A. Bader. 1-7 [doi]

Cycle-Stealing in Load-Imbalanced HPC ApplicationsPo-Hao Chen, Akshaya Bali, Shining Yang, Pouya Haghi, Carlton Knox, Benjamin Li, Amr Akmal Abouelmagd, Anthony Skjellum, Martin C. Herbordt. 1-8 [doi]

BB-CVXOPT: Basic Block Execution Count Estimation and Extrapolation Using Constrained Convex OptimizationYoussef Aly, Atanu Barai, Nandakishore Santhi, Abdel-Hameed A. Badawy. 1-7 [doi]

Comparison of Vectorization Capabilities of Different Compilers for X86 and ARM CPUsNazmus Sakib, Tarun Prabhu, Nandakishore Santhi, John Shalf, Abdel-Hameed A. Badawy. 1-7 [doi]

IOS: A Low Cost Defense to Mitigate Meltdown and Spectre Like AttacksXin Wang, Wei Zhang. 1-5 [doi]

Towards Just-in-Time Instruction Generation for Accelerated Sparse Matrix-Matrix Multiplication on GPUsSeth David Kay, H. Howie Huang. 1-7 [doi]

Scalable Approach for Analytic Polynomial Subspace Projection Matrices for a Space-Time Covariance MatrixFaizan A. Khattak, Mohammed A. Bakhit, Ian K. Proudler, Stephan Weiss 0001. 1-5 [doi]

Privacy-Preserving AI for Document Understanding with Controlled Unclassified InformationScott M. Sawyer. 1-7 [doi]

pc-COP: An Efficient and Configurable 2048-p-Bit Fully-Connected Probabilistic Computing Accelerator for Combinatorial OptimizationKiran Magar, Shreya Bharathan, Utsav Banerjee. 1-7 [doi]

Task-Level Parallelism for the Multifrontal Method in Tightly Coupled CPU-FPGA ArchitecturesZerong He, Zekang Cheng, Zhongguang Xu, Xi Jin 0002. 1-7 [doi]

MonoCoder: Domain-Specific Code Language Model for HPC Codes and TasksTal Kadosh, Niranjan Hasabnis, Vy A. Vo, Nadav Schneider, Neva Krien, Mihai Capota, Abdul Wasay, Guy Tamir, Ted Willke, Nesreen K. Ahmed, Yuval Pinter, Timothy G. Mattson, Gal Oren 0001. 1-7 [doi]

Characterization and Optimization of the Fitting of Quantum Correlation FunctionsPi-Yueh Chuang, Niteya Shah, Patrick Barry, Ian Cloët, Emil M. Constantinescu, Nobuo Sato, Jianwei Qiu, Wu-chun Feng. 1-8 [doi]

Optimization Strategies to Accelerate BLAS Operations with ARM SVEAniket P. Garade, Sushil Pratap Singh, Juliya James, H. V. Deepika, Haribabu P, S. A. Kumar, S. D. Sudarsan. 1-7 [doi]

Indexed Binary Operations in the GraphBLASTimothy G. Mattson, Manaswinee Bezbaruah, Matthias Maier, Scott McMillan, Michel Pelletier, Erik Welch, Timothy A. Davis 0001. 1-7 [doi]

LLMs for Closed-Library Multi-Document Query, Test Generation, and EvaluationClaire Randolph, Adam Michaleas, Darrell O. Ricke. 1-10 [doi]

VF2-PS: Parallel and Scalable Subgraph Monomorphism in ArachneMohammad Dindoost, Oliver Alvarado Rodriguez, Sounak Bagchi, Palina Pauliuchenka, Zhihui Du, David A. Bader. 1-9 [doi]

Understanding the Efficacy of Power Profiles: A Case Study of AMD Instinct MI100 GPUGhazanfar Ali, Mert Side, Sridutt Bhalachandra, Tommy Dang, Alan Sill, Yong Chen 0001. 1-7 [doi]

MERCURY: Efficient Subgraph Matching on GPUs with Hybrid SchedulingZhiheng Lin, Changjie Xu, Ke Meng, Guangming Tan. 1-7 [doi]

Graphical Learning Optimization and Dimensionality Reduction with Geometric Multi-Resolution AnalysisFelicia Schenkelberg, Allison Gunby-Mann, Emma Graham, Shuoxuan Li, Peter Chin 0001. 1-8 [doi]

A Run-Time Configurable NTT Architecture for Homomorphic Encryption Based on 3D AlgorithmWeicong Lu, Xiaojie Chen, Dihu Chen, Tao Su. 1-6 [doi]

Compressed Cannon's AlgorithmLouis Jencka, Amanda Bienz. 1-6 [doi]

Direct RF FPGAs Built with Multi-Chip Packaging Overcome Technology ChallengesMarjorie Catt, Dustin Henderson. 1-5 [doi]

What is Normal? A Big Data Observational Science Model of Anonymized Internet TrafficJeremy Kepner, Hayden Jananthan, Michael Jones 0001, William Arcand, David Bestor, William Bergeron, Daniel Burrill, Aydin Buluç, Chansup Byun, Timothy Davis, Vijay Gadepally, Daniel Grant, Michael Houle 0001, Matthew Hubbell, Piotr Luszczek, Lauren Milechin, Chasen Milner, Guillermo Morales, Andrew Morris, Julie Mullen, Ritesh Patel, Alex Pentland, Sandeep Pisharody, Andrew Prout, Albert Reuther, Antonio Rosa, Gabriel Wachman, Charles Yee, Peter Michaleas. 1-7 [doi]

Augmenting HPC Profilers with Analysis CapabilitiesAbhishek Patil, Shamjith K. V, Senthil Kumar R. K, S. D. Sudarsan. 1-7 [doi]

Experiences with VITIS AI for Deep Reinforcement LearningNabayan Chaudhury, Atharva Gondhalekar, Wu-chun Feng. 1-7 [doi]

p-YOLOv8: Efficient and Accurate Real-Time Detection of Distracted DrivingMohamed R. Elshamy, Heba M. Emara, Mohamed R. Shoaib, Abdel-Hameed A. Badawy. 1-6 [doi]

Intel Xeon Optimization for Efficient Media Workload AccelerationKaran Puttannaiah, Rajesh Poornachandran. 1-5 [doi]

A High-Performance Curve25519 and Curve448 Unified Elliptic Curve Cryptography AcceleratorAniket Banerjee, Utsav Banerjee. 1-7 [doi]

Improving Regression in Spiking Neural Networks for Oceanographic Data AnalysisAlissa J. Kane, Yuchou Chang. 1-5 [doi]

HBM-Based Hardware Accelerator for GNN Sampling and AggregationYuchen Gui, Qizhe Wu, Wei Yuan, Huawen Liang, Xiaotian Wang, Xi Jin 0002. 1-7 [doi]

High Performance Im2win and Direct Convolutions Using Three Tensor Layouts on SIMD ArchitecturesXiang Fu, Xinpeng Zhang, Jixiang Ma, Peng Zhao, Shuai Lu, Xu T. Liu. 1-7 [doi]

Supercomputer 3D Digital Twin for User Focused Real-Time MonitoringBill Bergeron, Matthew Hubbell, Daniel Mojica, Albert Reuther, William Arcand, David Bestor, Daniel Burrill, Chansup Byun, Vijay Gadepally, Michael Houle 0001, Hayden Jananthan, Michael Jones 0001, Piotr Luszczek, Peter Michaleas, Lauren Milechin, Julie Mullen, Andrew Prout, Antonio Rosa, Charles Yee, Jeremy Kepner. 1-8 [doi]

Exploring the Trade-Off Between Repair Time and Reliability in Large Scale Cluster Computers: A Simulation-Based ApproachLeslie A. Horace, Craig S. Walker, William M. Jones, Nathan DeBardeleben, Vivian E. Hafener, Steven T. Senator. 1-9 [doi]

LLM Inference Serving: Survey of Recent Advances and OpportunitiesBaolin Li, Yankai Jiang 0002, Vijay Gadepally, Devesh Tiwari. 1-8 [doi]

Parallel Online Directed Acyclic Graph Exploration for Atlasing Soft-Matter Assembly Configuration SpacesRahul Prabhu, Amit Verma, Meera Sitharam. 1-8 [doi]

Benchmarking Edge AI Platforms for High-Performance ML InferenceRakshith Jayanth, Neelesh Gupta, Viktor K. Prasanna. 1-7 [doi]

ModelGauge: Inference Profiling of Deep-Learning ModelsCalvin B. Gealy, David Langerman, Alan D. George. 1-7 [doi]

A Neural Network Based GCC Cost Model for Faster Compiler TuningHafsah Shahzad, Ahmed Sanaullah, Sanjay Arora, Ulrich Drepper, Martin C. Herbordt. 1-9 [doi]

Fpga Acceleration for Scalable High-Resolution Opir Target DetectionDaniel C. Stumpp, Alan D. George. 1-7 [doi]

A Framework to Enable Algorithmic Design Choice Exploration in DNNsTimothy L. Cronin IV, Sanmukh Kuppannagari. 1-7 [doi]

Quantum Computing for Data Calibration in Parallel Magnetic Resonance Imaging ReconstructionGirish Babu Reddy, Gulfam Ahmed Saju, Yi Liu, Yuchou Chang. 1-6 [doi]

IRIS-MEMFLOW: Data Flow-Enabled Portable Memory Orchestration in IRIS Runtime for Diverse HeterogeneityMohammad Alaul Haque Monil, Narasinga Rao Miniskar, Seyong Lee, Beau Johnston, Pedro Valero-Lara, Aaron R. Young, Keita Teranishi, Jeffrey S. Vetter. 1-9 [doi]

Efficient Eigenvalue Computation of Parahermitian Matrices Using Neural NetworksDiyari A. Hassan, Yunus Egi, Soydan Redif. 1-6 [doi]

HENNC: Hardware Engine for Artificial Neural Network-Based Chaotic OscillatorsMobin Vaziri, Shervin Vakili, M. Mehdi Rahimifar, J. M. Pierre Langlois. 1-5 [doi]

Beyond Zero Trust: Reclaiming Blue Cyberspace with AIScott A. Weed. 1-7 [doi]

Spike-Driven YOLO: Ultra Low-Power Object Detection with Neuromorphic ComputingMark Barnell, Courtney Raymond, Lisa Loomis, Francesca Vidal, Daniel Brown, Darrek Isereau. 1-5 [doi]

GLITCHES: GPU-FPGA LLM Inference Through a Collaborative Heterogeneous SystemFan Yang, Xinhao Yang, Hongyi Wang, Zehao Wang, Zhenhua Zhu, Shulin Zeng, Yu Wang. 1-7 [doi]

Exploring Sparse Inference with SuiteSparse: GraphBLASDeepak Suresh, Tim Davis 0001. 1-6 [doi]

Benchmarking Thread Block ClusterTim Lühnen, Tobias Marschner, Sohan Lal. 1-7 [doi]

Algebraic Vertex Ordering of a Sparse Graph for Adjacency Access Locality and Graph CompressionDimitris Floros, Nikos Pitsianis, Xiaobai Sun. 1-7 [doi]

Ultra Low Latency Hardware Optimised Radix-4 FFT for Optical Wireless FPGA Transceivers Via Hermitian Symmetry CharacteristicsMichael Codd, Ciara McDonald, Yiyue Jiang, Chunan Chen, Holger Claussen 0001, Miriam Leeser, John Dooley. 1-7 [doi]

Quantum Machine Learning in the Cognitive Domain: Alzheimer's Disease StudyEmine Akpinar. 1-6 [doi]

Community Detection for Large Graphs on GPUs with Unified MemoryEmre Dinçer, Isil Öz. 1-7 [doi]

JACC.shared: Leveraging HPC Metaprogramming and Performance Portability for Computations That Use Shared Memory GPUsPedro Valero-Lara, William F. Godoy, Keita Teranishi, Jeffrey S. Vetter. 1-7 [doi]

Accelerating Multi-Agent DDPG Training on Multi-GPU PlatformsSamuel Wiggins, Viktor K. Prasanna. 1-5 [doi]

Application of Virtual Client for Azure Hardware QualificationAnna Mary Mathew, Bryan DeYoung, Michael Chhor, Sharjil Khan. 1-6 [doi]

Syndeo: Portable Ray Clusters with Secure ContainerizationWilliam Li, Rodney S. Lafuente Mercado, Jaime Daniel Peña, Ross E. Allen. 1-11 [doi]

Binary Bleed: Fast Distributed and Parallel Method for Automatic Model SelectionRyan Barron, Maksim Ekin Eren, Manish Bhattarai, Ismael Boureima, Cynthia Matuszek, Boian S. Alexandrov. 1-8 [doi]

Benchmarking the Performance of Large Language Models on the Cerebras Wafer Scale EngineZuoning Zhang, Dhruv Parikh, Youning Zhang, Viktor K. Prasanna. 1-7 [doi]

Fully Transparent Client-Side Caching for Key-Value Store Applications Using FPGAsSahan Bandara, Noah Cherry, Martin C. Herbordt. 1-7 [doi]

Elucidating US Import Supply Chain Dynamics: A Spatial-Temporal Graph Neural Network ApproachNikolay Aristov, Ziyan Li, Thomas Koch 0005, Elenna R. Dugundji. 1-6 [doi]

GPU Accelerated Construction of Time Respecting Data Structure for Temporal GraphsAniman Naskar, Venkata Kalyan Tavva, Subhasis Banerjee. 1-7 [doi]

Power Efficient Deep Learning Acceleration Using Intel Xeon ProcessorsXiaofei Jiang, Mona Minakshi, Rajesh Poornachandran, Shamima Najnin. 1-6 [doi]

Multilevel Diffusion Based Spectral Graph ClusteringMalik Lechekhab, Dimosthenis Pasadakis, Olaf Schenk. 1-7 [doi]

A Performance Analysis of GPU-Aware MPI Implementations Over the Slingshot-11 InterconnectMichael Beebe, Rahulkumar Gayatri, Kevin Gott, Adam Lavely, Muhammad Haseeb, Brandon Cook 0001, Yong Chen 0001. 1-7 [doi]

External Links

Cite Key

Statistics

PDF

Researchr

IEEE High Performance Extreme Computing Conference, HPEC 2024, Wakefield, MA, USA, September 23-27, 2024

Abstract

Table of Contents