IEEE International Symposium on High-Performance Computer Architecture, HPCA 2021, Seoul, South Korea, February 27 - March 3, 2021 - researchr publication

researchr

You are not signed in
Sign in
Sign up

IEEE International Symposium on High-Performance Computer Architecture, HPCA 2021, Seoul, South Korea, February 27 - March 3, 2021. IEEE, 2021. [doi]

Conference: hpca2021

Abstract is missing.

Common Counters: Compressed Encryption Counters for Secure GPU MemorySeonjin Na, Sunho Lee, Yeonjae Kim, Jongse Park, Jaehyuk Huh. 1-13 [doi]

Streamline Ring ORAM Accesses through Spatial and Temporal OptimizationDingyuan Cao, Mingzhe Zhang, Hang Lu, Xiaochun Ye, Dongrui Fan, Yuezhi Che, Rujia Wang. 14-25 [doi]

Cheetah: Optimizing and Accelerating Homomorphic Encryption for Private InferenceBrandon Reagen, Wooseok Choi, Yeongil Ko, Vincent T. Lee, Hsien-Hsin S. Lee, Gu-Yeon Wei, David Brooks 0001. 26-39 [doi]

New Models for Understanding and Reasoning about Speculative Execution AttacksZecheng He, Guangyuan Hu, Ruby B. Lee. 40-53 [doi]

A Computational Stack for Cross-Domain AccelerationSean Kinzer, Joon Kyung Kim, Soroush Ghodrati, Brahmendra Reddy Yatham, Alric Althoff, Divya Mahajan, Sorin Lerner, Hadi Esmaeilzadeh. 54-70 [doi]

Heterogeneous Dataflow Accelerators for Multi-DNN WorkloadsHyoukjun Kwon, Liangzhen Lai, Michael Pellauer, Tushar Krishna, Yu-Hsin Chen, Vikas Chandra. 71-83 [doi]

SPAGHETTI: Streaming Accelerators for Highly Sparse GEMM on FPGAsReza Hojabr, Ali Sedaghati, Amirali Sharifian, Ahmad Khonsari, Arrvindh Shriraman. 84-96 [doi]

SpAtten: Efficient Sparse Attention Architecture with Cascade Token and Head PruningHanrui Wang 0002, Zhekai Zhang, Song Han 0003. 97-110 [doi]

BBB: Simplifying Persistent Programming using Battery-Backed BuffersMohammad A. Alshboul, Prakash Ramrakhyani, William Wang, James Tuck, Yan Solihin. 111-124 [doi]

TSOPER: Efficient Coherence-Based Strict PersistencyPer Ekemark, Yuan Yao, Alberto Ros, Konstantinos Sagonas, Stefanos Kaxiras. 125-138 [doi]

Stealth-Persist: Architectural Support for Persistent Applications in Hybrid Memory SystemsMazen Al-Wadi, Vamsee Reddy Kommareddy, Clayton Hughes, Simon David Hammond, Amro Awad. 139-152 [doi]

TILT: Achieving Higher Fidelity on a Trapped-Ion Linear-Tape Quantum Computing ArchitectureXin-Chuan Wu, Dripto M. Debroy, Yongshan Ding, Jonathan M. Baker, Yuri Alexeev, Kenneth R. Brown, Frederic T. Chong. 153-166 [doi]

QuCloud: A New Qubit Mapping Mechanism for Multi-programming Quantum Computing in Cloud EnvironmentLei Liu, Xinglei Dou. 167-178 [doi]

Systematic Approaches for Precise and Approximate Quantum State Runtime AssertionJi Liu, Huiyang Zhou. 179-193 [doi]

Faster Schrödinger-style simulation of quantum circuitsAneeqa Fatima, Igor L. Markov. 194-207 [doi]

Mix and Match: A Novel FPGA-Centric Deep Neural Network Quantization FrameworkSung-En Chang, Yanyu Li, Mengshu Sun, Runbin Shi, Hayden K. H. So, Xuehai Qian, Yanzhi Wang, Xue Lin. 208-220 [doi]

Revisiting HyperDimensional Learning for FPGA and Low-Power ArchitecturesMohsen Imani, Zhuowen Zou, Samuel Bosch, Sanjay Anantha Rao, Sahand Salamat, Venkatesh Kumar, Yeseong Kim, Tajana Rosing. 221-234 [doi]

Tensor Casting: Co-Designing Algorithm-Architecture for Personalized Recommendation TrainingYoungeun Kwon, Yunjae Lee, Minsoo Rhu. 235-248 [doi]

GradPIM: A Practical Processing-in-DRAM Architecture for Gradient DescentHeesu Kim, Hanmin Park, Taehyun Kim, Kwanheum Cho, Eojin Lee, Soojung Ryu, Hyuk-Jae Lee, Kiyoung Choi, Jinho Lee. 249-262 [doi]

SynCron: Efficient Synchronization Support for Near-Data-Processing ArchitecturesChristina Giannoula, Nandita Vijaykumar, Nikela Papadopoulou, Vasileios Karakostas, Ivan Fernandez, Juan Gómez-Luna, Lois Orosa 0001, Nectarios Koziris, Georgios I. Goumas, Onur Mutlu. 263-276 [doi]

Zero Directory Eviction Victim: Unbounded Coherence Directory and Core Cache IsolationMainak Chaudhuri. 277-290 [doi]

Designing a Cost-Effective Cache Replacement Policy using Machine LearningSubhash Sethumurugan, Jieming Yin, John Sartori. 291-303 [doi]

WiDir: A Wireless-Enabled Directory Cache Coherence ProtocolAntonio Franques, Apostolos Kokolis, Sergi Abadal, Vimuth Fernando, Sasa Misailovic, Josep Torrellas. 304-317 [doi]

Heat Behind the Meter: A Hidden Threat of Thermal Attacks in Edge Colocation Data CentersZhihui Shao, Mohammad A. Islam 0001, Shaolei Ren. 318-331 [doi]

Trident: A Hybrid Correlation-Collision GPU Cache Timing Attack for AES Key RecoveryJaeguk Ahn, Cheolgyu Jin, Jiho Kim, Minsoo Rhu, Yunsi Fei, David R. Kaeli, John Kim. 332-344 [doi]

BlockHammer: Preventing RowHammer at Low Cost by Blacklisting Rapidly-Accessed DRAM RowsAbdullah Giray Yaglikçi, Minesh Patel, Jeremie S. Kim, Roknoddin Azizi, Ataberk Olgun, Lois Orosa 0001, Hasan Hassan, Jisung Park 0001, Konstantinos Kanellopoulos, Taha Shahroodi, Saugata Ghose, Onur Mutlu. 345-358 [doi]

A Write-Friendly and Fast-Recovery Scheme for Security Metadata in Non-Volatile MemoriesJianming Huang, Yu Hua 0001. 359-370 [doi]

DepGraph: A Dependency-Driven Accelerator for Efficient Iterative Graph ProcessingYu Zhang 0027, Xiaofei Liao, Hai Jin 0001, Ligang He, Bingsheng He, Haikun Liu, Lin Gu 0002. 371-384 [doi]

QEI: Query Acceleration Can be Generic and Efficient in the CloudYifan Yuan, Yipeng Wang 0002, Ren Wang 0001, Rangeen Basu Roy Chowhury, Charlie Tai, Nam Sung Kim. 385-398 [doi]

EXMA: A Genomics Accelerator for Exact-MatchingLei Jiang 0001, Farzaneh Zokaee. 399-411 [doi]

Ultra-Elastic CGRAs for Irregular Loop SpecializationChristopher Torng, Peitian Pan, Yanghui Ou, Cheng Tan, Christopher Batten. 412-425 [doi]

GSSA: A Resource Allocation Scheme Customized for 3D NAND SSDsChun-Yi Liu 0002, Yunju Lee, Wonil Choi, Myoungsoo Jung, Mahmut Taylan Kandemir, Chita R. Das. 426-439 [doi]

Memristive Data RankingAnanth Krishna Prasad, Morteza Rezaalipour, Masoud Dehyadegari, Mahdi Nazm Bojnordi. 440-452 [doi]

DeACT: Architecture-Aware Virtual Memory Support for Fabric Attached Memory SystemsVamsee Reddy Kommareddy, Clayton Hughes, Simon David Hammond, Amro Awad. 453-466 [doi]

Analyzing and Leveraging Decoupled L1 Caches in GPUsMohamed Assem Ibrahim, Onur Kayiran, Yasuko Eckert, Gabriel H. Loh, Adwait Jog. 467-478 [doi]

Deadline-Aware Offloading for High-Throughput AcceleratorsTsung Tai Yeh, Matthew D. Sinclair, Bradford M. Beckmann, Timothy G. Rogers. 479-492 [doi]

Lazy Batching: An SLA-aware Batching System for Cloud Machine Learning InferenceYujeong Choi, Yunseong Kim, Minsoo Rhu. 493-506 [doi]

Dead Page and Dead Block Predictors: Cleaning TLBs and Caches TogetherChandrashis Mazumdar, Prachatos Mitra, Arkaprava Basu. 507-519 [doi]

ParaDox: Eliminating Voltage Margins via Heterogeneous Fault ToleranceSam Ainsworth, Lionel Zoubritzky, Alan Mycroft, Timothy M. Jones 0001. 520-532 [doi]

CARE: Coordinated Augmentation for Elastic Resilience on DRAM Errors in Data CentersJian Chen, Xiaowei Jiang, Ying Zhang, Liyin Liu, Huifeng Xu, Qiang Liu. 533-544 [doi]

Automatic Microprocessor Performance Bug DetectionErick Carvajal Barboza, Sara Jacob, Mahesh Ketkar, Michael Kishinevsky, Paul Gratz, Jiang Hu. 545-556 [doi]

CAPE: A Content-Addressable Processing EngineHelena Caminal, Kailin Yang, Srivatsa Srinivasa, Akshay Krishna Ramanathan, Khalid Al-Hawaj, Tianshu Wu, Vijaykrishnan Narayanan, Christopher Batten, José F. Martínez. 557-569 [doi]

SpaceA: Sparse Matrix Vector Multiplication on Processing-in-Memory AcceleratorXinfeng Xie, Zheng Liang, Peng Gu, Abanti Basak, Lei Deng 0003, Ling Liang, Xing Hu 0001, Yuan Xie 0001. 570-583 [doi]

Layerweaver: Maximizing Resource Utilization of Neural Processing Units via Layer-Wise SchedulingYoung H. Oh, Seonghak Kim, Yunho Jin, Sam Son, Jonghyun Bae, Jongsung Lee, Yeonhong Park, Dong-Uk Kim, Tae Jun Ham, Jae W. Lee. 584-597 [doi]

Sentinel: Efficient Tensor Migration and Allocation on Heterogeneous Memory Systems for Deep LearningJie Ren 0015, Jiaolin Luo, Kai Wu 0006, Minjia Zhang, Hyeran Jeon, Dong Li 0001. 598-611 [doi]

CSCNN: Algorithm-hardware Co-design for CNN Accelerators using Centrosymmetric FiltersJiajun Li, Ahmed Louri, Avinash Karanth, Razvan Bunescu. 612-625 [doi]

Improving GPU Multi-tenancy with Page Walk StealingB. Pratheek, Neha Jawalkar, Arkaprava Basu. 626-639 [doi]

Stream Floating: Enabling Proactive and Decentralized Cache OptimizationsZhengrong Wang, Jian Weng 0002, Jason Lowe-Power, Jayesh Gaur, Tony Nowatzki. 640-653 [doi]

Prodigy: Improving the Memory Latency of Data-Indirect Irregular Workloads Using Hardware-Software Co-DesignNishil Talati, Kyle May, Armand Behroozi, Yichen Yang 0005, Kuba Kaszyk, Christos Vasiladiotis, Tarunesh Verma, Lu Li, Brandon Nguyen, Jiawen Sun, John Magnus Morton, Agreen Ahmadi, Todd M. Austin, Michael F. P. O'Boyle, Scott A. Mahlke, Trevor N. Mudge, Ronald G. Dreslinski. 654-667 [doi]

P-OPT: Practical Optimal Cache Replacement for Graph AnalyticsVignesh Balaji, Neal Clayton Crago, Aamer Jaleel, Brandon Lucia. 668-681 [doi]

Pitstop: Enabling a Virtual Network Free Network-on-ChipHossein Farrokhbakht, Henry Kao, Kamran Hasan, Paul V. Gratz, Tushar Krishna, Joshua San Miguel, Natalie D. Enright Jerger. 682-695 [doi]

BoomGate: Deadlock Avoidance in Non-Minimal Routing for High-Radix NetworksGyuyoung Kwauk, Seungkwan Kang, Hans Kasan, Hyojun Son, John Kim. 696-708 [doi]

CHOPIN: Scalable Graphics Rendering in Multi-GPU Systems via Parallel Image CompositionXiaowei Ren, Mieszko Lis. 709-722 [doi]

Adapt-NoC: A Flexible Network-on-Chip Design for Heterogeneous Manycore ArchitecturesHao Zheng 0005, Ke Wang 0030, Ahmed Louri. 723-735 [doi]

Hardware-Based Address-Centric Acceleration of Key-Value StoreChencheng Ye, Yuanchao Xu 0001, Xipeng Shen, Xiaofei Liao, Hai Jin 0001, Yan Solihin. 736-748 [doi]

BRIM: Bistable Resistively-Coupled Ising MachineRichard Afoakwa, Yiqiao Zhang, Uday Kumar Reddy Vengalam, Zeljko Ignjatovic, Michael Huang. 749-760 [doi]

An Analog Preconditioner for Solving Linear SystemsBen Feinberg, Ryan Wong, T. Patrick Xiao, Christopher H. Bennett, Jacob N. Rohan, Erik G. Boman, Matthew J. Marinella, Sapan Agarwal, Engin Ipek. 761-774 [doi]

GCNAX: A Flexible and Energy-efficient Accelerator for Graph Convolutional Neural NetworksJiajun Li, Ahmed Louri, Avinash Karanth, Razvan Bunescu. 775-788 [doi]

Ascend: a Scalable and Unified Architecture for Ubiquitous Deep Neural Network Computing : Industry Track PaperHeng Liao, Jiajin Tu, Jing Xia, Hu Liu, Xiping Zhou, Honghui Yuan, Yuxing Hu. 789-801 [doi]

Understanding Training Efficiency of Deep Learning Recommendation Models at ScaleBilge Acun, Matthew Murphy, Xiaodong Wang, Jade Nie, Carole-Jean Wu, Kim M. Hazelwood. 802-814 [doi]

LIBRA: Clearing the Cloud Through Dynamic Memory Bandwidth ManagementYing Zhang, Jian Chen, Xiaowei Jiang, Qiang Liu, Ian M. Steiner, Andrew J. Herdrich, Kevin Shu, Ripan Das, Long Cui, Litrin Jiang. 815-826 [doi]

Eudoxus: Characterizing and Accelerating Localization in Autonomous Machines Industry Track PaperYiming Gan, Yu Bo, Boyuan Tian, Leimeng Xu, Wei Hu, Shaoshan Liu, Qiang Liu, Yanjun Zhang, Jie Tang 0003, Yuhao Zhu 0001. 827-840 [doi]

NeuroMeter: An Integrated Power, Area, and Timing Modeling Framework for Machine Learning Accelerators Industry Track PaperTianqi Tang, Sheng Li 0007, Lifeng Nai, Norman P. Jouppi, Yuan Xie. 841-853 [doi]

Chasing Carbon: The Elusive Environmental Footprint of ComputingUdit Gupta, Young-geun Kim, Sylvia Lee, Jordan Tse, Hsien-Hsin S. Lee, Gu-Yeon Wei, David Brooks 0001, Carole-Jean Wu. 854-867 [doi]

Need for Speed: Experiences Building a Trustworthy System-Level GPU SimulatorOreste Villa, Daniel Lustig, Zi Yan, Evgeny Bolotin, Yaosheng Fu, Niladrish Chatterjee, Nan Jiang, David W. Nellans. 868-880 [doi]

Operating Liquid-Cooled Large-Scale Systems: Long-Term Monitoring, Reliability Analysis, and Efficiency MeasuresRohan Basu Roy, Tirthak Patel, Raj Kettimuthu, William E. Allcock, Paul Rich, Adam Scovel, Devesh Tiwari. 881-893 [doi]

FuseKNA: Fused Kernel Convolution based Accelerator for Deep Neural NetworksJianxun Yang, Zhao Zhang, Zhuangzhi Liu, Jing Zhou, Leibo Liu, Shaojun Wei, Shouyi Yin. 894-907 [doi]

FAFNIR: Accelerating Sparse Gathering by Using Efficient Near-Memory Intelligent ReductionBahar Asgari, Ramyad Hadidi, Jiashen Cao, Da Eun Shim, Sung Kyu Lim, Hyesoon Kim. 908-920 [doi]

VIA: A Smart Scratchpad for Vector Units with Application to Sparse Matrix ComputationsJulian Pavon, Iván Vargas Valdivieso, Adrián Barredo, Joan Marimon, Miquel Moretó, Francesc Moll, Osman S. Unsal, Mateo Valero, Adrián Cristal. 921-934 [doi]

runs on WebDSL