Proceedings of the 2024 USENIX Annual Technical Conference, USENIX ATC 2024, Santa Clara, CA, USA, July 10-12, 2024 - researchr publication

researchr

You are not signed in
Sign in
Sign up

Saurabh Bagchi, Yiying Zhang 0005, editors, Proceedings of the 2024 USENIX Annual Technical Conference, USENIX ATC 2024, Santa Clara, CA, USA, July 10-12, 2024. USENIX Association, 2024. [doi]

Conference: usenix2024

Abstract is missing.

Harmonizing Efficiency and Practicability: Optimizing Resource Utilization in Serverless Computing with JiaguQingyuan Liu, Yanning Yang, Dong Du 0003, Yubin Xia, Ping Zhang, Jia Feng, James R. Larus, Haibo Chen 0001. 1-17 [doi]

ALPS: An Adaptive Learning, Priority OS Scheduler for Serverless FunctionsYuqi Fu, Ruizhe Shi, Haoliang Wang, Songqing Chen, Yue Cheng 0001. 19-36 [doi]

Starburst: A Cost-aware Scheduler for Hybrid CloudMichael Luo, Siyuan Zhuang, Suryaprakash Vengadesan, Romil Bhardwaj, Justin Chang, Eric J. Friedman, Scott Shenker, Ion Stoica. 37-57 [doi]

StreamBox: A Lightweight GPU SandBox for Serverless Inference WorkflowHao Wu 0010, Yue Yu, Junxiao Deng, Shadi Ibrahim, Song Wu 0001, Hao Fan, Ziyue Cheng, Hai Jin 0001. 59-73 [doi]

Power-aware Deep Learning Model Serving with μ-ServeHaoran Qiu, Weichao Mao, Archit Patke, Shengkun Cui, Saurabh Jha, Chen Wang 0039, Hubertus Franke, Zbigniew Kalbarczyk, Tamer Basar, Ravishankar K. Iyer. 75-93 [doi]

Fast Inference for Probabilistic Graphical ModelsJiantong Jiang, Zeyi Wen, Atif Bin Mansoor, Ajmal Mian. 95-110 [doi]

Cost-Efficient Large Language Model Serving for Multi-turn Conversations with CachedAttentionBin Gao, Zhuomin He, Puru Sharma, Qingxuan Kang, Djordje Jevdjic, Junbo Deng, Xingkun Yang, Zhou Yu, Pengfei Zuo. 111-126 [doi]

PUZZLE: Efficiently Aligning Large Language Models through Light-Weight Context SwitchKinman Lei, Yuyang Jin, Mingshu Zhai, Kezhao Huang, Haoxing Ye, Jidong Zhai. 127-140 [doi]

ScalaAFA: Constructing User-Space All-Flash Array Engine with Holistic DesignsShushu Yi, Xiurui Pan, Qiao Li, Qiang Li, Chenxi Wang, Bo Mao, Myoungsoo Jung, Jie Zhang 0048. 141-156 [doi]

FastCommit: resource-efficient, performant and cost-effective file system journalingHarshad Shirwadkar, Saurabh Kadekodi, Theodore Y. Ts'o. 157-171 [doi]

ZMS: Zone Abstraction for Mobile Flash StorageJoo Young Hwang, Seokhwan Kim, Daejun Park 0002, Yong-Gil Song, Junyoung Han, Seunghyun Choi, Sangyeun Cho, Youjip Won. 173-189 [doi]

Ethane: An Asymmetric File System for Disaggregated Persistent MemoryMiao Cai, Junru Shen, Baoliu Ye. 191-207 [doi]

PeRF: Preemption-enabled RDMA FrameworkSugi Lee, MinGyu Choi, Ikjun Yeom, Younghoon Kim. 209-225 [doi]

CyberStar: Simple, Elastic and Cost-Effective Network Functions Management in Cloud Network at ScaleTingting Xu, Bengbeng Xue, Yang Song, Xiaomin Wu, Xiaoxin Peng, Yilong Lyu, Xiaoliang Wang 0001, Chen Tian 0001, Baoliu Ye, Cam-Tu Nguyen, Biao Lyu, Rong Wen, Zhigang Zong, Shunmin Zhu. 227-246 [doi]

OSMOSIS: Enabling Multi-Tenancy in Datacenter SmartNICsMikhail Khalilov, Marcin Chrapek, Siyuan Shen, Alessandro Vezzu, Thomas Benz, Salvatore Di Girolamo, Timo Schneider, Daniele De Sensi, Luca Benini, Torsten Hoefler. 247-263 [doi]

ETC: An Elastic Transmission Control Using End-to-End Available Bandwidth PerceptionFeixue Han, Qing Li 0006, Peng Zhang, Gareth Tyson, Yong Jiang 0001, Mingwei Xu, Yulong Lan, Zhicheng Li. 265-284 [doi]

More is Different: Prototyping and Analyzing a New Form of Edge Server with Massive Mobile SoCsLi Zhang, Zhe Fu, Boqing Shi, Xiang Li, Rujin Lai, Chenyang Yang 0004, Ao Zhou 0001, Xiao Ma 0009, Shangguang Wang, Mengwei Xu. 285-302 [doi]

HiP4-UPF: Towards High-Performance Comprehensive 5G User Plane Function on P4 Programmable SwitchesZhixin Wen, Guanhua Yan. 303-320 [doi]

KEPC-Push: A Knowledge-Enhanced Proactive Content Push Strategy for Edge-Assisted Video Feed StreamingZiwen Ye, Qing Li 0006, Chunyu Qiao, Xiaoteng Ma, Yong Jiang 0001, Qian Ma, Shengbin Meng, Zhenhui Yuan, Zili Meng. 321-338 [doi]

High-density Mobile Cloud Gaming on Edge SoC ClustersLi Zhang, Shangguang Wang, Mengwei Xu. 339-347 [doi]

Limitations and Opportunities of Modern Hardware Isolation MechanismsXiangdong Chen, Zhaofeng Li 0004, Tirth Jain, Vikram Narayanan, Anton Burtsev. 349-368 [doi]

FetchBPF: Customizable Prefetching Policies in Linux with eBPFXuechun Cao, Shaurya Patel, Soo-Yee Lim, Xueyuan Han, Thomas Pasquier. 369-378 [doi]

Fast (Trapless) Kernel Probes EverywhereJinghao Jia, Michael V. Le, Salman Ahmed 0001, Dan Williams 0001, Hani Jamjoom, Tianyin Xu. 379-386 [doi]

HydraRPC: RPC in the CXL EraTeng Ma, Zheng Liu, Chengkun Wei, Jialiang Huang, Youwei Zhuo, Haoyu Li, Ning Zhang, Yijin Guan, Dimin Niu, Mingxing Zhang, Tao Ma. 387-395 [doi]

ExtMem: Enabling Application-Aware Virtual Memory Management for Data-Intensive ApplicationsSepehr Jalalian, Shaurya Patel, Milad Rezaei Hajidehi, Margo I. Seltzer, Alexandra Fedorova. 397-408 [doi]

Telescope: Telemetry for Gargantuan Memory Footprint ApplicationsAlan Nair, Sandeep Kumar, Aravinda Prasad, Ying Huang, Andy Rudoff, Sreenivas Subramoney. 409-424 [doi]

An Empirical Study of Rust-for-Linux: The Success, Dissatisfaction, and CompromiseHongYu Li, Liwei Guo, Yexuan Yang, Shangguang Wang, Mengwei Xu. 425-443 [doi]

Scalable and Effective Page-table and TLB management on NUMA SystemsBin Gao, Qingxuan Kang, Hao-Wei Tee, Kyle Timothy Ng Chu, Alireza Sanaee, Djordje Jevdjic. 445-461 [doi]

UniMem: Redesigning Disaggregated Memory within A Unified Local-Remote Memory HierarchyYijie Zhong, Minqiang Zhou, Zhirong Shen, Jiwu Shu. 463-477 [doi]

WingFuzz: Implementing Continuous Fuzzing for DBMSsJie Liang 0006, Zhiyong Wu, Jingzhou Fu, Yiyuan Bai, Qiang Zhang, Yu Jiang 0001. 479-492 [doi]

Balancing Analysis Time and Bug Detection: Daily Development-friendly Bug Detection in LinuxKeita Suzuki, Kenta Ishiguro, Kenji Kono. 493-508 [doi]

Kivi: Verification for Cluster ManagementBingzhe Liu, Gangmuk Lim, Ryan Beckett, Philip Brighten Godfrey. 509-527 [doi]

Monarch: A Fuzzing Framework for Distributed File SystemsTao Lyu 0004, Liyi Zhang, Zhiyao Feng, Yueyang Pan, Yujie Ren, Meng Xu 0001, Mathias Payer, Sanidhya Kashyap. 529-543 [doi]

Accelerating the Training of Large Language Models using Efficient Activation Rematerialization and Optimal Hybrid ParallelismTailing Yuan, Yuliang Liu, Xucheng Ye, Shenglong Zhang, Jianchao Tan, Bin Chen, Chengru Song, Di Zhang. 545-561 [doi]

Metis: Fast Automatic Distributed Training on Heterogeneous GPUsTaegeon Um, Byungsoo Oh, Minyoung Kang, Woo-Yeon Lee, Goeun Kim, Dongseob Kim, Youngtaek Kim, Mohd Muzzammil, Myeongjae Jeon. 563-578 [doi]

FwdLLM: Efficient Federated Finetuning of Large Language Models with Perturbed InferencesMengwei Xu, Dongqi Cai, Yaozong Wu, Xiang Li, Shangguang Wang. 579-596 [doi]

A Secure, Fast, and Resource-Efficient Serverless Platform with Function REWINDJaehyun Song, Bumsuk Kim, Minwoo Kwak, Byoungyoung Lee, Euiseong Seo, Jinkyu Jeong. 597-613 [doi]

SimEnc: A High-Performance Similarity-Preserving Encryption Approach for Deduplication of Encrypted Docker ImagesTong Sun, Bowen Jiang, Borui Li 0001, Jiamei Lv, Yi Gao 0001, Wei Dong 0001. 615-630 [doi]

mmTLS: Scaling the Performance of Encrypted Network Traffic InspectionJunghan Yoon, Seunghyun Do, Duckwoo Kim, Taejoong Chung, KyoungSoo Park. 631-647 [doi]

Pecan: Cost-Efficient ML Data Preprocessing with Automatic Transformation Ordering and Hybrid PlacementDan Graur, Oto Mraz, Muyu Li, Mohammad Sepehr Pourghannad, Chandramohan A. Thekkath, Ana Klimovic. 649-665 [doi]

OPER: Optimality-Guided Embedding Table Parallelization for Large-scale Recommendation ModelZheng Wang, Yuke Wang, Boyuan Feng, Guyue Huang, Dheevatsa Mudigere, Bharath Muthiah, Ang Li 0006, Yufei Ding. 667-682 [doi]

MAGPY: Compiling Eager Mode DNN Programs by Monitoring Execution StatesChen Zhang 0001, Rongchao Dong, Haojie Wang, Runxin Zhong, Jike Chen, Jidong Zhai. 683-698 [doi]

Quant-LLM: Accelerating the Serving of Large Language Models via FP6-Centric Algorithm-System Co-Design on Modern GPUsHaojun Xia, Zhen Zheng, Xiaoxia Wu, Shiyang Chen, Zhewei Yao, Stephen Youn, Arash Bakhtiari, Michael Wyatt, Donglin Zhuang, Zhongzhu Zhou, Olatunji Ruwase, Yuxiong He, Shuaiwen Leon Song. 699-713 [doi]

QDSR: Accelerating Layer-7 Load Balancing by Direct Server Return with QUICZiqi Wei, Zhiqiang Wang, Qing Li 0006, Yuan Yang 0001, Cheng Luo, Fuyu Wang, Yong Jiang 0001, Sijie Yang, Zhenhui Yuan. 715-730 [doi]

Evaluating Chiplet-based Large-Scale Interconnection Networks via Cycle-Accurate Packet-Parallel SimulationYinxiao Feng, Yuchen Wei, Dong Xiang, Kaisheng Ma. 731-747 [doi]

Config-Snob: Tuning for the Best Configurations of Networking Protocol StackManaf Bin-Yahya, Yifei Zhao, Hossein Shafieirad, Anthony Ho, Shijun Yin, Fanzhao Wang, Geng Li. 749-765 [doi]

Conspirator: SmartNIC-Aided Control Plane for Distributed ML WorkloadsYunming Xiao, Diman Zad Tootaghaj, Aditya Dhakal, Lianjie Cao, Puneet Sharma, Aleksandar Kuzmanovic. 767-784 [doi]

FBMM: Making Memory Management Extensible With FilesystemsBijan Tabatabai, James Christopher Sorenson III, Michael M. Swift. 785-798 [doi]

Mangosteen: Fast Transparent Durability for Linearizable Applications using NVMSergey Egorov, Gregory V. Chockler, Brijesh Dongol, Dan O'Keeffe, Sadegh Keshavarzi. 799-815 [doi]

FlexMem: Adaptive Page Profiling and Migration for Tiered MemoryDong Xu, Junhee Ryu, Kwangsik Shin, Pengfei Su, Dong Li 0001. 817-833 [doi]

SuperBench: Improving Cloud AI Infrastructure Reliability with Proactive ValidationYifan Xiong 0001, Yuting Jiang, Ziyue Yang, Lei Qu, Guoshuai Zhao, Shuguang Liu, Dong Zhong, Boris Pinzur, Jie Zhang, Yang Wang 0053, Jithin Jose, Hossein Pourreza, Jeff Baxter, Kushal Datta, Prabhat Ram, Luke Melton, Joe Chau, Peng Cheng 0005, Yongqiang Xiong, Lidong Zhou. 835-850 [doi]

Removing Obstacles before Breaking Through the Memory Wall: A Close Look at HBM Errors in the FieldRonglong Wu, Shuyue Zhou, Jiahao Lu, Zhirong Shen, Zikang Xu, Jiwu Shu, Kunlin Yang, Feilong Lin, Yiming Zhang. 851-867 [doi]

MSFRD: Mutation Similarity based SSD Failure Rating and Diagnosis for Complex and Volatile Production EnvironmentsYuqi Zhang, Tianyi Zhang, Wenwen Hao, Shuyang Wang, Na Liu, Xing He, Yang Zhang, Weixin Wang, Yongguang Cheng, Huan Wang, Jie Xu, Feng Wang, Bo Jiang, Yongwong Gwon, Jongsung Na, Zoe Kim, Geunrok Oh. 869-884 [doi]

Diagnosing Application-network Anomalies for Millions of IPs in Production CloudsZhe Wang 0015, Huanwu Hu, Linghe Kong, Xinlei Kang, Qiao Xiang, Jingxuan Li, Yang Lu, Zhuo Song, Peihao Yang, Jiejian Wu, Yong Yang, Tao Ma, Zheng Liu, Xianlong Zeng, Dennis Cai, Guihai Chen. 885-899 [doi]

Data Caching for Enterprise-Grade Petabyte-Scale OLAPChunxu Tang, Bin Fan, Jing Zhao, Chen Liang, Yi Wang, Beinan Wang, Ziyue Qiu, Lu Qiu, Bowen Ding, Shouzhuo Sun, Saiguang Che, Jiaming Mai, Shouwei Chen, Yu Zhu, Jianjian Xie, Yutian Sun, Yao Li, Yangjun Zhang, Ke Wang, Mingmin Chen. 901-915 [doi]

Full Lifecycle Data Analysis on a Large-scale and Leadership Supercomputer: What Can We Learn from It?Bin Yang, Hao Wei, Wenhao Zhu, Yuhao Zhang, Weiguo Liu, Wei Xue. 917-933 [doi]

Panorama: Optimizing Internet-scale Users' Routes from End to EndGeng Li, Shuihai Hu, Kun Tan. 935-949 [doi]

Enhancing Resource Management of the World's Largest PCDN System for On-Demand Video StreamingRuixiao Zhang, Haiping Wang 0002, Shu Shi, Xiaofei Pang, Yajie Peng, Zhichen Xue, Jiangchuan Liu. 951-965 [doi]

TileClipper: Lightweight Selection of Regions of Interest from Videos for Traffic SurveillanceShubham Chaudhary 0006, Aryan Taneja, Anjali Singh, Purbasha Roy, Sohum Sikdar, Mukulika Maity, Arani Bhattacharya. 967-984 [doi]

Expeditious High-Concurrency MicroVM SnapStart in Persistent Memory with an Augmented HypervisorXingguo Pang, Yanze Zhang, Liu Liu, Dazhao Cheng, Chengzhong Xu 0001, Xiaobo Zhou 0002. 985-998 [doi]

Taming Hot Bloat Under Virtualization with HUGESCOPEChuandong Li 0004, Sai Sha, Yangqing Zeng, Xiran Yang, Yingwei Luo, Xiaolin Wang 0001, Zhenlin Wang, Diyu Zhou. 999-1012 [doi]

CrossMapping: Harmonizing Memory Consistency in Cross-ISA Binary TranslationChen Gao, Xiangwei Meng, Wei Li, Jinhui Lai, Yiran Zhang, Fengyuan Ren. 1013-1028 [doi]

Efficient Decentralized Federated Singular Vector DecompositionDi Chai, Junxue Zhang 0001, Liu Yang 0008, Yilun Jin, Leye Wang, Kai Chen 0005, Qiang Yang 0001. 1029-1047 [doi]

Models on the Move: Towards Feasible Embedded AI for Intrusion Detection on Vehicular CAN BusHe Xu, Di Wu 0002, Yufeng Lu, Jiwu Lu, Haibo Zeng 0001. 1049-1063 [doi]

CPC: Flexible, Secure, and Efficient CVM Maintenance with Confidential Procedure CallsJiahao Chen, Zeyu Mi, Yubin Xia, Haibing Guan, Haibo Chen 0001. 1065-1082 [doi]

RL-Watchdog: A Fast and Predictable SSD Liveness Watchdog on Storage SystemsJinyong Ha 0001, Sangjin Lee, Heon Young Yeom, Yongseok Son. 1083-1100 [doi]

Exploit both SMART Attributes and NAND Flash Wear Characteristics to Effectively Forecast SSD-based Storage Failures in ClustersYunfei Gu, Chentao Wu, Xubin He. 1101-1117 [doi]

StreamCache: Revisiting Page Cache for File Scanning on Fast Storage DevicesZhiyue Li, Guangyan Zhang. 1119-1134 [doi]

Scalable Billion-point Approximate Nearest Neighbor Search Using SmartSSDsBing Tian, Haikun Liu, Zhuohui Duan, Xiaofei Liao, Hai Jin 0001, Yu Zhang 0027. 1135-1150 [doi]

gVulkan: Scalable GPU Pooling for Pixel-Grained Rendering in Ray TracingYicheng Gu, Yun Wang, Yunfan Sun, Yuxin Xiang, Xuyan Hu, Zhengwei Qi, Haibing Guan. 1151-1165 [doi]

vFPIO: A Virtual I/O Abstraction for FPGA-accelerated I/O DevicesJiyang Chen, Harshavardhan Unnibhavi, Atsushi Koshiba, Pramod Bhatotia. 1167-1184 [doi]

ScalaCache: Scalable User-Space Page Cache Management with Software-Hardware CoordinationLi Peng, Yuda An, You Zhou, Chenxi Wang, Qiao Li, Chuanning Cheng, Jie Zhang 0048. 1185-1202 [doi]

Centimani: Enabling Fast AI Accelerator Selection for DNN Training with a Novel Performance PredictorZhen Xie, Murali Emani, Xiaodong Yu 0001, Dingwen Tao, Xin He, Pengfei Su 0001, Keren Zhou 0001, Venkatram Vishwanath. 1203-1221 [doi]

A Difference World: High-performance, NVM-invariant, Software-only Intermittent ComputationHarrison Williams, Saim Ahmad, Matthew Hicks. 1223-1238 [doi]

Efficient Large Graph Processing with Chunk-Based Graph Representation ModelRui Wang 0076, Weixu Zong, Shuibing He, Xinyu Chen, Zhenxin Li, Zheng Dang. 1239-1255 [doi]

SlimArchive: A Lightweight Architecture for Ethereum Archive NodesHang Feng, Yufeng Hu, Yinghan Kou, Runhuai Li, Jianfeng Zhu, Lei Wu 0012, Yajin Zhou. 1257-1272 [doi]

Every Mapping Counts in Large Amounts: Folio AccountingDavid Hildenbrand, Martin Schulz 0001, Nadav Amit. 1273-1282 [doi]

runs on WebDSL