У нас вы можете посмотреть бесплатно ASPLOS'24 - Session 3D - ML Quantization and Memory Optimizations или скачать в максимальном доступном качестве, которое было загружено на ютуб. Для скачивания выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса savevideohd.ru
ASPLOS'24: The International Conference on Architectural Support for Programming Languages and Operating Systems Session 3D: ML Quantization and Memory Optimizations Session Chair: Kiwan Maeng (Pennsylvania State University) Papers Presented: 1. MAGIS: Memory Optimization via Coordinated Graph Transformation and Scheduling for DNN Authors: Renze Chen (Peking University); Zijian Ding (University of California Los Angeles); Size Zheng and Chengrui Zhang (Peking University); Jingwen Leng (Shanghai Jiao Tong University); Xuanzhe Liu and Yun Liang (Peking University) 2. 8-bit Transformer Inference and Fine-tuning for Edge Accelerators Authors: Jeffrey Yu, Kartik Prabhu, Yonatan Urman, Robert M. Radway, Eric Han, and Priyanka Raina (Stanford University) 3. Cocco: Hardware-Mapping Co-Exploration towards Memory Capacity-Communication Optimization Authors: Zhanhong Tan, Zijian Zhu, and Kaisheng Ma (Tsinghua University) 4. Atalanta: A Bit is Worth a “Thousand” Tensor Values Authors: Alberto Delmas Lascorz and Mostafa Mahmoud (University of Toronto); Ali Hadi Zadeh (University of Toronto and 1QBit); Milos Nikolic, Kareem Ibrahim, and Christina Giannoula (University of Toronto); Ameer Abdelhadi (McMaster University); Andreas Moshovos (University of Toronto and Vector Institute)