• Click to hide sidebar Click to show sidebar
  • MLsys - CMU课程笔记

    CMU Course Notes about MLsys

    Machine Learning System

    Intro

    ML systems stacks:

    StacksExplanation
    Automatic Differentiation自动生成反向传播计算图并计算梯度
    Graph-Level Optimization优化计算图,应用数学变换
    Parallelization/Distributed Training决定如何在分布式异构集群中最大化并行
    Data Layout and Placement如何在内存层级中放置张量,使用何种数据分布
    Kernel Optimizations生成高性能Kernel和不同硬件后端的可执行文件
    Memory Optimizations最小化AI硬件ML运算的内存需求