Skip to content

【PaddlePaddle Hackathon】75、在飞桨可视化分析工具VisualDL中新增Profiler功能,实现训练过程中实时跟踪模型的性能情况 #1008

@TCChenlong

Description

@TCChenlong

(此 ISSUE 为 PaddlePaddle Hackathon 活动的任务 ISSUE,更多详见PaddlePaddle Hackathon

【任务说明】

  • 任务标题:在飞桨可视化分析工具VisualDL中新增Profiler功能,展示训练过程中模型的性能情况

  • 技术标签:深度学习框架,C++,可视化

  • 任务难度:困难

  • 详细描述:

  • 查看模型在主机 (CPU)、设备 (GPU) 或主机与设备组合上的性能

  • 分析模型中各种运算的硬件资源消耗(时间和内存),并提供性能瓶颈解决建议

展现的内容包括但不限于:

  • 性能摘要:显示训练步数所需时间与设备计算时间机器百分比,包括变异、输入、输出、内核启动、主机计算时间、设备通信时间、设备上的计算时间
  • 运行环境:显示模型运行环境的高级摘要,包括使用的主机数量,设备类型(GPU/CPU),设备核心数
  • 步骤时间图:显示训练步数下设备说话时间的图表(用颜色标明不同类别所花费的时间)
  • 建议:针对性能瓶颈优化的具体建议
  • TOP 10的训练:显示运行时间最长的TOP10的训练进行详细展示:算子自身计算时间及其所占百分比、累计总时间、类别及名称

可以发送邮件至 [email protected] 获取详细说明。

【提交内容】

  • 任务提案

  • 任务 PR至 VisualDL

  • 相关技术文档

【技术要求】

  • 熟练掌握Paddle框架

  • 熟练掌握Python

Metadata

Metadata

Assignees

No one assigned

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions