(此 ISSUE 为 PaddlePaddle Hackathon 活动的任务 ISSUE,更多详见PaddlePaddle Hackathon)
【任务说明】
-
任务标题:在飞桨可视化分析工具VisualDL中新增Profiler功能,展示训练过程中模型的性能情况
-
技术标签:深度学习框架,C++,可视化
-
任务难度:困难
-
详细描述:
-
查看模型在主机 (CPU)、设备 (GPU) 或主机与设备组合上的性能
-
分析模型中各种运算的硬件资源消耗(时间和内存),并提供性能瓶颈解决建议
展现的内容包括但不限于:
- 性能摘要:显示训练步数所需时间与设备计算时间机器百分比,包括变异、输入、输出、内核启动、主机计算时间、设备通信时间、设备上的计算时间
- 运行环境:显示模型运行环境的高级摘要,包括使用的主机数量,设备类型(GPU/CPU),设备核心数
- 步骤时间图:显示训练步数下设备说话时间的图表(用颜色标明不同类别所花费的时间)
- 建议:针对性能瓶颈优化的具体建议
- TOP 10的训练:显示运行时间最长的TOP10的训练进行详细展示:算子自身计算时间及其所占百分比、累计总时间、类别及名称
可以发送邮件至 [email protected] 获取详细说明。
【提交内容】
【技术要求】