MindStudio模型训练场景精度比对全流程和结果分析( 三 )


在出现的信息配置框输入相关配置信息 , 如下图所示:

MindStudio模型训练场景精度比对全流程和结果分析

文章插图
输入服务器的SSH信息,如果测试连接失败,建议使用CMD或XShell等工具进行排查 。
选择远程 CANN 安装位置 , 如下图所示:
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
在Remote CANN location中选择CANN的路径,需要注意的是必须选择到CANN的版本号目录 , 这里选择的是5.1.RC2版本,如下图所示:
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
点击确定后,需要等待MindStudio进行文件同步操作 , 这个过程会持续数分钟,期间如果遇到Sync remote CANN files error.错误,考虑是否无服务器root权限 。
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
配置完成CANN点击下一步
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
在训练工程选择界面,选择“TensorFlow Project” , 单击“Finish” 。
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
进入工程界面,单击工具栏中
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
按钮( TensorFlow GPU2Ascend工具) 。
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
进入“TensorFlow GPU2Ascend”参数配置页,配置command file
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
  • Command File:tfplugin插件包中的工具脚本文件 。
  • Input Path:待转换脚本文件的路径 。
  • Output Path:脚本转换后的输出路径 。
根据tfplugin文件所在路径选择/Ascend/tfplugin/5.1.RC2/python/site-packages/npu_bridge/convert_tf2npu/main.py,如下图所示
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
同样的 , 选择下载的代码路径作为input path,并选择输出路径,如下图所示:
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
点击Transplant进行转换,如下图所示:
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
出现“Transplant success!”的回显信息,即转换成功 。如下图所示:
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
4.2 生成dump数据和计算图文件步骤一 dump前准备 。
编辑resnet_run_loop.py文件,修改如下(以下行数仅为示例,请以实际为准):
注释掉第83、85行
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
把max_steps设置为1 。
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
注释掉第575~582行
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
注释掉第595行,修改为“return None” 。
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
编辑cifar10_main.py文件,将train_epochs的值改为1 。
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
步骤二 dump参数配置 。
为了让训练脚本能够dump出计算图,我们在训练脚本中的包引用区域引入os,并在构建模型前设置DUMP_GE_GRAPH参数 。配置完成后,在训练过程中,计算图文件会保存在训练脚本所在目录中 。
编辑cifar10_main.py,添加如下方框中的信息 。
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
修改训练脚本(resnet_run_loop.py),开启dump功能 。在相应代码中,增加如下方框中的信息 。
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
步骤三 环境配置 。
单击MindStudio菜单栏“Run > Edit Configurations...” 。
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
进入运行配置界面,选择迁移后的训练脚本 。
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
MindStudio模型训练场景精度比对全流程和结果分析

文章插图
配置环境变量,打开下图所示界面 , 配置训练进程启动依赖的环境变量,参数设置完成后,单击“OK” , 环境变量配置说明请参见下表 。

推荐阅读