最近训练总是出问题,听取建议,在pytorch环境下引入了tensorboard
1、安装tensorboardX
tensorboardX是在tensorboard前提下进行安装的,所以我们需要先安装tensorboard
pip install tensorboard
pip install tensorboardX
2、简单使用
这里我们最长久的就是对损失收敛图进行一个使用
2.1 引入对应的模块进行初始化
# 导入可视化模块(ll添加)
from tensorboardX import SummaryWriter
writer = SummaryWriter('./result_tensorboard')
在我们训练的方法里添加可视化曲线图
if i % 10 == 0:
print(
f"Train epoch {epoch}: ["
f"{i * len(d)}/{len(train_dataloader.dataset)}"
f" ({100. * i / len(train_dataloader):.0f}%)]"
f'\tLoss: {out_criterion["loss"].item():.3f} |'
f'\tMSE loss: {255*255*out_criterion["mse_loss"].item():.3f} |'
f'\tBpp loss: {out_criterion["bpp_loss"].item():.2f} |'
f"\tAux loss: {aux_loss.item():.2f}"
)
writer.add_scalar('Loss',out_criterion["loss"].item(),epoch)
writer.add_scalar('MSE loss',255*255*out_criterion["mse_loss"].item(),epoch)
writer.add_scalar('Bpp loss',out_criterion["bpp_loss"].item(),epoch)
writer.add_scalar('Aux loss',aux_loss.item(),epoch)
查看页面指令
tensorboard --logdir=/xxxx/xxx
随着训练的进行可以看到对应的曲线
3、其他使用
另外tensorboardX还可以进行特征可视化,网络模型可视化等,正在探索中…
4、遇到的问题
4.1 tensorboard未找到命令
tensorboard未找到命令
第一次安装的时候按照上面的流程可以进行成功启动,但是后来跑完当前的任务后,发现换一个代码跑就报错了
解决方法
pip install tensorflow
tensorboard是基于tensorflow的,首先我们应该安装tensorflow
ps:关于启动的命令可以自定义port
tensorboard --logdir=/xxx --port 6007