torch笔记 【1】 torch中的arange、repeat和view

  • 最近已经到了需要改源码的地步了,不得不研究研究YOLO的结构,这就涉及到pytorch的各种api

range和arange

  • 创建1维张量
  • 这里给出一段示例:
z = torch.range(1,10)
print(z,z.shape)

z = torch.arange(1,10)
print(z,z.shape)
  • torch.range(1,10)和 torch.arange(10)都产生了一个1维的数组,类型是 <class ‘torch.Tensor’>
    • 二者不同的是
      • range产生的长度是10-1+1=10 是由1到10组成的1维张量,类型float
      • 而arange产生的是10-1=9 由1-9组成的1维度张量 ,类型int

他们的输出分别是

tensor([ 1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9., 10.]) torch.Size([10]) 
tensor([1, 2, 3, 4, 5, 6, 7, 8, 9]) torch.Size([9])
  • 示例2:
# z = torch.range(10)
# print(z,z.shape)
z = torch.arange(10)
print(z,z.shape)
  • 需要注意的是,range第一个值不能缺省,arange可以,默认0,其输出就是:tensor([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) torch.Size([10])

repeat

  • 复制张量
z = torch.arange(10)
print(z,z.shape)
z = torch.arange(10).repeat(10,1)
print(z,z.shape)
  • 这次我们先给输出:
  • 在这里插入图片描述
  • 可以看到repeat就干了一件事,复制,那么其复制的机制就是:得到[10,10x1]的张量,内容为复制出来的
  • 如果吧repeat参数改为repeat(10,5,2),那么就会懂得到[10,5,2x10]=[10,5,20]的张量,换句话说,repeat的最后一个参数,决定要复制的张量的基本元素,和前n-1个一起决定复制成什么样的矩阵。

View

  • 改变张量形状
  • View的机制顺序地拿数据填充形状,注意,定义的形状所需要的数据的数量必须=能提供的数据数量
    • 比如:[10x10] 的张量可以.view(1,1,10,10) 也可以.view(5,20) 但是不可以.view(10,11) ,一旦数据数量不同,就会报数据无效的错误
  • 代码示例
z = torch.arange(10)
print(z.shape)
z = torch.arange(10).repeat(10,1)
print(z.shape)
z = torch.arange(10).repeat(10,1).view(1,1,10,10)
print(z,z.shape)

在这里插入图片描述

最终效果

  • 我看这部分的目的是想做矩形推理,理论上我只要给z = torch.arange(10).repeat(10,1).view(1,1,10,10)传上正确的且比例不同的参数,那么我就可以得到矩形的tensor,就比如:
image_size=(416,320)
z = torch.arange(image_size[0]).repeat(image_size[1], 1)
print(z.shape)
z = torch.arange(image_size[0]).repeat(image_size[1], 1).view([1, 1, image_size[0], image_size[1]])
print(z.shape)
  • 我就可以得到这俩张量,恰好对应image的形状
torch.Size([320, 416])
torch.Size([1, 1, 416, 320])
  • 那么由此,我在padding的时候就可以不padding成一个416x416的正方形,而是可以是复合一定条件的矩形。理论上是会加速边缘设备的推理速度
发布了120 篇原创文章 · 获赞 153 · 访问量 18万+

猜你喜欢

转载自blog.csdn.net/symuamua/article/details/105170787