pytorch中Linear类中weight的形状问题源码探讨 - 代码天地

pytorch中Linear类中weight的形状问题源码探讨

其他 2018-11-01 07:27:19 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/dss_dssssd/article/details/83537765

import torch
from torch import nn

m = nn.Linear(20, 30)
input = torch.randn(128, 20)
output = m(input)

print(output.size())
print(m.weight.shape)

来看一下输出：
out:

torch.Size([128, 30])
torch.Size([30, 20])

发现weight的形状是[30,20]而非[20, 30]？

所以具体看一下源码的实现方式：

Linear类的源码网址：https://pytorch.org/docs/stable/_modules/torch/nn/modules/linear.html
functional模块的源码网址：
https://pytorch.org/docs/stable/_modules/torch/nn/functional.html

在Linear类中的__init__函数中，weight形状为[out_features, in_features]
在forward函数中调用F.linear函数，实现单层线性神经网络层的计算
在F.linear函数中，使用的是weight.t()，也就是将weight转置，再传入matmul计算。

通过以上三步，pytorch就完成weight形状的维护。简单的说就是，在定义时使用的是[out_features, in_features]，而在单层线性神经网络计算时使用的是weight的转置矩阵。

猜你喜欢

转载自blog.csdn.net/dss_dssssd/article/details/83537765

pytorch中Linear类中weight的形状问题源码探讨

pytorch中weight-initilzation

pytorch中nn.linear

pytorch中的Linear Layer（线性层）

Java中String类探讨

形状类族的中的纯虚函数

形状类组中的纯虚函数

[转载]Pytorch中nn.Linear module的理解

pytorch中tensor的形状 [n,1] 与 [n] 的区别

《Thinking In Java》中类的访问权限的探讨

Layout中的weight

PyTorch 中遇到的问题

项目管理中问题与对策探讨

机器学习-二分类SVC中的样本不均衡问题：重要参数class_weight

Pytorch 学习（7）：Pytorch中的Non-linear Activations (非线性层)实现

线性布局中weight权重异常问题分析。

opendrive中的几何形状

Pytorch|nn.Linear()维度问题

在实现linear regression中遇到的一些问题

caffe中weight_filler

pytorch中图片显示问题

pytorch中的若干问题

Pytorch学习中遇到的问题

Java学习中对于public类的一点探讨

pytorch中的神经网络子模块(线性模块)——torch.nn.Linear

【chat-gpt问答记录】关于pytorch中的线性层nn.Linear()

Java 中的finally的探讨

趣味探讨：Java中除数为0问题

在Java中substring产生的结果不共享问题探讨

Python中for循环变量作用域问题探讨

今日推荐

周排行

LRU cache算法

windows10, 自带的OpenSSH, key权限问题, 文件权限问题

测试用例书写方法

HIVE-默认分隔符的（linux系统的特殊字符）查看，输入和修改

最贵的AMD 7nm显卡来了！这设计够狂野

java多线程简单demo

[ 转载 ]在Android系统上使用busybox——最简单的方法

QT connect学习

BFSIFT算法分析

Xcode10：library not found for -lstdc++.6.0.9 临时解决

每日归档

更多

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)