transformers里的BertModel之架构、参数统计、返回值分析 - 代码天地

transformers里的BertModel之架构、参数统计、返回值分析

移动开发 2023-08-08 23:15:48 阅读次数: 0

BertModel的架构：

以bert-base-chinese为例：

model = BertModel.from_pretrained("../model/bert-base-chinese")

统计模型参数：

# 参数量的统计
total_params = 0 # 模型总的参数量
total_learnable_params = 0 # 可学习的参数量
total_embedding_params = 0 # embeddings 层的参数量
total_encoder_params = 0 # Encoder编码器部分的参数量
total_pooler_params = 0

for name , param  in model.named_parameters():
    print(name , "->" , param.shape)
    if param.requires_grad:
        total_learnable_params += param.numel()
    if "embedding" in name :
        total_embedding_params += param.numel()
    if "encoder" in name :
        total_encoder_params += param.numel()
    if "pooler" in name :
        total_pooler_params += param.numel()
        
    total_params += param.numel()

从上面可以看出：

embedding层占比 0.16254008305735163

Encoder编码器部分占比 0.8316849528014959

pooler层占比 0.005774964141152439

总共的参数：102267648

返回值分析：

关于BertModel的文档如下：

BERTWe’re on a journey to advance and democratize artificial intelligence through open source and open science.https://huggingface.co/docs/transformers/main/en/model_doc/bert#transformers.BertModel这里进步详细解释一下：

last_hidden_state 、 pooler_output 必定会返回的，而hidden_state是在model设置output_hidden_states=True 或者config.output_hidden_states=True的时候进行返回的。

这里说明一下：

outputs的长度为3：

# outputs[0] == last_hidden_state : (batch_size, sequence_length, hidden_size)

# outputs[1] == pooler_output : (batch_size, hidden_size)

# outputs[2] == hidden_state : (batch_size, sequence_length, hidden_size)

从上图中可以看出：

model.embeddings(input_tensor) == outputs[2][0]

猜你喜欢

转载自blog.csdn.net/wtl1992/article/details/132048038

transformers里的BertModel之架构、参数统计、返回值分析

transformers里的AutoTokenizer之返回值token_type_ids（二）

Java里的参数类型/返回值类型

Transformers源码阅读——BertModel

参数、返回值、局部变量、数组分析

从底层分析C语言中的参数传递与返回值

参数传递与返回值

函数的返回值与参数

函数参数返回值

函数,返回值,参数

transformers的bert预训练模型的返回值简要描述

C语言入门之函数的参数和返回值

Android之Intent实现携带参数跳转并返回值

组合之接口作为方法的参数或者返回值

Python基础之函数参数与返回值进阶

指针变量之函数参数作返回值A

Python基础——函数基础之参数与返回值

函数之返回值

Jmeter 提取http请求返回值里json数据参数化方法

python的函数返回值‘调用’参数

函数的返回值和参数

高阶函数-参数与返回值

获取请求返回值的参数

学习笔记：函数返回值与参数

形式参数与返回值问题

Controller当中的参数与返回值

（十四）函数参数和返回值

函数参数和返回值（一）

函数的参数和返回值

Python函数参数和返回值

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)