Quality-Estimation2 (翻译质量评价-在BERT模型后面加上Bi-LSTM进行fine-tuning) - 代码天地

Quality-Estimation2 (翻译质量评价-在BERT模型后面加上Bi-LSTM进行fine-tuning)

编程语言 2019-03-12 16:30:07 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/xiaoleiniu1314/article/details/88423118

简介

翻译质量评价（Quality Estimation,QE）是机器翻译领域中的一个子任务，大致可分为 Sentence-level QE，Word-level QE，Phrase-level QE，详情可参考WMT(workshop machine translation)比赛官网 http://www.statmt.org/wmt17/quality-estimation-task.html 。本项目针对 Sentence-level QE，在BERT模型后面加上Bi-LSTM进行fine-tuning，代码参考了 https://github.com/huggingface/pytorch-pretrained-BERT 。由于 wmt18-qe 的测试集标签没有公布，本项目仅在 wmt17-qe 数据集上进行实验。

实验需要的包

PyTorch 0.4.1/1.0.0;
python3;

实验步骤

代码见github : https://github.com/xlniu/Quality-Estimation2
1、准备数据，下载17年wmt sentence level的数据，将数据放置在 ./examples/QE 文件夹下，数据文件示例见QE文件夹;
2、下载bert预训练模型，放到 ./pretrain-models 文件夹并解压，这里用到的预训练模型是：BERT-Base, Multilingual Cased (New, recommended): 104 languages, 12-layer, 768-hidden, 12-heads, 110M parameters，
可以到这里下载：https://s3.amazonaws.com/models.huggingface.co/bert/bert-base-multilingual-cased.tar.gz ;
3、运行run_qe.sh进行fine-tuning;

实验结果

Data	Pearson’s
test 2017 en-de
state of the art(Single)	0.6837
test 2017 de-en
state of the art(Single)	0.7099

注：state of the art 参考论文：“Bilingual Expert” Can Find Translation Errors ;

猜你喜欢

转载自blog.csdn.net/xiaoleiniu1314/article/details/88423118

Quality-Estimation2 (翻译质量评价-在BERT模型后面加上Bi-LSTM进行fine-tuning)

Quality-Estimation0 (翻译质量评价-使用 BERT 特征训练 QE 模型)

Fine-tuning: 深度解析P-tuning v2在大模型上的应用

YOLOv2如何fine-tuning？

笔记: (Pytorch版)Bert模型-fine-tuning 篇

基于ChatYuan-large-v2 语言模型 Fine-tuning 微调训练广告生成任务

模型微调fine-tuning

使用BERT fine-tuning记录

BERT详解(4)---fine-tuning

论文解读：P-Tuning v2: Prompt Tuning Can BeComparable to Fine-tuning Universally Across Scales and Tasks

文本分类实战（四）—— Bi-LSTM模型文本分类实战（一）—— word2vec预训练词向量

A Closer Look at How Fine-tuning Changes BERT

翻译: 为什么需要微调大模型 Why Fine-tuning LLM

Fine-tuning

什么是fine-tuning？

fine-tuning介绍

Keras:融合不同的模型并使用自己的数据进行fine-tuning及预测（一）

Keras:融合不同的模型并使用自己的数据进行fine-tuning及预测（二）

【Keras】使用预训练的模型进行图像分类fine-tuning

图像质量评价（Image Quality Assessment，IQA）

Analyzing and Improving the Image Quality of StyleGAN （StyleGAN2 ：分析和改善StyleGAN的图像质量）

Caffe官方教程翻译（7）：Fine-tuning for Style Recognition

《Universal Language Model Fine-tuning for Text Classification》翻译

翻译: 迁移学习和微调 Transfer learning & fine-tuning

LLMs 参数高效微调技术2：软提示 Parameter efficient fine-tuning PEFT techniques 2: Soft prompts

Bi-LSTM学习

LLMs对单个任务进行微调Fine-tuning on a single task

ChatGPT进阶：利用Fine-tuning训练自己的模型

LLM Fine-Tuning大模型FT方法

LSTM 双向 Bi-LSTM

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)