一、认识NLP - 代码天地

一、认识NLP

其他 2020-03-25 21:42:46 阅读次数: 0

NLP定义：
(一词多义)
NLP的challenge(挑战)是：语言有多种意思
解决方法：看句子的context(上下文)

机器翻译系统：
传统方法：构建语料库，输入一句话，想看这句话的意思，一个单词一个单词从语料库找意思，用统计分析方法求概率

	传统方法的缺点：

可能出现语料库没有这个单词的情况(out of vocabulary)—(oov)
有一词多义的情况，不好区分意思
输出的语序不一定正确

解决方法：

Mixed Word/Character Model:
把所有的oov分词，拆成字符，比如比如 Jessica，变成J，e，s，s，i，c，a。其中是Begin，Middle，End的标记。这样处理的好处就是消灭了全部的OOV。坏处就是文本序列变得非常长，对于性能敏感的系统，这是难以接受的维度增长
UNK处理
在训练数据充足的情况下，RNN模型可以轻松支持30k-80k的词表。在大多数情况下，扩大词表都是首选的方案
通过上下文分析一词多义的情况
对于输出的语序不对的情况，可以用语言模型进行判定，给定一个句子，判定从语法来看，最正确的概率

统计型机器翻译系统的一般步骤

统计型机器翻译步骤

在这里插入图片描述

对于句法方面的经典论文推荐：

Question Answering in Context Coarse -to- Fine
Question Answering for long Documents QA Workshop
From Word Embedding To Document Distances（计算语义相似度）

归并排序算法——Merge sort
在这里插入图片描述

复杂度等级：
0(1)<0(logn)<0(n)<0(nlogn)<0(n^2)<0(nnlogn)<0(nn*n)<0(n!)

默默努力的人

发布了18 篇原创文章 · 获赞 0 · 访问量 149

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_43979941/article/details/104858052

一、认识NLP

NLP（一）

NLP 笔记（一）：介绍 NLP

小白nlp入门基础（一）--nlp简介

NLP(一)：简介

NLP学习（一）

NLP基础（一）

NLP学习笔记（一）

NLP一些资源

NLP（一）：从规则到统计

NLP学习（一）—基础篇

一. CNLP-NLP-简介

NLP从入门到实战（一）

一些NLP术语

对于JDBC的认识（一）

（一）认识Git与GitHub

认识PE格式一

mockjs（一）——认识mockjs

树莓派的认识（一）

认识Servlet（一）接口

一.HTML语言的认识

python的快速认识（一）

原型的深度认识（一）

认识对象（一）

Git的认识一

认识与设计Serverless（一）

Linux初步认识(一)

指针初认识（一）

（一）认识React

（一）认识RabbitMQ

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)