程序博客网 > s7edge怎么关闭4g网络

Deep Learning for Nature Language Processing --- 第八讲

来源：互联网发布：s7edge怎么关闭4g网络编辑：程序博客网时间：2024/06/02 14:05

Current statistical machine translation systems

源语言：法语

目标语言：英语

概率公式（利用贝叶斯定理）：

这里写图片描述

在平行语料库（parallel corpora）上训练翻译模型p(f|e)

在英语语料库上训练语言模型p(e)

这里写图片描述

Step1: Alignment

目标：将源语言中的单词或者短语匹配到正确的目标语言中的单词或者短语

这里写图片描述

假如匹配好了单词和短语，那么又如何给这些单词和短语重新排序呢?

这里写图片描述

After many steps

每个源语言中的单词或者短语，在目标语言中都有不止一个相匹配的单词或者短语：

这里写图片描述

Decode: Search for best of many hypotheses

这里写图片描述

TradiBonal MT（Machine Translation）

直接跳过非常多的细节部分

需要非常多的人工处理特征信息

非常复杂的系统

Deep learning to the rescue! … ?

也许我们能直接使用RNN做机器翻译

这里写图片描述

MT with RNNs – Simplest Model

这里写图片描述

最小化基于源语言，对应的目标语言中的词的交叉熵：

这里写图片描述

然而并没有这么的简单:）

RNN Translation Model Extensions

1）decoding和encoding部分，训练得到的RNN的Weeights是不一样的：

这里写图片描述

2）在解码时，根据下面的三项计算当前的hidden层：

1.之前的hidden层

2.上一个编码器的hidden层：c=h_T

3.之前预测得到的词y_t-1

这里写图片描述

对上一幅图更详细的描述

这里写图片描述

3）训练多层 stacked/deep RNNs

4）也可训练双向RNN

这里写图片描述

5）将输入序列反向后训练，以使得优化更加简单，如：A B C-》X Y换成C B A-》X Y

6）Main Improvement: Better Units。在循环的时候使用更加复杂的hidden units，如Gated Recurrent Units(GRU)

GRUs

标准的RNN直接计算下一个time step的hidden layer：

这里写图片描述

而在GRU中，则是先计算一个update gate，update gate是由当前的输入向量以及上一个hidden 层决定：

这里写图片描述

再用不同的Weights计算reset gate

这里写图片描述

由update gate和reset gate的公式可以得到新的记忆内容，如果reset gate接近于0，则忽略之前的记忆单元（隐层单元），只取当前time step的词向量：

这里写图片描述

最终的time step的记忆单元（隐层单元）公式：

这里写图片描述

下面这张图有利于你理解GRU：

这里写图片描述

GRU intuition

如果reset gate接近于0，则忽略之前hidden层的h。这样做的好处是可以丢弃和后面训练过程无关的信息。

update gate z的作用则是控制之前的部分对当前time step计算结果的影响程度（大小）。如果z接近于1，我们就可以将信息直接copy过来，这样的话有利于避免vanishing gradient。

短期依赖（short term dependences）的reset gate很活跃

长期依赖（long term dependendces）的update gate很活跃

参考图：

这里写图片描述

x1*x2对x1的导数如何求？同样使用的是链式法则，不同的是这里是通过模块化（modularization）和自定区划（automatic differentiation）实现的

Long-‐short-‐term-‐memories(LSTMs)

我们可以使传统RNN中的单个Unit（time step）更加复杂

可以在每个time step中添加下图中的几项：

这里写图片描述

最终的记忆单元：

这里写图片描述

最终得到的hidden层的计算公式：

这里写图片描述

LSTM详解图：

这里写图片描述

LSTMs are currently very hip!

LSTM是大多数序列标记任务的默认模型

非常的管用，特别是在使模型deeper之后（即每一个hidden层都是由一个内部的深度网络计算得到）

数据越多越管用

但是Deep LSTM和一些传统的MT方法的测试结果相差不大：

这里写图片描述

Further Improvements: More Gates!

这里写图片描述

1 0

s7edge怎么关闭4g网络

s7edge怎么关闭4g网络

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子法斗不喜欢溜怎么办法斗不爱干净怎么办宝宝剪头发哭怎么办小孩剪头发哭怎么办法斗得了螨虫怎么办狗狗舌苔发白怎么办微信标图不见了怎么办 qq表情显示问号怎么办孩子眼睛有点斜眼怎么办大人眼睛外斜怎么办狗背拱起来怎么办小孩胃囗不好怎么办婴儿胃囗不好怎么办睡懵了应该怎么办下午睡懵了怎么办睡醒后不清醒怎么办眼睛有表情纹怎么办白半袖变黄怎么办孩子受到惊吓后怎么办图片的字不清楚怎么办小孩总爱皱眉头怎么办 qq表情包上限怎么办鼠标变成双箭头怎么办做表情照片过大怎么办手机界面锁定了怎么办近视眼想戴墨镜怎么办社保本子丢了怎么办医保本子丢了怎么办小孩子发烧抽搐翻白眼怎么办猫咪太凶了怎么办小猫喜欢钻被窝怎么办玩第五人格卡怎么办上眼皮往下掉怎么办着凉引起的发烧怎么办七岁儿童智力低怎么办鼻炎两翼突变形怎么办父母被车撞了该怎么办孩子不愿意承认错误怎么办人在漩涡里怎么办白色衣服有墨水怎么办墨水滴衣裳上怎么办