大数据人|大数据第一社区

 找回密码
 注册会员

扫一扫,访问微社区

斯坦福大学深度学习与自然语言处理第四讲:词窗口分类和神经网络

2015-9-14 10:17| 发布者: admin| 查看: 10076| 评论: 0|来自: 我爱自然语言处理

摘要: 斯坦福大学在三月份开设了一门“深度学习与自然语言处理”的课程:CS224d: Deep Learning for Natural Language Processing,授课老师是青年才俊Richard Socher,以下为相关的课程笔记。第四讲:词窗口分类和神经网 ...
一个神经元本质上是一个二元逻辑回归单元


一个神经元本质上是一个二元逻辑回归单元

    屏幕快照 2015-09-14 上午10.35.53

一个神经网络等价于同时运行了很多逻辑回归单元

  • 如果我们给一批逻辑回归函数一堆输入向量,我们就得到了一批输出向量…
  • 屏幕快照 2015-09-14 上午10.51.23

  • 这些输出又可以作为其他逻辑回归函数的输入
  • 屏幕快照 2015-09-14 上午10.55.49

  • 然后我们就有了多层神经网络
  • 屏幕快照 2015-09-14 上午10.56.32

神经网络中单层的矩阵符号表示

  • 我们有:
  • 屏幕快照 2015-09-14 上午11.05.22

  • 表示成矩阵符号形式:
  • 屏幕快照 2015-09-14 上午11.06.49

  • 其中f应用的是element-wise规则:
  • 屏幕快照 2015-09-14 上午11.07.18 1
    屏幕快照 2015-09-14 上午11.09.55

为什么需要非线性的f

  • 例子:函数逼近,例如回归或者分类问题
  • 屏幕快照 2015-09-14 上午11.16.08

  • 没有非线性函数,深度神经网络相对于线性变换价值不大
  • 其他的层次会被编译压缩为单个的线性变换: W1W2X=WX
  • 有了更多的层次,它们可以逼近更复杂的函数
  • 屏幕快照 2015-09-14 上午11.20.07

一个更牛的窗口分类器

  • 基于神经网络进行修正
  • 屏幕快照 2015-09-14 上午11.22.45

  • 单个(神经网络)层是一个线性层(函数)和非线性函数的组合
  • 屏幕快照 2015-09-14 上午11.25.06

  • 神经网络激活函数α可以用来计算一些函数
  • 例如,一个softmax概率分布或者一个没有归一化的打分函数可以是这样的:
  • 屏幕快照 2015-09-14 上午11.27.32

总结:前馈网络计算

  • 通过一个三层神经网络计算这个窗口向量的得分:s = score(museums in Paris are amazing)
  • 屏幕快照 2015-09-14 上午11.29.05

下一讲

  • 训练一个基于窗口(向量)的神经网络模型
  • 进行更复杂的深度推导–>反向传播算法
  • 这样我们就有了所有的基础工具去学习一个更复杂的深度模型:)

注:原创文章,转载请注明出处及保留链接“我爱自然语言处理”:http://www.52nlp.cn

12345

鲜花

握手

雷人

路过

鸡蛋

最新评论

关闭

站长推荐上一条 /2 下一条


id="mn_portal" >首页Portalid="mn_P18" onmouseover="navShow('P18')">应用id="mn_P15" onmouseover="navShow('P15')">技术id="mn_P37" onmouseover="showMenu({'ctrlid':this.id,'ctrlclass':'hover','duration':2})">前沿id="mn_P36" onmouseover="navShow('P36')">宝箱id="mn_P61" onmouseover="showMenu({'ctrlid':this.id,'ctrlclass':'hover','duration':2})">专栏id="mn_P65" >企业id="mn_Nd633" >导航 折叠导航 关注微信 关注微博 关注我们

QQ|广告服务|关于我们|Archiver|手机版|小黑屋|大数据人 ( 鄂ICP备14012176号-2  

GMT+8, 2024-4-29 15:24 , Processed in 0.197230 second(s), 21 queries .

Powered by 小雄! X3.2

© 2014-2020 bigdataer Inc.

返回顶部