【记录】NLP培训教程 学习过程
期间:
- NLP发展现状
- 基于Deep Learning的NLP的最近趋势
- GPU计算性能提升
- 传统NLP方法面临的挑战
- Big Data和Deep Learning给NLP带来的变革和机遇
- NLP的发展趋势,以及各行各业中的应用
- 数据挖掘Data Mining
- 文本挖掘Text Mining
- 文本分析Text Analytics
grouping
图像识别/分类
无监督的机器翻译
基于视频或图片的问答 visual question answering
chatbot
机器学习的一个问题:sparsity稀疏
一些Challenge:
Co-Reference Resolution 指代消解
- StanfordCoreNlp
- FudanNlp
- OpenNlp
- LTP
- 大数据= 大 + 数据
- Volume数量大
- Velocity速度
- 高效efficiency
- 即时realtime
- 动态dynamic
- 预测性predictive
- Variety类别多
普通大众:Big Data
学术界一般叫做:Large-Scale Data
Deep NLP= Deep Learning + NLP
NLP用途之一:垃圾邮件过滤
Representation 表现
Representation==features==code
主要就两个:CNN RNN
其他改进很多
Differentiable Programming 微分编程?
- Caffee
- Pytorch
- TensorFLow
深度网络的目标:学习到feature特征
Discriminative vs Generative Models
尤其是 最近出现的对抗网络:GAN
- Generative
- 联合概率
- 用途:分类
- Discriminative
- 条件概率
- 用途:判别
大部分的都可以用这两种:
- RNN = Recurrent Neural Network
- 机器翻译
- QA问答系统
- 自动生成图像描述
- CNN=Convolutional Neural Network
- 句子/文本分类
- 关系提取和分类
- 垃圾邮件检测
- 查询分类?
- 语义关系提取
VQA=Visual QA=Visual question answering