1 情感分析与数据集
情感分析(sentiment analysis):研究人们在文本中 (如产品评论、博客评论和论坛讨论等)“隐藏”的情绪
常见应用领域
- 政治(如公众对政策的情绪分析)
- 金融(如市场情绪分析)
- 营销(如产品研究和品牌管理)
情感分析采用的示例数据集是电影评价数据集
基于PyTorch的情感分析数据读取与预处理:
import os
import torch
fr
分类目录归档:书籍
情感分析(sentiment analysis):研究人们在文本中 (如产品评论、博客评论和论坛讨论等)“隐藏”的情绪
常见应用领域
情感分析采用的示例数据集是电影评价数据集
基于PyTorch的情感分析数据读取与预处理:
import os
import torch
fr
任意两个不同的 one-hot(独热)向量余弦相似度为0:无法编码词的相似性
两个经典的word2vec模型:skip-gram和CBOW
细节可参阅:[[1_study/DeepLearning/基础神经网络/word2vec 系列]]
当词表较大
《动手学深度学习》的英文版更新比中文版更及时,因此存在新增的内容
本文针对英文版增添的内容进行简要补充,尚未观看本书或笔记的读者建议先看正文
英文版中,将原本的第三章3.《动手学深度学习》线性神经网络拆分为两个部分:用于回归的线性神经网络和用于分类的线性神经网络
在英文版的第3章《用于回归的线性神经网络》的内容概述如下:
优化算法的目标是减少训练误差,追求损失最小化
深度学习的目标是减少泛化误差,寻找合适的模型
由于深度学习的优化算法一般是围绕误差传播和梯度展开的,因此围绕当梯度消失或值接近0时,会极大地干扰到深度学习的优化过程,其中常见的三种情况是:
与序列相关的有趣概念
序列预测的相关概念:
首先需要理解编译和解释的联系与区别
二者的联系:都是将高级语言翻译成机器语言执行的过程
过程上的区别:编译是将源程序翻译成可执行的目标代码,翻译与执行是分开的;而解释是对源程序的翻译与执行一次性完成,不生成可存储的目标代码。
结果上的区别:编译的话会把输入的源程序翻译生成为目标代码,并存下来(无论是存在内存中还是磁盘上),后续执行可以复用;解释的话则是把源程序中的指令逐条解释,不生成也不存下