科技名词

您当前的位置: 首页  >  科技名词  >  科技名词
情感分析
发布时间:2023-04-11     作者:   来源:学习强国全国科学技术名词审定委员会   分享到:

情感分析

sentiment analysis

定义:自动判定文本中观点持有者对某一话题所表现出的态度或情绪倾向性的过程、技术和方法。例如对文本或句子的褒贬性给出判断。

学科:计算机科学技术_人工智能_计算语言学

相关名词:自然语言处理 文本分类 机器学习

【延伸阅读】

情感分析主要面向文本数据,是自然语言处理的主要内容。情感分析又称意见挖掘、倾向性分析等,是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。人们在互联网的各种平台(如微博、论坛、知乎、豆瓣等)发布信息,其中难免有各种情感色彩和情感倾向性,如喜、怒、哀、乐的情绪,批评或批判、肯定或赞扬的态度。情感分析可以自主对这些文字背后所表达的情绪进行挖掘和判断。

情感分析的流程包括文本预处理、特征标注与选择、训练模型、调整模型。现有的文本情感分析的途径大致有三种:基于情感词典的方法、基于机器学习的方法、基于深度学习的方法。

基于情感词典的方法:指根据不同情感词典所提供的情感词的情感极性,来实现不同粒度下的情感极性划分。首先是将文本输入,通过对数据的预处理(包含去噪、去除无效字符等)以及分词操作,将情感词典中的不同类型和程度的词语放入模型中进行训练,最后根据情感判断规则将情感类型输出。现有的情感词典大部分都是人工构建的,这需要花费很大的代价,需要阅读大量的相关资料和现有的词典,总结概括含有情感倾向的词语,对这些词语的情感极性和强度进行不同程度的标注。

基于机器学习的方法:指通过大量有标注的或无标注的语料,使用统计机器学习算法,抽取特征,最后再进行情感分析输出结果。因为不能获取文本的上下文关联信息,并且需要人工对特征进行定义和把控才能得到较准确的情感分析结果,所以在某些文本结构较为规律的特定场合才适合使用。

基于深度学习的方法:以大量含有情感倾向的文本数据为支撑,通过各种深度神经网络结构,充分利用文本的上下文关联信息,主动学习含有不同种情感的文本所具有的特点。无须专家对这些特点进行人工定义。

随着近年来深度学习的发展,以及文本数据的可获取性不断提升,情感分析在自然语言处理研究领域中日渐举足轻重,慢慢从理论研究领域拓展到实践应用中。目前主要用于预测电影票房、股票趋势、舆情分析、改进服务及产品、了解用户体验等。