%0 Journal Article %A 徐瑞 %A 曾诚 %A 程世杰 %A 张海丰 %A 何鹏 %T 基于双三元组网络的易混淆文本情感分类方法 %D %R %J 中文信息学报 %P 135-145 %V 38 %N 1 %X 预训练模型的快速发展使得情感分类任务得到了突破性进展,然而互联网提供的海量数据中存在着大量语义模糊、易混淆的文本,制约了当前多数模型的分类效果。针对易混淆文本对情感分类的负面影响,该文提出了一种基于双三元组网络的易混淆文本情感分类方法。该方法有效解决了传统三元组网络中同类文本特征之间仍存在明显差异的问题,改进了三元样本组合的构建方式,分别从易分类文本和普通文本中构建出两对三元样本组合,并以不同权重进行特征相似度比对,让模型深入挖掘易混淆文本和易分类文本的特征编码差异,充分学习同类别文本间的相似性和混淆类别文本间的差异性,提高了文本特征的聚类效果;同时,在训练过程中将本批次的易混淆文本加入到下一批次进一步训练,更有效地利用了易混淆文本的语义信息,以此提升模型整体的分类效果。在nlpcc2014、waimai_10k和ChnSentiCorp数据集上进行对比实验,实验结果表明,与现有的易混淆文本情感分类方法相比,该方法在准确度和 F1值上具有更好的表现,其中 F1值相较于基准模型提升了3.16%、2.35%和2.5%,验证了所提方法的有效性和合理性。 %U http://jcip.cipsc.org.cn/CN/abstract/article_3671.shtml
Baidu
map