%0 Journal Article %A 王亚强 %A 李凯伦 %A 舒红平 %A 蒋永光 %T 基于批数据过采样的中医临床记录四诊描述抽取方法 %D %R %J 中文信息学报 %P 121-131 %V 38 %N 2 %X 中医临床记录四诊描述抽取对中医临床辨证论治的提质增效具有重要的应用价值,然而该任务尚有待探索,类别分布不均衡是该任务面临的关键挑战之一。该文围绕中医临床记录四诊描述抽取任务展开研究,首先构建了中医临床四诊描述抽取语料库;然后基于无标注的中医临床记录微调通用预训练语言模型实现该模型的领域适应;最后利用小规模标注数据,采用批数据过采样算法,完成中医临床记录四诊描述抽取模型的训练。实验结果表明,该文提出的抽取方法的总体性能均优于对比方法,并且与对比方法的最优结果相比,该文方法将少见类别的抽取性能 F 1值平均提升了2.13%。 %U http://jcip.cipsc.org.cn/CN/abstract/article_3687.shtml
Baidu
map