加急见刊

基于迁移学习和BiLSTM-CRF的中文命名实体识别

武惠; 吕立; 于碧辉 中国科学院大学; 北京100049; 中国科学院沈阳计算技术研究所; 沈阳110168

摘要:针对中文命名实体识别问题,该文提出了一种基于迁移学习和深度学习的TrBiLSTM-CRF模型.该模型采用基于实例的迁移学习算法,通过权值生成和样本选择,将源域的知识迁移到目标域,有效地解决了深度学习对少量数据学习能力不足的问题;通过词向量、BiLSTM、CRF等操作融合了上下文语义信息,克服了对人工特征和专家知识的依赖.实验结果表明,TrBiLSTMCRF模型在小规模数据集上进行中文机构名命名实体识别时,其准确率、召回率和F值分别为91. 57%、72. 29%和0. 80%,相比于该文提到的其他方法,取得了较好的效果.

注: 保护知识产权,如需阅读全文请联系小型微型计算机系统杂志社