融合静态与动态语义表示的在线问诊文本命名实体识别研究
【目的/意义】在线健康社区含有大量、繁杂的问诊文本,采用多类文本语义表示方法充分获取文本的语义信息,以精准识别其中的命名实体。【方法/过程】首先,分别使用Word2vec和GloVe静态词嵌入模型对问诊文本进行训练获得局部与全局静态语义表示,进而融合为静态语义表示。其次,利用医疗健康领域的ERNIE-Health动态词嵌入模型生成动态语义表示。最后,将静态和动态语义表示融合后输入BiLSTM-CRF,识别出问诊文本中的实体。【结果/结论】相较于单一的静态和动态语义表示,语义表示融合后的问诊文本命名实体识别效果在准确率、召回率和F1值分别提升了2.17%、4.07%和3.12%以及0.60%、3.18%和1.89%。【创新/局限】综合考虑问诊文本中的静态与动态语义表示,提升问诊文本命名实体识别效果。但仍存在含义相同但名称不同的实体,一定程度上影响实体质量。
情报科学
2024年10期
立即查看 >
图书推荐
相关工具书