基于生成式大语言模型的非遗文本嵌套命名实体识别研究

基于生成式大语言模型的非遗文本嵌套命名实体识别研究


标题: 基于生成式大语言模型的非遗文本嵌套命名实体识别研究


作者: 张逸勤,邓三鸿,王东波


第一作者: 张逸勤


机构: 南京大学信息管理学院,数据工程与知识服务省高校重点实验室(南京大学),南京农业大学信息管理学院


期刊: 现代情报


发表日期: 2024-12-31


论文摘要: [目的/意义] 本研究探索生成式大语言模型在非物质文化遗产文本嵌套命名实体识别中的应用,以提高特定领域复杂文本中多层次实体的识别精度。[方法/过程] 研究对比了GPT-4、Claude 3.5 Sonnet、ChatGLM2-6b等多种生成式大语言模型与BERT+GlobalPointer基线模型的性能,并设计了思维链与行为推理模式两种提示工程技术以优化模型复杂上下文中的识别能力。[结果/结论] GPT-4模型采用行为推理模式时表现最佳,Qwen2-72B模型达到91.16%的最高F1值,展现出优异的领域适应性。研究验证了生成式大语言模型在非遗文本嵌套实体识别中的应用潜力,然而在处理长文本和复杂嵌套结构时仍存在计算资源需求高、推理速度慢等挑战。未来研究将通过混合模型或多任务学习框架,融合BERT模型的稳定性与生成式大语言模型的灵活性以提升识别性能。


知网阅读链接: 点击跳转






提示:本站使用最低限度cookies来确保基础功能实现。 View more
同意
拒绝