为推动大语言模型技术在专业领域知识发现中的应用,探索人工智能与医学文本分析的深度融合。2025年5月8日,在江苏大学图书馆一楼报告厅,华东师范大学经济与管理学院段宇锋教授就 “大语言模型在专业领域知识发现中的应用研究 —— 以医学文本实体关系抽取为例” 这一主题开展专题讲座。本次讲座旨在借助大语言模型及相关技术,挖掘医学文本中实体关系的潜在价值,为医学信息抽取与知识发现等跨学科领域的研究提供新路径与新视角。
段宇锋,华东师范大学经济与管理学院教授、博士生导师。现兼任全国图书情报专业学位研究生教育指导委员会委员、中国科学技术情报学会理事、中国社会科学情报学会理事等职。主要从事信息组织、图书馆创新等方面的研究。主持国家社会科学基金项目3项,国家社会科学基金重大项目子课题2项,出版著作4部,发表学术论文100余篇。擅长信息组织方面的研究。
段宇锋教授从四个维度深入介绍了研究进展:首先,概述实体关系抽取方法,为后续讲解奠定基础;接着,详述基于提示工程的实体关系抽取,剖析该方法在医学文本中的应用;随后,对深度学习与提示工程方法展开对比,通过实验数据呈现两者差异;最后,针对基于提示工程方法进行优化思考,探索提升大语言模型抽取效果的路径。
讲座中,段教授着重阐释了实验环节。研究选取 qwen - turbo、ERNIE - 3.5 - 8K 等 9 种大语言模型,比较其抽取中医医学文本实体关系的性能差异,分析示例数量、关系类型数量对抽取效果的影响。通过构建提示、设定实验条件,得出 glm - 4 - 0520 综合抽取能力最强等结论,还发现示例数量并非越多越好,合适范围内增加示例可提升抽取效果。
讲座尾声,现场师生踊跃提问,段宇锋教授一一细致解答,与大家深入互动交流。参与讲座的师生反馈,此次讲座让他们目睹大语言模型在医学文本处理中的应用潜力,深切体会到跨学科研究在信息抽取与知识发现领域的关键作用,拓宽了学术视野,为今后科研与学习提供了新思路。
供稿人:张思琪(2024级专硕)
2025年5月8日