首页 > 学生工作 > 学工动态 > 正文 学工动态

【学术讲座】学术文本信息抽取研究进展

发布时间:2024-09-13 浏览次数:

如何从海量文本中高效、准确地提取关键信息,成为同学们在科研中面临的一个挑战。为此,2024年9月13日上午,江苏大学图书馆一楼报告厅内,南京理工大学教授、博士生导师章成志教授,就“学术文本信息抽取研究进展”这一主题,进行了深入而精彩的分享。

章成志教授作为信息组织与检索、文本挖掘及自然语言处理领域的权威专家,现任中国中文信息学会社会媒体处理专委会常委、中国系统工程学会数据科学与知识系统工程专委会常委等多个重要学术职务,并担任十余种国际期刊及五种中文期刊的编委或副编辑,其学术成就斐然。

讲座开始,章教授首先概述了学术文本信息抽取的背景与现状。他指出,随着科研活动的日益活跃,学术文献数量急剧增长,如何从这些文献中快速、准确地提取出摘要、关键词、引用关系等关键信息,对于促进知识发现、加速科研进程具有重要意义。尽管近年来该领域取得了显著进展,但仍面临着诸如篇章结构复杂、语义理解困难、跨语言处理障碍等多重挑战。

随后,章教授从篇章结构、句子、词语三个层面,详细阐述了其研究团队在学术文本信息抽取方面的最新进展。在篇章结构识别方面,他介绍了如何通过构建层次化的篇章结构模型,实现对学术文献整体框架的精准把握;在未来工作句识别上,他分享了基于深度学习的创新方法,有效提升了识别准确率;而在关键词与实体抽取环节,他则强调了结合领域知识库和上下文信息的重要性,以实现更加精准、全面的信息提取。

讲座的最后部分,章教授对未来研究方向进行了展望。他提出,随着人工智能技术的不断发展,学术文本信息抽取将更加注重跨语言、跨模态的处理能力,以及与其他学科领域的深度融合。同时,他也呼吁同学们应持续关注该领域的最新动态,勇于探索未知领域,共同推动学术文本信息抽取技术的不断进步。

此次讲座不仅为我们提供了一次难得的学习机会,也进一步激发了大家对学术文本信息抽取研究的浓厚兴趣。

供稿人:任思琪(2023级专硕)

2024年9月13日

Copyright◎江苏大学图书馆 版权所有 江苏省镇江市学府路301号