资源&培训

资源&培训

首页 > 信息 > 资源&培训 > 正文

截词检索

Time:2022-04-20


听说过截词检索么?知道截词检索有什么用么?在英文数据库中用过截词检索么?知道截词检索中的三个截词符么?今天带你走近截词检索。

如您在Springer Link检索“econom*”这样的字符串,您会发现检索结果中出现economiceconomicseconometrics这样的词;

1后截断

如果您将“* 移到字符串前,比如您输入“*bility”检索,检索结果会出现sustainabilityresponsibilitydisability这些命中词;

2前截断

 

当您再将“*”移到检索词的中间,比如您输入“micro*ics”时,检索结果会出现microelectronics等词。

3中截断

*”这么神奇,还有其他有这神奇功能的字符吗?有!如您输入“comput??????”时,您会发现出现computerised等词。

4?”的使用

我们“信息检索界”常将 *”、 ?”、“$”等这些神奇功能的字符称为通配符(通配符表示未知字符,仅在英文查询中有效),将用这些通配符检索的方式称为截词检索。

截词检索是预防漏检,提高查全率的一种常用检索技术,大多数系统都提供截词检索的功能。截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。尤其在西文检索系统中,使用截词符处理自由词,对提高查全率的效果非常显著。

截词算符在不同的系统中有不同的表达形式,分为有限截词(即一个截词符只代表一个字符)和无限截词(一个截词符可代表多个字符)。按截断的位置来分,截词可有后截断(图1)、前截断(图2)、中截断(图3)三种类型。当前大部分数据库用“*”这种通配符替代单词的部分字母,“?”仅代表一个字母,“$”可以替代一个字符或没有字符。

其他检索系统如WOSEIProquestEBSCO等均可成功实现截词检索。但有些数据库不支持“*”、 ?”、“$”等通配符的使用,比如ScienceDirect,但该数据库支持词根检索。如您在ScienceDirect检索“清洁能源”的相关文献,由于不能使用通配符,您可采用“clean  energy”或“clean  power”作为检索式进行模糊检索。


5clean  power”检索结果


6clean  energy”检索结果

由页面中的检索记录2(图5)和134(图6)可以看出系统支持词根检索,相当于后截断检索。

 

小贴士

任何一种截词检索,都隐含着布尔逻辑检索运算。采用截词检索时,既要灵活、又要谨慎,截词的部位要适当,如果截得太短(输入的字符不得少于3个),将影响查准率。另外,不同的检索系统使用的截词符不同、各数据库所支持的截断类型也不同。

 

 

 

研究支持中心    柳翔

  • 微信扫一扫
  • 官方微博
  • 移动图书馆
copyright ©2021-2023 江苏大学图书馆 版权所有