搜索到28篇“ 专指度“的相关文章
查询专指与检索多样化的关系研究被引量:1
2018年
为了研究不同查询专指语句的多样化检索效果,进而为提高检索质量和用户体验提供借鉴。本文基于TREC(2009-2012)Web Track检索词,人工进行专指标注,选用语言模型狄利克雷平滑、语言模型线性差值平滑和TF-IDF三种模型,使用MAP-IA,α-nDCG@k,ERR-IA@k评价多样化检索结果,对检索结果进行统计学分析和差异性检验,全面分析了查询专指与多样化检索效果之间的关联性。实验结果表明查询词的专指特征与多样化检索的效果间存在一定的关联。强专指查询的多样化检索效果要明显好于弱专指查询,特别在靠前的检索结果列表中,这种差异性最大。
赵春晖张俊
关键词:查询意图
查询专指对检索效果的影响研究被引量:1
2016年
【目的】针对不同查询专指语句的检索效果进行全面分析,为改善搜索引擎性能、提高用户检索体验提供借鉴。【方法】基于TREC Web Track查询语句,人工构建查询专指标注集,选用语言模型狄利克雷平滑、语言模型线性插值平滑和BM25三种模型,以常用的信息检索评价指标为基准,探讨查询专指强弱对检索效果在不同层次上的影响。【结果】在最靠前的几条检索结果中,强弱专指查询语句的检索效果差异最大,强专指的检索效果要明显好于弱专指。【局限】仅在TREC数据集上进行实验测试,还需在其他数据集上进一步检验。【结论】搜索引擎在专指这一维下,应重点关注最靠前的几条检索结果的准确性,以此为切入点改善检索模型。
任珂陆伟丁恒
关键词:查询意图
查询专指特征分析与自动识别被引量:5
2015年
【目的】基于Sogou查询日志构建人工标注集,实现查询专指的特征分析与自动识别,并对识别效果进行分析与评测。【方法】选取用户查询串基本特征与内容特征进行统计分析,并分别训练决策树、SVM和朴素贝叶斯分类器对专指进行自动识别。【结果】使用以上特征的识别效果良好,十折交叉检验的宏平均F-measure均高于0.8。【局限】分类特征的选择未考虑用户点击信息;朴素贝叶斯的独立性假设在本实验中是否可以忽略仍需进一步验证。【结论】利用查询串基本特征和内容特征,可以有效识别弱、略和强专指查询。
唐祥彬陆伟张晓娟黄诗豪
关键词:决策树SVM朴素贝叶斯
提高专类文献归类专指的探索——以民族文献为例被引量:1
2002年
探讨在使用《中国图书资料分类法》时,如何从民族文献的多民族、多语种、多地方等特性出发,提高专类文献的专指,以及更标准地使用复分技术,多主题、深层次地揭示文献内容。
李静
关键词:专指度民族文献
医学主题词表(MeSH)专指研究被引量:11
1995年
本文从词表先组、词量及词量系数、标引及检索四个不同角探讨厂MeSH表的专指问题,认为MeSH表的收词量及专指较为适宜,不失为词表中的典范,只是对于那些覆盖文献量过大的主题词应采取措施进一步细分,以利于标引和检索。
于双成逢大欣李占兵
关键词:医学主题词表MESH
关于中文刊名对类目专指的统计分析
1992年
一、问题的提出 有关中文期刊分类的文章无一不强调刊名不能作类分期刊的依据,并都例举一二,以资证明。对此,笔者不敢苟同。刊名对类分期刊究竟有无参考价值、有多大程?为了回答这个问题,笔者就馆藏中文期刊刊名对类目专指的情况作了统计分析,以期用定量的方法参于商榷。 二、准备工作 1.统计对象是烟台大学图书馆1988年3月编印的《现期报刊目录》里有关中文期刊部分,共计2341种,它们在22大类中均有分布;因此,具有一定的代表性和概括性。 2.类目是指期刊分类表中所列的类目。
金丰海
关键词:图书馆刊名统计分析
关于西文刊名对类目专指的统计分析
1991年
(一)问题的提出有关期刊分类的文章无不强调刊名不能作类分期刊的依据,并都例举一二以资证明。对此,笔者曾就中文刊名对类目专指的情况作了统计分析,对上述结论是否认的。那么西文刊名的情况会是怎样呢?以下便是西文刊名对类目专指情况的统计分析,望同行指教。 (二)准备工作 1.统计对象是《外国报刊目录》
金丰海
关键词:西文刊名
索引语言的专指被引量:1
1987年
情报检索是情报标引的逆过程.检索和标引时使用的语言即索引语言.我们检索时,选择使用索引语言,采用某种策略、程序、方法,结构成检索式,用以检索;一般书刊统称检索策略,实际上是检索技术的泛指.我们姑且使用这个泛指概念. 情报检索效果的好坏,主要取决于检索策略,关键问题是如何把握索引语言的专指Specificity.所谓专指,即表达事物的概念精确.探讨这个课题的目的,是为了指导检索实践中系统的选择及检索时具体的运用,并为文献检索课教师提供教学的实例.
龙小同
关键词:专指度查全率查准率文献检索课情报检索检索式
分类标引工作存在的问题及改进建议
2009年
阐述了图书分类标引中存在的专指低、实用性没得到充分体现、发展性差和组配标引不一致等问题,提出了相应的解决方法。
安晓丽
关键词:分类标引图书馆专指度组配标引
CNMARC中非控主题词的选词原则
2008年
非控主题词,也称自由词,是指词表未收、可随需要增补、不作为正式标引检索用词、但可实际用于检索,具有较大的识别功能的词。非控主题词属于自然语言范畴,其专指一般高于词表中的正式词。在CNMARC(中国机读目录格式)中,610字段反映非控主题词。
肖燕
关键词:非控主题词选词原则专指度主题词标引叙词标引

相关作者

陆伟
作品数:186被引量:1,305H指数:20
供职机构:武汉大学信息管理学院
研究主题:信息检索 复合材料 学术文献 XML检索 查询
李静
作品数:33被引量:35H指数:3
供职机构:中央民族大学经济学院
研究主题:图书馆 信息化建设 资源共享 信息化 民族文献
吴礼志
作品数:7被引量:37H指数:4
供职机构:武汉大学信息管理学院
研究主题:同类书排列 书次号码 信息分类体系 类目 维护管理
刘予漳
作品数:1被引量:0H指数:0
供职机构:太原理工大学
研究主题:财政法规 文本自动分类 文本分类 专指度 语料库
张晓娟
作品数:152被引量:1,658H指数:20
供职机构:武汉大学信息管理学院
研究主题:政府 查询 系统集成 查询意图 政府信息