何涛 作品数:8 被引量:55 H指数:5 供职机构: 中国科学院文献情报中心武汉分馆 更多>> 发文基金: 国家自然科学基金 国家重点基础研究发展计划 更多>> 相关领域: 文化科学 自动化与计算机技术 动力工程及工程热物理 生物学 更多>>
不规则文本中商品名称识别的特征选择 被引量:3 2016年 传统的命名实体识别任务多见于人名、地名、机构名这些普通的命名实体,且大多采用规则文本进行研究。随着电子商务和互联网广告的不断发展,如何从用户的各种不规则的上下文信息中自动识别出商品名称这一特殊的命名实体成为了一个需要解决的问题。为了解决这一问题,建立了一个最大熵模型用于识别论坛发帖这种不规则文本中的商品名称,并探讨了多种特征对于识别效果的影响。这些特征不仅包括传统命名实体识别方法中所使用的局部特征和布朗聚类特征,还包括词的分布式表示这种比较新颖的特征。这些特征按照各种不同的方式进行组合作为模型的输入。在CPROD01评测数据集上的实验结果表明,布朗聚类特征能够有效地提高商品名称识别系统的准确性。 杨美妮 何涛 沈静 张建军关键词:最大熵模型 基于类中心向量的论文作者归属机构自动识别方法研究 被引量:5 2019年 对大规模科技文献进行整理分析时,常常需要自动识别论文作者所归属的组织机构,此时需要将论文中的作者地址信息与对应的机构名称进行自动匹配。同一个机构的作者地址信息在不同的英文论文中可能出现多种不同的写法,这给匹配造成了困难。针对这一问题,设计出一种机器学习方法,此方法充分利用英文论文中作者地址的书写特点,在基于类中心向量的基础上将作者地址信息与机构名称进行自动匹配。与传统方法比较,该方法不需要手工编写烦琐的匹配规则,被应用于中国科学院作者地址信息数据集,实验结果证明了此方法的可行性。 何涛 王桂芳 马廷灿大数据环境下科技情报研究的新模式 被引量:13 2018年 大数据时代为科技情报研究与服务带来了重大的机遇和挑战,迫切需要发展新的数据驱动型情报研究模式来变革数据治理和工作流程,提高情报研究和咨询服务的质量。本文概述了传统的人力驱动型科技情报工作模式,分析了存在的问题和局限性;综述了海量异构数据集成、数据管理与分析方法和工具的开发进展;提出了建设数据驱动型科技情报研究模式的整体架构,展望了未来研究的重点。 陈伟 杨锐 何涛 王朔 陈江萍关键词:科技情报研究 大数据 数据驱动 数据集成 数据分析 基于科技文献的生物核磁领域技术机会识别 被引量:2 2016年 以Web of Science引文数据库收录的生物核磁共振领域论文为样本,采用文献计量的方法,对该领域的论文发表变化情况进行了统计分析,对高频关键词进行深入分析,利用Citespace软件绘制高频词共现图谱,并结合该领域专家智慧进行研究热点与发展趋势的解读;同时,利用Citespace软件的突现词发现功能,分析该领域的前沿领域,从定性与定量相结合的角度分析该领域的研究热点与前沿技术。 王桂芳 何涛 马廷灿 陈雷 刘买利关键词:论文产出 跨领域合作对科研产出的影响:以国家自然科学基金资助的SCI论文为例 被引量:13 2016年 科学研究的综合性和复杂性促使科研合作,特别是跨领域合作成为科研活动的常态。本文提出利用论文的资助基金所属研究领域来刻画和识别论文的学科领域,并基于2008—2015年受国家自然科学基金项目资助发表的SCI论文,研究科研合作,特别是跨领域合作对论文质量与项目产出的影响。研究结果表明,科研合作对论文质量与项目产出均存在明显的提升效果,跨领域合作的提升效果显著大于领域内合作。 岳名亮 马廷灿 王桂芳 何涛关键词:国家自然科学基金 基于词嵌入语义的精准检索式构建方法 被引量:10 2018年 [目的/意义]使用科技文献数据库进行文献检索时,检索式中的关键词如果不够全面,将导致检索结果查全率较低;检索式中的关键词如果一词多义,则可能向检索结果中引入无关文献,导致查准率较低。[方法/过程]针对这两类问题,本文提出使用词嵌入这一新颖的文本数据化表现形式,一方面通过语义分析对检索关键词进行扩充从而提高查全率;另一方面通过发现语义异常点来提高查准率。[结果/结论]本文将该方法应用于人工智能领域中深度学习方向上的文献检索式构建,实验结果表明该方法能在一定程度上提高检索的查全率和查准率。 何涛 王桂芳 杨美妮 郭楷模关键词:查准率 查全率 国际能源科技发展新动向及其对我国的启示 被引量:6 2018年 面对国内外能源形势变化,世界主要国家和地区纷纷实施并适时调整作为顶层指导的中长期能源科技战略,以抢占能源发展制高点。伴随我国经济进入新常态,能源发展已进入了消费增长减速换挡、结构优化步伐加快、发展动能转换升级的战略转型关键期,能源生产与消费革命正在不断深化,亟需辨识适合我国国情的重大能源技术变革方向。为此,本文对世界主要国家近年来的能源科技政策新动向、科技前沿进展进行系统梳理,分析其科技政策体系框架及未来能源科技发展趋势,提出我国能源科技发展的若干建议。 郭楷模 陈伟 吴勘 何涛 汪其 李富岭关键词:能源科技 能源政策 石墨烯/Ag@TiO2共同修饰的染料敏化太阳能电池制备及其性能 被引量:3 2018年 利用水热法制备石墨烯和Ag@TiO2核壳纳米颗粒(nanoparticles,NPs)共同修饰的染料敏化太阳能电池(dye-sensitized solar cell,DSSC),研究石墨烯和Ag@TiO2纳米颗粒对光阳极和DSSC性能的影响.实验结果显示,掺入的Ag@TiO2纳米颗粒质量分数为0.6%时,制备的DSSC性能最优,光电转换效率(photoelectric conversion efficiency,PCE)为5.84%,相比于纯TiO2光阳极DSSC提高了近20%.研究表明,石墨烯/Ag@TiO2染料敏化太阳能电池性能的提高,一方面是由于Ag@TiO2纳米颗粒的掺入增强了染料的光吸收能力;另一方面是由于石墨烯的引入显著改善了光阳极染料的吸附量,加快了载流子的传输,增加了载流子寿命,两者协同显著提高了DSSC的短路电流密度(short-circuit photocurrent density,J(sc))和光电转换效率. 郭楷模 陈伟 李明月 何涛 白利华 李美亚关键词:石墨烯 染料敏化太阳能电池