曹志鹏 作品数:7 被引量:17 H指数:2 供职机构: 暨南大学 更多>> 发文基金: 广东省社会科学规划项目 更多>> 相关领域: 文化科学 经济管理 自动化与计算机技术 更多>>
一种面向年报的公司名称和关系抽取方法 发明公开了一种面向年报的公司名称和关系抽取方法,一种面向年报的公司名称和关系抽取方法,具体步骤为:步骤1、进行词向量模型的训练,步骤2、对公司关系的分类进行定义,将SVM分类的标签设为三类,分别是非投资关系、投资关系、无... 潘定 梁倬骞 曹志鹏文献传递 以科学城支撑综合性国家科学中心建设 2023年 科学城是“科学”与“城”的互动融合、高效协同。科学城建设是我国构建科技创新体系、提升科技创新能力的重要战略与重要载体,最早建设始于上世纪80年代,此后不断“蜕变”和“升级”,现全国范围内已有近300个科学城(科技城)。为更好支持综合性国家科学中心建设,北京、上海、合肥、大湾区等地均以相应科学城为载体进行综合性国家科学中心建设。其中,位于广州市南沙区的南沙科学城,被明确定位为大湾区综合性国家科学中心主要承载区、粤港澳大湾区国际科技创新中心创新发展重点承载区、引领高质量发展的战略产业策源地等。 潘启亮 曹志鹏关键词:科技创新中心 科技创新体系 科技创新能力 互动融合 科学城 一种基于语言模型的年报语料库构建方法 本发明公开了一种基于语言模型的年报语料库构建方法,具体步骤为:步骤1、通过网络爬取进行数据收集,并使用PDFBox进行数据提取;步骤2、利用正则表达式进行目录提取;步骤3、运用语言模型进行数据分析;步骤4、进行模型训练并... 潘定 梁倬骞 温秋华 曹志鹏 翁秀木文献传递 一种基于词向量的中文年报标题分类方法 发明公开了一种基于词向量的中文年报标题分类方法,具体步骤为:步骤1、输入企业年报数据集,步骤2、对数据进行人工标注,并划分训练集,步骤3、对数据进行预处理,并训练Word2vector模型,步骤4、待抽取标题的年报通过W... 梁倬骞 潘定 曹志鹏文献传递 一种基于opencv库的文本版面识别方法 本发明公开了一种基于opencv库的文本版面识别方法,一种基于opencv库的文本版面识别方法,具体步骤为:步骤1、通过Smallpdf将所需pdf文件转成多张图片,每一页pdf一张图;步骤2、使用OpenCV对图片进行... 潘定 梁倬骞 温秋华 曹志鹏 翁秀木文献传递 基于表示学习的双层知识网络链路预测 被引量:10 2021年 当前,针对知识网络的链路预测主要是基于网络拓扑结构的相似性,很少考虑作者的研究领域,导致信息利用不充分等问题,因此本文提出了双层知识网络的链路预测框架hypernet2vec。双层知识网络,即作者合著关系网络和学术领域关系网络,利用网络表示学习,分别将两层网络中的节点映射到低维的向量空间,再输入到专门设计的卷积神经网络中计算并进行链路预测。与经典的链路预测指标如RA指标、LP指标和LRW指标等相比,hypernet2vec模型预测的AUC(area under curve)值取得了显著的提升,平均提升幅度达11.17%。文章还从情报产生层面和复杂系统层面,对模型发生作用的深层机理进行了探讨。 曹志鹏 潘定 潘启亮关键词:知识网络 链路预测 神经网络 H指数评估我国高校科研能力的效度研究 被引量:7 2012年 2005年美国加州大学圣地亚哥分校赫希(J.E.Hirsch)教授提出了评价科学家个人学术成就的一项新指标——h指数(h-index)。该指标一经提出,便迅速得到国际科学界的高度关注。本研究基于广东省211高校的数据,通过相关分析,探索H指数作为我国高校科研能力评估指标的有效性,并阐明了该指标的优势和不足。文章认为,H指数具有发展成为下一代核心评价参数的可能,在评价国内高校科研能力方面,也表现出优良的反映特牲。对H指数进行系统研究并运用于高校的科研能力评估具有重要学术意义和现实价值。 曹志鹏关键词:H指数