张绍武
- 作品数:39 被引量:318H指数:10
- 供职机构:大连理工大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金辽宁省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学理学经济管理更多>>
- 基于图排序的词汇情感消歧研究被引量:3
- 2014年
- 词汇情感消歧是文本情感倾向性分析的关键技术之一。该文在分析比较了词汇情感消歧和词义消歧异同后,从情感分析角度出发,提出了基于图排序的词汇情感消歧方法。该方法通过自动获取和人工校正相结合的方式获得多情感词汇,然后根据语义关系构建词义关系图,进而在词义关系图上迭代计算直至收敛,最后选择多情感词汇的词义中权值最大的词义作为结果输出,从而实现情感消歧。该文分别在新浪微博语料库和情感语料库上验证了该方法的有效性。
- 杨亮张绍武林鸿飞宋艳雪
- 基于神经网络的微生物生长环境关系抽取方法被引量:1
- 2017年
- 提出一种基于神经网络的方法实现细菌和栖息地的关系抽取,充分利用神经网络的特性实现对隐含的深层特征的自动学习,以避免传统人工特征设计的复杂性和冗余性.该方法利用单词以及实体属性的分布式向量丰富句法和语义信息,使用两个不同神经网络模型从不同角度进行关系抽取,并融合文档级别的分类结果,在生物医学自然语言处理Bio NLP-ST 2016共享任务的BB-event语料上进行实验,取得了不错的F1值,表明该方法在微生物生长环境关系抽取上具有良好的性能.
- 王健李虹磊林鸿飞杨志豪张绍武
- 基于HDP的汽车专利主题演化研究被引量:10
- 2014年
- 近年来专利数据呈爆炸式增长,从专利文本信息中准确地获取主题信息并将其可视化逐渐成为一个重要的研究方向。专利主题演化研究能够挖掘出专利中潜在的发展模式,对相关研究具有重要参考价值。本文将分层的狄利克雷过程(HDP)应用到专利主题聚类中,通过当前主题与加入历史数据之后的主题变化来挖掘主题的分流与合流,最后对主题信息利用叠式图进行可视化展示。实验结合实际的汽车专利数据进行分析研究,发现汽车专利主要分为三个大主题,而且各个主题之间有分流、合流,有逐年递增也有逐年递减,有新生主题也有消亡主题等各种形式,并发现从2006年开始汽车安全领域和汽车新能源领域分别独立成为一个主题并呈逐年增长的趋势。
- 王亮张绍武丁堃许侃林鸿飞
- 关键词:主题聚类汽车专利
- 一种基于细粒度词表示模型的序列标注模型
- 本发明提供了一种基于细粒度词表示模型的序列标注模型,用于进行序列标注任务,属于计算机应用及自然语言处理领域。本发明的模型结构主要由特征表示层、BiLSTM和CRF层3部分构成。利用该模型进行序列标注任务时,首先提出一种基...
- 张绍武林广和杨亮林鸿飞
- 文献传递
- 一种社交媒体事件级新闻中新闻媒体影响力评估方法
- 一种社交媒体事件级新闻中新闻媒体影响力评估方法,属于数据挖掘和复杂网络技术领域,用于解决评估新闻媒体影响力的问题,技术要点是包括R1、采集社交媒体数据,构建事件语料库;R2、统计语料库中各用户的相关数据;R3、构建转发网...
- 邵华张绍武林鸿飞陈晨
- 文献传递
- 基于项目和标签的随机游走个性化信息推荐模型被引量:10
- 2012年
- 近几年,各大社会媒体都在致力于提供良好的信息推荐服务,应对网络资源的增长和用户的个性化需求,然而数据稀疏性问题成为了影响推荐性能的主要障碍因素之一。本文在随机游走(RWR)算法的基础上进行了改进,提出了一种项目一标签导向的随机游走推荐模型(TRWR),针对特定用户分别在项目空间和标签空间中根据对象之间的相似性计算转移概率,进行有限步长的随机游走,在两个空间中都生成若干个待推荐项目,然后重新计算预测评分,最后对该用户进行个性化信息推荐。在计算对象之间相似性的过程中,本文采用了融合评分差异性和共同评分用户数的相似度计算方法。我们的实验基于MovieLens公开数据集,并与Top—N、DV和RWR这三种项目导向方法进行了对比,结果表明本文提出的模型提高了Precision值和Recall值,并使得MAE值有所下降。
- 王丽莎张绍武林鸿飞
- 关键词:个性化信息推荐数据稀疏随机游走
- 一种基于词向量的缩写词歧义消除系统及方法
- 本发明涉及一种基于词向量的缩写词歧义消除系统及方法,首先将对含有目标缩写词的待检测文档中所有非字母符号及停用词全部去除;其次选择出现在目标缩写词前后距离小于固定长度以内的词语作为备选关键词,并对备选关键词通过相对重要性进...
- 张绍武马建伟
- 文献传递
- 计算机专业课程思政建设的4个关键点被引量:27
- 2021年
- 分析计算机专业课程思政建设所面临的挑战,归纳出需要重点建设的4个关键点,并提出面向计算机专业课程思政实施的闭环协同体系,为实现切合专业特色的全课程育人奠定基础。
- 齐恒王宇新葛宏伟张绍武
- 关键词:计算机专业
- 一种用于构建用户画像的二级融合算法框架被引量:30
- 2018年
- 用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作是给用户贴"标签"。基于用户的查询词历史记录,提出一种用于预测用户多维标签的二级融合算法框架。在第一级模型中,分别在各个标签预测子任务上建立多种模型,使用传统机器学习方法与Trigram特征相结合来抽取用户用词习惯的差异,使用doc2vec浅层神经网络模型来抽取查询词的语义关联信息,使用卷积神经网络模型来抽取查询词之间的深层语义关联信息。实验表明,doc2vec在处理用户查询这样的短文本相关任务时有着相对较好的预测准确性。在第二级模型中,针对用户画像这样的多标签预测任务,使用XGBTree模型及Stacking多模型相融合的方法提取出用户各标签属性之间的关联信息,使得平均预测准确率进一步提高了2%左右。在2016年中国计算机学会(CCF)组织的大数据竞赛《大数据精准营销中搜狗用户画像挖掘》中,所提二级融合算法框架在894支队伍中夺得了冠军。
- 李恒超林鸿飞杨亮徐博魏晓聪张绍武古丽孜热.艾尼外
- 微博社交网络的用户影响力评价方法被引量:3
- 2017年
- 该文主要研究在微博社交网络中怎样评价用户的影响力。在影响用户影响力的众多因素中,该文认为用户的传播能力越强,用户的信息便可以更快地在网络中扩散,其影响力也越大。和传统的用户影响力评价方法相比,该文综合考虑用户的活跃度和用户所发微博质量两个方面的因素,得到用户的影响力权重,然后把每一个用户作为社交网络中的节点,计算其在社交网络中的影响力。通过在公开语料集和真实数据中的实验,表明该方法是可行的,比传统的用户影响力评价方法更能客观、真实地反映用户的实际影响力。
- 吴慧张绍武林鸿飞
- 关键词:社交网络活跃度