张春云
- 作品数:9 被引量:60H指数:4
- 供职机构:山东财经大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金山东省自然科学基金山东省自然科学杰出青年基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 一种层次化的乳腺肿瘤分割方法被引量:4
- 2018年
- 超声图像是乳腺癌辅助诊断常用的工具之一.肿瘤分割是乳腺超声图像分析的基础.乳腺超声图像中的灰度不同质性、纹理及形状的多变性等复杂特点使得肿瘤的精确分割较为困难.提出了一种层次化的分割框架.首先将局部灰度聚类假设引入活动轮廓模型作为底层分割模型,对图像进行初始分割;然后提出基于超像素和支持向量机(Support Vector Machine,SVM)的高层分割模型,对初始结果再进行高层分割.在高层分割过程中,首先使用简单线性迭代聚类(Simple Linear Interactive Cluster,SLIC)提取超像素,然后提取超像素的灰度、纹理和局部特征,最后使用SVM进行分类.高层分割模型是基于底层模型的分割结果学习获取的,能够检测到底层模型可能分割错误的区域,与底层模型具有较好的互补性.因此,提出的层次化分割框架具有较好的鲁棒性.在自建乳腺超声数据库上的实验结果证明了提出方法的有效性和鲁棒性.
- 袭肖明杜亨方孟宪静张春云张光张光于振
- 基于时序超图卷积神经网络的股票趋势预测方法被引量:6
- 2022年
- 传统的股票预测方法大多基于时间序列模型,忽视了股票之间复杂的关系,并且该关系往往超出成对连接,例如同行业板块内股票或者基金持仓多支股票。针对该问题,提出一种基于时序超图卷积神经网络(HGCN)的股价走势预测方法,根据金融投资事实构造超图模型以拟合股票之间的多元关系,该模型包括两大组件:门控循环单元(GRU)网络和超图卷积神经网络。GRU网络对历史数据进行时间序列建模,捕捉长期依赖关系;HGCN建模股票间的高阶关系以学习内在关系属性,从而将股票间多元关系信息引入到传统的时序建模中,进行端到端的趋势预测。在中国A股市场真实数据集上的实验结果表明,相较于已有的股票预测方法,所提模型预测性能有所提升;如与GRU网络相比,所提模型在ACC和F1_score上的相对增幅分别为9.74%和8.13%,且更具有稳定性。此外,模拟回测结果显示,基于该模型的交易策略更具获利能力,年回报率达到11.30%,与长短期记忆(LSTM)网络相比提高了5个百分点。
- 李晓杰崔超然宋广乐苏雅茜吴天泽张春云
- 基于不同语料的词向量对比分析被引量:2
- 2017年
- 通过对目前自然语言处理领域中基于深度学习的词向量表示方法对不同文本语料文本表达的有效性进行分析,将主流词向量训练方法用于不同的文本语料集,包括英文维基百科语料、新闻语料、论坛语料和Web语料进行训练,并采用三种评价指标:余弦相似度平均差、斯皮尔曼等级相关和米克罗夫类比方法对训练出的文本词向量表达方法进行比较.实验结果表明,针对上述四种语料,词向量能够实现对文本的有效表示,但各个语料训练出的词向量的通用性不同,其中维基百科语料训练的词向量的通用效果最好.
- 崔萌张春云
- 面向新工科人才培养的多措并举的概率统计原理及应用教学改革
- 2022年
- 针对新工科背景下计算机类专业本科学生概率统计原理及应用课程线上教学面临的挑战和遇到的问题,提出"一平台,两辅助"多措并举的线上智慧教学改革方案,介绍"以超星学习通为主要平台,以QQ、腾讯会议软件为辅助手段"的课程教学实践,最后说明教学成效。
- 张春云崔超然林培光
- 关键词:智慧教学教学改革
- 基于卷积神经网络的自适应权重multi-gram语句建模系统被引量:7
- 2017年
- 如今信息量呈爆炸式增长,自然语言处理得到了越来越广泛的重视。传统的自然语言处理系统过多地依赖昂贵的人工标注特征和语言分析工具的语法信息,导致预处理中语法信息的错误传递到系统训练和预测过程中。因此,深度学习的应用受到了学者们的关注。因为它能实现端对端预测并尽可能少地依赖外部信息。自然语言处理领域流行的深度学习框架为了更好地获取句子信息,采用multi-gram策略。但不同任务和不同数据集的信息分布状况不尽相同,而且这种策略并没有考虑到不同n-gram的重要性分布。针对该问题,提出了一种基于深度学习的自适应学习multi-gram权重的策略,从而根据各n-gram特征的贡献为其分配相应的权重;并且还提出了一种新的multigram特征向量结合方法,大大降低了系统复杂度。将该模型应用到电影评论正负倾向判断和关系分类两种分类任务中,实验结果证明采用的自适应multi-gram权重策略能够大大改善模型的分类效果。
- 张春云秦鹏达尹义龙
- 关键词:自然语言处理自适应权重
- 基于改进的TF-IDF算法及共现词的主题词抽取算法被引量:17
- 2017年
- 信息主题的抽取是快速定位用户需求的基础任务,主题词抽取时主要存在三个问题:一是词语权重的计算,二是词语间关系的度量,三是数据维度灾难.在计算词权重时首先利用互信息确定共现词对,与词频、词性、词位置信息非线性组合,然后,根据词权重构建文档—共现词矩阵并建立潜在语义分析(Latent Semantic Analysis,LSA)模型.该方法借助LSA模型的奇异值分解(Singular Value Decomposition,SVD)将文档—共现词矩阵映射到潜在语义空间,不仅实现数据降维,而且获得低维度的文档相似矩阵.最后,对文档相似矩阵进行k-means聚类,在同类文档中选出词权重最大的前几对共现词,作为该类文章的主题词.对比基于TF-IDF(Term Frequency-Inverse Document Frequency)和共现词抽取主题词的实验,该算法的准确度分别提高了19%和10%.
- 公冶小燕林培光任威隆张晨张春云
- 关键词:TERM
- 基于过程监督的序列多任务法律判决预测方法被引量:2
- 2021年
- 法律判决预测是人工智能技术在法律领域的应用,因此对法律判决预测方法的研究对于实现智慧司法具有重要的理论价值和实际意义。传统的法律判决预测方法大都是只进行单一任务的预测或仅基于参数共享的多任务预测,并未考虑各子任务之间的序列依存关系,因此预测性能难以得到进一步的提升。文中提出了一个端到端的基于过程监督的序列多任务法律判决预测模型,在建模各子任务之间的依存关系时,通过引入过程监督来确保依赖信息的准确性,从而提升序列子任务的预测性能。将所提模型应用到CAIL2018数据集上,取得了较好的分类效果,平均分类准确率比现有的state-of-the-art方法的准确率提升了2%。
- 张春云曲浩崔超然孙皓亮尹义龙
- 关键词:多任务学习
- 基于用户查询日志的网络搜索主题分析被引量:2
- 2017年
- 网络搜索分析在优化搜索引擎方面具有举足轻重的作用,而且对用户个人搜索特性进行分析能够提高搜索引擎的精准度。目前,大多数已有模型(比如点击图模型及其变体),注重研究用户群体的共同特点。然而,关于如何做到既可以获取用户群体共同特点又可以获取用户个人特点方面的研究却非常少。本文研究了基于个人用户网络搜索分析新问题,即通过研究用户搜索的突发性现象,获取个人用户搜索查询的主题分布情况。提出了两个搜索主题模型,即搜索突发性模型(SBM)和耦合敏感搜索突发性模型(CS-SBM)。SBM假设查询词和URL主题是无关的,CS-SBM假设查询词和URL之间是有主题关联的,得到的主题分布信息存储在偏Dirichlet先验中,采用Beta分布刻画用户搜索的时间特性。实验结果表明,每一个用户的网络搜索轨迹都有多种基于用户的独有特点。同时,在使用大量真实用户查询日志数据情况下,与LDA、DCMLDA、TOT相比,本文提出的模型具有明显的泛化性能优势,并且有效地描绘了用户搜索查询主题在时间上的变化过程。
- 张森张晨林培光张春云郭玉超任威龙任可
- 关键词:网络搜索主题模型文本挖掘
- 卷积神经网络下的Twitter文本情感分析被引量:20
- 2018年
- 随着社交网络的日益普及,基于Twitter文本的情感分析成为近年来的研究热点。Twitter文本中蕴含的情感倾向对于挖掘用户需求和对重大事件的预测具有重要意义。但由于Twitter文本短小和用户自身行为存在随意性等特点,再加之现有的情感分类方法大都基于手工制作的文本特征,难以挖掘文本中隐含的深层语义特征,因此难以提高情感分类性能。本文提出了一种基于卷积神经网络的Twitter文本情感分类模型。该模型利用word2vec方法初始化文本词向量,并采用CNN模型学习文本中的深层语义信息,从而挖掘Twitter文本的情感倾向。实验结果表明,采用该模型能够取得82.3%的召回率,比传统分类方法的分类性能有显著提高。
- 王煜涵张春云赵宝林袭肖明耿蕾蕾崔超然
- 关键词:情感分析卷积神经网络