袁华
- 作品数:32 被引量:80H指数:5
- 供职机构:电子科技大学更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金四川省教育厅人文社会科学重点研究基地项目更多>>
- 相关领域:自动化与计算机技术经济管理文化科学电气工程更多>>
- 基于主题模型的企业关系发现方法及系统
- 本发明公开了一种基于主题模型的企业关系发现方法,涉及大数据挖掘技术领域,本发明以新闻数据为研究的数据集,首先利用命名实体识别工具识别出实体,然后再用卷积神经网络来分类识别出企业实体,然后利用LDA模型,发现文本中的主题分...
- 钱宇袁华
- 基于词向量表征的问题评论对的构建方法
- 本发明公开了一种基于词向量表征的问题评论对的构建方法,包括以下步骤:获取问答语料库以及评论语料库,并对问题和该问题的回答进行拼接;使用word2vec工具和基于词向量的词袋模型分别对拼接后的问答语句以及评论进行表征,获得...
- 钱宇袁华
- 文献传递
- 基于最大置信度的中文复合新词发现方法
- 本发明涉及中文信息处理领域,提供一种基于最大置信度的中文复合新词发现方法,该方法包括步骤:文本内容抽取及数据预处理;序列频繁模式挖掘;复合新词发现。本发明提出的技术方案在保持准确率的同时,显著地提升了抽取结果的召回率和准...
- 袁华钱宇徐华林
- 文献传递
- 电子商务环境下多平台消费者价格偏好研究
- 本文首先通过爬虫获取多平台产品价格数据;其次根据购买力平价理论做平台价格等价性处理,用两平台同类产品的价格加权平均值之比乘以两平台该类产品的价格变异系数之比得到价格转换率,将所有价格划分到同一水平;然后利用K-Means...
- 张友莎钱宇袁华
- 关键词:电子商务消费者
- 基于海量序列数据的公交用户群体出行预测研究被引量:1
- 2020年
- 在海量序列数据中,预测群体用户在未来一段时间中的可能行为模式是一个非常有意义且具有挑战性的研究问题。本文以公交用户群体出行为例,通过引入相空间重构法,利用海量序列数据对大型系统建立模型来模拟其动态演化模式。同时,考虑到一般相空间预测方法在大数据情况下的不足,提出了相似性拐点方法进行预测前的相似点的自动挑选工作,该方法不但降低了预测过程中的相似度计算复杂度,同时也显著提升了预测效果。实验证明,本文的方法对于探讨利用海量(周期性)序列数据进行系统建模,以及预测一段时间内的群体行为提出了新的思路。
- 冯路钱宇白梦娜袁华
- 关键词:相空间重构
- 基于GPS轨迹的用户兴趣点及频繁路径挖掘研究被引量:11
- 2015年
- 用户在一定区域内的长期移动行为与某些物理位置相关,如家和办公室等.为了从用户的日常移动轨迹中找出这些位置与轨迹的关系,本文提出一种新的基于移动位置扰动的端点划分与聚类方法.该方法首先将GPS轨迹划分为成组的线段集,然后运用聚类方法将地理上相似的端点进行聚类以检测用户的个性化兴趣点,最后利用原始轨迹来映射个性化兴趣点之间连接关系,生成用户在区域内的移动路径网络.理论与实验结果表明,本文提出的方法可有效地从大量GPS轨迹中发现用户的频繁路径及个性化兴趣点,从而能够为其提供更好的个性化地理信息服务.
- 袁华钱宇杨锐
- 关键词:数据挖掘聚类
- 在线社区支持倾向对股市收益和波动的影响被引量:11
- 2020年
- 互联网技术的飞速发展使得非专业的个体投资者可以通过在线金融社区分享信息并表达倾向.本文利用东方财富网的5178824条用户评论,运用卷积神经网络的分类算法,提取并测量了在线用户对未来市场看涨或看跌的支持倾向,并从市场收益和波动两个方面,检验了在线用户支持倾向及其一致性对股市的影响.结果表明,在线用户当期支持倾向对未来的股市收益具有显著的负向影响,支持倾向的一致性则会放大市场的波动幅度.进一步的证据表明,用户支持倾向很大程度上是基于股票市场的历史表现而形成,且具有一定的“羊群效应”.
- 钱宇李子饶李强袁华
- 在线商品的'购买-评论'行为动力学研究
- 人类行为动力学成为诸多学科关注的重点,人类在线行为模式也越来越引起学者的兴趣.作为在线活动的一个重要组成部分,对在线网购中的购买评价行为的研究也尤为必要.本文通过抽取三种商品的消费者评论数据,发现和验证了消费者购买产品和...
- 李良强袁华邵培基
- 关键词:幂律分布
- 文献传递
- 海量文本中企业行为或事件的抽取方法
- 本发明涉及数据挖掘领域,提供一种海量文本中企业行为或事件的抽取方法,该方法包括:数据预处理;词表征;事件向量计算;事件提取分类。本发明提出的技术方案使用向量表示事件和微博,所以基于事件的相似度,本发明能够有效地计算相似度...
- 袁华钱宇邓雄文邓文君
- 文献传递
- 海量文本中旅游热点及其特征抽取方法及系统
- 本发明涉及数据挖掘领域,提供一种海量文本中旅游热点及其特征抽取方法及系统,该方法包括:文本预处理;热点话题词发现;热点话题特征抽取。本发明提出的技术方案除了降低计算复杂性之外,还提高了局部特征词与中心话题词之间的相关性,...
- 袁华钱宇徐华林印如意
- 文献传递