江腾蛟
- 作品数:29 被引量:310H指数:9
- 供职机构:江西财经大学信息管理学院更多>>
- 发文基金:国家自然科学基金江西省自然科学基金江西省教育厅科学技术研究项目更多>>
- 相关领域:自动化与计算机技术文化科学经济管理更多>>
- 基于词性标注和依存句法的Web金融信息情感计算被引量:17
- 2013年
- 基于词袋模型的文本情感倾向性分析没有考虑句子的句法结构对句子语义的理解,基于依存句法分析的方法试图解决这一问题.目前基于依存句法分析的方法对影响文本情感的依存关系的选择多根据人为观察,带有随意性.根据影响句子情感倾向性的原极性、修饰极性和动态极性,1)找出了影响句子情感倾向性的4种词性:形容词、动词、副词和名词;2)从词性和汉语句子成分理解的角度,逐一分析了24种依存关系对句子情感计算的影响,找出了可能影响句子情感倾向性的8种依存关系;3)根据这8种依存关系中可能的词性组合设计了6种情感计算规则,并提出了基于二叉树的情感计算策略,设计了情感计算二叉树的构建算法和基于情感计算二叉树的情感计算算法;4)在Web金融信息上进行了实验测试,实验结果表明了该方法的有效性.
- 万常选江腾蛟钟敏娟边海容
- 关键词:情感计算词性标注依存句法分析
- 基于答案结点的XML文档模糊检索排序模型
- 1引言XML文档数量正呈指数级增长,如何有效地解决大量XML文档集的检索已变得非常重要。由于普通用户发出的自然语言查询的模糊性,存在着检索粒度过小(信息不满足用户需求)或粒度过大(用户还需费时查找信息)的情况,本文中充分...
- 江腾蛟万常选
- 文献传递
- 基于结点权重模型的XML片段检索策略被引量:5
- 2013年
- 当用户向XML检索引擎提交查询后,返回的结果通常远远多于用户的期望,返回结果中难免有一些不相关的文档或结点.对于以文档为中心的XML文档集合,XML片段检索是根据用户的查询,从XML检索引擎返回的XML文档或结点中抽取出仅包含数百字节的片段,用户可以通过该片段判断片段所在的XML文档或结点与查询的真实相关性,以决定是否有必要进一步阅读,从而有效地提高从XML文档中获取信息的效率.该文提出了基于结点权重模型的XML片段检索策略.该策略先利用结点权重模型ATG(平均主题概括强度)对XML文档集中的标签或路径设置权重,再将该权重用于BM25模型,得到BM25NW检索模型.在利用BM25NW检索出XML结点后,对结点中定长窗口进行评分,考察其是否适合作为片段内容.最后在保证信息冗余较小的条件下,选择得分较高的窗口内容组成片段返回给用户.INEX 2011片段检索任务上的评测结果显示,基于结点权重模型ATG的XML片段检索策略具有很强的竞争力,性能明显优于其它参赛系统.
- 刘德喜万常选刘喜平钟敏娟江腾蛟
- 面向混合类型关键词查询的非合作结构化深网数据源选择被引量:6
- 2014年
- 为有效地利用深网中的资源,深网集成应运而生.为了提高深网集成的效率和返回结果的质量,数据源选择成为深网集成的关键技术.深网数据源大多数是结构化和非合作型的.当前已有的非合作结构化深网数据源选择的研究分为2类:一类是面向离散型关键词查询的源选择;另一类是面向字符型关键词查询的源选择,而未见面向混合类型关键词查询的结构化数据源选择的相关研究.基于此,将用户查询关键词分为检索型关键词和约束型关键词,基于主题词与主题词、主题词与特征词和直方图与直方图的关联特征构建了面向检索型、约束型混合关键词查询的层次化数据源摘要,有效地反映了非合作结构化深网数据源选择中检索型关键词的检索意图和约束型关键词的约束相关性,并依据此摘要给出了相应的数据源选择策略.实验结果表明,该方法在面向混合类型关键词查询的非合作结构化深网数据源选择时具有较好的记录召回率及准确率.
- 万常选邓松刘德喜江腾蛟刘喜平
- 关键词:非合作深网数据源选择
- 考虑投资者朋友关系和预期效用的P2P借贷个性化投资推荐方法被引量:2
- 2018年
- 随着互联网技术的快速发展,在线P2P借贷市场投资推荐已经成为网络金融领域的重要研究方向.对于P2P借贷市场潜在投资者来说,需解决的关键问题包括2个方面:1)如何选择真正符合自己投资需求和偏好的投资项目;2)如何将自己的投资金额在这些投资项目中进行合理分配.以往关于这两者的研究主要是侧重在借贷项目的违约风险预测、投资项目全局推荐及投资组合优化等方面.而随着研究的深入可以发现,仍在投资者效用无差异假设及投资者历史交易数据的基础上设计推荐模型,将难以满足不同风险偏好投资者的投资决策需求,保证推荐的有效性.鉴于此,1)基于Prosper平台历史数据建立P2P关联网络模型,并分别计算借贷项目和投资者的概念特征,得出相应的概念模型;2)进一步考察P2P关联网络模型中的投资者朋友关系,以捕获投资者之间投资行为的相互影响,发掘投资者投资行为的影响因子,并将其应用于借贷项目兴趣度的预测,以提高投资项目推荐的有效性;3)在此基础上,从预期效用理论出发,进一步考虑投资者风险偏好对投资需求的影响,建立个性化投资组合推荐框架,以提高其投资的满意度和经济性能;4)将其推荐结果与其他基准模型的推荐结果进行对比分析,以综合评价其推荐效果.在Prosper平台真实数据的基础上进行了详细的实验测试,结果表明:该方法相较于传统的投资推荐方法具有更好的推荐效果.
- 万常选游运江腾蛟刘喜平廖国琼刘德喜
- 关键词:朋友关系
- 多元化电子报税系统的设计与实现
- 2004年
- 江腾蛟谢金海
- 关键词:商业银行电子报税税款税务部门纳税人清算
- 面向XML文档的模糊检索排序模型
- 2006年
- 研究了XML文档检索的特性,归纳了XML文档模糊检索的结构放松和内容放松的影响因素。在此基础上,设计了模糊结构和内容检索的结果相关性排序模型;并设计了满足这种排序模型的top-K排序算法和搜索引擎的体系结构。
- 江腾蛟万常选
- 关键词:XML
- ERP实施探究
- 2004年
- 本文从ERP实施的失败着手,力求分析ERP实施失败的原因。全文首先阐述了ERP的概念、发展历程和作用,全 面介绍了EPR是什么、它能干什么、它是怎样发展而来的,然后重点列举了实施ERP失败的各方面原因和相应的对策,使读者 对成功实施ERP有正确的理论认识。
- 江腾蛟
- 关键词:ERP实施EPR
- 针对XML文档集的关键词检索结果排序被引量:4
- 2007年
- 探讨了针对XML文档集中只与内容相关的关键词检索结果的排序问题,针对XML文档特征提出了一种新的排序模型,它不同于面向Web的XML网页的搜索结果的排序。设计了满足这种排序模型的倒排列表索引结构和搜索引擎的体系结构。
- 江腾蛟万常选
- 关键词:XML关键词检索
- 基于语义约束LDA的商品特征和情感词提取被引量:54
- 2017年
- 随着网络购物的发展,Web上产生了大量的商品评论文本数据,其中蕴含着丰富的评价知识.如何从这些海量评论文本中有效地提取商品特征和情感词,进而获取特征级别的情感倾向,是进行商品评论细粒度情感分析的关键.根据中文商品评论文本的特点,从句法分析、词义理解和语境相关等多角度获取词语间的语义关系,然后将其作为约束知识嵌入到主题模型,提出语义关系约束的主题模型SRC-LDA(semantic relation constrained LDA),用来实现语义指导下LDA的细粒度主题词提取.由于SRC-LDA改善了标准LDA对于主题词的语义理解和识别能力,从而提高了相同主题下主题词分配的关联度和不同主题下主题词分配的区分度,可以更多地发现细粒度特征词、情感词及其之间的语义关联性.实验结果表明,SRC-LDA对于细粒度特征和情感词的发现和提取具有较好的效果.
- 彭云万常选江腾蛟刘德喜刘喜平廖国琼
- 关键词:LDA模型语义约束