钱铁云
- 作品数:37 被引量:230H指数:10
- 供职机构:武汉大学计算机学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金国家科技部专项基金更多>>
- 相关领域:自动化与计算机技术文化科学建筑科学社会学更多>>
- 基于CNN和LSTM深度网络的伪装用户入侵检测被引量:20
- 2018年
- 用户伪装入侵检测技术作为一种主动式安全防护技术已成为当前的研究热点。现有的用户伪装入侵检测技术存在难以准确建模用户行为模式的缺陷。利用卷积神经网络(convolution neural network,CNN)处理局部关联性数据和特征提取的优势,以及长短期记忆(long short-term memory,LSTM)神经网络捕获数据时序性和长程依赖性的优势,设计了一种结合卷积和长短期记忆的深度神经网络(CCNN-LSTM)用于伪装入侵检测。该方法具有较强的学习能力,能自动学习数据的表征而无需人工提取复杂特征,在面对复杂高维的海量数据时具有较强的潜力。实验结果表明,该方法具有更高的检测率及更低的检测代价,其性能胜过多个基线系统。
- 王毅冯小年钱铁云朱辉周静
- 利用prefix-hash-tree实现从中文文本到事务数据的转换
- 2005年
- 电子文档的飞速增长为自动文本分类提供了巨大的机遇和挑战。在现有的众多方法中,关联分类以其较高的准确率和较快的训练时间而成为一种重要的自动文本分类方法。为实现基于关联的文本分类,首先需要将无结构的文本转换为结构化的事务数据,本文提出的prefix-hash-tree是针对汉语的特殊性而设计的一种数据结构,利用它可以方便地将中文文本转化为事务数据,实验证明利用该数据结构相应的查找、插入和重构算法都具有较好的效率。
- 钱铁云王元珍冯小年
- 关键词:中文文本HASH事务自动文本分类文本转换
- 基于多层卷积神经网络的金融事件联合抽取方法被引量:15
- 2021年
- [目的/意义]为进一步提升金融领域事件抽取的效果,增强事件抽取两个子任务之间的关联性。[方法/过程]在中文金融文本上进行事件抽取相关研究,提出一种融合预训练模型与多层卷积神经网络的金融事件联合抽取方法,首先通过预训练模型BERT捕捉句子序列的综合语义信息,然后接入本文设计的多层卷积架构MultiCNN,分层提取局部窗口和高维空间语义信息,同时实现事件识别和要素抽取这两个任务,再通过引入对比损失,进一步强化两个任务之间的关联。[结果/结论]在中文金融事件数据集上F;达到82.20%,比各个基准抽取模型均有一定提升。
- 李旭晖李旭晖唐小雅于滔陈壮钱铁云
- 关键词:卷积神经网络
- 结合类频率的关联中文文本分类被引量:17
- 2004年
- 该文提出一种词类频率和关联中文文本分类相结合的算法ARCTC。此算法将文档视作事务 ,关键词视作项 ,并针对文本事务的特性 ,提出利用词的类频率筛选与分类相关性不大的词汇 ,然后将改进的关联规则挖掘算法用于挖掘项和类别间的相关关系。挖掘出的规则用于形成类别特征词的集合 ,可用来和类标号未知文档的词的集合求交集 ,交集元素个数最多者即为所分类别。实验证明 ,该算法在提高训练时间和测试时间的同时具有较好的召回率、准确率和F Measure。
- 钱铁云王元珍冯小年
- 关键词:计算机应用中文信息处理中文文本分类
- 基于量化情感的网店垃圾评论检测被引量:7
- 2013年
- 提出量化情感的概念(评论中的情感值),从用户评论的自然语言文本中得到用户表达的情感值。为了计算评论的量化情感,对评论中的情感词的依存关系进行了研究。给出了情感句的量化情感算法。对量化情感与垃圾评论的关系进行分析,通过直观观察,确定了一系列判别方法。最后本文以量化情感值为指标,建立时间序列对网店的评论进行分析,有效地检测了垃圾评论。实验结果证明在检测网店垃圾评论工作中,所提出的方法有良好的检测结果,优于已有的方法。
- 彭庆喜钱铁云
- 面向科技主题发展分段的社区核心圈技术
- 现有的主题发展分析主要集中在总体趋势的识别上,不能回答"该领域目前处于什么发展状态?"等问题。本文提出一种新的研究任务,旨在考察科技主题所处的发展状态。为完成此任务,在利用网络社区建模主题的基础上,提出一种基于社区核心圈...
- 钱铁云李青许承瑜
- 关键词:社会网络分析网络社区
- 文献传递
- 中国现代远距离教育的现状与我校发展设计的探讨
- 1999年
- 随着现代远距离教育技术的发展,传统的函授教育手段已越来越不能适应教育的需要,为了更好地了解国内远距离教育的现状,为我校的发展求证明确导向,学校组团专程赴京学习考察,先后参观了北京师范大学、清华大学电教中心及继续教育学院、北医大、北京大学和北邮大,我们这次北京之行的收获具体体现在两个方面。
- 钱铁云
- 关键词:远程教育系统现代远距离教育电话线远程教育网校园网
- 简洁实用的加密(解密)程序
- 1996年
- 钱铁云
- 关键词:加密程序应用程序
- 人工智能是否可以超越人类智能?——计算机和人脑、算法和思维的关系被引量:24
- 2004年
- 计算机硬件的发展使得在将来有一天完全可以造出在计算能力上和人类大脑一样快速的计算机 ,但是这是否意味着人工智能的发展终于将赶上并超过人类智能的发展呢 ?本文认为答案是否定的 ,其原因在于作为计算表现形式的算法不可能实现思维。文章从计算的基本理论、数理逻辑及思维科学的角度出发 ,在以下两个方面论述了算法对比于思维的局限性 :思维之非言语性、形式系统之不完全性 ,并在最后指出只有在逻辑思维领域的某些问题上计算机能够超过人类 ,但在总体上 ,计算机永远无法摆脱作为人类工具的命运。
- 钱铁云
- 关键词:人工智能人类智能思维
- 基于预训练语言模型的古籍文本智能补全研究
- 2024年
- 【目的】为古籍补全任务提供一种基于预训练语言模型的新方法,利用不同语义层次和简繁体预训练语言模型获得的表示,构建混合专家系统和简繁融合模型实现古籍补全。【方法】针对传世文献和出土文献分别设计基于混合专家系统的模型和简繁融合模型,在不同场景下充分融合与挖掘模型能力,进一步提升模型古籍补全的能力。【结果】使用自行构建的传世文献数据集以及出土文献数据集,补全任务的准确率分别达到70.14%和57.13%。【局限】只从自然语言处理角度出发,未来可以利用多模态技术,计算机视觉与自然语言处理相结合,整合图像信息和语义信息两个维度,可能会有更好的效果。【结论】在构建的传世文献和出土文献数据集上进行验证,达到较高的准确率,为古籍补全任务提供了一种具有竞争力的解决思路。
- 李嘉俊明灿郭志浩钱铁云彭智勇彭智勇王晓光李旭晖
- 关键词:古籍数字化混合专家系统