清华大学软件学院信息系统与工程研究所
- 作品数:45 被引量:58H指数:4
- 相关作者:亓伟周文胜戴锋赵博陈刚更多>>
- 发文基金:国家重点基础研究发展计划国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术交通运输工程更多>>
- 基于主题模型的微博重要话题发现与排序方法被引量:12
- 2013年
- 近年来,以Twitter和新浪微博为代表的微博客正在世界范围内流行起来.根据微博的特点,提出一种与特定主题(比如某种产品)相关的话题发现和排序的新方法.首先,在互联网上收集并格式化出现了感兴趣的词的微博.对于这些微博中的所有词汇,综合考虑影响力、突发性和相关性3个要素对其重要性进行评估.其次,对词的重要性做出估量后,以含有同一关键词的微博的集合为输入文档训练LDA模型.然后通过对主题关键词的概率分布的推导,实现词的聚类和主题的挖掘.这一方法可以克服微博的长度限制所带来的数据稀缺性问题.最后,通过真实数据集上的实验表明了该方法的有效性.
- 姜晓伟王建民丁贵广
- 关键词:主题发现LDA主题模型文本挖掘
- 基于PostgreSQL的执行计划缓存研究与实现
- 1引言执行计划缓存的主要功能避免相同查询的重复优化。当前的三大主流商业数据库中都支持执行计划共享。SQL Server将SQL或T-SQL执行计划保存到过程缓存中。Oracle将查询执行计划保存到库缓存中,通过V$LIB...
- 罗昌明王朝坤王建民
- 关键词:CACHE
- 文献传递
- PostgreSQL缓冲区自适应管理研究
- 数据缓冲区运行状况是数据库系统性能的关键所在.自适应管理技术,尤其是数据缓冲区的自适应管理研究,已经成为数据管理领域的一项重要内容.本文在PostgreSQL数据缓冲区中实现了自适应管理策略,通过自适应替换算法CART的...
- 戴锋王朝坤王建民
- 关键词:数据缓冲区数据库系统自适应管理POSTGRESQL
- 文献传递
- 面向PLM的CSCW系统框架设计
- 本文首先介绍的产品全生命周期和计算机支持的协同工作的背景知识,在此基础上提出了CSCW系统的协同工作如何看做支持PLM各个阶段工作的问题,针对此问题,本文根据CSCW系统特征和PLM的各阶段任务,设计了“面向PLM的CS...
- 聂荣显丁贵广张力
- 关键词:PLMCSCW虚拟技术全生命周期管理计算机支持协同工作
- 文献传递
- 数据库运行安全审查模型
- 库管理系统(DBMS)作为信息系统核心,在我国即将开展的信息系统安全审查中将起到至关重要的作用.按照安全生命周期概念,本文提出了一个包括数据库运行环境、数据库安全配置、数据库通信和数据库应用合规性分析等不同维度的数据库运...
- 王宇叶晓俊
- 关键词:数据库管理系统运行环境安全审查可靠性分析
- 基于Web2.0的数字音乐图书馆被引量:1
- 2009年
- 针对现有数字音乐图书馆系统在音乐展现方面的不足,设计一个基于Web2.0技术的数字音乐图书馆体系结构,能有效支持音乐内容数据和特征数据的交互式学习。实现一个基于上述体系结构的数字音乐图书馆原型系统MusicSpirit,通过应用Ajax和Web2.0技术基于内容地展现音乐数据。实验结果表明该系统能有效提高数字音乐素质教育的效率。
- 赵大朋王朝坤郑伟刘冰洋王建民
- 关键词:WEB
- 基于PostgreSQL的执行计划缓存研究与实现
- 执行计划缓存的主要功能避免相同查询的重复优化.当前的三大主流商业数据库中都支持执行计划共享.SQL Server将SQL或T-SQL执行计划保存到过程缓存中.Oracle将查询执行计划保存到库缓存中,通过V$LIBRAR...
- 罗昌明王朝坤王建民
- 关键词:POSTGRESQL字符串匹配
- 文献传递
- DBMS性能评价指标体系
- 作为评价基础软件产品性能的评价指标体系必须考虑用户在各种使用环境下的性能表现.依据课题组在“十五”期间承担的国家“八六三”国产数据库性能对比测试实践,讨论了新一代国产数据库产品性能评价指标体系应该考虑的应用场景和围绕GB...
- 叶晓俊王建民
- 关键词:数据库管理系统
- 文献传递
- 基于阶段事件驱动架构的TPC-C测试工具实现
- 介绍了一种基于SEDA的TPC-C性能测试工具实现,分析了这种设计方法与传统多线程模型设计的优缺点,并给出了实验结果和结果分析.
- 余廷扬覃飙王建民
- 关键词:TPC-C测试工具
- 基于模式匹配的数据库入侵检测技术
- 通过机器学习等方法发现数据库系统用户的合法行为模式,并据此对用户提交的数据库请求实时进行检测是一种主动的深度防御机制。依据结构化查询语言(SQL)的语法结构和语义特性,设计了适用于组合攻击检测的SQL语句模型,并依据SQ...
- Chen Dan陈旦Yang Fei杨非Ye Xiaojun叶晓俊
- 关键词:数据库入侵检测系统优化设计