齐芸芸
- 作品数:3 被引量:10H指数:2
- 供职机构:清华大学信息化技术中心更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 农业垂直搜索引擎信息抽取的研究被引量:4
- 2009年
- 自动文本信息抽取是垂直搜索引擎技术体系的一个研究方向,针对传统的农业垂直搜索引擎信息抽取精度不高的问题,在研究农业网页交易信息数据的特点的基础上,提出一种针对具有时空属性的行业领域信息的表示与抽取模型。该模型利用数据信息、数据时间、数据空间三元集描述定义此类数据,不仅可以表示数据对象的当前状态,而且可以准确地反映数据对象的历史与空间连续状态,据此设计了K-EA算法。实验结果表明,该模型对于具有时间与空间属性特点的数据有很好的召回率与精度。
- 胡亮袁芳齐芸芸
- 关键词:垂直搜索引擎农业信息抽取
- 信息系统“主动式”运维保障工作的研究与实践被引量:5
- 2015年
- 日常业务运转越来越依赖于信息系统的稳定运行,一旦系统出现异常,将影响日常业务的正常运转。为保障信息系统的稳定、高效运行,研究了信息系统"主动式"运维保障工作的主要内容与总体架构,在清华大学信息系统运维保障工作实践中取得了很好的应用效果。
- 李艳霞张倩齐芸芸俞春
- 关键词:信息系统
- 文件搜索引擎数据采集策略的优化被引量:1
- 2009年
- 在研究传统FTP文件搜索引擎的检索时效性问题的基础上,认为数据采集更新策略是提高其检索结果可访问性的关键影响因素,为此提出了一种有针对性的数据采集更新模型。该模型研究了数据采集更新频率与队列排序两个因子对检索时效性的影响,其中更新频率被设计用于解决在怎样尽可能降低服务器负载压力的前提下保证较高的平均有效下载比率的问题,而队列排序用于解决在一次数据采集更新中怎样确定FTP站点队列采集对象顺序的策略优化。实验结果表明,该策略可以有效地提高检索结果的平均有效链接比率。
- 胡亮袁芳齐芸芸
- 关键词:文件传输协议搜索引擎