王丙坤
- 作品数:4 被引量:17H指数:3
- 供职机构:清华大学信息科学技术学院电子工程系更多>>
- 发文基金:国家高技术研究发展计划清华大学自主科研计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于VoIP隐蔽通信的关键技术及原型系统
- 黄永峰周可张思发袁键李星李春花王桦王丙坤陶怀舟
- 课题来源与背景:信息隐藏技术中,流媒体载体具有海量、实时、动态特性,相比传统载体更适合即时隐蔽通信,具有国家安全和商业价值.但是之前的相关技术研究未能摆脱静态载体的思路的束缚.该课题试图从新的角度进行系统研究与应用开发....
- 关键词:
- 基于文本和社交语境的微博数据情感分类被引量:7
- 2014年
- 微博数据的情感分析具有重要的应用价值和研究价值,是网络文本挖掘领域的研究热点。微博消息非常短而且稀疏,同时包含大量的不规则词语,噪声很强,给传统的情感分析方法带来了很大的挑战。受社会科学的相关理论的启发,该文尝试利用微博消息的社交语境来帮助解决情感分析所面临的稀疏性强和噪声大的困难。由于文本向量的维度很高,而具有情感倾向的词只占其中较少的一部分,因此将Lasso方法加进LR(logistic regression)模型中以提高模型的鲁棒性。在真实的英文Twitter数据集上的实验结果表明,加入社交语境和模型的稀疏约束能够有效提高微博数据情感分类的准确率。
- 吴方照王丙坤黄永峰
- 关键词:情感分类凸优化
- 网络新词识别算法研究被引量:6
- 2013年
- 针对社交网络新词识别过程中"旧词新义"所引起的语义模糊问题,提出了网络新词识别算法。通过检测词语频度变化、共现词语分布一致性、情感倾向性迁移三项指标综合分析判断网络新词产生变化的规律特点,从而设计一种网络新词识别算法。最后以实验验证了该算法对提高现有系统网络新词识别准确率的可行性和有效性。
- 刘哲黄永峰罗芳陈跻王丙坤
- 关键词:社交网络新词识别准确率
- 基于多粒度计算和多准则融合的情感分类被引量:5
- 2015年
- 随着在线用户生成内容的激增,无监督情感分类方法有着广泛应用前景。现有基于情感词的无监督情感分类方法没有考虑句子类型和句间关系对情感分类的影响,分类效果较差;基于自学习的无监督情感分类方法在生成伪标注数据集时,又会引入较多错误。针对上述问题,该文提出了一种基于多粒度计算和多准则融合的无监督情感分类方法。该方法通过多粒度计算,提高现有基于情感词的无监督情感分类精度;同时通过多准则融合来减少伪标注数据错误率。在3个真实中文数据集上的实验结果表明:与现有无监督情感分类方法相比,该方法平均提高了6.5%的分类精度。
- 王丙坤黄永峰李星
- 关键词:情感分类