搜索到2226篇“ LDA模型“的相关文章
基于LDA模型的ChatGPT文献计量分析
2024年
阐述依据某数据库提供的710条文献数据,使用隐性狄利克雷分布机器学习算法,以文献摘要文本为数据集挖掘主题,归纳3个当前ChatGPT相关的热点研究方向。对每个主题进行分析解读后,提出完善人工智能治理体系,规范使用人工智能技术和摆正ChatGPT的知识生产角色的建议。
胡乐天姜娟潘伊芸杨欣晨
关键词:智能技术LDA模型文本挖掘
基于LDA模型的文本时间窗口划分研究被引量:1
2024年
[目的/意义]鉴于静态主题模型难以满足用户动态分析需求,为解决现有动态主题模型存在计算成本高或者受主观因素影响深等问题,从时间窗口相似度出发,以LDA模型为基础,提出一种文本时间窗口划分算法。[方法/过程]构建集时间窗口间差异性和时间窗口内一致性于一体的时间窗口相似度指标,基于该指标构建文本时间窗口划分算法,并以创新研究领域为例开展实证研究。[结果/结论]综合每一个时间窗口内最优主题个数下主题之间的平均JS散度和相邻时间窗口间不同主题之间的平均JS散度两个指标结果来看,使用本文提出的算法得出的划分结果明显优于多种固定时间窗口长度划分的结果,验证了本研究提出的文本时间窗口划分算法的有效性。该算法在一定程度上解决了现有动态主题模型计算成本高、主观性强等缺点,增加了文本时间窗口划分结果的客观性与准确性,可以为主题演化等相关研究提供技术支持。
龙艺璇王晓刚周子威王荣笙伊惠芳
关键词:LDA模型文本相似度
一种基于词加权LDA模型的恶意文件检测方法
2024年
恶意文件中往往含有出现频率较低、但表征能力更好的特征码,传统的方法未能将这一类特征提取出来。针对该问题,提出一种基于词加权LDA模型的恶意文件检测方法,该方法通过反汇编对样本进行预处理,采用改进的KeyGraph算法(IKG)提取“重点词”,这类词具有更好的特征表征能力,再利用优化的点互信息(OPMI),算出各“重点词”权重,构建词字典,然后将该词加权方法扩展到LDA模型,建立IKG-OPMI-LDA(IOL)模型完成分类,并采用Gibbs Sampling进行参数估计。实验结果表明,相较于其他方法,该方法的分类准确率有明显提高,分类效率更好,并且提取的特征具有更高的区分度,与主题相关度更高。
徐建国王旭阳
关键词:LDA文档分类
改进LDA模型在影视作品推荐中的应用研究
2024年
为了解决影视资源推荐精度问题,引入隐含狄利克雷分布(LDA)完成对影视作品影评数据分析。考虑LDA无法体现各特征词重要性,将注意力机制嵌入网络,提高模型精度。结果显示,在推荐准确率测试中,以MoviesLens-1M数据进行测试,所提出模型准确率为0.936,相对同类推荐技术精度最好。由此可见,所提出推荐模型在系统稳定性、推荐效果上均有出色效果。
申菲
关键词:影视作品LDA
基于LDA模型的国内用户画像研究主题及演化分析
2024年
【目的/意义】旨在发现国内用户画像研究领域的研究主题以及这些主题的发展脉络,为图书馆用户画像的构建提供参考。【方法/过程】运用LDA主题模型对国内用户画像研究论文的题目、摘要和关键词等内容进行文本挖掘,按年度对热点主题进行分析并发现各主题的演化趋势。【结果/结论】国内用户画像研究领域大体可划分为8个研究主题:新媒体营销、电商系统与精准营销、推荐算法与推荐系统、健康信息服务、教育教学、金融服务、社交网络与内容分析、高校图书馆与信息服务。研究主题按年度演化趋势可分为上升主题、平稳主题和衰减主题3类。高校图书馆与信息服务是上升幅度最大的主题,这表明研究人员越来越关注用户画像在图书馆及相关领域的应用研究。
王一博张鹏翼
关键词:图书馆
基于LDA模型的中国大气污染治理政策主题演进分析
2024年
中国的大气污染治理政策自颁布伊始距今已有41年(1979—2019年),以此作为研究背景,将我国大气污染治理政策划分为三个时期。运用困惑度计算各个时期的主题数目,使用R软件构建隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型进行主题标识及关键词强度的计算,研究发现政策内容由单一污染物、污染源主题演变为多污染物、污染源的治理主题;政策工具的主题演变体现了我国大气污染治理的多样化;重要事件驱动了我国大气污染治理政策的演变。
王源翟广宇
关键词:大气污染LDA模型
基于LDA模型和意象图式的产品隐喻设计方法研究
2024年
目的为实现隐喻设计方法的喻体选择和隐喻转译,结合LDA模型和意象图式提出一种新型产品隐喻设计方法。方法应用LDA聚类分析始源域中事件的情绪体验,获取用户在始源域中的主题喻体。基于深度访谈和图式表征分析提取意象图式,并通过AHP评价排序获取重要图式转译因子。将图式因子进行组合表述,联想产品相应功能特征,完成意象喻体到产品主体的转译。结果以减压产品为例进行设计实践,通过LDA聚类获取了感官放松、情感满足、体验良性发展、探索未知、无意识本能、体能释放六大主题与相应模态,以及与主题对应的图示因子,并以可视化桌面蓝牙音箱为设计载体,从视觉、听觉和触觉模态介入,结合图式联想完成了音乐播放、探索互动、自动休眠和情绪释放4个功能隐喻设计。利用加权算法对设计方案进行测试评估,验证了设计方法的合理性。结论从隐喻设计现状出发,探索了基于LDA模型和意象图式的产品隐喻设计方法并加以实践,验证理论与方法的可行性与有效性,为产品隐喻设计乃至其他情感价值类产品的设计研究提供了优质案例与借鉴。
侯士江卫建君孙宇辰鲁莹王佳棋廉博杰
关键词:产品设计LDA模型意象图式
基于LDA模型与政策工具的中国数据主权政策研究被引量:1
2024年
在数字经济发展与总体国家安全观的双重时代背景下,数据主权已成为国家主权的重要组成部分。各主要国家和地区积极开展数据主权战略部署,在数据资源、数据技术和数据规则方面展开激烈竞争与博弈。文章采用政策文本分析方法研究我国数据主权政策,运用LDA(Latent Dirichlet Allocation)主题模型和政策工具量化分析中国数据主权政策的过程演化、主题特征,并综合考虑全球数据主权态势,提出4条政策建议:积极主导和参与国际规则制定;优化数据出境安全评估流程;完善个人信息出境标准合同模版;强化数据安全法治保障。
乔晗徐君如
关键词:数据安全LDA模型
LDA模型下的我国图书馆人才队伍建设与管理主题
2024年
对我国图书馆人才队伍建设与管理领域进行文本挖掘,揭示该领域研究热点主题。选取中国知网(CNKI)相关文献摘要作为研究语料,运用Python的gensim库构建LDA主题模型,进行文本挖掘,利用困惑度和一致性确定最佳主题数量、计算各主题强度。最终确定10个热点主题数量,其中高校图书馆员培养、图书馆建设与阅读推广、公共图书馆服务、多角度合作、用户需求与满意度这五个主题的主题强度较高,揭示了主题演化趋势。
王安莉王建玲张文婷罗海波杨飞龙
关键词:LDA模型主题挖掘图书馆人才队伍建设
基于LDA模型的乡村振兴研究主题挖掘与热度演化分析
2024年
乡村振兴战略是推动农业高质量发展、促进共同富裕的重要保障。精准识别乡村振兴研究的主题与热点,有助于在新发展阶段下面向农村地区开展精细化研究提供基础。以SCI期刊、EI来源期刊、北大核心、CSSCI和CSCD的13184条文献摘要为研究对象,使用词云图和LDA主题建模的方式分析了乡村振兴相关领域的热点主题和变化趋势。结果显示,学者们最为热衷的是乡村振兴战略、路径和乡村体制及农业农村现代化等宏观方向的研究,而组织振兴、人才振兴和农村土地等具体领域的研究有待进一步扩展。
冷奇兵
关键词:主题挖掘LDA模型

相关作者

李湘东
作品数:53被引量:283H指数:9
供职机构:武汉大学信息管理学院
研究主题:文本分类 LDA模型 书目信息 非人灵长类动物 LDA
段红梅
作品数:84被引量:567H指数:14
供职机构:北京中医药大学护理学院
研究主题:儿童 哮喘 共词分析 聚类分析 文献计量学
黄莉
作品数:20被引量:136H指数:8
供职机构:武汉大学动力与机械学院
研究主题:文本分类 LDA模型 书目信息 语料库 数字图书馆
唐晓波
作品数:146被引量:1,400H指数:22
供职机构:武汉大学信息管理学院
研究主题:本体 情感分析 LDA 社会化媒体 知识服务
曹洁
作品数:364被引量:1,050H指数:15
供职机构:兰州理工大学
研究主题:粒子滤波 故障诊断 目标跟踪 明胶生产 调度问题