搜索到260 篇“ 不完美信息 “的相关文章
并行化不 完美 信息 博弈策略生成方法、装置、电子设备以及存储介质 本申请属于机器学习技术领域,具体而言,涉及一种并行化不 完美 信息 博弈策略生成方法、装置、电子设备以及存储介质。该方法包括:利用非完全回忆聚类方法,对不 完美 信息 博弈的原始特征空间进行压缩,得到抽象特征空间;利用MCCFR最小... 刘启涵 杨君 梁斌 芦维宁 陈章基于深度强化学习的不 完美 信息 群智夺旗博弈 被引量:2 2023年 复杂环境中群智博弈问题是近年来的研究热点之一.为解决不 完美 信息 条件下多智能体夺旗博弈问题,本文提出了一种基于多智能体双重决斗深度Q网络(multi-agent dueling double deep Q-network,MAD3QN)以及图注意力网络(graph attention network,GAT)的多智能体夺旗博弈深度强化学习算法(G-MAD3QN).该算法在实现多智能体在迷宫地图中路径规划的同时,建模不 完美 信息 条件下多智能体合作与竞争关系,从而确定夺旗博弈策略.在实验中,本文基于二维迷宫环境,考虑智能体观测信息 不 完美 条件,将G-MAD3QN算法与多智能体深度Q网络(multi-agent deep Q-network,MADQN)、MAD3QN等多智能体深度强化学习的基线算法进行对比,从而验证了在二对二夺旗博弈中本文G-MAD3QN算法的有效性. 王健瑞 黄家豪 唐漾关键词:不完美信息 计算机博弈中序贯不 完美 信息 博弈求解研究进展 被引量:3 2023年 计算机博弈是人工智能的果蝇和通用测试基准.近年来,序贯不 完美 信息 博弈求解一直是计算机博弈研究领域的前沿课题.围绕计算机博弈中不 完美 信息 博弈求解问题展开综述分析.首先,梳理计算机博弈领域标志性突破的里程碑事件,简要介绍4类新评估基准,归纳3种研究范式,提出序贯不 完美 信息 博弈求解研究框架;然后,着重对序贯不 完美 信息 博弈的博弈模型和解概念进行调研,从博弈构建、子博弈和元博弈、解概念以及评估3方面进行简要介绍;接着,围绕离线策略求解,系统梳理算法博弈论、优化理论和博弈学习3大类方法,围绕在线策略求解,系统梳理对手近似式学习、对手判别式适变和对手生成式搜索3大类方法;最后,从环境、智能体(对手)和策略求解3个角度分析面临的挑战,从博弈动力学和策略空间理论、多模态对抗博弈和序贯建模、通用策略学习和离线预训练、对手建模(剥削)和反剥削、临机组队和零样本协调5方面展望未来研究前沿课题.对于当前不 完美 信息 博弈求解问题进行全面概述,期望能够为人工智能和博弈论领域相关研究带来启发. 罗俊仁 张万鹏 苏炯铭 魏婷婷 陈璟关键词:计算机博弈 对手建模 并行化不 完美 信息 博弈策略生成方法、装置、电子设备以及存储介质 本申请属于机器学习技术领域,具体而言,涉及一种并行化不 完美 信息 博弈策略生成方法、装置、电子设备以及存储介质。该方法包括:利用非完全回忆聚类方法,对不 完美 信息 博弈的原始特征空间进行压缩,得到抽象特征空间;利用MCCFR最小... 刘启涵 杨君 梁斌 芦维宁 陈章文献传递 网络外部性、同伴效应与从众行为——基于不 完美 信息 贝叶斯模型的实证研究 被引量:10 2020年 数字经济是我国未来发展的重要方向,同伴效应在数字经济发展中起到了非常重要的驱动作用。利用2019年“双十一”网络消费调查数据,基于不 完美 信息 贝叶斯决策模型的理论与实证研究表明,同伴效应会对消费者从众行为产生显著的影响,并且这种影响会随着同伴数量的增加而以递减速度增加。进一步数据分析显示,由于网络信息 外部性和支付外部性,参与“双十一”活动的同伴数量每增加一位,平均而言会使得消费者参加“双十一”活动的概率提高约8%以上。在使用工具变量法和倾向指数匹配分析处理之后,该结果仍然显著成立。这说明,数字经济的发展存在一定程度的非理性繁荣,要维持数字经济健康持续稳定发展,还需要从政府政策、企业管理和个人决策等方面分别做出优化提升。 习明明关键词:从众行为 贝叶斯模型 网络外部性 基于不 完美 信息 动态博弈的企业风险处置研究--以S省为例 被引量:2 2020年 随着我国经济下行压力加大、产业转型升级加速,企业风险暴露与处置成为当前维护金融稳定面临的一项重要任务。通过构建基于不 完美 信息 下的三方动态博弈模型,总结了银企双方博弈和银政企三方博弈下的六种情况。随后,按照整体债务重组、分拆债务重组、整体破产重整、分拆破产重整、破产清算等五种处置模式筛选出S省5家典型企业,运用博弈模型对其进行了详尽分析。结果显示,企业积极配合是银企博弈达到最优解的基本前提,银行合理救助是银企博弈达到最优解的重要保障,政府及时介入是化解银企博弈困境的最终屏障,应从企业、银行、政府三个维度提高企业风险处置效率。 孙毅关键词:动态博弈 政府决策 不 完美 信息 博弈中对手模型的研究被引量:2 2019年 针对传统的显式建模方法依赖大量数据样本的问题,提出了策略自扩展算法,通过样本数据的自扩展来提高建模效率。同时,为了提高对手模型的准确度,结合隐式建模和隐式子策略建模的方法,提出了子策略发现算法。以勒杜克(Leduc)扑克博弈为实验对象,对比研究了2种传统方法和本文提出的2种算法。实验结果表明:策略自扩展算法提高了显式建模的效率和模型准确性。在利用对手弱点获取收益方面,策略自扩展算法比显式建模方法提升了84. 4%,子策略发现算法比隐式建模方法提升了128. 6%。 吴天栋 石英大学生消费信贷市场的完全但不 完美 信息 动态博弈分析 被引量:1 2019年 近年来,大学生消费信贷市场在以互联网为依托的大背景之下迅速发展,但大学生这个特殊的群体有其特殊性,正是其自身的特殊性使得大学生消费信贷市场风险陡然增加,本文将从大学消费信贷市场对大学生消费信贷市场的完全但不 完美 信息 动态博弈进行分析。分析表明,大学生消费信贷市场缺乏有效的约束机制。 李根不 完美 信息 动态博弈下的中小企业融资问题研究2019年 自改革开放以来,我国市场经济体制的改革也在不 断的深入与发展,在经济态势大好的环境下,中小型企业也得到了更多的发展空间,逐渐成为国民经济的中流砥柱。但由于市场上存在诸多不 定性因素,中小企业无法一直处于高速成长的状态。本文针对中小型企业融资难融资贵这一问题,建立不 完美 信息 动态博弈模型,分析我国中小企业融资贷款成本以及相应的收益,寻求最优博弈策略,并就分析结果提出缓解我国融资难融资贵问题的相关建议。 罗岚 刘璐璐关键词:信息非对称 动态博弈 企业融资策略 不 完美 信息 计算机博弈的研究与应用 随着计算机科学的高速发展,人工智能技术日益成为学者们的研究焦点。作为检验人工智能发展水平的重要平台,计算机博弈也得到了长足的发展。目前,很多完美 信息 博弈问题已经得到了解决,而不 完美 信息 博弈也在解决完美 信息 博弈问题过程中慢... 郑建弟关键词:人工智能 计算机博弈 投票机制 文献传递
相关作者
高阳 作品数:211 被引量:1,325 H指数:19 供职机构:南京大学 研究主题:人工智能 HADOOP 多AGENT系统 海量数据 神经网络 陈章 作品数:60 被引量:1 H指数:1 供职机构:清华大学 研究主题:电子设备 存储介质 多智能体 单轨 智能体 赖玥 作品数:34 被引量:68 H指数:3 供职机构:广西科技大学 研究主题:财政分权 面板数据 博弈模型 药品市场 乡村 郑炯 作品数:2 被引量:0 H指数:0 供职机构:吉林大学 研究主题:不完美信息 动态博弈 悖论 审计过程 上市公司会计 梁斌 作品数:480 被引量:1,293 H指数:20 供职机构:清华大学 研究主题:空间机器人 机械臂 关节 机器人 非合作目标