
【C117】基于大语言模型的博弈合作行为复现实验
经济学
机器学习与深度学习
Python
本项目参考论文 Large Language Models Replicate and Predict Human Cooperation Across Experiments in Game Theory,尝试复现大语言模型在博弈实验中的合作行为表现。项目的核心问题是:在给定不同收益矩阵的情况下,大语言模型是否会产生接近人类或理论基准的合作选择。
项目围绕经典双人博弈场景展开,包括和谐博弈、雪堆博弈、猎鹿博弈和囚徒困境等类型。代码通过设置诱惑收益 T、受骗收益 S、合作奖励 R 和背叛惩罚 P,构造不同博弈参数组合,并让大语言模型在每个参数点上输出合作或背叛选择。
项目提供了 Streamlit 可视化界面,支持设置模型接口、模型名称、温度参数、收益矩阵范围、重复实验次数和解析失败重试次数。结果部分计算 LLM 合作率、Nash 合作率、与 Nash 基准之间的 MSE 和 Pearson 相关系数,并通过热力图展示不同博弈参数下的合作行为差异。
运行方式:
streamlit run app.py