博弈论综述
展开
博弈论,又称为对策论(Game Theory)、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。
博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
博弈论已经成为经济学的标准分析工具之一。在金融学、证券学、生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论思想古已有之,中国古代的《孙子兵法》等著作就不仅是一部军事著作,而且算是最早的一部博弈论著作。
近代对于博弈论的研究,开始于策梅洛(Zermelo),波莱尔(Borel)及冯·诺依曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统地应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950年~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,莱因哈德·泽尔腾、约翰·海萨尼的研究也对博弈论发展起到推动作用。博弈论已发展成一门较完善的学科。
博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
博弈论已经成为经济学的标准分析工具之一。在金融学、证券学、生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论思想古已有之,中国古代的《孙子兵法》等著作就不仅是一部军事著作,而且算是最早的一部博弈论著作。
近代对于博弈论的研究,开始于策梅洛(Zermelo),波莱尔(Borel)及冯·诺依曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统地应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950年~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,莱因哈德·泽尔腾、约翰·海萨尼的研究也对博弈论发展起到推动作用。博弈论已发展成一门较完善的学科。
话题与分类:
主题股票:
主题概念:
声明:遵守相关法律法规,所发内容承担法律责任,倡导理性交流,远离非法证券活动,共建和谐交流环境!
沙发
我第几
1.局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。
2.策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一局博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。
3.得失:一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。
4.对于博弈参与者来说,存在着一博弈结果 。
5.博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是一稳定的博弈结果。
板凳。。。。。嗨得是牛牛啊
1.局中人:是多人(多主体)博弈。
2.策略:在单一个股,板块,单日之内,是有限博弈。
在一个阶段,在整个市场,是趋向于无限博弈。
3.得失:在(阶段性)截取某段博弈过程时,每个参与方的得失与其当日策略有关,也与全局人的策略总和有关。
4.这种得失结果,不仅仅在账户上,也在心理上,策略上,经验上产生积淀。
5.这种均衡时动态的,任何时点都是一种动态均衡,只是下一时点是新矢量方向的动态均衡。
沙发
嘿嘿~~~来的早,不如来的巧呀~!!!
一般认为,博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解: 囚徒困境 就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。
^^^^^^^^
股市里面,基本上是非合作博弈,俗称市场合力。
(惯于臆想的阴谋论者所津津乐道地坐庄,勾结市值管理等等,仅占事实上很少的比例。)
操作上,基本上是动态博弈。
下棋不可能一步定输赢,因为对手还会继续博弈。
所以策略管理包含了动态评估事态,动态仓位管理。
事态——策略——仓控
尽量不要有毕其功于一役的想法。
牛牛命中注定是炒股人,盘盘都是你坐沙发啊。。。。
沙发
一般认为,博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解: 囚徒困境 就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。
^^^^^^^^
股市里面,基本上是非合作博弈,俗称市场合力。
(惯于臆想的阴谋论者所津津乐道地坐庄,勾结市值管理等等,仅占事实上很少的比例。)
操作上,基本上是动态博弈。
下棋不可能一步定输赢,因为对手还会继续博弈。
所以策略管理包含了动态评估事态,动态仓位管理。
事态——策略——仓控
尽量不要有毕其功于一役的想法。
————
很明显,股市里面,大多数情况下,参与的多方,每个人的认知都不同。
是不完全信息博弈。
当然,由于对市场的理解程度不同,经验积累不同,博弈策略不同,事实上会构成类似围棋段位评级一样的金字塔构架。
这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a,b*) ≤ 偶对(a*,b*) ≥偶对(a*,b)。
对于非零和博弈也有如下定义:一对策略a*(属于策略集A)和策略b*(属于策略集B)称为非零和博弈的均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:对局中人A的偶对(a,b*) ≤偶对(a*,b*);对局中人B的偶对(a*,b)≤偶对(a*,b*)。
有了上述定义,就立即得到纳什定理:
任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。
纳什定理的严格证明要用到不动点理论,不动点理论是经济均衡研究的主要工具。通俗地说,寻找均衡点的存在性等价于找到博弈的不动点。纳什均衡点概念提供了一种非常重要的分析手段,使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。但纳什均衡点定义只局限于任何局中人不想单方面变换策略,而忽视了其他局中人改变策略的可能性,因此,在很多情况下,纳什均衡点的结论缺乏说服力,研究者们形象地称之为“天真可爱的纳什均衡点”。
————
也即,纳什均衡是偏静态的一锤子买卖。
事实上,对阶段内多方博弈而言,是动态的。
预判,反预判,预判对方的预判,都是构成多重博弈的。
在1965年发表《需求减少条件下寡头垄断模型的对策论描述》一文,提出了“子博弈精炼纳什均衡”的概念,又称“子对策完美纳什均衡”。这一研究对纳什均衡进行了第一次改进,选择了更具说服力的均衡点。海萨尼在60年代末把不完全信息引入博弈分析。
将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的,决策者要“随机应变”,“向前看”,而不是固守旧略。
由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。这一点对预测分析是非常有意义的。
用动态博弈理论来讨论实际究竟发生哪个纳什均衡。
给定“历史”,每一个行动选择开始至博弈结束构成了一个博弈,称为“子博弈”。
只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。
这个概念指出,类似于现实生活中手发生颤抖时就抓不住东西,在博弈时也要考虑到合作者可能会发生轻微的失误而影响整个结果。颤抖手均衡就是即使在参与者中有一些极小机会将取某些偏离均衡的行动,但另一些参与者将继续优化其应变策略,最终会发现其他参与者还是按照原来选定的纳什均衡策略。
每个颤抖手完美均衡都是一个次对策均衡,向不同方向颤抖的几率是不同的。参与者手在颤抖的时候,可能偏向左,可也能偏向右,但是当他发现偏向右的损失较大时,必然会更加小心避免向右颤抖,因此向不同方向的颤抖概率就会不同。
(1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。) [2]
假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌疑人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,如果我抵赖,得坐10年监狱,如果我坦白最多才8年;假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。
基于经济学中“理性的经济人”的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判处一年就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局,纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。
送外卖补仓可以行不通了。
所以我准备换个副业,
明年去搞直播了,
青峯,那么欣赏我。
明年来我来直播间刷礼物啊。
还得是牛牛,简直是宝藏女孩
塞尔顿(R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点,从而形成了两个均衡的精炼概念:子博弈完全均衡和颤抖的手完美均衡。
首先,讲了博弈论的理论
其次,讲了博弈论的流派和分支扩展
然后,讲了股市中的博弈是动态博弈,多重博弈
最后,说到大名鼎鼎的纳什均衡
(结合北交所现在的量能,在上贴中明王老师已经说到了,现阶段走到拉锯战即博弈区)
==========================
以下是老师上贴原文摘抄
不动明王楼主2024-01-16 16:23
北交所成交量:
200+ 热带 (多头陷阱)
180+ 亚热带
130-150 常温带
100- 亚寒带
80- 寒带 (空头陷阱)
前面撤退时讲过,北交将进入战壕拉锯战。
常温带为主要拉锯区域。
过180到200,逐步理性控仓,不头铁,多兑现。
低于100到80,逐步理性入场,无惧,勇于抗打。
其实也就解释了,股市里面为什么常常出现多杀多。
两个人在森林里看到一只熊,一个穿起了跑鞋,另一个笑说:你是跑不过熊的。那个说,我跑的过你就行。
下跌趋势中,你不卖,别人卖,造成股价更多下跌,给你带来更多损失。
这种损失,在有跌停板限制的时候,更容易造成心理压力。
因为跌停发生后,已经无法达到想卖的人都能卖出的理想状态。
越接近跌停板,越容易造成对股价的虹吸。
那么,为什么涨停板不是呢?
应该说,不完全是。
因为你不买涨停,事实上只是带来0收益。因为你是博弈的场外方。(有融券平仓要求的除外。)
但你不卖跌停,你是会造成实际上的损失的,因为你是博弈的场内参与者。
这也就是为什么2016年的指数熔断草草收场的根本原因。
按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特
[展开]囚徒困境是纳什均衡的一个经典案例。其实也就解释了,股市里面为什么常常出现多杀多。两个人在森林里看到一只熊,一个穿起了跑鞋,另一个笑说:你是跑不过熊的。那个说,我跑的过你就行。下跌趋势中,你不卖,别人卖
[展开]囚徒困境(1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。) [假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,
[展开]我账号创历史新低了,送外卖补仓可以行不通了。所以我准备换个副业,明年去搞直播了,青峯,那么欣赏我。明年来我来直播间刷礼物啊。
熔断机制于2016年1月1日起开始实施,其推出的背景就是2015年股灾以后,为了进一步促进股市稳定而推出的一种制度。这种制度在发达国家的成熟证券市场早已推出,也十分有效。
熔断机制内容:以沪深300指数为基准,设置5%和7%两档阈值,涨跌均触发。当出发5%熔断阈值时,停盘15分钟,如果当日下午两点四十五以后触发5%阈值,也暂停交易至收市;任何时间触发7%阈值,则暂停交易至收市。
2016年1月1日到3日为元旦假期休市。
1月4日周一开盘,指数开始一路下跌,至中午收盘,沪深300指数下跌4.01%;下午开盘后继续下跌,13点13分触发5%熔断阈值,暂停交易15分钟,13点27分恢复交易,好景不长,到13点34分,只用了8分钟,沪深300指数即触发7%阈值,暂停交易至收市。当天A股遭遇开年黑,大量股票跌停。
我账号创历史新低了,送外卖补仓可以行不通了。所以我准备换个副业,明年去搞直播了,青峯,那么欣赏我。明年来我来直播间刷礼物啊。
当天熔断以后,证监会紧急召开会议讨论熔断机制问题,提出了2种方案,一种是提高熔断阈值至6%和9%,另一种就是暂停熔断机制。最终证监会选择了第二种方案,1月8日起暂停熔断机制。至此,仅仅推出一周的熔断机制就宣告失败,堪称A股历史上最为短命的机制。鉴于市场反应过于剧烈,之后管理层再未提起,估计今后也没人敢提了。
这就是大清库银为什么几十年丢失都没法查清的原因。
道光这个人,是清朝有名的补丁,然而在道光二十二年(1843),因为一纸诉状,开启了朝廷四十多年来从未进行过的国库大盘查,揭开了一件震惊朝野的“库丁偷盗库银案”。
通常国库的银库中的银子以每千两为单位装袋,并摆放得整整齐齐。在进行清查时,一位官员触碰到了一个银袋,发现手感有异,遂打开检查,却发现所谓的“每袋千金”实际上是使用白布裹着木头伪装的!经过仔细清点,发现大部分的银袋都是假的,银库几乎成了“木头库”。这一发现令当时负责调查的官员感到惊讶和恐惧。
虽然户部银库是管库大臣的下属机构,但其主要掌控权实际上由道光亲自选派的“管理户部三库大臣”负责。历任管库大臣中,不乏内阁大学士、军机大臣和宗室贵族等重要人物。他们的地位和权力都不可小觑。
要知道,清朝对国库的监管制度是非常严格的,其中一项措施是委派宰相级别的重臣充任管库大臣,定期稽查户部三库。
为了确保官银的安全,库丁进入银库劳作时必须脱光衣服,裸体进入,出来时还要进行一系列的体检。这种体检的严格程度甚至超过了现代的安检。
尽管防范措施如此严密,但库丁仍然能够偷窃官银,这令办案官员感到非常震惊。经过深入调查,他们发现了库丁偷运白银的一种方法——“谷道运银之路”。所谓的“谷道”,也就是……“肛门”,库丁们通过训练将自己的肛门变成运银的密道。
这些库丁从小就接受父辈的训练,不断刺激肛门,直到能够塞入十两重铁丸十颗为止。然后,他们再配合使用一种名为“松骨药”的药物,一次就能夹带六七锭银子。据说,这些库丁们最满意的江西省上缴的官银,因为江西的白银不仅含银纯度足,而且其银身被打磨得十分的光滑洁净。
这种方式不由得令办案官员瞠目结舌,毕竟按这种方式计算下来,库丁们挣得比清朝官员都多。
清朝中央朝廷的国库,分为两大类,一类是内库,归内务府管理,称为内务府七库,实际上是清朝皇家的私人银库。另一类是外库,归户部管理,称为户部三库,用于全国各种事务的财政支出。户部三大库中的银库,总共有库丁40名,全都是满人或者旗人,一个不在旗的汉人都没有,每个人最多只能干三年,而且人员的选拔由户部的满人尚书亲自主持和面试。
每个库丁三年任满,从银库里偷盗的银子,除了孝敬上级和各种官员,至少还能剩下三四万两之多,而一品大员的年俸才180两。
但是即便再怎么苦练“谷道”神功,偷运的银子也是有限的,一名叫张诚保的库丁玩了把更大的,最后事发彻底暴露了偷盗库银案。
众所周知,清朝有纳捐这种官方承认的“用钱买官”的规则,纳捐由于是官方承认的,所以这些钱,一般直接进入户部的银库,而张诚保这个人就负责银子进银库时的称量工作。
他只需要根据别人报的数字进行登记,而一般人根本不知道自己的银子少了没有。张诚保靠朝廷收纳捐银的机会,一次性往往能弄走四千两之多。三年弄走小十万两户部银库的银子,简直太容易了。
张诚保每次作案,都会给亲朋好友纳捐,最后一次的时候,竟然因为分赃不均而东窗事发,也就是那张告到了道光帝案前的诉状。
道光帝愤怒至极下旨彻查,一查之下发现,户部三个银库,竟然多年时间被人偷盗了925万两官银,直接震惊了清朝的朝野。
户部的账务出了这么大漏洞,道光下令取消三库御史的职位,改为由户部侍郎直接管理三库。此外,他还采取了严厉的惩罚措施,包括对库丁、银匠、栅栏库丁和银库皂隶等人实施极刑,无论他们在库内还是库外;其家人则被视为奴隶或被流放。
道光帝要求对历任国库管理人员和查库官员进行审查和追究,以期减少国库损失。根据官员在任时长差异,国库担任的不同职位的官员与检查国库官员每月赔偿一定数量的银钱。已经去世的官员相应的赔偿减半,并由子孙继续赔偿。
尽管道光的追赔制度在一定程度上减少了国库的损失,但这种做法也无疑会误杀或误判许多无辜的人。对于防止腐败问题,应该采取综合措施,包括完善制度、加强监督、提高公众参与度等方面,才能从根本上解决这个问题。
人傻,钱多,牛来,速归。
一、经济学中的“智猪博弈”(Pigs’payoffs) ,这个例子讲的是:
假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若小猪先到槽边,大小猪吃到食物的收益比是6∶4;同时到槽边,大小猪收益比是7∶3;大猪先到槽边,大小猪收益比是9∶1。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。
智猪博弈 由纳什于1950年提出。实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪选择等待的话,小猪可得到4个单位的纯收益,而小猪行动的话,则仅仅可以获得大猪吃剩的1个单位的纯收益,所以等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。
用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择:
从矩阵中可以看出,当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。
在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为。
高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。