MS. MACHIAVELLI和稳定匹配问题

MS.  MACHIAVELLI和稳定匹配问题

 

                加州大学伯克利分校数学系    DAVID GALE

                巴西Pontificia Universidade Catolica do Rio de Janeiro 数学系

 

    这篇论文是上一篇Dubins 和 Freedman 在1981写的论文 “Machiavelli 和 Gale-Shapley 算法” 的续。接着,那个论文是1962年Gale和Shapley写的“大学的录取和婚姻的稳定性”的续。为了可能错过先前论文的读者的利益, 在下列节我们给出简短的复述。

  1. 故事到目前为止:上面列出的参考书目2是和存在双方的集合的情况相关的,例如学生和学校,工人和老板,女人和男人。为了能使其更具体一些,我们将用最后一组女人和男人的方式描述这个问题。我们假设每个男人和女人都准备一个列表,列表包括了那些他们可以接受作为婚姻对象的异性的名字,并且这些名字按照喜好程度来排序。这个列表被送到媒人那儿。如果我们考虑一个不匹配的人和他或她匹配,那么这个匹配唯一需要的就是稳定了;那就是说,那儿不应该有任何的那些没有互相匹配但是却认为互相作为配偶是最好的男人和女人。这个匹配就是离婚证据。书目2的主要结果就是一个展示对任何男人和女人的集合M与W和任何偏爱模式的存在性定理,那儿通常至少一个稳定的匹配。证明是有建设性的,给出了一个找到理想匹配的算法。

既然我们知道了稳定匹配的存在,这是一个有建设性的更加简单的问题,也就是要证明稳定匹配的集合在下列意义上形成了一个格:如果u 和u’是匹配的,我们就可以写uu’如果一个男人喜欢u里面的配偶至少像喜欢u’的一样。我们将会发现这个稳定匹配的偏续是一个格就像我们马上说明的一样。更进一步的,我们并不难知道如果uu’,那么u’u,意味着如果所有男人相比于u’更喜欢u,那么所有的女人比起u更喜欢u’(这个是J.H.Conway发现的并且包含在书目4中)。作为一个推论,既然一个有限格又一个最大的和最小的元素,接着就有在所有的匹配中有一个是所有的男人最喜欢的,另外一个是所有的女人最喜欢的。这些就被称作M(W)-优化匹配。书目2所给出的算法经常可到达这个极端的匹配。

大约20年后,Dubins 和Freedman考虑下面的问题:假设我们已经知道那个媒人将采纳M-优化稳定匹配,而且一些参加这对其他人的偏好有充分的了解。是不是总有可能对一个个体或者一群个体通过改变偏好列表来得到更好的配偶。在书目1中我们可以看到有这种情况妇女可以通过改变偏好做得更好。另一方面,主要结果证实没有一个男人或者一组男人永远可以通过改变他们的真实偏好而变得更好。结论就是:在男人方面MACHIAVELLIAN行为是没有好处的,他们不能比列出他们的真实偏好做得更好,而不管女人怎么做。这篇论文的目的就是对女人的策略可能性给出一个具体的分析。将会证实几乎在所有情况下期待女人变成MACHIAVELLIAN型的是有好处的,在一些很好的假设下,我们将描述他们最有竞争力的行为。

2.一些历史。当然,上面描述的关于婚姻的一些东西几乎是不现实的,但是,在现实情况下,也有很多真实的匹配问题经常出现。把学生录取到大学的问题(正是他推动了这个讨论)就是个例子。这里的困难就是,有很多复杂的因素例如各种各样的经济赞助的可能性,这种情况也会经常出现的。然而,书目2中至少一种情况不仅可以被运用而且已经被运用30年了。“国家人力资源分配工程(NRMP)”在Evanston Illinois的总部每年都有任务把全国医学院的硕士生分配到需要人的医院的项目中去。将会发现NRMP中使用的过程正是书目2中描写的那样,唯一的区别就是这个过程对于医院来说是优化的,而书目2中所描述的过程是对学生是优化的。Dubins ----Freedman定理说明了如果过程是对学生优化的,那么如果学生列出他们真实感兴趣的医院,他们将做的最好。在NRMP系统下,另一方面,这里的结果显示,一般的话有一些同学可以通过改变他们的偏好度而进到更好的医院。

我们应该看到,学生-大学问题比婚配问题更匹配。而且,大学问题不象婚配问题是一对一的,并且大学准许任何数量的学生达到固定的配额q。许多婚配问题的本质可以归结为一夫多妻制的问题,包括我们将要描述的。然而,并不是所有的结果归结为更普通的情况,特别的Roth最近举了一个例子甚至当大学最有匹配就像NRMP被使用的时候,如果把偏好调整一下可以得到一个更好的班级也是可能的。

我们现在回到我们的主题。

  1. 预备。在这一章节中,我们现实俩个以后将药用的并且很有趣的两个命题。这些是[3]一些结果中的特殊的情况。第一个非常出乎意料,回忆在一般情况下,那可能有许多静态匹配对于给出一个男人和女人的集合,我们的结论有,然而,那些没有匹配的人获我们可以说自匹配是相同的,对于这些所有的匹配,这点更明显在学生-医院情况的上下文中。假如SNMP改变政策,使学生优化并不是医院优化,当然了,这将是所有的学生的情况至少有原来那么好,但是那些没有被人和医院接受的学生仍然没有被接受。从另一方面说,医院只招收相同数量的学生。尽管这些学生在学生优化和医院优化中是不同的。这个不很明显的结论很容易说明了。我们的第二个命题,相比之下,更加有希望了。它说明如果额外的女人加进这个集合,这对任何一个男人不会造成坏的影响,这个证明就不那么直接了。

    我们需要一些术语。一个偏好形式(M,W,P)将有一个三元组组成,这个三元组中,M和W代表男人和女人,P代表他们的偏好。那就是说这个有序的序列包含的元素再MW中。因为我们的习惯,一个为匹配的人考虑是一个自匹配的。我们可以定义一个匹配u作为俩个MW到自己的两阶双射。那就是,uu是单位映射,并且如果m和w不是自映射的,那么u(m)W,u(w)M。我们称u(m)(u(w))是u下m(w)的配偶。我们称(m,w)组成一个匹配u,如果m比起u(m)更喜欢w并且w比起u(w)更喜欢m.。匹配u是稳定的,如果他没有被任何块组成。如果u 和u’是匹配,我们说m(w)更偏好u’比起u如果他(她)更偏好u’(m)比起u(m)(u’(w)比起u(w))。我们就可以这样说uu’如果每个男人在u下至少根u’下一样好。下面是一个关键的结论。

LEMMA 1.   假设WW’并且u是一个稳定的匹配对于(M,W;P)和(M,W’;P’),P’和P在W上是一致的。令是那些比起u’更喜欢u的男人,是那些比起u更喜欢u’的女人。那么u和u’是在 和之间的双射。

     这是一种分解引理,它可以用下面的图表表示。

     它将足够可以说明u()并且因为和是有限的并且u和u’是单射的,同样他们必须是满射的。因为m在中我们知道u(m)m对于m相比于u’(m)更偏好u(m);所以令w=u(m)。那么并且。因为如果没有(w,m)阻止u’的话,w比起m更偏好u’(w),所以。对称的有。

    我们的第一个结论是一个这个引理的结果。

    PROPOSITION 1.  如果u和u’是(M,W)稳定的匹配,那么那些自匹配的人对于双方来说是相同的。

    假设u’(m)=m但是u(m)=w。那么,但是引理只对W=W’,情况下成立,与u’(m)=m是矛盾的。

    LEMMA2.  u和u’像LEMMA1中定义的一样并且定义u’’和u在上是一致的,u’定义在。那么u’’对于(M,W’)是稳定的。

    假如w对于u’’(w)来说更偏好于m,显然的u’’定义在或者上是稳定的,所以如果有一个可以阻止的组,我们就必须有,,或者, 。

    情况1. ,那么m对于u’(m)更偏好于u(m),所以(m,w)没有阻止u’’。

    情况2. ,,那么m喜欢u’(m)至少像喜欢u(m)一样,既然u是稳定的,所以(m,w)也不会阻止u’’.

    那么格的属性就是引理2的结论,记住u’’分配每个男人他喜欢的u(m)和u’(m),所以通常情况下我们记。就像在介绍中描述的一样,接着有对任何的(M,W;P)存在匹配和分别是对M-优化和W-优化的。我们就有

    PROPOSITION 2.  伴随着引理1的假设,令是M-优化的匹配对于(M,W;P),是M-优化的匹配对于(M,W’;P’)。那么每个男人在 下至少不差于在下。

    □从引理2,对于(M,W’;P’)是稳定的,而且

   . □

    4.匹配游戏。既然Dubins-Freedman定理指出如果男人伪造他们的偏好对他们是没有好处的,我们假设男人总是将自己真正的偏好列表提交。对于那些只有一个稳定匹配的特殊情况,Dubins-Freedman定理证实诚实对女人来说也是最好的策略。在所有其他情况下,这个并不是这样的。

    定理1.  如果超过一个稳定的匹配,那么至少有一个女人伪造偏好是更好的,假设其他的女人都是诚实的。

    □在的假设下,所以令w是那些的女人。现在令w改变偏好,现在偏好列表下的男人全部去掉。显然匹配仍然是稳定的在这些偏好下(现在有更少得更能阻止的块了)。令是M-优化的匹配,对这些新的偏好,由Proposition1,w不是自匹配的,所以她匹配的至少会像她喜欢一样。因为所有其他的男人已经从他列表中除去了,她对于更喜欢。所以她对于更喜欢’。

    定理1表明诚实地反映喜好的策略是不稳定的对于那些女人在另外一种不稳定性的意义下,如果每个女人期待其他人是诚实的,在通常情况下,至少一个女人可以通过撒谎改善她的位置是可能的。有人将问以下问题:如果城市不是最好的策略,还有其他的被女人吸收的性质策略或战略的集合?那将没有任何优越对任何一个女人在改变她的战略下?现在介绍一些标准的游戏理论术语,我们因此将我们的模型作为匹配的游戏是非常有用的。我们现在处理的有可能是游戏理论中最重要的概念。那就是一个平衡点,一个抽象的游戏由一个玩家集合组成,这些玩家有一个确定的战术集合。在玩这个游戏的时候,每个万加选择一个战略和游戏规则,然后分配他一些东西,可能是数目(分数),或在我们的条件下,是个配偶。假设其他人不改变他们的战略时,如果没有人在改变它的战略时可能获得更好的东西,那么战略集合将形成一个平衡点。如果没有玩家的子集通过改变他们的战略可得到更好的东西对于所有他的成员,战略集合将形成一个强平衡点。那儿有平衡点对于女人在匹配游戏中。下面的俩个定理回答这个问题。

    定理2:令u是任何稳定的匹配对于(M,W;P),并且假设在u(M)是每个女人的选择。列表中的战略仅仅u(M)在她的偏好列表中。这是一个平衡点。

    □这很显然u是稳定的在这些改变了的偏好下。我们记这改变的偏好是P’。u是(M,W;P’)是唯一的稳定匹配,对于其他任何匹配,将有一些w在u(M)是不匹配的,从定理1可以看出这是不可能的。因此u是M-优化的匹配在(M,W;P’)中。

    为了发现P’是一个平衡点,假设一些w现在改变它的偏好列表导致一个新的M-优化匹配u’。u’给他一个配偶,M’=u’(w)。这个配偶是她偏好于u(W)在真正的偏好下的。因为如果不是(m’,w)将阻止u在(M,W;P)中,那么m’必须通过u匹配于一些w’。但是w’在u’下是自匹配的,既然m’是唯一的男人在她的P’-列表下。这意味着m’对于w’更喜欢w。但是如果是这样的话,(m’,w)将又会阻止u。矛盾。

     定理2说明女人可以服从任何在真正偏好下通过平衡点战略得到的稳定匹配。我们现在给出一个逆定理。

    定理3:假设女人选择一个对于匹配游戏已经形成平衡点的战略集合(偏好列表),对应的M-优化匹配是一个(M,W;P)中稳定的匹配。

    这个定理表明在Roth[5]中利用的是[2]中的匹配算法的性质,我们现在给出一个直接证明。

    □ 假设u’是M-优化的匹配对于(M,W;P’),但(m,w)阻止u’在w的真实偏好下,我们将表明P’不是一个平衡点。令w改变使她的列表上只有m。然后她将得到m,令是M-优化的匹配,对于新的偏好。如果w没有得到m,由的稳定性,m是自匹配的。在m偏好w胜过(m)的前提下,m偏好(m)胜过w。所以m偏好(m)胜过(m)。但是匹配对于(M,W-w;P’)是稳定的,P’是定义在W-w上的。因此M’在(M,W;P’)M-优化的匹配比他在(M,W-w;P’)下的更糟这将直接与Proposition 2矛盾。

    综上所述,我们可以看到通过适当的改变,通过平衡点战略,女人可能获得任何稳定的匹配。特别的,有W-优化匹配。在另一方面,女人不能变得更贪婪因为如果任何一个战略的集合给一些女人w一个她比起更喜欢的配偶,这将不是一个平衡点,通过定理3,所以其他的女人可以改变匹配使得她可以更优越通过选择一个不同的战略。

    5. 强平衡点。通过定理2,女人可以获得任何稳定的匹配u 通过平衡点战略。然而,直到,才出现强平衡点。如果,那么至少对两个女人有,也就是说,。有定理1,不是自匹配的通过u,并且因此,。为了看出u在强平衡点下是不匹配的,我们令w是所有的w集合,令所有的w的偏好被改为只有一个男人在列表上。那么是稳定的对这个新的偏好。因此既然w是通过匹配的,他们通过新偏好下的M-优化匹配是匹配的。

    那么存在平衡点吗?是的。

    定理4:令每个女人w提交一个偏好列表在真实的偏好顺序下,但是移开那些排在后的男人。这些偏好P’是一个强平衡点。

    我们称是唯一的稳定匹配对于(M,W;P’)。显然是稳定的,并且其它稳定匹配u’必须有对一些w,因此,如果w不是自匹配的,那么u’(w)是被通过的w偏好。既然是W-优化的稳定匹配,这意味着u’是不稳定地在真实偏好下,因此被一些(m,w)阻止。但是通过P’的构造,这意味着(m,w)阻止u’在P’偏好下。根据u’的P’-稳定性是矛盾的。

    现在既然是唯一的稳定匹配对于(M,W;P’),它就是W-优化匹配对于P’。如果一些子集w能够获得更好的东西通过改变,那么它将得到更好的东西比从W-优化的(M,W;P’)匹配中,但是根据Dubins-Freedman定理,这是不可能的。

    定理4中P’的改变作为最好的方法对于女人来说看起来是合理的。它是(a)一个强平衡点,所以没有女人或女人的集合可以别诱惑去从P’越轨。并且所有平衡点战略中(b)给与女人最高可能性的东西。我们将可以很好地断言匹配是唯一的从强平衡点中获得的匹配。不幸的是,这不是这种情形。下面的例子将证明这点。真的偏好列表在表1中给出

TABLE1

 

2,2

1,3

3,x

x,x

1,3

3,2

2,3

4,x

x,x

x,x

1,2

1,1

3,1

4,1

2,1

2,x

 

TABLE2

      

x

2

x

x

2

x

2

x

x

x

3

x

1

1

 

  Box i,j中的第一个入口是的排序在列表中。如果它是x,这表明不是在列表中。因此给在第三个地方并且不是在列表中。第二个入口是的排序通过。如果它是x,这标志着不在列表中。所以给m排序在第二个地方并且。因为这些列表,匹配被给出通过(m1,w1)( m2,w2)( m3, w3)(m4, w4)。现假设所有女人使用列表2种P’偏好的系统。Box i,j的入口就是的排序通过。M-优化的匹配对于这些就是偏好被给出通过(m2,w1)( m1,w2)( m3, w3)(m4, w4)。我们断言P’是强平衡点。实际上,没有子集。包含,通过改变,可以改善它所有成员的情况。既然配偶是最大的可能;如果包含,它将不能改善的情况。因为(m4, w4)将阻止新的匹配。如果包含,它将不能使通过改变获得更好的配偶。因为(m4, w4)或(m2, w3)将阻止新的匹配。如果包含,这将是不可能改善,因为(m4, w4)或(m1, w2)将阻止新的匹配。

  1. 支配战略。有一个更重要的游戏-理论概念,这在匹配游戏中举例说明的。令和是俩战略对一些w。在普通的n-人游戏中,我们称支配如果无论其他人使用何战略她使用至少像使用那么高,并且严格支配。如果她使用比更高对至少一个战略,对其他人,如果一个战略支配其他战略,我们称这个战略是显性的。

    作为一个例子对这些概念,Dubins-Freedman定理说明,对每个男人泄露真正的偏好是一个显性匹配。对于女人,没有显性匹配,除了特殊的情况|W|=1。如果仅有一个女人w,那么泄漏真正的偏好严格支配任何战略,因为如果她提交真正的偏好,它将得到她列表中最好的男人。如果她改变,举例说,列出取代,它将更糟在m和是唯一的男人在和她结合的列表中。从现在开始将假设至少俩个女人在W中,我们将说明只有一个男人在列表中的战略被支配的直到那个男人正好是女人的真正第一选择,就像定理2种一样。事实上,通过下面的定理,我们能本质上表示女人的被支配战略的特性,其中意味着x比b更偏好a在Px偏好列表下。

    定理5:w没有列出他第一真实选择在她列表顶上的任何战略是严格受支配的。

    □这已经使用匹配算法被证明通过Roth[5]。我们这给一个直接证明。

    令是一个上面描述的战略。我们将说明是严格被支配。令(w得最喜欢男人)在第一位并且不改变其他人的在列表中的位置。令如果=那么就无需证明了,所以现假设,然后

(1)   更喜欢因为如果不是(,w)阻止。因此是稳定的在下。所以根据的M-优化。

(2)    

更多地,从(1)和(2),接着有,并且既然所有其它元素不同于得以相同的顺序排列在和中。接着。因此,,所以。

     为了显示,令m’是中第一个元素。包含下面的偏好类型:m’:{w},={w}并且没有其他男人列出w。然后我们能看到,定理得证。□

我们最后的结果陈述定理5描述了本质上的所有受支配的战略。

    定理6:令是满足(a):(w得最爱)是排第一位。(b)任何战略,那么是不受支配的。

    □我们将说明对任何战略,存在战略对任何其他人像。分别地使是M-优化匹配对于(M,W;)和(M,W;)。有三种情况,我们现假设满足条件(a)。

    情况1   对于,我们假设m列出w为第一选择,并且设有任何男人列出w。然后,当w是自匹配的在下(我们使用)

    情况2    对于我们假设m有偏好列表{}。对一些w’,有偏好列表{},并且有偏好列表{}没有其他任何男人列出w,。那么就证实了。

     情况3     令列表但是w偏好m胜过在中;偏好胜过m在中。然后假设的偏好列表是{},m的是{},{},对是{},并且没有其他任何男人列出w或。这是一个有建设性的工作对于证实。

    我们已经看到当满足(a)和(b)并且满足(a)。那么对一些,。如果不满足(a),由定理5,有一些支配并且满足(a),所以我们构造,所以由支配性,证毕。□

    标记1:条件(b)是需要避免当={}且m不在中时。很明显那是被={}严格支配的。

    标记2:第4节中反例使用仅仅是不受支配的战略对于女人。因此我们没有一个唯一的强平衡点对于W甚至当严格定义在不受支配的战略使用上。

 

参考书

1. L.E Dubins and D.Freedman, Machiavelli and the Gale-Shapley algorithm, this Monthly,88 (1981) 485-484.

2. D.Gale and L.S.Shapley,College admissions and the stability or marriage,this Monthly, 69 (1962) 9-14.

3. D.Gale and M.Sotomayor ,Some remarks on the stable mathing problem.Operations Research Center report OCR-83-13,University or California,Verkeley,1983.

4.  D.E.Knuth,Mariages Stables,Montreal University Press,1976.

5 A.E.Roth,Misrepresentation and stability in marriage problem, Working paper #160,Department of Economics,University of Pittsburgh, Pennsyvania,1983.

6._____, Incentives in the college admissions problem and related two-sided markets.Working paper #173,Department of Economics,University of Pittsburgh,Pennsylvania,1983.

 

 

猜你喜欢

转载自blog.csdn.net/b0207191/article/details/94124172
ms