Professional Documents
Culture Documents
8 Answers: What Is The Difference Between Nash Equilibrium and Pareto Optimality?
8 Answers: What Is The Difference Between Nash Equilibrium and Pareto Optimality?
Optimality?
8 Answers
Now, you might want to take this as an exercise: Find other Pareto optimal
outcomes of this game (there are more).
Eficiência de Pareto
Origem: Wikipédia, a enciclopédia livre.
Esta página ou secção cita fontes fiáveis e independentes, mas que não cobrem todo o conteúdo, o que compro
a verificabilidade (desde setembro de 2016). Por favor, insira mais referências no texto. Material sem fontes p
ser removido.
—Encontre fontes: Google (notícias, livros e acadêmico)
Índice
[esconder]
1Na economia
2Na informática
3Referências
4Ver também
5Ligações externas
Esta página ou secção cita fontes fiáveis e independentes, mas que não cobrem todo o conteúdo, o que compro
a verificabilidade (desde setembro de 2016). Por favor, insira mais referências no texto. Material sem fontes p
ser removido.
—Encontre fontes: Google (notícias, livros e acadêmico)
Os pontos vermelhos indicam a escolha ótima em termos de eficiência dado o
conjunto de opções, formando uma fronteira de Pareto sob o espaço de
escolhas restante (abaixo e à esquerda, em cinza)
Eficiência ou óptimo de Pareto é um conceito desenvolvido
pelo italiano Vilfredo Pareto, que define um estado de alocação de recursos em
que é impossível realocá-los tal que a situação de qualquer participante seja
melhorada sem piorar a situação individual de outro participante.[1] O conceito
tem aplicações no campo da economia, engenharia, informática, e ciências
sociais.
Índice
[esconder]
1Na economia
2Na informática
3Referências
4Ver também
5Ligações externas
Cada prisioneiro faz a decisão sem saber a escolha do outro - eles não podem
conversar. Como o prisioneiro vai reagir? Existe algum decisão racional a
tomar? Qual seria a sua decisão?
Uma forma esquemática para mostrar uma interação humana, ou seja, um jogo,
é através de uma "matriz de resultados" [NOTA 2]. Embora o enunciado do
problema seja simples e intuitivo para entender de forma verbal, a
representação gráfica oferece uma grande ajuda para visualizar o cenário de
forma completa e entender as opções e implicações para cada jogador.
Imagine que você é o prisioneiro A. Assim, você raciocina nas duas hipóteses:
- Suponha que o Prisioneiro B escolha Colaborar. Então, se você escolher Colaborar,
leva 1 ano de prisão. Se escolher Trair, sai livre. Neste caso, Trair é a melhor opção.
- Suponha que o Prisioneiro B escolha Trair. Então, se você escolher Colaborar, leva
10 anos de prisão. Se escolher Trair, fica com 5 anos. Neste caso, Trair é a melhor
opção.
Perceba que Trair é a melhor opção em ambos os casos. Em outras palavras, Trair é
a melhor opção independente da decisão do Prisoneiro B.
Agora, imagine o que o Prisoneiro B está pensando: se ele é racional como você,
provavelmente a mesma coisa.
- Ele supõe que você vai escolher Colaborar. Então, se ele escolher Colaborar, leva 1
ano de prisão. Se escolher Trair, sai livre. Neste caso, Trair é a melhor opção.
- Ele supõe que você vai escolher Trair. Então, se ele escolher Colaborar, leva 10
anos de prisão. Se escolher Trair, fica com 5 anos de prisão. Neste caso, Trair é a
melhor opção.
Neste exemplo dos prisioneiros, como ambos vão escolher Trair devido a
estratégia dominante, cada um é preso por 5 anos. Assim, dizemos que Trair-
Trair é a solução de equilíbrio, equilibrio do jogo ou Equilibrio de
Nash. O Equilibrio de Nash [NOTA 3]é a solução (combinação de decisões) em
que nenhum jogador pode melhorar seu resultado com uma ação unilateral. Ou
seja, dado que Trair-Trair é a solução de equilíbrio (o resultado racional do
jogo), se o Prisioneiro A mudar unilateralmente para Colaborar ele sai perdendo
(15 anos), o mesmo ocorrendo para o Prisioneiro B.
Você poderia imaginar que este equilíbrio só ocorre porque as pessoas não
podem conversar e combinar as ações, e que se pudessem fazer um
acordo prévio, tudo se resolveria. Isso não é necessariamente verdade. Você
quer colaborar (ficar em silêncio), mas quem garante que o seu parceiro fará o
mesmo? O quanto você confia no outro jogador?
Você é o prisioneiro e sua vida está em jogo. Você combina antes que vai
colaborar e quer cumprir sua palavra. Seu comparsa sabe isso. Então, o que
garante que, no último instante, ele não vai te trair, justamente sabendo que
você vai colaborar? Para ele é simples, ele sai livre e você pega 15 anos de
prisão... Daí é tarde. Provalvelmente, o seu comparsa pensará da mesma forma
a seu respeito. Por isso, o Dilema dos Prisioneiros se torna, na verdade,
num Dilema da Confiança. Como resolver esse dilema? Você verá nos
próximos artigos.
[OBS: para melhor aproveitar este artigo, sugiro primeiro ler o O que é o Dilema
dos Prisioneiros como introdução]
O maravilhoso mundo do Dilema dos Prisioneiros abre as portas para muitas
analogias com a vida real. Este "jogo-modelo" é uma das metáforas mais
poderosas na ciência do comportamento humano pois inúmeras interações
sociais e econômicas tem a mesma estrutura de incentivos (a matriz de
resultados). O conflito típico dos jogos da categoria "Dilema dos Prisioneiros" é
que cada jogador escolhe sua estratégia dominante e o resultado é pior ao grupo
como um todo; é o conflito entre o interesse individual e coletivo.
Imagine uma cidade com apenas dois postos de gasolina. Você é dono de
um deles, chamado GASOIL, que fica lado a lado do seu concorrente, o
posto CARGAS. Devido a proximidade, quando uma pessoa precisa abastecer o
carro, ela vai até eles, visualiza o preço de ambos e escolhe pelo menor. Embora
existam outros motivos que diferenciam os postos, como a cordialidade e
velocidade dos frentistas, o preço é o fator mais relevante.
Assim, se o assunto é preço, alguns centavos a menos podem induzir parte dos
clientes a preferir o posto com menor valor. Por exemplo, se seu concorrente
abaixar o preço em 5%, ele ganha cerca de 30% dos seus clientes. Este aumento
de volume de clientes compensa o preço reduzido, melhorando a rentabilidade,
enquanto você perde faturamento. Por isso, você pensa: que tal abaixar o preço
do litro de $3 para $2,90? Isso fará com que habituais clientes do CARGAS
(concorrente) passem a abastecer no GASOIL (o seu posto).
CARGAS
Manter Reduzir
Manter 50 , 50 30 , 60
GASOIL
Reduzir 60 , 30 40 , 40
Recapitulação
[1] O Dilema dos Prisioneiros foi inventado em 1950 por Merrill Flood e Melvin
Dresher, e foi adaptado e divulgado por A.W.Tucker.
[2] Em inglês, o termo usado é "payoff matrix". Em português existem algumas
variantes: matriz de resultados, matriz de recompensas e matriz de pagamentos.
[3] O nome Equilibrio de Nash é devido seu inventor, John Nash, ganhador do
prêmio Nobel em 1994 e que foi retratado no filme Uma Mente Brilhante, em
2001.
Índice
[esconder]
A e B negam
Este jogo possui como Equilíbrios de Nash a estratégia:
O dilema do prisioneiro cumpre a fórmula : 0 > -0,5 > -5 > -10 (em
negativo porquanto os números representam anos de cárcere).
Costuma também cumprir-se (T + C)/2 < R, e isto é exigido no caso
iterado[2].
As fórmulas anteriores asseguram que, independentemente dos
números exactos em cada parte da matriz de ganhos, é sempre
"melhor" para cada jogador desertar, faça o que fizer o outro.
Seguindo este princípio, e simplificando o dilema do prisioneiro ao
cenário da troca de malas anterior (ou a um jogo de dois jogadores tipo
Axelrod — ver mais abaixo), obteremos a seguinte matriz de ganhos
canónica para o dilema do prisioneiro, isto é, a que se costuma mostrar
na literatura sobre este tema:
Cooperar Desertar
Cooperar 3, 3 -5, 5
Desertar 5, -5 -1, -1
Cooperar Desertar
…
Podemos perdoar a um homem fazer uma coisa útil, contanto que a não admire.
A única desculpa para fazer uma coisa inútil é admirá-la intensamente.