Estratégia de evaporação Reversi
Guia de Estratégia para Reversi & amp; Reversão Reversa.
No clássico jogo de Reversi você tenta acabar com a maioria dos discos de sua cor no final do jogo. Em Reversão Reversa, as regras são as mesmas, mas o objetivo é acabar com o menor número de discos. Muito do pensamento estratégico por trás do jogo clássico também pode ser aplicado ao jogo reverso, embora às vezes ao contrário!
Preto, para se mover, tem uma escolha.
de quatro quadrados simetricamente equivalentes.
dezesseis, enquanto o central 2x2.
Os jogos podem ser gravados listando os números dos movimentos e as coordenadas de cada jogador.
ou registrando os números de movimento em uma grade. O diagrama 4 mostra uma sequência de movimentos típica para a abertura da Tanida sobreposta à posição alcançada após os primeiros 8 movimentos.
ou Algoritmo Greedy.
Diagrama 5: Muito, muito cedo.
(Passe o mouse sobre a placa para ver o resultado)
No reverso invertido, você não precisa se preocupar em ser eliminado, pois isso também conta como uma vitória, mas esse é outro argumento contra o uso descontrolado de territórios úteis. Em um dos meus primeiros jogos invertidos, eu estava tão ocupado preparando o chão para o grande final que perdi o fato de que meu oponente estava evaporando e de repente fui forçado a tirar o último de suas peças antes que metade dos discos tivesse sido lançada. Escusado será dizer que agora me esforço mais para garantir a sobrevivência do meu oponente.
(Passe o mouse para destacar os discos estáveis)
Olhando para o diagrama 5, deve ficar claro que, se você puder forçar seu oponente a tomar todos os quatro cantos e arestas, é provável que acabe com a maioria dos discos. Simplesmente inverter os valores posicionais de cada quadrado dá uma primeira aproximação a uma avaliação fixa do jogo reverso. Um estudo mais aprofundado mostra que, embora ocupar um X-quadrado no jogo clássico seja dar um canto e seja, portanto, um movimento ruim, o controle de ambos os quadrados C e o X-quadrado é necessário se você for obrigar seu oponente para ocupar a esquina. Uma vez que um disco tenha sido colocado em um quadrado C, ele só pode ser movido por um movimento para o quadrado do canto. O X-quadrado pode ser virado mais rapidamente e pode ser usado pelo seu oponente como um trampolim para um C-quadrado. Da mesma forma, tomar um A-square antecipado pode fornecer acesso a C-squares para o seu oponente, então provavelmente ele deve ser evitado. Pelo menos um A-square será necessário para evitar qualquer possibilidade de o seu oponente virar o X-square mais tarde no jogo. Compare o sudeste e o & amp; cantos sudoeste do diagrama 8 abaixo. O preto quase certamente terá que jogar para h8 antes do jogo acabar, ganhando um canto indesejado. No entanto, jogar b6 irá virar o disco em b7 e se o branco não conseguir virar b7 novamente, dependendo da mobilidade relativa durante o final do jogo, existe a possibilidade de o branco ter que tomar o canto sudoeste antes da conclusão do jogo.
Embora reconhecendo as limitações da estratégia posicional pura, sugiro a tabela estática acima para consideração como um guia rápido para o provável valor relativo de vários quadrados em Reversão Reversa. Em suma, os quadrados-C são quase sempre úteis, enquanto aqueles adjacentes a eles provavelmente devem ser evitados, pois fornecem acesso ao quadrado-C.
Em cada fase do jogo, você terá que escolher entre o número limitado de movimentos disponíveis para você. No diagrama 9, o branco tem apenas 3 movimentos disponíveis ou "liberdades", dois dos quais entregam um canto para o preto imediatamente. Assumindo que as brancas jogadas em e8 preto terão 13 jogadas disponíveis, das quais 11 levarão a uma vitória com a melhor jogada possível por ambos os lados depois disso. Nessa posição, o branco tem pouca mobilidade, tendo poucos movimentos para escolher, todos muito ruins, enquanto o preto tem boa mobilidade, tendo muitas opções de escolha. Enquanto houver pelo menos um movimento não desastroso para cada jogador, o jogo permanecerá em equilíbrio, mas se você puder começar a restringir a mobilidade do seu oponente enquanto mantém o seu próprio, então você poderá forçá-lo a ter que fazer o mal. movimentos.
Diagrama 10: Preto para jogar.
Cada jogada é jogada para um quadrado vazio adjacente ao disco do adversário e vira pelo menos um dos seus discos. Os discos que têm quadrados vizinhos vazios formam a fronteira, enquanto aqueles que não são chamados de discos interiores. Quanto mais discos de fronteira você tiver, mais opções seu oponente terá e, da mesma forma, um conjunto menor de discos de fronteira restringirá o número de movimentos disponíveis. Deve ficar claro que minimizar a fronteira é fundamental para vencer a batalha pela mobilidade. No diagrama 11, o preto deve tocar a6 lançando 3 discos (em vez de f7, que vira 1), pois isso mantém a fronteira no mínimo. Um movimento como esse que não vira discos de fronteira é chamado de movimento silencioso e geralmente representa uma boa jogada. Isto sugere um refinamento da estratégia de evaporação na qual você tenta evaporar seus discos de fronteira, sem estar tão preocupado com o número total de discos invertidos em cada turno.
É muito fácil perder o controle do jogo nos primeiros movimentos. Jogue o movimento errado e seu oponente poderá restringir sua escolha de movimentos àqueles que trabalham a seu favor. Embora os conceitos discutidos acima possam ajudar a guiar seus movimentos de abertura, vale a pena olhar para algumas aberturas padrão que parecem preservar o equilíbrio de controle, pelo menos por um tempo. A página de aberturas tem um guia passo-a-passo ilustrado para algumas das variações de abertura mais promissoras e uma lista de aberturas nomeadas comuns.
Guias de Estratégia & amp; Outros links:
Embora minhas anotações sobre Reversão Reversa sejam todas originais, partes deste guia estratégico foram copiadas de guias existentes em alguns dos sites mencionados acima. Como Tom Lehrer colocou em sua canção Lobachevsky: -
Reversi / Estratégia.
As peças do jogo rodam muito rápido, facilmente e (frequentemente) repetidamente, por isso oferece pouca vantagem - e, de facto, tipicamente torna-se desvantajoso - para tentar ganhar a maioria das peças no início do jogo. Cantos, mobilidade, jogo de limites, paridade, jogo de final de jogo e look-ahead formam os elementos-chave da bem-sucedida estratégia de Otelo.
Fig. 1 O layout da placa.
O jogo tem 8x8 quadrados com a posição inicial mostrada. Cada quadrado tem um nome (o quadrado do canto superior esquerdo é a1).
Fig. 2 Os quadrados nomeados.
Existem alguns quadrados que os jogadores nomearam:
Posições de canto, uma vez jogadas, permanecem imunes ao flipping para o resto do jogo: assim, um jogador pode usar uma peça em um canto do tabuleiro para ancorar grupos de peças (começando com as bordas adjacentes) permanentemente. Então, capturar uma esquina freqüentemente prova uma estratégia eficaz quando surge a oportunidade. Mais genericamente, uma peça é estável quando, nas quatro direções, ela está em um limite, em uma linha preenchida ou próxima a uma parte estável da mesma cor.
Um adversário que jogue com uma estratégia razoável não irá desistir tão facilmente do canto ou de quaisquer outras boas jogadas. Então, para conseguir esses bons movimentos, você deve forçar seu oponente a jogar movimentos que renunciam a esses bons movimentos. A melhor maneira de conseguir isso envolve reduzir o número de movimentos disponíveis para o seu oponente. Se você restringir consistentemente o número de lances legais que seu oponente pode fazer, então, mais cedo ou mais tarde, eles terão que fazer um movimento indesejável. Uma posição ideal envolve ter todas as suas peças no centro cercadas pelas peças do seu oponente. Em tais situações, você pode ditar quais movimentos seu oponente pode fazer.
Quando os movimentos parecem iguais em relação aos movimentos que você vai deixar a si mesmo e ao seu oponente, jogar uma estratégia de peça mínima tenderá a beneficiar você, porque minimizar os seus discos tenderá a deixar menos discos para o seu oponente girar nos movimentos subsequentes do jogo. Não se deve jogar a estratégia mínima do disco ao extremo, no entanto, como isso também pode levar rapidamente a uma falta de mobilidade.
Embora a reprodução de peças nas bordas da placa possa parecer boa (porque elas não podem ser viradas facilmente), isso pode ser prejudicial. As peças de borda podem ancorar os flops que influenciam a movimentação para todas as regiões do tabuleiro. Por causa disso, isso pode, mais cedo ou mais tarde, envenenar movimentos posteriores que você faz, fazendo com que você jogue muitas peças e abra muitos movimentos para o seu oponente. No entanto, às vezes jogando para uma borda onde o seu oponente não pode responder facilmente deixará aquele oponente com significativamente menos movimentos disponíveis.
O quadrado imediatamente na diagonal adjacente ao canto (chamado de X-square), quando jogado no início ou no meio do jogo, normalmente garante a perda daquele canto. Jogar nos quadrados de borda adjacentes ao canto pode levar a armadilhas táticas envolvendo o sacrifício de um canto, ou simplesmente jogar a borda em uma sequência específica.
Em geral, você deve evitar o jogo de beisebol no início e no meio do jogo, se possível, a menos que você possa ganhar concessões maiores em termos de mobilidade ou uma massa de peças indecifráveis.
À medida que a jogada avança, as regiões do tabuleiro normalmente se separam onde nenhum dos lados pode impedir o outro de jogar arbitrariamente nessas regiões. Simplesmente contando o número de quadrados em uma região, pode-se verificar se existe um número ímpar ou um número par de quadrados. No caso de um número ímpar de quadrados, jogando primeiro você pode forçar seu oponente a jogar primeiro fora daquela região. Você conseguiu isso simplesmente jogando nessa região a qualquer momento, ele tem um número ímpar de quadrados disponíveis, e não jogando nele quando ele possui um número par de quadrados. Se você levar em consideração certos quadrados em uma região que pareça muito perigosa (como um X-quadrado ou um quadrado de aresta que leve a uma armadilha óbvia), então você pode forçar seu oponente a jogar em outro lugar ou a ocupar um desses quadrados perigosos.
Como em qualquer boa estratégia para xadrez ou damas, um jogador não deve considerar apenas a situação atual no tabuleiro. Para cada jogada que você considera, você deve considerar possíveis respostas de seu oponente, depois as respostas subseqüentes que você fará a essas jogadas e assim por diante. Os aspectos da posição atual podem não permanecer relevantes em alguns movimentos. Portanto, ao otimizar sua mobilidade, ganhar cantos ou qualquer outra coisa, considere a melhor forma de fazer isso a longo prazo, e não apenas para o próximo passo.
Para o final do jogo (os últimos 20 movimentos do jogo), as estratégias normalmente mudam. Técnicas especiais como varrer, ganhar acesso e os detalhes da ordem de movimento podem ter um grande impacto no resultado do jogo. Nestes últimos estágios do jogo não existem regras rígidas. O jogador experiente tentará olhar para frente e ter uma ideia do que levará ao melhor resultado final.
Estratégia de evaporação Reversi
Eu escrevi meu próprio player Reversi, baseado no algoritmo MiniMax, com a remoção de Alpha-Beta, mas nos primeiros 10 movimentos minha função de avaliação é muito lenta. Eu preciso de uma boa função de avaliação inicial.
Estou tentando fazer isso com essa matriz (correspondente ao quadro) que determina o quão favorável é esse quadrado:
Mas isso não funciona bem.
Você já escreveu uma função de avaliação inicial para o Reversi?
Eu vejo que você já descobriu a estratégia posicional.
Uma heurística muito simples que funciona muito bem no início do jogo é "dar-a-fora", também conhecida como "evaporação": tábuas que têm mais pedras inimigas e menos pedras são melhores. (Isso é um pouco contra-intuitivo, porque o oposto é verdadeiro no final do jogo).
Portanto, uma simples função de avaliação do conselho poderia ser algo parecido.
onde K1, K2 e K3 são ajustados para "tocar bem".
Você pode querer dar uma olhada no Guia de Estratégia do Reversi & amp; Reversi Reversi para heurísticas mais complicadas.
Em muitos jogos de tabuleiro, é comum que os primeiros movimentos de 'n' sejam pré-calculados em um "livro de abertura", que é apenas um arquivo contendo todas as posições de jogo possíveis dentro desse número de movimentos e as respostas preferidas para cada.
Para gerar o livro de abertura você usa a mesma heurística que você faz para o jogo normal, mas em vez de fazê-lo enquanto o jogo está sendo jogado, você calcula todos os movimentos possíveis dentro daqueles primeiro 'n' e armazena os resultados em um jogo. arquivo que você envia com o jogo. Então, quando o jogo está realmente jogando, para aqueles primeiros 'n' movimentos, em vez de executar a heurística (que, como você diz, pode ser bastante lenta), você procura os resultados pré-calculados do livro de abertura que você salvou anteriormente .
Facebook.
dica do dia: estratégia de evaporação.
a estratégia de manter uma baixa contagem de discos durante grande parte do jogo, dando assim ao adversário menos opções.
Dica do dia: olhe para frente!
Você precisará considerar as ramificações de seus movimentos e olhar para frente, bem além do movimento atual. Por exemplo, para fazer uma curva, primeiro você precisa forçar seu oponente a jogar no quadrado ao lado do canto.
Gostaria que eu tivesse isso no meu último vôo 14hr :)
Há um novo jogo na cidade! Jogue Reversi contra outros jogadores, ganhe jogos e ganhe fichas. Basta clicar em LIKE e, em seguida, jogar agora e você está pronto para ir.
Facebook.
dica do dia: estratégia de evaporação.
a estratégia de manter uma baixa contagem de discos durante grande parte do jogo, dando ao oponente menos opções.
Dica do dia: olhe para frente!
Você precisará considerar as ramificações de seus movimentos e olhar para frente, bem além do movimento atual. Por exemplo, para fazer uma curva, primeiro você precisa forçar seu oponente a jogar no quadrado ao lado do canto.
Gostaria que eu tivesse isso no meu último vôo 14hr :)
Há um novo jogo na cidade! Jogue Reversi contra outros jogadores, ganhe jogos e ganhe fichas. Basta clicar em LIKE e, em seguida, jogar agora e você está pronto para ir.
Facebook.
dica do dia: estratégia de evaporação.
a estratégia de manter uma baixa contagem de discos durante grande parte do jogo, dando assim ao adversário menos opções.
Dica do dia: olhe para frente!
Você precisará considerar as ramificações de seus movimentos e olhar para frente, bem além do movimento atual. Por exemplo, para fazer uma curva, primeiro você precisa forçar seu oponente a jogar no quadrado ao lado do canto.
Gostaria que eu tivesse isso no meu último vôo 14hr :)
Há um novo jogo na cidade! Jogue Reversi contra outros jogadores, ganhe jogos e ganhe fichas. Basta clicar em LIKE e, em seguida, jogar agora e você está pronto para ir.
Eu escrevi meu próprio player Reversi, baseado no algoritmo MiniMax, com a remoção de Alpha-Beta, mas nos primeiros 10 movimentos minha função de avaliação é muito lenta. Eu preciso de uma boa função de avaliação inicial.
Estou tentando fazer isso com essa matriz (correspondente ao quadro) que determina o quão favorável é esse quadrado:
Mas isso não funciona bem.
Você já escreveu uma função de avaliação inicial para o Reversi?
Eu vejo que você já descobriu a estratégia posicional.
Uma heurística muito simples que funciona muito bem no início do jogo é "dar-a-fora", também conhecida como "evaporação": tábuas que têm mais pedras inimigas e menos pedras são melhores. (Isso é um pouco contra-intuitivo, porque o oposto é verdadeiro no final do jogo).
Portanto, uma simples função de avaliação do conselho poderia ser algo parecido.
onde K1, K2 e K3 são ajustados para "tocar bem".
Você pode querer dar uma olhada no Guia de Estratégia do Reversi & amp; Reversi Reversi para heurísticas mais complicadas.
Em muitos jogos de tabuleiro, é comum que os primeiros movimentos de 'n' sejam pré-calculados em um "livro de abertura", que é apenas um arquivo contendo todas as posições de jogo possíveis dentro desse número de movimentos e as respostas preferidas para cada.
Para gerar o livro de abertura você usa a mesma heurística que você faz para o jogo normal, mas em vez de fazê-lo enquanto o jogo está sendo jogado, você calcula todos os movimentos possíveis dentro daqueles primeiro 'n' e armazena os resultados em um jogo. arquivo que você envia com o jogo. Então, quando o jogo está realmente jogando, para aqueles primeiros 'n' movimentos, em vez de executar a heurística (que, como você diz, pode ser bastante lenta), você procura os resultados pré-calculados do livro de abertura que você salvou anteriormente .
Facebook.
dica do dia: estratégia de evaporação.
a estratégia de manter uma baixa contagem de discos durante grande parte do jogo, dando assim ao adversário menos opções.
Dica do dia: olhe para frente!
Você precisará considerar as ramificações de seus movimentos e olhar para frente, bem além do movimento atual. Por exemplo, para fazer uma curva, primeiro você precisa forçar seu oponente a jogar no quadrado ao lado do canto.
Gostaria que eu tivesse isso no meu último vôo 14hr :)
Há um novo jogo na cidade! Jogue Reversi contra outros jogadores, ganhe jogos e ganhe fichas. Basta clicar em LIKE e, em seguida, jogar agora e você está pronto para ir.
Facebook.
dica do dia: estratégia de evaporação.
a estratégia de manter uma baixa contagem de discos durante grande parte do jogo, dando ao oponente menos opções.
Dica do dia: olhe para frente!
Você precisará considerar as ramificações de seus movimentos e olhar para frente, bem além do movimento atual. Por exemplo, para fazer uma curva, primeiro você precisa forçar seu oponente a jogar no quadrado ao lado do canto.
Gostaria que eu tivesse isso no meu último vôo 14hr :)
Há um novo jogo na cidade! Jogue Reversi contra outros jogadores, ganhe jogos e ganhe fichas. Basta clicar em LIKE e, em seguida, jogar agora e você está pronto para ir.
Facebook.
dica do dia: estratégia de evaporação.
a estratégia de manter uma baixa contagem de discos durante grande parte do jogo, dando assim ao adversário menos opções.
Dica do dia: olhe para frente!
Você precisará considerar as ramificações de seus movimentos e olhar para frente, bem além do movimento atual. Por exemplo, para fazer uma curva, primeiro você precisa forçar seu oponente a jogar no quadrado ao lado do canto.
Gostaria que eu tivesse isso no meu último vôo 14hr :)
Há um novo jogo na cidade! Jogue Reversi contra outros jogadores, ganhe jogos e ganhe fichas. Basta clicar em LIKE e, em seguida, jogar agora e você está pronto para ir.
No comments:
Post a Comment