Othello: Análisis Teórico
Enviado por Rebecca • 3 de Septiembre de 2018 • 1.593 Palabras (7 Páginas) • 329 Visitas
...
- Weighted Piece Counter WPC.
WPC. Es una estrategia simple que asigna a cada posición del tablero de juego un peso. Se representa mediante una función ponderada lineal.
64
f (b)=∑ wi∗bi (1).
i=1
Se asigna un peso wi a una posición del tablero, bi será igual a 0 si es una posición vacía, 1 si esta ocupada por una ficha negra y -1 por una ficha blanca. La salida de esta función será interpretada de manera diferente por ambos jugadores, es decir, jugador1(fichas negras) buscará movimientos donde los valores de la función sean más altos y el jugador2(fichas blancas) hará lo contrario.
C Perceptrón multicapa MLP.
Red neuronal perceptrón multicapa(MLP) formada por múltiples capas, esto le permite resolver problemas que no son linealmente separables, lo cual es la principal desventaja de la perceptrón simple. Cada capa en la red contiene un conjunto de unidades que reciben las entradas desde las unidades en la capa anterior y envía las salidas a las unidades en la siguiente capa; no hay conexiones entre unidades en la misma capa, así como cada capa esta conectada a la siguiente. Características de esta estrategia:
- El estado actual del tablero determina los estados sucesivos.
- Los patrones de entrada son los posibles estados futuros.
[pic 6]
“figura 7 MLP, output → heurística”
- Temporal Difference Learning TDL.
The Temporal Difference Learning(TDL) Es un método de aprendizaje que es usado para resolver los problemas de predicción estimando la siguiente acción del sistema usando experiencias pasadas. El aprendizaje sucede cuando hay un cambio en el estado del sistema y este esta basado en el error entre predicciones sucesivas temporales. Su objetivo es hacer que la predicción anterior coincida más estrechamente con la predicción actual (teniendo en cuenta distintos estados del sistema observados en los intervalos de tiempo correspondientes).
- Montecarlo.
El método Montecarlo se llamó así en referencia al Casino de Monte Carlo por ser “la capital del juego de azar”. Es un método no determinista o estadístico numérico, usado para aproximar expresiones matemáticas complejas y costosas de evaluar con exactitud. Este es un método de aprendizaje que aprende directamente en linea o de la experiencia simulada. La idea básica es correr el programa desde cada posible movimiento en el tablero actual.
- Análisis de resultados.
Para las pruebas se utiliza el criterio victoria/derrota/empate y el tiempo requerido para los cuatro primeros niveles del árbol de juego. Para una mejor lectura de resultados se asignan puntos a cada función de evaluación, 1 punto equivale a una victoria, 0,5 puntos equivaldrán a un empate y 0 a una derrota. El costo espacial no es tenido en cuenta ya que los resultados dependerán de la máquina. Se hacen 144,000 pruebas que determinan a MLP como la más efectiva en cuanto al número de victorias de las fichas negras.
V CONCEPTOS VISTOS EN CLASE.
La IA es muy utilizada en el mundo de los videojuegos, especialmente juegos donde el ordenador toma el papel de un jugador. Los primeros intentos de recrear un comportamiento inteligente en un ordenador se basaron en juegos como el ajedrez, de esto, la importancia de los juegos en el mundo de la IA.
Othello es un juego ni muy complicado ni muy trivial y determinista lo que lo hace un buen candidato para aplicar los diferentes conceptos de la inteligencia artificial, conceptos como “Minimax” que es un método de decisión para minimizar la pérdida máxima esperada en juegos con adversarios aplicado a juegos de dos jugadores. Este método genera un árbol de decisiones el cual debe ser tratado con poda alfa-beta.
Debido al tamaño del árbol de juego generado, es poco práctico pensar en una solución óptima, es decir, se debe pensar en una heurística para acercarse a una solución. Se considera la heurística uno de los conceptos más importantes ya que muchos algoritmos en la inteligencia artificial son heurísticos por naturaleza, o tienen reglas heurísticas en ellos.
Para hacer de la máquina un oponente competente se utilizan diferentes estrategias que le sirvan de “cerebro” para hacerse un camino en el juego, estrategias como el uso de algoritmos evolutivos, redes neuronales y la combinación de estas permiten al ordenador “aprender” mediante el entrenamiento para ejecutar jugadas de alta calidad. El siguiente link contiene un buen ejemplo de la aplicación de una red neuronal a un juego:
VI REFERENCIAS BIBLIOGRÁFICAS.
- Selection of Suitable Evaluation Function Based on Win/Draw Parameter in Othello.
- Othello Disponible en : https://es.wikipedia.org/wiki/Reversi
- Multilayer Perceptrón Disponible en: https://en.wikipedia.org/wiki/Multilayer_perceptron
---------------------------------------------------------------
...