Examen 16 Mayo 2019, preguntas y respuestas PDF

Title	Examen 16 Mayo 2019, preguntas y respuestas
Course	Sistemas Inteligentes
Institution	Universidad Rey Juan Carlos
Pages	11
File Size	638.7 KB
File Type	PDF
Total Downloads	249
Total Views	408

Preview

CLICK TO PREVIEW PDF

Summary

Warning: TT: undefined function: 32 16 de mayo de 2019APELLIDOS: NOMBRE:Duración: 1 hora 50 mins No se permiten móviles, libros, apuntes, ni calculadora Realice los ejercicios en hojas separadas, incluidos en blanco No se levante del asiento salvo para entregar el examenEjercicio 1: [20 puntos: resp...

Description

Examen Sistemas Inteligentes 16 de mayo de 2019

APELLIDOS:

NOMBRE:

Duración: 1 hora 50 mins No se permiten móviles, libros, apuntes, ni calculadora Realice los ejercicios en hojas separadas, incluidos en blanco No se levante del asiento salvo para entregar el examen

Ejercicio 1:

[20 puntos: respuesta acertada = +1, respuesta incorrecta = –1]

Complete las frases que se muestran a continuación con las alternativas especificadas. En la siguiente tabla, indique "V" o "F" para respuestas verdaderas y falsas respectivamente:

(a)

(b)

(c)

(d)

1.1

V

F

F

F

1.2

V

V

F

V

1.3

F

V

F

V

1.4

V

V

F

V

1.5

F

V

V

F

!

Pág. 1 / 11

Examen Sistemas Inteligentes 16 de mayo de 2019

APELLIDOS:

NOMBRE:

Duración: 1 hora 50 mins No se permiten móviles, libros, apuntes, ni calculadora Realice los ejercicios en hojas separadas, incluidos en blanco No se levante del asiento salvo para entregar el examen 1.1. ¿Cuáles de las siguientes afirmaciones acerca de los algoritmos de búsqueda son verdaderas y cuáles son falsas? (a) Con una función heurística h* optimista, el algoritmo A* es siempre óptimo y completo, independientemente de los valores enteros concretos h*(n) que devuelve la función para los diferentes nodos n del espacio de estados. (b) En el 8-puzzle, la suma de los valores de las piezas descolocadas en un estado es una función heurística optimista. (c) Sean h1* y h2* dos funciones heurísticas optimistas. Si h1* es más informada que h2*, entonces el algoritmo A* con h1* siempre encuentra una solución mejor (e.d., una solución de menor coste) que A* con h2*. (d) El algoritmo A* degenera en una búsqueda en profundidad si h*(n) = 0 para todos los nodos n del espacio de estados. 1.2. ¿Cuáles de las siguientes afirmaciones acerca de la búsqueda en línea son verdaderas y cuáles son falsas? (a) Se intercala una fase de búsqueda (elección de acciones) con una fase de acción/percepción. (b) Una búsqueda en línea, la solución encontrada es mejor cuanto menor sea su índice competitivo (coste del camino real entre coste del camino óptimo). (c) La búsqueda en línea siempre es óptima y completa. (d) Es conveniente aplicar la búsqueda con horizonte cuando el espacio de búsqueda es demasiado grande como para realizar una única búsqueda A*.

1.2.

Sea X = {A,B,C,D} un conjunto de variables, D = {DA, DB, DC , DD} un conjunto de dominios tal que DA = DB = DC = DD = {1,2}, y R = {RA,B, RA,C, RB,C} un conjunto de restricciones, todas ellas de desigualdad (p.e. RA,B º (A≠B)). ¿Cuáles de los siguientes afirmaciones respecto al Problema de Satisfacción de Restricciones (X,D,R) son ciertas y cuáles falsas ? (a) El grafo que representa el Problema de Satisfacción de Restricciones es conexo. (b) El Problema de Satisfacción de Restricciones es arco-consistente. (c) El Problema de Satisfacción de Restricciones tiene exactamente una solución. (d) El Problema de Satisfacción de Restricciones no tiene solución.

Pág. 2 / 11

Examen Sistemas Inteligentes 16 de mayo de 2019

APELLIDOS:

NOMBRE:

Duración: 1 hora 50 mins No se permiten móviles, libros, apuntes, ni calculadora Realice los ejercicios en hojas separadas, incluidos en blanco No se levante del asiento salvo para entregar el examen 1.4. ¿Cuáles de las siguientes afirmaciones son verdaderas y cuáles son falsas? (a) En lógica de descripciones ALC: 9r.C v 9r.> (b) En OWL se puede especificar que una propiedad es transitiva (c) Protégé es un lenguaje de consulta para datos RDF (d) Para toda t-norma T y t-conorma S se cumple que "x,y S(x,y) ³ T(x,y)

1.5. ¿Cuáles de las siguientes afirmaciones son verdaderas y cuáles son falsas? (a) En el aprendizaje supervisado, regresión es un caso especial de clasificación. (b) El objetivo del aprendizaje por refuerzo es determinar para cada estado cual es la acción con la que puede ganar la mayor recompensa acumulada esperada durante su ciclo de actuación. (c) En el aprendizaje por refuerzo en un entorno determinista. Sea el factor de descuento g=1 y V*(s) el valor de un estado para la política óptima. Un agente que se encuentra en el estado s y aplica la política óptima tiene asegurado ganar exactamente una recompensa acumulada de V*(s) durante su ciclo de actuación. (d) En el aprendizaje Q-learning, aplicar una política épsilon-greedy implica que el agente elige su acción siempre de forma aleatoria.

Pág. 3 / 11

Examen Sistemas Inteligentes 16 de mayo de 2019

APELLIDOS:

NOMBRE:

Duración: 1 hora 50 mins No se permiten móviles, libros, apuntes, ni calculadora Realice los ejercicios en hojas separadas, incluidos en blanco No se levante del asiento salvo para entregar el examen Ejercicio 2: [ 30 puntos] A finales de los años 90 del siglo pasado se propuso el siguiente pasatiempo: Un grupo de n contrincantes disponen cada uno de un conjunto de monedas en pesetas. En cada ronda del juego, uno tras otro cada jugador elige una moneda y la coloca delante de sí de forma visible. El objetivo de cada jugador es acercarse lo más posible al valor de un Euro, pero sin pasarse, con las monedas que ese jugador ha colocado (recordamos que 1 € » 166,386 Pts). Como restricción, se requiere que un jugador no puede nunca elegir una moneda del mismo valor que la que acaba de colocar el jugador inmediatamente anterior. Además, no puede pasar turno sin colocar una moneda. Si un jugador se pasa del valor de un Euro pierde, y el juego se acaba. En este caso, entre los demás, el ganador es el jugador cuya suma de monedas se acerque más a un Euro. a) Defina una representación eficiente de los estados de este juego. Puede suponer que existe un conjunto M que contiene todos los posibles valores de las monedas. Se supone que los jugadores disponen de un número ilimitado de monedas. b) Ahora nos interesa un caso especial del juego arriba mencionado en el que hay solo dos contrincantes (Max y Min), y se dispone sólo de monedas de 5, 25 y 100 pesetas (e.d., M = {5, 25, 100}). Empieza Max. Desarrolle el árbol de juego hasta ply 3 (e.d., se realizan 3 media jugadas). Cuando un jugador puede elegir entre colocar monedas de diferente valor, suponga que en el árbol se incluyen primero los estados que resultan de colocar monedas de 25 pesetas, luego de 100 pesetas, y finalmente de 5 pesetas. c) Suponga que summax es la suma de las monedas colocadas por Max, y summin la suma de las monedas colocadas por Min. Una posible función de evaluación e de Max para cualquier estado de juego s es: +∝ −∝ 𝑒(𝑆) = & 𝑠𝑢𝑚-78 − 𝑠𝑢𝑚-./

𝑠𝑖 𝑠𝑖

𝑠𝑢𝑚-./ > 12𝐸𝑢𝑟𝑜 𝑠𝑢𝑚-78 > 12𝐸𝑢𝑟𝑜 𝑑𝑒2𝑙𝑜2𝑐𝑜𝑛𝑡𝑟𝑎𝑟𝑖𝑜

Aplique el algoritmo Minimax simple (sin poda a -b ) y propague los valores de evaluación por el árbol del apartado (b). ¿Cuál es la mejor jugada de Max? d) Contemple el siguiente árbol de un juego bipersonal de suma nula, en cuyas hojas se indica el valor correspondiente de la función de evaluación. Es el turno del jugador

Pág. 4 / 11

Examen Sistemas Inteligentes 16 de mayo de 2019

APELLIDOS:

NOMBRE:

Duración: 1 hora 50 mins No se permiten móviles, libros, apuntes, ni calculadora Realice los ejercicios en hojas separadas, incluidos en blanco No se levante del asiento salvo para entregar el examen Max. Suponiendo que siempre se expanden los sucesores de un nodo de izquierda a derecha, aplique el algoritmo Minimax con poda a-b, determine qué nodos o subárboles se podan, e indique en la tabla de abajo cómo van cambiando los valores de a y b de los demás nodos interiores durante la ejecución del algoritmo. ¿Cuál es la mejor jugada para Max?

max!

A!

a 1!

a 2!

B!

min!

a1,1! a1,2! E!

evaluación,e! 8!

F! 12!

a 3! D!

C!

a1,3! G! 3!

a

a2,1! a2,2!

a2,3!

a3,1! K!

H!

I!

J!

4!

2!

6!

3!

a3,2!

a3,3!

L!

M!

5!

14!

b

A B C D Nodos podados:

Mejor jugada:

Pág. 5 / 11

Examen Sistemas Inteligentes 16 de mayo de 2019

APELLIDOS:

NOMBRE:

Duración: 1 hora 50 mins No se permiten móviles, libros, apuntes, ni calculadora Realice los ejercicios en hojas separadas, incluidos en blanco No se levante del asiento salvo para entregar el examen Solución:

a) Sea U el conjunto de tipos de monedas junto con el símbolo “-”, e.d. U = M È {-}. El conjunto de estados sería S = U x À x … x À. Un estado sÎS sería una n+1 tupla, donde el primer elemento representa el valor de la última moneda colocada (“-” si todavía no se ha colocado ninguna), y los siguientes la suma de las monedas colocadas por cada uno de los diferentes jugadores, respectivamente. b+c)

d) Se poden los nodos J, L y M. La jugada elegida por Minimax es a1 que lleva al nodo B (obviamente a3 es igual de buena) A B C D

a

b

-∞ / 3

+∞

-∞ 3

+∞ / 8 / 3 +∞ / 4 / 2

3

+∞ / 3

Pág. 6 / 11

Examen Sistemas Inteligentes 16 de mayo de 2019

APELLIDOS:

NOMBRE:

Duración: 1 hora 50 mins No se permiten móviles, libros, apuntes, ni calculadora Realice los ejercicios en hojas separadas, incluidos en blanco No se levante del asiento salvo para entregar el examen Ejercicio 3: [10 puntos] Escribir una consulta SPARQL que permita obtener los nombres (propiedad foaf:name) de actores (sin distinguir hombre o mujer) que hayan participado en dos series de televisión (instancia de dbo:TelevisionShow), ambas del género “comedia de situación” (valor dbr:Sitcom para la propiedad dbo:genre), tal que una de ellas tiene más de 5 temporadas (dbo:numberOfSeasons) y la otra menos de 5 temporadas. Las series tienen la propiedad dbo:starring con valor actor que participa en ella. Ordenar los resultados de menor a mayor por el nombre del actor. Se muestra a continuación el esqueleto de la consulta, incluyendo una definición de prefijos (no es necesario copiarlos a la solución), algunos de los cuales se han usado en la descripción de la consulta a realizar. PREFIX PREFIX PREFIX PREFIX

foaf: rdf: dbo: dbr:

SELECT DISTINCT ?nombre WHERE { }

SOLUCIÓN SELECT DISTINCT ?nombre WHERE { ?actor foaf:name ?nombre. ?serie1 dbo:starring ?actor. ?serie2 dbo:starring ?actor. ?serie1 rdf:type dbo:TelevisionShow. ?serie2 rdf:type dbo:TelevisionShow. ?serie1 dbo:genre dbr:Sitcom. ?serie2 dbo:genre dbr:Sitcom. ?serie1 dbo:numberOfSeasons ?numTemp1. FILTER (?numTemp1 > 5) ?serie2 dbo:numberOfSeasons ?numTemp2. FILTER (?numTemp2 < 5) } ORDER BY ?nombre

Pág. 7 / 11

Examen Sistemas Inteligentes 16 de mayo de 2019

APELLIDOS:

NOMBRE:

Duración: 1 hora 50 mins No se permiten móviles, libros, apuntes, ni calculadora Realice los ejercicios en hojas separadas, incluidos en blanco No se levante del asiento salvo para entregar el examen Ejercicio 4:

[15 puntos]

a) Dada la t-conorma S(x,y) = Min(1, x + y), calcular su t-norma dual. Si es necesario, tomar como negación N(x) = 1 – x. b) La siguiente figura muestra el conjunto borroso que definen el valor Baja de la variable “carga de ropa de una lavadora”. CARGA

Baja 1

Kg

0 0

2

4

6

8

10

Obtener el grado de verdad de las siguientes expresiones: b1) 2.4 kg es carga baja pero 6.8 kg es alta. b2) Si 2.4 kg no es carga baja, 6.8 kg es carga muy alta. En caso de que sea necesario utilizar las funciones: • T-norma = T(x,y) = x * y • T-conorma = S(x,y) = x + y – x*y • Implicación = J(x,y) = 1 – x + x*y Solución: a) Si S es una t-conorma y N es una negación fuerte entonces S*(x,y) = N(S(N(x),N(y))) es una t-norma que se denomina t-norma dual de S. En el caso del ejercicio: S*(x,y) = N(S(N(x),N(y))) = 1 – S(1 – x, 1 – y) = 1 – Min(1, 1 – x + 1 – y) = = Max(1 – 1, 1 – (1 – x + 1 – y)) = Max(0, x + y – 1) Obsérvese que 1 – Min(a, b) = Max(1 – a, 1 – b) b) b1) 2.4 kg es carga baja pero 6.8 kg es alta. µBaja(2.4) = 0.8 µAlta(6.8) = µBaja(10 – 6.8) = µBaja(3.2) = 0.4 µBaja Ù Alta(2.4,6.8) = T(µBaja(2.4), µAlta(6.8)) = T(0.8,0.4) = 0.8 * 0.4 = 0.32 b2) Si 2.4 kg no es carga baja, 6.8 kg es carga muy alta. µ¬Baja(2.4) = 1 – µBaja(2.4) = 1 – 0.8 = 0.2 µMuy Alta(6.8) = µAlta(6.8)2 = 0.42 = 0.16 µ¬Baja ® Muy Alta(2.4, 6.8) = J(µ¬Baja(2.4), µMuy Alta(6.8)) = J(0.2,0.16) = = 1 – 0.2 + 0.2*0.16 = 0.832

Pág. 8 / 11

Examen Sistemas Inteligentes 16 de mayo de 2019

APELLIDOS:

NOMBRE:

Duración: 1 hora 50 mins No se permiten móviles, libros, apuntes, ni calculadora Realice los ejercicios en hojas separadas, incluidos en blanco No se levante del asiento salvo para entregar el examen Ejercicio 5:

[18 puntos]

A dos hermanos, Pepe y Juan, les gusta jugar al Piedra, Papel y Tijera. En este juego, después de elegir ambos su jugada, el ganador cobra del perdedor su dinero del fin de semana (1 euro). Pepe ha observado en el pasado que, en este juego, su hermano Juan juega Papel en el 60% de los casos y Piedra o Tijera de forma igual en el restante 40%. Pepe quiere modelizar el juego como un problema de decisión de Markov, para saber cual sería su mejor jugada. a) Realiza la modelización de este problema como proceso de decisión de Markov, tal como lo haría Pepe. Especifica los estados, las acciones que puede realizar Pepe con sus respectivas recompensas y transiciones. NOTA: Piensa en cómo Pepe puede modelar, desde su punto de vista, la decisión que realizará su hermano. Desde su punto de vista, la jugada de Juan es una incógnita. b) Suponiendo que la constante de descuento γ tenga el valor 1, calcula los valores de la de la funcione valor-estado-acción (Q∗) mediante el algoritmo de iteración de valores. Presenta la evolución de los valores al ejecutar el algoritmo. ¿Cuál es la mejor jugada de Pepe? Juego Piedra-Papel-Tijera: dos jugadores A y B eligen al mismo tiempo uno de los tres valores. El resultado se determina de la siguiente forma:

B-Piedra B-Papel B-Tijera

A-Piedra empate Gana B Gana A

A-Papel Gana A empate Gana B

A-Tijera Gana B Gana A empate

Solución: a) Lo importante aquí es determinar como incluir la jugada de Juan en el modelo de Pepe. Desde su punto de vista, la jugada de Juan hace que su propia jugada se convierte en no determinista. Por ejemplo, si juega papel, el estado resultante podría ser papel-papel, papel-tijera o papel-piedra. Basado en esta idea, se modela el problema como sigue.

Pág. 9 / 11

Examen Sistemas Inteligentes 16 de mayo de 2019

APELLIDOS:

NOMBRE:

Duración: 1 hora 50 mins No se permiten móviles, libros, apuntes, ni calculadora Realice los ejercicios en hojas separadas, incluidos en blanco No se levante del asiento salvo para entregar el examen

Pi-pi

0,2

0,2 0,2

Pi-ti

SF

p/-1 SF

0,2

S0 Tijera/0

0,6

SF

0,6 Pa-pa

0,2 Ti-pi

p/-1

Pa-ti

0,2

Pi-pa

SF

Papel/0

Piedra/0 g/1

g/+1

Pa-pi

0,6

Ti-ti

Ti-pa g/+1

p/-1

SF

SF

b) Q*(s0,pi)

Q*(s0,pa)

Q*(s0,ti)

Q*( pi-pa,p)

Q*( pi-ti,g)

Q*( ti-pi,p)

Q*( ti-pa,g)

Q*( pa-pi,g)

Q*( pa-ti,p)

0 -0,4 -0,4

0 0 0

0 0,4 0,4

-1 -1 -1

1 1 1

-1 -1 -1

1 1 1

1 1 1

-1 -1 -1

La mejor jugada de Pepe es tijera.

Pág. 10 / 11

Examen Sistemas Inteligentes 16 de mayo de 2019

APELLIDOS:

NOMBRE:

Duración: 1 hora 50 mins No se permiten móviles, libros, apuntes, ni calculadora Realice los ejercicios en hojas separadas, incluidos en blanco No se levante del asiento salvo para entregar el examen Ejercicio 6:

[7 puntos]

Diseñe una neurona perceptron (con función de activación umbral) con 3 entradas (binarias) que calcule la siguiente función: La salida tiene valor 1, si la primera entrada tiene valor 0 y la segunda o la tercera entrada, o ambas tienen valor 1. En todos los demás casos la salida de la neurona es 0. Diseñe la estructura de la red y especifique pesos y el sesgo adecuados para que el comportamiento corresponda al cálculo de la función descrita. Solución:

W1=-2

W2=1 W0=-0,5

W3=1

Pág. 11 / 11...