Examen Anal à tica de Negocios y Big Data Abril-Mayo 2021 PDF

Title Examen Anal à tica de Negocios y Big Data Abril-Mayo 2021
Author Rodrigo Langenhin
Course Analítica de negocios y big data
Institution Universidad ORT Uruguay
Pages 13
File Size 816.8 KB
File Type PDF
Total Downloads 66
Total Views 144

Summary

asdasda...


Description

28/7/2021

Pregunta

CUESTIONARIO - Analítica de Negocios y Big Data - 7548 - Examen de fecha - 14/5/2021 - Hora 12:00

1

Sin responder aún Puntúa como 5,00

¿En base a la siguiente regresión lineal en R, existe un problema de multicolinealidad?

a. Si, las variables Postulantes y Aceptados presentan valores altos en la función VIF. b. Si, las variables Postulantes y Aceptados por un lado y las variables Costo_Libros y Privado por otro tienen valores similares en la función VIF. c. Si, la variable Costo_Libros no es significativa. d. No, si bien las variables Postulantes y Aceptados tiene alto VIF, ambas son significativas dentro del modelo por lo que se descarta la multicolinealidad.

https://aulas.ort.edu.uy/mod/quiz/attempt.php?attempt=227957&cmid=329839

1/13

28/7/2021 Pregunta

CUESTIONARIO - Analítica de Negocios y Big Data - 7548 - Examen de fecha - 14/5/2021 - Hora 12:00 2

Sin responder aún Puntúa como 5,00

Usted cuenta con datos de una muestra de universidades de Estados Unidos. Está interesado en poder predecir si una Universidad es privada o no. En función de la siguiente salida de R, diga si la siguiente afirmación es Verdadera o Falsa. "Un incremento en la tasa de graduados genera una disminución en la probabilidad de que la universidad sea privada dejando todo lo demás constante".

Seleccione una: Verdadero Falso

https://aulas.ort.edu.uy/mod/quiz/attempt.php?attempt=227957&cmid=329839

2/13

28/7/2021 Pregunta

CUESTIONARIO - Analítica de Negocios y Big Data - 7548 - Examen de fecha - 14/5/2021 - Hora 12:00 3

Sin responder aún Puntúa como 5,00

Usted cuenta con datos sobre una muestra de Universidades de Estados Unidos. Está interesado en predecir la tasa de graduados. Para ello cuenta con las siguientes variables: Privado (Categorica, vale Si o No), Postulantes y Ratio Alumno Profesores. En base al siguiente gráfico, indique cuáles de las reglas presentadas a continuación corresponden al nodo terminal 15 (marcado en amarillo).

a. Aquellas universidades que son privadas, que reciben 1717 postulaciones o más y el ratio alumno profesor es menor a 10. b. Aquellas universidades que son privadas, que reciben 1717 postulaciones o más y el ratio alumno profesor es mayor o igual a 10. c. Aquellas universidades que son NO son privadas, que reciben 1717 postulaciones o más y el ratio alumno profesor es menor a 10. d. Aquellas universidades que son privadas, que reciben 1717 postulaciones o menos y el ratio alumno profesor es menor a 10.

Pregunta

4

Sin responder aún Puntúa como 5,00

De las siguientes afirmaciones señale la correcta:

Seleccione una: a. En el aprendizaje supervisado se utilizan una serie de inputs (Xs) para realizar predicciones sobre una variable output (Y). b. El aprendizaje no supervisado consiste en estimar un modelo predictivo. c. En el aprendizaje supervisado se utilizan una serie de variables para formar grupos (clusters) de observaciones.

https://aulas.ort.edu.uy/mod/quiz/attempt.php?attempt=227957&cmid=329839

3/13

28/7/2021 Pregunta

CUESTIONARIO - Analítica de Negocios y Big Data - 7548 - Examen de fecha - 14/5/2021 - Hora 12:00 5

Sin responder aún Puntúa como 5,00

Usted cuenta con datos sobre una muestra de universidades de Estados Unidos. Está interesado en analizar la tasa de graduados (el porcentaje de estudiantes que efectivamente termina la carrera). En base a la siguiente salida del R, interprete el valor del coeficiente asociado a la variable Ratio_Alum_Prof (el ratio entre la cantidad de alumnos y profesores):

a. Un aumento de un punto en la variable Ratio_Alum_Prof dejando las demás variables constantes, provoca un incremento en el valor promedio de la tasa de graduados de 0,62. b. Un aumento de un punto en la variable Ratio_Alum_Prof dejando las demás variables constantes, provoca una disminución en el valor promedio de la tasa de graduados de 0,16.

c. Un aumento de un dólar en la variable Ratio_Alum_Prof, provoca un aumento en la tasa de graduados de 0,62. d. Un aumento de un punto en la variable Ratio_Alum_Prof dejando las demás variables constantes, provoca una disminución en el valor promedio de la tasa de graduados de 0,62.

Pregunta

6

Sin responder aún Puntúa como 5,00

Seleccione el enunciado que es VERDADERO respecto a los modelos de Árboles. a. Es necesario calcular los VIF para detectar problemas de multicolinealidad. b. Los árboles pueden manejar fácilmente predictores cualitativos por lo que no es necesario crear variables ficticias para incluirlas en el árbol. c. Los árboles de decisión no pueden predecir variables continuas d. No es posible inferir reglas a través de los árboles de regresión o clasificación

https://aulas.ort.edu.uy/mod/quiz/attempt.php?attempt=227957&cmid=329839

4/13

28/7/2021 Pregunta

CUESTIONARIO - Analítica de Negocios y Big Data - 7548 - Examen de fecha - 14/5/2021 - Hora 12:00 7

Sin responder aún Puntúa como 5,00

El intervalo de confianza a 95% para la variable Income es:

Seleccione una: a. (39.11, 51.32)

b. (45.05, 45.39)

c. (29.67, 36.57)

d. (41.75, 48.68)

Pregunta

8

Sin responder aún Puntúa como 5,00

Suponga que una empresa fabrica bolsas. La producción mensual de la misma es de 130.000, se espera que la resistencia media de las bolsas sea de 50 kg. Para verificar la resistencia media de las bolsas, el consultor saca una muestra de 100 bolsas y obtiene como resultado una resistencia media de 42 kg. ¿Cuál sería el estadístico para probar si la resistencia media de las bolsas es efectivamente 50 km bajo el supuesto de conocer que el desvío estándar es 17.5?.

Seleccione una: a. 45.7 b. -4.57 c. 4.57 d. -45.7

https://aulas.ort.edu.uy/mod/quiz/attempt.php?attempt=227957&cmid=329839

5/13

28/7/2021 Pregunta

CUESTIONARIO - Analítica de Negocios y Big Data - 7548 - Examen de fecha - 14/5/2021 - Hora 12:00 9

Sin responder aún Puntúa como 5,00

Para evaluar la clasificación en una regresión logística calculamos la matriz de confusión. El valor de especificidad es: a. La cantidad de falsos positivos más falsos negativos sobre la cantidad de observaciones. b. La cantidad de verdaderos positivos más verdaderos negativos sobre la cantidad de observaciones c. La cantidad de verdaderos positivos sobre la cantidad de positivos d. La cantidad de verdaderos negativos sobre la cantidad de negativos.

Pregunta

10

Sin responder aún Puntúa como 5,00

En base al siguiente gráfico, cuantos nodos seleccionaría para podar el árbol original:

a. 5 b. 6 c. 3 d. 4 e. 1

https://aulas.ort.edu.uy/mod/quiz/attempt.php?attempt=227957&cmid=329839

6/13

28/7/2021 Pregunta

CUESTIONARIO - Analítica de Negocios y Big Data - 7548 - Examen de fecha - 14/5/2021 - Hora 12:00 11

Sin responder aún Puntúa como 5,00

En base a la siguiente salida de R donde se ha aplicado la técnica de Cluster k-means a una muestra de Universidades de Estados Unidos, seleccione el enunciado VERDADERO.

a. La distancia entre los centroides cuanto explica un 45.6% de la variabilidad total de los datos. b. La suma total de la variación dentro del cluster 1 es 11.95 c. Se han armado 5 clusters. d. El cluster 1 es el más homogeneo.

https://aulas.ort.edu.uy/mod/quiz/attempt.php?attempt=227957&cmid=329839

7/13

28/7/2021 Pregunta

CUESTIONARIO - Analítica de Negocios y Big Data - 7548 - Examen de fecha - 14/5/2021 - Hora 12:00 12

Sin responder aún Puntúa como 5,00

Usted cuenta con datos sobre una muestra de Universidades de Estados Unidos. Está interesado en predecir la tasa de graduados. Para ello cuenta con las siguientes variables: Privado (Categorica, vale Si o No), Postulantes y Ratio Alumno Profesores. En base al siguiente gráfico, indique cuál será la respuesta predicha para las universidades que pertenecen al nodo 15 marcado en amarillo.

a. 15 b. 87 c. 49 d. 6

Pregunta

13

Sin responder aún Puntúa como 5,00

En la selección de variables de un modelo, el método de selección Backward: Seleccione una: a. Se comienza con un modelo con una constante, se estiman p regresiones simples y se agrega al modelo inicial la variable que resulta del modelo con menor RSS. Luego se estiman los modelos con 2 variables (dejando la que ya se incorporó) y se agrega la variable del modelo con menor RSS. Este proceso continúa hasta que se cumpla cierta regla de finalización.

b. Ninguna de las anteriores.

c. Se comienza con un modelo sin variables. Se agrega la variable que ajusta mejor. Continuamos agregando variables una por una. Si en algún momento el p-value para alguna de las variables en el modelo se eleva por encima de un cierto umbral, entonces eliminamos esa variable. Continuamos realizando estos pasos hacia adelante y hacia atrás hasta que todas las variables en el modelo tengan un p-value suficientemente bajo, y todas las variables fuera del modelo tendrían un valor p grande si se agregan al modelo.

d. Se comienza con todas las variables en el modelo y se elimina la variable con mayor p-value (la que es menos significativa). Luego se estima el modelo con (p-1) variables y se vuelve a eliminar la variable con mayor p-value. Esto continúa hasta que se alcanza una regla de detención. Por ejemplo, podemos detenernos cuando todas las variables restantes tienen un valor p por debajo de algún umbral.

https://aulas.ort.edu.uy/mod/quiz/attempt.php?attempt=227957&cmid=329839

8/13

28/7/2021 Pregunta

CUESTIONARIO - Analítica de Negocios y Big Data - 7548 - Examen de fecha - 14/5/2021 - Hora 12:00 14

Sin responder aún Puntúa como 5,00

En base a la siguiente salida del R, que características tiene el cluster número 3:

a. La mayor cantidad de postulaciones y gasto junto con el menor ratio alumno profesor y tasa de graduados. b. La mayor cantidad de postulaciones, gasto y tasa de graduados junto con el menor ratio alumno profesor. c. La mayor cantidad de postulaciones, gasto, tasa de graduados y ratio alumno profesor. d. La menor cantidad de postulaciones, gasto y tasa de graduados junto con el menor ratio alumno profesor.

https://aulas.ort.edu.uy/mod/quiz/attempt.php?attempt=227957&cmid=329839

9/13

28/7/2021 Pregunta

CUESTIONARIO - Analítica de Negocios y Big Data - 7548 - Examen de fecha - 14/5/2021 - Hora 12:00 15

Sin responder aún Puntúa como 5,00

Dados los siguientes modelos de regresión lineal señale cuál afirmación es FALSA.

a. El residual standard error en el modelo 1 es menor que en el modelo 2. b. En ambos modelos la variable a predecir es la Tasa de Graduados c. En ambos modelos todas las variables incluidas son significativas a un nivel del 10% o menos. d. El R2 ajustado del modelo 2 (en train) es menor que el del modelo 1 (en train).

https://aulas.ort.edu.uy/mod/quiz/attempt.php?attempt=227957&cmid=329839

10/13

28/7/2021 Pregunta

CUESTIONARIO - Analítica de Negocios y Big Data - 7548 - Examen de fecha - 14/5/2021 - Hora 12:00 16

Sin responder aún Puntúa como 5,00

En base a la siguiente matriz de confusión seleccione la opción correcta.

a. La sensibilidad es de 0.70 y la especificidad de 0.96 b. La sensibilidad es de 0.96 y la especificidad de 0.70 c. La sensibilidad es de 0.78 y la especificidad de 0.94 d. La sensibilidad es de 0.94 y la especificidad de 0.78

Pregunta

17

Sin responder aún Puntúa como 5,00

En base a la siguiente salida de R, seleccione la afirmación correcta.

a. La variable Tasa_graduados presenta un estadístico t igual a 0.0076 y por lo tanto se rechaza la hipótesis nula de que el parámetro es igual a 0. b. La variable Tasa_graduados presenta un estadístico t igual a 7.97 y por lo tanto se rechaza la hipótesis nula de que el parámetro es igual a 0. c. La variable Tasa_graduados presenta un estadístico t igual a 7.97 y por lo tanto NO se rechaza la hipótesis nula de que el parámetro es igual a 0. d. La variable Tasa_graduados presenta un estadístico t igual a 0.0076 y por lo tanto NO se rechaza la hipótesis nula de que el parámetro es igual a 0.

https://aulas.ort.edu.uy/mod/quiz/attempt.php?attempt=227957&cmid=329839

11/13

28/7/2021 Pregunta

CUESTIONARIO - Analítica de Negocios y Big Data - 7548 - Examen de fecha - 14/5/2021 - Hora 12:00 18

Sin responder aún Puntúa como 5,00

¿Por qué es necesario dividir la muestra en training y testing antes de estimar un modelo? Seleccione una: a.

Ninguna de las anteriores.

b. Para evitar poner variables explicativas que no son significativas.

c. Para evitar poner variables multicolineales en el modelo.

d. Para verificar que el modelo no produce un sobre-ajuste.

Pregunta

19

Sin responder aún Puntúa como 5,00

¿ Cuando se utiliza una regresión logística en vez de una regresión lineal? Seleccione una: a. Cuando la variable a explicar es categorica.

b. Cuando la variable a explicar tiene mucha dispersión.

c. Cuando se tienen muchas variables explicativas.

d. Cuando existen problemas de multicolinealidad

Pregunta

20

Sin responder aún Puntúa como 5,00

Cuál es el código que debemos utilizar para aplicar la técnica cluster Kmeans en R dado que la base de datos Mydata no se encuentra estandarizada, la cantidad k de cluster es 3 y se van a utilizar mas de un conjunto aleatorio para la implementación del algoritmo.

a. kmeans(scale(Mydata), 3, nstart=1) b. kmeans(Mydata, 3, nstart=1) c. kmeans(scale(Mydata), 1, nstart=3)

d. kmeans(Mydata, 1, nstart=3)

e. kmeans(scale(Mydata), 3, nstart=20)

f.

kmeans(Mydata, 3, nstart=20)

◄ CUESTIONARIO - Analítica de Negocios y Big Data - 7548 - Examen de fecha - 14/5/2021 - Hora 12:00 (oculto) Ir a... TAREA - Analítica de Negocios y Big Data - 7548 - Examen de fecha 17/2/2021 - Hora 19:00 (oculto) ►

https://aulas.ort.edu.uy/mod/quiz/attempt.php?attempt=227957&cmid=329839

12/13

28/7/2021

CUESTIONARIO - Analítica de Negocios y Big Data - 7548 - Examen de fecha - 14/5/2021 - Hora 12:00

https://aulas.ort.edu.uy/mod/quiz/attempt.php?attempt=227957&cmid=329839

13/13...


Similar Free PDFs