SEARCH
You are in browse mode. You must login to use MEMORY

   Log in to start

level: Level 1

Questions and Answers List

level questions: Level 1

QuestionAnswer
En los cubos OLAP, las dimensiones representan las variables, categorías o atributos que definen los datos almacenados, estás dimensiones permiten organizar y estructurar la información en el cubo, proporcionando un marco para realizar análisis multidimensionales Es cierto o falso?Cierto
Que observas en la imagen?Estructura XML
Elemento XML que en conjunto permite crear un cubo para realizar análisis<schema>, <cube>, <physicalSchema>
“Base de datos multidimensional basada en arreglos que hace posible procesar y analizar múltiples dimensiones de datos de manera mucho más rápida y eficiente que una base de datos relacional tradicional”Cubo OLAP
En el análisis del diseño de los cubos, ¿cuáles son los puntos importantes?*Hechos: Actividad objeto del análisis *Indicadores: Métricas o variables a analizar *Dimensiones: Perspectiva de análisis
En el caso de SVM lineal, la ecuación que define el hiperplano es:w⋅x+b=0
Requisitos para el diseño de los cubos OLAPRequerimientos Análisis Determinar Jerarquías de dimensiones Diseño multidimensional
En el caso de SVM lineal, la ecuación que define el hiperplano es:w⋅x+b=0
¿Cuál es el objetivo principal de SVM?Es maximizar el margen entre las clases y minimizar los errores de clasificación
En el caso de SVM lineal, la ecuación que define el hiperplano es...w⋅x+b=0
¿Cuáles son Los tipos de servidores en los cubos?OLAP-ROLAP:Está basado en los modelos relacionales DBMS. OLAP-MOLAP: Está basado en DBMS multidimensionales para su almacenamiento y acceso a los datos.
¿Cuál es el objetivo principal de SVM?Es maximizar el margen entre las clases y minimizar el error de clasificación
El proceso de Minería de Datos de esta metodología se compone de las siguientes etapas: - Muestreo - Exploración - Modificación - Modelado - Evaluación (Valoración)Metodología SEMMA
Pregunta audioBits
¿Cómo se puede expresar el problema de construir un árbol de decisiónRecursivamente
¿Cómo se llama la medida de impureza que se usa en un árbol de decisión?Información
¿Cuál es el primer paso que se debe de hacer en Spoon?Hacer una conexión a la base de datos Origen y a la Destino
¿Cuál es la metodología a seguir para la creación de cubos OLAP?Metodología
Se le conoce como...Transformación
¿Para qué se definen los dos tipos de elementos: Transformations y Jobs en Spoon?Se define Transformations para transformar los datos, describiendo flujos de datos para ETL. Se definen Jobs para organizar tareas y transformaciones estableciendo su orden y condiciones de ejecución
¿Qué representa?Las etapas del proceso de Descubrimiento de Conocimiento en Bases de Datos (Knowledge Discovery in Databases, KDD)
Con la imagen nos referimos a...La Metodología CRISP-DM
¿Cuáles con las actividades de la etapa de Procesamiento de Datos en el KDD? (Knowledge Discovery in Databases, KDD)Las actividades de esta etapa son: - Limpieza de datos (data cleaning) - Transformación de los datos - Reducción de dimensionalidad
Usa el enfoque de divide y vencerásÁrboles de decisión
Límite de decisión que separa puntos de datos en diferentes clases en un espacio de alta dimensiónHiperplano
¿Qué significa SVM por sus siglas en inglés?Support Vector Machine
¿Cuáles son las diferencias entre OLTP y OLAP?OLTP es un sistema de modificación de datos online, mientras que OLAP es un sistema de recuperación de datos multidimensionales históricos en línea
¿Cuál es el término para esta definición?Bagging
¿Qué representa la imagen?Bosque aleatorio
¿Cómo se define un boque aleatorio?Conjunto de árboles de decisión dónde cada árbol se entrena en una muestra aleatoria de datos y contribuye a la predicción final
¿Cómo se decide la predicción final en los bosques aleatorios?Para clasificación: Votación Para regresión: Promedio
¿Qué es la minería de datos?Técnicas para el descubrimiento automatizado eficiente de patrones previamente desconocidos, válidos, novedosos, útiles y comprensibles en grandes bases de datos.
¿A qué se refiere la siguiente imagen?Proceso de la minería de datos
Técnica de la minería de datosModelado predictivo
Técnica que se basa en el concepto de agrupación de datos y se incluye en el aprendizaje no supervisado, donde los datos no están etiquetados.Segmentación de bases de datos
¿Cuál es la estructura de una función en R y describe brevemente cada una de sus partes ?Entradas o argumentos: sirven para ingresar información Cuerpo: está formado por un conjunto de instrucciones Salidas: son los resultados de la función. Toda función debe tener al menos un resultado.
Tu cliente que en este caso es una escuela privada te pide analizar su base de datos, al comenzar de lo primero que te percatas es que gay un campo que posee valores categóricos lo que significa que esos valores no están ordenados, qué harías para que ese campo sea útil a la hora de extraerlo y usarlo en un algoritmoUtilizar la funcion revalue y con ello reemplaza valores en la variable dada en la entrada x, de acuerdo con las reglas dadas en la entrada de reemplazo.
¿De que tipo es la siguiente grafica?Gráficos de barras con una superposición de respuesta para explorar la relación entre un predictor categórico.
El cliente o el analista pueden no tener nociones a priori destacadas sobre lo que los datos podrían revelar. En tales casos,¿Qué es lo que le permite hacer el análisis exploratorio de datos (EDA) o el análisis gráfico de datos?Gráficas para explorar la relación entre las variables predictoras y la variable objetivo
¿Qué es un árbol de decisión?crea modelos de regresión o clasificación en forma de estructura de árbol.
En los árboles de decisión, ¿para qué se utiliza está fórmula?La desviación estándar se utiliza para calcular la homogeneidad de una muestra numérica.
¿Cuáles son algunas métricas comunes utilizadas para evaluar la calidad de los modelos de regresión?R-squared MSE MAE RMSE
En la matriz de confusión, ¿qué representan los verdaderos positivos?Esto representa casos que se pronostican como Sí y en realidad, los casos son Sí.
El resultado a predecir no es una clase discreta sino una cantidad numericaPredicción numérica
Sirve para identificar patrones que permiten explorar las propiedades de los datosModelo descriptivo