Big Data - Universidad Siglo 21
![]() |
![]() |
![]() |
Título del Test:![]() Big Data - Universidad Siglo 21 Descripción: Materia Big Data de la universidad Siglo 21. ues21. Siglo XXI. 1° y 2° parcial Fecha de Creación: 2022/07/31 Categoría: Universidad Número Preguntas: 89
|




Comentarios |
---|
NO HAY REGISTROS |
2.4.5 La empresa para la que trabajas, te pregunta para que puede ser usada la información o … obtiene al emplear técnicas de minería de datos que propusiste. Seleccione las 4 respuestas. La empresa puede usar la minería de datos para mejorar las relaciones con los clientes. La empresa puede usar la minería de datos para aumentar los ingresos. La empresa puede usar la minería de datos para reducir los riesgos. La empresa puede usar la minería de datos para reducir los costos. La empresa puede usar la minería de datos para aumentar sus precios. 2.3.1 ¿Qué tipo de almacenamiento es que utilizan los sistemas corporativos?. Transaccionales. Digitales. 2.4.1 Te postulaste para una vacante de científico de datos en una compañía financiera, ¿Qué es lo que están buscando para esa vacante?. Se trata de una persona formada en las ciencias matemáticas y las estadísticas que domina la programación y sus diferentes lenguajes, ciencias de la computación y analítica. 2.3.1 ¿En qué etapa del ETL se puede procesar una longitud inconsistente de campos?. Transformación. Carga. Descarga. Extracción. 1.1.3 ¿Cuál es el objetivo general de la Inteligencia de Negocios o Business Intelligence?. La toma de decisiones. Optimizar la rentabilidad de una organización. Obtener recursos para realizar análisis. 2.2.1 ¿Quién es el responsable de definir el medio de almacenamiento de los datos?. Arquitecto de datos. Ingeniero de datos. Científico de datos. Analista de datos. 1.1.1 eres un consultor de Big Data en la empresa y el director, te pide que le especifiques que ventaja obtiene aplicando este tipo de tecnología si tenemos en cuenta la velocidad de los datos. ¿Qué responderías?. Para la empresa, la velocidad de los datos será ventajosa para la toma de decisiones. Para la empresa, la velocidad de los datos será ventajosa para comprender al consumidor o usuario. Para la empresa, la velocidad de los datos será ventajosa para realizar los análisis necesarios. Para la empresa, la velocidad de los datos será ventajosa para obtener una ventaja sobre la competencia. 1.1.3 Cuando hablamos de la característica “volumen” en Big Data, ¿Cuál es la visión respecto a la utilidad de los datos?. Algunos datos no serán útiles por falta de calidad o porque no forman parte de la estrategia de análisis. 2.4.5 A la minería de datos también se la conoce por otros nombres como: extracción de conocimiento… isis de patrones y datos, machine learning, entre otros. Verdadero. Falso. 2.4.3 ¿Cuáles son etapas del proceso de descubrimiento de conocimiento o KDD? Seleccione las 4 correctas. Selección de los datos. Transformación de los datos. Preprocesamiento de datos. Minería de datos. Clustering. 1.2.3 ¿Por qué los Smartphone son una fuente de datos valiosa para las empresas que nos ofrecen aplicaciones gratuitas?. Porque para interactuar con aplicaciones previamente tenemos que identificarnos con un usuario, y ello permite crear perfiles personales y recopilar hábitos de consumo. Porque pueden recopilar información del contenido de nuestros mensajes y llamadas personales. Porque pueden hacer un seguimiento preciso de nuestra ubicación a cada momento. Porque sus aplicaciones ganan visibilidad y luego estas empresas pueden ser vendidas a compañías internacionales como Google o Facebook. Porque una vez que utilizamos estas aplicaciones luego nos ofrecerán servicios premium pagos. 1.1.4 Respecto a la característica “Veracidad” en Big Data, ¿a qué hace referencia?. A la calidad de los datos que se utilizan para el análisis. A la cantidad de datos que se utilizan para el análisis. A la fuente de los datos que se utilizan para el análisis. 1.2.4 “He observado diferencias de tipo sintácticas en los datos, a la hora de migrarlos desde fuentes de datos origen al Data Lake (laguna de datos)”. Esto dijo el encargado de migrar los datos ¿a qué está haciendo referencia?. Está haciendo referencia a que hay información escrita de diferente manera, pero que puede ser igualmente válida. 2.3.4 ¿Cuáles son las herramientas de consulta con las que finalmente se accederá al almacén de datos? Seleccione la opción correcta. Aplicaciones para consultas ad hoc e informes; aplicaciones de consulta de directivos; herramientas OLAP, Herramientas de minería de datos. Aplicaciones para consultas ad hoc e informes; aplicaciones de consulta de directivos; herramientas OLAP, Herramientas de minería de datos. Data marts; ETL; EDW; herramientas OLAP; Hadoop; Spark. 1.1.1 Seleccione las 2 opciones correctas. En una empresa de productos electrónicos, se está analizando la implementación de tecnología Big Data. ¿Cuáles son las principales ventajas que se obtendrían?. Visión 360º del cliente, porque le permitirá tener más información sobre sus clientes. Análisis de operaciones, porque la empresa podrá analizar sus transacciones en mejor tiempo y de manera más eficaz. Aumentar los volúmenes de ventas, porque es la consecuencia de aplicar Big Data. Predecir los costos de sus importaciones, porque la empresa podrá analizar mejor y de manera más eficaz los datos. Estimación de comportamientos del mercado, porque les permitirá analizar la balanza comercial. 1.1.6 En una editorial de periódicos están necesitando perfeccionar la cantidad de copias de periódicos que imprimen. Tienen un detalle de las cantidades que día a día se emitieron. Creen que es conveniente contratar un científico de datos para realizar esa tarea. Esto es: Verdadero. Falso. 1.1.2 ¿Qué aporta a las organizaciones un rol más activo y social por parte del usuario de las nuevas tecnologías?. Un ecosistema proclive al intercambio de información. 2.2.2 Mario debe llevar mediante algún proceso, los datos desde los transaccionales a la Data Warehouse. ¿Con cuál de los siguientes puede hacerlo?. Mario debe trabajar con el proceso ETL, porque es el encargado de llevar los datos desde diferentes fuentes a un almacenamiento. Mario debe trabajar con el proceso SSIS, porque es el encargado de llevar los datos desde diferentes fuentes a un almacenamiento. 2.1.1 ¿Cómo se llama el enfoque de almacenamiento de datos que crea, primero el Almacén de datos central completo, y después los data marts para grupos específicos de usuarios?. Enfoque de arriba hacia abajo. Enfoque de abajo hacia arriba. Lateral hacia arriba. Lateral hacia abajo. 1.2.3 una organización está interesada en incorporar Big Data para mejorar en varios aspectos su desempeño en el mercado. Entonces, te consultan respecto las ventajas de este tipo de soluciones para la toma de decisiones. ¿Qué podrías decir respecto a los datos y las nuevas tecnologías de Big Data, con respecto a los sistemas de toma de decisiones tradicionales?. El análisis de datos no estructurados es una ventaja de las nuevas tecnologías de Big Data, porque siempre han sido difíciles de gestionar para los sistemas tradicionales. El análisis de datos estructurados es una ventaja de las nuevas tecnologías de Big Data, porque siempre han sido difíciles de gestionar para los sistemas tradicionales. 2.3.3 Tienes que desarrollar el proceso ETL de la compañía, ¿Qué fases debes cumplir obligatoriamente? Seleccione las 3 opciones correctas. Transformación de datos, porque el proceso de ETL permite reformatear y limpiar datos antes de cargarlos a otra base de datos. Carga de datos, porque el proceso ETL permite mover datos de una fuente para cargarlos a otra. Extracción de datos, porque el proceso ETL permite mover datos de una fuente a otra. Descarga de datos, porque el proceso ETL permite obtener los datos necesarios para la base de datos. 1.2.2 La empresa Analytics está trabajando en la fase de carga de datos en el proceso ETL. ¿Qué valoraciones primordiales deberían tener, estando en la fase de carga de datos? Seleccione la opción correcta. La empresa Analytics debería tener como valoraciones primordiales el destino y nivel de detalle de los datos. La empresa Analytics debería tener como valoraciones primordiales el origen y calidad de detalle de los datos. 1.2 una empresa quiere incorporar Big Data a su compañía pero no está del todo convencida de realizar esta inversión. Entonces, te contratan para asesorarlos. ¿Qué motivo a que Big Data se convierta en una tendencia en la actualidad y podríamos decir que a esta empresa en particular?. La empresa se da cuenta de que no puede almacenar, ni manejar la información de manera convencional. Es una tendencia que surge a partir del auge de las redes sociales. 1.1.5 el área de Stagin, ¿Qué tipo de información almacena?. Información detallada. Accesos a las plataformas. 2.1 ¿Qué significa que un almacén de datos, es variable en el tiempo?. Los datos se cargan con una referencia temporal. Que los datos varían en el tiempo. 1.2.4 Seleccione las 2 respuestas correctas. El área de atención al cliente, recibe reclamos por mail y a través del call center. Si quisiéramos analizar los dos tipos de datos que estas variables representan, diríamos que son: Datos estructurados, porque tienen un formato fijo y preestablecido. No estructurados, porque no tienen un formato determinado y pueden ingresar de cualquier forma. Agrupados, porque representan a ambas variables. 2.4.3 ¿Cuál es el objetivo del proceso de descubrimiento de conocimiento en bases de datos o KDD?. Extraer conocimiento de datos en el contexto de bases de datos grandes mediante minería de datos. 1.1.2 indique que solicitudes se pueden resolver utilizando Data Mining: (Seleccione la opción correcta). Encontrar patrones ocultos y repetitivos. Encontrar relaciones entre tablas del modelo. Descubrir datos históricos. Mejorar la performance en la carga de datos. Obtener funciones logarítmicas. 1.2 Seleccione las 4 respuestas correctas. La compañía de marketing MTK y Cía., debe comenzar a nutrir la laguna de datos. ¿Cuáles pueden ser las fuentes de datos desde donde tomar los datos?. Transacciones, porque tienen información de operaciones monetarias, telefónicas, etc. Machine to machine (M2M), porque implican datos capturados por dispositivos que son retransmitidos a otros a través de redes. Datos biométricos, porque tiene información de las personas que es perfecta. Web y medios sociales, porque abarca datos generados en la internet y en las redes sociales de las personas. Aleatorios, provienen de las diferentes variables de información. 4.1.2 ¿Qué factores influyen en el éxito de implementar BI en una compañía? Selecciones las 4 (cuatro) opciones correctas. Madurez en el mercado. Datos secundarios o de apoyo. Mano de obra de análisis. Calidad de datos como valores incorrectos o faltantes. Apertura organizacional a nuevos resultados. 4.1.2 ¿Es necesario tener un perfil técnico para la visualización de datos?. Es innecesario tener perfil técnico para entender la visualización de datos, pero es importante contar con herramientas tales como el análisis predictivo, la ingeniería de datos, el análisis estadístico, etc. Es necesario tener perfil técnico para entender la visualización de datos aparte de contar con análisis estadísticos, análisis predictivo, conocimiento de diseño y big data. 4.1.5 ¿Cuál es la tendencia en las empresas sobre la utilización de software de gestión de datos masivos?. Las empresas suelen contratar software de visualización. Las empresas suelen contratar software de contabilidad. (3.1.5) Juan quiere utilizar Customer analytics para analizar el comportamiento de los clientes de su industria, y para ello debe explicarle a su equipo las múltiples características que definen este proceso. ¿Cuáles son estas características? Seleccione las 3 tres correctas. Una de las características es la multiplataforma. Una de las características es el multisector. Una de las características es la granularidad del dato. Una de las características es la industria. Una de las características es el enfoque. 3.2.1 ¿Cuál es la metodología de desarrollo más utilizada en Customer Analytics?. KDD. CRM. ETL. 3.2.2 Ana está realizando un proyecto de Customer Analytics y debe definir el/los tipo/s de análisis a realizar. ¿De qué va a depender su elección? (selecciones una opción). Va a depender de la estrategia y tipo de conocimiento. Va a depender de su personalidad y su perfil académico. Va a depender de la estrategia y su perfil. 3.1.3) Qué le permite a una iniciativa de Customer Analytics el hecho de utilizar y Dominar Big Data? (1 OPCION). Lidiar con múltiples fuentes y formatos de datos, Trabajar con grandes volúmenes de datos, Capturar y extraer datos a alta velocidad y Poner el foco en la calidad del dato y de los modelos de análisis. Lidiar con menor cantidad de fuentes y formatos de datos, Trabajar con volúmenes de datos variables, Capturar y extraer datos a alta velocidad y Poner el foco en la calidad del dato y de los modelos de análisis. 3.1.1 De acuerdo a las múltiples características que definen a Customer Analytics, éstas son: seleccione las 4 (cuatro) opciones correctas. Multiplataforma. Longitudinal. La granularidad del dato. Multisector. Volumen. 4.1.1) En un entorno de trabajo Business Intelligence, ¿Cuáles son las dos capas en las que se engloban sus acciones estratégicas? Selecciones la opción correcta. (UNA OPCION). Las acciones estratégicas se engloban en la capa de negocio y en la capa de soporte. Las acciones estratégicas se engloban en la capa de planeamiento y en la capa de soporte. Las acciones estratégicas se engloban en la capa de negocio y en la capa de mantenimiento. Las acciones estratégicas se engloban en la capa de planeamiento y en la capa de mantenimiento. (3.1.6) Cuales son las distintas fases en la evolución del entendimiento del cliente a partir de los datos? Seleccione las 4 (cuatro) correctas: Análisis prescriptivo. Análisis predictivo. Análisis descriptivo. Análisis diagnostico. Análisis cualitativo. 3.2.2 En la empresa de contact center en la cual te encuentras trabajando, se está por implementar un CRM para mejorar las gestiones. ¿Cuál es el objetivo del CRM analítico? (UNA OPCION). El objetivo es comprender el comportamiento del cliente. El objetivo es mejorar la satisfacción del cliente. 4.1.6 Carlos está comentando con sus compañeros cuál es su función como reporting en la empresa en la cual acaba de incorporarse y debe explicarles sobre la visualización de datos ¿Cómo lo explicarías?. Explicaría que es la presentación de datos en un formato gráfico o pictórico. Explicaría que es la presentación de datos en un formato gráfico. Explicaría que es la presentación de datos en un formato pictórico. 4.1.1 ¿Qué nos permite es uso de la visualización de datos? Selecciones las 4 opciones correctas. Disponer de información de manera gráfica y visual. Descubrir estacionalidades en los datos. Identificar visualmente la distribución de un set de datos. Identificar con mayor facilidad comportamientos atípicos en los datos (valores atípicos). Identificar posibilidades de crecimiento. 4.1.2) el análisis visual es un componente del software de inteligencia empresarial que hace hincapié en: (seleccione las dos correctas). Visualizaciones o gráficos como salida. Una interfaz gráfica notablemente fácil. Modelado multidimensional. 3.1.3) Considerando las distintas fases que constituyen la metodología de desarrollo denominada SEMMA: seleccione las 4 opciones correctas. Simple. Model. Modify. Explore. Complex. 4.1.4 Cuando un científico de datos está escribiendo avanzados análisis predictivos o algoritmos de aprendizaje automático, ¿Qué función cumple la visualización de los datos? (UNA OPCION). Visualizar los datos para monitorearlos y garantizar que los modelos funcionen según lo previsto. Visualizar los datos para monitorearlos y analizar como es posible mejorar su imagen. 4.1.6 ¿Cuál es uno de los motivos por los que Excel es considerada una herramienta poco adecuada para Visual Analytics?. Limita severamente el volumen de datos que se puede consultar con éxito. Limita las posibilidades de calculo de datos que se pueden utilizar con éxito. Limita el volumen de datos que se puede consultar con éxito. 4.1.8 Juan, gerente comercial de la empresa Granos SRL, necesita ir monitoreando los movimientos de los productos para ir haciendo ajuste en la operación del negocio. ¿Qué tipo de gráficos se usa para mostrar en tiempo real datos de big data?. Se utiliza cuadros de mando empresariales o dashboards. Se utiliza SAP Business Objects Analysis. Se utiliza organigramas específicos. Se utiliza algún software especializado para visualización de datos. 3.1.4 Cuales son las metodologías de desarrollo más utilizadas en Customer Analytics? Seleccione las 3 tres correctas: KDD. CRISP-DM. SEMMA. ERP. CRM. 3.1 Juan les dice a sus empleados que la empresa busca comprender la relación del cliente y la organización a largo plazo. ¿A que categoría de conocimiento hace referencia?. Hace referencia al ciclo de vida. 3.2.1 ¿Cuál es la metodología de desarrollo más utilizada en Customer Analytics?. KDD. CRM. 4.1.1) Big data, con sus vastos volúmenes de datos, es en gran medida inútil sin la funcionalidad de análisis y presentación de datos que se encuentra en las herramientas de análisis visual. Verdadero. Falso. 3.1.4) Carlos va a utilizar un análisis de afinidad para hacer minería de datos en la empresa en la cual está trabajando. ¿Qué es el análisis de afinidad?. Es un análisis de datos y una técnica de minería de datos que busca relaciones entre actividades realizadas (o registradas) de individuos, grupos u objetos. Es un análisis de datos y una técnica de minería de datos que mide el tiempo entre actividades realizadas (o registradas) de individuos, grupos u objetos. 4.1.3 La visualización de datos utiliza gráficos, generalmente interactivos, para exponer grandes cantidades de números de manera artística, haciendo más fácil su comprensión. Verdadero. Falso. 4.1 Algunas de las ventajas de los informes clásicos reutilizables son (una opcion correcta). Producen un excelente resultado para consultas rutinarias. Poseen un mantenimiento de software cuando se actualicen las versiones de las aplicaciones subyacentes. (4.1.6) Algunas de las ventajas de los informes clásicos reutilizables son: seleccione las 2 opciones correctas. Producen un excelente resultado para consultas rutinarias. Ofrecen resultados confiables y consistentes porque los informes son cuidadosamente desarrollados y probados. Poseen un mantenimiento de software cuando se actualicen las versiones de las aplicaciones subyacentes. (4.1.6) Algunas de las ventajas de los informes clásicos reutilizables son: seleccione las 3 (tres) opciones correctas. Producen un excelente resultado para consultas rutinarias. Ofrecen resultados confiables y consistentes porque los informes son cuidadosamente desarrollados y probados. Se pueden producir de manera eficiente cuando el volumen de datos es modesto y la cantidad de fuentes de datos es baja. Poseen un mantenimiento de software cuando se actualicen las versiones de las aplicaciones subyacentes. 3.2.1 ¿Mediante qué tipo de análisis se puede mejorar la colocación de los productos en un supermercado, catalogo o web de comercio electrónico?. Análisis de cesta de compras. 4.1.6 te solicitan armar un conjunto de gráficos para mostrar distintas perspectivas de la compañía. ¿Quién demanda un diseño a medida de los gráficos diseñados en big data?. El negocio demanda gráficos diseñados en big data. El cliente demanda gráficos diseñados en big data. 3.1.5 En el call center se están aplicando distintas funcionalidades del CRM ¿Cuáles son los tipos de CRM que podemos encontrar?. Operacional. Transaccional. 3.1.4 Carlos está haciendo un análisis de cesta de compra en su empresa. ¿A qué tipo de análisis pertenece el análisis de la cesta de compra?. Pertenece al análisis de afinidad. Pertenece al análisis proyectivo. (3.1.5) Cuales de las siguientes opciones son técnicas que pertenecen a Business Intelligence?. OLAP, cuadros de mando y herramientas de ETL. 4.1.1 ¿En qué tipos de empresas se usa la visualización de datos?. En todo tipo de empresa, independientemente de la industria o el tamaño. En empresas donde se justifique por la cantidad de datos recopilados. En empresas de gran tamaño. En empresas donde su industria lo requiera. 4.1.3 Juan se está desempeñando como ingeniero de datos en una compañía y tiene que aplicar Big Data para dar solución a una problemática de la compañía. ¿Qué técnicas y tecnologías asociadas a Big Data puede utilizar? Seleccione la correcta: Puede utilizar la captura, procesamiento, análisis y visualización de los datos. Puede utilizar la Visual Analytics, Visual Discovery y Business Analytics. 3.1.6 ¿Cuál es el foco principal del Business Analytics en las organizaciones?. Gestionar con rapidez grandes volúmenes de datos, desarrollar, testar, entrenar y monitorizar modelos predictivos. Permitir que usuarios no técnicos de áreas de negocio se familiaricen con los datos y puedan realizar análisis sencillos en modo autoservicio. 3.1.4 ¿Cuál es el foco principal del Business Intelligence en las organizaciones?. Permitir que usuarios no técnicos de áreas de negocio se familiaricen con los datos y puedan realizar análisis sencillos en modo autoservicio. Gestionar con rapidez grandes volúmenes de datos, desarrollar, testar, entrenar y monitorizar modelos predictivos. 4.1.2 Los datos en sí mismos aportan valor. Esto es precisamente lo que hace el business intelligence. Falso. Verdadero. 3.2.1 El análisis de afinidad es análisis de datos y una técnica de minería de datos que busca relaciones entre actividades realizadas de individuos, grupos u objetos. Verdadero. Falso. 3.1.4 Juan propone como objetivo a su equipo conocer la probabilidad de que sus clientes respondan ante estímulos de marketing. ¿Qué categoría de conocimiento quiere analizar?. Quiere analizar el interés. Quiere analizar la afinidad. 4.1.4 Si eres un consultor encargado de ventas de servicios de BI y debes desarrollar un tablero para la empresa Granos SRL, ¿Cuáles son las características esenciales que debe tener ese tablero BI? Seleccione la opción correcta: Deberá mostrar información de calidad, actualizada y confiable de manera visual, que permita al alto management la toma de decisiones eficiente. Deberá mostrar información de calidad, actualizada y confiable de manera visual, que permita al medio management la toma de decisiones eficiente. Deberá mostrar información de calidad, actualizada y confiable de manera visual, que permita al alto management la toma de decisiones urgentes. Deberá mostrar información de calidad, actualizada y confiable de manera visual, que permita al medio management la toma de decisiones urgentes. Cuál es una técnica de explotación sobre los almacenes de datos para la extracción de conocimiento..? (una opción). Minería de datos. Clustering. KDD. 2.3.1) ¿Cuáles son las tres capas de las que consta una arquitectura de almacén de datos?. Repositorio de documentos, capa de inteligencia empresarial y el Enterprise Data Warehouse (EDW). 1.1.6 Seleccione las 3(tres) opciones correctas. Una empresa de logística está implementando una solución Big Data. ¿Cuáles de los siguientes perfiles profesionales deben intervenir para una solución Big Data en la empresa de logística?. Un Data Steward (administrador de datos), porque será quien mantenga la calidad, la seguridad y la disponibilidad de los datos. Un científico de datos, porque es necesario a la hora de extraer conocimiento e información útil de los datos proporcionados. Un arquitecto de datos porque definirá la estructura de organización y funcionamiento de la solución Big Data. Un Business Analyst, porque será quien analice todos los factores positivos y negativos a la hora de implementar una solución Big Data. 2.3.3 Tienes que desarrollar el proceso ETL de la compañía. Seleccione las 3 (tres) opciones correctas. Extracción de datos, porque el proceso ETL permite mover datos de una fuente a otra. Carga de datos, porque el proceso ETL permite mover datos de una fuente para cargarlos en otra. Transformación de datos, porque el proceso ETL permite reformatear y limpiar datos antes de cargarlos a otra base de datos. 1.1.1 ¿Qué entendemos por Big Data?. Es toda aquella información que no puede ser procesada o analizada utilizando procesos o herramientas tradicionales. Información en gran cantidad que debe ser analizada. (1.1.1) ¿Cuáles de las siguientes corresponden al concepto de “Las 4 V” de “Big Data”? Selecciones las 4(cuatro) opciones correctas. Velocidad. Volumen. Variedad. Valor. Validez. 2.3.3 ¿Cuál es la función de los procesos ETL?. Son los responsables de extraer los datos de las fuentes de datos transaccionales, realizar las transformaciones necesarias y cargarlos en el almacén de datos una vez que han sido tratados. 1.1.4 Respecto a la característica VERACIDAD en Big Data ¿A que hace referencia?. A la calidad de los datos que se utilizan para el análisis. A la cantidad de datos que se utilizan para el análisis. A la validez de los datos que se utilizan para el análisis. 2.1.1 En los procesos ETL, se llevan los datos desde las distintas fuentes de datos a un Staging ¿Cuál es el objetivo de las técnicas de almacenamiento de datos? (UNA OPCION). Integrar la información procedente de distintas fuentes de datos para la toma de decisiones. Adaptar la información procedente de distintas fuentes de datos para la toma de decisiones. Integrar la información procedente de distintas fuentes de datos para su correspondiente análisis. Adaptar la información procedente de distintas fuentes de datos para su correspondiente análisis. 2.2.1 ¿Qué es un almacén de datos?. Es una colección de datos orientados por tema, integrados, variables en el tiempo y no volátiles que se emplea como apoyo a la toma de decisiones estratégicas. Es una colección de datos almacenados para su posterior integración al servidor. (1.2.3) Un reconocido estudio de abogados necesita almacenar sus documentos para comenzar a hacer un análisis de sus casos, los tiempos de resolución, la distribución de sus socios, etcétera. Todo el material disponible se encuentra en un archivo formato Word. Te piden que analices los datos, ¿Qué formato dirías que tienen?. El Word nos brinda datos no estructurados ya que son datos sin un orden claro. El Word nos brinda datos textuales dado que es un procesador de texto. (2.4.1) Tu jefe te consulta en que consiste el proceso de minería de datos ¿Qué le contestarias?. Es el proceso que tiene como objetivo explorar y analizar grandes volúmenes de datos de manera automática o semiautomática para encontrar patrones ocultos y repetitivos que expliquen el comportamiento de los datos y generar modelos predictivos basados en datos. Es el proceso de encontrar anomalías, errores e información faltante dentro de grandes conjuntos de datos para predecir los resultados. Es el sistema que tiene como objetivo explorar y analizar grandes volúmenes de datos de manera automática o semiautomática para encontrar patrones ocultos y repetitivos que expliquen el comportamiento de los datos y generar modelos predictivos basados en datos. (2.4.6) ¿Cuáles son aplicaciones de la Minería de Datos?. Marketing. Análisis de la cesta de la compra. Segmentación de mercados. Análisis de riesgos. Gestión de fraudes. 2.4.5) Una empresa te contrata para hacer minería de datos ¿Culaes son los dos grupos de técnicas que utilizaría para analizar los datos bajo la minería de datos? Seleccione la opción correcta: Técnicas estadísticas y de inteligencia artificial, porque se busca descubrir grandes patrones o irregularidades en una cantidad determinada de datos. Análisis de datos y Business Intelligence. (2.3.1) ¿Qué componentes forman parte del ecosistema de Hadoop? Seleccione las 4 correctas: Hive. Hbase. Zookeeper. Sqoop. OLAP. 2.4.2 En la compañía donde se está haciendo consultoría de Big Data, tienen implementado la Suite de Hadoop ¿Qué componentes forman parte del ecosistema Hadoop? Seleccione las 4 respuestas correctas: Hive. Hbase. Zookeeper. Sqoop. OLAP. 2.3 Tu eres el nuevo arquitecto de datos de la compañía "A&B" y tienes que redefinir la arquitectura de almacenamiento. ¿Cómo estructurarías la arquitectura clásica de un almacén de datos?. Estructuraría la arquitectura del almacén de datos con datos desestructurados; web y medios sociales; machine to machine; e internet de las cosas. Estructuraría la arquitectura del almacén con fuentes de datos externas; repositorio del almacén de datos; metadatos; herramientas de consulta; y servidores OLAP. 1.2 Indique cuales de las siguientes preguntas puede resolverse con Data Mining. ¿Cuál es el perfil de los clientes que probablemente respondan a la futura campaña?. 2.4.5 A la minería de datos también se la conoce por otros nombres como: extracción de conocimientos, análisis de patrones y datos, machine learning, entre otros. Verdadero. Falso. 1.1.4 Seleccione las 4 (cuatro) respuestas correctas. Una compañía de transporte contrata los servicios de un Administrador de datos; quien dice que para asegurar la buena calidad en los datos deben cumplir con ciertas características. ¿Cuáles son?. Consistencia: deben ser datos que al cruzarse con otros no pierdan su esencia, es decir, deben ser consistentes. Exactitud: no podemos dudar si son datos correctos o no, deben ser exactos. Completitud: porque, aunque en este momento sea irrelevante cierta parte del dato, en algún momento …. Conformidad: porque los datos que obtenga la empresa, deben estar en un formato estandarizado y legible para su comprensión. Coherencia: porque los datos deben seguir una cohesión lógica. |