Large-Scale Data Analytics with Python and Spark

19 diciembre, 2023

A Hands-on Guide to Implementing Machine Learning Solutions

Isaac Triguero, Universidad de Granada
Mikel Galar, Universidad Pública de Navarra

Editorial: Cambridge University Press
Año: 2023
Páginas: 378
ISBN: 9781009318242

Un libro práctico que enseña cómo llevar a cabo análisis de datos a gran escala e implementar soluciones de aprendizaje automático para Big Data. Incluyendo numerosos ejemplos del mundo real, ofrece un paquete de enseñanza coherente con asignaciones de laboratorio, ejercicios, soluciones para instructores y diapositivas.

El libro enseña los conceptos clave para realizar análisis de datos a gran escala y aprendizaje automático con Big Data. Está dividido en tres partes principales. La Parte I aborda los conceptos básicos para comprender qué es Big Data y los principios clave y paradigmas de programación para abordarlo. La Parte II se sumerge en la parte tecnológica del Big Data, presentando algunos de los marcos de trabajo de Big Data más consolidados, como Hadoop y Spark. Esto implica detalles técnicos clave y cómo programar eficientemente con estructuras de datos distribuidas. Finalmente, la Parte III se centra en cómo realizar aprendizaje automático y ciencia de datos en presencia de grandes volúmenes de datos, aprendiendo a utilizar bibliotecas existentes y cómo diseñar soluciones eficientes y efectivas para adaptar técnicas de ciencia de datos (incluyendo preprocesamiento, aprendizaje y despliegue de modelos) a este escenario. El libro contiene muchos ejemplos, y cada capítulo incluye diversos desafíos para los lectores y una serie de ejercicios. El material complementario incluye Prácticas de Laboratorio que comprenden proyectos de código más extensos con diversos niveles. El material adicional también proporciona un tutorial práctico para comenzar con Python y Spark.