Name: Procesando el Big Data con Apache Spark (en español)
Brand: Tomás Fernández Pena
SKU: 11324074
Price: 19.99 $
Availability: InStoreOnly
Rating: 4.33 (418 reviews)

Descripción

A través de este curso los alumnos aprenderán a programar con Apache Spark, la solución más eficiente y popular para procesar enormes cantidades de datos en clusters de cientos de máquinas.

Spark es hasta 100 veces más rápido que Apache Hadoop si el procesamiento se hace en memoria y 10 veces más rápido si se hace en disco. Para conseguir este rendimiento, Spark incorpora un motor de ejecución avanzado basado en Grafos Dirigidos Acíclicos (DAGs) de tareas que permite el flujo de datos acíclico u la computación en memoria.

Spark es fácil de usar, y permite utilizar diferentes lenguajes de programación, en concreto Python, Scala, Java o R. Ofrece más de 80 operadores de alto nivel que facilitan la creación de programas paralelos escalables a cientos o miles de máquinas. Y es posible utilizarlo de forma interactiva mediante los interpretes de Python, Scala o R, o utilizando herramientas como Apache Zeppelin, como veremos en este curso.

Spark se puede ejecutar en un PC simple, en un cluster con Hadoop YARN o Apache Mesos, o en la nube, con soluciones como Amazon Elastic MapReduce o Microsoft HDInsight. Y puede acceder a datos almacenados el HDFS, Cassandra, HBase, Hive, Tachyon y cualquier fuente de datos accesible por Hadoop.

Empezaremos viendo los elementos básicos de la programación Spark: los RDDs o Resilient Distributed DataSets. Veremos como crearlos, transformarlos y operar con ellos para procesar nuestros archivos.Continuaremos viendo aspectos avanzados para mejorar y optimizar nuestros códigos Spark y finalizaremos adentrándonos en el conjunto de soluciones de alto nivel de Spark: Spark SQL, Spark Streaming, Spark ML para problemas de Machine Learning, y GraphX para procesamiento de grafos. Todas estas soluciones pueden combinarse en la misma aplicación para alcanzar nuestros objetivos.

Los estudiantes también compraron

Netcurso-como-una-esponja-cerebro-nino-infantil

El cerebro del niño

Álvaro Bilbao

4.88 (2888)

~~€99.99 $~~ 19.99 $

Inglés Básico: Todo lo esencial para hispanohablantes

Daniel Welsch

4.55 (3335)

~~€59.99 $~~ 19.99 $

Curso de Ingles Conversacional Basico para Principiantes

Mauricio Rubio - Agile Guru & Founder of AgileKB | AgileLee & Ureducation

4.37 (948)

~~€49.99 $~~ 19.99 $

Netcurso-curso-practico-de-ingles-para-el-dia-a-dia-1

Inglés para el día a día 1: job interview, airport and hotel

Ana Mathias

4.05 (574)

~~€19.99 $~~ 19.99 $

Aprende a Crear un Curso Online

Miguel Hernandez

4.6 (670)

~~€44.99 $~~ 19.99 $

Inglés Básico para Principiantes: Una sólida base, hablando.

Peter Hanley

4.57 (1719)

~~€104.99 $~~ 19.99 $

Netcurso-habla-lee-y-entiende-ingles-basico-con-confianza

5 minutos al día para mejorar tu inglés: para gente ocupada

Nathan Conkey

4.49 (979)

~~€59.99 $~~ 19.99 $

Aprender a leer a los 3: Método Doman en preescolar

Elisa Guerra

4.55 (439)

~~€39.99 $~~ 19.99 $

Objetivo Inglés: lo que no te enseñaron en la escuela

Daniel Welsch

4.55 (335)

~~€59.99 $~~ 19.99 $

Netcurso-nueroeducacion-y-neurodidactica

Neuroeducación y Neurodidáctica - Herramientas para educar

Nueces y Neuronas Formaciones

4.61 (478)

~~€149.99 $~~ 19.99 $

Contenido del curso

Presentación del curso

Presentación
Preparación del entorno en Microsoft Windows
Preparación del entorno en GNU/Linux

Introducción a Spark y a los RDDs

Introducción a Apache Spark
Introducción a los RDDs
Introducción a las transformaciones y acciones

Operaciones sobre RDDs simples

Transformaciones sobre un RDDs simple
Transformaciones sobre dos RDDs simples
Acciones de agregación sobre RDDs simples
Otras acciones sobre RDDs simples
Programa WordCount

Otros tipos de RDDs

RDDs con pares clave-valor
Transformaciones sobre un RDD clave/valor
Transformaciones sobre dos RDDs clave/valor
Principales acciones sobre RDDs clave/valor
Número de citas de patentes
Número medio de reivindicaciones por país
RDDs numéricos
Número de patentes por país y año

Aspectos avanzados de Apache Spark

Persistencia y particionado
Lectura y escritura de ficheros
Crear ficheros secuencia
País, año y número de citas de cada patente
Ejecución de scripts desde línea de comandos
Aspectos avanzados: interfaz Web
Otros aspectos avanzados de Apache Spark
Número de patentes por año de un país

Otros componentes de Apache Spark

Spark SQL (I): creación de DataFrames
Spark SQL (II): operaciones con DataFrames
Número de citas de patentes usando DataFrames
Spark Streaming
Spark MLlib
Spark GraphX

Información sobre el Instructor

4.33 Calificación
2291 Estudiantes
1 Cursos

Tomás Fernández Pena

Doctor en Arquitectura de Computadores

Me licencié en Física en la Universidad de Santiago de Compostela (USC) en el año 1989 y en ella obtuve el título de doctor en Física en el año 1994. Desde 1990 hasta 1994 fui profesor en la Facultad de Informática de la Universidad de A Coruña. Desde 1994 soy profesor titular de universidad en el Departamento de Electrónica y Computación de la Universidad de Santiago de Compostela. Soy miembro del CiTIUS (Centro de Investigación en Tecnologías de la Información) de la USC desde 2010.

Mis principales líneas de interés incluyen la computación de altas prestaciones, la arquitectura de sistemas paralelos, el desarrollo de algoritmos paralelos para clusters y supercomputadores, la optimización de rendimiento en problemas irregulares y con matrices dispersas, la predicción y mejora del rendimiento de aplicaciones paralelas en general, el desarrollo de aplicaciones y middleware para sistemas grid y cloud y las tecnologías Big Data aplicadas al procesamiento del lenguage natural, la bioinformática, la chemioinformática y aplicaciones científicas en general. Actualmente soy Senior Member del IEEE y editor asociado de la revista IEEE Transactions on Computers.

Comentarios de los estudiantes

4.33

Valoración del curso

Reseñas

Miguel Ángel Sainz Ayuso

06-05-2021

Curso introductorio a Apache Spark bastante completo. Me ha servido para obtener una base y continuar formándome en Apache Spark.

Alexander Gutierrez Ruiz

20-04-2021

La lecciones y los ejercicios me han servido mucho en mi trabajo. Gracias.

Estudiantes nuevos
ingresar aquí:

Plataforma vieja de
Netcurso:

Procesando el Big Data con Apache Spark (en español)

La mejor herramienta para el procesamiento del Big Data

Descripción

Los estudiantes también compraron

El cerebro del niño

Inglés Básico: Todo lo esencial para hispanohablantes

Curso de Ingles Conversacional Basico para Principiantes

Inglés para el día a día 1: job interview, airport and hotel

Aprende a Crear un Curso Online

Inglés Básico para Principiantes: Una sólida base, hablando.

5 minutos al día para mejorar tu inglés: para gente ocupada

Aprender a leer a los 3: Método Doman en preescolar

Objetivo Inglés: lo que no te enseñaron en la escuela

Neuroeducación y Neurodidáctica - Herramientas para educar

Información sobre el Instructor

Tomás Fernández Pena

Doctor en Arquitectura de Computadores

Comentarios de los estudiantes

Valoración del curso

Reseñas

Estudiantes nuevosingresar aquí:

Plataforma vieja deNetcurso:

Procesando el Big Data con Apache Spark (en español)

La mejor herramienta para el procesamiento del Big Data

Lo que aprenderás

Descripción

netcurso.net free. La mayor selección de cursos gratis del mundo

Los estudiantes también compraron

El cerebro del niño

Inglés Básico: Todo lo esencial para hispanohablantes

Curso de Ingles Conversacional Basico para Principiantes

Inglés para el día a día 1: job interview, airport and hotel

Aprende a Crear un Curso Online

Inglés Básico para Principiantes: Una sólida base, hablando.

5 minutos al día para mejorar tu inglés: para gente ocupada

Aprender a leer a los 3: Método Doman en preescolar

Objetivo Inglés: lo que no te enseñaron en la escuela

Neuroeducación y Neurodidáctica - Herramientas para educar

Contenido del curso

Información sobre el Instructor

Tomás Fernández Pena

Doctor en Arquitectura de Computadores

Comentarios de los estudiantes

Valoración del curso

Reseñas

Estudiantes nuevos
ingresar aquí:

Plataforma vieja de
Netcurso: