• Analítica de dados com Hadoop

Pronto para usar técnicas estatísticas e de aprendizado de máquina (machine learning) em grandes conjuntos de dados? Este guia prático mostra por que o ecossistema do Hadoop é perfeito para essa tarefa. Em vez de ter como foco a implantação, as operações ou o desenvolvimento de softwares geralmente associados à computação distribuída, você se concentrará nas análises particulares que poderá fazer, nas técnicas de armazém de dados (data warehousing) oferecidas pelo Hadoop e em fluxos de trabalho de alta ordem que esse framework é capaz de gerar.

Os cientistas e os analistas de dados aprenderão a usar diversas técnicas que variam da escrita de aplicações MapReduce e Spark com Python ao uso de modelagem avançada e gerenciamento de dados com Spark MLlib, Hive e HBase. Você também conhecerá os processos analíticos e os sistemas de dados disponíveis para desenvolver e conferir eficácia aos produtos de dados capazes de lidar com – e que, na verdade, exigem – quantidades enormes de dados.

Entenda os conceitos principais do Hadoop e do processamento em cluster.
Utilize padrões de projeto e algoritmos analíticos paralelos para criar jobs de análise de dados distribuídos.
Adquira conhecimentos sobre gerenciamento de dados, mineração e armazém de dados em um contexto distribuído usando Apache Hive e HBase.
Utilize Sqoop e Apache Flume para entrada de dados a partir de bancos de da

Código: L034-9788575225219
Código de barras: 9788575225219
Peso (kg): 0,560
Altura (cm): 23,50
Largura (cm): 17,00
Espessura (cm): 1,80
Autor Kim Jenny
Editora Novatec Editora
Idioma PORTUGUES
Encadernação BROCHURA
Páginas 352
Ano de edição 2016
Faixa etária

Escreva um comentário

Você deve acessar ou cadastrar-se para comentar.

Analítica de dados com Hadoop

Frequentemente comprados juntos

Aprenda mineração de dados
25% off

Aprenda mineração de dados

Normalmente livros de Mineração de Dados são gigantescos, carregados de muita teoria e fórmulas mira..

R$15,00 R$11,25

Vendido e entregue por Leitura - CE/Fortaleza - Riomar Fortaleza

Data science do zero

Data science do zero

As bibliotecas, estruturas, módulos e kits de ferramentas do data science são ótimas para desempenhá..

Vendido e entregue por Leitura - CE/Fortaleza - Riomar Fortaleza

Problemas clássicos de ciência da computação com Python

Problemas clássicos de ciência da computação com Python

Problemas de ciência da computação aparentemente novos ou ímpares muitas vezes têm raízes em algorit..

R$79,00

Vendido e entregue por Leitura - CE/Fortaleza - Riomar Fortaleza

Mindset
25% off

Mindset

Carol S. Dweck, ph.D., professora de psicologia na Universidade Stanford e especialista internaciona..

R$74,90 R$56,18

Vendido e entregue por Leitura - CE/Fortaleza - Riomar Fortaleza

Aprendendo SQL

Aprendendo SQL

Atualizado para os mais recentes sistemas de gerenciamento de banco de dados – incluindo MySQL 5.1, ..

Vendido e entregue por Leitura - CE/Fortaleza - Riomar Fortaleza