Pronto para usar técnicas estatísticas e de aprendizado de máquina (machine learning) em grandes conjuntos de dados? Este guia prático mostra por que o ecossistema do Hadoop é perfeito para essa tarefa. Em vez de ter como foco a implantação, as operações ou o desenvolvimento de softwares geralmente associados à computação distribuída, você se concentrará nas análises particulares que poderá fazer, nas técnicas de armazém de dados (data warehousing) oferecidas pelo Hadoop e em fluxos de trabalho de alta ordem que esse framework é capaz de gerar.
Os cientistas e os analistas de dados aprenderão a usar diversas técnicas que variam da escrita de aplicações MapReduce e Spark com Python ao uso de modelagem avançada e gerenciamento de dados com Spark MLlib, Hive e HBase. Você também conhecerá os processos analíticos e os sistemas de dados disponíveis para desenvolver e conferir eficácia aos produtos de dados capazes de lidar com – e que, na verdade, exigem – quantidades enormes de dados.
Entenda os conceitos principais do Hadoop e do processamento em cluster.
Utilize padrões de projeto e algoritmos analíticos paralelos para criar jobs de análise de dados distribuídos.
Adquira conhecimentos sobre gerenciamento de dados, mineração e armazém de dados em um contexto distribuído usando Apache Hive e HBase.
Utilize Sqoop e Apache Flume para entrada de dados a partir de bancos de da
Código: | L030-9788575225219 |
Código de barras: | 9788575225219 |
Peso (kg): | 0,560 |
Altura (cm): | 23,50 |
Largura (cm): | 17,00 |
Espessura (cm): | 1,80 |
Autor | Kim Jenny |
Editora | Novatec Editora |
Idioma | PORTUGUES |
Encadernação | BROCHURA |
Páginas | 352 |
Ano de edição | 2016 |
Analítica de dados com Hadoop
Frequentemente comprados juntos
Mindset
Carol S. Dweck, ph.D., professora de psicologia na Universidade Stanford e especialista internaciona..
R$55,90 R$37,19
Vendido e entregue por Leitura - MG/BH - Av. Paraná 393
Análise de dados com Python e Pandas
Atualmente os analistas devem lidar com dados caracterizados por variedade e volume extraordinários,..
R$115,00
Vendido e entregue por Leitura - SP/Campinas - Parque D.Pedro
Aprenda mineração de dados
Normalmente livros de Mineração de Dados são gigantescos, carregados de muita teoria e fórmulas mira..
R$19,80 R$15,84
Vendido e entregue por Leitura - SP/Campinas - Parque D.Pedro
Web Scraping com Python
Se a programação é mágica, o web scraping certamente é uma forma de magia. Ao escrever um programa a..
R$93,00
Vendido e entregue por Leitura - SP/Campinas - Parque D.Pedro
O guia do mochileiro Python
Pronto para concluir sua jornada de iniciante a verdadeiro pythonista? Este livro prático fornece ao..
R$105,00
Vendido e entregue por Leitura - MG/BH - Shopping Cidade
Problemas clássicos de ciência da computação com Python
Problemas de ciência da computação aparentemente novos ou ímpares muitas vezes têm raízes em algorit..
R$79,00
Vendido e entregue por Leitura - DF - Park Shopping
Data science do zero
As bibliotecas, estruturas, módulos e kits de ferramentas do data science são ótimas para desempenhá..
R$76,90
Vendido e entregue por Leitura - SP/Campinas - Parque D.Pedro
Aprendendo SQL
Atualizado para os mais recentes sistemas de gerenciamento de banco de dados – incluindo MySQL 5.1, ..
R$83,00
Vendido e entregue por Leitura - SP/Campinas - Parque D.Pedro