Logotipo IT Forum
IT Forum Instituto Itaqui Distrito Itaqui IT Invest
IT Forum - A Comunidade de Tecnologia se Encontra Aqui
  • Todas as notícias
  • Negócios
  • Liderança
  • CIO
  • Carreira
  • IA
  • Cibersegurança
  • Plataformas
  • ESG
  • Vídeos
  • Nossas colunas
  • Colunistas
  • Pesquisas
  • Prêmios
Revistas
  • IT Forum Líderes
  • Series
  • Histórias da TI
  • Ver todos
  • Todos os eventos
  • IT Forum Trancoso
  • IT Forum Forte
  • IT Forum Mata
  • Sobre o HIT
  • Todos os materiais
Todas as notícias Negócios Liderança CIO Carreira IA Cibersegurança Plataformas ESG Vídeos
Nossas colunas Colunistas
Pesquisas Prêmios
Revistas
Todos os videocasts E agora, TI? Entre Tech IT Forum Líderes Series
Todos os eventos Trancoso
Todos os materiais Todos os materiais
  1. Home
  2. Notícias
  3. Computerworld Brasil
  4. Hadoop: o que é e qual sua relação com big data
big data;
Hadoop

Hadoop: o que é e qual sua relação com big data

Saiba mais detalhes sobre o conjunto de programas e procedimentos open source

Publicado:
25/09/2018 às 08:58
Leitura
5 minutos
hadoop
hadoop

Hadoop é um dos termos que fazem parte do “vocabulário” das tecnologias emergentes. Mas afinal, o que é Hadoop?

De forma simples, ele pode ser descrito como um conjunto de programas e procedimentos open source – disponíveis de graça para que todos usem e modifiquem, que servem como estrutura para operações de dados.

A natureza flexível de um sistema Hadoop permite que as empresas possam adicionar ou modificar seu sistema de dados à medida que suas necessidades mudam, usando peças baratas e prontamente disponíveis de qualquer fornecedor de TI.

A Mastertech, startup que prepara profissionais do futuro, explica passo a passo o que é o conceito, qual sua relação com o big data, bem como seus principais módulos.

o que é hadoop

Como funciona

Atualmente, o Hadoop é o sistema mais usado para fornecer armazenamento e processamento de dados em hardware “commodity”: sistemas relativamente baratos e de prateleira, em vez de sistemas caros e sob medida para o trabalho em mãos.

Quase todos os grandes nomes on-line o utilizam e, como qualquer um é livre para alterá-lo para seus próprios propósitos, modificações feitas no software por engenheiros especializados da Amazon e Google, por exemplo, são realimentadas à comunidade de desenvolvimento, onde são freqüentemente usados ​​para melhorar o produto “oficial”. Essa forma de desenvolvimento colaborativo entre usuários voluntários e comerciais é uma característica fundamental do software de código aberto.

Em seu estado “bruto”, usando os módulos básicos fornecidos aqui pelo Apache, o Hadoop pode ser muito complexo, mesmo para profissionais de TI. É por isso que várias versões comerciais foram desenvolvidas, como a Cloudera, que simplifica a tarefa de instalar e executar um sistema Hadoop, bem como oferecer serviços de treinamento e suporte.

Graças à natureza flexível do sistema, as empresas podem expandir e ajustar suas operações de análise de dados à medida que seus negócios se expandem. E o apoio e entusiasmo da comunidade de código aberto por trás disso levou a grandes avanços no sentido de tornar a análise de big data mais acessível para todos.

o que é hadoop

Qual a relação entre Hadoop e big data?

Mais comumente, o Hadoop é usado para processar cargas de trabalho de big data por ser altamente escalável. Para aumentar a capacidade de processamento do cluster do Hadoop, é possível adicionar mais servidores com os recursos de CPU e memória necessários precisa para atender às necessidades.

O Hadoop proporciona um alto nível de durabilidade e disponibilidade, enquanto continua processando em paralelo cargas de trabalho analíticas computacionais. A combinação de disponibilidade, durabilidade e escalabilidade de processamento torna o Hadoop a escolha ideal para cargas de trabalho de maior número de dados. Algumas vantagens do Hadoop são:

  • Velocidade e agilidade maiores
  • Complexidade administrativa reduzida
  • Integração com outros serviços na nuvem
  • Disponibilidade e recuperação de desastres melhoradas
  • Capacidade flexível

Quatro módulos do Hadoop

O Hadoop é composto de módulos, sendo que cada um deles carrega uma tarefa essencial para sistemas de computador desenhados para a análise de dados. Esses módulos são:

1. Distribuição de sistemas de arquivo

Esse módulo é um dos mais importantes pois permite que os dados sejam armazenados em um formato simples e acessível, entre um grande número de dispositivos de armazenamento linkados. O “sistema de arquivos” é o método usado por um computador para armazenar dados e pode ser encontrado e usado. Normalmente, isso é determinado pelo sistema operacional do computador, no entanto, um sistema Hadoop usa seu próprio sistema de arquivos que fica “acima” do sistema de arquivos do computador host, o que significa que pode ser acessado usando qualquer computador com sistema operacional compatível.

2. MapReduce

MapReduce é nomeado a partir das duas operações básicas que este módulo realiza: ler dados do banco de dados, colocando-os em um formato adequado para análise (mapa) e realizar operações matemáticas, ou seja, contando o número de homens com mais de 30 anos em um banco de dados de clientes, por exemplo (redução). É o MapReduce que garante as ferramentas para explorar dados de diversas formas.

3. Hadoop Comum

O outro módulo é o Hadoop Common, que fornece as ferramentas (em Java) necessárias para os sistemas de computador do usuário (Windows, Unix ou qualquer outro) lerem dados armazenados no sistema de arquivos do Hadoop.

4. YARN

O módulo final é o YARN, que gerencia os recursos dos sistemas que armazenam os dados e executam a análise.

Diversos outros procedimentos, bibliotecas ou recursos passaram a ser considerados parte do “framework” do Hadoop nos últimos anos, mas o Hadoop Distributed File System, o Hadoop MapReduce, o Hadoop Common e o Hadoop YARN são os quatro principais.

Seta para cima
Mais lidas
CIO

Envie alertas do Calendário Google para qualquer celular

14 anos atrás

1
Notícias

Nodes Tecnologia lança aplicação que adiciona camada de proteção às soluções antivírus

7 anos atrás

2
Notícias

LinkedIn, sua nova carta de apresentação

8 anos atrás

3
Notícias

Após pagamento de multas, X volta a operar no Brasil

2 anos atrás

4
Notícias

Commvault anuncia Scott Strubel para liderar programa de canais no mundo

8 anos atrás

5
Logo IT Forum
Newsletter
As melhores notícias de tecnologia B2B em primeira mão
Acompanhe todas as novidades diretamente na sua caixa de entrada.
Instagram Linkedin Facebook Tiktok Youtube
1 / 1
big data;
Hadoop

Nenhum autor cadastrado para este post.

Notícias relacionadas
Ver mais Seta para direita
Notícias relacionadas
Ver mais Seta para direita
Capital cognitivo híbrido, o próximo capital das organizações
Gestão
Capital cognitivo híbrido, o próximo capital das organizações

Heriton Duarte

3 meses atrás

Dilema da IA está entre escalar produtividade e preservar confiança
Inteligência Artificial
Dilema da IA está entre escalar produtividade e preservar confiança

Déborah Oliveira

3 meses atrás

“O varejo não compete mais por canal, mas por capacidade de movimentar produtos”, diz CIO da Motz
Inteligência Artificial
“O varejo não compete mais por canal, mas por capacidade de movimentar produtos”, diz CIO da Motz

Pamela Sousa

3 meses atrás

Xerox anuncia nova estrutura global para o mercado da Print
Negócios
Xerox anuncia nova estrutura global para o mercado da Print

Redação

4 meses atrás

Conectando a tecnologia e o futuro dos negócios

Insights e inovações para líderes no IT Forum.

Conteúdos

  • Notícias
  • Colunas
  • Pesquisas
  • Series
  • Revistas
  • Videocasts
  • Eventos

Notícias

  • Todas as notícias
  • Negócios
  • Liderança
  • CIO
  • Carreira
  • Inteligência Artificial
  • Cibersegurança
  • Plataformas
  • Sustentabilidade
  • Vídeos

IT Forum

  • Sobre nós
  • Envie seu Release
  • Mídia Kit
  • Contato
  • Expediente
  • Cultura
  • Distrito Itaqui
  • Anuncie
  • Notícias
  • Colunas
  • Pesquisas
  • Series
  • Revistas
  • Videocasts
  • Eventos
  • Todas as notícias
  • Negócios
  • Liderança
  • CIO
  • Carreira
  • Inteligência Artificial
  • Cibersegurança
  • Plataformas
  • Sustentabilidade
  • Vídeos
  • Sobre nós
  • Envie seu Release
  • Mídia Kit
  • Contato
  • Expediente
  • Cultura
  • Distrito Itaqui
  • Anuncie

Logo do IT Forum
Estr. Dr. Yojiro Takaoka, 4601 - Ingahi, Itapevi - SP, 06696-050
Icone Instagram Icone Linkedin Icone Facebook Icone TikTok Icone YouTube
  • Link Política de privacidade
  • Link Fale conosco
  • Link Termos de uso
  • Link Trabalhe conosco
Copyright © 2026 IT FORUM - Todos os Direitos Reservados