Apache Flink: A Framework open source para a quarta geração do Big Data

24 Mai 2019

3 Comentários

Os sistemas distribuídos estão em todo o lugar, ou melhor, acessíveis a partir de qualquer lugar. Segundo Tanenbaum, um sistema distribuído é um conjunto de computadores independentes entre si (e até diferentes), ligados através de uma rede de dados, que se apresentam aos utilizadores como um sistema único e coerente.

Conheça a Framework Apache Flink que permite o processamento de grandes quantidades de dados.

Apache Flink

O Apache Flink é a ferramenta de última geração do Big Data, conhecido como o 4G do Big Data. Esta framework:

É uma true stream processing framework , ou seja, não corta a stream em micro-batches.
O kernel ou core do Flink é um streaming runtime que também tem a capacidade de processamento distribuído, tolerância a falhas, etc.
O Flink processa eventos a uma velocidade elevada constante com baixa latência.
É uma framework de processamento de dados de larga escala com capacidade de processar dados gerados a grandes velocidades.

O Apache Flink é uma plataforma open source que pode responder aos seguintes requisitos de forma efetiva:

Batch Processing
Interactive processing
Real-time stream processing
Graph Processing
Iterative Processing
In-memory processing

O Flink é uma alternativa ao MapReduce, usado, por exemplo, no Hadoop, e consegue processar dados 100 vezes mais rápido que o MapReduce. É independente do Hadoop, mas pode utilizar o HDFS para ler, escrever, guardar e processar dados. O Flink não tem um sistema de armazenamento de dados.

Apache Flink

Num próximo artigo vamos mostrar como podem instalar o Apache Flink, num Multi-Node Cluster no Ubuntu 18.04 usando VirtualBox. Estejam atentos e se gostarem desta área da computação distribuída, partilhem ideias.

5 Smartphones até 250€ para comprar em Portugal

Próximo artigo

Redmi 7A: o novo smartphone Xiaomi com bateria de 4000 mAh

PUB

Comentários

3

Deixe um comentário Cancelar resposta

eu

24 de Maio de 2019

Eu só li “O Flink * ao MapReduce, * no Hadoop mais rápido que o MapReduce. * do Hadoop, mas pode utilizar o HDFS” 😛

Flink, MapReduce, Hadoop, HDPS, shoot in your head.

Responder
ze miguel

24 de Maio de 2019

Uso actualmente juntamente com Kafka+Zookeeper e um cluster de Hadoop e aconselho muito bom!

Responder
1. Pedro Pinto
  
  24 de Maio de 2019
  
  Vamos abordar também 😀
  
  Responder

Aviso:

Todo e qualquer texto publicado na internet através deste sistema não reflete, necessariamente, a opinião deste site ou do(s) seu(s) autor(es). Os comentários publicados através deste sistema são de exclusiva e integral responsabilidade e autoria dos leitores que dele fizerem uso. A administração deste site reserva-se, desde já, no direito de excluir comentários e textos que julgar ofensivos, difamatórios, caluniosos, preconceituosos ou de alguma forma prejudiciais a terceiros. Textos de caráter promocional ou inseridos no sistema sem a devida identificação do seu autor (nome completo e endereço válido de email) também poderão ser excluídos.

Apache Flink: A Framework open source para a quarta geração do Big Data

Leia também…

PUB

Questão Semanal

Deveria haver uma marca obrigatória em todas as imagens geradas por IA?

Arquivo de Questões

Velocímetro Pplware

Teste a velocidade da sua Internet

5 Smartphones até 250€ para comprar em Portugal

Redmi 7A: o novo smartphone Xiaomi com bateria de 4000 mAh

PUB

Comentários

Deixe um comentário Cancelar resposta

Aviso: