본문 바로가기

프로그래밍/MicroService

Apache Kafka vs Apache Flink

techwin 2024. 11. 16. 22:58

Kafka는 데이터를 수집, 저장, 전달하는 데 최적화된 플랫폼
Flink는 데이터를 실시간으로 처리 및 분석하는 데 최적화된 엔진
두 기술은 서로 다른 목적을 가지고 있지만, 함께 사용하면 강력한 실시간 데이터 파이프라인과 분석 시스템을 구축 가능

특성	Apache Kafka	Apache Flink
역할	데이터의 전달 및 저장 플랫폼	데이터의 실시간 처리 및 분석 엔진
데이터 흐름	Producer → Broker → Consumer	데이터를 Flink 클러스터 내에서 처리 및 분석
주요 기능	- 메시지 큐 역할 - 데이터 파이프라인 구축 - 이벤트 스트리밍	- 스트리밍 데이터 처리 - 복잡한 연산 및 패턴 탐지
데이터 저장	데이터를 디스크에 영구 저장 가능	데이터 저장 기능 없음 (실시간 처리 후 외부에 저장)
데이터 처리	단순 데이터 전달 및 소비	고급 데이터 변환, 집계, 분석 가능
상태 관리	없음 (데이터만 전달)	상태 기반 처리(Stateful Processing) 지원
사용 목적	데이터 전송과 메시지 브로커 역할	실시간 데이터 처리 및 분석

Kafka와 Flink는 상호 보완적으로 사용되는 경우가 많습니다.

좀 더 예를 들어보면..

사용 구조:

Kafka:
- 데이터를 수집하고 저장.
- 실시간으로 데이터를 여러 소비자에게 전달.
Flink:
- Kafka에서 데이터를 가져와 복잡한 분석 및 처리를 수행.
- 처리 결과를 다른 데이터베이스나 시스템으로 전송.

예시:

IoT 환경:
- Kafka로 센서 데이터를 수집 → Flink로 데이터를 분석(이상 감지) → 처리 결과를 저장(InfluxDB 등).
로그 분석 시스템:
- Kafka로 로그를 저장 → Flink로 실시간 검색어 분석 → 대시보드로 결과 출력.

'프로그래밍 > MicroService' 카테고리의 다른 글

IaaS, PaaS, SaaS, DaaS 장단점과 예시 (0)	2024.11.16
시계열 DB 종류 (0)	2024.11.16

티스토리툴바