반응형
Spark 사용 예시
- 클러스터 전체에 걸쳐 분산된 대규모 데이터 세트의 병렬 처리.
- 데이터 탐색이나 시각화를 위한 일회성이나 대화형 질의 수행.
- MLlib 을 이용해 머신러닝 모델을 구축, 훈련, 평가하기.
- 다양한 데이터 스트림으로부터 끝까지 데이터 파이프라인 구현.
- 그래프 데이터 세트와 소셜 네트워크 분석.
반응형
'Data engineer > Apache Spark' 카테고리의 다른 글
[Spark]Spark 애플리케이션 용어 (0) | 2024.01.09 |
---|---|
[Spark]Spark 디렉토리와 파일들 (0) | 2024.01.09 |
[Spark]tungsten 이란? (0) | 2024.01.07 |
[Spark]Spark executor 이란? (0) | 2024.01.07 |
[Spark]Spark Cluster Manager 이란? (0) | 2024.01.07 |