반응형

Spark 사용 예시

  • 클러스터 전체에 걸쳐 분산된 대규모 데이터 세트의 병렬 처리.
  • 데이터 탐색이나 시각화를 위한 일회성이나 대화형 질의 수행.
  • MLlib 을 이용해 머신러닝 모델을 구축, 훈련, 평가하기.
  • 다양한 데이터 스트림으로부터 끝까지 데이터 파이프라인 구현.
  • 그래프 데이터 세트와 소셜 네트워크 분석.
반응형

'Data engineer > Apache Spark' 카테고리의 다른 글

[Spark]Spark 애플리케이션 용어  (0) 2024.01.09
[Spark]Spark 디렉토리와 파일들  (0) 2024.01.09
[Spark]tungsten 이란?  (0) 2024.01.07
[Spark]Spark executor 이란?  (0) 2024.01.07
[Spark]Spark Cluster Manager 이란?  (0) 2024.01.07

+ Recent posts