반응형
Spark MLlib(Machine Learning Library)
- 머신러닝 알고리즘과 유틸리티 기능을 제공하는 라이브러리로, 분류, 회귀, 군집화 등의 머신러닝 작업을 지원합니다.
- Spark 1.6 을 시작으로 MLlib 은 spark.mllib 과 spark.xml 로 분리 되었습니다.
- spark.mllib 은 RDD 베이스이며 유지보수 상태입니다.
- spark.xml 은 데이터 프레임 기반 API 입니다. 모든 새로운 기능은 spark.xml 로 업데이트 되고 있습니다.
- MLlib API 는 특성을 추출하고 변형하고 파이프라인을 구축하고 배포하는 동안 모델을 보존해줍니다.
반응형
'Data engineer > Apache Spark' 카테고리의 다른 글
[Spark]GraphX (0) | 2024.01.07 |
---|---|
[Spark]Spark 정형화 스트리밍(Structured Streaming) (1) | 2024.01.07 |
[Spark]Spark SQL 이란? (0) | 2024.01.07 |
[Spark]Spark 특성 4가지 (1) | 2024.01.07 |
[Spark]방향성 비순환 그래프(directed acyclic graph, Dag) (2) | 2024.01.07 |