scala-guide

Part 4: Apache Spark

Spark 기반 실전 빅데이터 처리 프로젝트

📚 학습 목표

📖 챕터 목록

Chapter 15: Apache Spark 기초 및 실전 프로젝트

Spark 기초

실전 프로젝트 1: 로그 분석 시스템

실전 프로젝트 2: 실시간 스트리밍 처리

실전 프로젝트 3: 머신러닝 파이프라인

성능 최적화

⏱️ 예상 학습 시간

총 3-4주 (주당 10-15시간 투자 기준)

🎯 학습 성과

Part 4를 완료하면 다음을 할 수 있습니다:

✅ Spark로 대규모 데이터 배치 처리 ✅ 실시간 스트리밍 데이터 처리 ✅ 머신러닝 파이프라인 구축 ✅ Spark 성능 최적화

🔧 실습 환경

필수 요구사항:

데이터셋:


← Part 3: 고급 주제 메인 목차 다음: Part 5 생태계와 도구 →