TechStudy/BigDataTools
2023. 11. 20.
Hadoop 기본 실행
Hadoop: a platform for processing big data, MapReduce programming model HDFS = Hadoop Distributed File System 장점: Scalability(big data처리에 적합), Batch Processing(batch작업 우수), Ecosystem(각종 tools 많음; hive for 쿼리, pig for data processing 등), Data resilience(데이터탄성력.회복력:= node failures로부터 보호), Cost-Effectiveness(오픈소스라서 비용 덜들음) 단점: Latency(실시간 batch처리가 지연될 수 있음), Complexity(설정 관리가 복잡), Programming Model..