Programming/Python
2024. 1. 16.
기본 개념 정리 1 (데이터, EDA, 데이터 전처리)
출처: AI 엔지니어 기초 다지기 : 네이버 부스트캠프 AI Tech 준비과정 돌다리도 다시 두들겨보고 건너는 개념 복습 게시물 정형데이터: 행(하나의 데이터 인스턴스), 열(데이터 피처)로 표현 可 데이터 -> 범용적임(가장 기본 소양) 이면에 숨겨진 진실을 찾는 통찰력 중요 ex) 전쟁에서 무사히 돌아온 비행기 도면에 표시된 총알 자국을 보고, 격추된 비행기에는 총알 자국이 없는 곳에 공격을 당했다고 파악, 해당 부분을 철판으로 더 보강 비정형데이터: 이미지, 비디오, 음성, 자연어 등 정제되지 않은 데이터 (요즘 트랜드) [문제 정의] X = 5914명 고객 2009.12 ~ 2011.11 구매기록 Y = 5914명 고객 2011.12 총 구매액 > 300 여부 (Binary) -> 우량고객 예측(..