데이터변환 : 주어진 목적 기반의 올바른 결과 획득을 위하여 원시 데이터를 데이터 분석에 용이하도록 형태 변환
구간화 : 연속형 데이터를 구간으로 구별하여 범주화 형태 변환
-지정 길이 기반 구간 정의 : 사용자 기준으로 데이터 범위의 간격을 구분하여 관측치를 나누는 방안
-분포 기반 구간 정의 : 관측치가 각 구간 내 동일한 개수로 구분되도록 나누는 방안
정규화 : 데이터 탐색 및 기계학습 적용을 위한 연속형 변수 변환
-최대-최소 정규화 : 데이터 구간을 0에서 1사이로 변환 / 특정 데이터의 위치 파악
-Z-점수 정규화 : 0을 중심으로 양쪽으로 데이터 분포시킴 / 특정 데이터가 평균과 얼마나 떨어져 있는지 파악
'데이터 분석' 카테고리의 다른 글
데이터 축소 - 특징 선택 (0) | 2023.08.02 |
---|---|
데이터 변환 - 특징 생성 (0) | 2023.08.02 |
데이터 정제 - 결측 / 이상 데이터 처리 (0) | 2023.08.01 |
다변량 비시각화 / 시각화 탐색 (0) | 2023.07.30 |
일변량 비시각화 / 시각화 탐색 (0) | 2023.07.30 |