본문 바로가기
데이터 분석

데이터 변환 - 정규화, 구간화

by anion 2023. 8. 2.

데이터변환 : 주어진 목적 기반의 올바른 결과 획득을 위하여 원시 데이터를 데이터 분석에 용이하도록 형태 변환

 

구간화 : 연속형 데이터를 구간으로 구별하여 범주화 형태 변환

-지정 길이 기반 구간 정의 : 사용자 기준으로 데이터 범위의 간격을 구분하여 관측치를 나누는 방안

-분포 기반 구간 정의 : 관측치가 각 구간 내 동일한 개수로 구분되도록 나누는 방안

 

정규화 : 데이터 탐색 및 기계학습 적용을 위한 연속형 변수 변환

-최대-최소 정규화 : 데이터 구간을 0에서 1사이로 변환 / 특정 데이터의 위치 파악

-Z-점수 정규화 : 0을 중심으로 양쪽으로 데이터 분포시킴 / 특정 데이터가 평균과 얼마나 떨어져 있는지 파악