본문 바로가기

전체 글36

DRF(Django REST Framework) DRF(Django REST Framework) : Django를 백엔드 개발에만 사용하도록 해 줌 DRF의 역할 : 직렬화 백엔드 -> 파이썬 객체 형식 프론트엔드 -> JSON 형식 => 통신을 위해서 데이터 형식 통일 필요 => 직렬화 / 역직렬화 직렬화는 서버에 파이썬 객체로 저장된 데이터를 JSON 형태로 바꿔 주는 것 역직렬화는 JSON 형태의 데이터를 파이썬 객체로 바꿔 주는 것 DRF는 Django의 모델과 ORM 문법을 그대로 사용 Django는 응답으로 데이터와 HTML, CSS 코드를 함께 반환. 그래서, Django의 응답만으로 하나의 웹 페이지가 완성 DRF는 HTML과 CSS 코드를 반환하지 않습니다. 대신, 요청에 따라 처리된 데이터만 프론트엔드에 전달 REST란 Represe.. 2023. 9. 5.
시각화 라이브러리 # 시각화 라이브러리 import matplotlib.pyplot as plt #pyplot 모듈 불러옴 import seaborn as sns # 차트 그리기 plt.plot(data['Temp']) ->1차원 값 plt.plot('Date', 'Temp', data = data) x축 : 인덱스 y축 : 1차원 값 color= 'red','green','blue' ... 혹은 'r', 'g', 'b', ... https://matplotlib.org/stable/gallery/color/named_colors.html linestyle= 'solid', 'dashed', 'dashdot', 'dotted' 혹은 '-' , '--' , '-.' , ':' marker= List of named colo.. 2023. 8. 20.
시계열 데이터 처리 날짜 타입으로 변환 pd.to_datetime(날짜데이터, format = '입력되는 날짜 형식') -> date = pd.Series(['03-01-2023', '03-02-2023', '03-03-2023']) date = pd.to_datetime(date, format = '%d-%m-%Y') #입력받은 날짜 데이터 형식이 '%d-%m-%Y'! shift : 시계열 데이터에서 시간의 흐름 전후로 정보를 이동시킬 때 사용 # 전날 매출액 열을 추가합시다. temp['Amt_lag'] = temp['Amt'].shift() #default = 1 # 전전날 매출액 열을 추가. temp['Amt_lag2'] = temp['Amt'].shift(2) # 2행 shift rolling.집계함수 -> 시간의.. 2023. 8. 19.
데이터 축소 - 특징 선택 : 가장 좋은 성능을 보여줄 수 있는 데이터의 부분 집합을 찾아내는 방법 -> 모델 생성에 밀접한 데이터의 부분 집합을 선택하여 연산 효율성 및 모델 성능을 확보 목적 및 필요성 -> 연산 효율성 : 원본 데이터에서 가장 유용한 특징만을 선택하여 간단한 모델 구성 및 성능을 확보하고자 하는 것이 주요 목적 특징 생성 방안 1.필터 : 특징들에 대한 통계적 점수를 부여하여 순위를 매기고 선택하는 방법론 : 실행속도가 빠르다는 측면에서 시간 및 비용 측면의 장점을 보임 1) 카이제곱 필터 - 범주형인 독립 및 종속 변수 간의 유의미성을 도출하기 위한 통계적 방안 - 연속형 변수를 이산화(범주)를 하여 활용 가능 2) 상관관계 필터 - 연속형인 독립 및 종속변수 간 유의미성을 도출하기 위한 통계적 방안 - 보.. 2023. 8. 2.
데이터 변환 - 특징 생성 원본 데이터의 조합/변환 등을 기반하여 새로운 특징들을 구축 및 생성하는 방법 -> 원본 데이터로 특징을 새롭게 생성하여 분석 과정 내 성능과 효율성을 확보하고자 함 목적 및 필요성 -품질 확보 -최적화된 형태 변환 특징 생성 방안 1. 범주 인코딩 : 크게 Nominal(순서가 없는)과 Ordinal(순서가 있는)형식으로 나뉘는 범주형 변수 : 숫자가 아닌 범주 변수 값을 숫자로 표현하고 모델링에 적용하기 위한 과정 -> 범주형 데이터의 알고리즘 적용을 위한 수치형 변환 One-hot Encoding -> 순서의 의미를 지니지 않은 범주형 변수를 처리하는 대표적 방법 2. 결합 및 분해 : 데이터 셋의 변수들의 조합을 기반으로 새로운 특징을 구축하는 방법 : 변수 간의 연산 혹은 분해를 통해 새로운 특.. 2023. 8. 2.
데이터 변환 - 정규화, 구간화 데이터변환 : 주어진 목적 기반의 올바른 결과 획득을 위하여 원시 데이터를 데이터 분석에 용이하도록 형태 변환 구간화 : 연속형 데이터를 구간으로 구별하여 범주화 형태 변환 -지정 길이 기반 구간 정의 : 사용자 기준으로 데이터 범위의 간격을 구분하여 관측치를 나누는 방안 -분포 기반 구간 정의 : 관측치가 각 구간 내 동일한 개수로 구분되도록 나누는 방안 정규화 : 데이터 탐색 및 기계학습 적용을 위한 연속형 변수 변환 -최대-최소 정규화 : 데이터 구간을 0에서 1사이로 변환 / 특정 데이터의 위치 파악 -Z-점수 정규화 : 0을 중심으로 양쪽으로 데이터 분포시킴 / 특정 데이터가 평균과 얼마나 떨어져 있는지 파악 2023. 8. 2.