본문 바로가기
데이터 분석

데이터 선택

by anion 2023. 7. 27.

<Numpy 라이브러리>

conda install numpy

-고속연산

-쉽고 빠른 배열 변환

-다양한 함수 제공

Numpy가 제공하는 ndarray의 shape/ndim/size 속성을 이용하면 배열의 형태/차원/원소 개수 파악 가능

 

<Pandas 라이브러리>

conda install pandas

-강력한 스프레드시트 처리

-데이터 통계 분석

Pandas 데이터구조

Dateframe과 Series로 구분

 

<Numpy 데이터 선택>

N차원 배열에서 특정 면/행/열 등을 탐색하거나 조건에 맞는 데이터를 확인하고자 할 때 사용

Slicing : 배열을 쉽게 자를 수 있음

Indexing : 리스트와 다르게 [x,y] 표기법 가능

Boolean Indexing : 특정 조건에 따른 값을 배열로 추출

Fancy Indexing : 배열에 인덱싱 값을 주어 변환

 

<Pandas 데이터 선택>

Dateframe에서 특정 열/행을 탐색하거나 조건에 맞는 데이터를 확인하고자 할 때 사용

loc 인덱서

사용법 : df.loc[행, 원하는 열의 이름]

->원하는 행렬의 이름을 정확히 입력

iloc 인덱서

사용법 : df.iloc[행, 열의순서]

->원하는 열의 번호를 정확히 입력

'데이터 분석' 카테고리의 다른 글

일변량 비시각화 / 시각화 탐색  (0) 2023.07.30
정적 시각화 실습 (matplotlib / seaborn 활용)  (0) 2023.07.28
데이터 병합  (0) 2023.07.28
데이터 변경  (0) 2023.07.27
분석 환경 준비  (0) 2023.07.27