<Numpy 라이브러리>
conda install numpy
-고속연산
-쉽고 빠른 배열 변환
-다양한 함수 제공
Numpy가 제공하는 ndarray의 shape/ndim/size 속성을 이용하면 배열의 형태/차원/원소 개수 파악 가능
<Pandas 라이브러리>
conda install pandas
-강력한 스프레드시트 처리
-데이터 통계 분석
Pandas 데이터구조
Dateframe과 Series로 구분
<Numpy 데이터 선택>
N차원 배열에서 특정 면/행/열 등을 탐색하거나 조건에 맞는 데이터를 확인하고자 할 때 사용
Slicing : 배열을 쉽게 자를 수 있음
Indexing : 리스트와 다르게 [x,y] 표기법 가능
Boolean Indexing : 특정 조건에 따른 값을 배열로 추출
Fancy Indexing : 배열에 인덱싱 값을 주어 변환
<Pandas 데이터 선택>
Dateframe에서 특정 열/행을 탐색하거나 조건에 맞는 데이터를 확인하고자 할 때 사용
loc 인덱서
사용법 : df.loc[행, 원하는 열의 이름]
->원하는 행렬의 이름을 정확히 입력
iloc 인덱서
사용법 : df.iloc[행, 열의순서]
->원하는 열의 번호를 정확히 입력
'데이터 분석' 카테고리의 다른 글
일변량 비시각화 / 시각화 탐색 (0) | 2023.07.30 |
---|---|
정적 시각화 실습 (matplotlib / seaborn 활용) (0) | 2023.07.28 |
데이터 병합 (0) | 2023.07.28 |
데이터 변경 (0) | 2023.07.27 |
분석 환경 준비 (0) | 2023.07.27 |