본문 바로가기

IT study36

타인과 협업하기(git clone, pull) 원격저장소 복제 git clone 원격저장소주소 다른 팀원이 최근 git push 했으면 나는 git push 못함 원격저장소-> 로컬저장소 -> git pull 원격저장소주소 브랜치 팀원이 만든 파일이 내 로컬 저장소에 반영 *원격저장소 최신내용이 로컬저장소에 있을 때만 git push 가능 git pull : git fetch + git merge git fetch: 원격저장소 신규 commit을 가져와라 git merge : 내 브랜치에 merge * git push전에 git pull 먼저 할 것 ! +협업자가 여러명일 경우 원격 저장소 브랜치 만들기 git hub에서 브랜치 생성 가능 로컬저장소에서 브랜치 만드는 것도 가능 -> git branch mining git swithch mining .. 2023. 8. 2.
Github 사용법 (git push) git : 버전 관리 프로그램 repository : git이 파일 기록해두는 장소 (.git) 컴퓨터가 고장났을 시를 대비해 online repository도 생성 local에서 작성한 파일들을 online에도 백업 online repository (원격 저장소) 1.컴퓨터 고장나도 안심 2.협업가능 github 원격저장소 생성 로컬저장소를 원격저장소에 백업 -> git init : repository 생성 * github는 기본브랜치 이름을 main으로 강요 ->git branch -M main ->git add . ->git commit -m 'a 만들었음' 현재 로컬저장소에서 원격 저장소로 push ->git push -u 원격저장소주소 올릴로컬브랜치명 =>git push -u github주소(h.. 2023. 8. 2.
git revert, rest, restore 파일 복구하는 법 git restore 파일명 특정 commit 시점으로 파일 복구하는 법 git restore --source 커밋아이디 파일명 스테이징 취소 가능 git restore --staged 파일명 commit 취소하는 법 git revert 커밋아이디 최근 commit 취소가능 git revert HEAD 과거로 모든걸 되돌리기 git reset --hard 커밋아이디 (협업시 사용금지) 리셋인데 변동사항 지우지말고 스테이징해두기 git reset --soft 커밋아이디 리셋인데 변동사항 지우지말고 unstage해두기 git reset --mixed 커밋아이디 2023. 8. 2.
git branch 브랜치 생성 git branch 브랜치명 ->git branch coupon 브랜치로 이동 git switch 브랜치명 ->git switch main coupon 브랜치 코드를 main 브랜치에 합치고 싶다 git merge 브랜치명 ->git switch main ->git merge coupon 충돌 발생하면 코드 고치고 ->git add & git commit merge 완료된 브랜치 삭제 git branch -d 브랜치 merge 안한 브랜치 삭제 git branch -D 브랜치 2023. 8. 2.
git add, commit 파일 현재 상태 기록 git add 파일명 git commit -m '아무메세지' git add app.txt 모든 파일 스테이징 git add . 상태창 ( 어떤 파일들을 스테이징 했는지) git status 커밋내역 git log --all --oneline 스테이징된 파일 취소 git restore --stage 파일 최근 commit 과 현재파일 차이점 보여줌 git diff 키 j / k 로 스크롤바 조작 키 q는 종료 -> git diff를 잘 안씀 시각적으로 분석 가능 git difftool 키 h / j / k / l 이 방향키 키 :q 아니면 :qa 종료 현재 파일 vs 특정 커밋 비교 가능 git difftool 커밋 아이디 vscode 에디터에서 extension에서 git graph.. 2023. 8. 2.
데이터 정제 - 결측 / 이상 데이터 처리 결측치 : 데이터가 수집되지 않거나 누락되어 정보(값) 가 존재하지 않음을 의미 -> 결측치가 포함된 데이터는 모델학습이 불가능하므로 사전에 반드시 결측치 처리를 진행 결측치 처리 방안 -제거하기 -> 엄청난 데이터 손실 발생 -대체하기 -> 편향 발생 가능 제거시 정보의 손실이 발생할 수 있음 Listwise deletion : 결측치가 존재하는 행 삭제 > df.dropna() Pairwise deletion : 모든 변수가결측치로만 존재하는 행 삭제 >df.dropna(how='all') 정보의 손실을 방지하나 변수 특성(평균, 상관관계 등)에 영향 발생 일정 값 대체 : 결측치를 각 변수의 평균값으로 대체 > df['col1].replace(np.nan.df['col1'].mean()) 선형 값 .. 2023. 8. 1.
다변량 비시각화 / 시각화 탐색 : 두개 이상의 변수로 구성된 데이터의 관계를 교차표 및 상관계수 등으로 파악하는 데이터 탐색 유형 -> 주어진 변수 간의 관계를 수치 및 통계적 지표 기반으로 파악하는 것이 목적 다변량 비시각화 종류 높은 상관계수 : 비슷한 정보를 제공하는 밀접한 관계의 변수 >회귀 분석에서 독립 변수 간에 강한 상관관계 발생 -> 다중 공선성 발생 > 데이터 탐색 중 상관분석 결과를 통해 모델링 사전 단계 내 고려 필요 : 두 개 이상의 변수로 구성된 데이터의 관계를 시각화 기반으로 파악하는 데이터 탐색 유형 -> 주어진 변수 간의 패턴 및 관계를 다양한 그래프의 시각화를 통해 전체적으로 파악 다변량 시각화 종류 모자이크 플롯 > 범주 그룹 간 비중의 차이를 전체적으로 파악 가능 > 범주 수가 많고, 각 조합별 비중.. 2023. 7. 30.
일변량 비시각화 / 시각화 탐색 탐색적 데이터 분석 EDA ->통계적 요약, 분포 파악 및 시각화 등의 기법을 통해 직관적으로 데이터 특성 파악 속성 파악 ex) 가격 예측 분석 과제에서 가격 컬럼 유형 및 관측치 범위 확인 관계 파악 ex) 건물의 건축연도와 가격 사이 유의미한 영향 관계 유무 확인 사전 데이터 탐색 데이터 정의 확인 : 정의서 기반 데이터 확인 > 테이블별 변수 목록, 개수, 설명 타입 등 실 데이터 확인 : 실제 데이터 개요, 결측치, 형상 등 확인 >head, tail, info 기반 확인 변수별 정의된 범위 및 분포 등 확인 >관측치 범위/분포 등 요인별 EDA 유형 구분 1. 데이터 변수 개수가 몇 개 인가? 1개 -> 일변량 2개이상-> 다변량 2. 결과를 어떻게 파악할 것인가? > 비시각화, 시각화 3. .. 2023. 7. 30.
정적 시각화 실습 (matplotlib / seaborn 활용) Matplotib 데이터 시각화 라이브러리 2D 형태의 그래프와 이미지를 그릴 때 많이 사용 유연한 인터페이스 import matplotlib.pyplot as plt plt.figure() -> 새로운 그래프를 담을 도화지 생성 plt.plot() -> 데이터 시각화 기능 담당, 그래프 유형(plot, hist, pie)과 변수를 주어 설정 가능 plt.show() -> 그래프 출력 여러개의 axes를 하나의 figure에 그릴 수 있음 plt.subplot(row,cloum,index) x축을 공유하는 두개의 그래프를 동시에 그릴 수 있음 Seaborn matplotlib을 기반으로 하며 다채로운 디자인 테마와 통계용 차트 등이 추가된 강력한 시각화 라이브러리 -> 한줄의 코드로 강력한 시각화 가능 .. 2023. 7. 28.