요약정리

Shoot for the moon
[자격증] 빅데이터분석기사 실기 요약정리(작업형3)
·Study
:: 기본 개념*모집단과 표본모집단 : 연구 대상이 되는 전체 집단표본 : 모집단의 일부*귀무가설과 대립가설귀무가설(H0) : 기존에 알려진 사실, 효과나 차이가 없음대립가설(H1) : 연구자가 입증 하려는 사실, 효과나 차이가 있음*검정 결과검정통계량: 주어진 데이터와 귀무가설 간의 차이를 통계적으로 나타내는 값p-value (유의수준 0.05) ⇒ 귀무가설을 지지하는 정도유의수준보다 작으면 귀무가설을 기각하고, 대립가설을 채택한다.유의수준보다 크면 귀무가설을 기각하지 못한다.(귀무가설 채택)*가설검정 프로세스통계적 가설 설정: 귀무가설과 대립가설유의수준 결정: 예) 0.05검정 통계량 및 p-value(유의확률) 계산결과 도출 (해석) :: 1. t-test (t검정)1) 단일표본검정모집단 1개한 그..
[자격증] 빅데이터분석기사 실기 요약정리(작업형2)
·Study
:: 1. Library/Data 불러오기 + EDA파일이 3개 주어질 경우 (X_train, X_test, y_train)데이터 샘플 확인 : head(), tail(), sample()데이터 크기 : shape데이터 타입 : info()통계값 확인 (수치형 / 범주형 칼럼) : describe()결측치 확인 : isnull().sum()y데이터의 target별 개수 확인 : value_counts()상관관계 : corr()# 수치형 칼럼X_train.describe()# 범주형 칼럼X_train.describe(include='O') X_train.describe(include='object')파일이 2개 주어질 경우 (train, test)예측해야할 target 칼럼이 데이터셋에 포함되어 있음최근 ..
[자격증] 빅데이터분석기사 실기 요약정리(작업형1)
·Study
:: Pandas 문법 기초#기본 활용 문법각 칼럼 내 고유값 수 출력 : nunique( )각 항목별 개수 : value_counts( )자료형 변경 : astype( )특정 행 삭제 : df.drop(1, axis = 0) → 1번 행만 선택해서 삭제*df = df.drop(~~)과 같이 기존 객체명에 적용해야 삭제 반영됨csv로 저장 : to_csv(’파일명’, index=False) → 인덱스값 저장하지 않음#인덱싱/슬라이싱loc vs iloc- loc : 인덱스 이름 / 마지막 선택자 포함 o- iloc : 인덱스 번호 / 마지막 선택자 포함 xindex메뉴가격칼로리0아메리카노4100101카페라떼46001802카페모카46004203바닐라콜드브루5100320# 인덱싱 예시df.loc[1:2, '가..
곰젤리열기구