[빅데이터 분석기사] 실기 시험 준비, 독학, 온라인, python

빅데이터 분석기사,, 벼락치기용,, 기록용,, 을 남긴다.

실기 시험을 3일 앞두고 공부하는 나,,

다 까먹었기 때문에 문법이라도 기록해서 다음 실기 준비할 때 봐야겠다.

▼아래 '데이터 마님' 공부 방법과 문법을 참고해서 정리한다.

1. csv 데이터 읽기

df = pd.read_csv(DataUrl,sep='\t')

df = pd.read_csv(DataUrl, encoding='cp949')

2. 데이터 타입 확인

print(df.columns[df.dtypes!='object'])
print(df.select_dtypes(exclude=object).columns)

print(df.select_dtypes(include=object).columns)
print(df.columns[df.dtypes=='object'])

3. 데이터 확인

df['평균 속도'].quantile(0.75)-df['평균 속도'].quantile(0.25)

print(len(df['읍면동명'].unique()))
print(df['읍면동명'].nunique())

df.loc[df['quantity']==3].head().reset_index(drop=True)

df.loc[(df.new_price<=9) & (df.item_name=='Chicken Salad Bowl')].head()
df.loc[(df['item_name']=='Steak Salad') | (df['item_name']=='Bowl')]

df.iloc[:, ::2]
df.iloc[:, 1::2]

df.sort_values('new_price', ascending=False).reset_index(drop=True)

df.loc[df.choice_description.str.contains("Black")]

len(df.loc[~df.choice_description.str.contains('Vegetables')])

df.loc[df.item_name.str.len()>=15]

lst =[1.69, 2.39, 3.39, 4.45, 9.25, 10.98, 11.75, 16.98]
df.loc[df.new_price.isin(lst)]

4. 데이터 수정

df['new_price']=df['item_price'].str[1:].astype('float')

ans=ans.drop_duplicates('item_name')
ans = ans.drop_duplicates('item_name', keep='last')

df.loc[df.choice_description.isnull(),'choice_description']='NoData'

5. Grouping

df['host_name'].value_counts().sort_index()

df_1 = df.host_name.value_counts().to_frame()
df_1.rename(columns={'count':'counts'}, inplace=True)

* as_index : True이면 group값으로 index를 새로 구성, False이면 기존 df의 인덱스를 따름

df.groupby(['neighbourhood_group','neighbourhood'], as_index=False).size()

df.groupby(['neighbourhood_group', 'neighbourhood'], as_index=False).size().groupby(['neighbourhood_group']).max()

df.groupby('neighbourhood_group')['price'].agg(['mean', 'var', 'max', 'min'])

*stack : 컬럼을 인덱스로 , unstack : 인덱스를 컬럼으로

df.groupby(['neighbourhood', 'neighbourhood_group'])['price'].mean().unstack().fillna(-999)

[빅데이터 분석기사] 실기 7회 후기, 대구 시험장 주차장, 3일 준비(합격!!) (2)	2023.12.04
[빅데이터 분석기사] 실기 문제 연습 (작업형2) 모델링과 예측 (0)	2023.12.01
[파이썬 라이브러리] Numpy, Pandas 문법 (0)	2023.03.02

얀나랑 코딩 공부