목록Data/Project (5)
슬코생

Score RMSLE from sklearn.metrics import make_scorer def rmsle(predicted_values, actual_values): # 넘파이로 배열 형태로 바꿔준다. predicted_values = np.array(predicted_values) actual_values = np.array(actual_values) # 예측값과 실제 값에 1을 더하고 로그를 씌워준다. log_predict = np.log(predicted_values + 1) log_actual = np.log(actual_values + 1) # 위에서 계산한 예측값에서 실제값을 빼주고 제곱을 해준다. difference = log_predict - log_actual # difference..

✔ 연도-월로 나타내기 # 월별 데이터 모아보기 def concatenate_year_month(datetime): return "{0}-{1}".format(datetime.year, datetime.month) train["year_month"] = train["datetime"].apply(concatenate_year_month) print(train.shape) train[["datetime", "year_month"]].head() fig, (ax1, ax2) =plt.subplots(nrows=1,ncols=2) fig.set_size_inches(18,4) sns.barplot(data=train, x="year",y="count",ax=ax1) sns.barplot(data=train, ..

타이타닉 캐글 생존자 예측모델 fig, (ax1, ax2) =plt.subplots(nrows=1,ncols=2) fig.set_size_inches(18,4) sns.barplot(data=train, x="year",y="count",ax=ax1) sns.barplot(data=train, x="month",y="count",ax=ax2) fig, ax3 = plt.subplots(nrows=1, ncols=1) fig.set_size_inches(18,4) sns.barplot(data=train, x="year_month",y="count",ax=ax3) 해당 대회는 캐글의 워싱턴 공공 자전거 데이터를 바탕으로 수요를 예측하는 모델을 만드는 것이다. 대회링크는 http://www.kaggle.co..

1. 터미널 열기 $ cd practice_1st //practice_1st 폴더로 이동하라는 코드 $ cd .. //잘못 들어갔을 때 다시 전단계로 빠져나오는 코드 $ ls //현재 내 위치! 2. 가상환경 만들기 $ python -m venv myvenv $ source myvenv/Scripts/activate
2019년 9월 21일 서울 창업허브로 데이터 분석 세미나를 다녀왔다. 강사님은 인프런, 오늘코드 에서 코딩 채널을 운영하시는 박조은 강사님! 육아와 회사 일을 같이 할 수 있는 방법을 찾아보다가 오늘코드라는 유투브 채널을 열게 되셨다고 했다. ✔ 세미나에서 들은 내용을 간략하게 정리하자면 R보다는 python을 추천해주셨는데, 그 이유는 python은 생태계가 다양해 django, flask, back -end game 등 다양한 서버를 만들 수 있고 다른 생태계에 있는걸 배워보자 할 때 좀 더 친근하게 다가갈 수 있기 때문이다. (주류 언어로 바뀌게 된 계기) 뿐만 아니라, python은 package, library 굉장히 다양하다. community의 힘! / pycon 행사 한 번 알아보기 참고..