본문 바로가기

Data Analysis8

타이타닉 결측치도 예측해서 풀어보기(Ridge, RandomForest, Linear Regressor, XGBoost) 타이타닉... 가장 유명한 Caggle 챌린지고 데이콘에서도 학습차원에서 도전할 수 있당... 이번에 교육자료 만들면서 오래간만에 풀어봤는데 하다보니 재밌어서 내용이 길어짐...ㅜ 임포트 + 데이터 로드 + 일단 MLP로 함 돌려보기 일단 라이브러리 임포트... 교육자료 만드려고 한거라 지저분함... 다시 봐도 별걸 다 한 듯... import os import numpy as np import pandas as pd import sweetviz as sv import xgboost from sklearn.tree import DecisionTreeClassifier, DecisionTreeRegressor from sklearn.model_selection import cross_val_score, t.. 2022. 2. 12.
이미지 데이터 증강 논문 읽기: Improving Deep Learning using Generic Data Augmentation(Luke Taylor et al., 2017) [원본] [번역] 초록 딥 뉴럴넷은 효율적인 학습을 하기 위해 큰 용량의 데이터를 필요로 하는데, 학습 데이터를 모으는 것은 많은 비용과 노동이 필요하다. 데이터 증강은 이 이슈를 데이터의 레이블을 보존하면서 변환시켜 증강시킴으로서 해결한다. 최근 CNN task 성능을 개선하기 위해 데이터 증강을 폭넓게 사용하고 있다. 본 연구는 널리 알려진 다양한 데이터 증강법을 연구자들이 그들의 학습 방법에 적용함에 있어 과학적 이론에 입각한 결정을 내릴 수 있도록 기준을 제공할 것이다. 다양한 기하학적, 광학적 데이터 증강 방법론들의 성능을 비교적 간단한 CNN을 통해 측정했다. 실험 결과는, 4-fold cross-validation과 TOP 1, TOP 5 Accuracy를 활용했을 때, 기하학적 방법인 Cr.. 2022. 1. 21.