일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 기계학습
- 파이썬
- pandas filter
- pandas
- INSERT
- plt
- 순열
- 자료구조
- 재귀함수
- python
- MacOS
- 등차수열
- numpy
- 리스트
- SQL
- matplotlib
- maplotlib
- 스터디노트
- barh
- 문제풀이
- Machine Learning
- DataFrame
- 머신러닝
- pandas 메소드
- 조합
- tree.fit
- Folium
- 통계학
- Slicing
- 등비수열
- Today
- Total
목록zero-base 데이터 취업 스쿨 (47)
코딩하는 타코야끼

안녕하세요! 저는 반도체 장비 제작부에서 근무하며 쌓은 경험을 토대로 데이터 분야로의 전환을 꿈꾸게 된 비전공자 입니다! 새로운 도전을 위해 국비 지원 부트캠프에 등록하여 6개월 간 오프라인 수업을 듣고 두 개의 프로젝트에 참여했어요. 다양한 분야의 지식을 접하긴 했지만, 이것만으로는 전문적인 지식을 쌓기에는 부족함을 느꼈어요. 오프라인 부트캠프를 통해 컴퓨터 비전 분야에 큰 관심을 갖게 되었고, 이 분야로의 취업을 목표로 설정했어요. 국비 지원 부트캠프를 마친 후 더 전문화된 교육을 찾아 제로베이스 부트캠프에 등록했는데, 데이터 직군에 특화된 커리큘럼이 인상 깊었어요. 온라인 부트캠프의 유연함이 큰 장점으로 다가왔고, 수강생들과 함께하는 Slack 커뮤니티와 강사님, 멘토님의 지원 덕분에 안심하고 학습..

1. Decision Tree를 이용한 Wine 분석 red_url = "" white_url = "" red_wine = pd.read_csv(red_url, sep=";") white_wine = pd.read_csv(white_url, sep=";") red_wine.head() white_wine.head() ⚡️ 레드/화이트 와인별로 등급 fig = px.histogram(wine, x="quality", color="color") fig.show() ⚡️ 데이터 분리 X = wine.drop(["color"], axis=1) y = wine["color"] from sklearn.model_selection import train_test_split X_train, X_test, y_train..

1. 타이타닉 생존자 분석 - EDA 📍 컬럼의 의미 📍 생존 상황 import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline # 데이터 정의 titanic_url = "" titanic = pd.read_excel(titanic_url) titanic.head() # 시각화 f, ax = plt.subplots(1, 2 ,figsize=(16, 8)) titanic["survived"].value_counts().plot.pie(ax=ax[0], autopct="%1.1f%%", shadow=True, explode=[0, 0.05]) ax[0].set_title("Pie plot - survived") ax[0].set_ylabe..

1. 머신러닝이란 📍 머신러닝(machine learning) 컴퓨터가 데이터를 통해 학습하여 특정 작업을 수행하는 능력을 개선하는 알고리즘과 기술의 집합입니다. 전통적인 프로그래밍에서는 문제를 해결하기 위해 직접 명령어를 작성하는 반면, 머신러닝에서는 대량의 데이터와 알고리즘을 사용하여 패턴을 찾아내고, 그 결과로 예측, 분류, 군집화 등의 작업을 수행합니다. 🔌 지도학습 (Supervised Learning) 입력 데이터와 해당 데이터에 대한 목표 또는 라벨이 주어집니다. 알고리즘은 주어진 입력에서 원하는 출력을 예측하는 방법을 학습합니다. 예를 들어, 스팸 메일 필터링이나 이미지 분류와 같은 작업에서 사용됩니다. 🔌 비지도학습 (Unsupervised Learning) 입력 데이터만 주어지고 목표 ..

1. 모집단과 표본 📍 모집단(Population), 표본(Sample) ⚡️표본추출(Sampling) 모집단으로 부터 표본을 추출 하는 것을 Sampling이라고 하며, 표본으로부터 그 특성을 찾아내고 모집단의 특성을 추론하고자 함 모집단에서 표본을 추출하는 방법에는 여러가지가 있음 ⚡️ 복원추출(Sampling with replacement) 모집단에서 데이터를 추출 할 때 하나를 추출하고 다시 넣고 추출하는 방법으로 동일한 표본이 추출 될 수 있음 ⚡️ 비복원추출(Sampling without replacement) 모집단에서 데이터를 추출 할 때 하나를 추출하고 다시 넣지 않고 추출하는 방법 ⚡️Random Sampling 모집단에서 데이터를 추출할 때 주의할 점은 편향되지 않아야 함, 각 개체가..

1. 이산형 확률 분포 📍 확률 분포(probability distribution) 확률 변수 X가 취할 수 있는 모든 값과 그 값을 나타날 확률을 표현한 함수 📍 이산형 균등 분포(discrete uniform distribution) 확률 변수 X가 유한개이고, 모든 확률 변수에 대하여 균일한 확률을 갖는 분포를 이산형 균등 분포라고 함 📍 베르누이 시행(Bernoulli trial) 각 시행의 결과가 성공, 실패 두가지 결과만 존재하는 시행을 베르누이 시행이라고 한다. 베르누이 시행에서 성공이 ‘1’, 실패가 ‘0’의 값을 갖을 때 확률 변수 X의 분포를 베르누이 분포(Bernoulli distribution)라고 하며, 다음과 같이 정의함 ⚡️ 예제) 파란공 7개, 빨간공 3개가 들어있는 주머니에..