성동2기 전Z전능 데이터 분석가 17일차 [파이썬 기초이해_03]

2024. 6. 5. 18:10데이터분석 기술블로그

함수와 패키지

함수(function)

함수란 입력 값을 활용하여 어떤 일을 수행하고 그 결과물을 내어 놓는 것. 마치 변수를 마법상자(함수)에 넣었다가 꺼내보면 원하는 결과물이 나오거나, 과일을 믹서기(함수)에 넣고 갈면 과일 주스(출력)가 나오는 것과 같음. ()가 붙어있는 모든 것들이 함수

 

패키지(package)

함수가 여러 개 들어있는 꾸러미라고 보면 됨. 패키지에는 다양한 함수들이 있는데, 패키지를 설치하면 그 안에 들어있는 함수를 사용할 수 있음. 아나콘다에는 대부분의 패키지가 설치되어있음

 

패키지 로드하기(seaborn)

- 그래프를 만들 때 주로 사용하는 패키지

- 수십가지의 그래프 관련 함수가 들어있음

- import 패키지 이름을 적으면 해당 패키지를 로드할 수 있음

seaborn 패키지 로드 후 함수 그래프 출력

 

(좌)사용할 데이터 불러오기(타이타닉) / (우)가져온 데이터 그래프 만들기 + hue에 'who'추가해서 세부 카테고리 추가

 


데이터 프레임

데이터를 다룰 때 가장 많이 사용하는 데이터 형태이다. 행과 열로 구성되어 표처럼 생겼다. 열은 속성들을 나타내며 컬럼(column)또는 변수(variable)이라고 불린다. 행은 (row)또는 케이스(case)라고 부르며 한 사람의 정보 또는 하나의 단위이다. 또한 행은 사람 뿐 아니라 여러가지 단위가 들어갈 수 있다.(ex.도시, 학번, 등) 데이터가 크다는 것은 데이터의 행이 커지는 경우와 열이 커지는 경우 모두 포함한다. 하지만 접근하는 방법은 다르다. 

(좌)사용할 데이터 프레임 만들기 / (우) 함수 사용하여 평균 구하기