데이터분석교육(22)
-
성동2기 전Z전능 데이터 분석가 18일차 [numpy, pandas_01]
데이터분석 기초 이해head() : 데이터의 앞부분 출력tail() : 데이터의 뒷부분 출력shape() : 데이터의 행, 열 개수 출력info() : 변수 속성 출력- non-null count : null(누락된 값)을 제외하고 구한 값의 개수- dtype(변수속성) : int64(정수), float(실수), object(문자), datetime64(날짜 시간) describe() : 요약 통계량 출력 데이터 프레임으로 실습데이터 프레임 만들기 *데이터 프레임을 복사할 때 df.copy()를 사용하는 이유df_new = df_raw와 같이 작성하면 df_new와 df_raw는 이름만 다를 뿐 한 몸 처럼 항상 같은 값을 갖게 됨. 어느 한쪽을 수정하면 다른 한쪽도 수정되므로, 복사본을 수정해도 원본..
2024.06.10 -
성동2기 전Z전능 데이터 분석가 17일차 [파이썬 기초이해_03]
함수와 패키지함수(function)함수란 입력 값을 활용하여 어떤 일을 수행하고 그 결과물을 내어 놓는 것. 마치 변수를 마법상자(함수)에 넣었다가 꺼내보면 원하는 결과물이 나오거나, 과일을 믹서기(함수)에 넣고 갈면 과일 주스(출력)가 나오는 것과 같음. ()가 붙어있는 모든 것들이 함수 패키지(package)함수가 여러 개 들어있는 꾸러미라고 보면 됨. 패키지에는 다양한 함수들이 있는데, 패키지를 설치하면 그 안에 들어있는 함수를 사용할 수 있음. 아나콘다에는 대부분의 패키지가 설치되어있음 패키지 로드하기(seaborn)- 그래프를 만들 때 주로 사용하는 패키지- 수십가지의 그래프 관련 함수가 들어있음- import 패키지 이름을 적으면 해당 패키지를 로드할 수 있음 데이터 프레임데이터를 다룰 때 ..
2024.06.05 -
성동2기 전Z전능 데이터 분석가 16일차 [파이썬 기초이해_02],[데이터 분석 법률 이슈]
리스트(list)- 여러개의 데이터를 모은 것- index로 각 요소를 선택할 수 있음- 각 요소들은 엘리먼트 또는 아이템이라고 부름- 리스트의 내용은 변경 가능 리스트 메소드 (list method)append(x)리스트의 맨 마지막에 x를 추가 sort()리스트의 요소를 순서대로 정렬 (reverse = True : 내림차순)reverse()리스트를 역순으로 변환index(x)리스트에 x값이 있으면 x의 인덱스 값을 리턴insert(a,b)리스트의 a번째 위치에 b를 삽입remove(x)리스트에서 첫번째로 나오는 x를 삭제 (직접 지정)pop()리스트의 맨 마지막 요소를 리턴, 해당 요소 삭제count(x)리스트 안에 x요소의 개수를 리턴extend(x)리스트에 x리스트 더하기 반복문( loof)반복..
2024.06.04 -
성동2기 전Z전능 데이터 분석가 15일차 [파이썬 기초 이해_01]
15일차부터 파이썬이라는 툴을 배웠다.파이썬은 데이터 분석에 활용되는 고급 프래그래밍 언어이다. 파이썬의 장점은1. 쉬운 난이도, High Level Language (C/ Java / Python) 중 난이도가 가장 쉽다고 한다. 2. 데이터 분석과 관련된 다양한 오픈소스 사용 가능3. 대량의 데이터를 빠르게 처리 가능, 빅데이터와 AI의 중심이 되는 언어4. 무료! 장점이 이렇게 많으면서 무료로 사용 가능하니 가장 많이 사용하는 데이터분석 툴이 된 것 같다. 많은 사람들이 사용하다 보니 교육자료나 오픈소스도 많아서 학습하기에 좋다. 3일차까지는 기본 이해와 문법을 배울 예정이다.오늘의 학습 내용1. 입출력문(print, input) - 화면에 원하는 문구를 출력하거나 값을 입력할 때 사용- print..
2024.06.04 -
성동2기 전Z전능 데이터 분석가 14일차 [데이터 분석 이론_02]
오늘은 AI와 머신러닝 개념 및 주요 분석 기법에 대한 이론을 알아보았다. 요즘 AI가 많이 핫하고 나도 몇가지 툴은 즐겨 사용하고 있는데 사용하면서도 인공지능이 어떤 메커니즘으로 작동하는지는 제대로 알지 못했다. 인공지능 기술에는 크게 두가지 개념이 존재하는데 머신러닝과 딥러닝이다. 둘의 정의를 살펴보면 머신러닝은 인공지능을 만들기 위해 데이터를 통해 학습하고 개선하는 방법으로, 신경망(neural network) 등 다양한 기법 이 존재한다. 딥러닝은 신경망 모델을 깊게 구축하고 학습 시키는 방법인데 이 신경망 모델이란 것은 뇌의 뉴런과 유사한 정보 입력 층계 활용하여 데이터를 학습시키는 방법이다. 사실 이런 개념을 들어도 제대로 이해하지는 못하지만 작동하는 원리를 대략 설명하자면, 머신러닝은 샘플..
2024.06.04 -
성동2기 전Z전능 데이터 분석가 13일차[멘토 간담회2]
오전엔 전날 강의하셨던 모비니티의 프론트엔드 개발자 직무 멘토님이 개발자 사용 설명서란 주제로 간담회를 진행했다. IT업계에서 일하면 개발자들과 업무적으로 접점이 많다. 업무적으로 엮여있는 만큼 회의도 많이하고 갈등도 잦다. 기획, 디자인, 데이터 직무 할거 없이 모두 개발자들과 함께 일해야 하므로 그들과 소통하고 함께 일하는 법을 알아야 일이 수월하게 진행된다. 그런 뜻에서 이러한 강의는 나에게 더 많은 개발자들의 스타일을 파악할 수 있는 좋은 데이터가 될 것 같다. 간담회의 주된 내용은 개발자가 일하는 방법을 이해하고 소통하는 법을 알려주는 것이었는데, 개발자의 사고방식은 논리적/수학적 사고방식으로 컴퓨터처럼 생각하게 되었다는 것이다. 그리고 기획 및 디자인한 제품이 실제로 어떻게 동작하는지에 대..
2024.06.03