실무프로젝트(17)
-
성동2기 전Z전능 데이터 분석가 32일차 [GA4 초기 환경 구성]
Google Analytics4의 데이터 수집 초기 환경 구성부터 분석까지 학습 내용을 정리하였다.GA4는 온라인에서 고객들의 방문율, 주문한 제품, 금액 등을 확인할 수 있도록 해준다. 그리고 개선을 위한 관리를 위해 GA4를 활용하여 측정하도록 도와준다. 주요 용어 설명GA4에서의 세션 : 방문한 프로세스를 모두 포함해서 세션이라고 함. 과거에는 세션이 단절되면, (예를 들어 30분동안 아무런 상호작용이 없을 경우) 세션2가 시작되는 구조였음. 세션은 1초만에 종료해도 측정됨. 참여 세션은 꾸준히 서비스를 이용하면 참여 세션에 찍힘. UI 살펴보기측정 기준에 + 버튼을 눌러서 세부적으로 2차원 보고서까지 볼 수 있음각 카테고리를 호버 지속하면 상세하게 설명하는 툴팁이 나옴인구 통계 세부정보에는 연령..
2024.06.28 -
성동2기 전Z전능 데이터 분석가 27일차 [데이터분석 스프린트 결과]
6월 13일부터 19일까지 스프린트로 진행됐던, 총 5일간의 데이터 분석 프로젝트가 끝나고 주요 결과를 정리하였다.스프린트 주제 : 연예인 스캔들이 소속사 주가에 미치는 영향 해당 프로젝트를 통해 알아보고 싶은 것 : 영향을 주는 스캔들의 종류를 찾아보고 실제로 스캔들로 인한 주가 변동이 발생하는 지 확인데이터 분석 프로세스 : 문제 정의 - 가설 수립 - 데이터 수집과 정리 - 패턴 분석 - 가설 검증 - 결론 및 의사 결정데이터 수집스캔들 기사 수집스캔들 기사를 수집하여 구글 스프레드 시트에 취합하였다. 데이터를 테이블 형식으로 만들고 어떤 분류로 컬럼을 구성할 것인지 정했다. 스캔들 기사는 2019년부터 24년까지 5년내 발생한 사건들로 자료를 수집했다. 각자 검증하려는 가설들이 달라서 사건의 종류..
2024.06.24 -
성동2기 전Z전능 데이터 분석가 22일차[데이터분석 스프린트 시작]
첫 스프린트를 잘 마치고 두번째 스프린트인 데이터 분석에 기반한 스프린트를 진행했다. 스프린트 주제는 '소속 연예인 스캔들이 기업 주가에 미치는 영향'이다. 개인적으로 주식에 관심도 있고 투자도 하고있어서 재밌는 스프린트 주제가 될 것 같았다. 이번 스프린트는 개발 언어에 대한 숙련도를 높이기 위한 목적성이 커서 어떤 문제를 해결하기 보단, 파이썬을 활용해서 다양한 검정법과 라이브러리를 사용해보고 개발 언어에 대한 친숙도를 높이기 위한 목적이 더 컸다. 스프린트 주제 : 연예인 스캔들이 소속사 주가에 미치는 영향 국내 대형 엔터테인트먼트 소속 연예인들의 스캔들로 주가에 어떤 영향을 주는 지 알아보자소속 연예인들의 개인 스캔들이 기업 주가에 영향을 미치고 그로인한 해당 기획사의 기업 가치 훼손과 평가절하..
2024.06.13 -
성동2기 전Z전능 데이터 분석가 18일차 [numpy, pandas_01]
데이터분석 기초 이해head() : 데이터의 앞부분 출력tail() : 데이터의 뒷부분 출력shape() : 데이터의 행, 열 개수 출력info() : 변수 속성 출력- non-null count : null(누락된 값)을 제외하고 구한 값의 개수- dtype(변수속성) : int64(정수), float(실수), object(문자), datetime64(날짜 시간) describe() : 요약 통계량 출력 데이터 프레임으로 실습데이터 프레임 만들기 *데이터 프레임을 복사할 때 df.copy()를 사용하는 이유df_new = df_raw와 같이 작성하면 df_new와 df_raw는 이름만 다를 뿐 한 몸 처럼 항상 같은 값을 갖게 됨. 어느 한쪽을 수정하면 다른 한쪽도 수정되므로, 복사본을 수정해도 원본..
2024.06.10 -
성동2기 전Z전능 데이터 분석가 16일차 [파이썬 기초이해_02],[데이터 분석 법률 이슈]
리스트(list)- 여러개의 데이터를 모은 것- index로 각 요소를 선택할 수 있음- 각 요소들은 엘리먼트 또는 아이템이라고 부름- 리스트의 내용은 변경 가능 리스트 메소드 (list method)append(x)리스트의 맨 마지막에 x를 추가 sort()리스트의 요소를 순서대로 정렬 (reverse = True : 내림차순)reverse()리스트를 역순으로 변환index(x)리스트에 x값이 있으면 x의 인덱스 값을 리턴insert(a,b)리스트의 a번째 위치에 b를 삽입remove(x)리스트에서 첫번째로 나오는 x를 삭제 (직접 지정)pop()리스트의 맨 마지막 요소를 리턴, 해당 요소 삭제count(x)리스트 안에 x요소의 개수를 리턴extend(x)리스트에 x리스트 더하기 반복문( loof)반복..
2024.06.04 -
성동2기 전Z전능 데이터 분석가 15일차 [파이썬 기초 이해_01]
15일차부터 파이썬이라는 툴을 배웠다.파이썬은 데이터 분석에 활용되는 고급 프래그래밍 언어이다. 파이썬의 장점은1. 쉬운 난이도, High Level Language (C/ Java / Python) 중 난이도가 가장 쉽다고 한다. 2. 데이터 분석과 관련된 다양한 오픈소스 사용 가능3. 대량의 데이터를 빠르게 처리 가능, 빅데이터와 AI의 중심이 되는 언어4. 무료! 장점이 이렇게 많으면서 무료로 사용 가능하니 가장 많이 사용하는 데이터분석 툴이 된 것 같다. 많은 사람들이 사용하다 보니 교육자료나 오픈소스도 많아서 학습하기에 좋다. 3일차까지는 기본 이해와 문법을 배울 예정이다.오늘의 학습 내용1. 입출력문(print, input) - 화면에 원하는 문구를 출력하거나 값을 입력할 때 사용- print..
2024.06.04