데이터분석교육(22)
-
성동2기 전Z전능 데이터 분석가 32일차 [GA4 초기 환경 구성]
Google Analytics4의 데이터 수집 초기 환경 구성부터 분석까지 학습 내용을 정리하였다.GA4는 온라인에서 고객들의 방문율, 주문한 제품, 금액 등을 확인할 수 있도록 해준다. 그리고 개선을 위한 관리를 위해 GA4를 활용하여 측정하도록 도와준다. 주요 용어 설명GA4에서의 세션 : 방문한 프로세스를 모두 포함해서 세션이라고 함. 과거에는 세션이 단절되면, (예를 들어 30분동안 아무런 상호작용이 없을 경우) 세션2가 시작되는 구조였음. 세션은 1초만에 종료해도 측정됨. 참여 세션은 꾸준히 서비스를 이용하면 참여 세션에 찍힘. UI 살펴보기측정 기준에 + 버튼을 눌러서 세부적으로 2차원 보고서까지 볼 수 있음각 카테고리를 호버 지속하면 상세하게 설명하는 툴팁이 나옴인구 통계 세부정보에는 연령..
2024.06.28 -
성동2기 전Z전능 데이터 분석가 27일차 [데이터분석 스프린트 결과]
6월 13일부터 19일까지 스프린트로 진행됐던, 총 5일간의 데이터 분석 프로젝트가 끝나고 주요 결과를 정리하였다.스프린트 주제 : 연예인 스캔들이 소속사 주가에 미치는 영향 해당 프로젝트를 통해 알아보고 싶은 것 : 영향을 주는 스캔들의 종류를 찾아보고 실제로 스캔들로 인한 주가 변동이 발생하는 지 확인데이터 분석 프로세스 : 문제 정의 - 가설 수립 - 데이터 수집과 정리 - 패턴 분석 - 가설 검증 - 결론 및 의사 결정데이터 수집스캔들 기사 수집스캔들 기사를 수집하여 구글 스프레드 시트에 취합하였다. 데이터를 테이블 형식으로 만들고 어떤 분류로 컬럼을 구성할 것인지 정했다. 스캔들 기사는 2019년부터 24년까지 5년내 발생한 사건들로 자료를 수집했다. 각자 검증하려는 가설들이 달라서 사건의 종류..
2024.06.24 -
성동2기 전Z전능 데이터 분석가 22일차[데이터분석 스프린트 시작]
첫 스프린트를 잘 마치고 두번째 스프린트인 데이터 분석에 기반한 스프린트를 진행했다. 스프린트 주제는 '소속 연예인 스캔들이 기업 주가에 미치는 영향'이다. 개인적으로 주식에 관심도 있고 투자도 하고있어서 재밌는 스프린트 주제가 될 것 같았다. 이번 스프린트는 개발 언어에 대한 숙련도를 높이기 위한 목적성이 커서 어떤 문제를 해결하기 보단, 파이썬을 활용해서 다양한 검정법과 라이브러리를 사용해보고 개발 언어에 대한 친숙도를 높이기 위한 목적이 더 컸다. 스프린트 주제 : 연예인 스캔들이 소속사 주가에 미치는 영향 국내 대형 엔터테인트먼트 소속 연예인들의 스캔들로 주가에 어떤 영향을 주는 지 알아보자소속 연예인들의 개인 스캔들이 기업 주가에 영향을 미치고 그로인한 해당 기획사의 기업 가치 훼손과 평가절하..
2024.06.13 -
성동2기 전Z전능 데이터 분석가 21일차[데이터분석 기법 : AB테스트]
많은 기업들이 실행하는 실험 방법 중에서 AB테스트는 단순하면서도 대표적으로 실험하는 방법이다. AB테스트는 주로 웹/앱 서비스의 UI 개편에서 많이 사용되는 실험이며 실험 과정은 다음과 같다.1. 임의로 구분 지은 두 집단을 분리하여 (이유 중요)2. 한 집단에게는 기존 페이지를 보여주고 다른 집단에게는 새롭게 개선할 예정인 페이지를 보여줌3. 두 집단 중 어떤 집단이 더 높은 성과를 보이는지 측정하여, 새 페이지가 기존 페이지에 비해 좋은지를 정량적으로 평가여기에서 성과란 새 사이트가 목표로 했던 바에 따라 다른데, 보통은 회원 가입율, 재방문율, 구매전환율 등의 지표를 본다.정량적 수치를 어떻게 평가할 것인지가 중요하다.AB테스트의 기반 이론인과 추론 - 무작위 표본 추출이 필요한 이유와 방법인과관..
2024.06.12 -
성동2기 전Z전능 데이터 분석가 20일차[데이터 시각화]
데이터 시각화는 데이터 분석 업무에서 중요한 일이다. 데이터를 통해 추세와 경향성이 드러나는 데이터의 특징을 이해하고 새로운 패턴이나 특징을 발견해서 새로운 인사이트를 얻을 수 있다. 더불어 업무 이해 관계자들과 커뮤니케이션 과정에서 시각화한 데이터를 가지고 소통하기에 협업에서도 필수적이다. 파이썬에서는 패키지를 통해 그래프를 만들고 수집한 데이터를 시각화할 수 있는 패키지를 제공한다. 오늘은 그래프를 만들 때 사용하는 패키지와 시각화하는 법을 기술했다. seaborn 패키지 그래프를 만들 때 자주 사용되는 패키지이며, 코드가 쉽고 간결하다. 산점도(scatter plot)산점도 그래프는 x,y축에 점으로 표현한 그래프이다. 주로 나이와 소득같은 연속값으로 된 두 변수의 관계를 표현할 때 사용된다. mp..
2024.06.11 -
성동2기 전Z전능 데이터 분석가 19일차[numpy, pandas_02]
파이썬 기본 규칙소괄호()- 함수 호출할 때 사용- 연산자 우선순위 (-곱셈보다 덧셈 등을 먼저 사용할 때)- 여러개의 조건절을 구분할 때 - 튜브(목록과 같은 인덱스 사용) 대괄호()- 리스트, 데이터프레임, 스트링 등에서 일부 데이터를 추출할 때(인덱싱)- 여러 개의 값의 묶음(그룹화) 따옴표 / 쌍따옴표('',"")- 의미상 차이는 없음.- 일반적인 스트링의 경우 ""- 문장에 '가 들어갈 경우는 "" / 반대의 경우는 ''- 리스트 내에 item의 경우 보통''데이터 전처리데이터 전처리는 분석에 적합하게 데이터를 가공하는 작업이며 데이터분석 업무에서 가장 많은 작업 비중을 차지한다고 한다. pandas 패키지는 전처리 작업시에 가장 많이 사용되는 패키지이다. 원하는 형태로 데이터 가공하기 (메소드..
2024.06.10