성동2기 전Z전능 데이터 분석가 14일차 [데이터 분석 이론_02]

2024. 6. 4. 11:47데이터분석 기술블로그

오늘은 AI와 머신러닝 개념 및 주요 분석 기법에 대한 이론을 알아보았다. 요즘 AI가 많이 핫하고 나도 몇가지 툴은 즐겨 사용하고 있는데 사용하면서도 인공지능이 어떤 메커니즘으로 작동하는지는 제대로 알지 못했다. 인공지능 기술에는 크게 두가지 개념이 존재하는데 머신러닝과 딥러닝이다. 둘의 정의를 살펴보면 머신러닝은 인공지능을 만들기 위해 데이터를 통해 학습하고 개선하는 방법으로, 신경망(neural network) 등 다양한 기법 이 존재한다. 딥러닝은 신경망 모델을 깊게 구축하고 학습 시키는 방법인데 이 신경망 모델이란 것은 뇌의 뉴런과 유사한 정보 입력 층계 활용하여 데이터를 학습시키는 방법이다. 사실 이런 개념을 들어도 제대로 이해하지는 못하지만 작동하는 원리를 대략 설명하자면, 머신러닝은 샘플을 뿌려놓고 특징적인 데이터를 분류기로 분류한 후 학습시키는 방법이고, 딥러닝은 샘플과 분류를 AI가 알아서 알아가며 학습하는 방법이라고 한다. 두 방식의 장단점이 너무 상반돼서 환경에 맞게, 필요에 맞게 잘 쓰는 게 중요할 것 같았다.

 

주유 분석 기법에서 머신러닝의 알고리즘은 지도학습과 비지도 학습이 있다. 지도학습은 레이블(Lable)이 있는 문제를 다루는 방법인데 레이블의 종류에 따라 분류/회귀로 나뉜다. 비지도 학습은 레이블이 없는 문제를 다루고 결과의 정답이 없으며, 숨겨진 구조나 패턴을 발견하여 인사이트를 도출해내는 방법이다. 비슷한 데이터를 묶어주는 군집화와 데이터가 표현되는 차원을 줄이는 차원축소로 나뉜다.

이것도 내식으로 대략 설명하자면,
지도분석 : 이름있는것 끼리 묶어서 특징과 이름의 관계를 학습시키고 새로운 데이터를 더해 레이블을 예측시켜가며 인공지능 학습시킴

비지도학습 : 이름없고 기준이 애매한것들 데려다가 의미있는 정보를 추출하고 데이터 구조와 패턴을 파악하기 위함

 

아직 더욱 심화된 개념까지 이해하기엔 무리였다. 데이터 분석을 위한 인공지능 모델을 구축하여 사용하는 것 까지 이해하는 걸 목표로 해야지, 사실 인공지능에 대해 딥하게 들어가면 그땐 이미 데이터분석가가 아니게 될거다. 그리고 이렇게 배운 인공지능 모델을 구축하는데 파이썬을 많이 사용한다고 하는데, 다음주부터 배우게 될 것 같다. 기대가 된다.