데이터 분석 프로젝트 주제
대기업 현직 데이터 분석가가 추천하는 데이터 분석 프로젝트 주제 + 활용 데이터셋
데이터 분석 프로젝트 주제
어떻게 해야 할까?
데이터분석 취업 준비하며 데이터 분석 프로젝트 주제에 대해 이런 고민하고 계시지 않은가요?
“데이터 분석 프로젝트 어떤 주제를 해야 할지 모르겠어요”
“데이터 분석 프로젝트 과정을 포트폴리오에 어떻게 녹여야 할까요?”
“오픈 API를 활용한 데이터 분석 프로젝트와 개인 프로젝트는 다른가요?”
데이터 취업 스쿨 수강생분께 받은 질문을 바탕으로 데이터 분석가 취업을 위한 데이터 분석 프로젝트 주제를 소개해드리고자 합니다. 데이터 분석 프로젝트 주제 선정부터 분석 과정, 포트폴리오 활용 팁까지 함께 이야기해드릴게요!
데이터 분석 프로젝트 5단계
먼저 데이터 분석 프로젝트는 5단계로 진행합니다.
1단계. 데이터 분석 프로젝트 주제 선정 (★중요!)
2단계. 데이터 찾기 (★중요!)
3단계. 데이터 분석 프로젝트 문제 정의 (★중요!)
4단계. 데이터 분석 진행
5단계. 데이터 분석 시각화 및 포트폴리오 구성
데이터 분석 프로젝트에서 가장 중요한 건 1~3단계입니다. 최신 기술 스택, 화려한 시각화보다 데이터 분석가 신입에게 요구하는 건 문제를 파악하는 역량과 논리력이니까요. 그렇기 때문에 데이터 분석 프로젝트에서 어떤 주제를 어떻게 정의했느냐 합격의 키 포인트입니다. 데이터 분석가 신입 채용 시 가장 중요하게 보는 문제 해결 역량을 바탕으로 데이터 분석 프로젝트 주제는 아래 3가지 대표 문제 유형 안에서 선정하는 걸 추천드립니다. 신입 데이터분석가가 대표 문제 해결 유형에 대한 역량을 보여준다면 타지원자와 비교하여 훨씬 경쟁력을 갖출 수 있답니다.
데이터 분석 프로젝트 주제
대표 문제 유형 3가지
데이터 분석 프로젝트 주제 유형 ①
✅ 회귀(Regression)
회귀 모델은 연속적인 척도로 목표 변수를 예측하는 데 사용합니다.
변수 간의 관계를 이해하고 추이를 평가하거나 예측하는 데에 활용합니다.
데이터 분석 프로젝트 주제 유형 ②
✅ 분류(Classification)
분류는 Supervised learning 지도학습의 일종으로 기존 데이터의 범주(Category)를 파악하고 새로 수집된 데이터의 범주를 스스로 판별하는 과정에 활용합니다.
데이터 분석 프로젝트 주제 유형 ③
✅ 이상탐지(Anomaly Detection)
이상탐지는 예상되거나 기대하는 관찰 값이 아닌 데이터 패턴, 개체 를 찾아내는 것을 의미합니다.
데이터 기반으로 이상 현상을 정의하고, 이상탐지 알고리즘을 활용하여 이상 여부 모델링합니다. 이상탐지는 금융, 통신, 의학 등 산업 전반에서 다양한 활용이 가능합니다.
회귀, 분류, 이상탐지 외에도 협업 필터링을 활용한 ‘추천시스템’도 데이터 분석 프로젝트 주제의 기본입니다.
3가지 대표 문제 유형과 함께하면 좋을 ‘클러스터링’과 ‘차원축소’도 소개해드릴게요.
함께하면 좋을 데이터 분석 프로젝트 주제 유형 ①
✅ 클러스터링(Clustering)
클러스터링은 주어진 데이터를 데이터 특성에 맞게 분류해주는 작업입니다. 클러스터링을 통해 데이터를 특성에 맞게 구분(Segmentation)하는 역할을 수행합니다. 특히 이커머스에서 시장을 구분할 때 하나의 시장을 여러 고객의 하위 군집으로 구분할 때 활용하곤 합니다.
함께하면 좋을 데이터 분석 프로젝트 주제 유형 ②
✅ 차원축소(Dimension Reduction)
차원 축소는 다량의 피처로 구성된 고차원의 데이터를 저차원 데이터로 축소하여 다양한 분석을 수행할 때 활용합니다.
학습 데이터의 크기가 줄어 학습을 효율화할 수 있으며, 단순히 데이터를 줄이는 것이 아닌 차원 축소를 통해 데이터를 더 잘 설명할 수 있는 잠재 요소를 추출하는 역할을 합니다.
소개해드린 데이터 분석 프로젝트 주제는 데이터 분석가 취업을 희망한다면 기본적으로 수행할 수 있어야 하는 대표적인 문제 해결 유형입니다. 데이터 분석에 대한 기본기는 반복해서 강조해도 지나침이 없는데요. 데이터 분석가 신입 공고에 지원한다면 전공, 학위가 부족할수록 ‘기본’에 집중해보세요!
잠깐
데이터분석 프로젝트의 대표 유형 소개가 끝난 뒤 또 다른 수강생분께 이런 질문을 받았어요.
“멘토님 데이터 분석 프로젝트 데이터셋은 어디서 구하나요?”
현직 데이터 분석가라면 사내 데이터를 포함하여 접근할 수 있는 데이터 셋이 정말 넓고 다양하지만 신입 취업을 준비하는 여러분께는 데이터 셋을 확보하는 것부터 막막하고 어렵죠. 비전공자, 학생, 취준생 누구나 접근할 수 있는 샘플 데이터셋 사이트를 소개해드릴게요!
이미지 = 캐글 홈페이지 (링크)
✅ Kaggle
이미지 = 데이콘 홈페이지 (링크)
✅ Dacon
데이콘은 캐글과 유사한 데이터 사이언스 컴피티션 국내 플랫폼입니다. 주최측으로부터 특정 데이터를 제공받고 해당 데이터를 이용하여 모델을 만들어 겨루는 형태로 이루어져 있어요.
* 분류 모델링 수행에 활용할 참고 데이터셋 링크
이미지 = 카네기 멜론 대학교 홈페이지
✅ 카네기 멜론 대학교 통계학과 공개 데이터셋
카네기 멜론 대학교 통계학과에서는 인구 통계학, 소비, 시장 등 오랜 기간 축적된 데이터셋 중 일부를 공개하고 있습니다.
* 회귀 모델 학습 시 활용할 수 있는 인구통계 데이터셋 링크
이미지 = 공공데이터 포털 홈페이지
✅ 공공데이터 포털 & 서울 열린데이터 광장
국내 인구 혼잡 정보, 서울지하철 승하차인원, 코로나19 데이터 등 사회현안 별 국내 공공데이터를 수집할 수 있어요.
아직 실무를 경험하지 못한 분들도 공개되어 있는 ‘실제’ 데이터를 통해데이터 분석 프로젝트 실무에 한 발짝 더 가까운 프로젝트 경험을 쌓을 수 있습니다. 전공, 학력이 뒷받침되기 어렵다면 ‘문제 해결 역량’을 보여줄 수 있는 프로젝트, ‘실제’ 데이터를 활용한 프로젝트가 여러분께 중요한 무기가 될 거에요. 그렇다면 이제 지원분야별 데이터 분석 프로젝트 주제 예시를 함께 볼까요?
현직 데이터 분석가가 추천하는
데이터 분석 프로젝트 주제
개인 프로젝트를 진행할 때에는 먼저 취업하고자 하는 분야, 즉 도메인을 구체화하는 것을 추천드립니다. 예를 들어 쿠팡과 같은 이커머스 기업을 희망한다거나 토스, 현대카드와 같은 금융, 핀테크 기업을 희망한다는 것 처럼요. 지원하고자 하는 도메인이 명확할수록 해당 도메인의 기업에서 수행하는 방법론 혹은 도메인에 맞춘 데이터셋을 활용하여 프로젝트를 진행한다면 취업 시 가산점을 받을 수 있습니다.
이미지 = 이커머스 대표 쿠팡
만약 쿠팡과 같은 ‘이커머스’ 기업을 희망한다면?
데이터 분석 프로젝트 주제 추천 ① 이커머스
🚩 퍼널 분석 프로젝트 주제
특정 웹 사이트에서 특정 결과(구매)에 도달하는데 필요한 단계와 각 단계를 통과하는 사용자 수 분석하기
🚩 코호트 분석 프로젝트 주제
사용자 유지율(User retention, 재방문율) 등의 지표를 통해 특정 기간에 방문한 사용자가 시간 경과에 따라 참여도가 어떻게 달라지는지 분석하기
🚩 A/B test 프로젝트 주제
A/B 테스트를 통해 두 가지 콘텐츠를 비교하여 방문자/뷰어가 더 높은 관심을 보이는 버전을 도출하기
👉🏻 추천 데이터셋 : Kaggle 브라질 이커머스 서비스 “Olist” DB
링크
이미지 = 삼성 스마트 공장 현장
삼성, 현대와 같은 대기업의 생산/제조에 관심있다면?
데이터 분석 프로젝트 주제 추천 ② 제조
🚩 품질 불량 원인 탐색 프로젝트 주제
냉장고를 생산하는 라인에서 센서 데이터를 분석하여 품질의 영향을 끼치는 공정 및 변수를 탐색하고 조정을 통해 품질 불량률 감소시키는 결과 도출하기
🚩 이상탐지 프로젝트 주제
설비가 고장나서 큰 Loss가 발생하기 전 데이터 분석을 통해 이상현상을 감지하고 사전 보수를 통해 고장을 방지하는 프로세스 구축하기
👉🏻 추천 데이터셋 : 제조AI 데이터셋
링크
이미지 = 게임 업계 대표
요즘 핫한 게임 업계로 취업하고 싶다면?
데이터 분석 프로젝트 주제 추천 ③ 게임
🚩 게임 Abuse 유저 탐색
게임 생태계의 보존을 위해 이상탐지를 통해 버그 활동이 의심되는 유저를 검출 및 조치하는 프로세스 구축
🚩 게임 내 과금 가능성이 높은 유저 예측
게임 내 어떤 페이지 혹은 퍼널 단계에서 광고를 노출했을 때 유저가 과금할 가능성이 높은지 분석하기
이미지 = 카카오페이 사옥
시장을 계속 확장해나가고 있는 IT 금융 업계에 관심있다면?
데이터 분석 프로젝트 주제 추천 ④ 금융
🚩 상품 가입 가능성이 높은 고객 예측
과거의 금융 거래 이력 학습을 통해 신규 상품 가입 가능성이 높은 고객을 예측하고, 해당 고객 대상 타겟 마케팅 플랜 수립하기
👉🏻 추천 데이터셋 : 공공데이터포털 자치구별 신용카드 매출액
링크
이미지 = 마켓컬리 유통, 배송
데이터를 통해 물류의 혁신을 꿈꾼다는 마켓컬리에 관심있다면?
데이터 분석 프로젝트 주제 추천 ⑤ 유통
🚩 우수고객 전환 가능성이 높은 고객 예측 프로젝트 주제
우수 고객의 특징을 분류하여 일반 고객에서 우수 고객으로 전활될 확률이 높은 고객을 예측하여 우수 고객 전환에 기여하기
🚩 이탈확률이 높은 고객 예측 프로젝트 주제
최근 3개월 평균 구매 금액이 ex.30만원 이하인 고객을 이탈 고객으로 정의하고, 이탈할 확률이 높은 고객을 예측하여 이탈을 방지하는 활동을 전개하기
🚩 구매 품목에 따른 고객 Segmentation 프로젝트 주제
명품, 가전, 식품 등 어떤 특성을 가지고 있는 고객이 특정 카테고리를 선호하는지 파악하고, 그룹핑(Segmentation)을 진행, 분류된 Segmentation을 기준으로 마케팅 효율 증대에 기여하기
데이터 분석 프로젝트 규모를 키워 팀 프로젝트를 하고 싶은데 함께 할 동료를 찾고 있다면,
데이터 취업 스쿨에서 현직 인공지능 개발자의 피드백과 함께 해보는 건 어떨까요?
데이터 취업 스쿨에서는 수강생이 선정한 프로젝트 주제와 취업 희망 도메인을 바탕으로 100% 취업 연계 인턴십을 운영하고 있습니다. 나이, 전공, 학력 상관없이 실제 기업에 출근하여 데이터 분석 실무를 경험하고 경력 쌓아 데이터 분석가 신입 취업에 도전하세요!
데이터 분석 취업까지 6개월.
데이터 전문 교수진이 함께합니다.
>> 데이터 취업 스쿨 바로가기
추천 컨텐츠