제로베이스 데이터 취업 스쿨

빅데이터 활용 사례 5가지, 카카오 / 오늘의집 / 당근마켓 데이터 분석 실무 알아보기

국내 TOP 기업 사례로 알아보는 빅데이터 특징, 데이터 분석 예시

빅데이터 활용사례

Editor's note
빅데이터 분석, 중요하다고는 하는데 도대체 빅데이터가 뭔지 아직 감이 잘 안 오시나요?
실무에서 데이터 분석이 중요하다는 이야기는 많이 들어보셨을 거예요. 실제로 카카오, 오늘의집, 당근마켓 등 국내 TOP 기업의 빠른 성장 배경엔 빅데이터 활용이 지대한 영향을 끼쳤습니다. 이들이 활용한 빅데이터란 무엇인지, 어떤 특징이 있는지. 그리고 기업에서 데이터 분석 실무는 어떻게 이루어지는지. 궁금하지 않으신가요?

국내 TOP 기업들의 빅데이터 활용 사례를 통해 실무에 빅데이터가 어떻게 활용되는지, 데이터 분석이 왜 중요한지 살펴보도록 하겠습니다. 빅데이터에 대해 알고 싶은 분들, 혹은 데이터 분석가로 취업하고 싶은 분들이라면 아래 글을 꼭! 읽어보면서 실제 기업들의 빅데이터 활용 사례를 알아보시길 추천드려요.

  • 이번 아티클은 이렇게 구성되어 있어요!

    1. 빅데이터 알아보기
     1) 빅데이터 정의
     2) 빅데이터의 특징
     3) 빅데이터 관련 용어 살펴보기

    2.빅데이터 활용 사례

     1) 카카오
     2) 오늘의집
     3) 당근마켓
     4) 쿠팡
     5) 컬리

Part 1.
빅데이터 알아보기

1) 빅데이터 정의

빅데이터, 하면 ‘아주아주 많은 데이터’라는 이미지가 떠오르지 않나요? 여러 기관에서 내린 빅데이터의 정의는 다음과 같아요.

“기존의 관리 및 분석 체계로는 감당할 수 없을 정도의 거대한 데이터의 집합” - 삼성경제연구소

“대용량 데이터를 활용, 분석하여 가치있는 정보를 추출하고,
생성된 지식을 바탕으로 능동적으로 대응하거나 변화를 예측하기 위한 정보화 기술”
- 국가정보화전략위원회

빅데이터는 관점에 따라 정의가 조금씩 달라지지만, 공통된 정의에 따르면 “기존의 데이터 처리방법으로는 감당하기 힘들 정도로 방대한 분량의 데이터”라고 말할 수 있습니다. 이러한 빅데이터는 전통적인 데이터 관리 및 분석 도구로는 처리하기 어려운 규모와 복잡성을 가지고 있습니다.


빅데이터 활용사례

2) 빅데이터의 특징

빅데이터는 일반적으로 3V(Volume, Variety, Velocity)에 2가지 특성(Variability, Veracity)을 추가하여 5V를 가지고 있어요. 빅데이터의 특징 5가지, ‘5V’는 다음과 같습니다.

① 규모 (Volume)
: 대량의 데이터로 이루어져 있습니다. 일반적으로 테라바이트(TB)에서 페타바이트(PB) 이상의 크기를 가지며, 지속적으로 증가하는 경향이 있죠.

② 다양성 (Variety)
: 다양한 유형과 형식의 데이터를 포함합니다. 구조화된 데이터뿐만 아니라 비구조화된 데이터, 텍스트, 이미지, 오디오, 비디오 등 다양한 형태의 데이터를 다루며, 다양한 소스에서 수집됩니다.

③ 속도 (Velocity)
: 고속으로 생성되고 전송되는 특성을 가지고 있습니다. 실시간으로 발생하는 데이터 스트림이나 고속의 데이터 처리를 필요로 합니다.

④ 가변성 (Variability)
: 다양한 형식과 소스에서 생성되며, 다양한 시기에 발생하는 특성을 가지고 있습니다. 데이터의 가용성, 변동성, 불규칙성 등을 다루어야 합니다.

⑤ 정확성 (Veracity)
: 데이터의 신뢰성과 정확성에 대한 문제를 다루어야 합니다. 데이터의 오류, 노이즈, 부정확성 등을 고려하여 데이터의 신뢰도를 확보해야 합니다.

3) 빅데이터 관련 용어 살펴보기

빅데이터는 알겠는데, 빅데이터와 닮은 듯 다른 듯 헷갈리는 용어들이 많다구요? 지금부터는 빅데이터 관련 용어들에 대해 자세히 알아보도록 할게요.

① 데이터베이스(Database)

“체계적으로 구성된 데이터의 집합”
일반적으로 컴퓨터 시스템에 저장되고 관리되며, 효율적인 데이터 접근과 관리를 위한 구조와 방법을 제공합니다. 가장 일반적인 형태인 관계형 데이터베이스(Relational Database)는 테이블(Table)이라는 구조를 사용하여 데이터를 저장하고, 테이블 간의 관계를 정의하여 데이터를 조작하고 검색할 수 있는 SQL(Structured Query Language)을 사용합니다.

② 인공지능(AI, Artificial Intelligence)

“지능적인 행위를 할 수 있는 컴퓨터 프로그램”
일반적으로 컴퓨터 시스템에 저장되고 관리되며, 효율적인 데이터 접근과 관리를 위한 구조와 방법을 제공합니다. 가장 일반적인 형태인 관계형 데이터베이스(Relational Database)는 테이블(Table)이라는 구조를 사용하여 데이터를 저장하고, 테이블 간의 관계를 정의하여 데이터를 조작하고 검색할 수 있는 SQL(Structured Query Language)을 사용합니다.

인공지능은 인간의 지능을 모방하거나 강화하는 컴퓨터 시스템 또는 프로그램을 가리키는 용어입니다. 인공지능은 컴퓨터가 사고, 학습, 추론, 문제 해결 등 인간의 인지적 능력을 모사하도록 설계되었습니다. 인공지능은 다양한 분야에서 사용되며, 다양한 작업을 수행할 수 있는 기능을 갖추고 있습니다. ex) 음성 인식, 이미지 분석, 자연어 처리, 추천 시스템, 자율 주행차, 게임 인공지능

인공지능은 다양한 분야에서 혁신과 발전을 이끌고 있으며, 향후 더 많은 분야에서의 응용이 기대되고 있습니다.

③ 머신러닝(Machine Learning)

“스스로 학습을 하는 프로그램” (경험을 많이 할 수록 성능이 좋아지는 컴퓨터 프로그램)
머신러닝은 인공지능의 한 분야로, 컴퓨터 시스템이 데이터로부터 학습하고 패턴을 인식하며, 이를 통해 문제를 해결하고 예측하는 기술입니다. 머신러닝은 데이터를 기반으로 자동으로 모델을 구축하고 업데이트하여 인사이트를 발견하고 의사결정을 지원하는 능력을 갖추게 됩니다.

④ 딥러닝(Deep Learning)

“머신 러닝의 한 분야로, 심층 학습을 하는 알고리즘”
딥 러닝은 인공신경망(Artificial Neural Network)을 기반으로 한 머신러닝 알고리즘의 한 종류입니다. 딥 러닝은 다층 신경망(multi-layer neural network) 구조를 갖춘 모델을 사용하여 데이터로부터 의미 있는 표현을 자동으로 학습하고 예측, 분류, 패턴 인식 등을 수행합니다. 딥 러닝은 여러 개의 은닉층(hidden layer)을 통해 데이터의 추상적인 특징을 계층적으로 학습하여 복잡한 패턴을 해석할 수 있게 합니다. 이렇게 학습된 딥러닝 모델은 새로운 데이터에 대한 예측이나 분류를 수행할 수 있습니다.

[장점]
: 높은 정확도, 복잡한 문제를 다룰 수 있음, 대용량 데이터와 고성능 컴퓨팅 자원이 확보되는 환경에서 특히 높은 성능을 보임
(-> 컴퓨터 비전, 음성 인식, 자연어 처리, 게임 AI 등에서 광범위하게 활용됨)

[단점]
: 느린 속도, 결론의 이유를 알기 어려움, 데이터가 너무 적은 경우 학습이 어려움

머신러닝 딥러닝

정리하자면
딥 러닝 ⊂ 머신 러닝 ⊂ 인공지능!

인공지능
, 즉 AI는 특정한 기술이라기보다는 하나의 거대한 목표에 가까워요!
머신 러닝은 ‘인공지능’이라는 목표를 이루기 위한 하나의 방법론,
딥 러닝은 머신 러닝 알고리즘의 한 종류라고 할 수 있습니다.

Part 2.
빅데이터 활용 사례

빅데이터가 무엇인지 이제 조금은 감이 잡혔다면, 국내 TOP 기업들의 빅데이터 활용 사례에 대해 알아볼까요? 카카오, 오늘의집, 당근마켓 등 우리가 알고 있는 유명 IT 기업들은 서비스를 향상시키고, 비즈니스 효율성을 극대화하는 방법을 찾아 빠르게 성장하기 위해 빅데이터 분석을 적극 활용해왔습니다. 각각의 분야에서 빅데이터 분석을 어떻게 활용했는지 알아보도록 하겠습니다.

빅데이터 활용 사례 ① 카카오

국내 대표 IT 기업인 카카오는 다양한 온라인 서비스를 제공하면서 대량의 사용자 데이터를 수집하고 있습니다. (ex. 카카오톡, 카카오뮤직, 카카오TV, 카카오페이) 제공하는 서비스가 많은 만큼, 각각의 서비스에서 수집할 수 있는 사용자 데이터도 어마어마하겠죠? 이를 통해 빅데이터 분석이 가능해지는데, 특히 사용자의 행동 패턴과 선호를 분석하는 데에 이 데이터를 활용합니다. 이런 분석 결과를 바탕으로 카카오는 서비스를 개인화하여 사용자 경험을 개선합니다.

[빅데이터 활용 사례 - 카카오 1] 카카오페이

카카오 빅데이터 활용사례

카카오페이는 마이데이터(본인신용정보관리업) 사업을 통해 빅데이터 분석을 활용한 자산관리 서비스를 더욱 확장해나가고 있습니다. 카카오페이는 이 마이데이터를 기반으로 사용자의 결제 이력, 관심사, 소비 성향 등을 분석하여 맞춤형 추천 서비스를 제공합니다. 예를 들어 사용자의 소비 패턴에 맞는 카드 상품을 추천해주는 ‘카드추천’ 서비스, 특정 가맹점의 할인 혜택 추천 등이 있죠. 이를 통해 사용자는 보다 효율적이고 만족스러운 소비 경험을 할 수 있습니다.

[빅데이터 활용 사례 - 카카오 2] 카카오TV

카카오 TV에서는 사용자의 시청 기록을 분석하여 사용자에게 맞는 컨텐츠를 추천합니다. 이런 추천 시스템 덕분에 사용자는 자신이 관심을 가질 가능성이 높은 새로운 컨텐츠를 발견할 수 있게 됩니다. 넷플릭스, 왓챠 등 OTT 서비스를 제공하는 대부분의 기업들이 이러한 시스템을 활용하고 있죠.

카카오의 빅데이터 활용 사례에 대해 더 자세히 알고 싶다면?
카카오 개발 컨퍼런스 2022 보러가기

빅데이터 활용 사례 ② 오늘의집

버킷플레이스 '오늘의집'의 Data & Discovery 팀은 빅데이터를 활용하여 서비스 개선에 주력하고 있습니다. 머신러닝 기술을 활용하여 앱 내 개인화된 추천 기능을 고도화하고 있죠.

오늘의집 빅데이터 활용사례

오늘의집의 홈 화면, ‘이 콘텐츠 좋아하실 것 같아요’ 탭
(유저에 따라 홈 화면이 다르게 표현되는 모습)

오늘의집은 앱 첫 화면(Home)을 개인화하여 추천과 발견의 공간으로 만들었습니다. 이 홈 화면 개인화 이후 홈 영역에서 클릭 전환율은 약 2배 증가했고, 조회 전환도 약 60% 높아졌다고 해요.

오늘의집 빅데이터 활용사례

오늘의집 개인화된 사진 피드 화면

오늘의집 하면 떠오르는 멋지고 감도 높은 사진 추천도 빅데이터 기반으로 이루어지고 있어요. 개인화 피드 적용을 통해 모든 유저가 자신의 취향에 맞는 사진 전시회에 온 것처럼 인기 사진과 자신의 취향에 맞는 사진을 같이 볼 수 있답니다.

오늘의집은 유저의 행동을 바탕으로 상품 구매 패턴, 즐겨보는 콘텐츠의 스타일, 주제 등을 분석하여 머신러닝을 통해 유저의 취향을 판단합니다. 이를 오늘의집이 가진 #미니멀리스트 #미드센추리 같은 분류체계와 결합해 개인화 추천모델을 만들어냅니다. 통계적으로 어떤 취향을 가질지 등을 분석해 다음에 볼 콘텐츠나 상품을 예측하고 추천하는 것이죠.

이러한 개선 작업을 위해 오늘의집은 플랫폼 내 정보를 재분류하고, 제품과 콘텐츠의 랭킹 로직을 설계했습니다. 또한 사용자의 개인 취향을 자동으로 분석해 데이터화하는 머신러닝 기술도 고도화했어요.

이와 같이 오늘의집은 콘텐츠와 커뮤니티, 커머스 등 다양한 분야에서 데이터를 기반으로 한 개인화 추천 기술을 적용하고 있고, 앞으로도 확대할 계획이라고 합니다.

오늘의집 빅데이터 활용 사례에 대해 더 자세히 알고 싶다면?
오늘의집 뉴스룸 보러가기

빅데이터 활용 사례 ③ 당근마켓

당근마켓 빅데이터 활용사례

“혹시… 당근이세요?”

중고 거래를 중심으로 하는 지역 생활정보 플랫폼 서비스 ‘당근마켓’. 이미 중고 거래 서비스는 많이 있지만 당근마켓은 ‘지역'이라는 특성을 바탕으로 차별성을 갖게 됐고, 결국 이용자가 늘어나면서 지역 사회의 이야기를 담아내는 커뮤니티로 성장했습니다. 그리고 이 비즈니스 확장의 중심에는 데이터가 있습니다. 당근마켓은 빅데이터와 머신러닝 기반의 데이터 분석 서비스를 통해 게시판을 효율적으로 운영하고 있습니다. 당근마켓의 머신러닝 활용 예시 중 두 가지를 소개해드릴게요.

(1) 상품 카테고리 자동 분류
사용자가 당근마켓에 물품을 판매하기 위해 사진을 게시했을 때, 머신러닝 기반 이미지 인식 및 분류 기술을 통해 상품 사진을 자동으로 분석하고, 상품 카테고리를 자동으로 지정할 수 있습니다. 이는 사용자들이 올린 상품을 쉽게 찾을 수 있도록 도와주며, 판매자들도 상품 정보를 입력하는 시간과 노력을 줄여줍니다.

(2) 이용자에 맞춤형 콘텐츠 추천
당근마켓은 사용자들에게 관심 상품을 추천하여 매칭해주는 서비스를 제공합니다. 이때 머신러닝 기술을 기반으로 사용자의 검색 이력, 관심사, 거래 기록 등을 분석하여 사용자가 좋아할 만한 상품이 홈 화면에 자동으로 추천되어 보여지죠. 이러한 개인화된 추천 시스템은 사용자들이 더욱 편리하고 맞춤화된 거래 경험을 할 수 있도록 도와줍니다.

위의 두 사례 외에도 당근마켓은 가품 판별, 스팸 댓글 필터링, 악성 사용자 탐지 등 소비자의 소통 및 거래 만족도 향상을 위해 빅데이터를 적극 활용하고 있습니다. 이러한 빅데이터 기반 머신러닝 모델을 적용하면서 당근마켓은 늘어나는 게시물을 효율적으로 관리할 수 있게 됐고, 이용자별 맞춤 서비스도 갖출 수 있었습니다. 결과적으로 급격하게 성장하는 스타트업이 시스템 때문에 겪을 수 있는 문제들을 깔끔하게 해결하게 됐죠.


당근마켓 빅데이터 활용 사례에 대해 자세히 알고 싶다면?
당근마켓 테크 블로그 보러가기

빅데이터 활용 사례 ④ 쿠팡

쿠팡 빅데이터 활용사례

국내 대표 이커머스 기업 쿠팡은 광범위한 고객 데이터를 활용한 빅데이터 분석에 중점을 두고 있습니다. 이를 통해 쿠팡은 개인화된 서비스 제공, 상품 추천, 배송 최적화, 고객 서비스 향상 등 다양한 분야에서 빅데이터를 활용하고 있습니다.

(1) 개인화된 상품 추천
고객들의 구매 이력, 검색 기록, 페이지 방문 기록 등을 분석하여 개인화된 상품 추천을 제공합니다. 이를 통해 고객은 자신의 선호에 맞는 상품을 쉽게 찾을 수 있고, 쿠팡은 고객 만족도를 높이고 매출을 증가시킬 수 있죠.

(2) 배송 최적화
쿠팡은 배송 데이터를 분석하여 배송 루트를 최적화하고, 배송 시간을 줄입니다. 이는 '로켓 배송'이라는 쿠팡의 주요 서비스에 기여하며, 고객들에게 빠른 배송을 제공함으로써 경쟁력을 유지하고 있습니다.

(3) 고객 서비스 개선
쿠팡은 고객의 피드백 및 상품 리뷰 데이터를 분석하여 고객 서비스를 개선합니다. 예를 들어, 특정 상품의 리뷰에서 반복적으로 나타나는 문제점을 파악하면, 해당 문제를 해결하기 위한 조치를 취할 수 있습니다.

이외에도, 쿠팡은 마케팅 효율성 분석, 재고 관리, 가격 최적화 등에서도 빅데이터를 활용하고 있어요. 이를 통해 쿠팡은 고객 만족도를 높이고, 비즈니스 운영의 효율성을 증가시키고 있죠.

빅데이터 활용 사례 ⑤ 컬리

컬리 빅데이터 활용사례

‘마켓컬리 새벽배송’으로 국내 식품 유통 시장에 혁신을 일으킨 컬리는 최근 화장품 분야로도 사업분야를 확장하여 ‘뷰티컬리’ 서비스도 함께 운영하고 있습니다. 컬리 또한 빅데이터를 다양한 방식으로 활용하고 있는데요.

(1) 고객 맞춤형 상품 추천
컬리는 고객의 구매 이력, 검색 이력, 페이지 뷰 등의 데이터를 분석하여 고객 맞춤형 상품 추천을 제공합니다. 이를 통해 고객은 자신의 선호에 따른 상품을 더 쉽게 찾아볼 수 있고, 컬리는 매출을 늘릴 수 있죠.

(2) 재고 관리 및 수요 예측
고객의 구매 패턴, 계절성, 트렌드 등을 분석하여 수요를 예측하고 재고를 관리합니다. 이로 인해 불필요한 재고 비용을 줄이고 상품 품절을 최소화하여 고객 만족도를 높일 수 있어요.

(3) 마케팅 전략 개발
컬리는 고객 행동 데이터를 분석하여 효과적인 마케팅 전략을 개발합니다. 예를 들어, 어떤 상품이나 카테고리가 고객들에게 인기가 있는지, 특정 시간대에 가장 많은 트래픽이 몰리는지 등의 정보를 활용하여 타겟팅 광고나 프로모션을 진행합니다.

이처럼 컬리는 빅데이터를 통해 고객 경험을 향상시키고, 비즈니스 운영의 효율성을 증대시키는 데 활용하고 있습니다.

마치며,

‘이 글에서 다뤄본 국내 TOP 기업들의 빅데이터 활용 사례처럼, 빅데이터 분석은 다양한 산업에서 가치를 창출하고 있습니다. 기업이 새로운 비즈니스 모델을 개발하고, 고객과의 관계를 강화하며, 효과적인 의사결정을 가능하게 하는데 필수적인 요소가 됐죠.

빅데이터의 활용 사례를 살펴보면, 빅데이터 분석이란 단순히 데이터를 수집하고 분석하는 것만을 의미하는 것이 아닙니다. 데이터를 통해 얻은 인사이트를 실제 비즈니스 전략과 결정에 적용하는 것에 있죠. 이를 통해 경쟁력을 향상시키고, 효율성을 증가시키며, 고객 만족도를 높이는 모습을 빅데이터 활용 사례에서 살펴볼 수 있습니다.

기업에서 빅데이터 분석이 필수가 된 만큼, 데이터 전문가의 직업적 유망성은 앞으로도 밝을 전망이예요. 실제로 데이터 직군은 미국에서도 2022년 직업 유망성 TOP 10 안에 들었죠. 미국의 직장 및 상사 평가사이트 글래스도어에 따르면, 유망 직종 10위 안에 데이터 사이언티스트와 데이터 엔지니어가 꼽혔어요.

2023 유망 직업

미국 2022 유망 직업 10가지 (사진=글래스도어)

빅데이터를 제대로 배워 데이터 분석 직무로 취업하고 싶다면, 제로베이스 데이터 취업 스쿨을 추천드려요.
데이터의 기초 지식부터 시작해, 실무와 유사한 데이터 분석 프로젝트 경험까지 쌓을 수 있거든요.

제로베이스는 여러분의 데이터 분야 취업을 응원합니다!

누구나 6개월 만에 데이터 분야 취업하고 싶다면
>> 데이터 취업 스쿨 바로가기


추천 컨텐츠