머신러닝, 딥러닝, 인공지능 차이

제로베이스 데이터 취업 스쿨

머신러닝, 딥러닝, 인공지능 차이
  • 알파고가 이세돌을 이긴 그날 이후로 자주 보이는 인공지능, 딥러닝, 머신러닝 기타 등등... 나와는 상관없어! 무시해왔지만 이제는 디자이너에게조차 data-driven 역량을 요구하는 채용 공고를 종종 발견하는 현실.ㅠㅠ 이쯤 되면 나 빼고 다들 저 단어들과 친한 것 같은데, 오늘 한 번 간단한 개념만 정리해볼까?라고 생각했다면 잘 들어오셨습니다! 아주 큰 그림만 그려서 보여드릴게요. 딥러닝, 머신러닝, 인공지능 이게 다 무슨 말이람.

딥러닝 ⊂ 머신러닝 ⊂ 인공지능


1. 인공지능은 사람의 지능을 모방하여 사람과 같이 복잡한 일을 할 수 있는 기계를 만드는 것을 말합니다. 인공지능을 구현하는 방법 중 중요한 방법이 머신러닝이고, 그 머신러닝의 여러 방법 중 하나가 딥러닝이랍니다.

머신러닝, 딥러닝, 인공지능 차이

머신러닝 VS 딥러닝, 좀 더 자세히 쉽게 알려줘요!


3. 이 질문은 LG이노텍 CTO에서 딥러닝 코칭을 담당하는 신제용 님이 답해주셨어요.

머신러닝, 딥러닝, 인공지능 차이

신재용 강사님

머신러닝은 '기계가 명시적으로 코딩되지 않은 동작을 스스로 학습해 수행하게 하는 연구 분야' 에요. 예를 들어, 어떤 학생에게 문제와 답만 있는 수학 문제집을 잔뜩 준다고 해보죠. 개념도 공식도 모르니 처음엔 다 틀리겠죠. 그런데 계속해서 문제를 풀다 보면, 머리가 좋은 학생이라면 어쩌다가 점점 문제를 잘 풀게 될 수도 있겠죠? 머신러닝은 그런 기대를 ‘기계’에 하는 거에요. 어떤 문제와 답을 막 던져주면 기계가 계속 풀어내면서 추상적인 원리를 스스로 깨치고 새로운 문제가 주어져도 스스로 답을 낼 수 있게 하는 것이 ‘머신 러닝’ 입니다.

​ 딥러닝은 머신러닝보다 더욱 알아서 하는 경우에요. 머신러닝의 경우 알고리즘에 입력하기 전 필요한 특징을 사람이 직접 선정해야 하거든요? 예를 들어 사람의 나이를 추정한다고 하면, 얼굴의 주름 개수, 피부 색상의 균일도, 특정 주름의 짙은 정도, 머리카락의 색깔과 같이 나이를 추정하는 데에 유용한 ‘특징’을 사람이 먼저 선택해야 하는 거죠.

그런데 딥러닝의 경우에는 ‘특징’을 선정하는 부분까지 한꺼번에 학습합니다. 머신러닝과 달리 사람 얼굴을 찍은 사진을 입력으로 넣어주면, 스스로 어떤 특징이 나이를 추정하는 데에 유용한지 알아내는 거죠. 그런 식으로 사람이 좀 더 손을 대 줘야 하던 부분들을 컴퓨터가 더 많이 처리해주는 편리함이 있습니다.

머신러닝 개발자 VS 데이터 사이언티스트, 이 둘은 어떻게 다른가요?.


4. 이 부분에 대해서는 이해하기 쉽게 예시를 들어 설명해주신 글이 있어서 소개해드리려고 해요.

​ 데이터 분석가는 자동차 수리공, 머신러닝 개발자는 자동차 엔진 개발자, 그리고 데이터 사이언티스트는 자동차 설계 및 디자이너라고 예시를 들 수 있습니다. 숙련된 자동차 수리공은 자동차를 한번 운전해보고 엔진 소리를 들으면 어느 곳에 문제가 있는지 쉽게 파악해내고 적합한 솔루션을 제시할 수 있죠.

머신러닝을 잘 활용하는 능력을 갖춘 개발자는 적절한 엔진을 장착시켜 자동차가 잘 나갈 수 있도록 해 줄 수 있고요. 차를 설계하고 디자인해서 상품을 출시하는 것은 보다 근본적인 문제입니다. 데이터 사이언티스트에게 가장 핵심적인 스킬은 문제에 맞는 모델링을 하고 그 모델을 통계학, 시뮬레이션, 머신러닝 기술을 적절하게 조합해서 실제로 구현하는 능력이라고 생각해요.

더 자세히 알려주세요.


유저들의 행동 패턴을 예측하는 매체사 모델의 경우를 예로 들어봅시다. 데이터 분석가는 유저의 연령, 성별, 지역 등등 식별화할 수 있는 정보들을 바탕으로 상호 연관관계를 잡아낼 수 있을 것 입니다. 머신러닝 개발자는 관계있는 변수들을 Tensor Flow에 얹어서 그 변수들과 매칭율이 높은 유저에게 적절한 광고를 노출할 수 있는 시스템을 만들 수 있고요.

데이터 사이언티스트는 우선 앞의 두 가지를 모두 다 할 수 있어야 합니다. 나아가 변수가 될 가능성이 있는 데이터 가공 능력도 필수입니다. 단순히 DB에 저장된 데이터를 그대로 Tensor Flow에 얹는 게 아니라, 다양한 테스트를 통해서 적절한 변수를 찾아낼 수 있어야 해요.

변수들 간의 상관관계가 목적에 부합하는지 테스트하는 능력도 필수입니다. 데이터에 오류가 있을 때 나타나는 상관관계가 있을 경우, 데이터 오류의 영향을 제거할 수도 있어야 하고요. 더불어 주어진 광고 캠페인 데이터와 미래 트렌드를 적절하게 조합하는 시뮬레이션 모델로 광고주에게는 광고 예산을 예상할 수 있게, 매체사에는 광고 물량을 예상할 수 있도록 해 줘야 합니다.

자료 출처


1 인공지능, 머신러닝, 딥러닝 개념 [인공지능 이야기] 정의, 주요 개념 구분, 종류, 예시
https://brunch.co.kr/@gdhan/10

2사진 출처; 인공지능, 딥러닝은 뭐고 머신러닝은 뭐야?
http://yangjaehub.com/newsinfo/%ed%95%99%ec%83%9d%ea%b8%b0%ec%9e%90%eb%8b%a8/?mod=document&uid=39

3 머신러닝과 딥러닝, 아직도 헷갈린다고?
http://media.fastcampus.co.kr/knowledge/data-science/ai_study/

4 데이터 사이언티스트란? data science with R -1.오해
http://blog.ab180.co/data-science-with-r-1-misperception/ ​


제로베이스와 함께한 이야기가 더 궁금하다면,