Introduction to Data Science

1. Data Science

: 데이터 사이언스란 합리적인 의사 결정을 위해 정형/ 비정형 형태를 포함한 다양한 데이터로부터 지식과 인사이트(insight)를 추출하기 위한 과학적 방법론 및 프로세스.

 

- 정형 데이터 : 정수형, 실수형, 문자 데이터등 과 같이 데이터의 특성이 정해짐

- 비정형 데이터 : 음성, 영상, text등 과 같이 데이터의 포맷이 정해지지 않음

인사이트 : 통찰력, 비즈니스, 마케팅 등에서는 어떤 비즈니스 문제를 해결하는 이상적이고 창의적으로  해결할 수 있는 단서.

 

또는, 데이터를 통해 실제 현상을 이해하고 분석하기 위한 통계학, 데이터 분석, 기계학습 등과 연관된 방법론을 통합하는 개념

 

- 데이터 사이언스 관련 기술

  • 수학, 통계학
  • 컴퓨터 공학, 정보 공학
  • 패턴인식, 기계학습, 데이터 마이닝, 데이터 베이스 ....

- 데이터 분석 및 활용 사례들

  • 질병의 진단, 예측
  • 공장 기계/로봇의 장애 예측
  • 자동차 사고 발생 예측
  • 데러 및 재난 예측
  • 웹사이트의 개인 맞춤형 광고
  • 상품의 고객 피드백 분석
  • 흥행할 영화, 음악 등 예측...

2. Data Business : 데이터를 분석하여 가치를 창출하는 비즈니스

 ex) 구글, 네이버 등의 검색 엔진, 페이스북, 트위터, 인스타그램 등의 SNS, Youtube, Amazon, Apple....

 

3. Data 분석

3-1. 데이터 분석의 가치

- 데이터 기반 경제의 핵심은 데이터를 분석하고 이로부터 새로운 가치를 창출하는 것.

- 데이터 유통이 증가하고 있음.

   -> 현재 각 기업들의 고객 데이터 분석이 증가하고 있음.

- 데이터 분석은 정치, 경제, 사회, 문화, 국방, 교육, 의료 등 전 분야에 영향을 줌.

- 다양한 데이터를 활용해 다양한 시각의 분석이 가능해짐.

    -> 문제 해결 과제의 사례

         - 기업의 상품 매출 높이기

         - 특성 시기별 상품의 사전 준비

         - 신용카드의 불법 이용 적발

         - 기존 고객의 고객 이탈 방지

         - 삼야 버스 노선의 효과적 계획......

3-2. 데이터 분석의 필요성

    1) 경험과 직관의 한계

       - 데이터 사이언스의 장점은 미리 결과를 알 수 있다는 예측에 있음.

             ex) 세이버 매트릭스(야구선수 스카우트), 로버 어드바이저(금융 상품 추천), 의학, 항공 분야......

 

       - 전문가의 경험과 직관보다 객관적인 의사결정이 가능함.

             ex) 올리 아션펠터의 와인 품질 공식을 통한 분석

       - 데이터 사이언스에서 경험과 직관을 가진 전문가가 해야 할 역할

                ▶ 무엇이 중요한 문제인지 결정

                ▶ 어떤 데이터를 조사해야 할지 판단.....

    2) Data Science vs 기존의 연구

                     기존의 연구                                    데이터 분석

        - 기존의 과학적 탐구는 원인 발견에 초점         - 원인 탐구 보다는 관계 분석에 초점

        - 어떤 현상의 원인을 연구하여 원리 발견         - 근본 원인을 모르더라도 미래 예측 연구에 가치를 둠

        - 인과 관계 연구에 초점                               - 문제 해결에 필요한 패턴, 상관관계 연구에 초점

3-3. 데이터 사이언스의 접근 방법

    ▶ 통계학적 접근 방법

         - 추론 통계 -> 가설 확인 중심 : 가설을 세운 뒤, 데이터를 수집, 분석하여 가설을 확인

              ex) 가설 : 고객의 연봉과 대출금액이 신용 불량 여부 관계가 높다

    ▶ 데이터 마이닝(Data Mining)식 접근 방법

         - 가설 발견 중심 : Classification, Clustering, Association Rule Mining, Text....

              ex) 어느 고객이 잠재적 신용 불량자일까

 

'전공 과목 공부 > 데이터 사이언스' 카테고리의 다른 글

Data Preprocessing(1)  (0) 2021.03.17
About Data(3)  (0) 2021.03.17
About Data(2)  (0) 2021.03.10
About Data(1)  (0) 2021.03.10
Introduction to Data Mining  (0) 2021.03.06