어두운 지도를 조금씩 밝혀나가는 데에서 즐거움을 느낀다면
- 정형 데이터 : 정수형, 실수형, 문자 데이터등 과 같이 데이터의 특성이 정해짐
- 비정형 데이터 : 음성, 영상, text등 과 같이 데이터의 포맷이 정해지지 않음
- 인사이트 : 통찰력, 비즈니스, 마케팅 등에서는 어떤 비즈니스 문제를 해결하는 이상적이고 창의적으로 해결할 수 있는 단서.
또는, 데이터를 통해 실제 현상을 이해하고 분석하기 위한 통계학, 데이터 분석, 기계학습 등과 연관된 방법론을 통합하는 개념
- 데이터 사이언스 관련 기술
- 데이터 분석 및 활용 사례들
ex) 구글, 네이버 등의 검색 엔진, 페이스북, 트위터, 인스타그램 등의 SNS, Youtube, Amazon, Apple....
- 데이터 기반 경제의 핵심은 데이터를 분석하고 이로부터 새로운 가치를 창출하는 것.
- 데이터 유통이 증가하고 있음.
-> 현재 각 기업들의 고객 데이터 분석이 증가하고 있음.
- 데이터 분석은 정치, 경제, 사회, 문화, 국방, 교육, 의료 등 전 분야에 영향을 줌.
- 다양한 데이터를 활용해 다양한 시각의 분석이 가능해짐.
-> 문제 해결 과제의 사례
- 기업의 상품 매출 높이기
- 특성 시기별 상품의 사전 준비
- 신용카드의 불법 이용 적발
- 기존 고객의 고객 이탈 방지
- 삼야 버스 노선의 효과적 계획......
- 데이터 사이언스의 장점은 미리 결과를 알 수 있다는 예측에 있음.
ex) 세이버 매트릭스(야구선수 스카우트), 로버 어드바이저(금융 상품 추천), 의학, 항공 분야......
- 전문가의 경험과 직관보다 객관적인 의사결정이 가능함.
ex) 올리 아션펠터의 와인 품질 공식을 통한 분석
- 데이터 사이언스에서 경험과 직관을 가진 전문가가 해야 할 역할
▶ 무엇이 중요한 문제인지 결정
▶ 어떤 데이터를 조사해야 할지 판단.....
2) Data Science vs 기존의 연구
기존의 연구 데이터 분석
- 기존의 과학적 탐구는 원인 발견에 초점 - 원인 탐구 보다는 관계 분석에 초점
- 어떤 현상의 원인을 연구하여 원리 발견 - 근본 원인을 모르더라도 미래 예측 연구에 가치를 둠
- 인과 관계 연구에 초점 - 문제 해결에 필요한 패턴, 상관관계 연구에 초점
▶ 통계학적 접근 방법
- 추론 통계 -> 가설 확인 중심 : 가설을 세운 뒤, 데이터를 수집, 분석하여 가설을 확인
ex) 가설 : 고객의 연봉과 대출금액이 신용 불량 여부 관계가 높다
▶ 데이터 마이닝(Data Mining)식 접근 방법
- 가설 발견 중심 : Classification, Clustering, Association Rule Mining, Text....
ex) 어느 고객이 잠재적 신용 불량자일까
Introduction to Data Science
1. Data Science
: 데이터 사이언스란 합리적인 의사 결정을 위해 정형/ 비정형 형태를 포함한 다양한 데이터로부터 지식과 인사이트(insight)를 추출하기 위한 과학적 방법론 및 프로세스.
- 정형 데이터 : 정수형, 실수형, 문자 데이터등 과 같이 데이터의 특성이 정해짐
- 비정형 데이터 : 음성, 영상, text등 과 같이 데이터의 포맷이 정해지지 않음
- 인사이트 : 통찰력, 비즈니스, 마케팅 등에서는 어떤 비즈니스 문제를 해결하는 이상적이고 창의적으로 해결할 수 있는 단서.
또는, 데이터를 통해 실제 현상을 이해하고 분석하기 위한 통계학, 데이터 분석, 기계학습 등과 연관된 방법론을 통합하는 개념
- 데이터 사이언스 관련 기술
- 데이터 분석 및 활용 사례들
2. Data Business : 데이터를 분석하여 가치를 창출하는 비즈니스
ex) 구글, 네이버 등의 검색 엔진, 페이스북, 트위터, 인스타그램 등의 SNS, Youtube, Amazon, Apple....
3. Data 분석
3-1. 데이터 분석의 가치
- 데이터 기반 경제의 핵심은 데이터를 분석하고 이로부터 새로운 가치를 창출하는 것.
- 데이터 유통이 증가하고 있음.
-> 현재 각 기업들의 고객 데이터 분석이 증가하고 있음.
- 데이터 분석은 정치, 경제, 사회, 문화, 국방, 교육, 의료 등 전 분야에 영향을 줌.
- 다양한 데이터를 활용해 다양한 시각의 분석이 가능해짐.
-> 문제 해결 과제의 사례
- 기업의 상품 매출 높이기
- 특성 시기별 상품의 사전 준비
- 신용카드의 불법 이용 적발
- 기존 고객의 고객 이탈 방지
- 삼야 버스 노선의 효과적 계획......
3-2. 데이터 분석의 필요성
1) 경험과 직관의 한계
- 데이터 사이언스의 장점은 미리 결과를 알 수 있다는 예측에 있음.
ex) 세이버 매트릭스(야구선수 스카우트), 로버 어드바이저(금융 상품 추천), 의학, 항공 분야......
- 전문가의 경험과 직관보다 객관적인 의사결정이 가능함.
ex) 올리 아션펠터의 와인 품질 공식을 통한 분석
- 데이터 사이언스에서 경험과 직관을 가진 전문가가 해야 할 역할
▶ 무엇이 중요한 문제인지 결정
▶ 어떤 데이터를 조사해야 할지 판단.....
2) Data Science vs 기존의 연구
기존의 연구 데이터 분석
- 기존의 과학적 탐구는 원인 발견에 초점 - 원인 탐구 보다는 관계 분석에 초점
- 어떤 현상의 원인을 연구하여 원리 발견 - 근본 원인을 모르더라도 미래 예측 연구에 가치를 둠
- 인과 관계 연구에 초점 - 문제 해결에 필요한 패턴, 상관관계 연구에 초점
3-3. 데이터 사이언스의 접근 방법
▶ 통계학적 접근 방법
- 추론 통계 -> 가설 확인 중심 : 가설을 세운 뒤, 데이터를 수집, 분석하여 가설을 확인
ex) 가설 : 고객의 연봉과 대출금액이 신용 불량 여부 관계가 높다
▶ 데이터 마이닝(Data Mining)식 접근 방법
- 가설 발견 중심 : Classification, Clustering, Association Rule Mining, Text....
ex) 어느 고객이 잠재적 신용 불량자일까
'전공 과목 공부 > 데이터 사이언스' 카테고리의 다른 글