데이터과학자2 데이터과학, 데이터과학자와 데이터 주도권 데이터과학의 기초 개념데이터과학은 데이터를 과학의 대상으로 다루는 접근법을 의미하는 것으로 체계적인 데이터 축적, 과학적인 데이터 분석틀 설계 등이 포함된다. 데이터과학은 데이터분석과 동일하다고 보는 관점도 있지만, 데이터 분석은 데이터과학의 일부분일 뿐이며, 분석 도구 자체까지 연구하는 포괄적인 학문이다.일반적 과학 이론과 데이터과학의 차이점은 그 형성과정에서 비롯된다. 대부분의 과학적 접근법은 검증의 대상이 되는 적절한 질문(가설)에서 시작하고, 데이터를 체계적으로 수집하여 증거를 축적한 뒤 확인한다. 그러나 데이터과학은 관찰, 측정, 데이터 수집이 선행되고 경험적 일반화 과정에 이르는 접근 방법이라고 할 수 있다.이에 데이터과학에서는 방법론적 관점에서 조사를 원활하게 수행하기 위한 방법, 도구, .. 2024. 9. 7. 빅데이터의 개요 (2) - 데이터 분석과 데이터 과학자 1. 데이터 분석20세기에는 표본조사와 실험계획법의 발달로 양질의 데이터를 축적하게 되었다.표본조사란 모집단에서 임의로 표본을 추출하여, 해당 모집단의 특성값을 추측하는 것으로 여론조사, 국가 통계 등을 예시로 들 수 있다.실험계획법은 피셔가 제안한 방법으로 실험의 실시를 통해 데이터 변화 요소의 효과를 측정하는 방법이며, 신약 계발이나 품질관리 등이 그 예이다.즉 양질의 데이터를 활용한 통계 모형을 만들고, 변수 간 인과관계를 도출하여 현상을 설명하였으며, 이는 20세기의 발전을 이룬 핵심 인프라로 작용했다.통계학이란 데이터 수집 및 분석 과정 그 자체이며, 모집단 가정, 양질의 데이터, 공정한 방법론을 통해 전체를 가장 그럴듯하게 추정하는 것이다.하지만 21세기에는 빅데이터 시대가 열렸으며, 통계 모.. 2024. 8. 30. 이전 1 다음