정형 데이터 vs 비정형 데이터

 

 

데이터는 형태에 따라 정형 데이터, 반정형 데이터, 비정형 데이터로 나뉩니다.

 

크게 정형 vs 비정형으로 알아보겠습니다. 

 

◆정형 데이터란??

 

스키마 형태가 있고 연산가능하면 정형 데이터이며, 형태가 있으나 연산가능하지 않으면 반정형 데이터에 속합니다.

 

예로 RDBMS의 테이블들을 예로 들수 있겠습니다.

 

 

여기서 반정형 데이터의 경우를 들자면 아래와 같이 데이터의 형태가 있지만 정형 데이터와 같이 완벽하게 정리된 모습이 아닌 것을 반정형이라 칭하는 것 같습니다.

 

반정형 데이터의 예로 공공 API에서 받은 정리되지 않은 데이터들 또는 JSON파일 등 입니다.

반정형 데이터

 

 

◆비정형 데인터란??

 

비정형 데이터는 형태도 없고, 연산 가능하지도 않은 것. 우리가 흔히 말하는 소셜 데이터가 이에 속하며 텍스트, 영상, 음성 등의 형태로 나타납니다.

 

 

 

 

◆데이터들의 저장 구조

 

데이터의 형태에 따라 저장구조에도 차이가 있습니다. 정형 데이터는 RDBMS(MySQL)로 저장되고, 반정형 데이터는 파일(JSON)로, 비정형 데이터는 NoSQL(몽고DB)이라는 저장구조를 갖게 됩니다.

 

 

 

'Programming > 빅데이터' 카테고리의 다른 글

[빅데이터]수집  (0) 2017.08.10
하둡이란  (0) 2017.07.18
빅데이터란?  (0) 2017.07.09
데이터의 형태  (0) 2017.07.09

+ Recent posts