본문 바로가기

책 이야기/2018년

18-6. 빅데이터 분석대로미래는 이루어진다.....우종필

3.29(목) ~ 4.02(월), 올리브

 

가상화폐를 아무것도 아닌 것, 네덜란드의 튜율립 광풍으로 치부하고

무엇인지 찬찬히 알아 보지 않고 그냥 넘겨 버렸다

혹자는 많은 부를 이루었고, 혹자는 폐가망신했다는 말이 많다

그러나 나는 그것이 무엇인지조자 모르고 지나갔다

그래서 정신 차리기로 했다.

 

호기심의 촉을 놓지 말것!

 

그래서 이제는 블록경제, 빅데이터, 4차 산업 등등

세간에 많이 회자되고 있는 새로운 것에 대해 지속적인 호기심을 갖고

계속해서 새로운 지식, 경향, 동향을 알아가기로....

 

빅데이터,

어렴풋이 많은 양의 정보를 수집하여 개인, 조직, 세대, 지역등의 트렌드를 분석하는

정보처리 기술.....이라고 알고 있는 것을 더 자세히 알아보기 위해 이 책을 잡았다.

 

--------------------------------------------------------------------------------

 

우선!

구글 트렌드, 네이버 트렌드라는 검색 사이트가 있다는 것을 알았다

www.google.com/trends

 

인터넷 포털 사이트에서 어떤 단어들이 가장 많이 검색되는지, 어느 기간, 누구에 의해서, 어떤 지역에서

어떤 것이 가장 많이 검색되고 있는지를 아는 것을 통해서

트렌드를 파악하는 것이라는 것!

 

책은 이런 트렌드 분석 사이트를 통해서 정보를 어떻게 해석했는지를 보여주는 내용이다

 

새로운 분야, 몰랐던 창문을 하나 새롭게 발견한 기분!

 

----------------------------------------------------------------------------------

 

- 순서효과(Order effect) : 응답자들이 주로 1번을 많이 선택하는 경향

- comma separated value format : CSV

- Shy Tory, Shy Trump : 외부에 자신의 본심을 들어내지는 않았지만 실제 투표장에서는 본인의 진솔한 감정대로 투표하는 것

- Bradley effect

- Under dog : 게임에서 승률이 낮은 쪽

- vape : Vapour, Vaporize의 약어로 전자담배를 피다라는 신생어

- Bid data : 방대한 양의 데이터, 기존의 정형 데이터 + 데이터로 취급 못 받았던 반정형데이터, 비정형 데이터를 포함한 데이타

  정형데이터(Structured data),  반정형데이터(semi-structured data), 비정형데이터(informal data)

- 킬로(10*3승), 메가(6승), 기가(9승), 테라(12승), 페타(15승), 엑사(18승), 제타(21승), 요타(10*24)

- Data is the oil of the 21st century

- 기계 러닝(Maching Learning)

- 데이터 사이언티스트 : 반정형, 비정형 데이터를 통해서 정형데이터를 끌어 낼 수 있는 사람. 

- 상관관계와 인과관계