digital_media_contents/infographics_lecture

뎁로이 언어의 탄생 강의 질문

jisunlee 2013. 5. 31. 10:14

통계학: 자료 시각화하기

 

학습단위 6: 자료로써의 문서 - 단어의 탄생

 

 

우리의 세계가 점점 도구화되어감에 따라, 우리는 사람들이 말하고 있는 것 사이에 점을 연결하는 것과 발생하고 있는 것이 새로운 사회 구조와 힘을 보게 하는 능력이라는 것 안에서 그들이 말하고 있는 것을 연결하는 것에 가능성을 가진다. Deb Roy

 

From TED:

2011 TEDTalk “Deb Roy: 단어의 탄생을 보라. MIT 매체 실험 베테랑 Deb Roy는 완전히 새로운 수준으로 홈 비디오를 찍었다: Roy는 어떻게 그의 젖먹이 아들이 언어를 배우는지 분석하기 위해 비디오 카메라와 함께 그의 집을 배선했다. 90,000 시간 이상의 장면 분석에서, Roy는 새로운 단어의 습득에 대한 공간과 시간 문제의 기절할 만한 시각화를 확립한다. 게다가 Roy와 그의 팀은 사회 매체 내용의 소유 계약, 무수한 공급 재료로부터 끌어오는 것을 설명하는 것에 같은 기술을 재-의도했다.

 

주요 키워드:

 

세로 자료

Longitudinal data

시간의 주기에 따라 수집된 자료

네트워크 그래프

Network graph

네트워크 자료를 위한 표시. 목적은 모서리로부터 연결되어진 네트워크에서 어떤 두 교점에 연결되어진 교점과 같이 묘사되어진 네트워크에 있다.

비디오 분석

Video analytics

녹화되거나 실-시간 비디오, 또한 Video Content Analysis (VCA)라 불리는 것의 조사 분류하기와 분석

어의 분석

Semantic analysis

말하거나 쓰여진 언어에서의 단어 또는 절에 대한 분석

 

연구과제 문제:

1. Roy는 그의 계획을 위한 중요한 과학적 동기는 어떻게 아동이 언어를 배우는 지 이해하는 것에 이 자연스러운 세로 자료를 사용하는 것에 있었다고 말한다. 떻게 이 자료가 세로인지를 설명하라.

2. Roy의 집안에서는 모두 녹화되는 것과 공간에 조심스러운 사생활 제한을 두는 것에 동의했다. 의사소통과 사회 매체에 대한 Roy의 분석을 위해 그는 공적으로 이용할 수 있는 출처만을 사용했다. 그러나, 그의 발표의 두 부분은 대중적인 논쟁 을 반영한다 - 자료 수집이 사생활에 관련될 때는 언제인가? 당신은 윤리적인 방 법에서 자료가 수집되고 사용된다고 생각하는지 진술하라. 각각의 사례에서 당신의 논거를 간단히 설명하라.

a) 모든 중요한 교통 교차점에서 도시 공간 비디오 녹화자는, 교통 방식의 분석을 위해 공적으로 이용할 수 있는 이러한 자료를 만들었다.

b) 이메일 공급자는 당신의 메시지를 기록하고 저장하고, 당신에게 더 많이 관련된 광고를 보여주는 것에 이러한 자료를 사용한다.

c) GPS 네비게이션 소프트웨어를 만드는 회사는 그들의 사용자의 속도와 위치에 대한 자료를 수집하고, 이러한 자료를 법의 집행 기관에 판다. 법의 집행 기관은 속도 매복을 위한 좋은 장소를 확인하는 것에 이러한 자료를 사용한다.

3. 공적인 매체 내용의 소유 계약을 탐색하기 위해, Roy와 그의 동료들은 각각의 달에 30억 사회 매체 내용을 수집하고 분석하고 있다. Roy는 어떤 다른 사람들이 TV를 보는 것과 온라인에서 말하는 것에 걸쳐 많은 영향을 미치는 것으로 보이는 중요한 사람들을 확인하는 것을 그것이 할 수 있다고 말한다. 당신은 이것에 대해 무엇을 생각하는가? 태연하거나 오싹한가?

4. Roy는 우리의 온라인 의사소통과 어떻게 사건과 매체로부터 실현되는지를 묘사 하는 것에 네트워크 도표를 사용한다. 네트워크 그래프는 교점의 집합과 모서리의 집합에 양립한다. 두 교점은 만약 그것 사이에 어떤 특수한 관계가 있다면 모서리 로부터 결합되어진다. 세 가지 교점 (X,Y, 그리고 Z)과 함께, XY 사이에 모서리 와 함께, YZ 사이에 모서리와 함께한 네트워크 그래프. Roy가 사용한 그래프는 몇몇의 천 개 교점과 다수의 수준과 함께 합성되어질 수 있다. 6명의 학우와 함께 단순한 합성을 고려해보자: Tommy, Larry, Kari, Jerry, JennyEugene. Tommy Kari와 친구이고, JerryJenny와 친구이고, JennyLarry와 친구이고, KariEugene와 친구이다. 만약 그들이 친구라면 모서리로부터 한 사람과 두 사람이 결 합되어지는 것에 해당하는 각각의 교점이 있는, 이러한 자료의 네트워크 그래프를 만들라.

5. Bluefin Labs에서 Roy와 그의 동료들은 사회 매체 출처로부터 발췌된 댓글을 조사하는 것에 의해 보여 지는 어떤 TV 주위에 사회 원동력을 탐색한다. 이것은 자료의 여러 가지 종류를 위한 웹 사이트 스크랩하기예의 하나이다. David McCandless 또는 Blaise Aguera y Arcas 하는 것처럼 스크랩하는 것이 Deb Roy 가 하고 있는 것보다, 또는 같은 것에 대해 더 많이 또는 더 적게 친절하게 보이는 ? 어떤 사례에서, 스크랩하는 것은 어떤 법률과 윤리적인 사건을 제안한다. 예를 포함한다:

BBC: FBI는 사회 네트워크 지도 경보 설득-하는 적용을 계획한다. (1/26/12) (정부)

Taylor Wessig: 로봇 전쟁 - 개인적인 정보를 스크랩하기 (2/2011) (건강 관리)

Bloomberg Law: 새로운 시대 기술: BrazilianU.S. 법정 스크랩하기법률의 인터넷 사용의 경계 (11/09/11) (법인의 경쟁 상대)

스크랩하기는 해킹으로부터 어떻게 다른가? 당신은 왜 개인 또는 조직이 인터넷으 로부터 정보를 스크랩하는 것을 원하는지 다른 동기에 대해 생각할 수 있는가? 중적인 TV 드라마가 당신의 마음에 가지고 있는 시나리오를 제안하는 에피소드를 개발하는 것을 가정하라. ; 에피소드의 요약을 기술하라.

6. 자료와 같은 음향과 영상을 다루는 것의 개념은 생소할지도 모른다. 그러나, 러한 자료의 분석은 현재 연구의 거대한 분야이다. 오디오 자료를 숫자상으로 묘사 하는 것에 대한 일반적인 방법은 시간에 걸쳐 음향 파동의 진폭과 빈도를 측정하는 것에 있다. 예를 들어, 세 가지 일반적으로 말하는 단어를 위한 오디오 신호를 고 려하라: 만약 이러한 단어가 그 밖에 누군가로부터 말해진다면, 그들의 신호는 다 르게 보일 것이다. 같은 세 가지 단어를 위한 오디오 신호는, 다른 사람들로부터 말해진, 아래에 주어진다. 당신은 A에 대응하는, B에 대응하는, C에 대응하는 어 떤 단어를 확인할 수 있는가? (만약 이것을 찾는 것이 어렵다면, 염려하지 마라. AppleGoogle 같은 회사가 어떻게 그들의 오디오 신호로부터 단어를 확인하는 것에 숫자를 표시하는지 여전히 노력하고 있다!)