유권자 영향에 대한 케임브리지 분석가의 데이터 수집 방법

왜 잘못된 정보로 개인 정보를 요구하는 것은 큰 문제입니다.

오바마 선거에서 소셜 미디어 분석의 사용을 되돌아 보면, 트럼프 캠페인이 연구 회사 인 케임브리지 애널리 티카와 어떻게 다른가요? 이것은 Cambridge Analytica의 Facebook 정책 위반에 관한 것입니까, 아니면 이것보다 큰 것입니까?

2013 년 1 월, 나는 오바마 대통령이 소셜 미디어에 정통한 케네디의 텔레비전 사용 능력과 비교하여 2008 년과 2012 년 대선 캠페인에서 소셜 미디어를 효과적으로 사용하는 방법에 관해 썼습니다. 케네디가 카리스마와 머리카락과 같은 선천적 인 재능을 가지고있어 집안의 TV 화면에 잘 투영되도록 허용 한 오바마의 은 소셜 미디어를 사용하여 사회 심리학을 연구했습니다. 2016 년에 트럼프의 사람들은 데이터를 사용했습니다.

Pamela Rutledge/Shutterstock

출처 : Pamela Rutledge / Shutterstock

우리는 현재 데이터 과학 시대에 있습니다. 여러 소셜 미디어 플랫폼에서 데이터를 가져 와서 사용자 행동 패턴 및 코멘트를 캡처하는 기능은 전례가 없습니다. 엄청난 양의 데이터를 수집하고 분석하고, 골치 아픈 알고리즘을 작성하고, 예측 모델을 구축하는 방법을 파악하고있는 최고 수준의 데이터 과학자들에게 막대한 수요가 생겨났습니다. 도구 상자는 기계 학습, 통계, 강력한 프로그래밍 기술 및 인공 지능과 자연 지능 모두가 인상적인 조합이며, 그들은 항상 인간의 행동을 더욱 뉘앙스와 목표로 포착하고 영향을 미치려고합니다.

오바마와 트럼프의 비교가 어떻든 그들은 붉은 청어 다. 이 공개 토론의 중심에있는 것은 데이터에 대한 액세스 및 사용입니다. 이 물건들은 사라지지 않습니다. 더 정교하고 유비쿼터스적일뿐입니다. 그것은 모두 나쁘지도 좋지도 않습니다. 이는 정치적 손가락 가리기의 토끼 구멍에 빠지지 않는 한 데이터 마이닝과 관련된 주요 윤리적 및 법적 문제를 더 잘 이해할 수있는 중요한 교육 기회입니다.

여전히 많은 사람들이 비교를 원할 것입니다. 4 년은 말 그대로 데이터 과학의 진화에서 평생입니다. 역량과 사회 환경은 2008 년과 2012 년과 비교하여 모두 달랐습니다. 데이터를 긁어 모으고 평가할 수있는 도구와 기능은 이제 기술적으로나 이론적으로나 훨씬 정교합니다. 오바마의 팀이 할 수 있었던 것보다 용도.

그러나 더 중요한 것은 사회적 환경이 변화하고 그에 따라 데이터 위반에 대한 인식 및 윤리적 가이드 라인 및 규정 강화 등 프라이버시를 위반하는 데이터 사용에 대한 이해가 변경된 것입니다. 사람들은 아마존 권장 사항에서부터 사이트를 따라 우리를 추적하는 타겟 광고에 이르기까지 온라인 행동을 기반으로 데이터 알고리즘을 사용하는 방법에 대해 점점 더 많이 인식하고 있습니다. 투명성, 허가 및 프라이버시 유지 – 안전 및 조작 방지를 위해 -은 모두 내부 고발자 및 사회 담화의 주요 주제였습니다.

케임 브리지 애널리 티카 (Cambridge Analytica) 논란과 관련된 큰 문제 중 하나는 데이터 수집 방법에 관한 것입니다. 보도에 따르면 뉴욕 타임즈와 다른 곳에서는 캠브리지가 목적과 의도에 대해 잘못된 정보를 제공하는 앱을 통해 개인 정보를 요청했다. 일부는 대학 전공 및 정치 소속과 같이 무해한 것으로 보이는 다양한 유형의 정보를 요청했지만 앱에는 성격 프로필을 생성하는 성격 평가 질문도 포함되어 있습니다.

자, 왜 이것이 큰일인가? 우리는 이미 연구자들이 보여 주듯이 텍스트 데이터 묶음에서 다른 사람의 페이스 북 프로파일을 코딩함으로써 성격 프로파일을 추정 할 수 있다는 것을 이미 알고 있습니다. 문제는 대규모로 수행하기가 어렵다는 것입니다. 당신은 각 참가자로부터 상당한 양의 텍스트를 가져야 만합니다. 이것은 어떤 규모의 그룹을 위해 매우 비싸고 노동 집약적입니다. 심리 연구자가 200 명의 참가자 그룹을 볼 수 있고 일반화 가능성이있는 조개처럼 행복 할 수있는 곳에서는 유권자 설득을 위해이를 축소하지 않습니다. 그러나 목표 청중을 심리적으로 프로파일하려는 욕구는 현재 공개적으로 이용 가능하지 않은 귀중한 정보를 제공하기 때문에 큰 매력을 발휘합니다. 여러 연구 기관이 자연어 처리와 같은 분석 기술을 사용하거나 IBM의 Watson의 힘을 이용하여 솔루션을 개발하고 있지만 현재 HR 목적으로 (참여자 권한으로) 소규모 그룹에서 사용되거나 집계 된 “맹인” 개인 신원에. 그러나 더 중요한 것은 이러한 것들이 다른 것들보다 낫다고 추측되지만 사람들이 검증 된 정신 테스트 측정을 받음으로써 얻는 성격 프로필과 같지 않습니다. (어떤 사람들은 성격 테스트가 자기보고이기 때문에 실제로 데이터로 추정되는 프로파일보다 정확도가 떨어지는 것으로하지만, 평가를 위해 더 많은 경험을 가진 사람들에게 내쫓 깁니다.)

말할 필요도없이, 많은 사람들의 성격 프로파일을 얻는 것이 훨씬 쉽습니다. 회사가 사람들에게 성격 테스트를 받도록 할 수 있다면 말이죠. 그들이 사람들에게 무엇이 필요한지 사람들에게 말하지 않는다면, 회사는 참가자들이 자신의 목적에 맞게 “좋아 보인다”는 답변을 왜곡 할 필요가 없다. 소수의 주요 질문과 소셜 미디어 액세스에 대한 액세스로 인해 앱 개발자는 소셜 미디어 계정 (참가자가 앱을 사용하기 위해 입력 한 이후 앱에있는 데이터)에서 데이터를 스크랩 할 수 있습니다. 균열 데이터 과학자가 링크하기 쉽습니다 좋아하는 것, 싫어하는 것, 정책 위치, 친구 식별, 예측 모델을 만드는 성격 프로파일.

이제 그들은 영화 선호도와 같은 “라이프 스타일 변수”뿐만 아니라 심리적 특성을 기반으로 개인을 타겟팅 할 수 있습니다. 모든 정직한면에서 마케터들은 그렇게하기를 좋아하지만 그렇게하지는 않습니다. 소셜 미디어 회사의 개인 정보 보호 규정 및 윤리적 기준을 위반하지 않고 대상 사용자 데이터와 연결된 개인 취향 데이터를 얻는 것은 어렵지 않지만 합법적 인 성격 테스트 결과도 없습니다. 예를 들어 Twitter와 같은 회사는 마케팅 및 정치 캠페인의 데이터 일치 요청에서 개별 사용자 식별을 열정적으로 보호합니다. Cambridge Analytica는 우리 대부분이 앱에 로그인하여 우리가 안전하다고 느끼면 개인 정보를 제공한다는 사실을 이용했습니다. 페이스 북에서 권유하고 사람들에게 그것이 학술 연구를위한 것이라고 말하면서 그들은 안전하다고 느꼈다. 따라서 법적 문제 : 거짓 허위로 허락을 받아야 하는가?

2008 년과 2012 년 오바마의 선거 운동 기간 동안 그의 팀은 공개 프로필을 사용하고있었습니다. 페이스 북에서 오바마에게 친구를 사주면, 당신은 그에게 당신의 데이터를 주었고 당신 친구가 누구인지를 보여 주었다. 그것의 작은 글씨입니다. 약간의 시간을 읽으십시오. 사용자가 제공 한 데이터를 통해 정책에 대한 가능성이있는 항목을 식별하고 우편 번호와 같은 다른 사용 가능한 데이터와 교차 일치시킬 수있었습니다.

사람들은 항상 정보로부터 예측을합니다. 우리가 우리 자신의 경험을 사용할 때, 그것을 휴리스틱이라고합니다. 수많은 정보와 수학으로 데이터 과학이라고 불립니다. 문제는 정확성입니다. 케임브리지가 수집 한 데이터가 있더라도 사람들에게 영향을 미치는 능력은 확실하지 않거나 일부 사람들이 주장한 것처럼 문화를 혼란스럽게하는 능력이 있습니다. 그러나 개인적인 표적으로하는 것은 설득을 더 가능하게하고 허가없이 표적으로하기, 그것을 직면하자, 소름 끼치는 종류이다. 오바마의 팀은 당시에는 상당히 정교했지만 Google, 아마존 또는 기타 데이터 중심의 상업적 관심사는 아닙니다. 오바마의 캠페인은 소셜 미디어 마케팅 기법이 정치에 처음 적용된 날이었습니다. 관심은 오바마가 사회적 네트워크에서 자신의 성격을 사용하여 풀뿌리 열정을 활성화하고 캠페인 금고를 효과적으로 활용할 수있는만큼 타겟팅 목표를 정교화 한 것이 아닙니다.

우리가 아직 모르는 부분은 트럼프 캠페인이 케임브리지에 데이터에 대해 무엇을 요청 했습니까? 이 이야기는 펼쳐질 것입니다. 그러나 사람들은 조작되는 것을 좋아하지 않습니다. 긍정적이고 부정적인 뉴스 피드를 실험 해 페이스 북에 대한 대중의 반응을 상기 해 볼 수 있습니다. 콘텐츠의 원자가가 전반적인 분위기와 분위기를 바 꾸었는지, 그리고 이는 개인 타겟팅이 아니라 전체적으로 나타났습니다. 사람들이 조작 공세의 전망을 일률적으로 찾거나 당선에 따라 다른 것들로 분류되면 보는 것이 흥미로울 것입니다.

모든 정치가는 유권자들에게 공감할 점을 찾는다. 2012 년 선거에서 소셜 미디어 데이터와 유권자 프로파일 링을 사용하면 캠브리지 애널리 티카 (Cambridge Analytica)의 데이터 활용과 비교하여 거의 건강 해 보입니다. 그러나 사람들을 속이기 위해 잘못된 정보를 사용하여 정치적 목적으로 데이터를 요청한 것은 이번이 처음입니다. 이것은 트럼프 – 클린턴 선거 기간 동안 그리고 그 이후로 소용돌이 치는 잘못된 정보의 양을 고려할 때 많은 사람들에게 심각한 핫 버튼을 촉발시킵니다. 정치적 설득에 관계없이 누구나 가짜 뉴스에 민감합니다. 잘못된 정보가이 데이터 수집의 근원임을 알게되면 특히 과거의 경험을 바탕으로 행동이나 의도를 부여하는인지 적 편견을 고려할 때 위반이 훨씬 더 심각하게 보일 수 있습니다. (그들이 속임수를 쓰면 B를 속이거나 속임수를 쓰면 속임수를 범해야합니다.) 합리적이지는 않지만 조작 된 것이므로 사람들이 본질적으로 신뢰에서 방어 및 의심스러운 위치로 이동합니다.

슬프게도,이 모든 것은 손가락으로 가리키며 나타납니다. 우리는 항상 누군가를 비난하고 싶습니다. 이 경우 Facebook의 발이 Cambridge Analytica와 함께 불꽃에 붙들린 것처럼 보입니다. 페이스 북이 의도적으로 허위 진술을하지 못하게하기 위해 페이스 북이 할 수 있었던 일이 있다면 나는 심각하게 의심한다. 그러나, 아이러니하게도 페이스 북을 위해, 그들의 브랜드의 힘은 그 앱을 암시 적으로 검증했다.