“현대 웹은 매시업입니다. 즉, 텍스트와 그래픽이 포함된 하나의 웹 페이지처럼 보이는 페이지에서 보고 있는 콘텐츠가 실제로는 여러 다른 소스, 때로는 수십 개로부터 조립되며 이러한 다양한 소스는 다양한 회사가 될 수 있습니다.”라고 보조자인 Arvind Narayanan은 설명합니다. 프린스턴 컴퓨터 과학 교수는 “웹 페이지를 볼 때 눈에 보이는 콘텐츠와 순전히 사용자의 정보를 추적하기 위한 보이지 않는 콘텐츠가 있습니다. 행위."
추천 동영상
온라인 광고는 인터넷 초창기부터 존재해 왔지만 최근 몇 년간 훨씬 더 정교해졌습니다. 지금 우리가 보는 광고는 기업이 우리의 모든 검색 활동을 추적하려고 시도하는 디지털 스토킹의 산물인 경우가 많습니다. 그런데 애초에 어떻게 이런 일이 일어나는 걸까요?
관련된
- Mac이 정말로 Windows보다 더 안전한가요? 우리는 전문가들에게 물었다.
- 휴대폰 방사선은 실제로 위험한가요? 몇몇 전문가에게 물어봤습니다.
- 문자를 보내고 운전하는 것은 위험합니다. 하지만 어떻게 습관을 고칠 수 있습니까? 우리는 전문가들에게 묻습니다.
그림자 속의 눈
“이 기술이 정말 잘하는 일은 사이트에서 사이트로 사용자를 추적하고, 사용자의 행동을 추적하고, 일반적으로 실제 데이터가 아닌 데이터베이스로 컴파일하는 것입니다. 이름이 아니라 가명 숫자 식별자를 통해 Narayanan은 말합니다. 과거에 귀하에 대해 프로파일링한 경우 그에 따라 귀하를 대하고 귀하에게 제공할 광고, 때로는 귀하에게 콘텐츠를 개인화하는 방법 등을 결정할 것입니다. 에."
동일한 사용자에게 속한 두 개의 서로 다른 장치를 연결하는 방법도 있습니다.
기업들이 우리에 대한 데이터를 수집하고 있다는 것을 알고 있지만 그들이 사용하는 기술에 대한 투명성은 거의 없으며 오해가 많이 있습니다. 우리는 그들이 어떤 데이터를 수집하고 있는지, 어떤 용도로 사용할지 정확히 알지 못합니다.
Narayanan은 "그들이 수집하는 데 가장 유용한 정보는 검색 기록과 검색 기록입니다. 이 정보는 수집되어 행동 범주로 프로파일링됩니다."라고 설명합니다.
표면적으로는 이 데이터가 수집, 분석되어 관련 광고를 타겟팅하는 데 사용되지만 다른 방법으로도 사용될 수 있습니다.
“단순히 추적하는 것이 아니라 해당 데이터를 사용하여 데이터 마이닝을 수행하고 그에 대해 추론할 수 있는 내용을 확인합니다. Narayanan은 이렇게 말합니다. “어떤 경우에는 연구 결과에 따르면 데이터가 심지어 가격을 조정하는 데 사용됨. 때로는 동일한 제품의 가격이 미묘하게 다르기도 하고, 때로는 가격대가 다른 서로 다른 제품이 소비자에게 강요되기도 합니다.”
2012년에 다음과 같은 사실이 밝혀졌습니다. 여행 웹사이트 Orbitz는 Mac 사용자에게 더 비싼 호텔 옵션을 보여주었습니다. PC 사용자보다 같은 해 후반에 월스트리트저널은 보고됨 스테이플스 웹사이트는 방문자의 위치를 추적하고 20마일 이내에 경쟁 매장이 있는 경우에만 가격 할인을 적용하고 있었습니다.
그들은 우리를 어떻게 추적하고 있나요?
“웹 페이지의 코드가 상호 작용할 때 모든 장치는 미묘하게 다른 방식으로 작동하는 것으로 밝혀졌습니다. Narayanan은 이렇게 설명합니다. “이는 장치의 지문을 추출하는 데 사용될 수 있으므로 동일한 장치의 동일한 사용자가 언제 방문하는지 제3자가 알 수 있습니다. 다시."
이 기술은 다음과 같이 알려져 있습니다. 캔버스 지문 채취. 이러한 스크립트 중 하나가 귀하가 방문하는 웹사이트에서 실행되면 브라우저에 보이지 않는 이미지를 그리도록 지시합니다. 모든 장치는 고유한 방식으로 이를 수행하므로 장치에 번호를 할당하고 탐색을 효과적으로 추적하는 데 사용할 수 있습니다.
그것이 인터넷의 어두운 구석에서만 찾을 수 있는 일종의 수상한 일처럼 들린다면, 당신은 실망하게 될 것입니다. Whitehouse.gov에서 perezhilton.com에 이르기까지 모든 종류의 유명하고 존경받는 사이트에서 이러한 스크립트를 실행하고 있다는 소식을 들었습니다. 벨기에 루벤 대학교(University of Leuven)에서는 완전한 검색 가능 목록 이러한 추적 메커니즘을 갖춘 사이트의 수입니다.
쿠키병 너머
이해하기 어려운 데이터를 수집하는 데 사용되는 다른 기술이 있습니다. 우리 대부분은 쿠키에 대해 어느 정도 알고 있지만 광고주들은 쿠키 시스템을 이용하거나 우회하는 새로운 방법을 개발했습니다.
Narayanan은 "제가 가장 우려하는 부분 중 하나는 배후에서 진행되는 데이터 공유입니다."라고 말합니다.
라는 프로세스 쿠키 동기화를 사용하면 온라인에서 귀하를 추적하는 주체가 귀하에 대해 발견한 정보를 공유하고 귀하의 장치를 식별하기 위해 생성한 ID를 함께 연결할 수 있습니다. 그들은 메모를 비교하고 귀하에 대한 더 나은 프로필을 구축할 수 있습니다. 그리고 이 모든 작업은 사용자의 지식이나 입력 없이 수행됩니다.
일반적인 쿠키 시스템을 완전히 우회하는 슈퍼 쿠키라는 것이 있습니다.
Narayanan은 "이 쿠키는 정보를 저장할 수 있는 웹 브라우저 구석에 있지만 기본 쿠키 데이터베이스에는 없습니다."라고 말합니다. 특히 사악한 유형의 슈퍼 쿠키는 자신을 여러 위치에 저장하고 각 위치를 사용하여 다른 위치를 다시 생성하는 쿠키입니다. 따라서 컴퓨터의 모든 브라우저에서 해당 쿠키의 모든 흔적과 형태를 한 번에 삭제하지 않는 한 해당 쿠키는 다시 돌아올 것입니다.”
동일한 사용자에게 속한 두 개의 서로 다른 장치를 연결하는 방법도 있습니다. 회사는 귀하의 이름을 붙이지 않고도 동일한 사람이 소유하고 있음을 확인할 수 있습니다.
“당신이 노트북과 컴퓨터를 가지고 있다고 가정해 봅시다. 스마트 폰, 그들과 함께 여행하고 Wi-Fi를 통해 웹을 탐색하고 있습니다." Narayanan은 말합니다. "광고주 또는 다른 회사에서는 항상 동일한 웹 사이트에 연결되는 두 개의 특정 장치가 있음을 발견했습니다. 회로망. 이런 일이 우연히 일어날 확률은 두 사람이 같은 여행 일정을 가질 확률과 유사하므로, 일정 시간이 지난 후에도 이런 일이 계속 발생하면 두 사람의 소유자가 동일하다고 추론할 수 있습니다. 장치. 이제 그들은 한 장치의 탐색 행동을 다른 장치의 탐색 행동과 함께 저장하고 이를 사용하여 더 심층적인 프로필을 구축할 수 있습니다."
우리는 정말 익명인가요?
우리는 기업이 익명화된 데이터만 수집하고 있다는 주장을 종종 받아들이곤 합니다. 이것은 여러 가지 이유로 Narayanan이 예외를 두는 것입니다.
“다양한 가격이나 제품 측면에서 개인화의 영향은 실명이 있든 없든 동일하게 실현 가능합니다. 이는 그들의 계산 및 타겟팅을 위한 데이터의 의도된 사용과 전혀 관련이 없으며 많은 사용자에게 매우 불쾌합니다.”라고 그는 설명합니다.
광고주들뿐만 아니라 우리도 걱정할 것이 더 많습니다.
“우리 연구 중 일부는 NSA는 실제로 피기백할 수 있습니다. Narayanan은 이렇게 말합니다. “이러한 제3자 서비스는 NSA의 업무를 더 쉽게 만듭니다.”
익명화된 데이터가 노출되어 실제 신원과 연결될 위험도 있습니다.
Narayanan은 이렇게 설명합니다. “이러한 데이터베이스는 다양한 방법으로 익명화할 수 있습니다. 실수로 개인 정보가 유출되는 경우도 있었습니다. 명심해야 할 것은 이 익명화된 서류가 있으면 한 명의 불량 직원만 한 번만 필요하다는 것입니다. 어딘가에서 개인 정보 익명성의 모든 추정 이점을 위해 실제 신원을 이러한 데이터베이스와 연결합니다. 잃어버린."
Narayanan은 심지어 익명이라는 단어에 반대합니다. 컴퓨터 과학자들은 가명이라는 용어를 사용합니다. 이는 실제로 익명이 아니며 방금 가명이 할당되었음을 강조합니다. 귀하의 신원이 알려지면 상상했던 프라이버시를 잃게 되며 이러한 일이 발생할 수 있는 방법은 다양합니다.
이러한 제3자 서비스는 NSA의 업무를 더 쉽게 만들어줍니다.
“우리 정보가 수집되는 이러한 데이터베이스 중 상당수는 무해한 목적이나 소비자가 원하는 목적으로 시작되었습니다. 편안하지만 투명성, 책임감, 규제가 완전히 결여된 상태와 결합하면 엄청난 문제가 발생합니다. 오용의 기회가 있습니다." Narayanan은 설명합니다. "회사가 파산하거나 데이터베이스가 해킹당하거나 사기꾼이 있는 경우 어떻게 되나요? 직원?"
온라인 추적과 오프라인 구매 습관을 결합하려는 산업이 성장하고 있다는 증거도 있습니다. LiveRamp와 같은 온보딩 회사는 이 데이터를 연결하고 회사에 더 많은 통찰력을 제공하는 방법을 제공합니다. 매장에서 구매 시 카운터에서 이메일 주소를 묻는 경우 LiveRamp와 같은 회사와 이를 공유할 수 있습니다. 이는 귀하가 이를 사용하여 거래 중인 특정 특정 웹사이트에 로그인한 다음 이를 귀하의 웹사이트에 연결하는 시기를 식별할 수 있습니다. 장치. 이제 기업은 데이터에 실제 이름을 붙일 수 있습니다.
개인정보를 어떻게 보호하나요?
Narayanan은 "단 하나의 마법의 총알 솔루션은 없습니다. 누군가가 당신에게 하나의 솔루션을 판매하거나 귀하의 개인 정보 보호 문제를 처리한다고 주장하는 장치는 거의 확실하게 귀하에게 뱀을 판매하고 있습니다. 기름. 하지만 조금만 시간을 투자한다면 개인정보를 보호하는 것이 가능합니다.”
다양한 브라우저 확장 기능과 엔드투엔드 암호화 도구가 있습니다. Narayanan은 다음으로 시작하라고 제안합니다. 토르 그리고 유령. 그는 또한 다음 책을 읽어볼 것을 권한다. 전자프론티어재단 그리고 전자개인정보센터, 더 자세히 알고 싶다면.
"기술을 조금 연구하고, 사용 중인 제품이 개인정보 보호에 미치는 영향에 대해 알아보고, 시중에 나와 있는 개인정보 보호 도구와 이를 사용하는 올바른 방법에 대해 알아보세요." Narayanan은 다음과 같이 제안합니다. “완전히 인식하지 못한다면 충분한 정보를 바탕으로 선택을 할 수 없을 것입니다. 그러나 각 사람마다 편리함과 편안함의 스펙트럼에서 어느 위치에 있기를 원하는지에 대한 절충안이 있습니다. 은둔."
편집자의 추천
- 정신 건강 앱이 정말 도움이 되나요? 우리는 전문가들에게 물었다.
- 수면을 추적하면 실제로 더 나은 잠을 자는 데 도움이 됩니까? 전문가에게 물어봤습니다
- UFS 3.0 스토리지란 무엇입니까? 휴대폰용 SSD에 대해 전문가에게 물어봤습니다.