Новости
- прості істини
- «Печеньки»
- Зрада в Flash
- «Срібний світло»
- Кеш з маслом
- Особлива магія Google
- «Залізний» капут
- «Відбитки» браузера
- Той, хто сидить перед екраном
Навіть найбільш холоднокровних користувачів рано чи пізно вчинить нав'язливість системи Google AdSense, яка любить пропонувати контекстну рекламу в залежності від старих запитів у пошуковій системі.
Здавалося б, з моменту пошуку пройшло чимало часу, кеш браузера неодноразово зачищали, файли сookies кілька віддалялися - тим не менш, настирлива програма все одно пам'ятає, чим ви там цікавилися рік тому. Як же відбувається відстеження користувача? Насправді, інструментів для цього більш ніж достатньо.
Стеження за користувачем в інтернеті має на увазі розрахунок і установку унікального ідентифікатора для кожного браузера, який відвідує певний сайт. Крім реклами ця функція покликана допомагати власникам сайту розрізняти звичайних користувачів і пошукових роботів. Технологія швидко припала «до двору» рекламної індустрії.
прості істини
Найпростіший метод ідентифікувати користувача - це зберегти на його комп'ютері будь-якої довгостроковий ідентифікатор , Який можна запитувати при подальшому відвідуванні ресурсу.
Крім cookies, це можуть бути деякі плагіни - Local Shared Objects в Flash, або Isolated Storage в Silverlight. Протокол HTML5 теж включає в себе кілька механізмів зберігання на стороні клієнта. Крім того, унікальні маркери можна зберігати в кешованих ресурсах локальної машини або метаданих кеша. Користувача також можна ідентифікувати по «відбитками», отриманим з Origin Bound сертифікатів, які згенерував браузер для SSL-з'єднань, даним, що містяться в SDCH-словниках, і метаданих цих словників.
«Печеньки»
Файли cookies використовують для зберігання якогось невеликого обсягу даних на стороні клієнта. сервер встановлює унікальний ідентифікатор для нового користувача, зберігаючи його в cookies-файлах - на випадок повторних запитів клієнт буде відправляти його серверу.
Незважаючи на те, що всі популярні браузери давно оснащені зручним інтерфейсом з управління (або відключення) cookies, їх все одно продовжують активно використовувати для відстеження користувачів. Справа в тому, що користувачі надзвичайно рідко переглядають і чистять їх. На відміну від більшості інших механізмів для стеження, cookies можна зберігати гранично прозоро і легально, а для того щоб «помітити» користувача, навіть необов'язково зберігати унікальний ідентифікатор в окремому файлі - він може збиратися з значеньдекількох cookies або зберігатися в метаданих.
Зрада в Flash
Файли Local Shared Objects (LSO) - це, грубо кажучи, ті ж cookies для Adobe Flash. Втім, LSO може зберігати не тільки короткі фрагменти текстових даних. Роботу цих файлів можна контролювати безпосередньо через контрольну панель.
Більшість сучасних браузерів досить добре інтегровані з технологіями Flash, так що при видаленні cookies та інших даних сайтів будуть заодно стерті і LSO.
«Срібний світло»
Якщо ви використовуєте програмну платформу Silverlight, то повинні знати про механізм Isolated Storage. На відміну від cookies, налаштування приватності тут ніяк не пов'язані з браузером, так що навіть в разі повного очищення cookies і кеша браузера дані, збережені в Isolated Storage, все одно залишаться.
Враховуючи що достукатися до цього механізму через настройки браузера поки не можна, він не отримав такого широкого поширення в якості сховища для унікальних ідентифікаторів. Одним словом, на рахунок Silverlight турбуватися не варто - ви все одно не можете особливо ні на що вплинути.
Кеш з маслом
Ресурси відвідуваних сайтів браузери складають в локальний кеш, щоб забезпечувати високу швидкість роботи.
Цей механізм можна перетворити в сховище з довільним доступом - сервер може повернути користувачеві JavaScript-документ з унікальним ідентифікатором всередині його тіла і встановити в заголовках Expires / max-age = далеке майбутнє.
Таким чином, скрипт разом з унікальним ідентифікатором пропишеться в кеші браузера, після чого до нього можна буде звернутися з будь-якої сторінки в мережі, просто надіславши запит завантаження скрипта з відомого URL. Рецепт тут досить проста: регулярно проводити очищення кеша вручну.
Особлива магія Google
Алгоритм SDCH - це створена Google система компресії, яка грунтується на використанні наданих сервером словників. Алгоритм забезпечує більш високий рівень стиснення даних, оскільки в звичайному житті web-сервер віддає занадто багато повторюваної інформації.
Використання SDCH має на увазі, що клієнт отримує з сервера файл словника, що містить рядки, які можуть з'явитися в наступних відповідях. Після чого сервер може просто посилатися на ці елементи всередині словника, а клієнт буде самостійно на їх основі збирати сторінку.
Ці словники можна легко використовувати і для зберігання унікальних ідентифікаторів. Рецепт для користувачів той же, що і з кешем браузера - нещадно чистити.
«Залізний» капут
Менш очевидний підхід до ідентифікації користувача системи має на увазі використання характеристики самого комп'ютера. сайти просто збирають дані про користувача системі - поодинці кожна характеристика являє собою лише кілька біт інформації, але якщо об'єднати кілька, то вони зможуть унікально ідентифікувати будь-який комп'ютер в інтернеті.
Таку стеження набагато складніше розпізнати і запобігти. Крім того, дана техніка моніторингу дозволяє ідентифікувати користувача, який сидить під різними браузерами або використовує приватний режим. Контрзаходів від такого стеження, по суті немає - хіба що регулярно оновлювати технічну «начинку» своєї системи.
«Відбитки» браузера
Найпростіше визначити користувача, вибудовуючи систему параметрів, доступних в середовищі браузера, кожен з яких окремо не становить ні найменшого інтересу, але разом вони утворюють унікальне для кожної машини значення.
Так, програма стеження збирає дані про версії браузера і операційної системи, часу на годиннику комп'ютера, інформацію про центральний процесор і тактовій частоті, вирішенні монітора і розмірі вікна браузера, списку встановлених на комп'ютері шрифтів і багато іншого. Відчуваєте? Окремо це - досить необразливі відомості.
Всі разом вони перетворюються в докладне досьє на вашу систему, якій присвоюється унікальний ідентифікатор. Який шанс зустріти два ідентичних комп'ютера в інтернеті?
Той, хто сидить перед екраном
Нарешті, один з найнадійніших варіантів - відслідковувати не характеристики комп'ютера, а його власника. наприклад, з'ясувати вибір мови користувача, його кодування за замовчуванням і часовий пояс - все це знаходиться в HTTP-заголовках і доступно з JavaScript.
З історії переглядів браузера можна витягувати URL. Спеціальні системи відстежують характерні жести мишею, частоту і тривалість натискання клавіш, дані з акселерометра. Будь-які зміни стандартних шрифтів сайту і їх розмірів, рівень наближення або віддалення тієї чи іншої сторінки і використання спеціальних можливостей - все це говорить про користувача так само явно, як і його паспортні дані.
І на все це абсолютно неможливо вплинути. Все ще вірите в анонімність в інтернеті? Думаємо, ви зрозуміли, що питання носить суто риторичний характер.
Відчуваєте?Який шанс зустріти два ідентичних комп'ютера в інтернеті?
Все ще вірите в анонімність в інтернеті?