Обзор
Если пользователь Universal Analytics запрашивает деидентификацию IP, наша система обрезает адрес при первой технической возможности. Последний октет IP-адреса в формате IPv4 или последние 80 бит IP-адреса в формате IPv6 обнуляются вскоре после передачи информации в Аналитику. В этом случае полный IP-адрес никогда не записывается на диски в нашей системе.
Географические параметры определяются позже на основе деидентифицированных IP-адресов.
В Universal Analytics деидентификацию IP-адреса необходимо включить. Ее реализация описана в следующем разделе.
Подробная информация
Аналитика поддерживает функцию anonymize_ip (gtag('config', '<GA_MEASUREMENT_ID>', { 'anonymize_ip': true })
из библиотеки gtag.js), которая позволяет владельцам сайтов деидентифицировать IP-адреса своих посетителей при обработке данных в нашей системе. Деидентификация и частичное хранение IP-адресов помогают выполнять требования по защите личных данных, включая как политики конфиденциальности самих ресурсов, так и рекомендации местных надзорных органов по защите данных. Адрес деидентифицируется сразу же, как только поступает в сеть Аналитики, до обработки и хранения.
Деидентификация IP-адресов в Аналитике выполняется в два этапа: на уровне тегов JavaScript и сети сбора данных. Ниже рассказывается, как это происходит.
JavaScript-тег Google Аналитики
Когда браузер, в котором включена поддержка JavaScript, загружает страницу с тегом Аналитики, асинхронно происходят два действия: загружается для обработки очередь функций и запрашивается JavaScript-код. Очередь функций – это массив JavaScript, в который передаются различные функции сбора данных и настройки Аналитики. К этим функциям, которые задаются владельцем сайта при внедрении Аналитики, могут относиться указание номера аккаунта Аналитики и отправка информации о просмотрах страниц в Аналитику.
Когда выполняется функция из очереди функций, активирующая передачу информации в Google Аналитику (обычно это функция gtag('config', '<GA_MEASUREMENT_ID>'
из библиотеки gtag.js), данные передаются как параметры URL в HTTP-запросе для http://google-analytics.com/collect. Если функция деидентификации была вызвана до функции отслеживания страницы, то к запросу пикселя прикрепляется дополнительный параметр деидентификации IP-адреса. Этот параметр выглядит так:
(&aip=1).
Сеть сбора данных Аналитики
В сеть сбора данных Аналитики объединены серверы, которые выполняют две основные задачи: обслуживают gtag.js (JavaScript-код Аналитики) и собирают данные, которые передаются в запросах /collect.
Поступающий запрос файла gtag.js содержит дополнительную информацию в заголовке HTTP-запроса (используемый браузер) и в заголовке TCP/IP (IP-адрес источника запроса).
Поступивший запрос передается в память для деидентификации. Если его URL содержит параметр &aip=1, то последний октет IP-адреса посетителя обнуляется прямо в памяти. Например, значение 12.214.31.144 меняется на 12.214.31.0 (для IPv6-адресов обнуляются последние 80 из 128 бит). Только после такой деидентификации запрос записывается на диск для обработки. Фактически при использовании маскировки полный адрес никогда не хранится в системе, а обнуление его части происходит в памяти сразу же после получения запроса.