ruua

Рекламная революция Google: больше конфиденциальности, но проблемы остаются


235
235 points

В марте 2021 года Google объявил, что прекращает поддержку сторонних файлов cookie и переходит на более конфиденциальную модель. Несмотря на ожидаемость такого шага, все еще существуют путаница в отношении новой модели и скептицизм по поводу того, действительно ли она представляет собой революцию в области конфиденциальности в интернете, о которой заявляет Google.

Чтобы оценить это, нужно понять эту новую модель и то, что меняется. Текущий подход к рекламным технологиям (adtech) — это подход, при котором платформенные корпорации предоставляют нам «бесплатные» услуги в обмен на наши данные. Данные собираются с помощью сторонних файлов cookie, загружаемых на наши устройства, которые позволяют браузеру записывать нашу деятельность в интернете. Они используются для создания профилей и прогнозирования нашей восприимчивости к определенным рекламным кампаниям, пишут доцент социологии Дэвид Мураками Вуд и магистр Дэвид Элиот из Университета Куин в Онтарио, Канада.

Рекламная революция Google в области искусственного интеллекта: больше конфиденциальности, но проблемы остаются
Изображение: Gerd Altmann/Pixabay

Последние достижения позволили цифровым рекламодателям использовать глубокое обучение, форму искусственного интеллекта (ИИ), при которой люди не устанавливают параметры. Хотя эта модель более эффективна, она по-прежнему согласуется со старой моделью, основанной на сборе и хранении наших данных для обучения моделей и составления прогнозов. Планы Google идут еще дальше.

У всех корпораций есть свой секретный соус, а Google ещё более скрытен, чем большинство других. Однако патенты могут раскрыть кое-что из того, чем там занимаются. Изучив патенты Google, канадские исследователи обнаружили патент США US10885549B1 «Целевая реклама с использованием временного анализа пользовательских данных»: патент на систему, которая прогнозирует эффективность рекламы на основе «временных данных» пользователя, т.е. снимков того, что пользователь делает в определенный момент вместо неизбирательного массового сбора данных за более длительный период времени.

Выводы можно сделать также и изучив работы других организаций. Исследование, финансируемое рекламной компанией Bidtellect, показало, что для создания точных прогнозов не нужны долгосрочные исторические данные о пользователях. Оно использовало глубокое обучение для моделирования интересов пользователей на основе временных данных.

Наряду с контекстной рекламой, которая отображает рекламу на основе содержимого веб-сайта, на котором она появляется, это может привести к более ориентированной на конфиденциальность рекламе. И без хранения информации, позволяющей установить личность, этот подход соответствовал бы прогрессивным законам, таким как Общий регламент ЕС по защите данных (GDPR).

Google также опубликовал некоторую информацию через Google Privacy Sandbox (GPS), набор публичных предложений по реструктуризации adtech. В его основе лежат Federated Learning Cohorts (FLoC), децентрализованная система искусственного интеллекта, развернутая в последних версиях браузеров. Как объясняется в блоге Google AI, федеративное обучение отличается от традиционных методов машинного обучения, которые собирают и обрабатывают данные централизованно. Вместо этого модель глубокого обучения временно загружается на устройство, где она обучается на наших данных, прежде чем вернуться на сервер в качестве обновленной модели для объединения с другими.

С помощью FLoC модель глубокого обучения будет загружена в браузеры Google Chrome и станет анализировать локальные данные браузера. Затем она отсортировывает пользователя в «когорту» — группу из нескольких тысяч пользователей с общими наборами черт, определенными моделью. После этого она создает зашифрованную копию самой себя, удаляет оригинал и отправляет зашифрованную копию обратно в Google, оставляя после себя только номер когорты. Поскольку каждая когорта состоит из тысяч пользователей, Google утверждает, что личность становится практически неидентифицируемой.

Когорты и проблемы

В этой новой модели рекламодатели не выбирают отдельные характеристики для таргетинга, а вместо этого показывают рекламу определенной когорте, как объясняется на странице Google на Github. Хотя FLoC может показаться менее эффективной, чем сбор наших индивидуальных данных, Google утверждает, что получает «95% количества конверсий на потраченный доллар по сравнению с рекламой на основе файлов cookie».

Процесс торгов за рекламу также будет происходить в браузере с использованием другой системы под кодовым названием Turtledove. Вскоре Google adtech будет работать именно так, в веб-браузере, делая постоянные прогнозы рекламы на основе наших последних действий, без сбора и хранения личной информации.

По поводу этого существуют 3 основных опасения. Во-первых, это только часть гораздо большей картины ИИ, которую Google создает в Интернете. Например, с помощью Google Analytics Google продолжает использовать данные, полученные из файлов cookie первого лица на отдельных веб-сайтах, для обучения моделей машинного обучения и, возможно, создания индивидуальных профилей.

Во-вторых, имеет ли значение, как организация нас «узнает»? Или дело в том, что она знает? Google возвращает нам юридически приемлемую конфиденциальность личных данных, однако расширяет свои возможности узнавать нас и превращать нашу онлайн-активность в товар. Является ли конфиденциальность правом контролировать наши личные данные или чтобы наша сущность оставалась неизвестной без согласия?

Последний вопрос касается ИИ. Ограничения, предвзятость и несправедливость вокруг ИИ сейчас широко обсуждаются. Нам нужно понять, как инструменты глубокого обучения в FLoC группируют нас в когорты, приписывают качества когортам и что эти качества представляют. В противном случае, как и любая предыдущая маркетинговая система, FLoC может еще больше укрепить социально-экономическое неравенство и разногласия.


Понравилось? Поделитесь с друзьями!

235
235 points
Василий Вдовиченко
Южная научно-исследовательская лаборатория