Про TikTok и будущее cross-could

Новость почти месячной давности, но прочитал только сейчас;

Если убрать политическую подоплеку и различные “угрозы демократии”, статья оголяет открытые вопросы регуляторного фреймворка.

  • TikTok обязали хранить персональные приватные данные об американских пользователей в облаке Oracle в Техасе и бэкапом в Сингапуре. К приватным данным относят телефонные номера, дни рождения, фио. Для мониторинга к Tik Tok предоставили аудитора, который смотрит, чтобы ни один бит персональной информации не утек в Китай.
  • Журналистка через всю статью акцентирует внимание на то, что инженеры Bytedance, которые отвечают за систему рекомендаций контента имеют доступ к данным американских пользователей. Может сложится впечатление, что речь про UUID, но на самом деле нет.

As TikTok continues to negotiate over what data will be considered protected, the recordings make clear that many US user data — including public videos, bios, and comments — will not be exclusively stored in the Oracle server. Instead, this data will be held in the company’s Virginia data center, which may remain accessible from ByteDance’s Beijing offices even once Project Texas is complete. That means ByteDance’s China-based employees could continue to access insights about what American TikTok users are interested in, from cat videos to political beliefs.

  • Противоречий с первоначально трактовкой закона я не вижу, разделение на приватные и публичные данные весьма четкое. Возможно, широкий читатель Buzzfeed, который верит в том числе, что фб продавал данные наружу, посчитает такие практики недопустимыми в рамках защиты интересов страны.
  • Ограничение к доступу публичным данным никак, конечно, не защищает их от того же скраппинга – получить всегда можно. Но предположим, что команда рекомендательной системы ввиду внешних ограничений лишена доступу к обратной связи (коменты, лайки, скипы роликов и тд); Получается очень интересный технически-организационный вызов. В данном сетапе TikTok должен нанять инженерную команду, которая поддерживает рекомендации только для американских пользователей; Получается некое федеративное обучение в рамках суверенных интернетов. Открытый вопрос – можно ли общаться через мета-медиумы, например обмениваясь весами нейросетевой модели или ключевыми метриками качества ранжирования и рекомендаций? Можно ли это регулировать и помогут ли кому-нибудь кроме облачных провайдеров эти ограничения?
  • И что именно считать данными американских пользователей? Что делать с просмотром американского пользователя контента немецкого автора? Или как интерпретировать лайк под постом жителя Уругвая, который он заснял будучи в Японии? Где хранить информацию о том, что пользователь в Малайзии смотрел ролик американского пользователя? С развитие законотворчества в области интернет-суверенитета в мире, спрос на обезличенную cross-could коммуникацию будет расти.