Проект Anna’s Archive сообщил о масштабном архивировании данных Spotify. По утверждению авторов инициативы, им удалось сохранить метаданные примерно по 256 млн треков, а также сами аудиофайлы для около 86 млн композиций.
Общий объем собранных данных оценивается почти в 300 ТБ. Архив, по заявлению проекта, охватывает около 99,6% всех прослушиваний на платформе. Музыка распределена по популярности: наиболее востребованные треки сохранены в формате OGG с битрейтом до 160 кбит/с, менее популярные - в более низком качестве.
Помимо аудиофайлов, в архив вошла крупная открытая база музыкальных метаданных, которую авторы называют крупнейшей из доступных публично. Она предназначена для зеркалирования и долгосрочного хранения при наличии достаточных вычислительных и дисковых ресурсов.
В Spotify заявили, что выявили и заблокировали аккаунты, участвовавшие в массовом неавторизованном сборе данных, а также усилили меры защиты. Компания подчеркивает, что подобные действия нарушают условия использования сервиса и нормы авторского права.
Несмотря на заявления о целях «сохранения музыкального наследия», эксперты отмечают, что подобные архивы могут использоваться для нелегального распространения контента и обучения ИИ-моделей без согласия правообладателей, что усиливает риски для цифровой музыкальной индустрии.