Инженеры Microsoft создали нейросеть VASA-1, которая заставляет фотографии двигаться, говорить и петь. Об этом сообщается на сайте компании.

VASA-1 работает на основе фотографии человека и аудиозаписи его голоса. Алгоритмы преобразуют статичное изображение, чтобы получить реалистичные видеоролики. Также пользователь может поменять направление, в котором повернута голова на видео.

Помимо фотоснимков, нейросеть умеет работать с портретами, созданные в любом художественном стиле. В одном из демонстрационных роликов Мона Лиза с полотна Леонардо да Винчи исполняет рэп.

Создатели нейросети решили пока не открывать доступ к ней. Они опасаются, что с помощью VASA-1 будет создано множество фейков. В частности, злоумышленники могут сгенерировать реалистичные видео с участием знаменитостей.

Смотрите видео: результаты работы нейросети VASA-1