Нейросеть будет озвучивать фотографии, основываясь на их сюжете

В панорамные фотографии будет внедрена озвучка, которая отслеживает сюжет изображения и проектирует соответствующие звуки.

Нейросеть обучена самостоятельно вставлять музыкальную озвучку панорамных фотоснимков. Сообщается, что в алгоритме добавлены вполне реальные звуки окружающей среды и условных объектов, обнаруживаемые на снимках и возможность расставить их в зависимости от местоположения на фотографии.

Как подчеркивается, данная технология будет весьма полезна для людей, которые занимаются разработкой в сфере виртуальной реальности.

Ранее команда исследователей из университета Вашингтона спроектировала специнструмент DeepSqueak, позволяющий проводить идентификацию, обработку и сортировку звуков, которые издают мыши и крысы.

загрузка...

Коротко

Показать все новости