В панорамные фотографии будет внедрена озвучка, которая отслеживает сюжет изображения и проектирует соответствующие звуки.
Нейросеть обучена самостоятельно вставлять музыкальную озвучку панорамных фотоснимков. Сообщается, что в алгоритме добавлены вполне реальные звуки окружающей среды и условных объектов, обнаруживаемые на снимках и возможность расставить их в зависимости от местоположения на фотографии.
Как подчеркивается, данная технология будет весьма полезна для людей, которые занимаются разработкой в сфере виртуальной реальности.
Ранее команда исследователей из университета Вашингтона спроектировала специнструмент DeepSqueak, позволяющий проводить идентификацию, обработку и сортировку звуков, которые издают мыши и крысы.