Изображение: Disney Research Zurich/Charles Malleson et al., 2015
Как сообщает портал N+1, ученые университета Суррея в Великобритании и научно-исследовательской организации Disney Research, разработали программу FaceDirector. Сначала FaceDirector анализирует выражение лица и важную аудио-информации. Системе необходимо получить представление об опорных точках лица актера, затем она с помощью технологии оптического потока накладывает изображения одно на другое и генерирует новые кадры. Технология оптического потока помогает рассчитать расстояние, на которое какие-то элементы сместились по отношению к их положению на предыдущем кадре за то время, которое прошло между фиксацией кадров. В результате FaceDirector «смешивает» несколько выражений лиц в одно, так что режиссеру необходимо выбрать наиболее подходящее.
Кадры из двух несинхронных дублей (верхний и средний ряд), и их синхронизированный синтетический видеоряд. Изображение: Disney Research Zurich/Charles Malleson et al., 2015
Систему протестировали с помощью актеров, которые проговаривали один и тот же текст с разными эмоциями – счастьем, грустью, воодушевлением, страхом, злостью и т.д. Исследователи синхронизировали видео в режиме реального времени, и пользователи за компьютерами генерировали новые эмоции прямо во время съемок. Семиминутное видео, демонстрирующее возможности алгоритма, было опубликовано на YouTube:
Исследователь Disney Research Жан-Чарльз Базин отмечает, что FaceDirector хорошо проявляет себя на крупных и средних планах.
Программу FaceDirector представят на конференции ICCV 2015 (International Conference on Computer Vision), которая пройдет в середине декабря этого года. Подробности о ней можно узнать здесь.