Технологии

Героями этой экспозиции стали реальные люди. Или нереальные? Как работают нейросети и технология морфинга

Слушать аудиоверсию 06:02
Фото photo.roscongress.org
Анна Послянова

Автор

Анна Послянова

Опубликовано

23 июня 2023

Опубликовано

23 июня 2023

Можно ли снять видеоролик с людьми, которых не существует в природе? Да, благодаря «дружбе» нейросетей, фейстрекинга и морфинга лиц. Пример такого синтеза технологий — экспозиция «Энергия в людях» на Петербургском международном экономическом форуме — 2023. Подойдем поближе, рассмотрим получше и выясним, как все это работает, вместе с разработчиками — студией Radugadesign.

Перед нами огромный куб высотой 7,5 и шириной 13 метров. Внутри — зал для подписания соглашений, а снаружи — большие экраны, которые перетекают друг в друга благодаря скругленным ребрам куба. На одной из граней крутится видео, и сейчас единственный герой в нем — геологоразведчик с пультом управления. Он смотрит вдаль и нажимает на кнопки, и не успевают гости ПМЭФ навести на экран видеокамеру, как сцена с геологоразведчиком меняется.

Перед нами появляется оператор буровой, но погодите… Черты лица героя начинают плавно меняться, и он превращается в другого человека, который продолжает движения первого, затем портрет трансформируется снова и снова, символизируя множество людей одной профессии.

За минуту каждый из 12 показанных на экспозиции героев успевал «сменить» несколько лиц. Галерея динамичных портретов сложилась в цифровой образ компании «Газпром нефть», новый слоган которой — «Энергия в людях».

На экранах транслировались шесть локаций, в каждую из которых «поселили» представителя разных профессий: оператора бурения, рабочего и лаборанта нефтеперерабатывающего завода, капитана ледокола, сотрудника АЗС, оператора топливозаправщика и других. Разрешение видео на всех экранах составило 19 968 на 2880 пикселей. Для сравнения стандартное разрешение современного телевизора — 1920 пикселей на 1080, а экрана 4К — 3840 на 2160 пикселей.

Десяток нейросетей

Для создания видеоконтента специалисты студии Radugadesign разработали цифровой алгоритм, который использовал возможности десяти нейросетей. У каждой была своя «зона ответственности»: одни меняли и дорисовывали изображение, чтобы естественно соединить несколько портретов и фонов в статике и динамике; другие отслеживали пол и возраст героев; третьи направляли креатив «коллег» в заданное программистами русло.

Сначала искусственному интеллекту показали 200 тысяч фотографий сотрудников «Газпром нефти». Алгоритм отфильтровал подходящие по качеству и композиции — например, чтобы лицо человека было хорошо видно. Вручную перебрать столько снимков в короткие сроки было бы невозможно. В «финал» прошли 90 тысяч фото, которые и взяли в работу.

Разбив фотоархив по разным категориям (профессия, пол, возраст), алгоритм под контролем программистов составил несколько собирательных образов представителей разных профессий. Эти портреты и «проступали» на лицах персонажей роликов. Ни на миг на экранах не появилось лицо реального сотрудника, но образ каждого героя стал суперпозицией тысяч настоящих фотографий.

Почему это не дипфейк

В основе дипфейка — подмена одного реального лица на фото или видео другим реальным. В случае с визуальным манифестом «Газпром нефти» на ПМЭФ на основе реальных портретов создали образы не существующих в действительности людей.

Что такое фейстрекинг и морфинг

Чтобы оживить собирательные портреты, использовали композиторинг — метод, объединяющий 3D-графику и реальные съемки. Созданные нейросетями лица накладывали на движущихся актеров. Для этого во время съемок реальных людей на их лицах расставили точки мимики: на зрачках, веках, губах, бровях и других частях. По словам разработчиков, это позволило избежать эффекта «зловещей долины» и помогло придать персонажам естественности.

Прием с маркированием лица точками называется фейстрекинг, его применяют в уличном распознавании лиц и анимированных масках в соцсетях, но в более простом варианте.

Для анимации и изменения черт лица персонажа по ходу видеосюжета использовали морфинг — цифровой визуальный эффект, когда один объект трансформируется в другой. Чтобы это происходило плавно, компьютер создает ряд промежуточных образов, немного отличных от исходных: столько, сколько нужно для заполнения «пустоты» между двумя объектами. При этом он ориентируется на опорные фигуры и точки — в данном случае точки мимики.

Александр Роднов

продюсер проекта

На съемочной площадке мы так организовали процесс, чтобы алгоритм давал команду «Стоп, снято!», ведь он подмечал мельчайшие неточности в движениях актеров.

На обучение алгоритма ушло около полугода, а графический контент готовили примерно девять месяцев. Над ним работала группа из 23 российских специалистов. По их оценкам, это первый случай в нашей стране, когда для художественного контента использовали базу данных корпорации и «команду» нейросетей.

1
Haha
Haha
0
0
Love
Love
0
0
0
Читать также
Специалист арктического нефтяного месторождения

Держи ноги в тепле, а землю — в холоде: зачем ученые наблюдают за вечной мерзлотой

3 мин. чтения
Сотрудники офиса во время обсуждения

В Петербурге обсудили, как привлечь в Россию квалифицированных работников из-за рубежа

2 мин. чтения
Центр управления добычей «Газпром нефти» в Тюмени

В Москве предложили «ловить» залежи нефти и газа гибридными компьютерными сетками

1 мин. чтения
Молодые ученые за работой

На Конгрессе молодых ученых договорились, как быстрее превращать студенческие стартапы в технологии

1 мин. чтения
Участники обучения в очках виртуальной реальности

Дизайнеры в эпоху искусственного интеллекта: что изучать и куда идти работать

4 мин. чтения
Космический корабль «Орел»

Ученые придумали, как уменьшить расход топлива космического аппарата «Орел»

2 мин. чтения
Специалист рассматривает металлическую деталь, напечатанную на 3D

Пермские ученые разработали методику 3D-печати металлических изделий без дефектов

1 мин. чтения
На конференции byteoilgas_conf 2024

Что нам стоит цифровой мир построить: тренды цифровой трансформации в энергетике

4 мин. чтения
Электротехник ЛЭП

В Великом Новгороде создали беспроводные датчики для измерения тока в ЛЭП

2 мин. чтения
Специалисты в офисе

В России появилось сообщество ИТ-разработчиков в нефтегазовой отрасли

1 мин. чтения
X 1