Специалисты обучили технологию рисовать с помощью нескольких миллионов видео.
Группа американских разработчиков представила нейросеть Speech2Face, способную нарисовать портрет человека по его голосу. Об этом сообщило arXiv.org.
Модели под силу нарисовать изображение, взяв за основу пол, расу, возраст. Разработкой занимался коллектив из Массачусетского технологического института, в составе которого был Тахён О.
Підписуйтеcь на наш Telegram-канал Lenta.UA - ЄДИНІ незалежні новини про події в Україні та світі
Ученые решили использовать для обучения нейросети датасет AVSpeech. Он содержит порядка миллиона коротких видео более сотни тысяч различных людей. При этом видео- и аудиодорожки разделены.
Точность работы технологии создатели определили согласно трем демографическим показателям. Сравнению подвергли пол, ориентировочный возраст и расу людей из оригинальных роликов и «вывод», сделанный нейросетью.
Также были выявлены недостатки модели. Она не всегда в состоянии определить возраст с точностью до десяти лет, а лучше всего изображает европеоидов и азиатов. Считается, что последняя проблема связана с неравномерностью присутствия различных рас в выборке для обучения.
По словам исследователей, в их планы не входило доскональное копирование внешности человека. Они стремились к точной идентификации пола, возраста, этноса.
На фото: оригинальные изображения, восстановленные и «нарисованные» по голосу.
Читайте также: Ученые рассказали, как роботы колонизируют Луну
Читайте также: Китайцы планируют создать робота-юмориста
Stanislav KarlovНовости
Ожидать ли теплую зиму в Украине, объяснили в Укргидрометцентре
16:50 21 сен 2024.
Залужный сообщил о гибели своего бывшего советника
15:20 21 сен 2024.
Об атаках врага на энергообъекты за минувшие сутки сообщили в Минэнерго
14:50 21 сен 2024.
У каких людей снижен риск инфаркта и инсульта, выяснили ученые
14:20 21 сен 2024.
Зеленский разоблачил ложь СМИ о цифре потерь украинских бойцов
13:50 21 сен 2024.
Первоначальный очаг COVID-19 нашли ученые
13:15 21 сен 2024.