Speech2Face e академичен проект, който има за цел да изследва технологичните възможности за сформиране на дигитален човешки образ на база на записан човешки глас. Това става чрез проектиране и обучение на дълбоки невронни мрежи и с използване на милиони видеоклипове от Youtube на хора с разнообразни гласове, споделящи информация на различни теми. Самият модел изучава аудиовизуални и гласови корелации, след което визуализира човешки образ с определен пол, възраст, етнос.

Докъде е стигнала технологията? Изкуствено генерираните образи от Speech2Face се разпознават от други програми като лица на реални хора. Така например някои приложения създават карикатури от полученото изображение.
Доколко всичко това е морално? В от гледна точка на етични съображения поради използваната лична информация, създателите на идеята споделят, че всичко се извършва в името на научния интерес.









