Разработка – компьютерная программа - способна в точности имитировать человеческий голос. Она называется Tacotron 2 и служит для преобразования текста в речь.
По данным Quartz, система состоит из двух нейросетей глубокого обучения. Первая преобразует текст в спектрограмму и передает алгоритму WaveNet, который озвучивает ее, генерируя соответствующие звуковые элементы.
Tacotron 2 в состоянии справиться с трудными для произношения словами и названиями, а также менять интонации в зависимости от знаков препинания.
Пока Tacotron 2 может озвучивать тексты только на английском языке и только женским голосом. Но в перспективе ожидается, что программа будет внедрена в фирменный онлайн-переводчик.