Компания Adobe, разработчик Photoshop, представила «фотошоп для аудио» — программу Project VoCo. Технология не нова, но теперь модифицировать речь на аудиозаписи станет совсем просто: это можно будет делать, просто печатая слова на клавиатуре.
Adobe представила «фотошоп для аудио»

Помимо обычных возможностей аудиоредактора Project VoCo позволяет модифицировать записи человеческой речи — менять слова и даже добавлять новые. Система поддерживает перевод текста в звук; запись речи она представляет в двух формах — текстовой и волновой. Пользователь может менять местами слова в текстовой записи, и программа сама адаптирует аудио под измененный порядок слов.

Кроме того, система может добавить в запись новые слова и короткие фразы, которые пользователь введет в текстовое поле VoCo. При этом голос и интонация нередактированной части записи сохраняются. При помощи этого редактора на основе одной записи голоса можно составить другие, в которых человек будет произносить слова, которых никогда не говорил на самом деле.

В качестве демонстрации во время презентации сотрудник Adobe взял запись фразы «Когда я прихожу домой, я целую собак и жену», произнесенную его коллегой. При помощи VoCo он исправил ошибку, поменяв местами слова «жену» и «собак», затем удалил в поле набора текста оба слова и вместо них добавил «Джейкоб» и «три раза». VoCo произнесла «Я целую Джейкоба три раза» нормальным человеческим голосом с почти естественными интонациями.

Разработчики Adobe работают совместно со специалистами из Принстонского университета. Дата выпуска программы пока не раскрывается. Вероятно, компании еще предстоит поработать над тем, чтобы модифицированные записи звучали более естественно.