?

Log in

No account? Create an account

Анатолій Андросюк

Всем Взаимофренд !

Previous Entry Share Flag Next Entry
Нейросеть научили копировать голос при синтезе текста в речь
biboroda




Группа разработчиков создала алгоритм для синтеза текста в речь на основе нейросетевых моделей Tacotron 2 и WaveNet. Алгоритмы могут создавать голос, имитирующий говорящего по фрагменту стороннего аудиофайла. Результаты работы опубликованы на arxiv.org в июне 2018 года, открытый исходный код размещён на площадке GitHub.

Для работы алгоритма нужно два аудиофайла: один с примером голоса, который необходимо скопировать, и второй с фразой, которую этим голосом нужно произнести. После этого алгоритм почти в реальном времени преобразует голос из второго аудиофайла. В итоге. получает голос похожий на тон говорящего из первого файла.

promo biboroda november 30, 2014 22:14 4141
Buy for 40 tokens
Оригинал взят у biboroda в Френдмарафон - новичков, но и старички - не стесняйтесь.( CAPTCHA) Уважаемые, сделал дубликат хорошего старого поста, там очень не удобно писать, постоянно надо вводить CAPTCHA, её поставил ЖЖ так как там очень много комментов, я её отключить не могу,…