Анонсирована новая перспективная нейросеть от компании OpenAI — она способна копировать голоса! Создатели популярной платформы ChatGPT представили Voice Engine — инновационную разработку, способную на основе всего лишь 15-секундной аудиозаписи воссоздать голос любого человека. Удивительно, что Voice Engine уже используется внутри ChatGPT, но компания с осторожностью подходит к распространению этой технологии, опасаясь возможного неправомерного использования нейросетью.
Судя по представленным примерам, нейросеть способна создавать эмоциональные и выразительные голоса, которые звучат очень реалистично. Для достижения подобных результатов достаточно всего лишь небольшого фрагмента оригинальной записи продолжительностью 15 секунд. Новая технология также позволяет озвучить текст на разных языках, используя этот «клонированный» голос.
Однако помимо этого очевидного применения, Voice Engine также может быть полезным для людей, страдающих проблемами с речью. Они смогут воспользоваться этой технологией, чтобы сделать свои записи и произношение более понятными и четкими.
Несмотря на все перспективы, компания с осторожностью подходит к программе, потому что не хочет, чтобы нейросеть использовали не по назначению. OpenAI пока не готова широко предоставлять Voice Engine для общего пользования. Нейросеть будет продолжать проходить тестирование и доработки перед окончательным выпуском.
Для любителей потестить революционное напоминаем, что буквально только-только самая мощная нейросеть DBRX появилась в открытом доступе.