Сгенерированный ИИ голос может озвучивать любой текст, сохраняя тембр оригинала, а также переводить на другие языки.
OpenAI, создатели ChatGPT, представили бета-версию Voice Engine – нового голосового движка. Он способен генерировать голос человека, используя всего 15-секундную аудиозапись. С помощью Voice Engine можно озвучивать текст на любом языке, сохраняя тембр и интонацию оригинала.
Об этом сообщает Bloomberg. Отмечается, что компания поделилась результатами тестирования функции. Они поделились моделью синтеза речи с 10 разработчиками. Однако OpenAI решила сократить выпуск после отзывов от заинтересованных сторон, в частности политиков, экспертов и творческих личностей.
Технология может помочь людям, потерявшим голос из-за болезни, найти его снова. Она также может быть использована для создания голосовых ассистентов или озвучивания аудиокниг на разных языках. Это позволит людям с разным языковым барьером общаться и получать доступ к информации удобнее.
OpenAI с конца 2022 года работает над моделью Voice Engine, позволяющей генерировать реалистичный голос человека, используя лишь краткий образец его речи. Модель училась на "сочетании лицензированных и открытых данных", но пока не доступна широкой общественности из-за опасений OpenAI по безопасности. В настоящее время Voice Engine могут тестировать только избранные разработчики.
Это не первая подобная разработка. В 2023-м стартап ElevenLabs представил модель, умеющую переводить и дублировать разговорный контент на другой язык с сохранением оригинального голоса.
Популярный чат-бот со искусственным интеллектом ChatGPT уже несколько месяцев удерживает позиции наиболее востребованного приложения. Люди используют его для написания текстов песен, эссе, сценариев телесериалов и т.д. Многие знают, что его создали разработчики OpenAI, но о самой компании известно не так и много.
OpenAI, основанная в 2015 году в Сан-Франциско, первоначально позиционировалась как некоммерческая лаборатория по исследованию ИИ, стремящаяся к созданию "общего ИИ". OpenAI планировала делать свои разработки открытыми, в отличие от Google. Илон Маск, Питер Тиль и Сэм Альтман стали первыми инвесторами OpenAI. С 2019 года Альтман, известный своими инвестициями в Airbnb, Reddit и другие успешные стартапы, возглавляет компанию.
В 2019 году OpenAI, с инвестицией $1 млрд от Microsoft, начала превращаться в коммерческое предприятие. Илон Маск, противник такой трансформации, покинул компанию. Компания сосредоточилась на разработке языковых моделей, представив GPT-3 2020 года. Модель научили кодировать, что привело к созданию Codex для разработчиков. А в ноябре 2022 OpenAI выпустила ChatGPT. Благодаря этому чат-боту все желающие могут взаимодействовать с искусственным интеллектом на разных уровнях.
Напомним, что на днях компания OpenAI представила новую функцию в текстовой модели на базе искусственного интеллекта ChatGPT. Она получила название Read Aloud и позволит пользователям заслушать ответы ИИ на свои запросы. Для этого модель предлагает выбрать один из пяти доступных вариантов голосов.
Подписывайтесь на наш Telegram-канал, чтобы не пропустить важные новости. Подписаться на канал в Viber можно здесь.