Творці ChatGPT представили інноваційний Voice Engine, який відтворює голос

Читать на русском

Згенерований ШІ голос може озвучувати будь-який текст, зберігаючи тембр оригіналу, і навіть перекладати іншими мовами

Читать на русском
Voice Engine
OpenAI представляє Voice Engine, який синтезуйте голос людини за 15 секунд

Згенерований ШІ голос може озвучувати будь-який текст, зберігаючи тембр оригіналу, і навіть перекладати іншими мовами

OpenAI, творці ChatGPT, представили бета-версію Voice Engine - нового голосового движка. Він здатний генерувати голос людини, використовуючи всього 15-секундний аудіозапис. За допомогою Voice Engine можна озвучувати текст будь-якою мовою, зберігаючи тембр та інтонацію оригіналу.

Про це повідомляє Bloomberg. Зазначається, що компанія поділилася результатами тестування функції. Вони поділилися моделлю синтезу мовлення з 10 розробниками. Проте OpenAI вирішила скоротити випуск після відгуків від зацікавлених сторін, зокрема політиків, експертів та творчих особистостей.

Технологія може допомогти людям, які втратили голос через хворобу, знайти його знову. Вона також може бути використана для створення голосових асистентів або озвучування аудіокниг різними мовами. Це дасть змогу людям із різним мовним бар'єром спілкуватися й отримувати доступ до інформації зручніше.

OpenAI з кінця 2022 року працює над моделлю Voice Engine, яка дає змогу генерувати реалістичний голос людини, використовуючи лише короткий зразок її мови. Модель навчалася на "поєднанні ліцензованих і відкритих даних", але поки не доступна широкому загалу через побоювання OpenAI щодо безпеки. Наразі Voice Engine можуть тестувати тільки обрані розробники.

Це не перша подібна технологія. У 2023-му стартап ElevenLabs представив модель, яка вміє перекладати і дублювати розмовний контент іншою мовою зі збереженням оригінального голосу. 

Що відомо про компанію OpenAI

Популярний чат-бот зі штучним інтелектом ChatGPT уже кілька місяців утримує позиції найбільш затребуваного додатка. Люди використовують його для написання текстів пісень, есе, сценаріїв телесеріалів тощо. Багато хто знає, що його створили розробники OpenAI, але про саму компанію відомо не так і багато.

OpenAI, заснована 2015 року в Сан-Франциско, спочатку позиціонувалася як некомерційна лабораторія з дослідження ШІ, яка прагне до створення "загального ШІ". OpenAI планувала робити свої розробки відкритими, на відміну від Google. Ілон Маск, Пітер Тіль і Сем Альтман стали першими інвесторами OpenAI. З 2019 року Альтман, відомий своїми інвестиціями в Airbnb, Reddit та інші успішні стартапи, очолює компанію.

У 2019 році OpenAI, з інвестицією $1 млрд від Microsoft, почала перетворюватися на комерційне підприємство. Ілон Маск, противник такої трансформації, покинув компанію. Компанія зосередилася на розробці мовних моделей, презентувавши GPT-3 2020 року. Модель навчили кодувати, що призвело до створення програми Codex для розробників. А в листопаді 2022 року OpenAI випустила ChatGPT. Завдяки цьому чат-боту всі охочі можуть взаємодіяти зі штучним інтелектом на різних рівнях.

Нагадаємо, що на днях компанія OpenAI представила нову функцію в текстовій моделі на базі штучного інтелекту ChatGPT. Вона отримала назву Read Aloud і дозволить користувачам заслухати відповіді ШІ на свої запити. Для цього модель пропонує обрати один з пʼяти доступних варіантів голосів.

Підписуйтесь на наш Telegram-канал, щоб не пропустити важливих новин. Підписатися на канал у Viber можна тут.

ЧИТАЙТЕ ТАКОЖ:

Ми використовуємо файли cookie, щоб забезпечити належну роботу сайту, а вміст та реклама відповідали Вашим інтересам.