Модель GPT-4o набагато розумніша за старі версії та буде доступна безплатно
Компанія OpenAI представила технологію GPT-4o. Оновлена модель чат-бота зі штучним інтелектом зможе підтримати розмову голосом у режимі реального часу, розумітиме людські емоції та тон голосу й буде відповідати з різною інтонацією та розпізнавати об'єкти на відео. Нейромережа GPT-4o ще швидша за GPT-4, і при цьому дозволяє запустити багато преміумфункцій для безкоштовних користувачів.
Так, OpenAI представила GPT-4o у прямій трансляції в понеділок, 13 травня. Це - оновлена версія моделі GPT-4, якій вже більше як рік. Нова модель буде краще працювати з текстом, аудіо та зображеннями в режимі реального часу. Оновлення будуть доступні для користувачів в найближчі тижні.
Головний виконавчий директор OpenAI Сем Альтман каже, що GPT-4o "за своєю суттю є мультимодельним" (буква "о" тут означає "omni", тобто мультимодальні можливості моделі), що відображає здатність використовувати текст, зображення, відео та голос як вхідні дані для взаємодії. Усе це, за словами компанії, наближає нас до "набагато більш природної взаємодії людини з комп'ютером". Користувачі можуть спілкуватися з ШІ як за допомогою лише одного виду даних, так і за допомогою комбінації тексту, аудіо та фото, а потім отримаєте згенеровані вихідні дані також у всіх трьох форматах.
Під час презентації також виявилося, що чат-бот майже миттєво перекладає мову з однієї мови на іншу. Так, OpenAI продемонструвала, як GPT-4o перекладає розмовну мову в реальному часі. Ведучі презентації попросили ChatGPT у режимі розмови слухати, що йому кажуть англійською, а потім пояснити співрозмовнику, який володіє лише італійською, що було щойно сказано. Після того, як друга людина відповідала італійською, ШІ пояснив, що було у її відповіді. Все це відбулося не в дослівному перекладі, а звичайно природною мовою, яка повністю передала суть.
Ще одне демонстраційне відео показує інші застосування цієї функції. Наприклад, попросити ШІ розказати щось про будівлю, яку видно в цей момент на відео, надати історичні дані про Букінгемський палац. ChatGPT також правильно визначив, що дивиться на качок, і розповів, що вони роблять, а потім допомагає користувачу віднайти на вулиці таксі й зупинити конкретну машину.
Ще одна вражаюча функція - аудіовзаємодія з ChatGPT. Тепер користувач може не лише перебивати фрази ШІ, а й значно краще керувати чат-ботом за допомогою голосу, використовуючи такі команди, як "бути більш драматичним" або "звучати більше як робот", регулюючи звучання голосу ChatGPT. GPT-4o також може конспектувати віртуальні зустрічі, виокремлюючи голоси різних людей і перетворюючи в текст кожну окрему фразу спікерів, розділяючи їх за особами.
"Це відчуття, як ШІ з фільмів, і для мене все ще трохи дивно, що це реально. Досягнення часу реакції на рівні людини та виразності виявляється великою зміною", - заявив головний виконавчий директор OpenAI Сем Альтман.
У OpenAI заявили, що GPT-4o навчався на тексті, зоровому сприйнятті та аудіо, а це означає, що всі вхідні та вихідні дані обробляються однією нейронною мережею. Це відрізняється від попередніх моделей компанії, GPT-3.5 і GPT-4, які дозволяли користувачам ставити запитання, просто розмовляючи, але потім транскрибували мову в текст. Це позбавляло інтонації та емоцій і робило взаємодію повільнішою.
OpenAI робить нову модель доступною для всіх, включаючи безкоштовних користувачів ChatGPT. У рамках своїх оновлень OpenAI заявив, що також дає можливість будь-кому отримати доступ до свого магазину GPT, який включає персоналізовані чат-боти, створені користувачами. Раніше це було доступно лише платним клієнтам.
На початку квітня чат-бот на основі штучного інтелекту ChatGPT став доступним для користування без реєстрації. Наразі ця послуга доступна не у всіх країнах. Проте в Україні вже доступна.
Також у компанії-розробника розповіли, що ChatGPT здатен навчатися на запитах та відповідях користувача. Проте тепер цю функцію можна відключати в налаштуваннях. Це можна робити, якщо є необхідність, щоб певні запити чат-бот не запамʼятовував. Крім того, розробники вирішили додати нові засоби захисту вмісту. Зокрема, тепер можливо блокувати підказки, а також генерації у ширшому діапазоні категорій. При цьому навіть без реєстрації користувачі не зможуть зберігати й переглядати історію чатів, ділитися чатами й розблокувати додаткові функції. Це також стосується функцій з голосовим чат-ботом.
Нагадаємо, через стрімкий розвиток ШІ у ЄС вирішили ухвалити законодавство про нього. Так був ухвалений перший Закон про штучний інтелект (AI Act) - це законодавчий акт Європейського Союзу, який регулює розробку, використання та поширення систем штучного інтелекту.
Підписуйтесь на наш Telegram-канал, щоб не пропустити важливих новин. Підписатися на канал у Viber можна тут.