OpenAI представила впечатляющую модель GPT-4o, с которой можно общаться: на что еще способен искусственный интеллект

Модель GPT-4o гораздо умнее старых версий и будет доступна бесплатно

GPT-4o
GPT-4o учился на тексте, зрительном восприятии и аудио

Компания OpenAI представила технологию GPT-4o. Обновленная модель чат-бота с искусственным интеллектом сможет поддержать разговор голосом в режиме реального времени, будет понимать человеческие эмоции и тон голоса и будет соответствовать разной интонации и распознавать объекты на видео. Нейросеть GPT-4o еще быстрее GPT-4, и при этом позволяет запустить много премиум функций для бесплатных пользователей.

Так, OpenAI представила GPT-4o в прямой трансляции в понедельник, 13 мая. Это – обновленная версия модели GPT-4, которой уже больше года. Новая модель будет лучше работать с текстом, аудио и изображениями в реальном времени. Обновления будут доступны для пользователей в ближайшие недели.

Главный исполнительный директор OpenAI Сэм Альтман говорит, что GPT-4o "по своей сути является мультимодельным" (буква "о" здесь означает "omni", то есть мультимодальные возможности модели), что отражает способность использовать текст, изображения, видео и голос как входные данные для взаимодействия. Все это, по словам компании, приближает нас к "намного более естественному взаимодействию человека с компьютером". Пользователи могут общаться с ИИ как посредством только одного вида данных, так и посредством комбинации текста, аудио и фото, а затем получите сгенерированные исходные данные также во всех трех форматах.

В ходе презентации также оказалось, что чат-бот почти мгновенно переводит речь с одного языка на другой. Так, OpenAI продемонстрировала, как GPT-4o переводит разговорный язык в реальном времени. Ведущие презентации попросили ChatGPT в режиме разговора слушать, что ему говорят на английском, а затем объяснить собеседнику, владеющему только итальянским, что было только что сказано. После того, как второй человек отвечал на итальянском, ИИ объяснил, что было в его ответе. Все это произошло не в дословном переводе, а обычно на естественном языке, который полностью передал суть.

Еще одно демонстрационное видео показывает другие приложения этой функции. Например, попросить ИИ рассказать что-нибудь о здании, которое видно в этот момент на видео, предоставить исторические данные о Букингемском дворце. ChatGPT также правильно определил, что смотрит на уток и рассказал, что они делают, а затем помогает пользователю найти на улице такси и остановить конкретную машину.

Еще одна впечатляющая функция – аудиовзаимодействие с ChatGPT. Теперь пользователь может не только перебивать фразы ИИ, но и значительно лучше управлять чат-ботом с помощью голоса, используя такие команды, как "быть драматичнее" или "звучать больше как робот", регулируя звучание голоса ChatGPT. GPT-4o также может конспектировать виртуальные встречи, выделяя голоса разных людей и превращая в текст каждую отдельную фразу спикеров, разделяя их по лицам.

"Это ощущение, как ИИ из фильмов, и для меня все еще немного странно, что это реально. Достижение времени реакции на уровне человека и выразительности оказывается большим изменением", - заявил главный исполнительный директор OpenAI Сэм Альтман.

В OpenAI заявили, что GPT-4o учился на тексте, зрительном восприятии и аудио, что означает, что все входящие и исходящие данные обрабатываются одной нейронной сетью. Это отличается от предыдущих моделей компании, GPT-3.5 и GPT-4, позволявших пользователям задавать вопросы, просто разговаривая, но затем транскрибируя язык в текст. Это лишало интонации и эмоций и делало взаимодействие медленнее.

OpenAI делает новая модель доступна для всех, включая бесплатных пользователей ChatGPT. В рамках своих обновлений OpenAI заявил, что также дает возможность кому-либо получить доступ к своему магазину GPT, включающему персонализированные чат-боты, созданные пользователями. Раньше это было доступно только платным клиентам.

ChatGPT теперь доступен без регистрации

В начале апреля чат-бот на основе искусственного интеллекта ChatGPT стал доступен для использование без регистрации. Пока эта услуга доступна не во всех странах. Однако в Украине уже доступна.

Также в компании разработчика рассказали, что ChatGPT способен учиться на запросах и ответах пользователя. Однако теперь эта функция может быть отключена в настройках. Это можно делать, если есть необходимость, чтобы некоторые запросы чат-бот не запоминал. Кроме того, разработчики решили добавить новые средства защиты содержимого. В частности, теперь можно блокировать подсказки, а также генерации в более широком диапазоне категорий. При этом даже без регистрации пользователи не могут сохранять и просматривать историю чатов, делиться чатами и разблокировать дополнительные функции. Это также относится к функциям с голосовым чат-ботом.

Напомним, из-за стремительного развития ИИ в ЕС решили принять законодательство о нем. Так был принят первый Закон об искусственном интеллекте (AI Act) – это законодательный акт Европейского Союза, регулирующий разработку, использование и распространение систем искусственного интеллекта.

Подписывайтесь на наш Telegram-канал, чтобы не пропустить важные новости. Подписаться на канал в Viber можно здесь.

 

ЧИТАЙТЕ ТАКЖЕ:

Главная Актуально Informator.ua Україна на часі Youtube