Глава компании OpenAI Сэм Альтман провел презентацию в рамках конференции DevDay, на которой рассказал о предстоящих обновлениях чат-бота ChatGPT и новых инструментах для разработчиков. 

Турбо-режим 

В первую очередь команда представила улучшенную версию GPT-4 Turbo с расширенным объемом контекстного окна в 128 000 токенов. Это значение эквивалентно 300 страниц текста за один запрос. 

Искусственный интеллект более функционален и обладает знаниями о мировых событиях до апреля 2023 года.

Чат-бот получил обновленную систему вызова функций, которая позволяет создать запрос на два действия одновременно, например «открыть окно автомобиля и выключить кондиционер». Усовершенствованный API для нейросети запоминает и «с большей вероятностью» воспроизводит правильные параметры функций. 

Кроме того, GPT-4 Turbo научили тщательно следовать запрошенному формату при указании специального параметра (например, «всегда отвечать в XML»). Нейросеть также поддерживает режим JSON для компоновки полученных результатов. 

Новый параметр — seed — обеспечивает воспроизводимость выходных данных, заставляя нейросеть повторять согласованные результаты. Бета-функция, которая обеспечивает больший контроль над поведением модели, полезна для создания нескольких запросов на отладку и комплексных модульных тестов.

В дополнение OpenAI выпустила турбо-версию GPT-3.5 с контекстным окном на 16 000 токенов. Нейросеть поддерживает аналогичную GPT-4 Turbo функциональность, но в более медленном режиме.  

Полезный ассистент

API Assistants — специально созданный ИИ, который имеет конкретные инструкции, использует дополнительные знания и может вызывать модели и инструменты для выполнения задач.

Интерфейс помощника предоставляет возможности интерпретатора и извлечения кода на Python. Инструмент также умеет исполнять некоторые функции, которые раньше приходилось прописывать вручную, и позволяет создавать «высококачественные приложения искусственного интеллекта».

«API разработан с учетом гибкости: варианты использования варьируются от приложения для анализа данных на естественном языке, помощника по программированию, планировщика отпуска на базе ИИ, диджея с голосовым управлением, интеллектуального визуального холста — список можно продолжать долго», — подчеркнули в OpenAI.

Дополнительные возможности

Расширенная функциональность, которую получили турбо-версии GPT, дает возможность реализовывать дополнительные решения. Например, API Chat Completions позволяет ИИ воспринимать изображения в качество входных данных, за счет чего нейросеть может создавать подписи к рисункам, делать подробный анализ фотографий или читать, а затем пересказывать документы. 

Благодаря «зрению» ChatGPT появилось приложение BeMyEyes, которое использует расширение для помощи слепым и слабовидящим людям в выполнении повседневных задач вроде навигации в помещении.

Теперь разработчики могут интегрировать генеративную нейросеть DALL-E 3 в свои продукты напрямую через интерфейс. Инструмент имеет встроенную модерацию выходного контента для борьбы с нарушением авторских прав. 

Кроме того, продукты OpenAI получили полноценную поддержку функции по преобразованию текста в речь и имеют шесть предустановленных голосов. Расширении обладает различными режимами, например для беседы в реальном времени или создания звуковой дорожки высокого качества. 

Для тех, кому недостаточно обычного функционала ChatGPT, добавили экспериментальную возможность «тонкой настройки» и инструмент Custom Models. Это позволит изменять код языковой модели на любом этапе, начиная с обучения. 

Напоследок OpenAI представила кастомные узконаправленные версии нейросети — GPTs. Они представляют собой нечто похожее на расширения для веб-браузера. 

Некоторые могут выполнять конкретные задачи по поиску информации в интернете  или служить виртуальным помощником в рабочих процессах. 

Согласно заявлению компанию, для создания GPTs не требуется написание кода. Инструмент можно сделать лично для себя, корпоративного использования или выложить его в общий доступ. 

Специальный магазин расширений появится позднее в ноябре. Сторонние пользователи смогут добавлять свои разработки на платформу, лучше из них выберет команда OpenAI.

В конце сентября разработчики выпустили масштабное обновление для ChatGPT. Чат-бот впервые научился «видеть, слышать и говорить».

Будь в курсе! Подписывайся на Криптовалюта.Tech в Telegram.