Нейросеть стала еще больше похожа на человека. Рассказываем, на что способен ИИ-бот с новыми чувствами.
OpenAI обновила нейросеть ChatGPT. Теперь нейросеть умеет слушать людей и отвечать им голосом. Об этом разработчики рассказали в своем блоге. Всего чатбот получил три крупных нововведения:
Слух
ChatGPT научился отвечать на вопросы, которые пользователь не написал, а произнес с включенным микрофоном. Функция диктовки запросов доступна в мобильном приложении ChatGPT. Вот как выглядит диалог с нейросетью:
Голос
Теперь ChatGPT может вам отвечать не только в текстовом, но и в голосовом формате. Чтобы активировать функцию, нужно в мобильном приложении ChatGPT перейти в Настройки > Новые функции приложения > Ответы голосом.
Всего доступно 5 голосов на выбор: 2 женских, 2 мужских и 1 небинарный. Послушать каждый из них можно по ссылке. Озвучкой ChatGPT занимались профессиональные актеры дубляжа. Помогала преобразовывать речь в текст собственная технология OpenAI Whisper.
«Глаза»
ChatGPT получил еще одно человеческое чувство — способность видеть. Человек может отправить нейросети фотографию, чтобы чатбот проанализировал ее. Примеры сценариев использования этой функции:
У вас сломался велосипед — сфотографируйте его и отправьте ChatGPT. Нейросеть расскажет, как его починить; Вы не знаете, что приготовить — отправьте ChatGPT фото с продуктами в холодильнике. Нейросеть расскажет, что можно сделать из имеющихся ингредиентов; Вы не можете решить задачу — сфотографируйте условия задачи или пример и отправьте ChatGPT. Нейросеть озвучит или напишет ответ с объяснением.
Подробнее https://hi-tech.mail.ru/news/103008-cha...