Google рассчитывает на своего собственного конкурента GPT-4, Gemini, и он опубликовал фрагменты недавнего демонстрационного видео. В разделе комментариев, Блумберг Google признает видео под названием «Практический опыт с Gemini: общение с мультимодальным ИИ», Мало того, что он был отредактирован для ускорения релизов (объявлено в описании видео), так еще и неявная голосовая связь между пользователем-человеком и ИИ практически отсутствует.
Вместо этого фактическая демонстрация была создана «с использованием кадров неподвижных изображений из сцен и текстовых подсказок», а не реакции Gemini или прогнозирования рисования или изменения объектов на столе в режиме реального времени. Это гораздо менее впечатляюще, чем хотелось бы, чтобы видео ввело нас в заблуждение, и, что еще хуже, отсутствие отрицания фактического метода ввода ставит под сомнение готовность Gemini.
Отрицание Google каких-либо правонарушений здесь, как уже отмечалось, вызывает удивление. на краю В сообщении X, написанном сопрезидентом Gemini Ориолом Виньялесом, говорится, что «все пользовательские подсказки и результаты в видео реальны» и что его команда создала видео «чтобы вдохновить разработчиков». Учитывая недавнее внимание отрасли и регулирования к ИИ, технологический гигант может быть более деликатным в отношении своих презентаций в этой области.
Очень рада видеть интерес к нашему видео «Практическое занятие с Близнецами». Вчера в нашем блоге разработчиков мы описали, как Gemini использовался для его создания. https://t.co/50gjMkaVc0
Мы представили Gemini массивы разных режимов — в данном случае изображения и текста — и он должен был отреагировать… pic.twitter.com/Beba5M5dHP
— Иволга Виньялес (@OreoleVinealesML) 7 декабря 2023 г.