На прошедшей недавно конференции Google только и говорил о своём новом ассистенте, Gemini. Если вы хотите послушать два часа повторения слова AI - смотрите конференцию. Поскольку AI (он же ИИ) в общем-то ещё не существует, приходится напоминать адептам, что это всё ещё лишь всего лишь очень хорошая угадывалка следующего слова на основе написанного пользователем и уже написанного в качестве ответа. Это порождает казусы, над которыми можно повеселиться, если позадавать искусственному "интеллекту" вопросы.
На этом всё, напишите мне, если вас тоже интересует такая животрепещущая тема, как "мотоциклы и еда" или если вы получили какие-то интересные ответы.
Началась новая эра ИИ, и эта эра Gemini, заявил гендиректор Google Сундар Пичаи, представивший большую языковую модель «Джеминай», или Близнецы. Если верить Пичаи и Демису Хассабису, руководителю отдела DeepMind Google, это громадный скачок вперед, который повлияет на всю продукты компании без исключения. Gemini свободно программирует на Python, Java, C++ и Go и уже показала, как создает сайты, которые динамически кодируют себя сами в процессе использования, если возникает необходимость в новых функциях. В недалеком будущем область восприятия модели охватит также осязание и тактильную обратную связь.
Год назад OpenAI выпустила ChatGPT, который тотчас стал хитом в области ИИ. Теперь Google, которая называла себя первой в этой технологии более десяти лет, и которую успех GPT очевидно застал врасплох, нанесла ответный удар.
Команде Google удалось создать первую модель, которая достигла 90% в тесте MMLU (массивный многозадачный тест на понимание языка) и превзошла экспертов (их результат 89,8%), а также GPT-4 (86,4%) в ряде задач на эрудицию и решение проблем по 57 областям знаний, включая математику, физику, историю, право, медицину и этику.
Модель с самого начала создавалась многомодальной, то есть обучалась не только на текстах, но и на данных в формате аудио и видео. Когда другие модели, глядя на изображение, «думают» о нем словами, Gemini замечает нюансы, свойственные медиуму. В будущем область восприятия модели охватит и осязание, и тактильную обратную связь, пообещал Хассабис, рассказывая о возможностях, которые открываются перед робототехникой с появлением Gemini.
Вдобавок, Gemini свободно программирует на Python, Java, C++ и Go и уже показала, как создает сайты, которые динамически кодируют себя сами в процессе использования, если возникает необходимость в новых функциях. Для интернета это совершенно новый подход: начинаешь с одной странички, которая постепенно развивается в то, что тебе на самом деле нужно.
Gemini — не одна языковая модель. Есть более легкая версия под названием Gemini Nano, которую можно запускать на устройствах Android без подключения к интернету. Есть более навороченная версия Gemini Pro, которая вскоре ляжет в основу ряда ИИ-сервисов Google и, начиная с сегодняшнего дня, поддерживает работу чатбота Bard. Еще более мощная версия Gemini Ultra для дата-центров в разработке и появится в следующем году, сообщает Verge.
Помимо чатбота Bard новая модель Google уже поддерживает некоторые функции смартфона Pixel 8 Pro. Разработчики и клиенты смогут получить доступ к Gemini Pro через Google Generative AI Studio или Vertex AI в Google Cloud начиная с 13 декабря. Пока Gemini доступна только на английском, но поскольку модель собираются интегрировать в поисковый движок Google, браузер Chrome, рекламные продукты и многое другое, поддержка других языков точно появится.