На конференции разработчиков Google I/O 2024 во вторник Google объявил, что непосредственно в рабочий стол клиента Chrome начиная с версии Chrome 126 внедряет Gemini Nano, самую маленькую из своих моделей искусственного интеллекта.
Как сообщает компания, это позволит разработчикам использовать модель на устройстве для создания собственных функций искусственного интеллекта. Google планирует использовать эту новую способность для реализации функций, таких как существующий инструмент "помогите мне написать" из Workspace Lab в Gmail.
Компания отмечает, что недавние работы по поддержке WebGPU и WASM в Chrome позволяют этим моделям работать с разумной скоростью на широком наборе оборудования.
Во время предварительного брифинга перед сегодняшним объявлением, Джон Далке, директор по продуктам Google Chrome, заявил, что Google находится в переговорах с другими поставщиками браузеров, чтобы также внедрять эту функцию - или подобную - в их браузерах.
\"Мы начали сотрудничать с другими браузерами и запустили раннюю программу предварительного просмотра для разработчиков\", - написал Далке в сегодняшнем объявлении. \"С веб-графическим интерфейсом пользователя, WASM и Gemini, встроенными в Chrome, мы считаем, что веб готов к использованию искусственного интеллекта\".
Однако я сомневаюсь, что большинство конкурентов Chrome захотят делать ставку исключительно на модели искусственного интеллекта Google. Более логичным представляется предоставить браузерам - и разработчикам - возможность запускать модель по своему выбору. Google, очевидно, предпочтет использовать Gemini для своих приложений, но эти модели достаточно компактны, чтобы позволить разработчикам выбирать ту, которая больше подходит для их приложений.
Ставка Google, тем не менее, заключается в предоставлении в Chrome ряда высокоуровневых API для перевода, подписи и транскрибирования текста в браузере с использованием своих моделей Gemini.
\"Чтобы реализовать эту функцию, мы тонко настроили нашу наиболее эффективную версию Gemini и оптимизировали Chrome\", - сказал Далке во время сегодняшнего разработчиккого доклада на Google I/O. \"Теперь мы хотим предоставить вам доступ к моделям Gemini в Chrome. Наша цель - предоставить вам наиболее мощные модели искусственного интеллекта в Chrome для достижения миллиардов пользователей, не беспокоясь о создании обработки данных, настройке, мощности и стоимости. Вам нужно только вызвать несколько высокоуровневых API - перевод, подпись, транскрибирование. Это большой сдвиг для веба, и мы хотим сделать его верным\".
Для разработчиков Google теперь также использует встроенную модель Gemini Nano для реализации новых функций в консоли инструментов разработки Chrome. Благодаря этому средства разработки Chrome теперь могут объяснять ошибки и предоставлять решения для отладки прямо в консоли.
Мы запускаем информационный бюллетень об искусственном интеллекте! Подпишитесь здесь, чтобы начать получать его в свои почтовые ящики 5 июня.