Project Astra — это исследовательский прототип универсального AI-ассистента от Google DeepMind, который понимает речь и визуальное окружение в реальном времени, проактивно помогает и выполняет действия от имени пользователя, работая на телефоне и прототипе очков. Решает проблему фрагментированного и реактивного взаимодействия с AI, создавая по-настоящему мультимодального, контекстно-осведомленного компаньона, который предугадывает потребности и действует в экосистеме Google.
Ключевые особенности: Мультимодальное понимание в реальном времени: Одновременно обрабатывает видео- и аудиопоток, понимая объекты, речь и окружение, и реагирует без задержек, игнорируя фоновый шум и нерелевантные разговоры. Action Intelligence: Выполняет задачи от имени пользователя, используя Google Search, Gmail, Calendar и Maps — например, находит информацию, управляет расписанием и планирует маршруты. Проактивная помощь: AI сам инициирует диалог, когда это уместно, без явного запроса пользователя, опираясь на контекст происходящего. Agent Highlighting: Понимает объекты в поле зрения и подсвечивает важные элементы на экране, привлекая внимание пользователя к ключевой информации. Мультимодальная память и контекстный диалог: Интегрирует разные типы данных (видео, аудио, текст) и помнит ключевые детали прошлых взаимодействий для непрерывного, осмысленного общения. Кросс-девайсность: Работает на Android-телефонах и прототипе очков с общей памятью между устройствами, обеспечивая бесшовный переход. Персонализация: Обучается предпочтениям пользователя и способен объяснять ход своих рассуждений. Версия Visual Interpreter: Специальная интеграция с Aira для помощи людям с нарушениями зрения в навигации и описании окружения.
Для кого: Прототип ориентирован на широкий круг пользователей — от массового потребителя до людей с нарушениями зрения (через Visual Interpreter), а также на разработчиков и тестировщиков, заинтересованных в будущем универсальных AI-ассистентов от Google.
Сценарии использования: Повседневный проактивный ассистент: AI самостоятельно напоминает о встречах, предлагает маршруты с учетом пробок, ищет информацию по контексту разговора и помогает в бытовых задачах без явных команд. Помощь в навигации и описании окружения: Люди с нарушениями зрения используют версию Visual Interpreter для аудио-описания окружающей обстановки и безопасной навигации. Выполнение действий в экосистеме Google: Ассистент от имени пользователя работает с Gmail, Calendar и Maps, управляя расписанием, отправляя сообщения и планируя поездки. Кросс-девайсное взаимодействие: Пользователи начинают диалог на телефоне и продолжают его на очках, сохраняя полный контекст и историю взаимодействия.
Цены и доступность: Project Astra находится в статусе исследовательского прототипа. Доступ предоставляется бесплатно через список ожидания (waitlist) на сайте Google DeepMind. Тестируется ограниченным числом пользователей. Часть технологий уже интегрирована в Gemini Live для Android. Конкретные сроки публичного запуска и возможные тарифы не раскрыты — уточняются на официальном сайте.