Компания Google в понедельник тихо выпустила офлайн-приложение для диктовки под названием «Google AI Edge Eloquent» на iOS. Оно позиционируется как конкурент таким сервисам, как Wispr Flow, SuperWhisper и Willow.
Приложение бесплатно для загрузки. После скачивания моделей автоматического распознавания речи на базе Gemma пользователи могут начать диктовать текст прямо на телефоне.
Основные функции
В приложении отображается живая транскрипция речи. При нажатии на паузу оно автоматически фильтрует слова-паразиты, такие как «эм» и «а», и полирует текст.
Под транскрипцией доступны опции для преобразования текста:
- Ключевые моменты
- Формальный
- Короткий
- Длинный
Пользователи могут отключить облачный режим, чтобы использовать только локальную обработку данных — в этом случае приложение полагается на модели Gemma. При включённом облачном режиме для очистки текста задействуются облачные модели Gemini.
Интеграция и персонализация
Google AI Edge Eloquent может импортировать определённые ключевые слова, имена и жаргонизмы из учётной записи Gmail, если это необходимо. Кроме того, пользователи могут добавлять собственные слова в список.
Приложение отображает:
- Историю сессий транскрипции с возможностью поиска по всем ним
- Слова, продиктованные в последней сессии
- Скорость речи в словах в минуту
- Общее количество произнесённых слов
Описание от компании
В описании приложения в App Store говорится: «Google AI Edge Eloquent — это продвинутое приложение для диктовки, созданное для преодоления разрыва между естественной речью и профессиональным, готовым к использованию текстом. В отличие от стандартного программного обеспечения для диктовки, которое дословно транскрибирует оговорки и слова-паразиты, Eloquent использует ИИ для улавливания вашего замысла. Оно автоматически редактирует „эмы“, „ахи“ и самокоррекции в середине предложения, выводя чистый и точный текст».
Доступность и перспективы
Хотя приложение в настоящее время доступно только на iOS, в описании App Store упоминается версия для Android. Согласно описанию, Eloquent предлагает «бесшовную интеграцию с Android», где его можно установить в качестве клавиатуры по умолчанию для системного доступа в любом текстовом поле.
Кроме того, приложение сможет использовать функцию плавающей кнопки, аналогичную той, что использует Wispr Flow на Android, для лёгкого доступа к транскрипции из любого места.
Контекст рынка
Приложения для транскрипции на базе ИИ набирают популярность среди пользователей по мере улучшения моделей преобразования речи в текст. С этим экспериментальным приложением Google присоединяется к тренду.
Если тест окажется успешным, улучшенные функции транскрипции могут появиться и в Android.