Verb: AI-платформа для языковой практики в мобильном приложении
Категория: EdTech, AI SaaS, мобильное приложение
Разработка: ASR/LLM/TTS-пайплайн, голосовая практика, новые слова, персональный план и ИИ-помощник.
6 моделей
Мультимодельный контур для английского и арабского: распознавание речи, генерация ответа и синтез речи.10 000+
AI-взаимодействий в сутки: голосовые запросы, проверка речи, подсказки и генерация диалогов.2 языка
Английский и арабский работают с разными учебными сценариями и модельными настройками.Обзор проекта
Verb — мобильное приложение и AI SaaS-платформа для изучения английского и арабского языков. Пользователь получает маршрут после диагностики, практикует новые слова, проходит уроки и обращается к ИИ-помощнику между занятиями с преподавателем.
Внутри кейса важно не только то, как выглядят экраны. Мы собирали мультимодельный AI-пайплайн: распознавание речи, языковая модель, синтез ответа, проверка произношения, генерация диалогов и асинхронная обработка задач.
Вызов и решение
Образовательное приложение легко перегрузить: диагностика, тарифы, уроки, новые слова и ИИ начинают конкурировать между собой. Сложнее всего было спрятать инженерную сложность AI-пайплайна за коротким учебным действием: сказал фразу, получил проверку, понял ошибку, продолжил практику.
Визуальная система опирается на фирменный градиент Verb, крупные карточки и понятные действия, а технический слой обрабатывает речь, контекст урока, генерацию ответа и возврат результата без ощущения тяжелого сервиса.
Какие механики сделали
Мы собирали приложение вокруг учебного AI-цикла. Важны не только экраны, но и то, что происходит после действия пользователя: голос попадает в распознавание, ответ проходит через модель, подсказка возвращается в интерфейс, а тяжелые операции обрабатываются асинхронно.
Отзыв
Заказчик дал обратную связь после презентации приложения: важно было показать, что Verb не открывает пользователю обычный чат, а ведет его через голосовую практику, проверку речи и понятный ответ ИИ-помощника.
Отзыв о работе над проектом
Спасибо компании AppFox за работу над Verb. Команда помогла связать мобильный интерфейс, голосовую практику и AI-пайплайн в один учебный сценарий: ученик говорит, получает проверку, видит объяснение и возвращается к занятиям. Нам было важно, чтобы ИИ-помощник выглядел не отдельным экспериментом, а естественной частью обучения между уроками.
Этапы разработки
Процесс строился вокруг учебного AI-цикла: ученик проходит диагностику, получает маршрут, говорит или отвечает в приложении, система распознает речь, генерирует подсказку и возвращает его к следующему упражнению.
Результаты
Получилась AI-платформа, в которой приложение отвечает не только за красивые экраны. За каждым учебным действием стоит модельный контур: речь распознается, ответ генерируется с учетом уровня, подсказка озвучивается, а тяжелые задачи уходят в асинхронную обработку.
Отдельные модели и настройки для английского и арабского сценариев.
Пользовательских AI-взаимодействий в сутки в расчетном сценарии.
Распознавание речи и озвучивание ответа внутри учебного цикла.
Генерация ответов и объяснений под уровень ученика и контекст урока.
Production-контур для вычислений, хранения, очередей и CI/CD.
Асинхронные задачи для inference, аудио и повторных попыток.
Калькулятор AppFox
Для AI-приложения считаем не только загрузки, а регулярность учебных действий и нагрузку на модельный контур: сколько учеников возвращаются к словам, голосовым запросам и подсказкам помощника между занятиями.
Ученики, которые проходят обучение и используют приложение.
Расчетный рост регулярных учебных сессий.
Потенциальные дополнительные возвращения к приложению.
Технологии
которые мы используем
Стек подбирается под мобильный продукт и AI-платформу: интерфейс, клиентская логика, API, мультимодельный пайплайн, очереди, inference и production-инфраструктура.
- UIFigma
- APPMobile app
- APIREST API
- ASRSpeech-to-text
- LLMDialogue models
- TTSSpeech synthesis
- MLML inference
- QUEUEAsync jobs
- AWSInfra
- CICI/CD
- DATAAnalytics
FAQ
Это просто интерфейс к OpenAI?
Нет. В кейсе показан мультимодельный AI-пайплайн: ASR для речи, LLM для ответов и диалогов, TTS для озвучки, отдельные сценарии для английского и арабского, fine-tuning и prompt engineering.
Какая нагрузка учитывалась?
Платформа проектировалась под 10 000+ AI-взаимодействий в сутки: голосовые запросы, проверку речи, генерацию ответов и обработку учебных событий.
Зачем приложению очереди задач?
Распознавание речи, генерация ответа и синтез могут выполняться асинхронно. Очереди помогают обрабатывать тяжелые задачи, повторные попытки и стабильную выдачу результата.
Все ли изображения использованы?
Да. В страницу добавлены все 30 изображений из переданной папки: вертикальные экраны и широкие презентационные макеты.



Все экраны приложения
Ниже собраны остальные вертикальные экраны из проекта. Их можно открыть в полном размере: для мобильного приложения важно видеть не только обложку, но и весь набор состояний, из которых собирается продукт.