MVP в открытом доступе

Жестовый язык,
понятный всем.

DACTIL — AI-переводчик казахского и русского жестового языка. Покажи жест в камеру — приложение переведёт его в текст за миллисекунды.

✓ Работает в браузере✓ Без регистрации✓ iOS приложение
AI-Перевод
Результат · 91%
привет
1000
распознаваемых жестов РЖЯ
59%
top-1 точность на новых пользователях
20 400
обучающих видео в датасете
5 мс
время распознавания на CPU

Что умеет DACTIL

Шесть ключевых возможностей, делающих жестовый язык доступным.

🤚

AI-распознавание жестов

Нейросеть SPOTER на трансформерах различает 1000 слов РЖЯ в реальном времени через камеру телефона.

🎯

Высокая точность

59% top-1 / 85% top-5 на тестовом датасете Slovo — лучшие показатели среди открытых русскоязычных моделей.

👤

Личный словарь

Не нашёл нужный жест? Запиши его сам за 5 секунд — модель сразу его выучит без переобучения.

Работает на CPU

Модель 8 МБ, инференс 5 мс. Работает на iPhone без облака и без задержек.

🌐

Дактиль + РЖЯ + Мимика

Три режима: побуквенный дактильный алфавит, жесты-слова и расширенный с мимикой и позой.

🔓

Открытый код

Архитектура нейросети, training pipeline и веб-приложение — open source. Любой исследователь может улучшить.

Как работает распознавание

Современный pipeline из 5 этапов — от кадра камеры до перевода в текст.

1

Захват кадра

Браузер или приложение получает видео с камеры на 20 fps.

2

MediaPipe extract

Из каждого кадра извлекаются 21 ключевая точка руки (плюс лицо и поза в Holistic-режиме).

3

Буфер 32 кадра

При нажатии кнопки записи накапливаются ключевые точки за ~1.5 секунды.

4

SPOTER инференс

Нейросеть-трансформер (2M параметров) обрабатывает последовательность и выдаёт топ-5 кандидатов.

5

Перевод + TTS

Результат отображается на экране и озвучивается через Web Speech API.

Технологии

Современный стек, open-source, edge-first архитектура.

Next.js 16
Frontend
MediaPipe
Computer vision
PyTorch + ONNX
ML
FastAPI
Backend
Vercel + Fly.io
Hosting
Capacitor
iOS / Android

Roadmap

Путь от MVP к полноценной экосистеме доступности.

Q1 2026
MVP запущен
Базовая модель SPOTER, веб-приложение, поддержка 52 жестов.
Q2 2026
v4 → 59% top-1
Pretraining на WLASL (ASL), расширение до 1000 жестов РЖЯ, iOS приложение.
Q3 2026
Holistic + Continuous
Мимика и поза, потоковое распознавание без кнопки.
Q4 2026
КЖЯ корпус
Сбор и обучение на казахском жестовом языке.
2027
Реальные переводчики
Видеозвонок с живым сурдопереводчиком 24/7, интеграция Enbek.kz.

Попробуй прямо сейчас

Работает в любом современном браузере. Бесплатно. Без регистрации.

Открыть переводчик →