Data Scientist (STT-системы)
01 Августа 2025
от 200 000 руб.

Город:
Новосибирск
Занятость:
Полная занятость
Компания "ROBOTMIA"
Привет!
Robotmia – продуктовая IT-компания, специализирующаяся на технологиях машинного обучения, искусственного интеллекта и понимания естественного языка. На рынке больше 7 лет и каждый год растет минимум в 2 раза.
Мы - сильное окружение из умных и приятных людей.
Наша команда ежедневно создает рабочее пространство, где каждый чувствует себя, как часть единого целого. Мы ценим самореализацию и инновации. У нас есть все возможности для раскрытия твоего потенциала, работая в команде профессионалов.
Основные продукты – "Голосовой ассистент" и "Модуль определения автоответчиков". С их помощью наши клиенты кратно увеличивают качество обслуживания своих пользователей и в разы сокращают расходы. А с операторов call-центров снимают скучную и рутинную работу.
Мы ищем Data Scientist для разработки и улучшения Speech-to-Text (STT) систем. Вам предстоит работать с обработкой аудиоданных, обучением и оптимизацией моделей распознавания речи, а также интеграцией решений в продукты компании.
Чем предстоит заниматься:
- Разработка, обучение и оптимизация нейросетевых моделей для распознавания речи
- Улучшение качества STT-моделей (метрики WER, CER), адаптация под разные акценты и шумные условия
- Оптимизация производительности модели для production (уменьшение задержек, сжатие моделей, квантование)
- Подготовка и обработка речевых данных (чистка, аугментация). Работа с речевыми датасетами
- Адаптация opensource-решений под текущие задачи
- Анализ ошибок модели и доработка алгоритмов для повышения точности распознавания
- Взаимодействие с инженерами для развертывания STT-моделей в в production-среду
- Разработка и внедрение методов акустического и языкового моделирования
- Тестирование и сравнение различных подходов к распознаванию речи
Мы ожидаем от тебя:
- Опыт работы 2+ года в Data Science / Machine Learning
- Уверенное владение Python и библиотеками (PyTorch/TensorFlow, Hugging Face, librosa, pandas, Kaldi)
- Понимание архитектур нейросетей, применяемых в ASR (CTC, RNN, CNN, Transformer-based)
- Знание методов акустической обработки сигналов (MFCC, спектрограммы, фильтрация)
- Базовые знания Docker, Git, MLflow (или аналогов)
- Базовые знания Linux и скриптовой автоматизации (bash/shell)
Будет плюсом:
- Опыт работы с opensource ASR-фреймворками (Whisper, DeepSpeech, Wav2Vec, ESPnet, NeMo)
- Опыт работы с ускорением ML-моделей (ONNX, TensorRT, quantization)
- Опыт работы с датасетами (LibriSpeech, Common Voice и др.)
- Опыт работы с речевыми данными (аугментация, feature extraction, работа с датасетами)
- Понимание оценки качества моделей (WER, CER, BLEU)
- Знание C++ для оптимизации инференса
- Опыт работы с распределенным обучением (DDP, FSDP)
- Знание методов аугментации аудио (speed perturbation, noise injection, SpecAugment)
- Умение дообучать и адаптировать модели под разные языки / акценты
- Знание методов акустического моделирования и языковых моделей (N-gram, RNN-LM)
Мы предлагаем:
-
Стабильную зарплату 2 раза в месяц, отпуска и больничные;
-
Креативную команду, которая решает инновационные задачи;
-
Удобный офис в Академгородке (2 мин. от станции Сеятель), возможный гибридный формат работы.
Мы не корпорация, наша стратегия основана на доверии и долгосрочных отношениях. Нам важно, чтобы новый человек был ответственным, вовлеченным и не боялся сложных задач.
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
11 Июля
Frontend-разработчик( Информационные системы и сервисы )
Новосибирск
от 70 000 руб.
Компания "Информационные системы и сервисы" Мы - Информационные системы и сервисы. Наша компания создает цифровые сервисы для государственного...
22 Июля
Специалист по развитию производственной системы
Новосибирск
от 65 000 руб.
Компания "Новосибирский приборостроительный завод («НПЗ»)" АО "Новосибирский приборостроительный завод" (АО "НПЗ") ищет кандидата на должность...
17 Июля
Новосибирск
Компания "Иннотехнум, Группа компаний" В команду Геомоделирования и клиентской аналитики ищем себе коллегу DS для разработки моделей...
31 Июля
Инженер по СКС (структурированные кабельные системы)
Новосибирск
Компания "СофтМолл" SoftMall – это аккредитованная IT-компания, крупнейший системный интегратор и один из ведущих центров компетенций в сфере...
31 Июля
Junior Data Scientist (Стажер)
Новосибирск
Компания "Центр финансовых технологий" Приглашаем начинающих специалистов, которые хотят начать карьеру в команде ML, в бесплатный проект ШИФТ....
Вакансия размещена в отрасли