Компания "ROBOTMIA"
Привет!
Robotmia – продуктовая IT-компания, специализирующаяся на технологиях машинного обучения, искусственного интеллекта и понимания естественного языка. На рынке больше 7 лет и каждый год растет минимум в 2 раза.
Мы - сильное окружение из умных и приятных людей.
Наша команда ежедневно создает рабочее пространство, где каждый чувствует себя, как часть единого целого. Мы ценим самореализацию и инновации. У нас есть все возможности для раскрытия твоего потенциала, работая в команде профессионалов.
Основные продукты – "Голосовой ассистент" и "Модуль определения автоответчиков". С их помощью наши клиенты кратно увеличивают качество обслуживания своих пользователей и в разы сокращают расходы. А с операторов call-центров снимают скучную и рутинную работу.
Мы ищем Data Scientist для разработки и улучшения Speech-to-Text (STT) систем. Вам предстоит работать с обработкой аудиоданных, обучением и оптимизацией моделей распознавания речи, а также интеграцией решений в продукты компании.
Чем предстоит заниматься:
- Разработка, обучение и оптимизация нейросетевых моделей для распознавания речи
- Улучшение качества STT-моделей (метрики WER, CER), адаптация под разные акценты и шумные условия
- Оптимизация производительности модели для production (уменьшение задержек, сжатие моделей, квантование)
- Подготовка и обработка речевых данных (чистка, аугментация). Работа с речевыми датасетами
- Адаптация opensource-решений под текущие задачи
- Анализ ошибок модели и доработка алгоритмов для повышения точности распознавания
- Взаимодействие с инженерами для развертывания STT-моделей в в production-среду
- Разработка и внедрение методов акустического и языкового моделирования
- Тестирование и сравнение различных подходов к распознаванию речи
Мы ожидаем от тебя:
- Опыт работы 2+ года в Data Science / Machine Learning
- Уверенное владение Python и библиотеками (PyTorch/TensorFlow, Hugging Face, librosa, pandas, Kaldi)
- Понимание архитектур нейросетей, применяемых в ASR (CTC, RNN, CNN, Transformer-based)
- Знание методов акустической обработки сигналов (MFCC, спектрограммы, фильтрация)
- Базовые знания Docker, Git, MLflow (или аналогов)
- Базовые знания Linux и скриптовой автоматизации (bash/shell)
Будет плюсом:
- Опыт работы с opensource ASR-фреймворками (Whisper, DeepSpeech, Wav2Vec, ESPnet, NeMo)
- Опыт работы с ускорением ML-моделей (ONNX, TensorRT, quantization)
- Опыт работы с датасетами (LibriSpeech, Common Voice и др.)
- Опыт работы с речевыми данными (аугментация, feature extraction, работа с датасетами)
- Понимание оценки качества моделей (WER, CER, BLEU)
- Знание C++ для оптимизации инференса
- Опыт работы с распределенным обучением (DDP, FSDP)
- Знание методов аугментации аудио (speed perturbation, noise injection, SpecAugment)
- Умение дообучать и адаптировать модели под разные языки / акценты
- Знание методов акустического моделирования и языковых моделей (N-gram, RNN-LM)
Мы предлагаем:
Стабильную зарплату 2 раза в месяц, отпуска и больничные;
Креативную команду, которая решает инновационные задачи;
Удобный офис в Академгородке (2 мин. от станции Сеятель), возможный гибридный формат работы.
Мы не корпорация, наша стратегия основана на доверии и долгосрочных отношениях. Нам важно, чтобы новый человек был ответственным, вовлеченным и не боялся сложных задач.
16 Августа
Новосибирск
от 90 000 до 200 000 руб.
Компания "DataWorks" DataWorks – разработчик продуктов для анализа данных и генерации отчетов. Мы являемся частью международной компании,...
10 Августа
PHP разработчик в команду Data mining( Drom )
Новосибирск
от 140 000 до 230 000 руб.
Компания "Drom" В настоящее время открыта вакансия backend-разработчика в команду “Data Mining”, которая занимается анализом больших данных по...
09 Августа
Новосибирск
Компания "Koronatech" Приглашаем в команду машинного обучения специалистов в области классического ML. Команда ML в Koronatech за 7 лет...
11 Августа
Главный технолог по автоматизированным системам
Новосибирск
Компания "Модульные Системы Торнадо" «Модульные Системы Торнадо» - ведущий российский разработчик и поставщик средств автоматизации, систем...
12 Августа
Менеджер проектных продаж (слаботочные системы)
Новосибирск
от 100 000 руб.
Компания "РУТЕК" Группа компаний Рутек начинает свою историю с 2008 года и на сегодня занимает лидирующие позиции на рынке систем безопасности...
Вакансия размещена в отрасли