Data Scientist (STT-системы)

01 Августа

от 200 000 руб.

Партнерские Вакансии

Город:

Новосибирск

Занятость:

Полная занятость

Компания "ROBOTMIA"

Привет!
Robotmia – продуктовая IT-компания, специализирующаяся на технологиях машинного обучения, искусственного интеллекта и понимания естественного языка. На рынке больше 7 лет и каждый год растет минимум в 2 раза.

Мы - сильное окружение из умных и приятных людей.
Наша команда ежедневно создает рабочее пространство, где каждый чувствует себя, как часть единого целого. Мы ценим самореализацию и инновации. У нас есть все возможности для раскрытия твоего потенциала, работая в команде профессионалов.

Основные продукты – "Голосовой ассистент" и "Модуль определения автоответчиков". С их помощью наши клиенты кратно увеличивают качество обслуживания своих пользователей и в разы сокращают расходы. А с операторов call-центров снимают скучную и рутинную работу.

Мы ищем Data Scientist для разработки и улучшения Speech-to-Text (STT) систем. Вам предстоит работать с обработкой аудиоданных, обучением и оптимизацией моделей распознавания речи, а также интеграцией решений в продукты компании.

Чем предстоит заниматься:

- Разработка, обучение и оптимизация нейросетевых моделей для распознавания речи

- Улучшение качества STT-моделей (метрики WER, CER), адаптация под разные акценты и шумные условия

- Оптимизация производительности модели для production (уменьшение задержек, сжатие моделей, квантование)

- Подготовка и обработка речевых данных (чистка, аугментация). Работа с речевыми датасетами

- Адаптация opensource-решений под текущие задачи

- Анализ ошибок модели и доработка алгоритмов для повышения точности распознавания

- Взаимодействие с инженерами для развертывания STT-моделей в в production-среду

- Разработка и внедрение методов акустического и языкового моделирования

- Тестирование и сравнение различных подходов к распознаванию речи

Мы ожидаем от тебя:

- Опыт работы 2+ года в Data Science / Machine Learning

- Уверенное владение Python и библиотеками (PyTorch/TensorFlow, Hugging Face, librosa, pandas, Kaldi)

- Понимание архитектур нейросетей, применяемых в ASR (CTC, RNN, CNN, Transformer-based)

- Знание методов акустической обработки сигналов (MFCC, спектрограммы, фильтрация)

- Базовые знания Docker, Git, MLflow (или аналогов)

- Базовые знания Linux и скриптовой автоматизации (bash/shell)

Будет плюсом:

- Опыт работы с opensource ASR-фреймворками (Whisper, DeepSpeech, Wav2Vec, ESPnet, NeMo)

- Опыт работы с ускорением ML-моделей (ONNX, TensorRT, quantization)

- Опыт работы с датасетами (LibriSpeech, Common Voice и др.)

- Опыт работы с речевыми данными (аугментация, feature extraction, работа с датасетами)

- Понимание оценки качества моделей (WER, CER, BLEU)

- Знание C++ для оптимизации инференса

- Опыт работы с распределенным обучением (DDP, FSDP)

- Знание методов аугментации аудио (speed perturbation, noise injection, SpecAugment)

- Умение дообучать и адаптировать модели под разные языки / акценты

- Знание методов акустического моделирования и языковых моделей (N-gram, RNN-LM)

Мы предлагаем:

  • Стабильную зарплату 2 раза в месяц, отпуска и больничные;

  • Креативную команду, которая решает инновационные задачи;

  • Удобный офис в Академгородке (2 мин. от станции Сеятель), возможный гибридный формат работы.

Мы не корпорация, наша стратегия основана на доверии и долгосрочных отношениях. Нам важно, чтобы новый человек был ответственным, вовлеченным и не боялся сложных задач.

Похожие вакансии

31 Июля

Инженер по СКС (структурированные кабельные системы)

Новосибирск

Компания "СофтМолл" SoftMall – это аккредитованная IT-компания, крупнейший системный интегратор и один из ведущих центров компетенций в сфере...

Отправить резюме подробнее

31 Июля

Junior Data Scientist (Стажер)

Новосибирск

Компания "Центр финансовых технологий" Приглашаем начинающих специалистов, которые хотят начать карьеру в команде ML, в бесплатный проект ШИФТ....

Отправить резюме подробнее

30 Июля

Дата аналитик/Data Scientist

Новосибирск

Компания "Центр финансовых технологий" Приглашаем в команду машинного обучения специалистов в области классического ML. Команда...

Отправить резюме подробнее

30 Июля

Учитель технологии по беспилотным авиационным системам

Новосибирск

от 100 000 руб.

Компания "МБОУ Лицей №22" Требования: высшее педагогическое образование, опыт работы Обязанности: ведение занятий (уроки и внеурочная...

Отправить резюме подробнее

26 Июля

Data Engineer

Новосибирск

Компания "Гипермаркет Самбери" Сеть гипермаркетов "Самбери" - самая известная, инновационная и мультиформатная сеть Дальнего Востока. Если...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: