Специалист по компьютерному зрению в команду распознавания документов

29 Октября

Партнерские Вакансии

Город:

Новосибирск

Занятость:

Полная занятость

Компания "МКК Страна Экспресс"

О команде:

Наша команда состоит из 10 инженеров компьютерного зрения, распределенных по всей России, с основными ячейками в Новосибирске, Томске и Санкт-Петербурге. Основной продукт команды - сервис по распознаванию документов для нужд финтеха.

Основные задачи команды:

  • Разработка и поддержка систем классификации, сегментации, оценки качества и OCR на базе нейронных сетей.
  • Создание и ускорение моделей для развертывания на серверах и запуска на мобильных устройствах.
  • Развитие инфраструктуры и анализ метрик на бою.
  • Непосредственное участие в генерации идей для улучшения сервисов вместе с бизнесом.

Сейчас мы активно ищем людей, которые помогут автоматизировать пайплайн обучения моделей и обработки данных для ускорения процессов в команде. Помимо инфраструктурного развития мы также стремимся технически развивать и оптимизировать наши сервисы, внедряя новые подходы и инструменты.

Чем предстоит заниматься

  • Выстраивать, оптимизировать и автоматизировать пайплайны обучения и тестирования моделей компьютерного зрения.
  • Разрабатывать инструменты для автоматического сбора предобработки и аннотирования данных.
  • Оптимизировать процесс взаимодействия с командой разметки для улучшения качества данных
  • Создавать новые и развивать текущие внутренние инструменты для аналитики работоспособности сервиса.
  • Заниматься ускорением и улучшением сервиса распознавания документов.

Требования

  • Опыт работы: от 2 лет в качестве ML Engineer или в схожей области.
  • Знание Python: Профессиональное владение языком Python. Это включает:
    • Глубокое понимание синтаксиса, семантики и базовых структур данных языка (списки, словари, множества).
    • Знание и умение применять парадигмы ООП: классы, объекты, наследование, полиморфизм.
    • Опыт работы с модулями и пакетами, понимание импорта и пространства имен.
    • Знание базовых алгоритмов и структур данных: сортировка, поиск, деревья, графы.
    • Умение работать с менеджером зависимостей Poetry: создание виртуальных сред, управление пакетами, создание spec-файла.
  • Работа с данными и анализ:
    • NumPy: умение работать с массивами данных, в частности: создание и манипуляция, изменение шейпа, индексирование и срезы, базовые алгебраические операции, каст данных в разные типы.
    • Понимание основных статистических показателей: среднее значение, медиана, стандартное отклонение, квантили.
    • Опыт работы с метриками: умение рассчитывать метрики, релевантные для задач машинного обучения (точность, полнота, F1-score, AUC).
    • Pandas для анализа данных: умение сортировать, группировать, фильтровать и создавать сводные таблицы на основании таблиц.
    • Визуализация данных: библиотеки визуализации (matplotlib, seaborn) для построения графиков и диаграмм по результатам анализа.
  • PyTorch:
    • Глубокое понимание фреймворка PyTorch и его основных компонентов: тензоры, вычисления градиентов, функции активации, операции с тензорами, оптимайзеры и даталоудеры.
    • Знание задач компьютерного зрения и основных бейзлайнов: object detection, image classification, image segmentation, OCR
    • Умение самостоятельно писать модули с нейронными сетями: слои, функции активации, архитектуры сетей.
    • Умение создавать собственные классы датасетов:
      • Написание классов для работы с собственными типами данных.
      • Использование различных семплеров (WeightedRandomSampler, RandomSampler etc.).
  • Computer Vision:
    • Библиотеки openCV и PIL для работы с изображениями
    • Умение применять аффинные преобразования к изображениям (повороты, масштабирование, сдвиги)
    • Опыт работы с фильтрами для обработки изображений (blur, sharpen, edge detection)

Будет плюсом

  • Опыт использования фреймворка PyTorch-Lightning для обучения моделей PyTorch.
  • Опыт работы с Apache Airflow для автоматизации и управления потоками данных.
  • Знание платформы LabelStudio для аннотации данных.
  • Опыт обучения и портирования нейронных сетей на мобильных устройствах.
  • Знание принципов контейнеризации и умение создавать Docker-образы для моделей машинного обучения.

Мы предлагаем:

  • Понятная траектория роста (performance review, карьерные консультации, индивидуальная карта развития и т.д.)
  • Обучение и развитие за счёт ресурсов компании (Учебный центр, корпоративная библиотека, оплата внешнего обучения)
  • Социальный пакет (ДМС с первого рабочего дня, скидки от партнёров, детская программа, поддержка спорта и т.д.)
  • Насыщенная корпоративная жизнь (радио, подкасты, кибертурнир, собственные мероприятия и участие в крупных событиях отрасли)
  • Возможность быть наставником, автором корпоративного блога, спикером – каждый выбирает то, что подходит именно ему
  • Официальное трудоустройство с первого дня, полностью белая зарплата.

Рассматриваем резюме от кандидатов из любого региона. Можно работать удаленно или из регионального офиса компании.

Похожие вакансии

13 Ноября

Главный специалист группы развития АБС

Новосибирск

Компания "Heaad" Ищем специалиста в группу развитие банковских продуктов на базе автоматизированной банковской системы (АБС). Мы ищем...

Отправить резюме подробнее

14 Ноября

Старший специалист по обеспечению безопасных условий и охраны труда( Tele2 )

Новосибирск

Компания "Tele2" Что нужно делать: Организовывать функционирование системы управления охраной труда (СУОТ): Разрабатывать необходимую...

Отправить резюме подробнее

14 Ноября

Технический специалист\Сервисный инженер\Сборщик ПК

Новосибирск

от 50 000 руб.

Компания "СИТИЛИНК" Действует акция приведи друга и получи денежное вознаграждение 10 000 рублей! Мы предлагаем: Официальное...

Отправить резюме подробнее

14 Ноября

Специалист по количественным исследованиям (junior/middle)

Новосибирск

Компания "Yandex Crowd" Какие задачи вас ждут: вы будете проводить исследования, самостоятельно или под кураторством старшего коллеги:...

Отправить резюме подробнее

15 Ноября

QAA-инженер в команду Поиск

Новосибирск

Компания "2ГИС" Мы — команда, которая создает алгоритм поиска для всех продуктов 2ГИС. Помогаем миллионам наших пользователей быстро и точно...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: