Александр Кручинин

Новые методы «особых точек» (features) на изображении и LightGlue

22.04.202422.04.2024 Александр Кручинин ALIKED, features, LightGlue, особые точки

«Особые точки», особенности или features используются в компьютерном зрении достаточно давно, в том числе и в OpenCV, в котором они первоначально Читать далее

Фреймворки машинного обучения

OpenVINO C++ развертывание моделей детектирования объектов

03.04.202403.04.2024 Александр Кручинин ONNX, OpenVINO, детектирование объектов

Что такое OpenVINO OpenVINO — это набор инструментов с открытым исходным кодом для оптимизации и развертывания моделей искусственного интеллекта. Поддерживаемое оборудование: Читать далее

Компьютерное зрение

iANPR2 — SDK для распознавания автомобильных номеров. Быстрое развертывание

13.03.202413.03.2024 Александр Кручинин iANPR SDK, iANPR2, распознавание автомобильных номеров

Что такое iANPR2 iANPR 2 – это комплект средств разработки для распознавания автомобильных номеров второго поколения. Изначально разрабатывалась для возможности Читать далее

Компьютерное зрение

Первый взгляд на модель мира Yolo (YOLO-World)

20.02.202420.02.2024 Александр Кручинин YOLO-World, Yolov8, Zero-Shot

31 января 2024 года была выпущена модель YOLO-World — модель обнаружения объектов с открытым словарем в реальном времени. Git: https://github.com/AILab-CVC/YOLO-World Аннотация Читать далее

Глубокие нейронные сети

Обучение PP-PicoDet для детектирования объектов

08.02.2024 Александр Кручинин Object Detection, picodet, PP-PicoDet, детектирование объектов

Что это за модель PicoDet — это модель для слабых вычислительных систем, которая заявляется, как более качественная и быстрая альтернатива Читать далее

Сопутствующие технологии

NVIDIA Triton Inference Server — запуск на Ubuntu

22.01.202422.01.2024 Александр Кручинин MMYOLO, triton inference server

NVIDIA Triton Inference Server представляет собой веб-сервер, на котором запускаются модели распознавания образов. Доступ через http(s) и возможен через GRPC. Читать далее

Компьютерное зрение

Тренировка модели RTMDet в MMDetection и MMYOLO

25.08.202325.08.2023 Александр Кручинин MMDetection, MMYOLO, RTMDet, детектирование объектов

RTMDet — является современной моделью компьютерного зрения, которую можно применять для детектирования объектов (Rect и RotatedRect) и сегментации. Реализация пока Читать далее

Компьютерное зрение

Замена объектов на изображении с использованием Stable Diffusion, SAM и Grounding DINO

12.08.2023 Александр Кручинин SAM, Stable Diffusion, замена объектов

Современные технологии компьютерного зрения и генерации изображений позволяют обычному пользователю (немного разбирающемуся как использовать Google colab) заменять части объектов на Читать далее

Глубокие нейронные сети

Классификация видео с использованием CNN-RNN

24.07.202324.07.2023 Александр Кручинин CNN-RNN, video classification

Классификация видео является важной задачей, конечным итогом которой является понимание того, что происходит на видеоданных. Здесь https://keras.io/examples/vision/video_classification/ описан простой метод Читать далее

Глубокие нейронные сети

Распознавание языка жестов, LSTM и ragged tf.Dataset

29.05.202329.05.2023 Александр Кручинин LSTM, ragged tf.Dataset, распознавания языка жестов

Какое-то время назад на Kaggle проходило соревнование по распознаванию языка жестов: https://www.kaggle.com/competitions/asl-signs Собственно были размеченные данные со скелетом человека, лицом и Читать далее

← Назад

Recog.ru

Автор: Александр Кручинин

Новые методы «особых точек» (features) на изображении и LightGlue

OpenVINO C++ развертывание моделей детектирования объектов

iANPR2 — SDK для распознавания автомобильных номеров. Быстрое развертывание

Первый взгляд на модель мира Yolo (YOLO-World)

Обучение PP-PicoDet для детектирования объектов

NVIDIA Triton Inference Server — запуск на Ubuntu

Тренировка модели RTMDet в MMDetection и MMYOLO

Замена объектов на изображении с использованием Stable Diffusion, SAM и Grounding DINO

Классификация видео с использованием CNN-RNN

Распознавание языка жестов, LSTM и ragged tf.Dataset