Новые методы «особых точек» (features) на изображении и LightGlue

«Особые точки», особенности или features используются в компьютерном зрении достаточно давно, в том числе и в OpenCV, в котором  они первоначально Читать далее

OpenVINO C++ развертывание моделей детектирования объектов

Что такое OpenVINO OpenVINO — это набор инструментов с открытым исходным кодом для оптимизации и развертывания моделей искусственного интеллекта.  Поддерживаемое оборудование: Читать далее

iANPR2 — SDK для распознавания автомобильных номеров. Быстрое развертывание

Что такое iANPR2 iANPR 2 – это комплект средств разработки для распознавания автомобильных номеров второго поколения. Изначально разрабатывалась для возможности Читать далее

Обучение PP-PicoDet для детектирования объектов

 Что это за модель PicoDet — это модель для слабых вычислительных систем, которая заявляется, как более качественная и быстрая альтернатива Читать далее

Тренировка модели RTMDet в MMDetection и MMYOLO

RTMDet — является современной моделью компьютерного зрения, которую можно применять для детектирования объектов (Rect и RotatedRect) и сегментации. Реализация пока Читать далее

Замена объектов на изображении с использованием Stable Diffusion, SAM и Grounding DINO

Современные технологии компьютерного зрения и генерации изображений позволяют обычному пользователю (немного разбирающемуся как использовать Google colab) заменять части объектов на Читать далее

Классификация видео с использованием CNN-RNN

Классификация видео  является важной задачей, конечным итогом которой является понимание того, что происходит на видеоданных.  Здесь https://keras.io/examples/vision/video_classification/ описан простой метод Читать далее

Распознавание языка жестов, LSTM и ragged tf.Dataset

Какое-то время назад на Kaggle проходило соревнование по распознаванию языка жестов: https://www.kaggle.com/competitions/asl-signs Собственно были размеченные данные со скелетом человека, лицом и Читать далее