Обучение PP-PicoDet для детектирования объектов

 Что это за модель PicoDet — это модель для слабых вычислительных систем, которая заявляется, как более качественная и быстрая альтернатива Читать далее

Тренировка модели RTMDet в MMDetection и MMYOLO

RTMDet — является современной моделью компьютерного зрения, которую можно применять для детектирования объектов (Rect и RotatedRect) и сегментации. Реализация пока Читать далее

Замена объектов на изображении с использованием Stable Diffusion, SAM и Grounding DINO

Современные технологии компьютерного зрения и генерации изображений позволяют обычному пользователю (немного разбирающемуся как использовать Google colab) заменять части объектов на Читать далее

Классификация видео с использованием CNN-RNN

Классификация видео  является важной задачей, конечным итогом которой является понимание того, что происходит на видеоданных.  Здесь https://keras.io/examples/vision/video_classification/ описан простой метод Читать далее

Распознавание языка жестов, LSTM и ragged tf.Dataset

Какое-то время назад на Kaggle проходило соревнование по распознаванию языка жестов: https://www.kaggle.com/competitions/asl-signs Собственно были размеченные данные со скелетом человека, лицом и Читать далее

Изменение шага learning rate в TensorFlow Keras

Для сходимости к лучшему результату при обучении одним из ключевых параметров является learning_rate, который говорит оптимизатору на каждом шаге сдвинутся на Читать далее

Keras модели внимания для компьютерного зрения

В репозитории https://github.com/leondgarse/keras_cv_attention_models  представлены модели нейронных сетей на базе внимания (в основном Трансформеры) для задач компьютерного зрения для фреймворка Keras. Репозиторий Читать далее