Тренировка модели RTMDet в MMDetection и MMYOLO

RTMDet — является современной моделью компьютерного зрения, которую можно применять для детектирования объектов (Rect и RotatedRect) и сегментации. Реализация пока Читать далее

Замена объектов на изображении с использованием Stable Diffusion, SAM и Grounding DINO

Современные технологии компьютерного зрения и генерации изображений позволяют обычному пользователю (немного разбирающемуся как использовать Google colab) заменять части объектов на Читать далее

Классификация видео с использованием CNN-RNN

Классификация видео  является важной задачей, конечным итогом которой является понимание того, что происходит на видеоданных.  Здесь https://keras.io/examples/vision/video_classification/ описан простой метод Читать далее

Распознавание языка жестов, LSTM и ragged tf.Dataset

Какое-то время назад на Kaggle проходило соревнование по распознаванию языка жестов: https://www.kaggle.com/competitions/asl-signs Собственно были размеченные данные со скелетом человека, лицом и Читать далее

Изменение шага learning rate в TensorFlow Keras

Для сходимости к лучшему результату при обучении одним из ключевых параметров является learning_rate, который говорит оптимизатору на каждом шаге сдвинутся на Читать далее

Keras модели внимания для компьютерного зрения

В репозитории https://github.com/leondgarse/keras_cv_attention_models  представлены модели нейронных сетей на базе внимания (в основном Трансформеры) для задач компьютерного зрения для фреймворка Keras. Репозиторий Читать далее

Next-ViT: Трансформер машинного зрения следующего поколения для эффективного развертывания в реалистичных промышленных сценариях

GitHub: https://github.com/bytedance/Next-ViT Статья: https://arxiv.org/pdf/2207.05501.pdf Основная цель разработки модели Next-ViT — это создание такой модели на основе Трансформера, которая бы превосходила модели CNN. Известно, Читать далее

ConvNeXt V2: Совместное проектирование и масштабирование ConvNet с маскированными автоэнкодерами

ConvNeXt V2 — это новое семейство моделей, основанное на полностью свёрточном каркасе автокодировщика с масками (FCMAE) и новом уровне глобальной Читать далее

Нарезки (Slicing) в Python списках и Numpy

Нарезка — это расширение синтаксиса индексации с использованием квадратных скобок. Она широко используется для доступа к диапазонам (интервалам) элементов. Простой Читать далее