Keras модели внимания для компьютерного зрения

В репозитории https://github.com/leondgarse/keras_cv_attention_models  представлены модели нейронных сетей на базе внимания (в основном Трансформеры) для задач компьютерного зрения для фреймворка Keras. Репозиторий Читать далее

Next-ViT: Трансформер машинного зрения следующего поколения для эффективного развертывания в реалистичных промышленных сценариях

GitHub: https://github.com/bytedance/Next-ViT Статья: https://arxiv.org/pdf/2207.05501.pdf Основная цель разработки модели Next-ViT — это создание такой модели на основе Трансформера, которая бы превосходила модели CNN. Известно, Читать далее

ConvNeXt V2: Совместное проектирование и масштабирование ConvNet с маскированными автоэнкодерами

ConvNeXt V2 — это новое семейство моделей, основанное на полностью свёрточном каркасе автокодировщика с масками (FCMAE) и новом уровне глобальной Читать далее

Нарезки (Slicing) в Python списках и Numpy

Нарезка — это расширение синтаксиса индексации с использованием квадратных скобок. Она широко используется для доступа к диапазонам (интервалам) элементов. Простой Читать далее

Обнаружение повернутых объектов с помощью набора инструментов NVIDIA Object Detection Toolkit

Ссылка на оригинал статьи, откуда взята большая часть материала https://developer.nvidia.com/blog/detecting-rotated-objects-using-the-odtk/. В отдельных задачах при определении детектировании объектов необходимо знать его наклон. Читать далее

Yolo5 на примере задачи Help Protect the Great Barrier Reef

Введение Yolov5 является одной из самых эффективных решений для детектирования объектов на настоящий момент. Собственно подтверждение этому можно найти на Читать далее