Детектирование QR Code с помощью средств OpenCV

Распознавание двухмерных кодов является актуальной задачей, впрочем, уже решенной на ряде устройств и персональных компьютерах. Однако на настоящий момент отсутствуют BSD версии библиотек распознавания, а ограниченные лицензии в большинстве случаев не позволяют использовать открытые исходные кода для своих целей.
Популярный в Японии QrCode является одним из наиболее оптимальных кодов, хотя при малых размерах кода квадраты-мишени отнимают много места. На рисунке 1 приведен пример кода Qr с закодированной фразой «Test code».



( Читать дальше )
  • +2
  • 03 апреля 2011, 16:52
  • vidikon
  • 2

Статическое подключение OpenCV 1.1 к проекту в VC 2003

Задача, конечно, врятли актуальная. Поскольку большинство пользуется OpenCV более новых версий и более новые студии. Однако, возникла такая ситуация. Необходимо создать проект на visual studio 2003 с использованием некоторых средств OpenCV, которая была бы статически подключена. Первое — это то, что версии OpenCV, начиная с 2.0 отпадают, поскольку они предназначены только для работы, начиная с vs 2005. Второе — динамически все работает нормально, однако когда речь заходит о статической линковке возникает ряд проблем. Ниже описано, какие действия надо сделать, что откомпилировать и подключить статически OpenCV к вашему проекту в vs 2003.


( Читать дальше )

Бинаризация изображений

Бинаризация изображений, т.е. перевод полноцветного или в градациях серого изображения в монохромное, где присутствуют только два типа пикселей (темные и светлые) имеет большое значение при распознавании образов. Особенно это относится к бинарным объектам, таким, как штриховые коды, текст, чертежи и т.п. Существуют различные подходы к бинаризации, которые условно можно разделить на 2 группы:
  • пороговые;
  • адаптивные.


( Читать дальше )

Android + OpenCV

    Привет всем, сегодня я расскажу вам о сборке OpenCv для Android под управлением ОС Windows7.
    Перед началом сего процесса необходимо иметь:
  1. Android NDK; developer.android.com/sdk/ndk/index.html
  2. Android SDK; developer.android.com/sdk/index.html
  3. JDK (5 или 6); www.oracle.com/technetwork/java/javase/downloads/index.html
  4. SWIG(swigwin); www.swig.org/download.html
  5. Apache Ant; ant.apache.org/bindownload.cgi
  6. Make; gnuwin32.sourceforge.net/packages/make.htm
  7. Cmake; www.cmake.org/cmake/resources/software.html
  8. Svn клиент; sourceforge.net/projects/win32svn/


( Читать дальше )

Затачиваем OpenCV под QT на Windows: Компиляция OpenCV под QT, создание OpenCV проекта на QT



Привет, народ! Сегодня расскажу вам как компилировать OpenCV с поддержкой QT…


( Читать дальше )

Перенос блога

Блог «Распознавание образов для программистов», расположенный по адресу: blog.vidikon.com перенесен на recog.ru.
Старые записи доступны по адресу:
Старые записи

iANPR SDK 1.5

Вышла новая версия библиотеки распознавания автомобильных номеров iANPR SDK 1.5
Что нового:
— добавление большого количества типов номеров для Беларуси;
— добавление базового типа номеров Польши;
— добавление базового типа номеров Латвии;
— добавление базового типа номеров Эстонии;
— добавление базового типа номеров Литвы;
— добавление основных типов номеров Украины;
— добавление основных типов номеров Молдовы;
— добавление настраиваемого типа ANPR_CUSTOM_TYPE;
— возвращение всех типов номеров при флаге RETURN_TYPE_NUMBER;
— добавление флага NO_LOW_RELIABILITY для удаления номеров с низкой достоверностью;
— немного переработано определение ложных срабатываний;
— изменен цветовой фильтр выбора типа номера для цветных изображений;
— исправлены некоторые мелочи и ошибки.
Перейти на страницу продукта

Решение проблемы низкой FPS на некоторых USB камерах

Столкнулся с проблемой в Windows, что камеры на новых ноутбуках и некоторые новые камеры при разрешениях выше 640x480 дают низкое значение FPS использованием видеопотока OpenCV (неважно Си или Си++ интерфейс).
В моем случае было 3 камеры (2 внешние и одна ноутбука), которые ставили разрешение 1280x760, но только одна при этом давала 30 FPS, остальные две камеры давали значение 10 FPS.

Естественно первая идея — установить FPS с помощью CV_CAP_PROP_FPS, но оно не работает для камер. Тогда пришлось смотреть исходники OpenCV и выяснять в каких режимах работает камера.


( Читать дальше )

DataMatrix Windows FREE Reader

После распознавания кода происходит эмуляция нажатий клавиш клавиатуры (так работает часть сканеров бар-кодов), поэтому встроить данное решение в свое программное обеспечение не вызовет трудностей. Поскольку результат распознавания будет выдаваться в активное окно. Программа распознает код и с интервалом в 5 секунд эмулирует нажатие клавиш клавиатуры, передавая декодированную информацию (с символом конца строки в конце) в находящееся в фокусе окне.

Cкачать здесь:
http://intbusoft.com/download/products/DataMatrixReader.exe

Распознавание и слежение за знаком скорости

Распознавание знака скорости и слежение за ним. Все выполняется довольно быстро — на 1 ядре процессора AMD FX(tm)-6100 Six-Core выделенная зона распознается за 0.017с. (полное FullHD изображение где-то в среднем на одном ядре за 0.032с — но анализ всего изображения не нужен. Достаточно распознавать указанную область).

iANPR SDK 1.4

Вышла версия SDK для распознавания автомобильных номеров версии 1.4
Изменения:
— добавление распознавания двухстрочных номеров Российской Федерации;
— добавление возвращения типа номера для номеров Российской Федерации;
— исправление ошибок утечки памяти в функциях anprPlateMatRect и anprPlateMatRectXML.

Перейти к странице продукта

Контурный анализ - детектирование зашумленного бинарного объекта

Бинарный объект

Бинарный объект – это объект, созданный человеком, и находящийся в поле зрения камеры. К таким объектам относятся дорожные знаки, автомобильные номера, баркоды и т.п. Часто эти объект имеют контур, по которому они достаточно хорошо детектируются. Однако возникают ситуации, когда объекты серьезно наклонены к оси камеры в нескольких плоскостях, а при этом на них накладывается шум:

Здесь: (а) исходный объект, (б) искаженный объект в результате поворота к камере, (в) зашумленный объект
Для правильного распознавания объекта необходимо провести перспективное преобразование. Но для этого необходимо получить 4 точки бинарного объекта.
Цель данной публикации: определить 4 точки в зашумленном объекте изначальной прямоугольной формы.


( Читать дальше )

iANPR SDK 1.3 Linux

Вышла версия 1.3 iANPR SDK для Linux
Страница продукта:
http://intbusoft.com/rus/products/iANPR/
Страница скачивания:
http://ianpr.org/download.htm

Пример iANPRcapture_motion на C# для iANPR SDK

1 О предназначении программы

Программа iANPRcapture_motion_CShrp предназначена для демонстрации возможностей iANPR SDK в вычислении траектории движения автомобильного номера и детектирования пересечения номером заранее заданных линий, т.е. для демонстрации возможности реализации функционала детектирования въезда-выезда автомобилей с помощью iANPR SDK. Эта программа написана на языке C# и является аналогом программы iANPRcapture_motion, написанной на языке С++. Эти и другие примеры использования распространяются в составе iANPR SDK.

2 Пример использования

Пример работы программы показан в следующем ролике.




( Читать дальше )

iANPR SDK 1.3 Windows

Вышла новая версия iANPR SDK для Windows, что нового:
— добавлено распознавание базовых номеров Казахстана, Туркменистана, грузовых автомобилей Беларуси в одну версию с распознаванием номеров Российской Федерации;
— немного повышено качество распознавания номеров Российской Федерации;
— исправлены примеры и добавлены новые.

http://intbusoft.com/rus/products/iANPR/

Пройти курсы по глубокому обучению от NVIDIA на английском языке

Deep Learning Courses


Deep learning is a rapidly growing segment of artificial intelligence. It is increasingly used to deliver near-human level accuracy for image classification, voice recognition, natural language processing, sentiment analysis, recommendation engines, and more. Applications areas include facial recognition, scene detection, advanced medical and pharmaceutical research, and autonomous, self-driving vehicles.

Free Deep Learning Course
Join NVIDIA’s deep learning experts for a free online course. This introductory course is comprised of five instructor-led classes that include interactive lectures, hands-on exercises, and office hours with the instructors.

You’ll learn everything you need to design, train and integrate neural network-powered artificial intelligence into your applications with widely-used open source frameworks and NVIDIA software. During the hands-on exercises, you will use GPUs and deep learning software in the cloud.

Register: nvda.ly/PUVYV

NVIDIA удваивает скорость обучения глубоких нейронных сетей

NVIDIA объявила об обновлении библиотек с алгоритмами глубокого обучения (deep learning) с поддержкой GPU-ускорения. Новая версия ПО позволяет удвоить скорость обучения нейронных сетей.

Более точные нейронные сети благодаря ускоренному обучению моделей и их более сложной структуре позволят ученым и исследователям ускорить работу над проектами, связанными с глубоким обучением.

Система глубокого обучения NVIDIA DIGITS™ Deep Learning GPU Training System версии 2 (DIGITS 2) и библиотека NVIDIA CUDA® Deep Neural Network library версии 3 (cuDNN 3) обеспечивают значительно более высокую производительность и предоставляют новые возможности для исследователей.

DIGITS 2 теперь позволяет автоматически масштабировать обучение нейронных сетей на несколько высокопроизводительных графических процессоров. Для задач классификации изображений это позволит сократить время обучения сети вдвое (по сравнению с системой на базе одного GPU).

cuDNN 3 позволяет оптимизировать хранение данных в памяти GPU при обучении более сложных нейронных сетей. cuDNN 3 также обеспечивает прирост производительности по сравнению с версией cuDNN 2, позволяя исследователям обучать нейронные сети до двух раз быстрее, чем на системах с одним GPU.

Ожидается, что новая библиотека cuDNN 3 будет интегрирована в новые версии фреймворков глубокого обучения Caffe, Minerva, Theano и Torch, которые широко применяются для обучения глубоких нейронных сетей.

Подробнее

Проект стартовал! Присоединяйтесь!

Проект «Распознавание изображений в сфере ритейла» стартовал!

Вы все еще сомневаетесь, включаться ли в проект? — Узнайте, кто уже участвует, наверняка, вы отлично впишитесь.

В проекте принимают участие более 260 человек из 12 стран, включая Испанию, Чехию, Литву и США.
Города-лидеры по числу участников: Москва, Иркутск, Санкт-Петербург, Киев и Екатеринбург.
Представителей прекрасной половины человечества на проекте 15%.
Большинство участников — это IT-специалисты и студенты.
Среди специалистов больше всего разработчиков, инженеров и программистов.
Cамые часто встречающиеся специальности: математическое моделирование, прикладная математика, информационные системы и технологии.

ТОП-5 вузов:
1. Национальный исследовательский Иркутский государственный технический университет,
2. Московский физико-технический институт (государственный университет),
3. Московский государственный университет имени М.В.Ломоносова,
4. Санкт-Петербургский государственный университет,
5. Национальный исследовательский Томский политехнический университет.

Вы уже имеете опыт в сфере распознавания изображений или обучаетесь на технической или математической специальности? — Тогда регистрируйтесь для участия в проекте и вступайте в борьбу за главный приз!

DIGITS DEVBOX: САМАЯ МОЩНАЯ В МИРЕ ПЕРСОНАЛЬНАЯ СИСТЕМА ГЛУБОКОГО ОБУЧЕНИЯ

Созданная командой инженеров NVIDIA, система DIGITS DevBox является ядром комплексной платформы для ускорения исследований глубокого обучения. Каждый компонент DevBox, начиная с четырех карт GPU TITAN X и заканчивая памятью и интерфейсами, максимально оптимизирован, чтобы обеспечить наиболее эффективную работу для самых сложных задач глубокого обучения

Данная система поставляется с предустановленным программным обеспечением, которое необходимо ученым и исследователей для создания собственных глубоких нейронных сетей. В список приложений входят пакет программ DIGITS, самые популярные платформы глубокого обучения Caffe, Theano и Torch, а также cuDNN 2.0 – GPU-ускоренная библиотека для задач глубокого обучения от NVIDIA.

И все это заключено в экономичный, тихий, хорошо охлаждаемый корпус с красивым дизайном, который легко помещается под столом и питается от обычной розетки. Самые первые результаты такого многопроцессорного обучения показывают, что DIGITS DevBox обеспечивает производительность почти в четыре раза выше по сравнению с одним TITAN X в тестах глубокого обучения. С помощью DIGITS DevBox
натренировать сеть AlexNet можно всего за 13 часов, тогда как обычному ПК на базе самого быстрого GPU потребовалось бы более двух суток, а системе на базе CPU — больше месяца.

Подробнее о NVIDIA DIGITS DevBox

IPPLateReader

На основе iANPR SDK мы разработали первую версию программного продукта IPPlateReader, предназначенного для распознавания автомобильных номеров по видеопотоку с IP камеры.

Программа IPPlateReader предназначена для контроля проезда транспортных средств на контрольно пропускном пункте, за счёт распознавания государственных номерных знаков. Использование данного программного обеспечения подразумевается на КПП малых предприятий, парковок, частных территорий и кооперативных хозяйств, пограничных объектах и прочих пунктах нуждающихся в контроле проезда автомобилей. Программное средство позволяет осуществлять полный контроль передвижения транспорта через подконтрольную территорию. Программа имеет возможность автоматически открывать шлагбаум в случае подъезда авторизованного в системе автомобиля. Шлагбаум может открываться вручную оператором, эта функция так же присутствует в программе. Программа имеет функцию связи с пользователями по SMS, при помощи usb-модема. Текущая версия 1.0b — бета версия. Это означает, что программа не работает гарантированно стабильно. Вы можете принять участие в улучшении программы и тем самым получить полную версию бесплатно.


( Читать дальше )