DIGITS DEVBOX: САМАЯ МОЩНАЯ В МИРЕ ПЕРСОНАЛЬНАЯ СИСТЕМА ГЛУБОКОГО ОБУЧЕНИЯ

Созданная командой инженеров NVIDIA, система DIGITS DevBox является ядром комплексной платформы для ускорения исследований глубокого обучения. Каждый компонент DevBox, начиная с четырех карт GPU TITAN X и заканчивая памятью и интерфейсами, максимально оптимизирован, чтобы обеспечить наиболее эффективную работу для самых сложных задач глубокого обучения

Данная система поставляется с предустановленным программным обеспечением, которое необходимо ученым и исследователей для создания собственных глубоких нейронных сетей. В список приложений входят пакет программ DIGITS, самые популярные платформы глубокого обучения Caffe, Theano и Torch, а также cuDNN 2.0 – GPU-ускоренная библиотека для задач глубокого обучения от NVIDIA.

И все это заключено в экономичный, тихий, хорошо охлаждаемый корпус с красивым дизайном, который легко помещается под столом и питается от обычной розетки. Самые первые результаты такого многопроцессорного обучения показывают, что DIGITS DevBox обеспечивает производительность почти в четыре раза выше по сравнению с одним TITAN X в тестах глубокого обучения. С помощью DIGITS DevBox
натренировать сеть AlexNet можно всего за 13 часов, тогда как обычному ПК на базе самого быстрого GPU потребовалось бы более двух суток, а системе на базе CPU — больше месяца.

Подробнее о NVIDIA DIGITS DevBox

IPPLateReader

На основе iANPR SDK мы разработали первую версию программного продукта IPPlateReader, предназначенного для распознавания автомобильных номеров по видеопотоку с IP камеры.

Программа IPPlateReader предназначена для контроля проезда транспортных средств на контрольно пропускном пункте, за счёт распознавания государственных номерных знаков. Использование данного программного обеспечения подразумевается на КПП малых предприятий, парковок, частных территорий и кооперативных хозяйств, пограничных объектах и прочих пунктах нуждающихся в контроле проезда автомобилей. Программное средство позволяет осуществлять полный контроль передвижения транспорта через подконтрольную территорию. Программа имеет возможность автоматически открывать шлагбаум в случае подъезда авторизованного в системе автомобиля. Шлагбаум может открываться вручную оператором, эта функция так же присутствует в программе. Программа имеет функцию связи с пользователями по SMS, при помощи usb-модема. Текущая версия 1.0b — бета версия. Это означает, что программа не работает гарантированно стабильно. Вы можете принять участие в улучшении программы и тем самым получить полную версию бесплатно.


( Читать дальше )

DIGITS: GPU СИСТЕМА ДЛЯ ОБУЧЕНИЯ ГЛУБОКИХ НЕЙРОННЫХ СЕТЕЙ

Глубокое обучение (Deep learning) становится все более популярным разделом машинного обучения. Данный тип обучения использует сложные, многоуровневые нейронные сети Deep Neural Networks (DNNs) для создания систем, которые могут выявлять признаки из большого объема немаркированных данных. Специалисты по обработке и анализу данных как в промышленности, так и в научных кругах используют GPU для ускорения приложений, включая приложения компьютерного зрения, распознавания речи и понимания языка.

Успех применения DNN сопровождается ускорением на графических процессорах, которые стали частью системы, обучающей большие и сложные нейронные сети, при этом сокращается время обучения с месяцев до нескольких дней.

На конференции GPU Technology Conference была представлена DIGITS – первая интерактивная система на базе GPU для обучения глубоких нейронных сетей. Данный продукт имеет интуитивный и понятный web-интерфейс, что в свою очередь позволяет ученым и исследователям быстрее и проще создавать DNN-связи в реальном времени.

DIGITS – открытое программное обеспечение, размещенное на GitHub, что дает разработчикам возможность вносить свой вклад в проект.

Читать подробнее.
О машинном обучении.
Присоединиться к сообществу Deep Learning во вконтакте.

Проект разработки ПО для распознавания образов в сфере ритейла

Американская компания WorkFusion запускает на известной краудсорсинг-платформе Witology свой новый проект в области машинного обучения. Результатом работы должен стать готовый продукт – программа, которая позволит по фотографиям распознавать наличие товара на полках супермаркетов и корректность его выкладки.

Проект предполагает индивидуальную полномасштабную разработку системы на основе собственных идей и представлений о ней. По ходу работы каждый участник будет получать советы и рекомендации от экспертов, а также иметь возможность постоянной обратной связи с WorkFusion.

К участию приглашаются:
• Студенты и аспиранты технических и математических специальностей
• Специалисты в сфере распознавания образов и computer vision
• Все желающие, кому интересна задача проекта

Условия проекта:
• Разработка алгоритмов распознавания изображений
• Разработка прототипов ПО
• Автор лучшего решения получит вознаграждение в размере 5000$
• Самые активные участники с перспективными идеями получат вознаграждение в размере 1000$ и 500$

Интеллектуальные компьютерные системы различного вида уже давно применяются ритейлерами в работе супермаркетов, а потому итоговый продукт довольно быстро займет свое место на рынке.

Для участия в проекте необходимо пройти регистрацию на нашем сайте — goo.gl/YRpwjW

Максимально стабильные экстремальные области

В компьютерном зрении, максимально стабильные экстремальные регионы (MSER) используются в качестве метода обнаружения больших двоичных объектов в изображениях. Предложен в работе:
J. Matas, O. Chum, M. Urban, and T. Pajdla. «Robust wide baseline stereo from maximally stable extremal regions.» Proc. of British Machine Vision Conference, pages 384-396, 2002.
http://cmp.felk.cvut.cz/~matas/papers/matas-bmvc02.pdf
В OpenCV есть пример их использования mser_sample.cpp, текст которого приведен ниже


( Читать дальше )

Потоковое распознавание автомобильных номеров

В версии 1.21 iANPR SDK планируется изменить потоковый модуль, добавив дополнительную функциональность: траектория номера, пересечение траектории номера линий. На следующем видео показано, как будет работать пример:

Ускоренное сравнение с шаблоном

Здесь http://recog.ru/blog/opencv/57.htm показано, как использовать функции OpenCV cvMatchTemplate для сравнения с эталоном.
Недавно появилась статья «Tirui Wu, Alexander Toet Speed-Up Template Matching Through Integral Image Based Weak Classifiers // Journal of Pattern Recognition Research 1 (2014) 1-12.» (http://www.jprr.org/index.php/jprr/article/viewFile/516/193), в которой показано, как можно значительно ускорить процесс поиска шаблона.
Алгоритм работы следующий:
1. Шаблон и само изображение переводится к интегральному виду (т.е. в дальнейшем используются интегральные изображения).
2. Для шаблона вычисляется множество «слабых» бинарных блоков. Что такое «слабый» (weak) бинарный блок можно понять из следующего рисунка:



( Читать дальше )

Распознавание индустриальных баркодов DataMatrix с произвольным углом наклона и поворота камеры

Представлен алгоритм распознавания двумерных индустриальных кодов DataMatrix, позволяющий идентифицировать коды, нанесённые ударно-точечным или капельным методами на поверхности со сложным фоном. Алгоритм может адаптироваться в случаях изменения фона на основе смены режима бинаризации.
http://www.computeroptics.smr.ru/KO/PDF/KO38-4/380442.pdf

Распознавание автомобильных номеров Казахстана

Вышел модуль для распознавания автомобильных номеров Казахстана http://intbusoft.com/rus/products/iANPR/.
Доступно распознавания частных номеров и номеров организаций 1993 и 2012 годов. Распознаются только прямоугольные номера (не квадратные).

iANPR SDK 1.2 - распознавание автомобильных номеров

Вышла новая версия SDK для распознавания автомобильных номеров (пока только для Windows):


Страница SDK:
http://intbusoft.com/rus/products/iANPR/

  • добавлен модуль интерфейсов iANPRinterface
  • добавлен потоковый модуль iANPRcapture
  • добавлено распознавания Российских военных, полицейских номеров и номеров такси и автобусов
  • исправлены мелкие ошибки и недочеты

Вместе с тем сохраняется возможность использования предыдущих версий, которые можно скачать здесь
http://ianpr.org/download.htm

Документация: http://ianpr.org/doc.htm