NVIDIA удваивает скорость обучения глубоких нейронных сетей

NVIDIA объявила об обновлении библиотек с алгоритмами глубокого обучения (deep learning) с поддержкой GPU-ускорения. Новая версия ПО позволяет удвоить скорость обучения нейронных сетей.

Более точные нейронные сети благодаря ускоренному обучению моделей и их более сложной структуре позволят ученым и исследователям ускорить работу над проектами, связанными с глубоким обучением.

Система глубокого обучения NVIDIA DIGITS™ Deep Learning GPU Training System версии 2 (DIGITS 2) и библиотека NVIDIA CUDA® Deep Neural Network library версии 3 (cuDNN 3) обеспечивают значительно более высокую производительность и предоставляют новые возможности для исследователей.

DIGITS 2 теперь позволяет автоматически масштабировать обучение нейронных сетей на несколько высокопроизводительных графических процессоров. Для задач классификации изображений это позволит сократить время обучения сети вдвое (по сравнению с системой на базе одного GPU).

cuDNN 3 позволяет оптимизировать хранение данных в памяти GPU при обучении более сложных нейронных сетей. cuDNN 3 также обеспечивает прирост производительности по сравнению с версией cuDNN 2, позволяя исследователям обучать нейронные сети до двух раз быстрее, чем на системах с одним GPU.

Ожидается, что новая библиотека cuDNN 3 будет интегрирована в новые версии фреймворков глубокого обучения Caffe, Minerva, Theano и Torch, которые широко применяются для обучения глубоких нейронных сетей.

Подробнее

Проект стартовал! Присоединяйтесь!

Проект «Распознавание изображений в сфере ритейла» стартовал!

Вы все еще сомневаетесь, включаться ли в проект? — Узнайте, кто уже участвует, наверняка, вы отлично впишитесь.

В проекте принимают участие более 260 человек из 12 стран, включая Испанию, Чехию, Литву и США.
Города-лидеры по числу участников: Москва, Иркутск, Санкт-Петербург, Киев и Екатеринбург.
Представителей прекрасной половины человечества на проекте 15%.
Большинство участников — это IT-специалисты и студенты.
Среди специалистов больше всего разработчиков, инженеров и программистов.
Cамые часто встречающиеся специальности: математическое моделирование, прикладная математика, информационные системы и технологии.

ТОП-5 вузов:
1. Национальный исследовательский Иркутский государственный технический университет,
2. Московский физико-технический институт (государственный университет),
3. Московский государственный университет имени М.В.Ломоносова,
4. Санкт-Петербургский государственный университет,
5. Национальный исследовательский Томский политехнический университет.

Вы уже имеете опыт в сфере распознавания изображений или обучаетесь на технической или математической специальности? — Тогда регистрируйтесь для участия в проекте и вступайте в борьбу за главный приз!

DIGITS DEVBOX: САМАЯ МОЩНАЯ В МИРЕ ПЕРСОНАЛЬНАЯ СИСТЕМА ГЛУБОКОГО ОБУЧЕНИЯ

Созданная командой инженеров NVIDIA, система DIGITS DevBox является ядром комплексной платформы для ускорения исследований глубокого обучения. Каждый компонент DevBox, начиная с четырех карт GPU TITAN X и заканчивая памятью и интерфейсами, максимально оптимизирован, чтобы обеспечить наиболее эффективную работу для самых сложных задач глубокого обучения

Данная система поставляется с предустановленным программным обеспечением, которое необходимо ученым и исследователей для создания собственных глубоких нейронных сетей. В список приложений входят пакет программ DIGITS, самые популярные платформы глубокого обучения Caffe, Theano и Torch, а также cuDNN 2.0 – GPU-ускоренная библиотека для задач глубокого обучения от NVIDIA.

И все это заключено в экономичный, тихий, хорошо охлаждаемый корпус с красивым дизайном, который легко помещается под столом и питается от обычной розетки. Самые первые результаты такого многопроцессорного обучения показывают, что DIGITS DevBox обеспечивает производительность почти в четыре раза выше по сравнению с одним TITAN X в тестах глубокого обучения. С помощью DIGITS DevBox
натренировать сеть AlexNet можно всего за 13 часов, тогда как обычному ПК на базе самого быстрого GPU потребовалось бы более двух суток, а системе на базе CPU — больше месяца.

Подробнее о NVIDIA DIGITS DevBox

IPPLateReader

На основе iANPR SDK мы разработали первую версию программного продукта IPPlateReader, предназначенного для распознавания автомобильных номеров по видеопотоку с IP камеры.

Программа IPPlateReader предназначена для контроля проезда транспортных средств на контрольно пропускном пункте, за счёт распознавания государственных номерных знаков. Использование данного программного обеспечения подразумевается на КПП малых предприятий, парковок, частных территорий и кооперативных хозяйств, пограничных объектах и прочих пунктах нуждающихся в контроле проезда автомобилей. Программное средство позволяет осуществлять полный контроль передвижения транспорта через подконтрольную территорию. Программа имеет возможность автоматически открывать шлагбаум в случае подъезда авторизованного в системе автомобиля. Шлагбаум может открываться вручную оператором, эта функция так же присутствует в программе. Программа имеет функцию связи с пользователями по SMS, при помощи usb-модема. Текущая версия 1.0b — бета версия. Это означает, что программа не работает гарантированно стабильно. Вы можете принять участие в улучшении программы и тем самым получить полную версию бесплатно.


( Читать дальше )

DIGITS: GPU СИСТЕМА ДЛЯ ОБУЧЕНИЯ ГЛУБОКИХ НЕЙРОННЫХ СЕТЕЙ

Глубокое обучение (Deep learning) становится все более популярным разделом машинного обучения. Данный тип обучения использует сложные, многоуровневые нейронные сети Deep Neural Networks (DNNs) для создания систем, которые могут выявлять признаки из большого объема немаркированных данных. Специалисты по обработке и анализу данных как в промышленности, так и в научных кругах используют GPU для ускорения приложений, включая приложения компьютерного зрения, распознавания речи и понимания языка.

Успех применения DNN сопровождается ускорением на графических процессорах, которые стали частью системы, обучающей большие и сложные нейронные сети, при этом сокращается время обучения с месяцев до нескольких дней.

На конференции GPU Technology Conference была представлена DIGITS – первая интерактивная система на базе GPU для обучения глубоких нейронных сетей. Данный продукт имеет интуитивный и понятный web-интерфейс, что в свою очередь позволяет ученым и исследователям быстрее и проще создавать DNN-связи в реальном времени.

DIGITS – открытое программное обеспечение, размещенное на GitHub, что дает разработчикам возможность вносить свой вклад в проект.

Читать подробнее.
О машинном обучении.
Присоединиться к сообществу Deep Learning во вконтакте.

Максимально стабильные экстремальные области

В компьютерном зрении, максимально стабильные экстремальные регионы (MSER) используются в качестве метода обнаружения больших двоичных объектов в изображениях. Предложен в работе:
J. Matas, O. Chum, M. Urban, and T. Pajdla. «Robust wide baseline stereo from maximally stable extremal regions.» Proc. of British Machine Vision Conference, pages 384-396, 2002.
http://cmp.felk.cvut.cz/~matas/papers/matas-bmvc02.pdf
В OpenCV есть пример их использования mser_sample.cpp, текст которого приведен ниже


( Читать дальше )

Потоковое распознавание автомобильных номеров

В версии 1.21 iANPR SDK планируется изменить потоковый модуль, добавив дополнительную функциональность: траектория номера, пересечение траектории номера линий. На следующем видео показано, как будет работать пример:

Ускоренное сравнение с шаблоном

Здесь http://recog.ru/blog/opencv/57.htm показано, как использовать функции OpenCV cvMatchTemplate для сравнения с эталоном.
Недавно появилась статья «Tirui Wu, Alexander Toet Speed-Up Template Matching Through Integral Image Based Weak Classifiers // Journal of Pattern Recognition Research 1 (2014) 1-12.» (http://www.jprr.org/index.php/jprr/article/viewFile/516/193), в которой показано, как можно значительно ускорить процесс поиска шаблона.
Алгоритм работы следующий:
1. Шаблон и само изображение переводится к интегральному виду (т.е. в дальнейшем используются интегральные изображения).
2. Для шаблона вычисляется множество «слабых» бинарных блоков. Что такое «слабый» (weak) бинарный блок можно понять из следующего рисунка:



( Читать дальше )

Распознавание индустриальных баркодов DataMatrix с произвольным углом наклона и поворота камеры

Представлен алгоритм распознавания двумерных индустриальных кодов DataMatrix, позволяющий идентифицировать коды, нанесённые ударно-точечным или капельным методами на поверхности со сложным фоном. Алгоритм может адаптироваться в случаях изменения фона на основе смены режима бинаризации.
http://www.computeroptics.smr.ru/KO/PDF/KO38-4/380442.pdf

Распознавание автомобильных номеров Казахстана

Вышел модуль для распознавания автомобильных номеров Казахстана http://intbusoft.com/rus/products/iANPR/.
Доступно распознавания частных номеров и номеров организаций 1993 и 2012 годов. Распознаются только прямоугольные номера (не квадратные).