Тестовые изображения и видео

Различные изображения и видео можно найти по следующим ссылкам:

http://www.cs.cmu.edu/~cil/v-images.html

http://staff.science.uva.nl/~aloi/

Индивидуальный выбор оптимального количества особенностей при распознавании графических образов

         Существует целый класс алгоритмов распознавания графических образов, основанных на сопоставлении некоторых особенностей («особых» точек) неизвестного объекта с эталонными образами. Один из наиболее известных механизмов выделения особенностей представлен в работе [4] и реализован в популярной программной библиотеке OpenCV. Достоинством алгоритма распознавания на базе особенностей является возможность находить объекты на изображениях, где они повёрнуты на произвольные углы и могут частично перекрываться. Вероятность правильного распознавания в данном алгоритме, прежде всего, зависит от количества и содержимого эталонных образов, а также от числа сравниваемых особенностей.
         При применении алгоритмов на базе особенностей существенное влияние оказывает проблема быстродействия, которая усиливается при увеличении числа эталонных образов, когда особенности неизвестного изображения необходимо сравнить со всеми особенностями всех эталонных образов. Чрезмерное увеличение количества особенностей ведёт к снижению производительности алгоритма, поэтому возникает идея выбирать количество особенностей индивидуально для каждого эталонного образа, что позволит снизить время распознавания при сохранении качества. Целью настоящей работы является оптимизация алгоритма распознавания на основе особенностей путём оптимального выбора количества особенностей.


( Читать дальше )

Бинаризация изображений

Бинаризация изображений, т.е. перевод полноцветного или в градациях серого изображения в монохромное, где присутствуют только два типа пикселей (темные и светлые) имеет большое значение при распознавании образов. Особенно это относится к бинарным объектам, таким, как штриховые коды, текст, чертежи и т.п. Существуют различные подходы к бинаризации, которые условно можно разделить на 2 группы:
  • пороговые;
  • адаптивные.


( Читать дальше )

Android + OpenCV

    Привет всем, сегодня я расскажу вам о сборке OpenCv для Android под управлением ОС Windows7.
    Перед началом сего процесса необходимо иметь:
  1. Android NDK; developer.android.com/sdk/ndk/index.html
  2. Android SDK; developer.android.com/sdk/index.html
  3. JDK (5 или 6); www.oracle.com/technetwork/java/javase/downloads/index.html
  4. SWIG(swigwin); www.swig.org/download.html
  5. Apache Ant; ant.apache.org/bindownload.cgi
  6. Make; gnuwin32.sourceforge.net/packages/make.htm
  7. Cmake; www.cmake.org/cmake/resources/software.html
  8. Svn клиент; sourceforge.net/projects/win32svn/


( Читать дальше )

Определение положения второй камеры с помощью баскетбольного мяча

Пусть есть две камеры, оси которых параллельны друг другу. Необходимо, зная положение в пространстве одной камеры, определить положение второй (Рис.1). Данную задачу можно решить с помощью обычного баскетбольного мяча.

Рис. 1. Две камеры с параллельными осями и мячом в точке P3


( Читать дальше )

Роботов учат играть в футбол

В рамках ежегодного международного конкурса робототехники RoboCup проводятся серии футбольных матчей.

Оригинал новости.



Чтобы там не говорили, на мой взгляд – это жалкое зрелище. Ни роботы толком ещё двигаться не могут. А система распознавания наверняка примитивная – что может быть проще распознать оранжевый мяч на однотонном фоне и выделенные цветом ворота.

Моменты в OpenCV

Момент – это характеристика контура, объединённая (суммированная) со всеми пикселями контура. Момент (p,q) определяется как:

Здесь p – порядок x, q – порядок y, где порядок означает, так сказать, мощность, на которой соответствующий компонент взят в сумме с другими отображенными.


( Читать дальше )

Google научит компьютер видеть

Корпорация Google развивает свой сервис Goggles, который существует также как отдельное приложение для iPhone. Пользователь может делать снимки камерой и передавать их на сервис, где процесс распознавания изображения может занят 1-2 секунды. Кончено на настоящий момент сервис не распознает все, что угодно, но он идентифицирует исторические строения и произведения искусства, штрих-коды и торговые знаки, текст (с автоматическим поиском соответствия в Google).
Оригинал новости.

Распознавание текста с использованием шаблонов

Здесь показано, как распознавать текст с использованием контуров. Однако в случае зашумления и искажения контуров данный метод работает неудовлетворительно. Конечно, известны методы распознавание текста на базе нейронных сетей, но существует ещё более простой метод (в плане обучения), основанный на сравнении с эталоном (шаблоном). В ряде случае сравнение с шаблоном будет достаточно для распознавания текста, например, при распознавании автомобильных номеров.


( Читать дальше )

Роботы CareBot используют Kinect для зрения

GeckoSystems представит робота четвертого поколения «CareBot» для сервисного обслуживания на конференции «Mobile Robots in Motion» 13-15 апреля. Роботы построены на основе двух двухъядерных процессоров IntelAtom, размещенных на Mini-ITX платах, на одном работает Ubuntu Linux, а на другом Windows XP. Зрение систем базируется на технологии Microsoft Kinect (http://ru.wikipedia.org/wiki/Kinect).



По словам GeckoSystems, сервисные роботы, такие как CareBot могут быть использованы для обеспечения помощи для престарелых и инвалидов, предоставления услуг, включая уборку, развлечения, и удаленного мониторинга.
Оригинал новости.