Сидорук Андрій Васильович

Сучасні інформаційні технології,обчислювальна техніка та програмування

Сидорук Андрій Васильович

Чернівецький національний університет імені Ю. Федьковича

МЕТОД ВДОСКОНАЛЕННЯ СИСТЕМ ТЕХНІЧНОГО ЗОРУ В ЗАМКНУТОМУ ПРИМІЩЕННІ ЗА ДОПОМОГОЮ УЛЬТРАЗВУКОВОГО СКАНЕРУ ГЛИБИНИ СЦЕН

Розвиток робототехнічних систем і систем автоматизації виробництва усе активніше висуває вимогу по оснащенню цих систем технічним зором (СТЗ). Досягнення в розвитку апаратних засобів збору зорових даних і уведення їх в ЕОМ дозволяють ставити й вирішувати складні завдання по машинній обробці відеоінформації. Особливе місце серед таких завдань займають завдання, що вимагають рішення в масштабі реального часу, що задаються зовнішніми процесами [1].

Потреба в високоточних системах технічного зору диктує необхідність досліджень нових способів програмно-апаратних рішень для обробки й аналізу зображень. Важливим завданням у ряді областей – промисловості, наукових дослідженнях, медицині, системах безпеки – є аналіз зображень. Рішення складних і різноманітних проблем, що стоять перед дослідниками, найчастіше вимагає достовірних даних, для одержання яких необхідні швидко працюючі програмно-апаратні системи [3].

До завдань обробки зорових даних у реальному часі ставляться моніторинг стану різних об’єктів і систем, інспекційний технологічний контроль, спостереження за рухомими об’єктами, обробка зорової інформації в інформаційних системах маніпуляційних і рухомих робототехнічних комплексів. Автоматична локалізація й ідентифікація об'єктів у зображеннях реального світу.

Одне з важливих завдань – це швидкий пошук фрагментів в зображеннях реального світу [2]. Яскравими прикладами є завдання пов’язані з орієнтуванням в замкнутих приміщеннях, локалізації в ньому об’єктів, підрахунку кількості однотипних об’єктів в вказаному просторі, пошуку заданої ділянки з прив’язкою до трьох вимірів, порівняння об’єкту з еталоном і т.д. У всіх перерахованих додатках потрібно забезпечити в реальному часі одержання й обробку зорових даних з метою виявлення на сформованих цифрових зображеннях образів об’єктів інтересу або їхніх частин.

На даний момент у світі існує всього декілька програмних продуктів, що здійснюють швидкий пошук зразка для випадку, коли зразок може бути повернутий усередині даного зображення. Ще менше програм, що дозволяють виконати пошук зразка, перекрученого афінним перетворенням. Один з лідерів за часом пошуку серед таких систем є продукт американської фірми Datacube – MaxVision Toolkit [www.datacube.com], що володіє рядом незаперечних переваг: можливість пошуку зразка, перекрученого афінним перетворенням, нелінійна корекція освітленості. Але основним недоліком методу нормалізованої кореляції відтінків сірого, на якому заснований продукт, є більша обчислювальна складність.

Не можна не відзначити внесок фірми ABBY Software House у створенні систем автоматичного розпізнавання текстів. Продукт FineReader є одним із кращих у світі для цього завдання. Одним з недоліком даного продукту є чутливість до більшого (більше 15 градусів) кута повороту зображення. Таким же недоліком володіють різні системи локалізації й розпізнавання етикеток і штрих кодів. На сьогоднішній день потрібні швидко працюючі алгоритми для рішення даних завдань. Це стимулює пошук нових ідей і алгоритмів. Використання для цієї мети лише відеокамер є недостатньо ефективною через невисоку точність локалізації пошукових об’єктів, також через значну залежність від освітлення, та залежність від кута повороту зображення. Задача дещо полегшується при використанні поворотних (PTZ) камер, хоча для створення якісної системи технічного зору необхідно використовувати складні алгоритми котрі сповільнюють роботу системи в цілому та роблять її мало придатною для роботи в реальному масштабі часу.

Виходячи з зазначених недоліків, для одержанная конкурентноздатних відеосистем з гарними проказниками по швидкості та якості обробки даних, необхідна й актуальна розробка спеціалізованих програмно-апаратних засобів що допускають створення програмних продуктів котрі б використовували одночасно декілька засобів спостереження за оточуючим середовищем. Тобто окрім звичайної камери була б можливість використання додаткових приладів спостереження котрі б могли доповнити основну інформацію що поступає від камер. Для суттєвого покращення результату достатньо використати один додатковий пристрій, який буде надавати інформацію про об’єкт спостереження з іншої сторони. Таким приладом може бути – ультразвуковий сканер. Даний сканер дозволить формувати карту глибини сцен. Що дозволить на алгоритмічному рівні значно покращити чутливість до кута повороту, і спростити основні алгоритми розпізнання об’єктів. Даний метод дозволить створювати використовувати обидва потоки інформації в одому алгоритмі обробки даних [3].

При обробці інформації системою технічного зору важливими є алгоритми класифікації. Логічні алгоритми класифікації являють собою композиції елементарних класифікаторів, які також називаються закономірностями. Існують два протилежних підходи до підвищення якості (узагальнюючої здатності) таких алгоритмів: або збільшення числа закономірностей у композиції [1], або підвищення якості закономірностей. Якість алгоритму в обох випадках може виявитися співрозмірню, однак при другому підході виходять більш прості, легко інтерпритовані алгоритми. Використання додаткового приладу може на якісному рівні збільшити число закономірностей в композиції. У даній роботі поняття узагальнюючої здатності, що звичайно визначається для алгоритмів, поширюється на випадок закономірностей. У рамках комбінаторного підходу [2] виводяться складні оцінки якості закономірностей. Пропонується методика емпіричного виміру завищенності одержуваних оцінок, заснована на дотичному контролі.

Актуальність завдання побудови математичної моделі систем технічного зору з використанням додаткових приладів, для підсилення числа закономірностей в композиції, полягає в тому, що вона дозволяє використовувати цю систему, не реалізуючи її в повному обсязі. Визначення параметрів проводится на підставі навчальної вибірки. Оптимальність моделі визначається її точністю й швидкістю обчислення параметрів [3]. Тому важливим є застосування диференціального підходу, котрий дає можливість визначити ймовірність правильного розпізнавання тестованого зразка. Цей підхід дає можливість побудувати оптимальний варіант моделі СТЗ в умовах малих вибірок [4].

Однією зі значимих проблем в області багатокритеріального вибору є проблема звуження множини Парето, оскільки вона найчастіше виявляється досить широкою. Як правило, подальше звуження для пошуку найкращого рішення відбувається на основі додаткової інформації, котру можна одержати від ультразвукового сканера сцен.

У даній роботі розглядається завдання, у якому додаткова інформація надається додатковим приладом, а саме, ультразвуковим сканером сцен. Додаткова інформація являє собою кількісну інформацію про закономірності композиції [2]. Вона полягає в тому, що виділяються групи критеріїв і визначається важливість першої групи, класичного методу, відносно другої з урахуванням ультразвукового сканеру глибини сцен.

Інформація подібного роду, тобто коли група критеріїв A важливіше групи B, а група критеріїв B, у свою чергу, важливіше A (причому A і B непусті й взаємно непересічні групи) є взаємно залежною [2]. Нехай X множина можливих рішень. Переваги СТЗ виражаются за допомогою набору критеріїв f1, . . . , fm , m2, що утворять векторний критерій f (x) = (f1(x), . . . , fm(x)), і бінарного відношення строгої переваги □X , заданого на X. Множину обраних рішень позначимо через Sel(X). Поряд з множинами X і Sel(X) будемо використати множини можливих Y = f (X) ⊂ Rm і обраних Sel(Y) = f (Sel(X)) векторів. Додаткова інформація складається з наступних двох повідомлень:

  • група критеріїв A важливіше групи критеріїв B із заданими позитивними параметрами wi (∀i ∈ A), wj (∀j ∈ B) і група критеріїв B важливіше групи критеріїв A з заданими позитивними параметрами γj (∀j ∈ B), γi (∀i ∈ A);
  • група A важливіше групи критеріїв C з позитивними параметрами wi (∀i ∈ A), wk (∀k ∈ C) і група C важливіше групи критеріїв A з позитивними параметрами γk (∀k ∈ C).

Отже запропонований у даній роботі метод використання додаткового приладу, а саме, ультразвукового сканеру сцен дозволить розширити можливості СТЗ. В результаті можна провести аналіз інформації з позитивними параметрами та використати найоптимальніший варіант. Кількісно важливість виражається парою наборів числових параметрів. Перший набір містить максимальні величини виграшів по кожному із критеріїв більше важливої групи, у тім випадку, якщо СТЗ зробить поступки по кожному із критеріїв менш важливої групи (другий набір параметрів містить величини поступок). Більше того, виявляється, що друга група критеріїв, у свою чергу, важливіше першої. У даній ситуації СТЗ іде на взаємні поступки по деяким критеріям, заради максимальної продуктивності по кожному з них.

Література:

  1. Cohen W. W., Singer Y. A simple, fast and effective rule learner // Proc. Of the 16 National Conference on Artificial Intelligence. 1999. Pp. 335–342.
  2. Воронцов К. В. Комбинаторный подход к оценке качества обучаемых алгоритмов // Мат. вопр. киберн. М.: Физматлит, 2004. Т. 13. С. 5–36.
  3. Kapustiy B. O., Rusyn B. P., Tayanov V. A. Tayanov Comparative analysis of different estimates of Recognition Probability // Journal of Automation and Information Sciences. 2006. Issue 8. P. 8–16.
  4. Kapustiy B. O., Rusyn B. P., Tayanov V. A. Сlassifier optimization in small sample size condition // Avtomatika i vychislitel’naya tekhnika. 2006. vol. 40, Issue 5. P.25–32.

Статья створена 06.12.2009 (оригінал). Опублікована 30.09.2018

Назад

TerminalCoin

2018-10-02 06:19:12