Назад в библиотеку

Зоровий аналізатор людини як прототип для побудови сімейства проблемно-орієнтованих систем технічного зору

Автори:Боюн В.П.
Источник: Материалы Международной научно-технической конференции: «Искусственный интеллект. Интеллектуальные системы. ИИ-2010». 2010. Т.1, -С.21-26.

Вступ

Зорова система людини вдосконалювалась на протязі мільйонів років і досягла надзвичайно високого рівня організації. Узагальнена модель зорової системи людини є багатофункціональною та складається з декількох десятків, а то й сотні, локальних моделей, які описують цілий ряд структурних, фізичних, геометричних і психофізичних механізмів та процесів. Процес сприйняття візуальної інформації людиною є динамічним, з багатьма параметрами, які змінюються в процесі сприйняття, з багатьма зворотними зв’язками. Ми не тільки бачимо, ми й дивимось, реагуємо, тобто такий процес є активним. Тому феномен зору надає надзвичайно багато різнопланових елегантних рішень для систем технічного зору. А комп’ютерний зір – одна з самих затребуваних галузей на сучасному етапі розвитку цифрових комп’ютерних технологій.

Враховуючи досконалість зорового аналізатора людини, доцільно вивчити і виділити його елементи для використання в сучасних технічних системах. При цьому не обов’язково точно їх копіювати, а, навпаки, розуміючи їх функціонування, реалізовувати їх з врахуванням постановки конкретної технічної задачі та можливостей рівня техніки.

Орган зору людини

Орган зору людини складається з трьох основних складових: очне яблуко, зорові нерви та зорові центри в мозку [1]. Очне яблуко розміщено в захищеному поглибленні черепа, має сферичну форму з діаметром приблизно 20 мм. Ззовні очне яблуко покрито білою, непрозорою оболонкою (склерою) товщиною близько 1 мм. На передній поверхні ока склера переходить в прозору мембрану (роговицю). Відбите від оточуючих предметів світло попадає в око, переломлюється роговицею та кришталиком і фокусується на задній поверхні очного яблука. Друга очна оболонка – судинна, зв’язана зі склерою і складається із кровоносних судин (капілярів) і являється основним джерелом живлення ока. Темна судинна оболонка ока сильно пігментована і адсорбує надлишкове світло, яке попало в око, зменшуючи відбиття світлових променів всередині очного яблука та попереджуючи отримання нечіткого зображення. Сама передня частина судинної оболонки (радужка) представляє собою зафарбовану мембрану у вигляді концентричного диску, яка складається із гладких м’язів і розміщена між роговицею та кришталиком. Одна з основних функцій радужки є регулювання кількості світла, яке попадає в око. Внутрішня частина концентричного диску радужки (зіниця) в залежності від рівня освітлення збільшується або зменшується під впливом двох протилежно направлених м’язів радужки. Як правило, зіниця реагує на зміни освітлення рефлекторно із швидкістю 0,25-0,5 с.

Кришталик ділить око на дві нерівні по об’єму камери:

Обидві прозорі субстанції забезпечують утримання кришталика у визначеному положенні та підтримують форму ока. Кривизна кришталика змінюється в залежності від фокусної відстані під впливом війкових м’язів.

Сітківка охоплює біля 200? внутрішньої поверхні очного яблука та представляє собою надзвичайно складну мережу фоторецепторів і нервових клітин, які трансформують світлову енергію в нейрону активність. В багатьох відношеннях поверхня сітківки являється продовженням мозку. Сітківка складається з фоторецепторів двох видів – паличок і колбочок, відповідно циліндричної і конічної форми. На периферії сітківки розміщено 120-130 мільйонів паличок, ширина яких дорівнює приблизно 0,002 мм. Колбочки, у кількості 6-8 мільйонів, переважно сконцентровані в центральній ямці (зона fovea) шириною близько 1 мм і мають діаметр 0,003-0,008 мм. На невеликій відстані від центральної ямки в сторону носа розташований диск зорового нерву, з якого виходить зоровий нерв в мозок. На цій ділянці відсутні фоторецептори (сліпа пляма) і відсутня будь яка зорова реакція.

Зовнішня оболонка паличок і колбочок покрита світлопоглинаючим пігментом, що забезпечує умови їх збудження при попаданні на них світла. Сітківка представляє собою складну 10-ти шарову мережу нервових клітин різної спеціалізації, які зв’язані між собою вертикальними і горизонтальними зв’язками.

Базовими елементами нервової системи людини – основними обробниками і передавачами інформації – є нейрони або нервові клітини, яких налічується у людини приблизно 100 мільярдів. Відомі нейрони різних типів, кожен з яких виконує свої специфічні функції. Деякі з них зв’язані з рецепторними клітинами органів чуття (сенсорні нейрони), які сприймають визначені види енергії (світло, звук, тиск, хімічну енергію). Ці клітини перетворюють сприйняту ними енергію в нервові імпульси та передають їх іншим нейронам нервової системи: мотонейронам – для передачі імпульсів м’язам, або інтернейронам – для подальшої обробки сприйнятої інформації.

Більшість нейронів незалежно від їх функцій складається з трьох основних частин:

Таким чином дендрити сприймають інформацію від багатьох нейронів і передають її в тіло клітини. Сома, в залежності від сукупності прийнятої інформації (імпульси збудження і гальмування) та її спеціалізації, видає через свої аксони відповідні сигнали іншим нейронам або м’язам для виконання відповідних дій. Розгалужений кінець аксона закінчується кінцевою синоптичною головкою, яка є місцем контакту з дендритом іншого нейрона. В залежності від типа сигналу, що прийшов по аксону (збудження або гальмування), в синоптичний контакт виділяється особлива хімічна речовина – нейротрансміттер, який збуджує або гальмує пов’язаний з цим аксоном нейрон. Використання природою двох типів нейротрансміттерів забезпечує більш точні і скоординовані рухи м’язів.

Групи паличок і колбочок зв’язані по вертикалі з проміжними (біполярними) клітинами, які, в свою чергу, зв’язані з гангліозними клітинами, аксони яких входять до складу зорового нерву. Крім проміжних біполярних і гангліозних клітин існують також два шари горизонтальних зв’язків: перша мережа створюється горизонтальними клітинами між фоторецепторами і біполярними клітинами, друга мережа бокових (латеральних) зв’язків створюється амакриновими клітинами між біполярними і гангліозними клітинами. Однією з функцій цих бокових зв’язків є створення такої взаємодії між сусідніми клітинами, при якому можлива модифікація сигналів з фоторецепторів (латеральне гальмування).

Нервові клітини не обов’язково передають імпульси сусіднім нейронам всякий раз, коли на них діє подразник. Нейрон має багато дендритів (до тисячі), які пов’язані з багатьма іншими нейронами, і приносять вони не тільки ту інформацію, що збуджує свій нейрон, але й інформацію, що гальмує його роботу. Потенціал дії нейрона і передача від нього імпульсу виникає тоді, коли досягається визначений поріг його стимулювання. Величина потенціалу дії не залежить від інтенсивності подразника, тобто є постійною величиною. Вплив інтенсивності подразника проявляється в кількості потенціалів дії та у часовому інтервалі між ними, тобто в частоті імпульсів потенціалу дії. Ця частота не може перевищувати 1000 імпульсів дії за секунду.

Відчуття постійного по інтенсивності подразника з часом зменшується, тобто має місце адаптація до тривалого подразника. Хоча адаптація, як правило, свідчить про зниження чутливості, вона одночасно приносить і значну користь, допомагаючи сприймати більш слабкі сигнали про зміни в оточуючому середовищі.

Більш детально розглянемо основні функції, структурні та фізичні особливості, механізми та процеси, які мають місце та відбуваються в зоровому аналізаторі нижнього рівня людини [1-6] і які є важливими для грамотного синтезу сімейства проблемно-орієнтованих інтелектуальних технічних систем реального часу.

Фізичним подразником зорової системи є світло: з однієї сторони це електромагнітні коливання у вузькому діапазоні довжин хвиль (приблизно 380 – 760 нм для людини), а з другої сторони це енергія, тобто неперервний потік часток (квантів) енергії, який визначає інтенсивність світла.

Психологічний ефект від сприйняття електромагнітних хвиль різної довжини є кольори або відтінки (від фіолетового до червоного), а ефект від інтенсивності світла, як фізичного подразника, є яскравість. Зміни інтенсивності світла не обов’язково приводять до пропорційної зміни сенсорного сприйняття, тобто яскравості.

Основними функціями зорового аналізатора (ЗА) є:

Структурні (конструктивні) особливості ЗА:

Фізичні особливості ЗА:

Чим більш випадкове зображення, тим більшу кількість інформації воно містить, що забезпечує краще пристосування до умов середовища, більше шансів вижити видам в процесі еволюції. Наявність тремороподібних рухів в зоровому апараті в сполученні з можливою часовою когерентністю світла дозволяє виділяти з рандомізованого зображення регулярні інтерференційні структури, по яким в подальшому можна відновити вхідне зображення. Крім того це дозволяє знизити диференційні рівні яскравості на фоторецепторах завдяки її розподілу на більшу площу фоторецепторів [3, 4];

Тільки промені видимого електромагнітного спектра з довжиною хвиль від 380 до 760 нм здатні викликати у людини кольорові відчуття. Тобто відчуття кольору – це суб’єктивний результат дії на нервову систему відбитого від предмета променя з визначеною довжиною хвилі у видимому діапазоні. Самі по собі промені світла, фарби, тощо не мають кольору, вони лише результат відбиття або поглинання променевої енергії від оточуючого середовища, який інтерпретується зоровою системою. Навіть в мережі сітківки і зорової кори кольорів нема, вони з’являються коли відеоінформація отримує кінцеву інтерпретацію в свідомості спостерігача. Тобто колір – продукт діяльності зорової системи, а не невід’ємна властивість видимого спектру; Між відчуттям кольору і фізичними параметрами світла існує тісна залежність, яка може бути кількісно оцінена трьома атрибутами світла: довжиною хвилі, інтенсивністю та спектральною чистотою. Цим фізичним параметрам відповідають свої психологічні аспекти відчуття кольору: кольоровий тон, яскравість та насиченість. Кольоровий тон або просто колір визначається довжиною хвилі світла, яскравість кольору визначається його інтенсивністю, а насиченість кольору є психологічним параметром, який відображує відносну кількість кольору поверхні предмета і пов’язана з фізичним параметром спектральної чистоти.

Механізми і процеси ЗА:

Значна частина попередньої обробки зорової інформації проводиться вже на рівні сітківки. Спеціалізовані нейрони, розміщені в товщі сітківки, виділяють контури об’єктів, реагують на рух (часто лише в одному визначеному напрямку), виділяють інформацію про світ і тіні та деяку іншу інформацію, провести інтерпретацію якої дуже важко. Тобто в мозок посилається ціла серія динамічних образів, кожен з яких відображує лише один аспект загальної зорової картини. Кожен відеопотік передається по своїй групі волокон зорового нерву у вищі центри мозку, де вони об’єднуються в загальну картину.

Вище в ієрархії йдуть усвідомлені рухи очей, які визначаються когнітивним процесом сприйняття інформації. При цьому мозок містить повну модель сітківки та набутий досвід зображень об’єктів. Отримуючи інформацію з сітківки та порівнюючи її з моделями об’єктів, мозок у відповідності з поставленою ціллю та характеристиками об’єктів визначає високочастотні автоматичні режими управління рухами очей та керує низькочастотними режимами.

Враховуючи дуже велику складність побудови системи технічного зору з можливостями зорового аналізатора людини, велику її вартість, тощо, в більшості випадків більш доцільно створювати проблемно-орієнтовані пристрої або системи для вирішення конкретних прикладних задач промисловості, транспорту, науки, біології, медицини тощо. Такі пристрої або системи будуть ефективно реалізовувати всього декілька структурних особливостей або механізмів зорового аналізатора, але будуть швидко розроблятись та впроваджуватись, враховуючи їх невелику вартість. Синтез проблемно-орієнтованих систем технічного зору починається з визначення умов освітлення (денне світло, люмінесцентне, від ламп розжарювання, тощо), його постійності на протязі доби, розмірів об’єкта (об’єктів) і відстані до нього (них), діапазону зміни відстані до об’єктів, поле зору, необхідність оцінки глибини сцени, монохроматичне або кольорове бачення, завади та їх тип, орієнтовна швидкість руху об’єктів або сцени, інформативні ознаки об’єктів (колір, текстура, форма, орієнтовні розміри об’єктів, тощо), типи примітивів, які необхідно виділити з об’єкту, режими роботи системи (пошук об’єктів, слідкування за ними, розпізнавання, вимірювання розмірів, морфологічний та морфометричний аналіз), вимоги до часу розпізнавання або вимірювання, вимоги до точності вимірювання, тощо.

Можна виділити дві стратегії розробки сімейства проблемно-орієнтованих пристроїв та систем технічного зору:

Друга стратегія, враховуючи вже накопичений чималий досвід, в теперішній час була б більш правильною, але вимагає значних коштів та часу для реалізації. Її доцільно було реалізувати в рамках якоїсь Державної програми, наприклад «Образний комп’ютер».

Список літератури

1. Харви Ричард Шиффман. Ощущение и восприятие. 5-е изд. СПб.: Питер, 2003. – 928 с.
2. Свет В.Д., Хазен А.М. О формировании изображения в инвертированной сетчатке глаза. Биофизика, 2009, том 54, вып.2, – с.274-286.
3. Кирпичников А.П. Глаз как интеллектуальный сенсор. Датчики и системы. №12, 2009, – с.63-69.
4. Александров В.В. Глаз и визуальное восприятие. Оптический журнал, том 66, №9, 1999. – с 54-62.
5. Андерсон Д. Когнитивная психология. 5-е изд. СПб.:Питер, 2002. – 496 с.
6. Супин А.Я. Нейронные механизмы зрительного анализа. Наука. М. 1974. – 180 с.