Зрение - сравнение как принцип работы

  • Автор темы Автор темы sabos
  • Дата начала Дата начала
Статус
Закрыто для дальнейших ответов.
Ответ: Зрение - сравнение как принцип работы

sabos
Что-то полезность нашей дискуссии сошла на нет (для меня). При всем уважении к тебе и твоим знаниям, я не вижу за тобой какого-либо серьезного преимущества в обсуждаемом вопросе, даже учитывая мою нехорошую терминологию и отсутствие физического образования. Так что твоя поза гуру мне кажется несколько странной. Мне на мое самолюбие плевать, о чем я тебе говорил еще лет шесть назад, но просто смысла в разговоре сейчас нет. Буду пока, как и все, просто читать твои сообщения.

С уважением, Андрей Френкель.
 
Ответ: Cинапс колбочки с биполярной клеткой.

Я уделил такое внимание синапсу биполярной клетки, дабы показать, что в нашем распоряжении появился очень важный (для обработки сигналов) элемент - инвертор.

Он дает нам очень важную операцию для нашего видеопроцессора - вычитание.

Математики и программисты меня поймут - какой простор для моделирования наших "феноменов" дает такой, на первый взгляд простой, элемент.

На основе всего двух операций, сложение и вычитание, работает не только арифметика. Очень много высшей математики можно сделать с помощью этих двух операций, я могу и синусы, тангенсы, корни и логарифмы вычислять, и интегралы считать, и дифуры решать (см. RISC-процессоры). На базе этой операции я могу наконец построить нормальный частотный дискриминатор, т.е. выделить "цветную" составляющую (FM-модуляцию).

И, самое важное - я могу перейти к понятию соотношение.

Продвинутый читатель скажет: "не ври, инвертора здесь мало". И будет прав.

Далi буде.
 
Ответ: Зрение - сравнение как принцип работы

To the Japanese reader, who has sent the question through rudtp forum mail system - plz, use english in the request (usual google translate service), forum mail engine does not support Japanese.
 
Ответ: Cинапс колбочки с биполярной клеткой.

sabos сказал(а):
Я уделил такое внимание синапсу биполярной клетки, дабы показать, что в нашем распоряжении появился очень важный (для обработки сигналов) элемент - инвертор.
Саша, это замечательно и очень интересно.
Однако прежде, давай разберемся в том, чего мы хотим?

Ежели мы исследуем вопрос, действуя в интересах индустрии изображений -- это одно.
Ежели нам просто интересно исследовать этот вопрос, мы удовлетворяем свою познавательную потребность -- другое.
Ежели нам в первую очередь интересно + мы действуем в интересах отрасли -- третье.
Полагаю, что у нас у всех мотив все-таки третий.

Поэтому, думаю, нам прежде всего нужно понять ЧТО ПРОИСХОДИТ и ЗАЧЕМ ОНО ПРОИСХОДИТ?, а уже потом КАК ЭТО СДЕЛАНО?

Ответ на вопрос "Зачем оно (зрение) происходит?" в целом получен. Его невозможно выразить одним словом "выживание", но лишь комплексом развернутых тезисов. Эти тезисы сформулированы во второй главе и через месяцок мы с ними познакомимся.

Ответ на вопрос "Как это сделано?" можно получить только четко понимая "Что происходит?". Но идти обратным путем, т.е. анализируя устройство системы, чтобы понять процесс -- имхо, неверно. Хотя вероятно, у такого подхода есть приверженцы, способные аргументировать свою позицию и быть весьма убедительными.

Так или иначе, происходит то, что мы на входе системы имеем две дрожащих двухмерных проекции environment на двух сетчатках + два уточняющих поля, организованных fovea, а на выходе -- адекватную реальности трехмерную картину мира.

Если вспомнить евангельское чудо насыщения пяти тысяч человек из трех булок и двух селедок, то невольно начинаешь понимать, что в зрительном акте происходит нечто сходное: из двухмерной информационно-неполноценной фигни на сетчатке отрисовывается полноценная картина мира.

Тюрингов behavioral test автоматически подталкивает нас к мысли, что у нашего черного ящика не один вход (оптический), но несколько, потому как закон сохранения обмануть не получится (нынешний эк. кризис тому очередное доказательство) и невозможно из малого сделать большее без дополнительных вливаний (пусть имплицитных).

Таким образом, имхо (!): мы должны продумать информационные ходы процесса и ответить на вопрос "Что происходит?", "Откуда поступает информация?", "Какой информации достаточно?", памятуя при этом, что в природе все по Оккаму.

Только поняв информационные предпосылки зрительного акта, его входящие данные и пути вливаний, проще говоря, четко определившись с input (и ясно понимая output), можно начинать искать пути анатомо-гисто-физиологической реализации процесса.

И, если, скажем, мы понимаем, что вот это информационное преобразование невозможно без дополнительных данных, то ищем физиологический механизм получения этих данных. Например (я фантазирую), открываем для себя ламаровский принцип частотного кодирования (наряду с "классическим" амплитудным). Поняв, что иначе получить информацию о том (я фантазирую) "чем же два фотометрически идентичных стимула таки отличны друг от друга?" невозможно -- ищем и находим нейронный механизм, реализующий восприятие этого отличия. И т.п.

Предлагаемая схема размышлений, имхо, если не оптимальна, то по крайней мере заслуживает внимания.
 
Ответ: Cинапс колбочки с биполярной клеткой.

Alexey Shadrin сказал(а):
Тюрингов behavioral test автоматически подталкивает нас к мысли, что у нашего черного ящика не один вход (оптический), но несколько, потому как закон сохранения обмануть не получится (нынешний эк. кризис тому очередное доказательство) и невозможно из малого сделать большее без дополнительных вливаний (пусть имплицитных).
Как можно четко понять "Что происходит" в рамках некторого процесса, не изучив детально устройство системы, в которой этот процесс имеет место и не проследив все его шаги? И разве уже есть ясное понимание output-а? Известны все составляющие "полноценной картины мира", форма ее представления и алгоритмы формирования?
От модели формы представления "картины мира" и алгоритмов ее построения зависит, требуется ли привлечение не оптических каналов, или нет, см. например:
http://www.library.biophys.msu.ru/mce/20002410.htm
 
Ответ: Cинапс колбочки с биполярной клеткой.

emishanov сказал(а):
Известны все составляющие "полноценной картины мира", форма ее представления и алгоритмы формирования?
Да, конечно, потому как критерием полноценности является не физическая достоверность, но выживание особи и появление здорового потомства. Поэтому, когда читаешь материалы по зрению, то без должной подготовки поначалу кажется, что кругом одно словоблудие и что никто ничего толком не знает.

Что касается механизма исследования через анатомирование структуры, то в физиологии заурядной является ситуация, когда исследователь навеки застревал на функции какой-то одной клетки или группы клеток. Скажем, исследуя функцию пищеварения, некто завяз на бокаловидных клетках и в целом его это его устраивает (а ежели клетку потом назовут его именем -- так совсем здорово -- ради чего, собственно, все и делалось). Дарвин же или Павлов шли обратным путем. И результат несколько иной.
Короче, полностью поддерживаю стремление sabos двигаться дальше, но призываю при этом периодически подниматься на высоту птичьего полета, чтобы не терять ориентиров.
 
Ответ: Cинапс колбочки с биполярной клеткой.

Alexey Shadrin сказал(а):
Да, конечно, потому как критерием полноценности является не физическая достоверность, но выживание особи и появление здорового потомства. Поэтому, когда читаешь материалы по зрению, то без должной подготовки поначалу кажется, что кругом одно словоблудие и что никто ничего толком не знает.
Критерием полноценности чего, простите, является выживание особи? В мире прекрасно существуют живые организмы с разной степенью развития зрительной системы, включая ее полное отсутствие. По Дарвину - просто приспособленности к окружению.
 
Ответ: Cинапс колбочки с биполярной клеткой.

emishanov сказал(а):
Критерием полноценности чего, простите, является выживание особи?
Критерием полноценности картины мира, создаваемой зрительной системой человека в его сознании. Мы же начали с разговора о критериях полноценности картины мира.
В мире прекрасно существуют живые организмы с разной степенью развития зрительной системы, включая ее полное отсутствие.
Да, конечно. Биологическая ниша вида выводит на передний план тот или иной канал получения информации об окружающем мире. У приматов как у высокоорганизованных существ -- это оптический канал, несущий огромное количество информации. Но информация эта требуется особи не для объективных замеров расстояний, масс, плотностей, спектральных распределений, температур и пр., но лишь для эффективной категоризации объектов и оперативного ориентирования, т.е. -- для эффективнейшего выживания и размножения. Результат, собственно, налицо...
Более не намерен высказываться, потому как сказать более нечего -- все сказано гораздо более компетентными людьми, и с их данными (по обсуждаемому вопросу) мы сможем познакомиться в ближайшее время. В целом по зрительной системе перевод (буду жив) планирую закончить через три года.
 
Соотношение - измерение формы и цвета

Alexey Shadrin сказал(а):
Поэтому, думаю, нам прежде всего нужно понять ЧТО ПРОИСХОДИТ и ЗАЧЕМ ОНО ПРОИСХОДИТ?, а уже потом КАК ЭТО СДЕЛАНО?
Совершенно верно. Единственное но (ты уже второй раз эту, без сомнения важную, вещь говоришь - поэтому уточню) - мне не нужно ждать месяц, дабы познакомится с ответом на вопрос "Зачем оно (зрение) происходит?", я уже годика полтора, как плотно вопрос "зачем Главный Инженер так сделал?" изучаю. Конечно, я с удовольствием посмотрю, что у тебя на этом фронте получается.

sabos сказал(а):
Продвинутый читатель скажет: "не ври, инвертора здесь мало". И будет прав.
Да, инвертора на синапсе мало, биполярных клеток типа ON- и OFF- мало. Andrey Frenkel совершенно прав: "нейрон не может быть одновременно возбужденным и заторможенным". Или-или. Нужен еще один этап - сравнение, нужен еще один нейрон в каскаде.

Здесь я неточен, теоретически можно себе представить нейрон, имеющий оба типа дендритов - и он будет способен к вычитанию одних сигналов из других. И будет находится в соответствующем состоянии:
- в возбужденном, если ON преобладает над OFF;
- в заторможенном, если OFF преобладает над ON;
- в нейтральном, если ON=OFF (в т.ч. если сигналов нет и ON=OFF=0).

Наш "теоретический нейрон" умеет многое - например выделять "цвет" по принципу (трех)частотного дискриминатора.

Для любопытных: Так как вопрос про распознавание цвета очень часто возникает - сделаю отступление в виде задачки. В аттаче три набора фильтров - A, B, C. Пусть мы облучаем эти наборы монохроматическим излучением с заданной (единичной) мощностью и неизвестной длинной волны (один лазер). Какой из этих наборов сможет ответить - какая длина волны? Иными словами - какой набор можно назвать "измерителем"? Подсказка - это лишь один из трех наборов.

В сенсорных системах такой подход встречается, но в зрительной системе (человека) сделано сложнее. Там биполярные - лишь промежуточный этап, а сравнение идет на более высоком уровне. "Зачем Главный Инженер так сделал?"

Ответ прост - я недаром упоминал о размерностях.

Давайте изменим наш вопрос. Не "какого цвета точка?", а "как увидеть маленькую точку, практически сливающуюся с фоном?" Пусть на вопрос "какого цвета точка?" отвечают наши колориметры и спектрофотометры, глаз же ищет ответ на вопрос "как увидеть маленькую точку, практически сливающуюся с фоном?"

Мне нужен детектор, не реагирующий на крупные равномерно освещенные объекты, причем любые объекты, т.е. во всем диапазоне освещенностей и цветностей.

Элементарно - скажет инженер - нужно дифференциал взять от размера. Равномерно освещенный объект имеет нулевую производную, причем во всем диапазоне освещенностей и цветностей. А наша "маленькая точка, практически сливающаяся с фоном" - даст мощный всплеск.

Далi буде.
 

Вложения

  • frequencies_filters.png
    frequencies_filters.png
    5 КБ · Просм.: 1 025
Ответ: Соотношение - измерение формы и цвета


Не по теме:
sabos сказал(а):
Какой из этих наборов сможет ответить - какая длина волны?
Очевидно, что C, в силу необходимости получения взаимно-однозначного соответствия входа и выхода.

 
Single opponent cell - смена парадигмы

Я прошу очень "внимательно подумать" (с) над изменением вопроса с "какого цвета точка?" на "как увидеть маленькую точку, практически сливающуюся с фоном?" Это смена нашей парадигмы. Хорошая иллюстрация принципа "какой вопрос - такой ответ". Посмотрите в аттач - теперь на "оппонентность цвета" мы смотрим иначе, теперь у нас другая zone theory. Да, мы все еще делаем "вычитание колбочек", у нас похожий на Hering'a color opponent. Но теперь наша модель приобретает новые свойства, теперь она способна пояснить один из наших "феноменов", теперь она имеет связь размер(форма)-цвет.

Для математиков и программистов: По сути мы в таком колбочковом домене делаем свертку. В простейшем случае (домен из палочек или колбочек одного типа) - просто сдвигаем по пространственной. В аттаче чуть сложнее - между пространственной и частотной функцией.
 

Вложения

  • Color-Opponency.png
    Color-Opponency.png
    18.2 КБ · Просм.: 979
Ответ: Соотношение - измерение формы и цвета

emishanov сказал(а):
Очевидно, что C, в силу необходимости получения взаимно-однозначного соответствия входа и выхода.
Совершенно верно. Я на этом примере молодежи сравниваю трихроматию Грассмана и оппонентность цвета Hering'а. Показываю необходимость перехлеста и вычитания.
 
Ответ: Single opponent cell - смена парадигмы

Дополнение к Single opponent cell - смена парадигмы

В связи с появлением новой размерности - формы(размера) - наша цветоразностная теория усложняется, теперь нам нужно восемь цветоразностей (см. аттач).
 

Вложения

  • Single-color-opponent-cell.png
    Single-color-opponent-cell.png
    9.6 КБ · Просм.: 808
Ответ: Single opponent cell - смена парадигмы

В модели зрения с рецептивными полями мы можем наконец поговорить о некоторых эффектах, что не помещаются в Грассмановский трехстимульный принцип, о "феноменах". Например про индукцию фона (simultaneous contrast, см. аттач и сrispening), другие феномены связи форма-цвет, которые в современных цв. моделях получили обобщенное название "неизолированных стимулов" или связи стимул-его проксимальное поле.

Одним из важнейших психофизических доказательств ключевой роли рецептивных полей я считаю то, что что color matching (наши "священные" трихроматические cmf) разваливаются при стимулах меньше 1º. Такой стимул охватывает практически всю foveola, действуя больше чем на 25 тысяч колбочек, там должны были бы сохранится cmf-соотношения.

Для въедливых: Психофизические доказательства многие "материалисты" не любят, эти "опросы населения" нельзя "пощупать". Пощупать поможет нейрофизиология, она также дает немало экспериментальных доказательств существования таких колбочковых доменов. Если есть интерес - могу выложить парочку.

Обратите внимание, в модели зрения с рецептивными полями мы не "разрушаем" Грассмана (и Оккам не нарушен, нам не понадобилось усложнять сенсор, не нужно придавать колбочке некоторые "непознанные" свойства).

Наша модель усложнилась, но все еще не в состоянии ответить на вопрос соседней ветки Что такое "баланс белого?. Рецепторное поле заметно больше, чем колбочка, но и оно также не в состоянии "быстро охватить взглядом" сцену, выделяя из неё обобщенные (интегральные) признаки освещения.

Прежде чем перейти к color constancy, к (последнему) элементу нашей модели - процитирую Schiffman - Sensation and Perception:
У животных, имеющих сравнительно примитивную зрительную кору (например кролики и суслики), или у тех, у кого она полностью отсутствует (голуби и лягушки), сетчатка наделена способностью к весьма сложным процессам обработки и интегрирования информации.

Показателен ставший классическим нейрофизиологический анализ зрения лягушки, выявивший в ее сетчатке несколько видов, или форм, детекторов. Фиксируя нейронную реакцию отдельных волокон зрительного нерва лягушки на действие различных визуальных стимулов, авторы идентифицировали несколько разных типов нейронов, каждый из которых отвечает за реагирование на события определенного рода. Некоторые нейроны реагировали на острые края и границы, на движения краев и на общее ухудшение освещенности. Наиболее интересными оказались нейроны, названные авторами «детекторами мух», поскольку именно они лучше всего реагировали на мелкие темные предметы, мелькавшие в поле зрения лягушки...

Этот нейрон лучше всего реагирует тогда, когда в поле зрения появляется темный объект меньшего (чем рецептивное поле) размера, останавливается, а затем возобновляет движение, периодически замирая снова. На реакцию не влияет ни изменение освещенности, ни перемещение фона (скажем, изображения травы и цветов). Можно ли лучше описать систему обнаружения аппетитного насекомого?
И мы вслед повторим: "да, нас, инженеров, устраивает такой способ подавления девиаций освещения". И не только освещения, кстати.
 

Вложения

  • Simultaneous_contrast.png
    Simultaneous_contrast.png
    1.7 КБ · Просм.: 1 036
Ответ: Single opponent cell - смена парадигмы

2 Alexey Shadrin
Можешь считать эту телегу моим ответом на давний спор о "как пень вкопанных". Долго мне пришлось пробираться, и Ca++, и латеральное торможение, и rod intrusion, и Beer-Lambert - всё тестировалось (и не бесполезно, я хоть 2º и 10º научился сшивать).

Пользуясь случаем, поздравляю с выходом Ханта, титанический труд, горжусь за тебя!
 
Ответ: Single opponent cell - смена парадигмы

sabos сказал(а):
Пользуясь случаем, поздравляю с выходом Ханта, титанический труд, горжусь за тебя!
Спасибо, Саша! ~:O
 
Ответ: Single opponent cell - смена парадигмы

sabos сказал(а):
Одним из важнейших психофизических доказательств ключевой роли рецептивных полей я считаю то, что что color matching (наши "священные" трихроматические cmf) разваливаются при стимулах меньше 1º.

А в чём это выражается? Перестают действовать законы Грассмана сложения цветов? Невозможно уравнять трёхстимульной смесью образец? Или наоборот, существует много разных трёхстимульных смесей, уравновешивающих обрацез?

sabos сказал(а):
Наша модель усложнилась, но все еще не в состоянии ответить на вопрос соседней ветки Что такое "баланс белого?. Рецепторное поле заметно больше, чем колбочка, но и оно также не в состоянии "быстро охватить взглядом" сцену, выделяя из неё обобщенные (интегральные) признаки освещения.

Полагаю, рецепторное поле отвечает за одну какую-то функцию (распознавание границ, движений и т.д.) При этом кроме собственно своей функции рецепторное поле порождает некоторое количество «лишних» (неиспользованных) сведений, которые поступают в обработчик следующего уровня. Так?

Если уж совсем грубо проинтерполировать известные сведения о 1º и 2º наблюдателей, то получится, что характерный угловой размер доменов (извиняюсь за использование первого пришедшего в голову подходящего слова) следующего уровня аккурат где-то больше 1º и не больше 2º. Так?
 
Ответ: Single opponent cell - смена парадигмы

pell сказал(а):
А в чём это выражается? Перестают действовать законы Грассмана сложения цветов? Невозможно уравнять трёхстимульной смесью образец? Или наоборот, существует много разных трёхстимульных смесей, уравновешивающих образец?
Супер-вопрос. Порадовали наконец хорошим вопросом.

Стимул <1º порождает семейство cmf. Между ними есть связь, и "приятная" связь - линейная комбинация. Если еще точнее - всё семейство линейно связано с cone fundamentals. Единственная (но критичная) проблема - нет стабилизации данных, появляется стохастика.
pell сказал(а):
Полагаю, рецепторное поле отвечает за одну какую-то функцию (распознавание границ, движений и т.д.) При этом кроме собственно своей функции рецепторное поле порождает некоторое количество «лишних» (неиспользованных) сведений, которые поступают в обработчик следующего уровня. Так?
Верно, рецепторных полей много разных. В сетчатке примата (в отличие от кроликов, сусликов, голубей и лягушек) не очень много. Есть "детекторы движений", т.н. M-ganglion cells (название дано по первой букве латинского слова magnus, что значит «большой») - крупные поля с высокой скоростью реакции, они характерны для периферии сетчатки, там малая "острота зрения", но очень высокая чувствительность (объединяя большие массивы сенсоров - понижаем шум и повышаем чувствительность, но жертвуем разрешалкой). В центре зрения преобладают т.н. Р-ganglion cells (название дано по первой букве латинского слова parvus, что значит «маленький») — они менее чувствительны, шум повыше, реагируют медленно, с некоторым индукционным периодом. Но "острота" (разрешалка) очень высокая, порядка 1' (угловой минуты).
pell сказал(а):
Если уж совсем грубо проинтерполировать известные сведения о 1º и 2º наблюдателей, то получится, что характерный угловой размер доменов (извиняюсь за использование первого пришедшего в голову подходящего слова) следующего уровня аккурат где-то больше 1º и не больше 2º. Так?
Хорошо мыслите, зачет. Числа лишь уточню. Среди Р-cells также есть разброс, и немалый (10-200 мкм), если в среднем на тип (например для single color opponent или "SO"-домен) ~ 20'. Или 1/3 градуса (градус на сетчатке - это 300 мкм, связь мкм и градусов я беру из LeGrand theoretical eye - см. стр. 101 нашей "библии").

И еще важное - поля эти не "стык-в-стык", колбочка может участвовать в паре-тройке полей одновременно, и даже в полях одного типа (пусть SO +G-R) есть небольшой, уровня одна-две колбочки, перехлест (overlapping).

За "домены" не извиняйтесь - я также receptive field часто доменом называю.
 
Ответ: Зрение - сравнение как принцип работы


Не по теме:
А вот затронули тему Color Constancy и вспомнилось. С год назад со мной глюк такой приключился. Жил тогда в Саратове, ходил на работу пешком, примерно 20 минут прогулочным шагом вдоль проспекта. По нему постоянно ходили автобусы, покрашенные в рыжую и красную широкую горизонтальную полоску. Иду как-то на работу, обгоняет меня тихим ходом очередной красно-рыжий автобус, я на него не смотрю, о своём думаю. Перевёл взгляд в сторону, возвращаю — нет автобуса! Т.е., автобус есть, но не красно-рыжий, а оранжево-бежевый. Полоски точно тех же форм и размера, но цвет другой, заметно другой.

Это что, пока я вижу автобус перефирическим зрением, цвет услужливо подрисовывается «из головы» по памяти? И дальше происходит локальная адаптация под то, что голова уже подрисовала? Или просто от недостатка сна действительно что-то сбойнуло в голове?

 
Ответ: Зрение - сравнение как принцип работы

all
А вот сомнения обуяли. Раньше думал, что знаю ответ, а сегодня засомневался что-то.

Color constancy и хроматическая адаптация — это один механизм или нет? Вроде бы локальную хромадаптацию можно на той же (прошу прощения за механистический термин) элементной базе построить, что и color constancy?
 
Статус
Закрыто для дальнейших ответов.