Хорошо известный, но плохо изученный

Статус
Закрыто для дальнейших ответов.
Ответ: Хорошо известный, но плохо изученный

Любопытно и то, что и эта сугубо выборочная информация подвергается затем дискретизации, фактически — оцифровке: плавный первичный сигнал колбочек моментально этими же колбочками преобразуется в импульсный сигнал постоянной амплитуды, но переменной частоты (т.е. подвергается частотному кодированию)

Здесь небольшая путаница в терминах. Преобразование из амплитудно-модулированной формы в частотно-модулированную дискретизацией (оцифровкой) не является, сигнал остается непрерывным.

подвергается дальнейшей компрессии (кстати, удивительно схожей с JPEG-компрессией и с тем, что происходит при экономии полосы пропускания в телевизионных системах).

В этом совпадении не будет ничего удивительного, если учесть то, что инженеры, проектировавшие системы цветного телевидения, были знакомы с работами H.R. Blackwell и других, исследовавших пространственную разрешающую способность (CSFs) зрения. Откуда элементарная логика и дает готовое решение по упаковке сигналов. Это же касается и JPEG, и других physiology-based форматов сжатия. Здесь не удачное совпадение, это реальность так устроена - у эволюции и у инженера действуют одни законы и есть одно оптимальное решение.

прихожу к выводу, что саккады -- это вынужденная мера, обеспечивающая именно высокую скорость восприятия высокочастотной информации.

Здесь также не соображу в терминологии. Высокая скорость восприятия противоречит саккаде, саккада здесь мешает, замедляет. Наивысшую скорость восприятия у нас имеет M-канал (магноцеллюлярные клетки), он имеет очень низкое пространственное разрешение. Видимо здесь имеется ввиду полоса пропускания зрительного канала. Полоса пропускания расходуется и на пространственное разрешение, и на временное. Если одновременно повышать и первое, и второе - полоса пропускания растет в геометрической прогрессии. Эволюция такого себе позволить не могла, она экономно распределила полосу по трем назначениям:

1. Высокая скорость восприятия (и высокая чувствительность) с низким пространственным разрешением (и нулевым цветовым).
2. Низкая скорость восприятия (но высокая чувствительность) с низким пространственным разрешением (и невысоким цветовым).
3. Низкая скорость восприятия (и невысокая чувствительность) с высоким пространственным разрешением (в т.ч. цветовым).

Лишь третье назначение построено на fovea и интенсивно пользует сканирование (в т.ч. саккады).

На примере охранной видеосистемы - пусть она состоит из двух камер, обе с невысокой разрешающей способностью (экономим полосу пропускания), первая камера широкоугольная (её угловая разрешающая способность невысока), черно-белая, неподвижная, работает со скоростью 25 кадров в секунду. Вторая подвижная, цветная, её угловая разрешающая способность высока, но очень малое поле зрения - мы ею рассматриваем лишь самые важные события в нашем секторе наблюдения, наводясь по информации от первой камеры. Первая камера не сможет прочитать номер подозрительного автомобиля, это умеет вторая, если успеет навестись.

В дискуссии о том, какое значение имеют саккады - сама постановка вопроса мне не нравится. Зрение реализует несколько разных функций, для одних саккады имеют первостепенное значение, для других - наоборот вредны. Для того, чтобы уберечь глаз от летящей соринки, не нужно наводить на неё центр высокого разрешения и распознавать форму этой соринки, вполне достаточно зарегистрировать факт "опасное движение". Обратный пример - социальные функции, они невозможны без хорошего ("высокочастотного") распознавания формы, пусть гримасы вожака стада.

На любой иллюстрации, изображающей зрительные трэки видно, что они следуют в основном вдоль пространственных краев, а по классификации это не самые высокочастотные.

Контур, края - самый высокочастотный компонент изображения. Сам принцип разделения пространственных частот, его идею легко увидеть в фотошопе, фильтр blur выделяет низкочастотные компоненты изображения, а high-pass - высокочастотные.
 

Вложения

  • spatial-frequency.jpg
    spatial-frequency.jpg
    133.8 КБ · Просм.: 942
Ответ: Хорошо известный, но плохо изученный

Базовый принцип зрительных систем нашего типа - анализ изменений ВОМ, т.е. анализ контрастов.

Здесь у нас разногласий нет. Именно анализ изменений я имел ввиду полтора года назад, говоря Зрение - сравнение как принцип работы. О своей точке зрения на роль рассматривания и саккад в т.ч. я ответил выше.

Саккады (не микро) не бывают рефлекторными.

Llewellyn-Thomas, 1969, р. 406 «...обычно, саккады — управляемые движения, ибо они совершаются и с закрытыми глазами, и в полной темноте, их также можно либо вызвать сознательно, либо подавить. Однако они также и рефлекторные движения: внезапно появившийся, прерывистый или двигающийся стимул, увиденный лишь боковым зрением, может вызвать непроизвольную саккаду, которая направит взгляд прямо на него. Это обстоятельство имеет большое значение для выживания, поскольку в животном мире малейшее движение, увиденное боковым зрением... может оказаться первым признаком возможного нападения».

Очень важно отметить не только контекстнозависимость саккад (как осязания, так и зрения), но и их «целезависимость» (как это будет по-научному?).

Zingale & Kowler, 1987 «Саккады — это движения баллистического типа, так как они имеют конкретную цель и заданное направление. Это значит, что их частота, угловая скорость и направление спланированы нервной системой заранее, еще до их реализации. Подобно многим произвольным моторным действиям, выполняемым с участием конечностей и пальцев, саккады уже заранее спланированы в виде последовательности движений, совершаемых по определенной схеме».

Мне кажется, неправильно говорить, что «склеиваются картинки».

Уж прости за упрощение, отвечал неподготовленной аудитории.

Информация о контрастах уже на уровне сетчатки преобразуется в предположения (неоднозначные) о свойствах предмета, который задал эти контрасты.

Это перегиб, сетчатка — простенький калькулятор, она слишком примитивна для того, чтобы делать предположения.
 
Ответ: Хорошо известный, но плохо изученный

Всем - привет.

Пока отвечу только на то, на что могу быстро.
Например, хотя бы стереопсис Леонардо совершено не ложится в эту идею, да и бинокулярное зрение в целом.
Этот вопрос пересекается с
Гибсон говорит о точке наблюдения? Как центральное понятие экологической оптики это кажется странным, ведь "оптических аппаратов" в общем-то два у всех животных...
У Гибсона этот очень скользкий момент, но мне представляется все гораздо проще: Зрительная Система может иметь несколько Точек Наблюдения. Вот тогда будет и Леонардо и стереоскопия и прочее. А если у ЗС будет четыре ТН, можно получить чего и всем художникам не снилось.
два у всех животных...
Ну, пауки тоже животные, а глазиков то у них поболе будет. А многие змеи имею и вовсе две независимые ЗС: подобную нашей, основанной на анализе отражении, и инфракрасную, анализирующю излучения.
Знаю, что скажу очевидную вещь, но все равно скажу: восприятие переферическим зрением обеспечивает предварительное распознавание, а это в свою очередь определяет направление саккады, так что здесь ни пространственные частоты, ни размер объектов не являются определяющими.
Мне и добавить особо нечего отвечая на:
упор на сканирование -- несколько однобокий подход, на мой взгляд.
Наше зрение обходится с Теорией Информации предельно грубо: оно просто откидывает почти всю информацию не нужную в данное мгновение, а что не нужно, что нужно и что понадобится в следующее мгновение определяет по черновику (низкие частоты), предоставляемому всей сетчаткой, и исходя из здравого смысла.

С уважением, Андрей Френкель.
 
Ответ: Хорошо известный, но плохо изученный

Высокая скорость восприятия противоречит саккаде,
Бестолково я выяснился -- поясню: саккады реализуют выборочность передачи высокочастотной информации, то есть убыстряют ее передачу настолько, насколько можно -- за счет фрагментарности. В противном случае всё затянулось бы настолько, что несовместимо с выживанием.

(Разумеется, наибольшая скорость передачи по магнопути -- т.е. по низкой частоте.)
 
Ответ: Хорошо известный, но плохо изученный

определяет по черновику (низкие частоты), предоставляемому всей сетчаткой

Бестолково я выяснился -- поясню: саккады реализуют выборочность передачи высокочастотной информации

Не пойму, по какому критерию происходит это деление низко/высокочастотный.

Пусть у меня стоит два монитора. Первый огромный, диагональ 80 см, имеет разрешение 640x480 24bit/pixel @120 Гц, второй маленький, диагональ 30 см, разрешение 1280x1024 8bit/pixel @72 Гц. Кто из них «высокочастотный»?

Полоса пропускания первого: 640x480x24x120 = 885 Mbps = 110 мегабайт в секунду.
Полоса пропускания второго: 1280x1024x8x72 = 755 Mbps = 94 мегабайт в секунду.

Второй «низкочастотнее», но имеет в девять раз более высокое угловое разрешение.
 
Ответ: Хорошо известный, но плохо изученный

Наше зрение обходится с Теорией Информации предельно грубо: оно просто откидывает почти всю информацию не нужную в данное мгновение, а что не нужно, что нужно и что понадобится в следующее мгновение определяет по черновику (низкие частоты), предоставляемому всей сетчаткой, и исходя из здравого смысла.
Это твоя версия. Тебе хочется, чтобы было так, потому что представляется логигчным. Но как на самом деле, ни тебе, ни мне неизвестно. По институтским годам помню, как формальная логика прокалывалась на каждом шагу, когда начинали рассуждать о работе биологических систем. К сожалению, логические попытки постичь Замысел чаще всего приводят к ошибкам. Биологические науки таковы, что открытое приходится тупо учить. Чем и предлагаю заняться, материала уже достаточно. Ну, а я продолжаю работу над 6-й главой.
 
Ответ: Хорошо известный, но плохо изученный

Всем привет.
Это твоя версия. Тебе хочется
С чего это ты решил? Это факты:
Да, сенсоров много, но мы отлично помним, что подавляющее большинство их (на периферии) объединяется еще перед ганглиозной клеткой. Сильное усреднение, до десяти тысяч сенсоров в одну клетку. А что в fovea, а тем более что в foveola? А там уже не столько объединение, не столько сжатие, сколько "разжатие". Там всего порядка ста тысяч (10^5) сенсоров, но они отдают информацию в 5*10^9 синапсов-нейронов-"обработчиков" сетчатки. Это огромное соотношение,
Если ты помнишь, я уже очень давно говорю о неприменимости здесь термина сжатие.
логические попытки постичь Замысел чаще всего приводят к ошибкам
Что такое замысел как не логическая конструкция? Иногда логику увидеть трудно, но это не значит, что ее нет.
формальная логика прокалывалась на каждом шагу, когда начинали рассуждать о работе биологических систем
Это по причине недостатка знаний. Чем больше фактических знаний, тем яснее логическая конструкция.
открытое приходится тупо учить
Ты предлогаешь тупо учить Фершильда или Пальмера с их благоглупостями? Или Гибсона, уже с откровенной мистикой? Или Марра, которого зрение человека всегда интересовало постольку-поскольку: ему нужно было создавать машинное зрение? Ну и т.д. Можно я буду знакомиться с разной литературой в разной степени подробно? Я знаком с весьма большим количеством литературы, но тупо учить я категорически ничего не согласен.
Ну, а я продолжаю работу над 6-й главой.
За что тебе огромное сердечное спасибо.

С уважением, Андрей Френкель.
 
Ответ: Хорошо известный, но плохо изученный

Не пойму, по какому критерию происходит это деление низко/высокочастотный.
Виноват, выпендрился.
Это перегиб, сетчатка — простенький калькулятор,
Да, погорячился. Сетчатка только препарирует (преобразует) информацию для дальнейшего использования.
Однако они также и рефлекторные движения: внезапно появившийся, прерывистый или двигающийся стимул, увиденный лишь боковым зрением, может вызвать непроизвольную саккаду, которая направит взгляд прямо на него.
"Рефлекторно" - это я зря, но важно то, что дальше: саккады обязательно осмыслены, даже если они не осознаны. Т.е. эта саккада не случайна, ее смысл - "направить взгляд прямо на него"

Здесь у нас разногласий нет. Именно анализ изменений я имел ввиду полтора года назад, говоря Зрение - сравнение как принцип работы.
Ну да, я тогда тоже осознал важность именно изменений в ВОМ, и в [ http://forum.rudtp.ru/showthread.php?t=38262&p=429304&viewfull=1#post429304 ] очень старался обозначить важность сравнений. Но выглядит сейчас очень коряво. :)
В дискуссии о том, какое значение имеют саккады - сама постановка вопроса мне не нравится. Зрение реализует несколько разных функций,
Конечно, но согласись: большАя часть информационного потока, идущего по зрительному нерву, обеспечивается именно саккадами, поэтому невозможно игнорировать их влияние ни на какие (почти) последующие процессы. Все входные данные (почти) для работы визуальных систем мозга зависят от предшествующих саккад.
 
Ответ: Хорошо известный, но плохо изученный

Кстати, Андрей должен помнить, как в июле 1997 г я на две недели остался без очков (они утонули в бурной карельской речке) -- и ничего, справился с проблемой сразу (хотя было и неприятно).
Способности сознания адаптироваться просто потрясающие. Но в полной мере заменить физиологические пробелы они не способны. Я последние несколько лет с интересом наблюдаю, как мое 100% зрение потихонечку уходит. Это очень поучительно. Например, то на распознавание чего раньше уходило мгновение, теперь требует рассматривания и размышления. Это делает видимой цепочку выдвигаемых предположений и логических рассуждений.
саккады -- это второстепенное свойство зрительной системы
Не могу согласиться. Именно они обеспечивают большУю часть информации.
Но при этом вовсе не значит, что информация, проходящая по высоким частотам, обладает особо высокой биологической значимостью. Просто, в силу природы, ее много -- больше чем информации по средним и тем более низким частотам.
Больше той информации, которая нужнее развитой зрительной системе. Среагировать не движущийся объект может и муха.
 
Ответ: Хорошо известный, но плохо изученный

На любой иллюстрации, изображающей зрительные трэки видно, что они следуют в основном вдоль пространственных краев,
Именно вдоль. В общем случае не "исследуют края", а скользят вдоль, определяя контур. Контур наиболее стойкий оптический признак предмета.

Здесь, скорее всего, и ответ на начальный вопрос: когда полей только два, взгляд скользит вдоль границ каждого по отдельности и Chevreul effect не возникает. Если полей много взгляд скользит вдоль всей шкалы и эффект возникает.
И в этом, кстати, отличие от "слепого" осязания - глаз обычно "знает" куда он в следующий момент "нацелится"
Верно тут саккады поначалу совершенно хаотичны, но в целом очень наглядно.
А есть идеи? Могу подогнать испытуемых в количестве сколько хотите
Идеи есть, но кроме испытуемых нужен еще окулограф. Пол-царства за окулограф!!! Откуда у меня пол-царства???
 
Ответ: Хорошо известный, но плохо изученный

Контур, края - самый высокочастотный компонент изображения. Сам принцип разделения пространственных частот, его идею легко увидеть в фотошопе, фильтр blur выделяет низкочастотные компоненты изображения, а high-pass - высокочастотные.

Ключевое слово изображение. Вы правы, в изображении да, но не при восприятии пространственных объектов. Тут то, о чем говорил Алексей: Фотошоп - дурак, он не отличает пространственные и вещественные края. Потому приходится после шарпинга орудовать ластиком, возвращая пространственным краям легкое размытие, чтобы не потерять визуальный объем...

Когда Алексей на лекции сказал, что пространственные края - это группа средних пространственных частот (не отпирайтесь, Вы это говорили - у меня записано, подчеркнуто, и стоит жирный вопрос:)), я сперва стала бунтовать, мне тоже казалось, что пространственный край - высокочастотный стимул, но с другой стороны, чем ближе к наблюдателю объект, тем больше разница между контурами этого объекта в ретинальных проекциях левого и правого глаза, а значит пространственный край как-бы "размазывается" из-за бинокулярности, потому вполне логично, что он попадает под определение средних частот.

У Гибсона этот очень скользкий момент, но мне представляется все гораздо проще: Зрительная Система может иметь несколько Точек Наблюдения. Вот тогда будет и Леонардо и стереоскопия и прочее. А если у ЗС будет четыре ТН, можно получить чего и всем художникам не снилось.
Логично, но это уже вроде бы не Гибсон? У него, я так поняла, четко: одна особь -одна Т.Н.
 
Ответ: Хорошо известный, но плохо изученный

Логично, но это уже вроде бы не Гибсон? У него, я так поняла, четко: одна особь -одна Т.Н.
Мне потупиться? :)
С уважением Андрей Френкель.
 
Ответ: Хорошо известный, но плохо изученный

пространственный край как-бы "размазывается" из-за бинокулярности
Неуверен. Самый простой аргумент: двумя глазами мы видим лучше, чем одним. Даже если это край.
Мне история с краями вообще не очень нравится: это самая общая задача, определить что означает перепад яркости: край, светотень или изменение свойств поверхности. Решается это выдвижением массы предположений и выбором таких из них, которые не противоречат друг другу. И не важно что там на самом деле, иначе мы не могли бы смотреть изображения. Резкость линии здесь где-то на двадцатом месте, я думаю.
 
Ответ: Хорошо известный, но плохо изученный

Мне история с краями вообще не очень нравится: это самая общая задача, определить что означает перепад яркости: край, светотень или изменение свойств поверхности. Решается это выдвижением массы предположений и выбором таких из них, которые не противоречат друг другу.
Может, все-таки стОит вначале внимательно почитать о классификации краев и механизмах краевой детекции?
 
Ответ: Хорошо известный, но плохо изученный

Может, все-таки стОит вначале внимательно почитать о классификации краев и механизмах краевой детекции?
Прочитал еще раз. Честное слово. Извини, остаюсь при своем мнении. При классификации краев, степень их размытости - дело двадцатое.

Леша, я всегда ищу несоответствия и занимаюсь критиканством. :) Тебе уж пора бы привыкнуть. В конце концов, это же не ты написал. Переводчик за переводимого не отвечает. :) А если бы ты не перевел, что бы я критиковал?

С уважением, Андрей Френкель.
 
Ответ: Хорошо известный, но плохо изученный

Прочитал еще раз. Честное слово.
Я же сказал -- внимательно. Это значит -- обучаясь (а, не выбирая из текста лишь то, что подходит под твои сиюминутные представления о предмете). У нас нынче под вывеской самостоятельности и независимости мышления чаще прячется банальная лень.
При классификации краев, степень их размытости - дело двадцатое.
Потому что тебе так хочется, но не потому, что у тебя есть научные данные, опровергающие пространственно-частотный подход к вопросу.
Леша, я всегда ищу несоответствия и занимаюсь критиканством.
Указаний на несоответствия не прозвучало. Прозвучало лишь: "Я прав, потому что Я так хочу". Это даже не критиканство -- это песочница.
Тебе уж пора бы привыкнуть. В конце концов, это же не ты написал. Переводчик за переводимого не отвечает. А если бы ты не перевел, что бы я критиковал?
Во-первых, не собираюсь привыкать ко злу; во-вторых, я перевожу не для огульной и немотивированной поливы под вывеской критики, а для учения. Ко всем нам применима формула Булгакова (устами Преображенского): "Молчать и слушать!". И прежде чем критиканить нужно добротно освоить вопрос, на что пока нет и намека.
Учиться тяжело и лениво. Но есть лазейка: борьба с антидогматизмом и "критический подход".
 
Ответ: Хорошо известный, но плохо изученный

Привет, Алексей.

Попробую остаться в рамках вежливости. Но я бы не рекомендовал тебе продолжать в том же тоне.

Мне для понимания двух раз достаточно. Чтобы опровергнуть тезис про особую важность степени размытия краев достаточно посмотреть вокруг и немного подумать.

Блин!

С уважением, Андрей Френкель.
 
Ответ: Хорошо известный, но плохо изученный

Но я бы не рекомендовал тебе продолжать в том же тоне.
Я говорю в том тоне, в котором считаю нужным и ни в чьих рекомендациях не нуждаюсь.
Чтобы опровергнуть тезис про особую важность степени размытия краев достаточно посмотреть вокруг и немного подумать.
Опровержения не прозвучало. Опровержением может служить только комплект научных данных, свидетельствующих о том, что фурье-подход несостоятелен. У тебя таких данных нет и быть не может. Представители трех разных школ: Беркли (Palmer), Стэндфорда (Wandell) и практикущих офтальмологов США (Schwartz) единодушны в принятии концепции пространственно-частотных каналов. Нобеленосцы Хьюбел и Визель свидетельствуют о рецептивных полях, селективных по пространственной частоте краев. И т.д. Все эти люди не удосужились "посмотреть вокруг и немного подумать"? Не слишком ли самонадеянно?

"Молчать и слушать!", засунув гордыню в одно место -- это единственное, что от нас требуется.
 
Ответ: Хорошо известный, но плохо изученный

Ключевое слово изображение. Вы правы, в изображении да, но не при восприятии пространственных объектов... вполне логично, что он попадает под определение средних частот.

Попытался я проследить, откуда возникло предположение о роли средних пространственных частот. Ноги явно растут от алгоритма распознавания краев Marr-Hildreth, они предложили использовать сочетание дифференциального оператора Лапласа с двумерной сглаживающей функцией Гаусса. Это не очень удачный алгоритм, он склонен генерировать ложные контура, для борьбы с этим недостатком алгоритма приходится повышать Гауссово сглаживание, т.е. давить высокие частоты в анализируемом (исходном) изображении (автоматически теряя деталировку). Почему Марр посчитал именно этот, не очень надежный алгоритм, основой человечьего механизма распознавания краев - я не знаю. Математикам хорошо известен более продвинутый алгоритм Canny, могу предложить его реализацию для matlab, впрочем, поэкспериментировать можно и без тяжелой артиллерии, online здесь.

Если исходить из предположения (imho логичного), что у эволюции и у инженера действуют одни законы и есть одно оптимальное решение, то очень сомнительно, что в зрительной системе упор будет делаться на несовершенный Marr-Hildreth edge detection. Скажу больше, сомнительно, что в первичке зрительной системы упор вообще будет делаться на edge detection. Никакой наилучший алгоритм полноценно контура не выделит, ибо в исходнике (оптическом) контура уже нарушены (перекрытие и пр.). Более разумным на первичном уровне обработки, imho, выделять "особенности", features в изображении, собственно, как я уже отмечал, Mapp в итоге также пришел к этому выводу (см. Blob detection).

Конечно, Chevreul effect (также Mach Band Illusion, Hermann grid illusion, Cornsweet illusion) на который обратил внимание ув. Andrey Frenkel, наводит на мысль о фильтре высоких частот (точнее усилителе, свертке) где-то в первичной обработке, которая усиливает градиенты на краях, что помогает их обнаружить. Функция ли это рецептивных полей или латерального торможения нейронов - не знаю, нужно уточнить. Но уверенно скажу, Mach Band Illusion - эффект простенький, не вижу причин для его пояснения привлекать что-то очень умное и сложное.

Когда Алексей на лекции сказал, что пространственные края - это группа средних пространственных частот ... я сперва стала бунтовать

Очень хорошо, что стали бунтовать, что не принимаете информацию на веру и критично относитесь даже к авторитетам. Это основа научного способа мышления, только так можно научится размышлять в нашей науке (и не только в нашей).

Хочу подчеркнуть еще один важный научный принцип - сперва смотрим на факты. Я недаром привел пример разделения частот. Пусть фотошоп глуп, пусть это тупая машина, после которой нужно много дорабатывать - но фотошоп выделяет нам факт. Смотрим на высокочастотную компоненту и видим там ... что? Никакие высокомудрые гипотезы и умозрительные конструкции не могут опровергнуть этот факт, все они должны этот факт объяснять. Противоречат факту - безжалостно отбрасываем.

но с другой стороны, чем ближе к наблюдателю объект, тем больше разница между контурами

Да, этот метод известен, но с уточнением, он не "размазывает" границы, он их наоборот подчеркивает - это т.н. метод, использующий согласованность фаз. Кстати, очень качественный алгоритм.
 
Статус
Закрыто для дальнейших ответов.