Ответ: Sos!!!
->Dr.Caligari
Я не то-чтобы Вас не понял. Я, просто, выступаю сильно против того, что Вы говорите. Хотя уже не раз пожалел о том своем первом - столь радикальном - сообщении. (Пытался радикальностью и резкостью сократить объем сообщения).
Что касается флейма, под общий заголовок сообщения "Sos!!!" такой флейм вполне подходит, как мне кажется. Виталий, я надеюсь, сообщит вначале, если что не так, перед тем как нам баны раздавать.
I.
Насчет распознавания образов. Классическая задача - OCR, да? Что мы имеем на входе? Набор пикселей. Что на выходе? Знак алфавита.
Еще раз. У нас в начале не было буквы. А потом она появилась. Сходная - хотя и немного другая - ситуация и при распознавании отпечатков пальцев или сетчатки. Там идентифицируются два и более разных варианта одного и того-же образа.
Что с телепрограммой? Название фильма запрятано среди комментариев. Т.е. оно не отсутствует в исходной информации. Распознавать его ОБРАЗ в принципе не нужно. Нужно как-бы распознать или идентифицировать, что вот эта данная последовательность букв и является названием фильма.
Наверное это можно назвать задачей распознавания, но вряд-ли - распознавания именно образов. Методология и технология здесь другая. Это скорее грамматический разбор предложения.
II.
Если мы рассматривает грамматический разбор, это скорее напоминает, те проблемы, которые возникают при создании электронных переводчиков. Судя по качеству их работы, нерешенных проблем в этой области предостаточно.
Как и классическое распознавание образов, грамматический разбор - весьма интеллектуальная и наукоемкая задача. Я считаю, что эти методы вряд-ли могут иметь экономически обоснованное применение именно для этой - весьма узкой - задачи. В то же время никакое упрощение здесь не годится. Потенциально, запутать такую усеченную программу распознавания будет очень легко. Я поэтому и говорю о забивании гвоздей системным блоком.
III.
Как распознавание чего бы то ни было решит Вашу проблему изменения времён начала передач?
(ср. с базами данных).
IV.
Если всё-же такая программа и будет создана, то к чему это приведет? Прежде всего, к еще большей расхлябанности среди тех, кто такую информацию предоставляет.
(ср. с базами данных)
То, что предлагаю я - это путь к стандартизации. Вы предлагаете путь к поощрению человеческого разгильдяйства. "Зачем мне заботится о корректности своей информации? Программа, - типа, - сама всё исправит!"
____________________________________
Я не спорю, что для сиюминутной задачи по оперативной верстке программы передач вот здесь и вот сейчас, мое предложение, - как впрочем и Ваше, - имеет мало смысла.
Путь через "5 человек", о котором Вы говорите, мне представляется вполне адекватным. Мы один раз таким образом решали задачу вытаскивания текста из PDF. Оказалось весьма эффективным: 60 листовок, 2 машинистки, 4 часа работы.
В таком объеме именно с этой(!) задачей я, действительно, никогда не сталкивался. А про оптимизм я ничего не говорил. В данном случае никакого оптимизма у меня нет. Я просто перичислял набор инструментов, которые помогут в решении этой задачи. Есть ещё, кстати, интеллектуальный поиск/замена ОРФО. Он умеет с разными словоформами работать.