ПРОМТ и иже с ним.

  • Автор темы Автор темы JAW
  • Дата начала Дата начала
интервалом в несколько часов, причем один из них будет издевательским и даже нецензурным
Ну, я не перевожу столь популярные тексты :) Да и лёгкое знание языка таки тоже не повредит, чтобы отделить зёрна от плевел.

Ну, насчёт нейронной сети, это, конечно, что ею называть...
Для меня это структура данных, что под ней сейчас понимают, я давно уже вне этой темы.
 
Фактически это означает, что каждую фразу переводит легион злых анонимусов
Нет, конечно, сопоставляются человеческие переводы структур и на их основе конструируется новый перевод.
Более того, анализируются и правки переводов.

В общем и целом мы все обучаем систему.

Я вон, удивился, что обратный перевод у Гугла оказался просто 1:1, и это не с проста. Возможно, что он за мной следит :)
 
  • Спасибо
Реакции: suntory
Нет, конечно, сопоставляются человеческие переводы структур и на их основе конструируется новый перевод.
Более того, анализируются и правки переводов.
На самом деле, если на пальцах объяснять понятным языком, то это как будто по твоей фразе провели всенародный референдум, в котором помимо предложенных вариантов разрешили свои вписывать ;)
 
Фактически это означает, что каждую фразу переводит легион злых анонимусов
Фактически означает, что ты не понимаешь, что такое статистический перевод. Думаю пользовательские исправления это ничтожная доля, заметная только в отдельных, испорченных флешмобах фразах.
 
Ну я так понимаю, что и ты не понимаешь. Мы с тобой одинаково не понимаем не так ли?
Думаю пользовательские исправления это ничтожная доля, заметная только в отдельных, испорченных флешмобах фразах.
То, что такие флешмобы вообще возможны, говорит о правильности моего сравнения
 
  • Спасибо
Реакции: Jeine
Мы с тобой одинаково не понимаем не так ли?
Ты совсем не понимаешь. Это сравнение иллюстрирует полное непонимание
То, что такие флешмобы вообще возможны, говорит о правильности моего сравнения
Статистический изучает готовые профессиональные переводы, а флешмобы это уже пользовательские исправления, не имеющие к нему отношения. Это уже гибридные технологии
 
Последнее редактирование:
Статистический
Хм...

С такими массивами размеченного лингвистического материала, включающего в себя, в том числе, параллельные тексты, мне кажется качество машинных переводов очень быстро дойдёт до идеального.
Резкий качественный скачёк произошёл, по ощущениям года два назад. Вероятно подключили какие то ранее разрабатываемые алгоритмы. Теперь качество просто на глазах растёт.

Лично мне сейас в Гугле не хватает возможности уточнения и исправления переводов, чтобы можно было подставить другое слово из набора. Профессинальный движок это позволяет, но им в повседневной жизни неудобно пользоваться.
 
Ты совсем не понимаешь. Это сравнение иллюстрирует полное непонимание

Статистический изучает готовые профессиональные переводы, а флешмобы это уже пользовательские исправления, не имеющие к нему отношения. Это уже гибридные технологии
Твои ссылки замечательно иллюстрируют мою правоту - алгоритмы печатают бюллетени, а анонимусы заполняют их (а при желании портят)
 
ссылки замечательно иллюстрируют мою правоту
А почитать не пробовал?
а анонимусы заполняют их
Нет, основной объем перевода уже есть, пользователи к битекстам не имеют никакого отношения.
а при желании портят
Результат этого глупого занятия видят только другие глупые анонимусы по ссылке/наводке. Реальный пользователь сталкивается с ними крайне редко.
'fp''otbline'
 
А почитать не пробовал?

Нет, основной объем перевода уже есть, пользователи к битекстам не имеют никакого отношения.
Ну да, варианты в бюллетени впечатаны. Но периодически обновляются по данным соцопросов.
Результат этого глупого занятия видят только другие глупые анонимусы по ссылке/наводке. Реальный пользователь сталкивается с ними крайне редко.
'fp''otbline'
Да периодически сталкиваются все. И устойчивость коллизий напрямую зависит от лени и адекватности избиркома. Хорошо приведу тебе более классово близкий пример. Допустим есть некий форум, на котором есть движок, модераторы, администраторы. Движок фильтрует ботов, спаммеров и забаненных неадекватов. Но пишут ответы на нем живые люди и запросто в воскресный день когда администрация пребывает в вечерней неге, может обьявиться некий сферический пэйпермэн, который зафлудит все темы нетематическим мусором так, что посторонний человек, заглянув на форум увидит во всех темах только его.
Такое конечно случается редко но вполне реально и результат достаточно устойчив.
 
Но периодически обновляются по данным соцопросов.
Нет, основной объем не меняется. В битекстах тоже есть мат, а машинный переводчик может случайно выдать смешной результат неумышленно.
Хорошо приведу тебе более классово близкий пример.
Он не близкий и твое понимание такое же неверное, по внешним проявлениям и домыслам. Администрация c:( заметила ManPaper с первого поста и наблюдает. 'popcorn'
посторонний человек, заглянув на форум увидит во всех темах только его
Ну это вчера, а в остальное время увидит тебя.
 
Последнее редактирование:
Нет, основной объем не меняется. В битекстах тоже есть мат, а машинный переводчик может случайно выдать смешной результат неумышленно.
Ты хочешь сказать что битекстовая база та же самая, что и во времена основания гуглпереводчика и алгоритм просто выдергивает случайные варианты из нее? Ну хорошо, даже не случайные, а по результатам референдума?
Он не близкий и твое понимание такое же неверное, по внешним проявлениям и домыслам. Администрация c:( заметила ManPaper с первого поста и наблюдает. 'popcorn'
Они наблюдают? А в какой момент искусственный интеллект решит что нецензурный перевод немного не годится?
Ну это вчера, а в остальное время увидит тебя.
Меня он там не увидит вообще
 
что и во времена основания гуглпереводчика
Ну может постоянно пополняемая такими же битекстами. Референдум основную массу не меняет, люди чаще просто читают даже не глядя на варианты. Варианты на основании сравнения текстов, а не случайные. Потом у Гугла он гибридный, там и нейросеть есть. Зависит как я понимаю от пары языков и т.п.
Меня он там не увидит вообще
Почему же, обычно больше всех постов за день у тебя. Не в этих темах, так в других.
 
Вот тут всё, вероятно, про англо-русский и русско-английский.
Была необходимость перевода на грузинский.
Это просто праздник какой-то. Просто хтонический праздник.
Конечно, я не пробовал офлайновый промт. У меня его нет. Но и гугл, и яндекс такое выдавали, что просто закачаешься.
 
Ну так там и битекстов мало, и перевод скорее всего не прямой и пользователи даже вредному обучают мало.
 
Таккое впечатление было, что много.
 
Как ты кстати оценил качество перевода? Знаешь грузинский?
 
Ну может постоянно пополняемая такими же битекстами.
Ага значит все таки кто-то бюллетени перепечатывает?
еферендум основную массу не меняет, люди чаще просто читают даже не глядя на варианты.
Те кто не читают - в референдуме не участвуют, просто выкидывая свой бюллетень в корзину. Причем, нифига, все равно участвуют косвенно - своей пассивностью они подтверждают право кандидата с нецензурным именем.
Варианты на основании сравнения текстов, а не случайные.
Ну хорошо хоть признал.
Почему же, обычно больше всех постов за день у тебя.
Ты так говоришь, как будто в этом есть чтото плохое. Померяемся постами? '))'
 
Ага значит все таки кто-то бюллетени перепечатывает?
В смысле? Причем тут бюллетени, битексты это не голосование юзеров, это работа переводчиков.
Ну хорошо хоть признал.
Что признал?
Те кто не читают - в референдуме не участвуют, просто выкидывая свой бюллетень в корзину.
Ты уперся в эти пользовательские правки. У тебя есть инфа какой процент их влияния на перевод и какой процент вредных и полезных? Полагаю их совсем бы отключили, если бы вред превалировал.