ПРОМТ и иже с ним.

JAW

Топикстартер
15 лет на форуме
Сообщения
15 797
Реакции
3 454
интервалом в несколько часов, причем один из них будет издевательским и даже нецензурным
Ну, я не перевожу столь популярные тексты :) Да и лёгкое знание языка таки тоже не повредит, чтобы отделить зёрна от плевел.

Ну, насчёт нейронной сети, это, конечно, что ею называть...
Для меня это структура данных, что под ней сейчас понимают, я давно уже вне этой темы.
 

JAW

Топикстартер
15 лет на форуме
Сообщения
15 797
Реакции
3 454
Фактически это означает, что каждую фразу переводит легион злых анонимусов
Нет, конечно, сопоставляются человеческие переводы структур и на их основе конструируется новый перевод.
Более того, анализируются и правки переводов.

В общем и целом мы все обучаем систему.

Я вон, удивился, что обратный перевод у Гугла оказался просто 1:1, и это не с проста. Возможно, что он за мной следит :)
 
  • Спасибо
Реакции: suntory

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 138
Реакции
10 835
Нет, конечно, сопоставляются человеческие переводы структур и на их основе конструируется новый перевод.
Более того, анализируются и правки переводов.
На самом деле, если на пальцах объяснять понятным языком, то это как будто по твоей фразе провели всенародный референдум, в котором помимо предложенных вариантов разрешили свои вписывать ;)
 

suntory

Administrator
15 лет на форуме
Сообщения
23 351
Реакции
12 403
Фактически это означает, что каждую фразу переводит легион злых анонимусов
Фактически означает, что ты не понимаешь, что такое статистический перевод. Думаю пользовательские исправления это ничтожная доля, заметная только в отдельных, испорченных флешмобах фразах.
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 138
Реакции
10 835
Ну я так понимаю, что и ты не понимаешь. Мы с тобой одинаково не понимаем не так ли?
Думаю пользовательские исправления это ничтожная доля, заметная только в отдельных, испорченных флешмобах фразах.
То, что такие флешмобы вообще возможны, говорит о правильности моего сравнения
 
  • Спасибо
Реакции: Jeine

suntory

Administrator
15 лет на форуме
Сообщения
23 351
Реакции
12 403
Мы с тобой одинаково не понимаем не так ли?
Ты совсем не понимаешь. Это сравнение иллюстрирует полное непонимание
То, что такие флешмобы вообще возможны, говорит о правильности моего сравнения
Статистический изучает готовые профессиональные переводы, а флешмобы это уже пользовательские исправления, не имеющие к нему отношения. Это уже гибридные технологии
 
Последнее редактирование:

JAW

Топикстартер
15 лет на форуме
Сообщения
15 797
Реакции
3 454
Статистический
Хм...

С такими массивами размеченного лингвистического материала, включающего в себя, в том числе, параллельные тексты, мне кажется качество машинных переводов очень быстро дойдёт до идеального.
Резкий качественный скачёк произошёл, по ощущениям года два назад. Вероятно подключили какие то ранее разрабатываемые алгоритмы. Теперь качество просто на глазах растёт.

Лично мне сейас в Гугле не хватает возможности уточнения и исправления переводов, чтобы можно было подставить другое слово из набора. Профессинальный движок это позволяет, но им в повседневной жизни неудобно пользоваться.
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 138
Реакции
10 835
Ты совсем не понимаешь. Это сравнение иллюстрирует полное непонимание

Статистический изучает готовые профессиональные переводы, а флешмобы это уже пользовательские исправления, не имеющие к нему отношения. Это уже гибридные технологии
Твои ссылки замечательно иллюстрируют мою правоту - алгоритмы печатают бюллетени, а анонимусы заполняют их (а при желании портят)
 

suntory

Administrator
15 лет на форуме
Сообщения
23 351
Реакции
12 403
ссылки замечательно иллюстрируют мою правоту
А почитать не пробовал?
а анонимусы заполняют их
Нет, основной объем перевода уже есть, пользователи к битекстам не имеют никакого отношения.
а при желании портят
Результат этого глупого занятия видят только другие глупые анонимусы по ссылке/наводке. Реальный пользователь сталкивается с ними крайне редко.
'fp''otbline'
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 138
Реакции
10 835
А почитать не пробовал?

Нет, основной объем перевода уже есть, пользователи к битекстам не имеют никакого отношения.
Ну да, варианты в бюллетени впечатаны. Но периодически обновляются по данным соцопросов.
Результат этого глупого занятия видят только другие глупые анонимусы по ссылке/наводке. Реальный пользователь сталкивается с ними крайне редко.
'fp''otbline'
Да периодически сталкиваются все. И устойчивость коллизий напрямую зависит от лени и адекватности избиркома. Хорошо приведу тебе более классово близкий пример. Допустим есть некий форум, на котором есть движок, модераторы, администраторы. Движок фильтрует ботов, спаммеров и забаненных неадекватов. Но пишут ответы на нем живые люди и запросто в воскресный день когда администрация пребывает в вечерней неге, может обьявиться некий сферический пэйпермэн, который зафлудит все темы нетематическим мусором так, что посторонний человек, заглянув на форум увидит во всех темах только его.
Такое конечно случается редко но вполне реально и результат достаточно устойчив.
 

suntory

Administrator
15 лет на форуме
Сообщения
23 351
Реакции
12 403
Но периодически обновляются по данным соцопросов.
Нет, основной объем не меняется. В битекстах тоже есть мат, а машинный переводчик может случайно выдать смешной результат неумышленно.
Хорошо приведу тебе более классово близкий пример.
Он не близкий и твое понимание такое же неверное, по внешним проявлениям и домыслам. Администрация c:( заметила ManPaper с первого поста и наблюдает. 'popcorn'
посторонний человек, заглянув на форум увидит во всех темах только его
Ну это вчера, а в остальное время увидит тебя.
 
Последнее редактирование:

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 138
Реакции
10 835
Нет, основной объем не меняется. В битекстах тоже есть мат, а машинный переводчик может случайно выдать смешной результат неумышленно.
Ты хочешь сказать что битекстовая база та же самая, что и во времена основания гуглпереводчика и алгоритм просто выдергивает случайные варианты из нее? Ну хорошо, даже не случайные, а по результатам референдума?
Он не близкий и твое понимание такое же неверное, по внешним проявлениям и домыслам. Администрация c:( заметила ManPaper с первого поста и наблюдает. 'popcorn'
Они наблюдают? А в какой момент искусственный интеллект решит что нецензурный перевод немного не годится?
Ну это вчера, а в остальное время увидит тебя.
Меня он там не увидит вообще
 

suntory

Administrator
15 лет на форуме
Сообщения
23 351
Реакции
12 403
что и во времена основания гуглпереводчика
Ну может постоянно пополняемая такими же битекстами. Референдум основную массу не меняет, люди чаще просто читают даже не глядя на варианты. Варианты на основании сравнения текстов, а не случайные. Потом у Гугла он гибридный, там и нейросеть есть. Зависит как я понимаю от пары языков и т.п.
Меня он там не увидит вообще
Почему же, обычно больше всех постов за день у тебя. Не в этих темах, так в других.
 

Jeine

Да здравствует разум! Да сгинет маразм!
15 лет на форуме
Сообщения
7 246
Реакции
6 280
Вот тут всё, вероятно, про англо-русский и русско-английский.
Была необходимость перевода на грузинский.
Это просто праздник какой-то. Просто хтонический праздник.
Конечно, я не пробовал офлайновый промт. У меня его нет. Но и гугл, и яндекс такое выдавали, что просто закачаешься.
 

suntory

Administrator
15 лет на форуме
Сообщения
23 351
Реакции
12 403
Ну так там и битекстов мало, и перевод скорее всего не прямой и пользователи даже вредному обучают мало.
 

Jeine

Да здравствует разум! Да сгинет маразм!
15 лет на форуме
Сообщения
7 246
Реакции
6 280
Таккое впечатление было, что много.
 

suntory

Administrator
15 лет на форуме
Сообщения
23 351
Реакции
12 403
Как ты кстати оценил качество перевода? Знаешь грузинский?
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 138
Реакции
10 835
Ну может постоянно пополняемая такими же битекстами.
Ага значит все таки кто-то бюллетени перепечатывает?
еферендум основную массу не меняет, люди чаще просто читают даже не глядя на варианты.
Те кто не читают - в референдуме не участвуют, просто выкидывая свой бюллетень в корзину. Причем, нифига, все равно участвуют косвенно - своей пассивностью они подтверждают право кандидата с нецензурным именем.
Варианты на основании сравнения текстов, а не случайные.
Ну хорошо хоть признал.
Почему же, обычно больше всех постов за день у тебя.
Ты так говоришь, как будто в этом есть чтото плохое. Померяемся постами? '))'
 

suntory

Administrator
15 лет на форуме
Сообщения
23 351
Реакции
12 403
Ага значит все таки кто-то бюллетени перепечатывает?
В смысле? Причем тут бюллетени, битексты это не голосование юзеров, это работа переводчиков.
Ну хорошо хоть признал.
Что признал?
Те кто не читают - в референдуме не участвуют, просто выкидывая свой бюллетень в корзину.
Ты уперся в эти пользовательские правки. У тебя есть инфа какой процент их влияния на перевод и какой процент вредных и полезных? Полагаю их совсем бы отключили, если бы вред превалировал.