ПРОМТ и иже с ним.

suntory

Administrator
12 лет на форуме
Сообщения
19 581
Оценка реакций
10 350
Ты так говоришь, как будто в этом есть чтото плохое.
Нет, просто в общей картине ты, я и другие завсегдатаи форума это битекст и нейросеть, а эти вчерашние посты юзерский флешмоб с правками. :)
 

jeine

Да здравствует разум! Да сгинет маразм!
12 лет на форуме
Сообщения
5 070
Оценка реакций
5 270

_MBK_

Пикирующий бомбардировщик
12 лет на форуме
Сообщения
23 285
Оценка реакций
8 090
В смысле? Причем тут бюллетени, битексты это не голосование юзеров, это работа переводчиков.
Давай еще раз прильнем к анналам
Гуглпереводчик - это даже не нейросеть, это продукт коллективного творчества множества живых людей
Т.е. одни политтехнологи бюллетени разрабатывают, другие их проверяют, третьи правят по опросам электората, который иногда (и не очень) вносит туда свои пожелания напрямую - коллективное творчество и есть, алгоритмы и прочие нейросети исключительно на подхвате.
А что такое оффлайн переводчик? Собралась где-то в бункере группа рептилоидов, решила - будет такой-то президентом пожизненно и это готовое решение спустили всей общественности, повлиять на него никто не в силах.
 

suntory

Administrator
12 лет на форуме
Сообщения
19 581
Оценка реакций
10 350
коллективное творчество и есть
Ну в основном творчество "политтехнологов", т.е. алгоритмов и нейросетей, а электорат может только незначительную часть бюллетеней испортить, на результат это не повлияет.
 

suntory

Administrator
12 лет на форуме
Сообщения
19 581
Оценка реакций
10 350
Кэп догадался, но уточнил. Не зная языка оценить перевод нельзя.
Как все нормальные люди, переведя полученное обратно.
Перевод туда и обратно, тем более если он не прямой, а через еще один язык для проверки не годится. Ваш кэп.
 

jeine

Да здравствует разум! Да сгинет маразм!
12 лет на форуме
Сообщения
5 070
Оценка реакций
5 270

_MBK_

Пикирующий бомбардировщик
12 лет на форуме
Сообщения
23 285
Оценка реакций
8 090

suntory

Administrator
12 лет на форуме
Сообщения
19 581
Оценка реакций
10 350
Google Переводчик предлагает перевод с любого поддерживаемого языка на любой поддерживаемый, но в большинстве случаев реально выполняет перевод через английский. Иногда качество от этого сильно страдает.
 

jeine

Да здравствует разум! Да сгинет маразм!
12 лет на форуме
Сообщения
5 070
Оценка реакций
5 270
жуть
а как узнать, как выполняется перевод в конкретном случае?
 

suntory

Administrator
12 лет на форуме
Сообщения
19 581
Оценка реакций
10 350
Бывает что и не на мгновенье всякие интересные переводы зависают
Это типа победы на местных выборах не того кандидата, но общую картину не меняет.
а как узнать, как выполняется перевод в конкретном случае?
Не знаю 'hz'
 

Korinal

Участник
Сообщения
8
Оценка реакций
8
Это типа победы на местных выборах не того кандидата, но общую картину не меняет.

Не знаю 'hz'
Коллеги, привет! Это называется cross-перевод. Когда перевод осуществляется через третий язык (как правило это инглиш конечно же). Такого до 80% всех языков) Как узнать? Никак. Только имея доступ к сотрудникам компании, пообщавшись с ними, но кому это нужно? Поэтому перевод иногда и получается таким кривым- правила у каждого языка разные. Со статистическим переводом , все просто- берутся параллельные корпуса из официальных открытых источников (например нормативно- правовая база ООН ) Параллельный корпус- это исходник на английском (например) и его аналог на русском (или другом языке). Затем происходит выравнивание корпусов (работают специальные программы)- грубо говоря, они соотносят предложение на одном языке с предложением на другом языке. И далее формируется некая БД. Чем больше данных- тем точнее перевод. Например, с какого-нибудь аварского языка, перевод будет гораздо хуже, чем с испанского, так как разница в количестве данных колоссальна. Для построения статистической модели, достаточно нескольких человек- которым вообще не обязательно владеть данными языками. С RBMT все сложнее и интереснее- там должен быть целый штат лингвистов, которые ВНИМАНИЕ! руками прописывают правила переводов. Этих правил миллионы. Из разряда IF если здесь стоит заглавная буква, THEN это Название, ELSE Имя собственное и т.д... Это титанический труд, за который нужно таким разработчикам ставить памятники, чес слово))! Понятное дело, что все лингвисты должны владеть тем или иным языком. Что касается нейронки, там тоже достаточно небольшой группы разрабов, которые обучают перевод посредством матрицы (тоже спец программа). Сейчас любой язык можно создать/настроить/обучить за несколько месяцев. Да, будет коряво, но будет. Ну а дальше уже обучать, скармливая инфу нейронной матрице, до момента окончательного просветления. И да, когда я говорил про отказ от отдела переводов , я говорил про точную настройку под перевод типовой документации (договор поставки, смета, ТЗ)- некие шаблоны. Люди- переводчики при этом вообще становятся не нужны, кроме одного человека "на всякий случай"- редактора. Ждем появления оффлайн нейронки) Вот что будет интересным.
 

suntory

Administrator
12 лет на форуме
Сообщения
19 581
Оценка реакций
10 350