ИИ, нейросеть в работе

Флексороб · 30.01.2026

Emergency сказал(а):
А зачем? Вроде бы на рынке труда полно безработных верстальщиков

Я бы по другому задал вопрос: "зачем верстать?"

Александр Панарин · 30.01.2026

Emergency сказал(а):
А зачем? Вроде бы на рынке труда полно безработных верстальщиков, готовых задешево делать качественные верстки.

Если я правильно понимаю, то прогресс этой технологии не очень-то связан со спросом на профессии. Программистов тоже хоть убавляй, иллюстраторов там разных. Однако это никак не повлияло на развитие способностей нейросетей к написанию кода и генерации иллюстраций разной степени красоты и упоротости.

Флексороб · 30.01.2026

Александр Панарин сказал(а):
развитие способностей нейросетей к написанию кода и генерации иллюстраций разной степени красоты и упоротости.

Очень большой плюс/минус. Приблизительный результат, который выдает ИИ должен привести в порядок специалист с большой экспертизой. Так что ИИ - это просто инструмент для такого специалиста.

Флексороб · 30.01.2026

Так же, например, как ФШ для дизайнера или ретушера.

Emergency · 30.01.2026

Флексороб сказал(а):
Я бы по другому задал вопрос: "зачем верстать?"

Затем, что ИИ пока дает картинку, а не правильно оформленный документ для печати. Может быть со временем научится

izrukvruki · 10.03.2026

Пробую сейчас модель QWEN IMAGE 2512 (запускаю в ComfyUI), очень качественно генерирует картинки, если подробно расписать промт (можно писать по-русски), то результат поражает (типо, сверху то-то, снизу то-то, слева сё, справа то). Модель заточена под несколько видов разрешения, но я пробовал задавать произвольные - работает. Правда работает довольно долго, на RTX 4070 12гб (а в рекомендациях к модели написано, что желательно иметь 16гб видеопамяти) изображение 1400*1400 около 5 минут, 680*680 - чуть больше 1 минуты. Пишут что значительно улучшена генерация лиц, ландшафтов, природных явлений (туман, дождь, вода, листва, трава), что особо интересно - умеет хорошо работать с текстом (вроде пока только с латиницей), неплохо встраивает его в композицию.
Пока пробую стандартный форкфлоу, хочу попробовать добавить Upscale и изображение-референс.

Флексороб · 10.03.2026

izrukvruki сказал(а):
Пробую сейчас модель QWEN IMAGE 2512

Очень интересно! Пробую делать то же самое, но с другими моделями. Пока исследовал Flux1_base. Нравится, как генерит людей, и категорически плохо пейзажи. Немного исследовал модель Wan2.1 Это для генерации видео. Тоже понравилась, но тут предметы - хорошо, люди - так себе.
Лежит еще загруженная Z-image для статичных картинок. Но, к ней пока только прикоснулся. Вроде, у нее с людьми неплохо.

izrukvruki · 10.03.2026

Тут много картинок для сравнения как было и как стало с версией 2512

Флексороб · 10.03.2026

izrukvruki сказал(а):
как стало с версией 2512

ИИ говорит, что уже появляются Lora файлы на Hugging Face. Так что можете сделать свои генерации еще лучше! Я начинал с модели SDXL и заморачивался тренировкой через Kohya_ss. Способ работающий, но геморный, т.к. надо собирать датасет, потом проводить тренировку (2-3 суток). Результат, конечно впечатляет, но время....

Флексороб · 10.03.2026

izrukvruki сказал(а):
как было и как стало

Да, разница значительная. Тоже буду пробовать.

Флексороб · 10.03.2026

Что такое Qwen‑Image на самом деле

Qwen‑Image (например, Qwen‑Image‑2.5‑12B) — это мультимодальная трансформерная модель, а не диффузор. Она относится к семейству Qwen2.5, то есть:

архитектура — трансформер, как у LLM
работает с изображениями и текстом
может генерировать, понимать, редактировать изображения
использует autoregressive или flow‑based механизмы, а не диффузию

То есть она ближе к LLM‑моделям нового поколения, чем к Stable Diffusion, SDXL, Flux, Wan или CogVideoX.

Чем Qwen‑Image отличается от диффузных моделей

Свойство	Qwen‑Image	Diffusion (SD, SDXL, Flux)
Архитектура	трансформер	диффузор
Генерация	autoregressive / flow	пошаговая денойзинг‑диффузия
Скорость	быстрее	медленнее
Качество	высокое, особенно в понимании	высокое в детализации
Обучение LoRA	возможно, но иначе	стандартное LoRA
VRAM	выше	ниже

Флексороб · 10.03.2026

Хотя Flux вроде-бы тоже не дифузная модель.
Кстати, пробовал CogVideo, результат не понравился. Сразу перешел на Wan2.1

mnemonix · 10.03.2026

Google Whisk с простой бананой 30 апреля переезжает на Google flow (уже работает), где бесплатные банана 2, банана про и imagen 4, у ПРО ограничение порядка 25-30 генераций по 4 картинки, у других нет ограничений. Один минус, как по мне - генерит только вертикалки и горизонталки, квадрата нет, но это вкусовщина. Работает быстро. Можно видео генерировать, на них даётся 150 кредитов.

mnemonix · 10.03.2026

И да, Банана 2 - это новый продукт, старший брат простой бананы. Быстрее Про, порой результат существеннее лучше Про. По-русски понимает.

Флексороб · 10.03.2026

mnemonix сказал(а):
на них даётся 150 кредитов.

Обязательно исследую. Интересно, на сколько их хватит.

mnemonix · 10.03.2026

100 при регистрации и 50 ежедневно, только не знаю, сгорают ли в конце суток.

splxgf · 10.03.2026

izrukvruki сказал(а):
Пробую сейчас модель QWEN IMAGE 2512 (запускаю в ComfyUI), очень качественно генерирует картинки, если подробно расписать промт (можно писать по-русски), то результат поражает (типо, сверху то-то, снизу то-то, слева сё, справа то). Модель заточена под несколько видов разрешения, но я пробовал задавать произвольные - работает. Правда работает довольно долго, на RTX 4070 12гб (а в рекомендациях к модели написано, что желательно иметь 16гб видеопамяти) изображение 1400*1400 около 5 минут, 680*680 - чуть больше 1 минуты. Пишут что значительно улучшена генерация лиц, ландшафтов, природных явлений (туман, дождь, вода, листва, трава), что особо интересно - умеет хорошо работать с текстом (вроде пока только с латиницей), неплохо встраивает его в композицию.
Пока пробую стандартный форкфлоу, хочу попробовать добавить Upscale и изображение-референс.

Можно попробовать интерфейс WANGP, может чуть удобней чем комфи.

GitHub - deepbeepmeep/Wan2GP: A fast AI Video Generator for the GPU Poor. Supports Wan 2.1/2.2, Qwen Image, Hunyuan Video, LTX Video and Flux.

A fast AI Video Generator for the GPU Poor. Supports Wan 2.1/2.2, Qwen Image, Hunyuan Video, LTX Video and Flux. - deepbeepmeep/Wan2GP

github.com

Flux, Qwen, Z-image поддерживает из коробки, правда дожидаться долго пока модели скачаются.

mnemonix · 10.03.2026

Не по теме:

Кто интересуется новой бананой - канал на тытрубе SeTka Project, всё только по делу и никаких продажь вебинаров и воды.

izrukvruki · 11.03.2026

Веб сервис QWEN кстати тоже неплохо справляется с редактированием фото:

Флексороб · 11.03.2026

izrukvruki сказал(а):
с редактированием фото

Супер! Это главное преимущество модели Qwen в отношении к дифузным моделям, типа SDXL. Она использует принцип текстовых LLM моделей, поэтому хорошо работает с текстом и хорошо понимает текстовые команды для редактуры.
Но, меня пока остановил ее объем в 59 гб. Надо плотно думать, чтобы закачивать такую модель.

ИИ, нейросеть в работе

Участник

Участник

Участник

Участник

Забанен

Участник

Участник

Участник

Участник

Что такое Qwen‑Image на самом деле​

Чем Qwen‑Image отличается от диффузных моделей​

Участник

ॐ मणि पद्मे हूँ

ॐ मणि पद्मे हूँ

Участник

ॐ मणि पद्मे हूँ

ॐ मणि पद्मे हूँ

Участник

Что такое Qwen‑Image на самом деле

Чем Qwen‑Image отличается от диффузных моделей