[ID CC-CC2021] Есть ли мысли, как вычленить китайские символы?

hulk1776

Топикстартер
15 лет на форуме
Сообщения
735
Реакции
21
Есть китайский текст с элементами русского шрифта и латиницы. Если на весь такой текст назначить символы SimSun, то некитайские символы становятся Times'ом. Нет ли идей, как отследить только китайские символы и назначить им правильный шрифт.
 

Вложения

  • Clipboard01.jpg
    Clipboard01.jpg
    91.9 КБ · Просм.: 165

Oleg Butrin

20 лет на форуме
Сообщения
1 990
Реакции
1 213
Если я правильно понимаю, у китайских символов свой диапазон в Unicode.
 

suntory

Administrator
15 лет на форуме
Сообщения
23 426
Реакции
12 473
с элементами русского шрифта и латиницы.
В китайском тексте логичнее этим символам назначить
правильный шрифт
 
Последнее редактирование:
  • Спасибо
Реакции: hulk1776

veretragna

γνώσις
Сообщения
578
Реакции
200
Облеку высказанное в более материальную форму.
Нужно сделать вот такой grep поиск:
[\x{3000}-\x{ffff}]+
И найденному присвоить нужный шрифт или стиль символа.
 
  • Спасибо
Реакции: hulk1776 и George

veretragna

γνώσις
Сообщения
578
Реакции
200
Нужно обязательно включать в критерий поиска и замены еще жирный/нежирный/курсив. Иначе все перебьет к одному виду.
 

suntory

Administrator
15 лет на форуме
Сообщения
23 426
Реакции
12 473
Но в доминирующем китайском тексте я бы все-таки искал кириллицу и возможно для единообразия латиницу.
 

veretragna

γνώσις
Сообщения
578
Реакции
200
Китайский нужно обработать в любом случае, а по кириллице-латинице можно отдельно пройтись, если к ним есть претензии. Вместе с тем, если кириллицу-латиницу уже форматировали и утвердили (мало ли, сколько этапов форматирования было до этого), ее трогать не стоит.
 

suntory

Administrator
15 лет на форуме
Сообщения
23 426
Реакции
12 473
кириллицу-латиницу уже форматировали и утвердили
Ну так и сделать ей стиль утвержденным шрифтом, это не мешает
в доминирующем китайском тексте я бы все-таки искал кириллицу и возможно для единообразия латиницу.
 

hulk1776

Топикстартер
15 лет на форуме
Сообщения
735
Реакции
21
Фуф, спасибо всем, особенно veretragna. Зарядил в стиле обобщенное греп-условие [\x{3000}-\x{ffff}]+ . При более узких диапазонах, предложенными выше, нек. символы не преобразовывались. И спасибо suntory за ссылку на похожее обсуждение. По ней нашлись полезные вещицы.