- Сообщения
- 926
- Реакции
- 30
Продолжение разборок с hunspell. Обучаю ворд читать на санскрите. Образец текста:
Ну и словник на 200 000 слов:
Когда слова краткие, типа hāsya (как видно из списка они обычно не больше 10 букв), то все хорошо, вопросов нет. Морфология отдельный вопрос, у нас пока речь про фильтр грубой очистки.
Как только 2 слова слиплись вместе, типа devayajanasya - не узнаем. Ну хотя бы deva найти может? Заставить узнавать и искать части знакомых слов возможно?
Код:
na purastāddevayajanamātramatiricyeta | dviṣantaṃ [B]hāsya[/B]
tadbhrātṛvyamabhyatiricyate
kāmaṃ ha dakṣiṇataḥ syādevamuttarata etaddha tveva
samṛddhaṃ
devayajanaṃ yasya devayajanamātram paścātpariśiṣyate kṣipre
haivainamuttarā
devayajyopanamatīti nu [B]devayajanasya[/B]
Ну и словник на 200 000 слов:
Код:
puruSAyate
puruSAyita
puruSAyitatva
puruSAyuSa
puruSAyuSaka
puruSArtha
puruSArthakAra
puruSArthakaumudI
puruSArthacintAmaNi
puruSArthatrayImaya
puruSArthatva
puruSArthaprabodha
puruSArthaprabodhiNI
puruSArtham
puruSArtharatnAkara
puruSArthasiddhyupAya
puruSArthasudhAnidhi
puruSArthasUtravRtti
puruSArthAnuzAsana
puruSAvatAra
puruSAzin
puruSAstha
puruSAsthimAlin
Когда слова краткие, типа hāsya (как видно из списка они обычно не больше 10 букв), то все хорошо, вопросов нет. Морфология отдельный вопрос, у нас пока речь про фильтр грубой очистки.
Как только 2 слова слиплись вместе, типа devayajanasya - не узнаем. Ну хотя бы deva найти может? Заставить узнавать и искать части знакомых слов возможно?