ФорумРазработкаУстановка и администрирование ПОСерверы баз данных → sphinx многоязычный поиск

sphinx многоязычный поиск

  • Faster

    Сообщения: 1159 Репутация: N Группа: Кто попало

    Spritz 11 июня 2014 г. 9:59

    в общем направьте в нужную сторону.
    проблема в том как заставить sphinx искать на многих языках, а именно больше 15.
    сам сфинкс говорит в доке что готов искать на
    stem_en - apply Porter's English stemmer;
    stem_ru - apply Porter's Russian stemmer;
    stem_cz - apply Czech stemmer;
    stem_ar - apply Arabic stemmer (added in 2.1.1-beta);

    еще стеммеры вроде под 3-4 европейских языка можно собрать. но этого недостаточно для морфологического поиска
    вопрос если ли альтернатива?
  • phpdude

    Сообщения: 26618 Репутация: N Группа: в ухо

    Spritz 11 июня 2014 г. 10:01, спустя 1 минуту 50 секунд

    без стемеров нет конечно.

    Сапожник без сапог
  • vasa_c

    Сообщения: 3127 Репутация: N Группа: в ухо

    Spritz 11 июня 2014 г. 10:06, спустя 5 минут 38 секунд

    могу только для китайского хак показать:
    ngram_chars = U+4E00..U+9FBF, U+3400..U+4DBF, U+20000..U+2A6DF, U+F900..U+FAFF,U+2F800..U+2FA1F, U+2E80..U+2EFF, U+2F00..U+2FDF, U+3100..U+312F, U+31A0..U+31BF,U+3040..U+309F, U+30A0..U+30FF, U+31F0..U+31FF, U+AC00..U+D7AF, U+1100..U+11FF,U+3130..U+318F, U+A000..U+A48F, U+A490..U+A4CF

Пожалуйста, авторизуйтесь, чтобы написать комментарий!