ФорумПрограммированиеJavaScript → Выделение первого предложения из произвольного текста.

Выделение первого предложения из произвольного текста.

  • sum

    Сообщения: 25 Репутация: N Группа: Кто попало

    Spritz Июль 20, 2010, 9:22 д.п.

    Да, ясно что нужно по точке отслеживать, но иногда попадаются сокращения, например "г. Москва, пос. Звездный"
    и тогда обрезается на правильно, как быть? )
  • sum

    Сообщения: 25 Репутация: N Группа: Кто попало

    Spritz Июль 20, 2010, 9:27 д.п., спустя 5 минут 17 секунд

    Типа:
    "Меня зовут Вова, я онанист из г. Иваново. Вокруг столько девушек, а я все равно онанист!"

    надо выдрать из текста
    "Меня зовут Вова, я онанист из г. Иваново."

    а не
    "Меня зовут Вова, я онанист из г." - хотя этот вариант мне нравится больше )
  • phpdude

    Сообщения: 26646 Репутация: N Группа: в ухо

    Spritz Июль 20, 2010, 9:28 д.п., спустя 1 минуту

    sum, читаем литературу по русскому языку, где есть определение термина "предложение". чтобы не происходило "обрезание" надо стопслова сразу выбрасывать из текста.
    Сапожник без сапог
  • sum

    Сообщения: 25 Репутация: N Группа: Кто попало

    Spritz Июль 20, 2010, 9:31 д.п., спустя 2 минуты 30 секунд

    phpdude, да, это конечно круто, но когда тебя поисковик проиндексировал с этими стоп словами и ты двигался именно по опеределенным запросам, менять и выкидывать не очень бы хотелось.

    я тут подумал, как вариант, составить массив всех возможных сокращений, и потом двигаясь по тексту, находя точку сверять из массива элементы, точка "минус" сколько то слов до первого пробела.
  • phpdude

    Сообщения: 26646 Репутация: N Группа: в ухо

    Spritz Июль 20, 2010, 9:53 д.п., спустя 22 минуты 33 секунды

    находя точку сверять из массива элементы, точка "минус" сколько то слов до первого пробела

    другими словами стоп слова выбросить.
    Сапожник без сапог

Пожалуйста, авторизуйтесь, чтобы написать комментарий!