ФорумПрограммированиеPHP для идиотов → Функционал для сравнения текста

Функционал для сравнения текста

  • adw0rd

    Сообщения: 22905 Репутация: N Группа: в ухо

    Spritz 1 декабря 2009 г. 13:39

    Кто-нить знает готовые решения по поиску "одинаковости" двух текстов, что-то типа:
    <?php
    similar_text('test', 'quest', $p);
    echo "Percent: $p%";
    ?>

    или

    var_dump(soundex("pyha") == soundex("piha"));
    Спустя 21 сек.
    Можно не просто функции, а целые библиотеки и не только на PHP
    Спустя 144 сек.
    Есть еще всякие [man]metaphone[/man], [man]levenshtein[/man] и т.д.
    Также можем поговорить о алгоритмах
    adw/0
  • Trej Gun

    Сообщения: 5299 Репутация: N Группа: в ухо

    Spritz 1 декабря 2009 г. 16:31, спустя 2 часа 51 минуту 56 секунд

    adw0rd, алгоритм шилдингов или както так но он тебе на словах не поможет он для текстов
  • phpdude

    Сообщения: 26624 Репутация: N Группа: в ухо

    Spritz 1 декабря 2009 г. 20:12, спустя 3 часа 41 минуту 42 секунды


    adw0rd, алгоритм шилдингов или както так но он тебе на словах не поможет он для текстов
    ну да, эту хуйню поиск системы применяют, на яше.ру была где то документация по этому алгоритру

    только не шилдинги, а шингы и супершинглы, супер - типа последняя версия которая яшей и применяется для поиска дублей текста. у него есть много плюсов, один из них - при синонимизации текста(синонимами заменяют слова) он все равно определяет тексты как дубли) ибо текст бьется на куски по несколько слов и сравниваются эти куски, в зависимости от этого получается %% который и говорит о похожести текстов
    Сапожник без сапог
  • mario

    Сообщения: 6067 Репутация: N Группа: Джедаи

    Spritz 1 декабря 2009 г. 21:22, спустя 1 час 9 минут 18 секунд



    adw0rd, алгоритм шилдингов или както так но он тебе на словах не поможет он для текстов
    ну да, эту хуйню поиск системы применяют, на яше.ру была где то документация по этому алгоритру

    только не шилдинги, а шингы и супершинглы, супер - типа последняя версия которая яшей и применяется для поиска дублей текста. у него есть много плюсов, один из них - при синонимичности текста(синонимами заменяют слова) он все равно определяет тексты как дубли) ибо текст бьется на куски по несколько слов и сравниваются эти куски, в зависимости от этого получается %% который и говорит о похожести текстов
    на самом деше Яша долбоеб… и он не всегда правильно разлицает синонимизацию… И супер-шинглы это не совсем проверка на синонимичность… в общем хуй с ним )
    а почитать более менее тут можно про шинглы http://bajron.od.ua/seo-soft/shingles-compare-free/shinglyi-ili-kak-poiskiviki-nahodyat-plagiat.html
    В общем Эд, тебе нужно использовать обычные шинглы
    Спустя 81 сек.
    А куда звездочка пропала??????? ну что бы в избранное добавить?
  • adw0rd

    Сообщения: 22905 Репутация: N Группа: в ухо

    Spritz 1 декабря 2009 г. 23:39, спустя 2 часа 16 минут 47 секунд

    А куда звездочка пропала??????? ну что бы в избранное добавить?
    у меня есть
    adw/0
  • md5

    Сообщения: 11948 Репутация: N Группа: в ухо

    Spritz 1 декабря 2009 г. 23:39, спустя 47 секунд


    А куда звездочка пропала??????? ну что бы в избранное добавить?
    у меня есть
    и у меня
    все умрут, а я изумруд
  • adw0rd

    Сообщения: 22905 Репутация: N Группа: в ухо

    Spritz 1 декабря 2009 г. 23:42, спустя 2 минуты 45 секунд

    Я читал про шинглы тут http://www.codeisart.ru/python-shingles-algorithm/
    Спустя 43 сек.
    Еще есть какие алгоритмы? Я просто хочу побольше узнать об этом, а не решить конкретную задачу
    adw/0
  • Абырвалг

    Сообщения: 6476 Репутация: N Группа: Джедаи

    Spritz 3 февраля 2010 г. 23:52, спустя 64 дня 9 минут

    а какие либы есть для подсветки различий в файлах?
  • phpdude

    Сообщения: 26624 Репутация: N Группа: в ухо

    Spritz 4 февраля 2010 г. 0:21, спустя 29 минут 32 секунды


    а какие либы есть для подсветки различий в файлах?
    diff
    Сапожник без сапог
  • NRG

    Сообщения: 4761 Репутация: N Группа: в ухо

    Spritz 4 февраля 2010 г. 0:46, спустя 24 минуты 32 секунды



    а какие либы есть для подсветки различий в файлах?
    diff
    svn diff
    p.s. bond, james bond =)
  • adw0rd

    Сообщения: 22905 Репутация: N Группа: в ухо

    Spritz 4 февраля 2010 г. 0:59, спустя 12 минут 42 секунды

    diff -u -w 1.txt 2.txt | colordiff


    diff -u -w 1.txt 2.txt > diff.diff
    mcedit diff.diff
    Спустя 58 сек.
    для винды юзал winmerge
    Спустя 50 сек.
    для svn юзаю subclipse
    adw/0
  • Абырвалг

    Сообщения: 6476 Репутация: N Группа: Джедаи

    Spritz 4 февраля 2010 г. 2:03, спустя 1 час 4 минуты 49 секунд

    та мне ж на похапэ нужно. И не PECL.
    через ecec не хочу.
  • VaseninM

    Сообщения: 2416 Репутация: N Группа: Адекваты

    Spritz 4 февраля 2010 г. 2:05, спустя 1 минуту 43 секунды

    Абырвалг, напиши сам. Делов то….
  • phpdude

    Сообщения: 26624 Репутация: N Группа: в ухо

    Spritz 4 февраля 2010 г. 2:08, спустя 2 минуты 27 секунд


    Абырвалг, напиши сам. Делов то….
    +1
    Сапожник без сапог
  • Абырвалг

    Сообщения: 6476 Репутация: N Группа: Джедаи

    Spritz 4 февраля 2010 г. 2:10, спустя 2 минуты 39 секунд

    Давайте может батл такой сделаем?

Пожалуйста, авторизуйтесь, чтобы написать комментарий!