ФорумПрограммированиеPHP для идиотов → Функционал для сравнения текста

Функционал для сравнения текста

  • adw0rd

    Сообщения: 22959 Репутация: N Группа: в ухо

    Spritz Дек. 2, 2009, 12:39 д.п.

    Кто-нить знает готовые решения по поиску "одинаковости" двух текстов, что-то типа:
    <?php
    similar_text('test', 'quest', $p);
    echo "Percent: $p%";
    ?>

    или

    var_dump(soundex("pyha") == soundex("piha"));
    Спустя 21 сек.
    Можно не просто функции, а целые библиотеки и не только на PHP
    Спустя 144 сек.
    Есть еще всякие [man]metaphone[/man], [man]levenshtein[/man] и т.д.
    Также можем поговорить о алгоритмах
    https://smappi.org/ - платформа по созданию API на все случаи жизни
  • Trej Gun

    Сообщения: 5305 Репутация: N Группа: в ухо

    Spritz Дек. 2, 2009, 3:31 д.п., спустя 2 часа 51 минуту 56 секунд

    adw0rd, алгоритм шилдингов или както так но он тебе на словах не поможет он для текстов
  • phpdude

    Сообщения: 26646 Репутация: N Группа: в ухо

    Spritz Дек. 2, 2009, 7:12 д.п., спустя 3 часа 41 минуту 42 секунды


    adw0rd, алгоритм шилдингов или както так но он тебе на словах не поможет он для текстов
    ну да, эту хуйню поиск системы применяют, на яше.ру была где то документация по этому алгоритру

    только не шилдинги, а шингы и супершинглы, супер - типа последняя версия которая яшей и применяется для поиска дублей текста. у него есть много плюсов, один из них - при синонимизации текста(синонимами заменяют слова) он все равно определяет тексты как дубли) ибо текст бьется на куски по несколько слов и сравниваются эти куски, в зависимости от этого получается %% который и говорит о похожести текстов
    Сапожник без сапог
  • mario

    Сообщения: 6067 Репутация: N Группа: Джедаи

    Spritz Дек. 2, 2009, 8:22 д.п., спустя 1 час 9 минут 18 секунд



    adw0rd, алгоритм шилдингов или както так но он тебе на словах не поможет он для текстов
    ну да, эту хуйню поиск системы применяют, на яше.ру была где то документация по этому алгоритру

    только не шилдинги, а шингы и супершинглы, супер - типа последняя версия которая яшей и применяется для поиска дублей текста. у него есть много плюсов, один из них - при синонимичности текста(синонимами заменяют слова) он все равно определяет тексты как дубли) ибо текст бьется на куски по несколько слов и сравниваются эти куски, в зависимости от этого получается %% который и говорит о похожести текстов
    на самом деше Яша долбоеб… и он не всегда правильно разлицает синонимизацию… И супер-шинглы это не совсем проверка на синонимичность… в общем хуй с ним )
    а почитать более менее тут можно про шинглы http://bajron.od.ua/seo-soft/shingles-compare-free/shinglyi-ili-kak-poiskiviki-nahodyat-plagiat.html
    В общем Эд, тебе нужно использовать обычные шинглы
    Спустя 81 сек.
    А куда звездочка пропала??????? ну что бы в избранное добавить?
  • adw0rd

    Сообщения: 22959 Репутация: N Группа: в ухо

    Spritz Дек. 2, 2009, 10:39 д.п., спустя 2 часа 16 минут 47 секунд

    А куда звездочка пропала??????? ну что бы в избранное добавить?
    у меня есть
    https://smappi.org/ - платформа по созданию API на все случаи жизни
  • md5

    Сообщения: 11960 Репутация: N Группа: в ухо

    Spritz Дек. 2, 2009, 10:39 д.п., спустя 47 секунд


    А куда звездочка пропала??????? ну что бы в избранное добавить?
    у меня есть
    и у меня
    все умрут, а я изумруд
  • adw0rd

    Сообщения: 22959 Репутация: N Группа: в ухо

    Spritz Дек. 2, 2009, 10:42 д.п., спустя 2 минуты 45 секунд

    Я читал про шинглы тут http://www.codeisart.ru/python-shingles-algorithm/
    Спустя 43 сек.
    Еще есть какие алгоритмы? Я просто хочу побольше узнать об этом, а не решить конкретную задачу
    https://smappi.org/ - платформа по созданию API на все случаи жизни
  • Абырвалг

    Сообщения: 6480 Репутация: N Группа: Джедаи

    Spritz Фев. 4, 2010, 10:52 д.п., спустя 64 дня 9 минут

    а какие либы есть для подсветки различий в файлах?
  • phpdude

    Сообщения: 26646 Репутация: N Группа: в ухо

    Spritz Фев. 4, 2010, 11:21 д.п., спустя 29 минут 32 секунды


    а какие либы есть для подсветки различий в файлах?
    diff
    Сапожник без сапог
  • NRG

    Сообщения: 4761 Репутация: N Группа: в ухо

    Spritz Фев. 4, 2010, 11:46 д.п., спустя 24 минуты 32 секунды



    а какие либы есть для подсветки различий в файлах?
    diff
    svn diff
    p.s. bond, james bond =)
  • adw0rd

    Сообщения: 22959 Репутация: N Группа: в ухо

    Spritz Фев. 4, 2010, 11:59 д.п., спустя 12 минут 42 секунды

    diff -u -w 1.txt 2.txt | colordiff


    diff -u -w 1.txt 2.txt > diff.diff
    mcedit diff.diff
    Спустя 58 сек.
    для винды юзал winmerge
    Спустя 50 сек.
    для svn юзаю subclipse
    https://smappi.org/ - платформа по созданию API на все случаи жизни
  • Абырвалг

    Сообщения: 6480 Репутация: N Группа: Джедаи

    Spritz Фев. 4, 2010, 1:03 п.п., спустя 1 час 4 минуты 49 секунд

    та мне ж на похапэ нужно. И не PECL.
    через ecec не хочу.
  • VaseninM

    Сообщения: 2416 Репутация: N Группа: Адекваты

    Spritz Фев. 4, 2010, 1:05 п.п., спустя 1 минуту 43 секунды

    Абырвалг, напиши сам. Делов то….
  • phpdude

    Сообщения: 26646 Репутация: N Группа: в ухо

    Spritz Фев. 4, 2010, 1:08 п.п., спустя 2 минуты 27 секунд


    Абырвалг, напиши сам. Делов то….
    +1
    Сапожник без сапог
  • Абырвалг

    Сообщения: 6480 Репутация: N Группа: Джедаи

    Spritz Фев. 4, 2010, 1:10 п.п., спустя 2 минуты 39 секунд

    Давайте может батл такой сделаем?

Пожалуйста, авторизуйтесь, чтобы написать комментарий!