ФорумПрограммированиеPHP для идиотовРасширения PHP → Дублированные картинки. Как их определить?

Дублированные картинки. Как их определить?

  • md5

    Сообщения: 11960 Репутация: N Группа: в ухо

    Spritz 11 января 2009 г. 23:02

    Собственно, как определить, одинаковы ли две картинки?
    можно ли брать какой-то хеш с них или что-то вроде этого?

    допустим, как яндекс определяет одинаковые картинки с разных сайтов
    все умрут, а я изумруд
  • Givi

    Сообщения: 2284 Репутация: N Группа: Адекваты

    Spritz 11 января 2009 г. 23:12, спустя 10 минут 13 секунд

    Вес сравнить в байтах (про название не говорю, так как это не вариант). Если он совпадает, то разбирать картинки более глубже.
    Сам с таким не работал, но насколько знаю, то все пиксели хранятся как набор байт с инфой о цвете (кодом цвета), следовательно можно их прочитать (что, собственно, просмотрщик картинок и делает) и сравнить.
  • md5

    Сообщения: 11960 Репутация: N Группа: в ухо

    Spritz 11 января 2009 г. 23:18, спустя 6 минут

    так вот я и спрашиваю, в пыхе для работы с изображениями что есть? (чтобы поймать совпадения)
    все умрут, а я изумруд
  • phpdude

    Сообщения: 26646 Репутация: N Группа: в ухо

    Spritz 11 января 2009 г. 23:24, спустя 5 минут 49 секунд


    так вот я и спрашиваю, в пыхе для работы с изображениями что есть? (чтобы поймать совпадения)
    100% совпадения? или похожие? если первый вариант … срс32 + мд5(оО) хватит :-D если второй вариант … на пыхе это делать … (если конечно не пара штук) ебаное дело. да и алгоритмы там не простые нихуя
    Сапожник без сапог
  • md5

    Сообщения: 11960 Репутация: N Группа: в ухо

    Spritz 11 января 2009 г. 23:37, спустя 12 минут 45 секунд



    так вот я и спрашиваю, в пыхе для работы с изображениями что есть? (чтобы поймать совпадения)
    100% совпадения? или похожие? если первый вариант … срс32 + мд5(оО) хватит :-D если второй вариант … на пыхе это делать … (если конечно не пара штук) ебаное дело. да и алгоритмы там не простые нихуя
    ну вот закачивают фотографии, допустим это приложения к каким-то объявлениям
    я хочу сделать (на самом деле не хочу, а просто интересно))) из всех этих картинок галерею, поэтому мне повторяющиеся нахер не нужны.. вот и надо, как я понимаю, делать какой-то хеш картинки (не названия файла …
    …) и ложить рядом в базу и при загрузке следующих, смотреть, нет ли такого хеша и, если есть, то помечать как дубляж

    Ы

    как сделать md5 с файла? :)
    md5(file_get_contents($file)) ? :)
    все умрут, а я изумруд
  • md5

    Сообщения: 11960 Репутация: N Группа: в ухо

    Spritz 11 января 2009 г. 23:39, спустя 2 минуты 36 секунд

    и нах тогда нужен crc32?
    все умрут, а я изумруд
  • phpdude

    Сообщения: 26646 Репутация: N Группа: в ухо

    Spritz 11 января 2009 г. 23:42, спустя 2 минуты 46 секунд


    и нах тогда нужен crc32?
    crc32 - быстрый. но часто совпадающий :)
    md5 - медленный)) ну закачка картинки явно медленнее. для пущей мероятности я бы хранил оба хеша. вдвоем то они 99.(9) % не совпадут :)

    тебя бы в армию (с) эдворд вс. дуд
    http://ru2.php.net/md5_file/
    Сапожник без сапог
  • md5

    Сообщения: 11960 Репутация: N Группа: в ухо

    Spritz 12 января 2009 г. 0:08, спустя 26 минут 1 секунду

    так… ну эта херня мне впринципе и так была понятна)
    а вот интересует, как можно определить одну и туже картинку разного размера (ширина,высота)
    например, у меня на сайте оригинал 1024х768, а пхпдуд, сцуко, спиздил у меня мою классную картинку, только сжал её до 640х480…
    есть чо, чтобы распознать пакость? :)
    все умрут, а я изумруд
  • phpdude

    Сообщения: 26646 Репутация: N Группа: в ухо

    Spritz 12 января 2009 г. 0:18, спустя 9 минут 23 секунды


    так… ну эта херня мне впринципе и так была понятна)
    а вот интересует, как можно определить одну и туже картинку разного размера (ширина,высота)
    например, у меня на сайте оригинал 1024х768, а пхпдуд, сцуко, спиздил у меня мою классную картинку, только сжал её до 640х480…
    есть чо, чтобы распознать пакость? :)
    отпизди дуда чтобы не пиздил)
    Сапожник без сапог
  • phpdude

    Сообщения: 26646 Репутация: N Группа: в ухо

    Spritz 12 января 2009 г. 0:18, спустя 17 секунд

    нет, это сложная вещь. анализ картинок оочен ьсложная вещь.
    Сапожник без сапог
  • AlexB

    Сообщения: 4306 Репутация: N Группа: в ухо

    Spritz 12 января 2009 г. 1:40, спустя 1 час 22 минуты 21 секунду


    нет, это сложная вещь.
    Ага, сложная.

    Тем более критерий та же  это картинка или уже другая весьма условный. Ну ладно ужал картинку … А если еще ползунками поездил, яркость там, контрастность, цветовой баланс. Это все таже картинка или уже другая? Фильтры там всякие. Та же? В уголке слово из трех букв написал … все та же? А если еще сверху голую дефку наложил и слово, само собой, уже из пяти букв да крупным шрифтом? В общем забей ….
  • md5

    Сообщения: 11960 Репутация: N Группа: в ухо

    Spritz 12 января 2009 г. 1:53, спустя 12 минут 24 секунды

    я не говорю про вотермарки и голых девок, наложенных сверху и про кроп не говорю
    простой ресайз..
    вобщем пиздец )
    все умрут, а я изумруд
  • phpdude

    Сообщения: 26646 Репутация: N Группа: в ухо

    Spritz 12 января 2009 г. 2:05, спустя 12 минут 36 секунд


    я не говорю про вотермарки и голых девок, наложенных сверху и про кроп не говорю
    простой ресайз..
    вобщем пиздец )
    computer see теория тяжелая очень … там математики уебаться. да и пхп такой анализ тупо не потянет. проверяй мд5 от них так сказать. хватит этого "от дурага"
    Сапожник без сапог
  • NRG

    Сообщения: 4761 Репутация: N Группа: в ухо

    Spritz 12 января 2009 г. 10:49, спустя 8 часов 43 минуты 26 секунд

    как сделать md5 с файла? :)
    md5(file_get_contents($file)) ? :)


    md5_file()
  • artoodetoo

    Сообщения: 5147 Репутация: N Группа: в ухо

    Spritz 12 января 2009 г. 13:04, спустя 2 часа 15 минут

    тут кажется MABP публиковал код на php для определения "среднего" цвета. можно попробовать использовать его.
    опять же на 100% совпадение расчитывать не стоит, но можно определить что средний цвет очень близок.
    если не лениво и нежалко ресурсов, то можно вычилять цвета например всех четвертушек или восьмушек. это будет очень убедительное совпадение

    в конечном счете если картинки не равны байт-в-байт то решение должен принимать модератор. а скрипт просто должен выдавать сигнал со ссылками на "похожие" фотки.
    ιιlllιlllι унц-унц

Пожалуйста, авторизуйтесь, чтобы написать комментарий!