ФорумПрограммированиеОбщие вопросы программирования → Отселживание изменений в англоязычной документации для проекта с переводом доки на русский

Отселживание изменений в англоязычной документации для проекта с переводом доки на русский

  • Crank

    Сообщения: 542 Репутация: N Группа: Джедаи

    Spritz Фев. 5, 2017, 8:01 п.п.

    Есть проект на django с переводом буржуйской документации по одной интересной для меня теме на русский язык. Когда я запускал его я особо не запаривался над тем что нужно отслеживать изменения в оригинальной доке, но теперь нужно это сделать и хотелось бы услышать советов.

    Оригинал доки лежит в github и основаная структура его построена на yaml файле с деревом разделов где указано англ название раздела и путь к нему.
    Путь это папка в репе где лежат md файлы или чпу типа /section/article/filename/ где filename имя md файла. Вот такая хуевая структура у чуваков.

    На самом деле я уже почти все написал, но мне кажется получилось очень криво и громоздко. Я пока не придумал как менять структуру дерева вслед за оригиналом (проблема в том что нет уникального ид раздела, есть только путь который может измениться, а название раздела может быть не уникальным).

    Может кто-то уже решал похожие задачи или может что подсказать. Нужны советы по двум алгоритмам
    1. Отслеживание изменений в структуре ymal дерева.
    2. Отслеживание изменений в текстах внутри раздела. Самый простой случай если изменился известный раздел, я сравнил md5 оригинала и сохраненной у меня в базе копии. Есть расхождение, дальше ищем различающиеся абзацы опять же по md5.

    Сумбурненько получилось, если никто не поймет перепишу на трезвую голову человеческим языком.

  • phpdude

    Сообщения: 26646 Репутация: N Группа: в ухо

    Spritz Фев. 5, 2017, 8:04 п.п., спустя 2 минуты 32 секунды

    (проблема в том что нет уникального ид раздела, есть только путь который может измениться, а название раздела может быть не уникальным).

    @Crank, ну значит задача не имеет красивого решения, можешь поприменять fuzzy match для этих целей, возможно сгодится автоматичесая аналитика, но ручная работа как ни крути останется еще ))

    Сапожник без сапог
  • Crank

    Сообщения: 542 Репутация: N Группа: Джедаи

    Spritz Фев. 5, 2017, 8:10 п.п., спустя 6 минут 49 секунд

    ну подучается что так. Неопознанные разделы я пытаю увязать по алгоритму убирания папок первого уровня из ЧПУ и потом сравнивая с существующими. Но надо написать чувакам, я думаю они не против будут добавить id для разделов и статей иначе я ебанусь.

  • kandev777

    Сообщения: 1 Репутация: N Группа: Кто попало

    Spritz Ноя. 12, 2020, 9:13 д.п., спустя 1375 дней 13 часов 2 минуты

    the reputedly frustrated groom-to-be published his tale on reddit’s forums, in which he explained, “my fiancée, nicole, and i had chosen our wedding ceremony date, booked the venue, and notified the on the spot members of the own family of the date and

    seo optimization company

Пожалуйста, авторизуйтесь, чтобы написать комментарий!