ФорумПрограммированиеОбщие вопросы программирования → Отселживание изменений в англоязычной документации для проекта с переводом доки на русский

Отселживание изменений в англоязычной документации для проекта с переводом доки на русский

  • Crank

    Сообщения: 541 Репутация: N Группа: Джедаи

    Spritz 5 февраля 2017 г. 9:01

    Есть проект на django с переводом буржуйской документации по одной интересной для меня теме на русский язык. Когда я запускал его я особо не запаривался над тем что нужно отслеживать изменения в оригинальной доке, но теперь нужно это сделать и хотелось бы услышать советов.

    Оригинал доки лежит в github и основаная структура его построена на yaml файле с деревом разделов где указано англ название раздела и путь к нему.
    Путь это папка в репе где лежат md файлы или чпу типа /section/article/filename/ где filename имя md файла. Вот такая хуевая структура у чуваков.

    На самом деле я уже почти все написал, но мне кажется получилось очень криво и громоздко. Я пока не придумал как менять структуру дерева вслед за оригиналом (проблема в том что нет уникального ид раздела, есть только путь который может измениться, а название раздела может быть не уникальным).

    Может кто-то уже решал похожие задачи или может что подсказать. Нужны советы по двум алгоритмам
    1. Отслеживание изменений в структуре ymal дерева.
    2. Отслеживание изменений в текстах внутри раздела. Самый простой случай если изменился известный раздел, я сравнил md5 оригинала и сохраненной у меня в базе копии. Есть расхождение, дальше ищем различающиеся абзацы опять же по md5.

    Сумбурненько получилось, если никто не поймет перепишу на трезвую голову человеческим языком.

  • phpdude

    Сообщения: 26624 Репутация: N Группа: в ухо

    Spritz 5 февраля 2017 г. 9:04, спустя 2 минуты 32 секунды

    (проблема в том что нет уникального ид раздела, есть только путь который может измениться, а название раздела может быть не уникальным).

    @Crank, ну значит задача не имеет красивого решения, можешь поприменять fuzzy match для этих целей, возможно сгодится автоматичесая аналитика, но ручная работа как ни крути останется еще ))

    Сапожник без сапог
  • Crank

    Сообщения: 541 Репутация: N Группа: Джедаи

    Spritz 5 февраля 2017 г. 9:10, спустя 6 минут 49 секунд

    ну подучается что так. Неопознанные разделы я пытаю увязать по алгоритму убирания папок первого уровня из ЧПУ и потом сравнивая с существующими. Но надо написать чувакам, я думаю они не против будут добавить id для разделов и статей иначе я ебанусь.

Пожалуйста, авторизуйтесь, чтобы написать комментарий!