Общий контекст проекта
Проект направлен на создание системы eTMF (electronic Trial Master File) для фармакологических компаний - электронного хранилища регуляторной документации клинических исследований.
В рамках общей системы выделяется отдельный программный компонент, задачей которого является автоматизированный анализ документов и контроль их качества в соответствии с внутренними правилами и требованиями регуляторных проверок (инспекций).
Цель подпроекта
Разработка программного модуля, который:
- принимает документы (или ссылки на них) из eTMF-хранилища (в уже распознанном виде после задачи OCR),
- выполняет набор автоматизированных проверок,
- фиксирует результаты проверок,
- формирует статус качества документа и замечания,
- предоставляет результаты для последующего анализа и использования в системе.
Компонент не является полноценной eTMF, а встраивается в неё как сервис анализа.
Основные функции модуля
- анализ структуры и метаданных документа,
- проверки качества (полнота, актуальность, подписи, даты),
- конфигурируемые правила проверок,
- формирование структурированных результатов,
- API-интеграция с eTMF.
Рекомендуемый технологический стек Python. Контейнеризация обязательна. На первом этапе допустимо использование внешних LLM моделей.
Границы ответственности
- проектирование и реализация QC-модуля,
- документация и API,
- участие в уточнении требований;
- участие во внедрении.
На следующих этапах может быть предоставлен комплект дополнительных материалов:
- ориентировочные примеры документов,
- ориентировочные перечни проверок.
Ожидания от отклика:
- архитектурный подход с указанием технологий,
- оценка сроков и стоимости,
- риски и допущения,
- релевантный опыт,
- вопросы по существу.