Безопасность на стройке: Искусственный интеллект на страже

Автор: Денис Аветисян


Новые методы анализа текстовых отчетов и изображений с использованием больших языковых и мультимодальных моделей позволяют автоматизировать выявление опасностей на строительных площадках.

"Покупай на слухах, продавай на новостях". А потом сиди с акциями никому не известной биотех-компании. Здесь мы про скучный, но рабочий фундаментал.

Бесплатный Телеграм канал
Прогнозирование сценариев аварийных ситуаций осуществляется посредством специально разработанного запроса, позволяющего предвидеть развитие событий и потенциальные риски.
Прогнозирование сценариев аварийных ситуаций осуществляется посредством специально разработанного запроса, позволяющего предвидеть развитие событий и потенциальные риски.

Исследование демонстрирует эффективность использования больших языковых и зрительно-языковых моделей для автоматического обнаружения опасностей на строительных площадках без необходимости трудоемкой дообучающей выборки.

Несмотря на растущую потребность в обеспечении безопасности на строительных площадках, традиционные методы выявления опасностей часто оказываются неэффективными при работе с разнородными данными. Данная работа, озаглавленная ‘Automated Hazard Detection in Construction Sites Using Large Language and Vision-Language Models’, исследует возможности мультимодального подхода, объединяющего анализ текстовой и визуальной информации. Показано, что правильно настроенные большие языковые и зрительно-языковые модели способны эффективно выявлять потенциальные опасности без необходимости трудоемкой дообучающей выборки. Может ли подобный подход стать основой для создания экономически эффективных систем мониторинга безопасности, способных оперативно реагировать на изменения условий на строительной площадке?


Строительная Отрасль: Скрытые Угрозы и Вызовы Безопасности

Несмотря на строгие правила и нормы безопасности, строительная отрасль остается одной из самых травмоопасных. Ежегодно на строительных площадках происходят несчастные случаи, приводящие к серьезным травмам и, к сожалению, летальным исходам. Эта тревожная статистика обусловлена сложным характером работ, использованием тяжелой техники, высотой и динамичностью процессов. Даже при наличии регламентированных процедур контроля, человеческий фактор и непредсказуемость условий часто приводят к возникновению опасных ситуаций. Постоянное совершенствование мер безопасности и внедрение инновационных технологий — критически важная задача для защиты здоровья и жизни работников строительной отрасли.

Традиционные проверки безопасности на строительных площадках, несмотря на свою необходимость, зачастую носят реактивный характер и испытывают трудности с проактивной идентификацией потенциальных рисков на сложных объектах. Это связано с тем, что инспекции, как правило, проводятся после возникновения определенных этапов работ или при выявлении явных нарушений, а не для предвидения возможных опасностей. Сложность современных строительных проектов, включающих множество одновременных процессов и постоянно меняющуюся обстановку, значительно усложняет задачу выявления всех скрытых угроз. В результате, инспекторы могут упускать из виду незначительные, но потенциально опасные факторы, которые в совокупности способны привести к серьезным инцидентам. Необходимость перехода к более проактивным и превентивным методам обеспечения безопасности становится очевидной для снижения травматизма и повышения эффективности строительных работ.

Огромный поток визуальной информации на строительных площадках зачастую превышает возможности человеческого восприятия, создавая пробелы в обнаружении опасностей и их предотвращении. Постоянно меняющиеся условия, большое количество одновременно выполняемых работ и сложность строительных конструкций формируют перегрузку для инспекторов, что затрудняет выявление потенциальных рисков. Несмотря на опыт и внимательность, человек не способен одновременно отслеживать все детали, что приводит к упущениям и повышает вероятность несчастных случаев. В результате, традиционные методы контроля безопасности, основанные исключительно на визуальном осмотре, оказываются недостаточно эффективными для обеспечения полной безопасности на современных строительных объектах.

Данный запрос позволяет эффективно отфильтровывать потенциально опасные факторы риска.
Данный запрос позволяет эффективно отфильтровывать потенциально опасные факторы риска.

Автоматизированное Обнаружение Опасностей: Новый Подход к Безопасности

Автоматизированное обнаружение опасностей представляет собой превентивное решение, использующее искусственный интеллект для непрерывного анализа визуальных данных, получаемых со строительных площадок. Эта система позволяет в режиме реального времени выявлять потенциальные угрозы безопасности, такие как отсутствие защитных приспособлений, неправильное складирование материалов или небезопасное поведение рабочих. Непрерывный мониторинг позволяет оперативно реагировать на возникающие риски, минимизируя вероятность несчастных случаев и повышая общую безопасность на строительном объекте. В отличие от традиционных методов, основанных на периодических проверках, автоматизированный подход обеспечивает постоянный контроль, что значительно повышает эффективность выявления и предотвращения опасностей.

Для обучения моделей автоматического обнаружения опасностей на строительных площадках используются обширные наборы данных, такие как ConstructionSite10k Dataset. Этот датасет содержит более 10 000 изображений, размеченных с указанием различных типов опасностей, включая отсутствие средств индивидуальной защиты, небезопасное использование оборудования, нарушения в организации рабочего пространства и другие потенциально опасные ситуации. Использование таких больших объемов размеченных данных позволяет моделям машинного обучения эффективно выявлять закономерности и признаки, характерные для различных опасностей, и, как следствие, обеспечивать высокую точность обнаружения на новых, ранее не встречавшихся изображениях.

Наши исследования показали, что использование подходов, основанных на промптах, с применением предварительно обученных больших языковых и визуально-языковых моделей, позволяет достичь сопоставимой эффективности в анализе безопасности строительных площадок без необходимости масштабной дообучающей выборки или трудоемкой тонкой настройки. Это достигается за счет использования существующих знаний, заложенных в предобученные модели, и направляется посредством специально сформулированных запросов (промптов), которые задают контекст и ожидаемый результат анализа. Такой подход существенно снижает затраты на обучение и позволяет быстро адаптировать систему к новым типам опасностей и условиям на строительной площадке.

Использование LLM и Prompt Engineering: Точность и Эффективность Анализа

Для автоматизированного анализа безопасности на строительных площадках была применена модель GPT-4o, представляющая собой мощную языковую модель (LLM) и модель визуального понимания (VLM). GPT-4o использовалась для генерации детализированных текстовых описаний сцен, полученных из изображений строительных площадок. Эти описания содержат информацию о расположении объектов, выполняемых работах и других релевантных деталях, необходимых для оценки потенциальных рисков и опасностей. Автоматическое создание таких описаний позволяет значительно ускорить процесс анализа и повысить его объективность, предоставляя важный контекст для выявления потенциально опасных ситуаций.

Для повышения точности выявления потенциально опасных ситуаций на строительных площадках, мы применили передовые методы разработки промптов, включая семантическое программирование. Этот подход предполагает структурирование запросов к языковой модели таким образом, чтобы акцентировать внимание на семантических связях между элементами изображения и потенциальными рисками. В частности, промпты были разработаны для побуждения модели к выявлению не только объектов, но и их взаимосвязей, указывающих на возможные сценарии несчастных случаев. Например, запрос может включать информацию о расположении строительных материалов, рабочих и оборудования, а также указания на потенциальные нарушения правил безопасности. Оптимизация промптов проводилась итеративно, с использованием ручной оценки результатов и последующей корректировкой формулировок для достижения максимальной точности идентификации опасных факторов.

В ходе тестирования разработанного текстового конвейера на размеченной вручную тестовой выборке была достигнута точность в 89%, что подтверждает эффективность данного подхода. Дополнительно, модели Qwen2-VL-2B и Molmo-7B, использующие ансамбли промптов, продемонстрировали значения F1-меры в 72.6% и 67.2% соответственно, что указывает на их способность к точному определению и классификации объектов на изображениях строительных площадок.

На изображении представлен запрос для описания сцены.
На изображении представлен запрос для описания сцены.

Превосходя Идентификацию: Путь к Безопасности в Строительстве

Подход, основанный на анализе данных, позволяет существенно усовершенствовать существующие нормы безопасности в строительной отрасли. Система собирает и обрабатывает информацию о реальных опасностях на строительных площадках, выявляя закономерности и тенденции, которые ранее оставались незамеченными. Полученные данные предоставляют возможность для разработки более эффективных и адресных правил безопасности, а также для оперативной корректировки существующих протоколов в соответствии с текущей ситуацией. Это позволяет не просто констатировать нарушения, но и прогнозировать потенциальные риски, обеспечивая проактивный подход к обеспечению безопасности рабочих и снижению вероятности несчастных случаев. Таким образом, внедрение подобной системы способствует формированию более безопасной и продуктивной рабочей среды в строительстве.

Система способна автоматически выявлять случаи несоблюдения требований к использованию средств индивидуальной защиты (СИЗ) на строительных площадках, что значительно повышает безопасность рабочих и снижает юридическую ответственность работодателя. Анализируя видеопоток, она определяет, когда сотрудники не используют необходимые каски, защитные очки, перчатки или другую защитную экипировку, и немедленно сигнализирует об этом. Такой проактивный подход позволяет оперативно устранять нарушения и предотвращать возможные травмы, а также предоставляет документальное подтверждение соблюдения техники безопасности, что особенно важно в случае расследований несчастных случаев или аудитов. Автоматизированный контроль за соблюдением требований к СИЗ снижает зависимость от человеческого фактора и обеспечивает непрерывный мониторинг безопасности на объекте.

Система активно способствует снижению числа несчастных случаев на строительных площадках, фокусируясь на предотвращении падений с высоты и повышении осведомленности о близости опасных зон. Благодаря анализу видеопотока и применению алгоритмов машинного обучения, она способна выявлять потенциальные нарушения в использовании средств индивидуальной защиты от падения, такие как неправильно закрепленные страховочные системы или отсутствие необходимых приспособлений. Одновременно, система предупреждает рабочих о приближении к опасным участкам, например, к незащищенным краям крыш или открытым люкам, что позволяет своевременно принять меры предосторожности и избежать травм. Такой проактивный подход к выявлению и устранению рисков значительно повышает безопасность труда и способствует созданию более безопасной рабочей среды на строительных объектах.

Исследование демонстрирует, что эффективное выявление опасностей на строительных площадках возможно благодаря тщательно разработанным запросам к большим языковым и визуально-языковым моделям. Этот подход позволяет анализировать как текстовые отчёты, так и изображения, не требуя дорогостоящей и трудоёмкой дообучающей выборки. Как однажды заметил Джон Маккарти: «Искусственный интеллект — это изучение того, как сделать машины такими, чтобы они делали то, что люди делают хорошо, а не только то, что они делают.» Эта мысль особенно актуальна в контексте данной работы, поскольку речь идёт не о замене человеческого труда, а об усилении его возможностей. Модели, обученные анализировать данные, помогают специалистам по безопасности более оперативно и точно выявлять потенциальные угрозы, что способствует повышению безопасности на строительных объектах. Простота и ясность структуры запросов, как ключевой фактор успеха, подтверждает важность системного подхода к решению задач.

Куда Ведет Эта Дорога?

Представленная работа демонстрирует любопытную возможность — извлечение полезной информации о безопасности на строительных площадках без необходимости сложного обучения моделей. Это напоминает строительство города: инфраструктура должна развиваться без необходимости перестраивать весь квартал. Однако, простота не должна вводить в заблуждение. Текущие решения, полагающиеся на тщательно подобранные запросы, все еще остаются хрупкими. Неизбежно возникнет вопрос о надежности системы в условиях реального мира, где сообщения и изображения редко бывают идеальными или однозначными.

Очевидным направлением дальнейших исследований является повышение устойчивости системы к нечетким данным и контекстуальным изменениям. Необходимо исследовать, как модели могут учиться не только распознавать опасности, но и понимать их серьезность и потенциальные последствия. Более того, важно выйти за рамки простого обнаружения и перейти к прогнозированию — предсказанию потенциальных опасностей до того, как они возникнут.

В конечном счете, структура определяет поведение. Необходимо помнить, что любая система обнаружения опасностей — это лишь инструмент, и ее эффективность зависит от целостной системы управления безопасностью на строительной площадке. Простое добавление искусственного интеллекта не решит всех проблем, если не будет сопровождаться изменениями в культуре безопасности и процедурах работы.


Оригинал статьи: https://arxiv.org/pdf/2511.15720.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-11-21 20:46