Учёные ЧелГУ усовершенствовали компьютерное зрение
Математики Челябинского государственного университета разработали новый алгоритм компьютерного зрения.
Математики Челябинского государственного университета разработали новый алгоритм компьютерного зрения.
Многолетняя работа челябинских учёных привела к тому, что способности роботов к распознаванию трёхмерных изображений в пространстве существенно возросли, и теперь умные сенсоры могут «видеть» 3D-объекты, даже если точки, из которых они состоят, распределены неравномерно. Причем помешать автоматическим методам обработки данных не смогут ни шум, ни загрязненность воздуха.
Известно, что новейшие системы компьютерного зрения, использующие обработку и анализ трехмерных изображений, имеют ряд преимуществ перед системами, основанными на применении двумерных данных. К примеру, они почти не зависят от освещения. Дело в том, что каждое облако точек в трехмерном пространстве, формируемое сенсором, содержит миллионы точек, и алгоритм должен учитывать такие факторы, как неравномерное распределение точек в обрабатываемых облаках и разного рода помехи.
Исследования, связанные с изучением автоматических методов обработки 3D-пространственных данных, ведутся уже давно. Но до сих пор математики бьются над задачей построения трехмерного окружения сенсора или робота.
Путь к решению, кажется, удалось нащупать челябинским учёным. Год назад, начиная работу над проектом по гранту Российского фонда фундаментальных исследований, коллектив авторов ЧелГУ приступил к работе над новым алгоритмом компьютерного зрения.
«Сложность задачи регистрации зависит от характеристик исходного и целевого облаков точек. Если облака точек переводятся одно в другое движением в трехмерном пространстве, то проблема регистрации относительно проще, чем в случае несовпадающих с точностью до движения (неконгруэнтных) облаков. В реальных приложениях алгоритм регистрации должен иметь дело с несовпадающими облаками точек. Поэтому важной частью сравнения алгоритмов регистрации стала оценка качества их работы. Простой способ получения пары неконгруэнтных облаков – это добавление случайного аддитивного шума независимо к исходному и целевому облакам», – поясняет доцент кафедры вычислительной механики и информационных технологий, кандидат физико-математических наук Артём Маковецкий.
Таким образом, математики ЧелГУ разработали новый тип функционала компьютерного зрения, используемого в задаче регистрации облаков 3D-точек.
В ходе решения задачи учёные обнаружили, что выбор элементов для облака точек увеличивает вероятность сходимости алгоритма регистрации к правильному решению. На этом наблюдении и основан предложенный функционал. Авторский коллектив успел провести вычислительные эксперименты, которые показали исключительно высокую способность нового алгоритма регистрации облаков точек в трехмерном пространстве.
Однако исследователям предстоит пройти ещё долгий путь к созданию робота с идеальным компьютерным зрением. К примеру, недавно созданный робот пока не может адекватно визуализировать объект при очень сильном шуме или при условии обработки облака, которое содержит от десятков тысяч до нескольких миллионов точек.
Исследования, проводимые в направлении, активно поддержанном челябинскими учёными, уже сегодня меняют реальность. Именно благодаря развитию компьютерного зрения происходит автоматизация привычных процессов. Последние достижения в так называемой «технологии определения глубины элементов сцены с помощью сенсоров» привело к прогрессу во многих областях. Например, такие задачи, как оценка позы и жестов человека, распознавание человеческого лица и его выражения основаны на анализе информации в трех измерениях.
Благодаря развитию компьютерного зрения нас перестали удивлять возможности, которыми обладают современные беспилотники и всевозможные промышленные роботы.
«Основанная на регистрации облаков точек реконструкция трехмерной сцены найдет множество применений в компьютерной графике, взаимодействии человека с компьютером, навигации роботов», – обещает Артём Маковецкий.