ИСТИНА |
Войти в систему Регистрация |
|
ИСТИНА ПсковГУ |
||
Сегментация представляет собой процедуру анализа изображений и перехода в пространстве образца от поглощения излучения к пространственному распределению материалов, его составляющих. Например, при исследовании пористых сред и материалов это необходимо для последующего моделирования макроскопических свойств. Примерами таких пористых сред, представляющих особый интерес, являются пористые среды природного происхождения, такие как почвы и почвоподобные структуры, и моделирование фильтрации в таких образцах – так называемое моделирование в масштабе пор – необходимо для изучения процессов фильтрации жидкости в почве, выявления и описания процессов, сопровождающих сезонную динамику порового пространства, определение педотрансферных потоков в толще почв. Несмотря на большое количество различных существующих методик для сегментации изображений пористых сред, ни одна из них не может претендовать на звание точной. Кроме неточностей, вносимых экспериментальной процедурой самой томографии и математической процедуры реконструкции по теневым проекциям (например, шумы и артефакты), в этом виновата фундаментальная проблема разрешения изображения или так называемый partial volume эффект, т.е. содержание в одном вокселе смеси различных фаз/материалов. Хотя существуют особые случаи, когда эта проблема разрешима, например, когда твердая фаза состоит только из одного вещества с известным поглощением, или из большего количества известных веществ, снятых на нескольких энергиях в синхротроне. Такие решения или не могут применяться в общем случае, либо слишком затратны/неточны. Поэтому во всех существующих методах присутствует набор параметров, которые выбираются либо оператором, либо либо автоматически (например, за счет анализа гистограммы градаций серого) и влияют на результаты сегментации. Как показали исследования, оба этих подхода приводят к значительным ошибкам. Потенциально точным методом сегментации без входных параметров является машинное обучение, но оно требует «идеальных» (true data) результатов сегментации для тренировки нейронной сети. Отсутствие таких данных является еще одной фундаментальной проблемой, которая препятствует как созданию метода на основе искусственного интеллекта, так и верификации результатов любой другой методики. Разработанная технология позволит быстро и точно обрабатывать большие объемы 3D томографических данных, в том числе о строении порового простанства почвы. Отсутствие таких данных является еще одной фундаментальной проблемой, которая препятствует как созданию метода на основе искусственного интеллекта, так и верификации результатов любой другой методики. Решение сформулированных выше фундаментальных проблем, в том числе зависимости результатов сегментации от настроек метода и/или влияния выбора оператора, предлагается за счет создания универсального метода сегментации томографических изображений. Изначально междисциплинарный подход к разработке технологии такого метода построен на основе стохастического super-resolution алгоритма и совмещения разномасштабных изображений, синтетических томограмм и машинного обучения, в том числе на основе свёрточных нейронных сетей. Предлагаемое решение позволит создать метод не требующий участия оператора и не имеющий внешних настраиваемых параметров, но при этом позволяющий получать точные (вплоть до частичного заполнения пикселя/воксела определяемого разрешением изображения) сегментации, независимые от настроек томографа, параметров реконструкции по теневым проекциям, и изначального разрешения съемки. Актуальность создания такой технологии тяжело переоценить — точность последующего анализа получаемых томографических изображений напрямую зависит от качества сегментации. Быстрые и точные сегментации позволят значительно повысить достоверность такого анализа и последующего моделирования с использованием получаемых изображений. По сравнению с существующими методами сегментации предлагаемые подходы позволят впервые создать облачный сервис по сегментации томографических изображений пористых сред с точностью в пределах частичного заполнения вокселей и не требующего выбора параметров оператором. Ожидаемые результаты по своему научному содержанию соответствуют мировому уровню исследований в области сегментации томографических изображений, а в части проработки методики, использования уникальной коллекции образцов (несколько тысяч томографических изображений), валидации разрабатываемых методик на основе комплексного анализа лабораторных данных с численным моделированием будут превосходить известные в настоящее время мировые аналоги.
Segmentation is a procedure of image analysis which transforms spatial distribution of X-ray attenuation within the sample to spatial distribution of materials or components. For example, in the study of porous media and materials, segmentation is a necessary step for the subsequent modeling of macroscopic properties. Examples of such porous media of particular interest are soils and soil-like formations and other porous materials, and flow modeling in such samples — including the so-called pore scale modeling — is necessary to research filtration processes, determination and description of processes occurring during season dynamics, determination of pedotransfer fluxes in soils. Despite the large number of different existing methods for segmentation of images of porous media, none of them can even pretend to where this problem is solvable, for example, when the solid phase consists of only one substance with known X-ray absorption, or from larger known subtances scanned at several energies in the synchrotron. Such solutions either cannot be applied in general or are too costly / inaccurate. Therefore, in all existing methods there is a set of parameters that are selected either by the operator or automatically (for example, by analyzing the grayscale histogram) and affect the segmentation results. Studies have shown that both of these approaches lead to significant errors. A potentially accurate method of segmentation without input parameters is machine learning, but it requires “ideal” (true data) segmentation results as training data for a neural network. The absence of such data is another fundamental problem that hinders both the creation of a method based on artificial intelligence and the verification of the results of any other conventional method. The investigated technology will allow fast and accurate proceeding of large volumes of 3D tomographic data including structure of soils pore space. Absence of such data is another barrier to investigation of method based on artificial intellect and verification of results of another methods. The solution of the fundamental problems formulated above, including the dependence of the segmentation results on the method settings and / or the influence of the operator’s choice, is proposed by creating a universal method for the segmentation of tomographic images. Initially, an interdisciplinary approach to the development of technology of this method is based on a stochastic super-resolution algorithm and fusion of multi-scale images, synthetic tomograms and machine learning, including convolutional neural networks. The proposed solution will allow us to create a method that does not require operator participation and does not have external adjustable parameters, but allows to obtain accurate (up to partially filling the pixel / voxel image resolution) segmentation, independent of the tomography settings, reconstruction parameters for shadow projections, and the original imaging resolution. The urgency of creating such a technology is hard to overestimate - the accuracy of the subsequent analysis of the resulting tomographic images directly depends on the quality of segmentation. Fast and accurate segmentation will significantly improve the reliability of such analysis and subsequent modeling using obtained 3D images. The developed technology will allow fast and accurate processing of large volumes of 3D tomographic data, including the structure of oil and gas containing rocks and soil reservoirs obtained by micro and macro-tomography methods, in automatic mode with high accuracy. Compared to existing segmentation methods, the proposed approach will allow for the first time to create a cloud service for the segmentation of tomographic images of porous media with an accuracy within the limits of partial filling of voxels and not requiring the operator to select any parameters. The expected results in their scientific content correspond to the world level of research in the field of segmentation of tomographic images, and in terms of elaboration of the methodology, use of a unique collection of samples (several thousand tomographic images), validation of the developed methods based on a comprehensive analysis of laboratory data with numerical modeling will superceed the currently known world analogues.
Такой метод не требует участия оператора и не имеет настраиваемых параметров (см. обсуждение внутренних параметров нейронных сетей в методологическом разделе), но при этом позволяет получать точные (вплоть до частичного заполнения пикселя/воксела определяемого разрешением изображения) сегментации, независимые от настроек томографа, параметров реконструкции по теневым проекциям, и разрешения съемки. Ввиду наличия у коллектива значительной коллекции образцов томографических изображений пористых сред, разработка и верификация методики будет проводиться на таких изображениях. Для достижения поставленной основной цели Проекта необходимо получение следующих основных результатов: 1) Библиотека томографических изображений из сотен образцов с обработкой стеков согласно протоколу (размер стека, качество, разрешение, параметры съемки и реконструкции, дополнительные данные и т.д.). Эти образцы будут служить основой (прокси-образцами) для создания библиотеки «идеальных» сегментаций и синтетических томограмм для тренировки нейронных сетей. 2) Вспомогательная стохастическая методика для трехмерной многофазной сегментации (расстановки фаз на основе корреляционных функций и локальных значений в градациях серого) с учетом двухмерных карт распределения фаз/материалов, которые обычно получают в виде 2D изображений такими методами как XRD/XRF. 3) Сегментация (бинарная и многофазная сегментация для каждого образца) библиотеку прокси-образцов на основе самых современных методов с локальными порогами. 4) Методика цифрового увеличения разрешения и добавления элементов структуры ниже изначального порога разрешения по изображениям более высокого разрешения (совмещение масштабов) на основе стохастических реконструкций и корреляционных функций, с верификацией на основе морфологического анализа и сеточных моделей. Вопрос минимального необходимого увеличения требует отдельного ответа, который мы собираемся исследовать с использованием синтетических томограмм (на данном этапе предполагаем, что увеличения х10 раз будет достаточно) и выбрать единое значение увеличения для всего Проекта. 5) Обновление библиотеки отсегментированных прокси-образцов с помощью разработанных методик с целью добавления для каждой сегментации прокси-образца бинарную и многофазную «идеальную» сегментацию за счет цифрового увеличения разрешения (в том числе, с добавлением деталей ниже изначального разрешения). 6) Отработанная методика создания синтетических томограмм по увеличенным цифровым моделям прокси-образцов – сначала получим синтетические теневые проекции, из которых реконструируем синтетические томографические изображения. Для каждого образца создадим набор синтетических томограмм с разными параметрами (виртуального) томографа и настройками математической реконструкции по теневым проекциям (энергия излучения, разрешение, отсечки по гистограмме серого и т.д.). Определим необходимый набор таких точек в поле параметров для тренировки нейронных сетей. 7) На основе моделирования фильтрации методами в масштабе пор определим количественно размер ошибки за счет лимита разрешения сегментируемых изображений и частичного заполнения вокселей различными фазами/материалами. 8) На основе расчета тензорных проницаемостей выберем наиболее точный вариант сегментаций на основе нейронных сетей при их тренировке на основе 2D или 3D изображений. 9) Исследуем универсальность сегментации на основе машинного обучения, т.е. ответим на вопрос – как точнее тренировать: на всех возможных образцах или на группе образцов сходного генезиса? 10) Исследуем чувствительность различных архитектур CNN к параметрам томографа и настройкам математической реконструкции по теневым проекциям. 11) Выберем наиболее эффективную архитектуру нейронной сети для сегментации томографических изображений, проведем тренировку и ее верификацию на основе библиотеки связки «идеальных» сегментаций (увеличенные цифровые модели) и синтетических томографических изображений. Разработанная технология позволит быстро и точно обрабатывать большие объемы 3D томографических данных, в том числе о строении порового пространства почв почвогрунтов, полученными методами микро и макротомографии, в автоматическом режиме с высокой точностью. По сравнению с существующими методами сегментации предлагаемые подходы позволят впервые создать облачный сервис по сегментации томографических изображений пористых сред с точностью в пределах частичного заполнения вокселей и не требующего выбора параметров оператором. Ожидаемые результаты по своему научному содержанию соответствуют мировому уровню исследований в области сегментации томографических изображений, а в части проработки методики, использования уникальной коллекции образцов (несколько тысяч томографических изображений), валидации разрабатываемых методик на основе комплексного анализа лабораторных данных с численным моделированием будут превосходить известные в настоящее время мировые аналоги. Косвенно о высоком мировом уровне предлагаемых исследований свидетельствует значительный существующий задел, который был опубликован в ведущих мировых научных изданиях из первой квартили Q1. Ожидаемые результаты могут быть использованы компаниями, научными и экспертными организациями, связанными с работам в области физики и гидрологии почв, моделированию продвижения влаги и растворов в почвах и почвогрунтах, долгосрочным прогнозом воздействия природных и техногенных процессов при внесении удобрений и разных типах землепользования; оказывающими консультационные и страховые услуги, в том числе при разработке эффективных методов орошения и точного земледелия; органами исполнительной власти, в компетенции которых находятся вопросы планирования регионального социально-экономического развития. Предлагаемые к разработке методики, хотя и будут тестироваться и применяться в Проекте в приложении к почвам и почвогрунтам, имеют широкий спектр применения в науках о материалах, фармацевтике, медицине — везде, где требуется обработка изображений томографии.
грант РНФ |
# | Сроки | Название |
1 | 1 июля 2019 г.-30 июня 2022 г. | Универсальный метод сегментации томографических изображений порового пространства почв на основе машинного обучения: от современных локальных алгоритмов к синтетическим томограммам |
Результаты этапа: |
Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".