ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Journal influence

Higher Attestation Commission (VAK) - К1 quartile
Russian Science Citation Index (RSCI)

Bookmark

Next issue

4
Publication date:
09 December 2024

Bioreactors database

Date of submission article: 04.03.2015
UDC: 004.65
The article was published in issue no. № 3, 2015 [ pp. 210-213 ]
Abstract:Nowadays, much attention is paid to the development of biotechnological processes, an important element is the bioreactor. Taking into account the development of modern industry, the number and variety of produced bioreactors is constantly increasing. In order to systematize industrial bioreactors data using Microsoft SQL Server 2008 R2, the “Bioreac-tors” database was created. It systematizes the devices themselves as well as their basic technical and operational characteris-tics. For easy operation of the developed software it is necessary to provide the most comfortable user interaction with the program. Thus, using the Microsoft Visual Studio 2010 software package, an application was created. It represents a database graphical interface. The application allows you to obtain information about the bioreactors, manufacturers, tools, automation and other data in tables with the option to sort information. The tables in the database were developed for entering infor-mation about new models, companies and measuring instruments, and for correcting and updating existing information. A part of the software windows are fitted out with graphical regions to visualize the design of a biotechnological apparatus. As the result, the software product includes an interface adapted for users without knowledge of SQL. A software module was created for automatic data enrichment of the software product. It allows automatically analyze, collect and classify infor-mation from the web sites of manufacturers of bioreactors to fill and update existing databases. The approach, which was used in the module, is based on the DOM tree analysis, as well as on the combination of such methods as HtmlAgilityPack and Data Extracting SDK.
Аннотация:В настоящее время большое внимание уделяется развитию биотехнологических процессов, важным элементом которых является биореактор. В связи с развитием современной промышленности количество и многообразие вы-пускаемых биореакторов постоянно увеличивается. Для систематизации данных о промышленных биореакторах с помощью пакета Microsoft SQL Server 2008 R2 была создана БД «Bioreactors» (Биореакторы), в которой системати-зированы как сами аппараты, так и их основные технические и эксплуатационные характеристики. Для удобства эксплуатации разработанного программного продукта необходимо обеспечить максимально комфортное взаимодействие пользователя с программой, поэтому с помощью программного пакета Microsoft Visual Studio 2010 было разработано приложение, представляющее собой графический интерфейс БД. Приложение позволяет получать информацию о биореакторах, производителях, средствах автоматизации и другие данные в виде таблиц с возможностью сортировки сведений. Таблицы предназначены как для внесения в базу информации о новых моделях аппаратов, компаниях и измерительных приборах, так и для корректировки и обновления существующей информации. Часть программных окон оснащены графическими областями для наглядного представления конструкции биотехнологиче-ского аппарата. Полученный программный продукт имеет интерфейс, адаптированный для пользователей без знания языка запросов SQL. Для автоматического пополнения данных программного продукта был создан модуль ПО, позволяющий в автоматическом режиме анализировать, собирать и классифицировать информацию с web-сайтов производителей биореакторов для наполнения и актуализации имеющейся БД. Используемый в модуле подход основан на анализе DOM-дерева, а также комбинации таких методов, как HtmlAgilityPack и Data Extracting SDK.
Authors: Vorobyova E.S. (emulsja@rambler.ru) - D. Mendeleev University of Chemical Technology of Russian Federation, Moscow, Russia, Ivanov S.I. (patephon2009@yandex.ru) - D. Mendeleev University of Chemical Technology of Russian Federation, Moscow, Russia, Ph.D, Menshutina N.V. (chemcom@muctr.ru) - D. Mendeleev University of Chemical Technology of Russian Federation, Moscow, Russia, Ph.D
Keywords: dom tree, microsoft visual studio, microsoft sql server, database, bioreactor
Page views: 10556
Print version
Full issue in PDF (8.21Mb)
Download the cover in PDF (1.09Мб)

Font size:       Font:

Важным элементом биотехнологических процессов является биореактор. Существуют различные типы структурного оформления систем биореакторов в зависимости от необходимых условий процесса. Развитие современной науки и техники позволяет использовать практически уникальное устройство для каждого биотехнологического производства или исследования [1]. Разнообразие аппаратурного оформления и конструкционных особенностей биореактора способствует возник­новению множественных классификаций, помога­ющих систематизировать рабочие характеристики устройства [2, 3].

В век информационных технологий особую значимость приобретает быстрый и удобный по­иск информации. Основным средством хранения и обработки данных являются БД, функциональные особенности которых позволяют сортировать данные и осуществлять выборку необходимой информации [4].

С помощью Microsoft SQL Server 2008 R2 была создана БД «Bioreactors» с целью систематизации информации о промышленных биореакторах, выпускаемых современными производителями [5–9]. БД состоит из семи таблиц: «Bioreactors» (Биореакторы), «Process» (Процессы), «Controllers» (Средства контроля), «MixerType» (Тип смешения), «Manufacturers» (Производители), «Activi­ties» (Деятельность) и «ManufActivity». Набор таких данных, как название биореактора, материал его корпуса, наличие встроенной системы стерилизации, насоса и рабочего ПО, хранится в таблице «Bioreactors», которая содержит поля «Name» (Название), «BodyMaterial» (Материал корпуса), «HeatExchange» (Теплообмен), «Autoclave» (Автоклав), «Pump» (Насос), «Software» (ПО), «Designa­tion» (Конструкционное решение), а также ключи для связи с данными из других таблиц (рис. 1). Для контроля параметров процесса в биореакторах используют измерительные приборы и датчики, тип которых описан в таблице «Controllers». В данной таблице отражены эксплуатационные характеристики каждого прибора. Информацию о масштабности биотехнологической установки включает таблица «Process», в которую включены данные об объеме рабочего сосуда, необходимого для проведения лабораторного эксперимента, пилотного или промышленного производства. В таблице «MixerType» находятся данные об используемом способе перемешивания веществ в биореакторе, например перфузионном. Таблица «Manu­facturers» содержит сведения о производителях с учетом названия компании, контактного номера телефона, страны, адрес страницы производителя в Интернете, представительства в России для иностранных компаний. Дополнительные коммерческие возможности компаний сведены в таблицу «Activities», созданную для демонстрации аспектов полезного сотрудничества. Инфологическая схема БД представлена на рисунке 1.

Для удобства эксплуатации разработанного программного продукта необходимо обеспечить максимально комфортное взаимодействие пользователя с программой [10]. Поэтому с помощью программного пакета Microsoft Visual Studio 2010 было создано приложение «Bioreactors», которое представляет собой графический интерфейс БД.

Главное окно приложения предоставляет пользователю возможность обзора таблицы «Bioreac­tors» (рис. 2). Доступ к данным осуществлен в виде таблицы с активными полями. В результате нажатия на поле происходит сортировка информации в строках таблицы в алфавитном порядке, а также по увеличению/уменьшению значения интересующего параметра. При выделении данных основной таблицы в графическом поле окна отражается внешний вид соответствующего биореактора. Реализована возможность корректировки и добавления данных. В этом окне пользователю доступны такие функциональные кнопки, как «Производители», «Контроллеры», «Назначение биореактора», «Диаграмма таблиц» и «Запрос», нажатие которых приводит к открытию соответствующих окон.

Окно «Производители» включает в себя две области для работы с данными (рис. 3). В верхней части рабочего окна расположена таблица с данными, отражающая информацию из таблицы «Manufacturers». Аналогично главному окну программы поля представленной таблицы являются активными. С их помощью осуществляется сортировка данных, которые можно корректировать, добавлять или удалять. При выделении отдельных данных в графической области также изменяется логотип компании-производителя.

Нижняя область создана для просмотра данных, являющихся результатом наиболее распространенных запросов в рассматриваемой области. Результат выводится в таблицу с помощью кнопок. Так, при нажатии кнопки «Дополнительные возможности предприятия» в таблице появляются данные, которые являются результатом объединения и сортировки данных из двух таблиц посредством вложенного запроса. Аналогично при нажатии соответствующих кнопок реализованы наиболее распространенные запросы, например, подсчет количества биореакторов каждого предприятия или наличие встроенной системы автоклава. Такие разделы программы, как «Контроллеры» и «Назначение биореактора», разработаны по принципу главного окна.

При разработке программного продукта был создан модуль ПО, позволяющий в автоматическом режиме анализировать, собирать и классифицировать информацию с web-сайтов производителей биореакторов для наполнения и актуализации имеющейся БД [6–8]. Программный модуль анализирует содержание web-страницы, находит информацию о биореакторах, сравнивает ее с имеющейся в БД и при необходимости дополняет или изменяет информацию в БД. Приведем краткое описание принципа работы программного модуля, общая схема работы которого представлена на рисунке 4.

Используемый в модуле подход основан на анализе DOM-де­рева (Document Object Model – «объектная модель документа»), который позволяет получить данные непосредственно по уникальному идентификатору, а также по другим атрибутам элемента дерева. В случае отсутствия идентификатора возможно обращение к элементу, используя уникальный путь при спуске вниз по DOM-дереву или, например, при пересортировке однотипных элементов.

Данный подход удобен в использовании, так как позволяет извлекать данные любого типа и уровня сложности, а также получать необходимое значение элемента по пути его расположения. Однако необходимо учесть то, что путь элемента может изменяться, поэтому данная часть программного модуля рассчитана на кратковременный период сбора данных – при сильном изменении структуры web-сайта производителя требуется корректировка путей элементов сайта. Следует отметить, что необходимость в анализе DOM-де­рева присутствует не всегда. Например, если данные веб-ресурса отражены с помощью некоторых таблиц или шаблонов, где рассматриваются элементы одного типа, но разного значения, используется так называемый парсинг строк (string parsing), применение которого зачастую более эффективно, чем анализ DOM-дерева.

Из-за многообразия данных и способов их выражения на сайтах производителей в данном программном продукте используются комбинации различных подходов. В работе использовались такие инструменты, как HtmlAgilityPack, предоставляющий возможность анализировать DOM-дере­во, и Data Extracting SDK, позволяющий использовать парсинг строк.

Таким образом, разработанный программный продукт обеспечивает удобный доступ к данным пользователю с любым уровнем владения языком запросов SQL, а также при отсутствии таких навыков. Приложение позволяет осуществлять оперативный поиск необходимой информации в понятной и легкой для восприятия форме. С учетом темпов развития мирового производства важной функцией данного приложения является возможность добавления и расширения хранимых данных как с помощью автоматизированного модуля, так и в режиме ручной работы пользователя с приложением.

Литература

1.     Меньшутина Н.В., Мишина Ю.В., Алвес С.В. Инновационные технологии и оборудование фармацевтического производства. М.: Бином, 2012. Т. 1. 328 с.

2.     Сазыкин Ю.О., Орехов С.Н., Чакалева И.И. Биотехнология: учеб. пособие для студентов вузов. М.: Академия, 2008. 256 с.

3.     Северин С.Е. Биохимия и медицина – новые подходы и достижения. М.: Русский врач, 2006. 94 с.

4.     Меньшутина Н.В., Матасов А.В. Современные информационные системы хранения, обработки и анализа данных для предприятий химической и смежных отраслей: учеб. пособие. М.: Изд-во РХТУ им. Д.И. Менделеева, 2011. 307 с.

5.     Каталог фармацевтического оборудования. URL: http://pharmic.ru/ (дата обращения: 19.12.2014).

6.     Биореакторы промышленные. Бизнес-каталог фирм, компаний, предприятий. URL: http://www.ru.all.biz/bioreaktory-promyshlennye-epg1070832 (дата обращения: 20.12.2014).

7.     Поставщики машин и оборудования. URL: http://www. oborudunion.ru/i_store/item_1000356668/promyshlennye-bioreak­tory.html (дата обращения: 21.12.2014).

8.     Химический портал ChemPort.Ru. Поставщики фармацевтического оборудования. URL: http://www.chemport.ru/labe­quipment_products1350.html (дата обращения: 21.12.2014).

9.     Фирма промышленной автоматизации и биореакторов «Bioreactors.net». URL: http://www.bioreactors.net/index.php/ru/ visus-bioreaktoru-razotajus.html (дата обращения: 24.12.2014).

10.  Дунаев В.В. Базы данных. Язык SQL. СПб: БХВ-Пе­тербург, 2006. 288 с.


Permanent link:
http://swsys.ru/index.php?id=4054&lang=en&page=article
Print version
Full issue in PDF (8.21Mb)
Download the cover in PDF (1.09Мб)
The article was published in issue no. № 3, 2015 [ pp. 210-213 ]

Perhaps, you might be interested in the following articles of similar topics: