中药萃取控制数据模型研究

(整期优先)网络出版时间:2022-07-28
/ 2

中药萃取控制数据模型研究

张燕聪,马怀杰

广州盛原成科技有限公司  广东广州市511495

摘要:中药组分复杂,提取过程稳定差、产品均一性低等问题,导致中药生产智能控制研究方面比较落后,而且产线智能化程度低、效率低的问题亟需解决。本文基于广州某中药公司的低温高压萃取生产线进行智能控制研究,实时采集生产输入输出信息,经过数据处理和分析,得出智能控制数学模型,控制产品质量和生产安全,提高生产效率,减低生产成本;

关键词:中药低温萃取、控制模型

引言

我国是中草药的发源地,迄今为⽌已经发现了⼀万多种药⽤植物。中药组分复杂,提取过程稳定差、产品均一性低等问题,导致中药生产智能控制研究方面比较落后,而且产线智能化程度低、效率低的问题亟需解决。随着物联网技术的深化,传感器数量成爆发式增长,为数据收集提供了保障。同时,算法模型的优化为数据训练提升了效率,这都为技术支持层的发展提供了源源不断的动力。

一、数据样本获取

数据样本按照不同类型分成输入数据和输出数据

1.1、输入数据

输入数据也即是控制参数;在本研究对应的项目中,整个萃取的过程共有6个输入参数,其中2个温度参数,2个压力参数,2个开关参数。这6个参数控制着整个萃取过程的进行。其中温度参数用T1、T2表示,压力参数用Pa1、Pa2表示,开关参数用K1、K2表示。输入数据的定义如下表所示:

C:\Users\95864\Documents\WeChat Files\wxid_0m3eco40elb922\FileStorage\Temp\1654603359469.jpg

和一般的数据研究不同,生产设备的控制参数,由于涉及设备、生产环境及生产人员的安全要求,必须严格遵守安全规范,所以数据不能完全使用随机生成;我们在获取输入数据的时候,有两个方案:

输入数据获取方案一:采集无规律的实时输入控制数据: 1)在设备中使用智能温度及压力仪表,实时监控生产线的输入数据采集点数据,在生产的过程中采集输入数据值;2)生产过程中,任意一个控制参数的数据调整,数采软件都自动记录该输入数值及发生时间;3)系统采用盛原成SIOT数采软件进行控制数据的实时采集和记录;

输入数据获取方案二:生成规律的输入控制数据:1)根据生产设备的系统参数以及对应产品的生产经验,获得一组下限值,这组下限值作为根节点;2)从根节点开始,按广度优先顺序遍历所有输入参数,对每个节点的每个参数,增加一个固定的比例5%(该参数的上限值减去下限值乘以5%),任意一个参数的调整均产生一个下级节点;3)直到所有参数都到达上限值;4)剪枝去除参数组合完全重复的节点及其下级节点;5)采用盛原成SIOT数采软件进行输入数据反控输入;

在本研究中,我们采用方案一获取输入数据

1.2、输出数据

整个萃取的过程中,共有17个输出参数,其中12个压力参数,2个流量参数,1个滤膜消耗速度参数,1个小批次参数,1个质量参数;压力参数用Pb1到Pb12表示,流量参数用S1、S2表示,滤膜消耗速度用C表示;小批次参数用N表示,质量参数用Q表示;压力输出数据主要是用于安全监控和分析,流量数据用于效率监控和分析,滤膜消耗参数用于成本监控和分析。

其中Pb1-Pb12通过智能压力仪表连接自动采集程序自动直接采集,本实验使用的数据采集软件是盛原成公司的SIOT采集软件,流量数据同样使用智能仪表自动采集和记录。滤膜消耗数据C需要根据人工判断做输入,实际是通过滤膜使用时长进行成本转换,不同的输入条件下,滤膜消耗和滤膜使用时长成反比。

所有输出数据的定义如下表所示:

C:\Users\95864\Documents\WeChat Files\wxid_0m3eco40elb922\FileStorage\Temp\1654603376622.jpg

获得输出数据同样有两个方案

输出数据采集方案一:根据无规律的生产输入进行输出监控和采集。1)使用盛原成SIOT软件实时监测和记录仪表的输出数据,每当监控到数值变化的时候记录并标记输出数据的产生时间;2)记录每次实验的滤膜消耗情况(实际我们使用每次消耗相同的滤膜数量来方便记录和计算);3)持续进行约500次不同的人工控制,监控和记录输入值和输出值的每次变更及时间。

输出数据采集方案二:使用规律的输入数据树进行输出监控和采集。1)使用规律的输入数据树,按照深度优先算法从根节点开始进行实验,并监控对应的输出值;2)当输入或输出数据变化时记录并标记输出数据的产生时间;3)当某个输出值大于等于安全临界值时,则该输入数据节点的下级节点全部不再进行输入,即抛弃该节点的所有下级节点;4)一直到所有节点都输入完毕或被抛弃为止;5)每次更换滤膜也会采集一个数据及时间点。

在本研究中,我们采用方案一获取输出数据

二、数据样本分析

通过数据采集,我们获得了原始的数据,原始的数据是简单时序数据,每个数据除了名称外就只包含时间、值;数据类似下图:

1655711412574

1655711417577

C:\Users\95864\Documents\WeChat Files\wxid_0m3eco40elb922\FileStorage\Temp\1654754931460.jpg

2.1、数据处理和清洗

计算滤膜消耗速度:每个小批次使用相同的滤膜数量,可以通过批次的起止时间,计算得出每个批次的滤膜消耗速度;

去除噪音数据:将每个数据表中偶发明显偏小或偏大的不合理噪音数据去除;

去除质量不达标数据: 去除质量不达标的数据行;

2.2、数据合并及同构

我们对原始数据进行处理,根据时间线合并数据;合并后的数据类似下图所示:

1655711470345

2.3、数据对齐

将数据结构以时间为依据进行合并后,我们发现数据存在着大量的空白,必须往前追溯进行填充补齐;对每一个空白点,往前查找最近一个存在数据值的时间点,并将该时间点的数值记录到空白时间点上作为该点的数值;数据对齐以后,后续的分析便和数据的时间无关了,可以去除;最后补齐的数据类似下图所示:

1655711505715

2.4、数据拆分

根据17个个输出参数,将每个输出和所有输入参数切分成一个独立的数据表;拆分后的数据表如下所示:

1655711612566

1655711637428

2.5、数据去重

将每个数据表中重复的行去除,重复数据只保留第一条;

三、算法分析

将经过分析处理后的17个数据表数据,导入BP神经网络程序进行算法分析;遗传算法的基本流程如下:

图 1.1遗传算法流程

遗传算法优化BP神经网络分为BP神经网络结构确定、遗传算法优化和 BP神经网络预测3个部分。

其中,BP神经网络结构确定部分根据拟合函数输入输出参数个数确定 BP神经网络结构,这样就可以确定遗传算法的优化参数个数,进而确定遗传算法个体的编码长度。遗传算法优化的参数是 BP神经网络的初始权值和阈值,只要网络的结构已知,权值和阈值的个数就已知了。种群中的每个个体都包含了一个网络所有权值和阈值,个体通过适应度函数计算个体适应度值,遗传算法通过选择、交叉和变异操作找到最优适应度值对应的个体。BP神经网络预测用遗传算法得到最优个体对网络进行初始权值和阈值的赋值,网络经训练后预测样本输出。神经网络的权值和阈值一般是通过初始化为【-0.5,0.5】区间的随机数,这个初始化参数对网络训练的影响很大,但是又无法准确获得,对于相同的初始权重值和阈值,网络的训练结果是一样的,引入遗传算法就是为了优化出最优的初始权值和阈值。

遗传算法优化BP神经网络是用遗传算法来优化BP神经网络的初始权重值和阈值,使优化后的BP神经网络能够更好地进行样本预测。遗传算法优化BP神经网络的要素包括种群初始化、适应度函数、选择算子、交叉算子和变异算子。

四、建立数学模型

经过BP神经网络算法训练和分析,基于本研究对应的中药萃取产线;我们得出以下几个数学模型:1)输入与安全的关系模型;2)输入与效率的关系模型;3)输入与成本的关系模型;4)效率与成本的关系模型;

五、模型验证

由于我们是基于有限的输入进行总结的数学模型,为确定模型的有效性,还需要进行模型的验证。我们采用重新采集一系列生产数据进行验证,并选取不与原有的输入重复的数据进行验证;经验证,得出的模型是有效的;

六、应用

1、按照效率最优模型,可以提高26%效率,但会增加一定的成本;

2、根据成本最优选择模型,可以降低19%的成本;

3、实际生产中,按照一定的效率和成本权重选择合适的输入参数可以提高8%的效率同时降低13%的成本;