第4章 实验数据的整理及软件应用
4.1 实验数据的整理
化工原理实验的目的不仅仅是为了取得一系列的原始实验数据,而是通过这些数据得到各变量之间的定量关系,进一步分析实验现象,提出新的实验方案或得出规律,用于指导生产与设计。要得到各变量之间的关系,就有必要对实验数据进行整理,对实验中获得的一系列原始数据进行分析,计算整理成各变量之间的定量关系,并用最合适的方法表示出来。这是整个化工原理实验过程中一个非常重要的环节。在化工原理实验中,处理实验数据的方法通常有三种:
(1)列表法:列表法是将实验数据按照自变量与因变量的关系以一定的顺序列在表格中,表示各变量之间的关系,反应变量之间的变化规律。这是数据处理的第一步,也是数据绘图或者整理成数学公式的基础。
(2)图示(解)法:图示(解)法是将实验数据的函数关系用图线的形式来表示,从而揭示自变量与因变量之间的关系。图示(解)法可以直观、清晰地显示出相应变量之间的变化规律,便于分析和比较数据的极值点、转折点、变化率以及其他特性,并能方便地标出变量的中间值,得到曲线相应的数学表达式,分析、比较和确定数学表达式的常熟,用外推法求解一般测量方法难以测量的数据。对于比较精确的图形可以在不知数学表达式的情况下进行微积分运算。因此,图示(解)法应用十分广泛。
(3)回归分析法:回归分析法是处理数据变量之间相互关系的一种数理统计方法。该法可以从大量散点数据中寻找到反映数据之间的统计规律,得到最大限度符合实验数据的拟合方程式,并判断拟合方程式的有效性,有利于计算机进行计算。
4.1.1 列表法
4.1.1.1 实验数据表
数据表操作简单明了,有利于阐明某些实验结果的规律。如果设计合理,可以同时表达几种变量,而且不易混淆。实验数据表中随时记录测量的数据,所以在实验之前,要根据实验目的和待测参数进行设计与绘制,在进行实验时就可以清晰、完整地将实验数据记录下来。在原始数据记录表中,应逐相列出实验所需要测量的所有参数名称及其单位,并注意采用与测量仪表相一致的有效位数,在对较大数量级的表达上,应尽量采用科学计数法。本节以测定流体流动阻力的实验原始数据记录表为例(测定光滑直管的摩擦阻力系数与阀门的阻力系数),如表4-1所示。在实验过程中,当完成完成一组实验数据的测试时,须及时将测量的相关数据记录在表格内,实验完成后将得到一份完整的原始数据记录表。
实验结束后,要对所记录的实验数据进行分析和计算处理。实验数据处理结果表用于记录进行运算处理的中间结果和最终结果,其可以避免在数据的计算处理过程中发生数据遗漏和混淆的现象。本节一套管传热实验的数据处理结果表为例,如表4-2所示。
4.1.1.2 实验数据表的注意事项
在拟定和绘制实验数据表时应注意如下几点:
(1)表格中内容要齐全。物理量的名称、符合和单位要列在数据表的表头中。物理量的符号与单位之间用斜线“/”隔开。在一个物理量的单位中,斜线“/”不可重复使用,可以根据情况使用“()”或者负指数的形式。计量单位不宜混在数字之中,以免难以区分。
(2)注意实验数据的有效数字位数。记录的数据应与测量仪表的准确度相吻合,不要过多或者过少。
(3)注意数据的记录方法。当物理量的数值较大或者较小时,应考虑使用科学计数法。采用“物理量的代表符合×10/单位”的形式将“10”记入表头,该形式的数据记录原则为: 物理量的实际值×10=表中数据
(4)为了便于整理和使用,每个数据表都应在表的上方标明表的序号和表的名称(表题)。表的序号±n ±n ±n
要根据出现的顺序进行编号。在出现表格之前,要在正文之中有所指引,不能出现的太突然,要有必要的过渡。同一张表尽量不要跨页显示,如遇特殊情况要跨页,需在所跨页面的表格上方注明“续表„„”。
(5)如在实验前没有拟定好数据记录表,在实验过程中直接记录实验数据作表,则注意数据的自变量尽可能取得等间距,并且为整数为宜。
(6)数据表格要正规,数据书写要清楚整齐,不能潦草应付,否则会难以辨认。修改错误时要用单线将错误划掉,将正确的写在下面。各种实验条件可以写在表题和表格之间,也可以写在表格之间,也可以写在表格的下方。实验合作者的名单可以写在表的下方。
4.1.2 图示(解)法
图示(解)法是表示实验中各变量之间关系最常用的方法,它是将实验中得到的离散的数据点标绘在适宜的坐标上,然后将数据点连成光滑的曲线或者直线。直观清晰,方便比较,容易看出数据中的极值点、周期性以及其他特性,准确的图形还可以在不知道数学表达式的情况下进行微积分运算,是图示(解)法的显著优点。
在化工原理实验中,经常遇到两个变量x,y 的情况,将自变量x 作为图形的横轴,将因变量y 作为纵轴,得到所需要的图形。所以,在绘制图形之前要完成的工作就是按照列表法的要求列出因变量y 与自变量x 相对于的y i 与x i 数据表格。
作图时值得注意的是:选择适合的坐标,使得图形直线化,以便求得经验方程式;坐标的分度要适当,能清楚表达变量间的函数关系。
作曲线图时必须依据一定的法则,得到与实验点位置偏差最小而光滑的曲线图形。
4.1.2.1 选择适宜的坐标系
(1)常用的坐标系:化工中经常使用的坐标系有迪卡儿坐标系(又称普通直角坐标系)、半对数坐标系和对数坐标系。市场上有相应的的坐标纸出售,也可以选择相关的数据处理软件来处理数据。应根据数据的特点来选择合适的坐标系。
对数坐标系的原点为(1,1),而不是(0,0);1,10,100,1000等数对应的常用对数数值分别为0,1,2,3,所以在对数坐标轴上,每一数量级的距离都是相等的;对数坐标轴上某点与原点的实际距离为该点对应数据的对数值,但是在该点标出的值是真数,在求取直线的斜率时,应该选用对数:
lgy2-lgy1tan α lgx2-lgx1
半对数坐标系:图形的两个坐标轴x 轴和y 轴中,一个轴是分度均匀的普通坐标轴,另一个轴是分度不均匀的对数坐标轴,如图4-1所示。
双对数坐标系:图形的两个坐标轴x 轴和y 轴均为不均匀的对数坐标轴,如图4-2所示。
(2)坐标系的选择:在数据处理过程中,如何选择适宜的坐标系,通常以实验测量数据在坐标系上绘制出的图形能否为直线来作为标准。
选择半对数坐标系的情况有:
1) 变量之一在研究范围内发生了几个数量级的变化时;
2) 在自变量从0开始逐渐增大的初始阶段,当自变量的些许变化就能引起因变量相当大的变化时;
3) 需要将某种非线性关系转化为线性关系时,如幂函数关系:y=abx , 因lgy 与x 呈现直线关系。 选择对数坐标系的情况有:
1) 自变量和因变量在研究范围内均发生了几个数量级的变化时;
2) 需要将曲线开始部分划分成展开的形式时;
3) 需要将某种非线性关系转化为线性关系时,如幂函数关系:y=axb , 因为lgy=lga+blgx在双对数坐标
系上表现为一条直线。
4.1.2.2 坐标分度
坐标分度是按每条坐标轴所能代表的物理量的大小来定的,也就是坐标轴的比例尺。坐标分度的选择,应该使得每一个数据点在坐标系上的位置能方便找到,以便在图上读出数据点的坐标值。
坐标分度的确定方法如下:
(1) 在已知x 和y 的测量误差分别为D x 和D y 时,分度的选择方法通常为:使得2D x 和2D y 构成的矩
形近似为正方形,并使得2D x =2Dy =2mm,求得坐标比例常数M 。
x 轴的比例常数为
21M x = = 2Dx Dx
y 轴的比例常数为
M y =21 = 2Dy Dy
(2)在测量数据的误差未知的情况下,坐标轴的分度要与实验数据的有效数字位数相同,并且要方便阅读。
在通常情况下,确定坐标轴的风度时,既要保证不会因为比例常数过大而降低实验数据的准确度,又要避免因比例常数过小而造成图中数据点分布异常的假象。所以,建议选取坐标轴的比例常数M=(1、2、
5)×10n (n 为整数),不使用3、6、7、8等的比例常数,因为在数据绘图时比较麻烦,容易导致错误。±
另外,如果根据数据x 和y 的绝对误差D x 和D y 求出的坐标比例常数M 不恰好等于M 的推荐值,可选用稍小的推荐值,将图适当地画大一些,以保证数据的准确度不因作图而降低。
4.1.2.3 绘图注意事项
(1)确保图中曲线光滑。利用曲线板等工具将各个离散的数据点连接成光滑曲线,并使曲线尽可能通过较多的实验点,或者使曲线以外的点尽可能地位于曲线附近,并使曲线两侧的点数大致相等。另外,用计算机软件处理数据更为准确和便捷。
(2)定量绘制的坐标图,其坐标轴上必须注明该坐标所代表的变量名称、符号及所用的单位。如离心泵特性曲线的横坐标就必须标上流量Q /(m 3/h )。
(3)图必须有图号和图题(图名),以便于整理和引用。必要时还应有图注。
(4)不同线上的数据点可用○、△等不同符号表示,且必须在图上明显地标出。
4.1.3 经验公式
在化工原理实验中,除了用表格和图形描述变量之间的关系外,还常把实验数据整理成方程式,以描述自变量和因变量之间的关系,即建立过程的数学模型。
4.1.3.1 经验公式的选择
化工是以实验研究为主的科学领域,很难由纯数学物理方法推导出确切的数学模型而是采用半理论分析方法、纯经验公式和由实验曲线的形状确定相应的实验公式。
(1)半理论分析方法:在化学工程中,利用因次分析法推导出准数关系式,是一种常用的方法。用因次分析法将众多的参数整理成一些无因次的数群,即准数,不需要首先导出过程的微分方程。但是,如果已经有了微分方程暂时还难以得出解析解,或者又不想用数值解时,也可以从中导出准数关系式,然后再由实验来最后确定其系数值。例如,动量传递、热量传递和质量传递过程的准数关系式分别为
L Eu=A() a Re b (4-5) d
Nu=BRec Pr d
Sh=CRee Sc f
式中的A 、a 、b 、B 、c 、d 、C 、e 、f 等常数均可以通过实验数据计算得出。
(2)纯经验方法:在处理实验数据时,长期从事专业工作的人员可以凭借积累的经验来确
定应采用什么样的数学模型。例如,
常用y=aebt 或者y=aebt+ct2表示化学反应;
常用多项式y=a+a1x+a2x 2+…+an x n 表示溶解热或热容与温度之间的关系; (4-6) (4-7)
在生物学实验中培养细菌时,假设原来的细菌数量为a ,繁殖率为b ,则用y=aebt表示每一
时刻的细菌总量y 和时间t 的关系。
(3)由实验曲线求取实验公式:在整理实验数据的过程中,在选择模型时既没有理论指导,
又没有经验可借鉴的情况下,可以先将实验数据绘制在普通的直角坐标系上,得到一条直线
或曲线。根据得到的曲线类型,可以分为下面两种情况:
1)直线的情况。根据解析几何的原理,在直线上选择相距较远的两点(x 1,y 1)和(x 2,y 2),
代入直线方程:y=mx+n,其中m 、n 的值可由直线的斜率和截距求得。该直线的斜率(△y/
△x )为方程中的系数m ,直线在y 轴上的截距(n )就是方程中的n 值。
2)曲线的情况。y 和x 不是线性关系,可将实验曲线与典型的函数曲线相对照,选择与
实验曲线相似的典型函数曲线,然后用直线化方法对所选函数与实验数据的符合程度加以检
验。
直线化方法就是将函数y=f(x)转化成线性函数Y=A+BX,其中X=φ(x,y ),Y=ψ(x,y)(φ, ψ
均为已知函数) 。由已知函数x i 和y i ,按照Y i =ψ(xi ,y i ),Xi=φ(x i ,y i )求得Y i 和X i ,然后将
(X i ,Y i )在坐标系上标绘,如果得到一条直线,即可选择系数A 和B ,并求得y=f(x)的函数
关系式。如果Y i =f'(Xi ) 偏离直线,则要重新选定Y i =ψ'(xi ,y i ),Xi=ψ'(xi ,y i ), 直至Y-X
为直线关系为止。
4.1.3.2 常见函数的典型图形及线性化方法
非线性函数线性化是将非线性函数转化成线性函数。通常是根据实验测定数据作出离散
点图,再选用合适的曲线拟合数据点,以确定函数的类型,然后用变量变换的方法定出函数
中的未知参数,通过上述步骤就可以将非线性函数转换成线性函数关系。
如果将实验数据采用直线回归进行拟合,则可以表达因变量与自变量之间的函数关系,
便于对实验结果进行规律性分析。
由实验测定数据拟合的经验回归曲线主要有线性函数、对数函数、指数函数、幂函数、
y=1x 、双曲线y=、S 型曲线以及多项式拟合等等。 a+bxa+bx
例如:指数函数y=aebx
两边取对数,得
lgy=lga+bxlge (4-8)
令Y=lgy,X=x,K=blge,
则得到的直线化方程为
Y=KX+lga (4-9)
表4-3列出了几种常见函数的典型图形及其线性化方法。
在前面提到的8种经验公式中,直线型和抛物线型是多项式回归的特例,其他多项式则
比较复杂,但多项式回归非常重要,因为各种函数关系中,至少有一个范围可以用多项式逼
近拟合。因次,在分析一些复杂的实际问题时,通常采用多项式进行描述。
在整理实验数据时,都可以从上述曲线类型中选择一种曲线进行拟合。如果要取得最佳
的拟合效果,最好选用几种函数进行计算,并加以对照比较,选择其中一条与实验数据的残
差平方和最小的曲线为拟合曲线。
4.1.4 图解法求解经验公式中的常数
求取各函数式中未知参数的方法,在化工原理实验中仍然采用最小二乘法。如果该函数
是非线性关系,则可以通过变换使之成为线性关系后求出。
4.1.4.1 对数函数y=algx+b的线性图解
当研究的变量符号对数函数y=algx+b时,将实验数据(xi,yi )标绘在对数坐标上,图形
为一条直线。
(1)系数a 的确定:在标绘得到的曲线上,取相距较远的1点和2点,读取(x i ,y i )和(x 2,y 2), 令横轴x 为对数坐标,根据表4-3中的线性化方法,其直线方程为Y=aX+b,按照下式计算直线的斜率a :
y2-y1 a= (4-10) lgx2-lgx1
(2)系数b 的确定:在对数坐标系中,坐标原点为(1,1)。在y=algx+b中,当x=1时,y=b,因此,系数b 的值可以由直线与过原点的y 轴交点的纵坐标来确定。如果x 和y 的值与1相差比较大,图中找不到坐标原点的时候,可将直线上任一个已知点1的坐标(x 1,y 1)和已经求出的斜率a 代入公式b=y1-algx 1中计算出b 。
4.1.4.2 指数函数y=aebx 的线性图解
当变量x 和y 符号指数函数y=aebx 时,将实验数据(x i ,y i )标绘在半对数坐标上,图形为一条直线。
(1)小说b 的确定:在直线上任取相距较远的两个点,根据两点的坐标(x 1,y 1)和(x 2,y 2)求解系数b 的值。令纵轴y 为对数坐标,根据表4-3中的线性化方法,得到该指数函数的线性化方程Y=lga+KX,所以系数b 为
lgy2-lgy1 (4-11) (x2-x1)lge
(2)系数a 的确定:系数a 的确定与对数函数的方法基本相同,可将直线上任一点处的坐标(x i ,y i )和
yi 已经求出的系数b 代入函数关系式a= 后求解得到系数a 。 e bx i
4.1.4.3 幂函数y=axb 的线性图解
当变量x 和y 符合幂函数y=axb 时,将实验数据(x i ,y i )标绘在对数坐标上,图形为一条直线。
(1)系数b 的确定:在直线上任取相距较远的两点,根据两点的坐标(x 1,y 1)和(x 2,y 2)求解系数b 的值。令纵轴和横轴均为对数坐标,根据表4-3中的线性化方法,得到幂函数的线性化方程Y=lga+bX,所以系数b 为
lgy2-lgy1 B= (4-11) lgx2-lgx1
(2)系数a 的确定:在对数坐标系中坐标原点为(1,1)。在y=axb 中,当x=1时,y=a。因此,系数a 的值可以由直线与过原点的y 轴交点的纵坐标来确定。如果x 和y 的值与1相差比较大,在图中找不到坐标
yi 原点,则可以将直线上任一已知点的坐标(x i ,y i )和已经求得的斜率b 代入函数式a= 中求得系数a 。 xi b
4.1.4.4 y=1 的线性图解 ax+b
1根据表4-3中的线性化方法,将y=转化成Y=Ax+b。 ax+b
(1)系数a 的确定:在曲线上任取相距较远的两点,根据两点的坐标(x 1,y 1)和(x 2,y 2), 采用下面的公式求得系数a 的值:
11 y2y1 a= x2-x1
1(2)系数b 的确定:可将曲线上任一点坐标(x i ,y i )和已经求得的系数a 代入 -ax i 中求得系数b 。 yi
4.1.4.5 y=1 的线性图解 ax+b
x 根据表4-3中的线性化方法,可以将y=转化成Y=bX+a。 ax+b
(1)系数b 的确定:在曲线上任取相距较远的两点,根据两点的坐标(x 1,y 1)和(x 2,y 2), 采用下面的公式求得系数a 的值:
11y2y1 b= 11 x2x1
1b (2)系数a 的确定:可将曲线上任一点坐标(x i ,y i )和已经求得的系数b 代入- 中求得系数a 。 yi xi
14.1.4.6 S 型曲线y= 的线性图解 ae -x +b
1根据表4-3中的线性化方法,可以将y= 转化成Y=aX+b。 ae -x +b
(1)系数a 的确定:在曲线上任取相距较远的两点,根据两点的坐标(x 1,y 1)和(x 2,y 2), 采用下面的公式求得系数a 的值:
11y2y1A= e -x2-e -x1
1(2)系数b 的确定:可将曲线上任一点坐标(x i ,y i )和已经求得的系数a 代入 -ae -xi 中求得系数b 。 yi
4.1.4.7 抛物线型函数y=ax2+bx+c的线性图解
抛物线型函数y=ax2+bx+c中的系数a 、b 、c 均可采用曲线直线化的方法求出。在抛物线曲线上任取一点(x 1,y 1),则有:
y 1=ax12+bx+c (4-16) 将式(4-16)与原抛物线函数方程相减,可得:
y-y 1=a(x2-x 12)+b(x-x1) (4-17) 经过简化处理后,可以得到:
y-y1 =ax+ax1+b (4-18) x-x1
y-y1令Y=,A=ax1+b,则抛物线的线性化方程为: x-x1
Y=ax+A
(1)系数a 的确定:在曲线上任取相距较远的两点,根据两点的坐标(x 2,y 2)和(x 3,y 3), 采用下面的公式求得系数a 的值:
y3-y1y2-y1 -x3-x1x2-x1a= (4-19) x3-x2
yi-y1(2)系数b 的确定:可将曲线上任一点坐标(x i ,y i )和已经求得的系数a 代入b=-ax i 中求得系数b 。 xi-x1
(3)系数c 的确定:可将曲线上的其他一点坐标(x i ,y i )和已经求得的系数a 、b 代入c=yi -ax i 2+bxi +c中求得系数c 。
4.1.5 实验数据的回归分析法
前面几节介绍了用图解法获得经验公式的方法,它有很多的优点,但应用范围有限,因为在化工原理
实验中,由于存在实验误差与某些不确定因素的干扰,得到的数据往往不能用一条光滑的曲线或者直线来表达,实验点是随机地分布在一条直线或者曲线的附近。要得到这些实验数据中所包含的规律性即变量之间的定量关系式,使之尽可能地符号实验数据,应用最广泛的一种数理统计方法就是回归分析法,其中最常见的方法为最小二乘法。
4.1.5.1 变量类型
在解决工程实际问题时,会经常遇到多几个变量共同处于一个过程之中,各种变量间相互联系、相互制约、相互依存的情况。这些变量之间的关系可以分为两类:
(1)函数关系:变量之间的关系可以用函数来表达,成为函数关系,属于确定性的关系。
(2)相关关系:变量之间也有一定的关系,但是这种关系并不完全确定,不能用函数关系来描述。与其中一个变量的每一个值对应的另一个变量的值不是一个或者几个确定值,而是一个集合值,此时,变量x 和y 之间的关系称为相关关系。这是由于在许多实际问题中,或者由于随机性因素的影响,使得变量之间的关系比较复杂,或者由于各个变量的测量值不可避免地存在测量误差,致使变量之间的关系具有不确定性。总之,变量之间的相关关系是普通存在的。
值得注意的是,函数关系和相关关系在概念上是截然不同的,但它们之间并没有严格的分界线。相关变量之间虽然没有确定关系,但是从统计的角度来讲,它们之间又存在着某种确定的函数关系。理论上存在一定函数关系的变量,在多次测试中由于误差的存在也含有不确定性了。因此,两种关系之间存在着相互转化。
4.1.5.2 回归分析法
(1)回归方程:回归分析是处理变量之间相互关系的一种数理统计方法。用这种数字方法可以从测试的大量散点数据中寻找到能反映事物内部的一些统计规律,并可以按照数字模型的形式表达出来,也把它称为回归方程或者回归模型。
(2)线性和非线性回归:回归也称为拟合。对具有相关关系的两个变量,如果用一条直线来描述,则称之为一元线性回归;如果用一条曲线来描述,则称之为一元非线性回归。对具有相关关系的三个变量,其中一个为因变量,两个为自变量,如果用平面描述。则称之为二元线性回归;如果用曲面描述,则称之为二元非线性回归。以此类推,可以延伸到n 维空间进行回归,则称之为多元线性回归。在处理实际问题时,通常将非线性问题转化为线性来处理。建立线性回归方程的最有效方法为最小二乘法。
(3)回归分析的内容:回归分析法所包括的内容(或者说可以解决的问题),概括起来有四个方面:
1)根据一组实验测量数据,按照最小二乘法原理建立起正规方程,求解正规方程得到变量之间的数学关系式,也就是回归方程式。
2)判断所得到的回归方程的有效性。回归方程式是通过数理统计方法得到的,是一种近似结果,必须对它的有效性进行定量检验。
3)根据一个或者几个变量的取值,预测或者控制另一个变量的取值,并确定其准确度(精度)。
4)进行因素分析。对于一个因变量受多个自变量或者因素影响的情况,可以分清各自变量的主次和分析各个自变量或者因素之间的相互关系。
第4章 实验数据的整理及软件应用
4.1 实验数据的整理
化工原理实验的目的不仅仅是为了取得一系列的原始实验数据,而是通过这些数据得到各变量之间的定量关系,进一步分析实验现象,提出新的实验方案或得出规律,用于指导生产与设计。要得到各变量之间的关系,就有必要对实验数据进行整理,对实验中获得的一系列原始数据进行分析,计算整理成各变量之间的定量关系,并用最合适的方法表示出来。这是整个化工原理实验过程中一个非常重要的环节。在化工原理实验中,处理实验数据的方法通常有三种:
(1)列表法:列表法是将实验数据按照自变量与因变量的关系以一定的顺序列在表格中,表示各变量之间的关系,反应变量之间的变化规律。这是数据处理的第一步,也是数据绘图或者整理成数学公式的基础。
(2)图示(解)法:图示(解)法是将实验数据的函数关系用图线的形式来表示,从而揭示自变量与因变量之间的关系。图示(解)法可以直观、清晰地显示出相应变量之间的变化规律,便于分析和比较数据的极值点、转折点、变化率以及其他特性,并能方便地标出变量的中间值,得到曲线相应的数学表达式,分析、比较和确定数学表达式的常熟,用外推法求解一般测量方法难以测量的数据。对于比较精确的图形可以在不知数学表达式的情况下进行微积分运算。因此,图示(解)法应用十分广泛。
(3)回归分析法:回归分析法是处理数据变量之间相互关系的一种数理统计方法。该法可以从大量散点数据中寻找到反映数据之间的统计规律,得到最大限度符合实验数据的拟合方程式,并判断拟合方程式的有效性,有利于计算机进行计算。
4.1.1 列表法
4.1.1.1 实验数据表
数据表操作简单明了,有利于阐明某些实验结果的规律。如果设计合理,可以同时表达几种变量,而且不易混淆。实验数据表中随时记录测量的数据,所以在实验之前,要根据实验目的和待测参数进行设计与绘制,在进行实验时就可以清晰、完整地将实验数据记录下来。在原始数据记录表中,应逐相列出实验所需要测量的所有参数名称及其单位,并注意采用与测量仪表相一致的有效位数,在对较大数量级的表达上,应尽量采用科学计数法。本节以测定流体流动阻力的实验原始数据记录表为例(测定光滑直管的摩擦阻力系数与阀门的阻力系数),如表4-1所示。在实验过程中,当完成完成一组实验数据的测试时,须及时将测量的相关数据记录在表格内,实验完成后将得到一份完整的原始数据记录表。
实验结束后,要对所记录的实验数据进行分析和计算处理。实验数据处理结果表用于记录进行运算处理的中间结果和最终结果,其可以避免在数据的计算处理过程中发生数据遗漏和混淆的现象。本节一套管传热实验的数据处理结果表为例,如表4-2所示。
4.1.1.2 实验数据表的注意事项
在拟定和绘制实验数据表时应注意如下几点:
(1)表格中内容要齐全。物理量的名称、符合和单位要列在数据表的表头中。物理量的符号与单位之间用斜线“/”隔开。在一个物理量的单位中,斜线“/”不可重复使用,可以根据情况使用“()”或者负指数的形式。计量单位不宜混在数字之中,以免难以区分。
(2)注意实验数据的有效数字位数。记录的数据应与测量仪表的准确度相吻合,不要过多或者过少。
(3)注意数据的记录方法。当物理量的数值较大或者较小时,应考虑使用科学计数法。采用“物理量的代表符合×10/单位”的形式将“10”记入表头,该形式的数据记录原则为: 物理量的实际值×10=表中数据
(4)为了便于整理和使用,每个数据表都应在表的上方标明表的序号和表的名称(表题)。表的序号±n ±n ±n
要根据出现的顺序进行编号。在出现表格之前,要在正文之中有所指引,不能出现的太突然,要有必要的过渡。同一张表尽量不要跨页显示,如遇特殊情况要跨页,需在所跨页面的表格上方注明“续表„„”。
(5)如在实验前没有拟定好数据记录表,在实验过程中直接记录实验数据作表,则注意数据的自变量尽可能取得等间距,并且为整数为宜。
(6)数据表格要正规,数据书写要清楚整齐,不能潦草应付,否则会难以辨认。修改错误时要用单线将错误划掉,将正确的写在下面。各种实验条件可以写在表题和表格之间,也可以写在表格之间,也可以写在表格的下方。实验合作者的名单可以写在表的下方。
4.1.2 图示(解)法
图示(解)法是表示实验中各变量之间关系最常用的方法,它是将实验中得到的离散的数据点标绘在适宜的坐标上,然后将数据点连成光滑的曲线或者直线。直观清晰,方便比较,容易看出数据中的极值点、周期性以及其他特性,准确的图形还可以在不知道数学表达式的情况下进行微积分运算,是图示(解)法的显著优点。
在化工原理实验中,经常遇到两个变量x,y 的情况,将自变量x 作为图形的横轴,将因变量y 作为纵轴,得到所需要的图形。所以,在绘制图形之前要完成的工作就是按照列表法的要求列出因变量y 与自变量x 相对于的y i 与x i 数据表格。
作图时值得注意的是:选择适合的坐标,使得图形直线化,以便求得经验方程式;坐标的分度要适当,能清楚表达变量间的函数关系。
作曲线图时必须依据一定的法则,得到与实验点位置偏差最小而光滑的曲线图形。
4.1.2.1 选择适宜的坐标系
(1)常用的坐标系:化工中经常使用的坐标系有迪卡儿坐标系(又称普通直角坐标系)、半对数坐标系和对数坐标系。市场上有相应的的坐标纸出售,也可以选择相关的数据处理软件来处理数据。应根据数据的特点来选择合适的坐标系。
对数坐标系的原点为(1,1),而不是(0,0);1,10,100,1000等数对应的常用对数数值分别为0,1,2,3,所以在对数坐标轴上,每一数量级的距离都是相等的;对数坐标轴上某点与原点的实际距离为该点对应数据的对数值,但是在该点标出的值是真数,在求取直线的斜率时,应该选用对数:
lgy2-lgy1tan α lgx2-lgx1
半对数坐标系:图形的两个坐标轴x 轴和y 轴中,一个轴是分度均匀的普通坐标轴,另一个轴是分度不均匀的对数坐标轴,如图4-1所示。
双对数坐标系:图形的两个坐标轴x 轴和y 轴均为不均匀的对数坐标轴,如图4-2所示。
(2)坐标系的选择:在数据处理过程中,如何选择适宜的坐标系,通常以实验测量数据在坐标系上绘制出的图形能否为直线来作为标准。
选择半对数坐标系的情况有:
1) 变量之一在研究范围内发生了几个数量级的变化时;
2) 在自变量从0开始逐渐增大的初始阶段,当自变量的些许变化就能引起因变量相当大的变化时;
3) 需要将某种非线性关系转化为线性关系时,如幂函数关系:y=abx , 因lgy 与x 呈现直线关系。 选择对数坐标系的情况有:
1) 自变量和因变量在研究范围内均发生了几个数量级的变化时;
2) 需要将曲线开始部分划分成展开的形式时;
3) 需要将某种非线性关系转化为线性关系时,如幂函数关系:y=axb , 因为lgy=lga+blgx在双对数坐标
系上表现为一条直线。
4.1.2.2 坐标分度
坐标分度是按每条坐标轴所能代表的物理量的大小来定的,也就是坐标轴的比例尺。坐标分度的选择,应该使得每一个数据点在坐标系上的位置能方便找到,以便在图上读出数据点的坐标值。
坐标分度的确定方法如下:
(1) 在已知x 和y 的测量误差分别为D x 和D y 时,分度的选择方法通常为:使得2D x 和2D y 构成的矩
形近似为正方形,并使得2D x =2Dy =2mm,求得坐标比例常数M 。
x 轴的比例常数为
21M x = = 2Dx Dx
y 轴的比例常数为
M y =21 = 2Dy Dy
(2)在测量数据的误差未知的情况下,坐标轴的分度要与实验数据的有效数字位数相同,并且要方便阅读。
在通常情况下,确定坐标轴的风度时,既要保证不会因为比例常数过大而降低实验数据的准确度,又要避免因比例常数过小而造成图中数据点分布异常的假象。所以,建议选取坐标轴的比例常数M=(1、2、
5)×10n (n 为整数),不使用3、6、7、8等的比例常数,因为在数据绘图时比较麻烦,容易导致错误。±
另外,如果根据数据x 和y 的绝对误差D x 和D y 求出的坐标比例常数M 不恰好等于M 的推荐值,可选用稍小的推荐值,将图适当地画大一些,以保证数据的准确度不因作图而降低。
4.1.2.3 绘图注意事项
(1)确保图中曲线光滑。利用曲线板等工具将各个离散的数据点连接成光滑曲线,并使曲线尽可能通过较多的实验点,或者使曲线以外的点尽可能地位于曲线附近,并使曲线两侧的点数大致相等。另外,用计算机软件处理数据更为准确和便捷。
(2)定量绘制的坐标图,其坐标轴上必须注明该坐标所代表的变量名称、符号及所用的单位。如离心泵特性曲线的横坐标就必须标上流量Q /(m 3/h )。
(3)图必须有图号和图题(图名),以便于整理和引用。必要时还应有图注。
(4)不同线上的数据点可用○、△等不同符号表示,且必须在图上明显地标出。
4.1.3 经验公式
在化工原理实验中,除了用表格和图形描述变量之间的关系外,还常把实验数据整理成方程式,以描述自变量和因变量之间的关系,即建立过程的数学模型。
4.1.3.1 经验公式的选择
化工是以实验研究为主的科学领域,很难由纯数学物理方法推导出确切的数学模型而是采用半理论分析方法、纯经验公式和由实验曲线的形状确定相应的实验公式。
(1)半理论分析方法:在化学工程中,利用因次分析法推导出准数关系式,是一种常用的方法。用因次分析法将众多的参数整理成一些无因次的数群,即准数,不需要首先导出过程的微分方程。但是,如果已经有了微分方程暂时还难以得出解析解,或者又不想用数值解时,也可以从中导出准数关系式,然后再由实验来最后确定其系数值。例如,动量传递、热量传递和质量传递过程的准数关系式分别为
L Eu=A() a Re b (4-5) d
Nu=BRec Pr d
Sh=CRee Sc f
式中的A 、a 、b 、B 、c 、d 、C 、e 、f 等常数均可以通过实验数据计算得出。
(2)纯经验方法:在处理实验数据时,长期从事专业工作的人员可以凭借积累的经验来确
定应采用什么样的数学模型。例如,
常用y=aebt 或者y=aebt+ct2表示化学反应;
常用多项式y=a+a1x+a2x 2+…+an x n 表示溶解热或热容与温度之间的关系; (4-6) (4-7)
在生物学实验中培养细菌时,假设原来的细菌数量为a ,繁殖率为b ,则用y=aebt表示每一
时刻的细菌总量y 和时间t 的关系。
(3)由实验曲线求取实验公式:在整理实验数据的过程中,在选择模型时既没有理论指导,
又没有经验可借鉴的情况下,可以先将实验数据绘制在普通的直角坐标系上,得到一条直线
或曲线。根据得到的曲线类型,可以分为下面两种情况:
1)直线的情况。根据解析几何的原理,在直线上选择相距较远的两点(x 1,y 1)和(x 2,y 2),
代入直线方程:y=mx+n,其中m 、n 的值可由直线的斜率和截距求得。该直线的斜率(△y/
△x )为方程中的系数m ,直线在y 轴上的截距(n )就是方程中的n 值。
2)曲线的情况。y 和x 不是线性关系,可将实验曲线与典型的函数曲线相对照,选择与
实验曲线相似的典型函数曲线,然后用直线化方法对所选函数与实验数据的符合程度加以检
验。
直线化方法就是将函数y=f(x)转化成线性函数Y=A+BX,其中X=φ(x,y ),Y=ψ(x,y)(φ, ψ
均为已知函数) 。由已知函数x i 和y i ,按照Y i =ψ(xi ,y i ),Xi=φ(x i ,y i )求得Y i 和X i ,然后将
(X i ,Y i )在坐标系上标绘,如果得到一条直线,即可选择系数A 和B ,并求得y=f(x)的函数
关系式。如果Y i =f'(Xi ) 偏离直线,则要重新选定Y i =ψ'(xi ,y i ),Xi=ψ'(xi ,y i ), 直至Y-X
为直线关系为止。
4.1.3.2 常见函数的典型图形及线性化方法
非线性函数线性化是将非线性函数转化成线性函数。通常是根据实验测定数据作出离散
点图,再选用合适的曲线拟合数据点,以确定函数的类型,然后用变量变换的方法定出函数
中的未知参数,通过上述步骤就可以将非线性函数转换成线性函数关系。
如果将实验数据采用直线回归进行拟合,则可以表达因变量与自变量之间的函数关系,
便于对实验结果进行规律性分析。
由实验测定数据拟合的经验回归曲线主要有线性函数、对数函数、指数函数、幂函数、
y=1x 、双曲线y=、S 型曲线以及多项式拟合等等。 a+bxa+bx
例如:指数函数y=aebx
两边取对数,得
lgy=lga+bxlge (4-8)
令Y=lgy,X=x,K=blge,
则得到的直线化方程为
Y=KX+lga (4-9)
表4-3列出了几种常见函数的典型图形及其线性化方法。
在前面提到的8种经验公式中,直线型和抛物线型是多项式回归的特例,其他多项式则
比较复杂,但多项式回归非常重要,因为各种函数关系中,至少有一个范围可以用多项式逼
近拟合。因次,在分析一些复杂的实际问题时,通常采用多项式进行描述。
在整理实验数据时,都可以从上述曲线类型中选择一种曲线进行拟合。如果要取得最佳
的拟合效果,最好选用几种函数进行计算,并加以对照比较,选择其中一条与实验数据的残
差平方和最小的曲线为拟合曲线。
4.1.4 图解法求解经验公式中的常数
求取各函数式中未知参数的方法,在化工原理实验中仍然采用最小二乘法。如果该函数
是非线性关系,则可以通过变换使之成为线性关系后求出。
4.1.4.1 对数函数y=algx+b的线性图解
当研究的变量符号对数函数y=algx+b时,将实验数据(xi,yi )标绘在对数坐标上,图形
为一条直线。
(1)系数a 的确定:在标绘得到的曲线上,取相距较远的1点和2点,读取(x i ,y i )和(x 2,y 2), 令横轴x 为对数坐标,根据表4-3中的线性化方法,其直线方程为Y=aX+b,按照下式计算直线的斜率a :
y2-y1 a= (4-10) lgx2-lgx1
(2)系数b 的确定:在对数坐标系中,坐标原点为(1,1)。在y=algx+b中,当x=1时,y=b,因此,系数b 的值可以由直线与过原点的y 轴交点的纵坐标来确定。如果x 和y 的值与1相差比较大,图中找不到坐标原点的时候,可将直线上任一个已知点1的坐标(x 1,y 1)和已经求出的斜率a 代入公式b=y1-algx 1中计算出b 。
4.1.4.2 指数函数y=aebx 的线性图解
当变量x 和y 符号指数函数y=aebx 时,将实验数据(x i ,y i )标绘在半对数坐标上,图形为一条直线。
(1)小说b 的确定:在直线上任取相距较远的两个点,根据两点的坐标(x 1,y 1)和(x 2,y 2)求解系数b 的值。令纵轴y 为对数坐标,根据表4-3中的线性化方法,得到该指数函数的线性化方程Y=lga+KX,所以系数b 为
lgy2-lgy1 (4-11) (x2-x1)lge
(2)系数a 的确定:系数a 的确定与对数函数的方法基本相同,可将直线上任一点处的坐标(x i ,y i )和
yi 已经求出的系数b 代入函数关系式a= 后求解得到系数a 。 e bx i
4.1.4.3 幂函数y=axb 的线性图解
当变量x 和y 符合幂函数y=axb 时,将实验数据(x i ,y i )标绘在对数坐标上,图形为一条直线。
(1)系数b 的确定:在直线上任取相距较远的两点,根据两点的坐标(x 1,y 1)和(x 2,y 2)求解系数b 的值。令纵轴和横轴均为对数坐标,根据表4-3中的线性化方法,得到幂函数的线性化方程Y=lga+bX,所以系数b 为
lgy2-lgy1 B= (4-11) lgx2-lgx1
(2)系数a 的确定:在对数坐标系中坐标原点为(1,1)。在y=axb 中,当x=1时,y=a。因此,系数a 的值可以由直线与过原点的y 轴交点的纵坐标来确定。如果x 和y 的值与1相差比较大,在图中找不到坐标
yi 原点,则可以将直线上任一已知点的坐标(x i ,y i )和已经求得的斜率b 代入函数式a= 中求得系数a 。 xi b
4.1.4.4 y=1 的线性图解 ax+b
1根据表4-3中的线性化方法,将y=转化成Y=Ax+b。 ax+b
(1)系数a 的确定:在曲线上任取相距较远的两点,根据两点的坐标(x 1,y 1)和(x 2,y 2), 采用下面的公式求得系数a 的值:
11 y2y1 a= x2-x1
1(2)系数b 的确定:可将曲线上任一点坐标(x i ,y i )和已经求得的系数a 代入 -ax i 中求得系数b 。 yi
4.1.4.5 y=1 的线性图解 ax+b
x 根据表4-3中的线性化方法,可以将y=转化成Y=bX+a。 ax+b
(1)系数b 的确定:在曲线上任取相距较远的两点,根据两点的坐标(x 1,y 1)和(x 2,y 2), 采用下面的公式求得系数a 的值:
11y2y1 b= 11 x2x1
1b (2)系数a 的确定:可将曲线上任一点坐标(x i ,y i )和已经求得的系数b 代入- 中求得系数a 。 yi xi
14.1.4.6 S 型曲线y= 的线性图解 ae -x +b
1根据表4-3中的线性化方法,可以将y= 转化成Y=aX+b。 ae -x +b
(1)系数a 的确定:在曲线上任取相距较远的两点,根据两点的坐标(x 1,y 1)和(x 2,y 2), 采用下面的公式求得系数a 的值:
11y2y1A= e -x2-e -x1
1(2)系数b 的确定:可将曲线上任一点坐标(x i ,y i )和已经求得的系数a 代入 -ae -xi 中求得系数b 。 yi
4.1.4.7 抛物线型函数y=ax2+bx+c的线性图解
抛物线型函数y=ax2+bx+c中的系数a 、b 、c 均可采用曲线直线化的方法求出。在抛物线曲线上任取一点(x 1,y 1),则有:
y 1=ax12+bx+c (4-16) 将式(4-16)与原抛物线函数方程相减,可得:
y-y 1=a(x2-x 12)+b(x-x1) (4-17) 经过简化处理后,可以得到:
y-y1 =ax+ax1+b (4-18) x-x1
y-y1令Y=,A=ax1+b,则抛物线的线性化方程为: x-x1
Y=ax+A
(1)系数a 的确定:在曲线上任取相距较远的两点,根据两点的坐标(x 2,y 2)和(x 3,y 3), 采用下面的公式求得系数a 的值:
y3-y1y2-y1 -x3-x1x2-x1a= (4-19) x3-x2
yi-y1(2)系数b 的确定:可将曲线上任一点坐标(x i ,y i )和已经求得的系数a 代入b=-ax i 中求得系数b 。 xi-x1
(3)系数c 的确定:可将曲线上的其他一点坐标(x i ,y i )和已经求得的系数a 、b 代入c=yi -ax i 2+bxi +c中求得系数c 。
4.1.5 实验数据的回归分析法
前面几节介绍了用图解法获得经验公式的方法,它有很多的优点,但应用范围有限,因为在化工原理
实验中,由于存在实验误差与某些不确定因素的干扰,得到的数据往往不能用一条光滑的曲线或者直线来表达,实验点是随机地分布在一条直线或者曲线的附近。要得到这些实验数据中所包含的规律性即变量之间的定量关系式,使之尽可能地符号实验数据,应用最广泛的一种数理统计方法就是回归分析法,其中最常见的方法为最小二乘法。
4.1.5.1 变量类型
在解决工程实际问题时,会经常遇到多几个变量共同处于一个过程之中,各种变量间相互联系、相互制约、相互依存的情况。这些变量之间的关系可以分为两类:
(1)函数关系:变量之间的关系可以用函数来表达,成为函数关系,属于确定性的关系。
(2)相关关系:变量之间也有一定的关系,但是这种关系并不完全确定,不能用函数关系来描述。与其中一个变量的每一个值对应的另一个变量的值不是一个或者几个确定值,而是一个集合值,此时,变量x 和y 之间的关系称为相关关系。这是由于在许多实际问题中,或者由于随机性因素的影响,使得变量之间的关系比较复杂,或者由于各个变量的测量值不可避免地存在测量误差,致使变量之间的关系具有不确定性。总之,变量之间的相关关系是普通存在的。
值得注意的是,函数关系和相关关系在概念上是截然不同的,但它们之间并没有严格的分界线。相关变量之间虽然没有确定关系,但是从统计的角度来讲,它们之间又存在着某种确定的函数关系。理论上存在一定函数关系的变量,在多次测试中由于误差的存在也含有不确定性了。因此,两种关系之间存在着相互转化。
4.1.5.2 回归分析法
(1)回归方程:回归分析是处理变量之间相互关系的一种数理统计方法。用这种数字方法可以从测试的大量散点数据中寻找到能反映事物内部的一些统计规律,并可以按照数字模型的形式表达出来,也把它称为回归方程或者回归模型。
(2)线性和非线性回归:回归也称为拟合。对具有相关关系的两个变量,如果用一条直线来描述,则称之为一元线性回归;如果用一条曲线来描述,则称之为一元非线性回归。对具有相关关系的三个变量,其中一个为因变量,两个为自变量,如果用平面描述。则称之为二元线性回归;如果用曲面描述,则称之为二元非线性回归。以此类推,可以延伸到n 维空间进行回归,则称之为多元线性回归。在处理实际问题时,通常将非线性问题转化为线性来处理。建立线性回归方程的最有效方法为最小二乘法。
(3)回归分析的内容:回归分析法所包括的内容(或者说可以解决的问题),概括起来有四个方面:
1)根据一组实验测量数据,按照最小二乘法原理建立起正规方程,求解正规方程得到变量之间的数学关系式,也就是回归方程式。
2)判断所得到的回归方程的有效性。回归方程式是通过数理统计方法得到的,是一种近似结果,必须对它的有效性进行定量检验。
3)根据一个或者几个变量的取值,预测或者控制另一个变量的取值,并确定其准确度(精度)。
4)进行因素分析。对于一个因变量受多个自变量或者因素影响的情况,可以分清各自变量的主次和分析各个自变量或者因素之间的相互关系。