第72章 让我先把数据存了(1 / 2)
不过,无论孙玉月给他准备了什么样的惊喜,化合物的光学反应总不会骗人,司徒捷报写好的算法也不会骗人,那只有可能是那两个样品配错了。
是不是……配溶液的时候出了些什么问题?
毕竟如果点板出现问题,也只会有单独的几个离群值,不会让整个数据集都偏离。
程岳搓搓头皮,思索着,毕竟其他十个未知氨基酸已经顺利的检测出来了,没有必要再重做一遍。
实在不行的话,要不然发论文的时候,就把这两个未知氨基酸拿掉吧……不过,这绝对不是他的性格。
又或者,换一种化学计量法。
改用lda(lineardiscriminateanalysis,线性判别法?
程岳现在用的主成分分析法,计算的时候先只导入所有的数据,采用矩阵变换的方式,给每个采集参数设定比重,让数据与数据之间的点尽可能的分离,完成分离之后再引入每个数据的名称,名称相同的数据成为一个数据集。
而线性判别法,则是在开始导入数据的时候,一并导入了每个数据的名称,数据集已经形成,而这时候的矩阵变换,设定每个参数的比重,就要考虑到两个方向了,除了让数据集与数据集之间的距离尽可能大之外,还会让数据集之内每个数据点之间的距离尽可能缩小,所以线性判别法往往会给出比主成分分析法看起来更好看的数据——
数据集小,分离度高。
而程岳之所以从一开始选择了主成分分析法,是因为这个方法还能勉强手算,而线性判别法则只能靠计算机软件来计算,当时条件不允许。
虽然如果是检测未知物,原理上来说未知氨基酸和对应的已知氨基酸,应该完全相同的,更应该使用主成分分析法。
因为,主成分分析法先分离,再圈出数据集,这样的话完全一样的数据就会重叠在一起。
而,线性判别法先圈出数据集,再试图分离这些数据集,所以反而会有可能为了分离完全相同的两个数据集,采用一些原本占比不那么重的采集参数,给他们更大的比重,强行使数据集分离,而失去了原本的化学和统计意义。
不过,既然目前没什么更好的方向了,不如试一试线性判别法吧。
实在不行,再考虑去掉两个奇怪的未知氨基酸,十个未知物已经足够发论文了。
程岳想着想着,又重新燃起了斗志。
实验就是这样的嘛,什么都有可能,做几年也不出结果的实验比比皆是,自己已经算很顺利了。
突然,他感受到脖子一阵凉意,忍不住瑟缩了一下,回头看才发现是一脸开心的司徒捷报。
“岳哥!”
司徒捷报吸吸冻得通红的鼻子,轻轻跺跺脚,鞋套发出刺啦刺啦的声音,他咧嘴说道,“外面雪停了!”
因为计算机房没几个人,程岳也没顾忌放低音量,他看着司徒捷报兴奋地样子,也不由得被带动得有些开心,问道:“玩的好吗?”
司徒捷报猛点头:“嗯嗯嗯,而且我发现下去玩的有好多都是老乡,我还认识了好几个老乡。”
“哈哈哈!”
这点程岳倒是没想到,不过想想也是,这么冷的天,这么小的雪,还能欢天喜地出来玩的人,估计也就那么几个省的学生了吧。
“捷报,最近咋样?”
程岳看司徒捷报一直在吸鼻涕,从兜里掏了一小叠纸出来。
他原本只是随口问问,司徒捷报却突然一下更兴奋起来了:“岳哥,你不知道,我不是在跟吕教授做项目嘛,吕教授说等现在做的那个软件卖出去了之后,给我分红!”
“真好呀!”程岳也很替他开心。