气相-离子迁移谱技术(GC-IMS)可以快速、可靠、经济地分析挥发性混合物的化学成分。这种传感技术已成功应用于食品科学,以确定食品的来源、新鲜度和防止食品欺诈。然而,GC-IMS数据是高维、复杂的,并且存在强非线性、基线问题、错位、峰重叠、长峰尾等问题,所有这些都必须进行校正,以便从样本中正确提取相关特征。
在这项工作中,提出了一种用于信号预处理的方法,以及四种不同的GC-IMS数据特征提取方法。更准确地说,这些方法包括从以下方面提取数据特征:(1)反应物离子色谱峰(RIC)的总面积;(2)完整的RIC响应;(3)展开样本矩阵;(4)离子峰体积。根据两种不同质量等级的伊比利亚火腿样品的饲喂方式,将数据处理的结果应用于一个数据集。通过比较从偏最小二乘判别分析(PLS-DA)得出的分类结果和样本的投影变量重要性(VIP)得分,测试了从样本中推断化学信息的能力。
特征提取策略的选择是在保留的化学信息量和生成数据模型所需的计算工作量之间进行权衡。
FreireR, Fernandez L, Mallafré-Muro C, Martín-Gómez A, Madrid-Gambin F, Oliveira L,Pardo A, Arce L, Marco S. 食品组学气相色谱-离子迁移光谱分析的完整工作流程:在伊比利亚火腿香气分析中的应用。Sensors. 2021; 21(18): 6156. https://doi.org/10.3390/s21186156