机器学习过程中涉及到很多的学科和门类,在我看来,它更像是各个不同学科的集合体。因此我们想要学好机器学习,你需要一个具备很多问题方面的知识,不过也并不是所有人会用到机器学习的每个细节,因此可以根据自己的专长有针对性的学习。
无论是什么样的机器可学习模型、分类、算法都是依托于原始信息数据的,原始数据的分析和处理是前提也是很重要的部分。
通常我身边的工程师在进行相关设计的时候有一个惯性的思维,先采集一大堆的数据然后用工具分析特征和生成模型,之后通过大量的数据采集来实现模型的修正和完善,这种方式应该也是很多设计人员通常的思路。而且一般的情况下要求硬件采集设备尽可能的提供多种参数,这样可以丰富算法模型的输入参数,理论上可以更好地接近实际的结果,在纯技术的角度上这个是可行的,而且随着样本量的增加,采用机器学习的思路,最终的模型和算法会越来越精确。
这样的设计方法如果有一个理想的样本或可以很容易地获得样本数据,是非常有效的。但是如果现有的样本不是很理想,存在大量的干扰成分,样本数据受人为因素影响或必须人工采集才能获得数据,传统方法没有太大的优势..这个时候我们需要对数据信息进行预处理和必要的分析,需要通过确定几个方面问题:
一、首先,要事先确定几个要研究的参数,参数的选择需要有一定的依据和相关性,以红外信号输出信号分析为例,我们可以从开放的数据中知道红外传感器会受到温度和光谱范围的影响,从而导致输出曲线的变化,那么温度和光谱范围就是要研究的参数。
二、确定了参数之后,先不要对所有参数进行样本数据采样,而是针对单一参数进行数据采样,彻底明确单一参数对于最终结果的影响程度,也就是权重,用函数关系表示即:Y = F(X), Y为结果,X为样本数据参数,数据处理过程包括平滑、筛选、剔除、插入等基本操作,也就是预处理过程,之后可以生成基本的函数关系或对照表,为后续的大模型的建立提供数据支持。
三、在这之后的每个参数的影响程度量化,我们得到了所有的参数和功能的对应关系表,使用算法模型现有的这些结果,并建立一个框架,就在每个加权良好的设计数据模型,最终形成了初步的机器学习模型。
四、实现以上三个步骤,我们终于可以实现通过收集大量的数据样本,以提高整个机器学习模型,最终目标之前设置。
以上这种方法对于单个输出结果的模型建立比较有优势,对于多中输出结果的模型建立还不太适合,需要有更方便和有效的方案来解决。
更多产品了解
欢迎扫码加入云巴巴企业数字化交流服务群
产品交流、问题咨询、专业测评
都在这里!
2022-11-25 14:31:33
2022-11-21 17:33:04
2024-03-27 13:59:54
2022-11-23 16:33:09
2022-11-24 10:16:09
2022-11-24 13:51:35
甄选10000+数字化产品 为您免费使用
申请试用
评论列表