这次作业是关于机器学习的,我研究了各种类型的机器学习模型及其应用!
线性回归模型
我学习了线性回归,这是一种用于预测连续变量的简单模型。 例如,我们可以用线性回归模型预测房价:房价(因变量)与房屋面积、房屋位置、房屋年代等因素(自变量)之间存在线性关系。 通过获取房屋的历史交易数据,我们可以训练一个线性回归模型来预测给定特征的房屋价格!
逻辑回归模型
逻辑回归模型则用于预测离散变量,例如判断客户是否会进行购买行为(结果为“是”或“否”)。如果我们掌握了一个电商的***,这些数据可能包含年龄、收入、浏览记录等特征。我们可以建立一个模型,输入客户特征后,模型便判断此客户购买某商品的概率。逻辑回归模型输出的是概率值(会将输入数值转化为0~1之间的概率)!
支持向量机(SVM)
我还研究了支持向量机(SVM). 它被用来进行分类和回归任务。例如,一个医疗诊断中需要判断扫描图是否有肿瘤. 输入一些相关的特征,比如图像某些区域灰度值等可疑变量给支持向量机模型,它最后会输出是否肿瘤。 与线性回归和 逻辑回归的主要差异在与 支持向量机的目标函数是最大化类的可分离间隔,比上述单调线性依赖更有优势与价值. 这对于处理更多重特征更杂乱的信息更为稳健.
决策树和随机森林
另外,我学习了决策树模型及其更高级的树群学习方式(随机森林)。你可以把决策树想象成一个***: 通过不断问问题来进行决策(假设是一个要选择出行路线).例如决策时需要确定前往哪个景点:输入考虑的变量会包括天气状况 (晴/雨)距离(远/近),交通模式(机动车/公交车/步行...),决策树会将上述各个变量的特定结果进行关联进而得出一个理想选项.随机森林是在数据随机采样下, 生成出一群有各自决策途径的***标示出来组成。随机森林是多种基于单个特征进行评估得出综合结果进行预测的多重集合。它更稳定可靠,并且比单棵决策树具有更高的准确率 !
神经网络
我最后学习的神经网络比其他模型都更高级,它尝试模仿人大脑的工作方式。 神经网络适合处理含有高维关联性的任务,例如图像识别或者语音理解。举个例子,给神经网络大量手写字体图像以及每张文字各自对应的图像标签文字名.模型即可学习数字/字母手写真迹特征与标签文字之间的对应映射,进而学习到“识字/区分数字或字母”的能力。 现在神经網絡的应用越来越多也越来越深入,所以学习它也至关重要!
总而言之,这次作业让我对各种机器学习模型有了更深入的了解同时也熟悉了模型建立以及一些基本操作!