九九读小说网

手机浏览器扫描二维码访问

本站弹窗广告每日仅弹出一次
尽可能不去影响用户体验
为了生存请广大读者理解

机器学习是“让机器从数据中长本事”的技术(第3页)

巧妇难为无米之炊,数据就是机器学习的“米”。

- 数据收集:比如要做推荐系统,得收集用户的浏览记录、点击行为;要做疾病预测,得收集病人的病历、检查报告。

- 数据预处理:这步特别关键,就像淘米要去沙。包括:

- 处理缺失值:比如某个人的年龄没填,得想办法补上或删掉。

- 处理异常值:比如收入里突然出现一个“1亿”,明显不合理,得处理掉。

- 特征缩放:比如身高是“170cm”,体重是“60kg”,单位和数值范围不一样,得统一缩放(比如都缩到0-1之间),不然模型会“偏心”。

2. 特征工程:给数据“化妆”,让模型看得更清楚

“特征”就是数据里的关键信息。比如判断西瓜好坏,“色泽、根蒂、敲声”就是特征。特征工程是从原始数据里提炼出有用特征的过程,直接影响模型效果。

- 有时候要人工设计特征:比如把“日期”拆成“星期几”“是否节假日”。

- 有时候用算法自动提取特征:比如深度学习里的CNN,能自动从图像里提取“边缘、形状”这些特征,不用人类操心。

3. 模型训练:让机器“刷题涨本事”

选好算法(比如决策树、神经网络),把处理好的数据喂给它,机器就开始“学习”了。它会不断调整内部参数,让预测结果和真实情况越来越接近。

- 训练过程中,得注意过拟合和欠拟合:

- 欠拟合:模型太“笨”,连训练数据都没学好,比如把所有邮件都当成正常邮件。

- 过拟合:模型太“教条”,把训练数据里的噪声也学进去了,比如只认识训练过的那几张人脸,换张角度就不认识了。

解决方法也不少,比如“正则化”(给模型加约束,不让它学太细)、“增加数据量”“模型简化”等。

4. 模型评估:给机器“考试”打分

训练好的模型得测试一下准不准。常用的指标有:

- 准确率(Accuracy):预测对的比例,比如100个邮件,90个判对了,准确率就是90%。但它在“数据不平衡”时不准,比如垃圾邮件只有5%,模型全判正常,准确率也有95%,但没用。

热门小说推荐
路人甲与炮灰

路人甲与炮灰

脑洞文,没有极致拉扯和无故虐待,替身文化也没有。有cp女主男主双洁,无系统之类金手指。九九无意融合爱看书的残魂执念,给自己贴上路人甲的标签。第一位人生导师告诉她,时间对修士更重要。九九开始踏上追求长生之路,一路上不小心混进主角团。......

我也很害怕

我也很害怕

你的身上会长蘑菇吗嘿嘿~你会把身上的蘑菇拔掉吃掉吗?你要是成为了医生,把自己治死了咋办?游乐园还在建设,作为其中建造的一员,你想把它建造成什么样子?作为公主,如何成为一位女王?……宋晚棠在极度饥饿的情况下,她把自己身上的蘑菇拔来吃掉了;她一点也不懂医术,所以在成为医生后中毒了,选择抱大佬大腿;她对游乐场建造不感兴趣......

宇宙星塔

宇宙星塔

宇宙星塔情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的玄幻魔法小说,宇宙星塔-木渡头-小说旗免费提供宇宙星塔最新清爽干净的文字章节在线阅读和TXT下载。...

万维守护

万维守护

万维守护情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的都市言情小说,万维守护-青羊妖道-小说旗免费提供万维守护最新清爽干净的文字章节在线阅读和TXT下载。...

官婿美人图陈志远

官婿美人图陈志远

安江以选调生第一名上岸,怀揣为民之念,投身官场,却被无形大手拨至乡镇,赘婿身份受尽白眼,两年之期已满,组织部一纸调令,峰回路转,安江华丽蜕变全县最年轻正科级干部……且看安江如何一路横空直撞,闯出一条桃运青云路,手掌绝对权力!...

夜灯

夜灯

身为画师,沈恪被说没有自己的风格,最大的价值是会临摹大师们的作品。 身为写手,林声迟迟没能有自己的作品,为了谋生不得已写着并不属于自己的故事。 身为创作者,沈恪跟林声都身处困境,苦苦挣扎。 命运牵引,两个人相遇,但他们都隐瞒了自己的真实身份,短暂地扮演了自己想成为的角色。 他们只想感受当下,感恩当下,至少有一个人还能让自己暂时躲进一个美丽的梦里。 但梦终究是梦,当梦醒来,还是要去面对最真实的人生。...