九九读小说网

手机浏览器扫描二维码访问

机器学习是“让机器从数据中长本事”的技术(第3页)

巧妇难为无米之炊,数据就是机器学习的“米”。

- 数据收集:比如要做推荐系统,得收集用户的浏览记录、点击行为;要做疾病预测,得收集病人的病历、检查报告。

- 数据预处理:这步特别关键,就像淘米要去沙。包括:

- 处理缺失值:比如某个人的年龄没填,得想办法补上或删掉。

- 处理异常值:比如收入里突然出现一个“1亿”,明显不合理,得处理掉。

- 特征缩放:比如身高是“170cm”,体重是“60kg”,单位和数值范围不一样,得统一缩放(比如都缩到0-1之间),不然模型会“偏心”。

2. 特征工程:给数据“化妆”,让模型看得更清楚

“特征”就是数据里的关键信息。比如判断西瓜好坏,“色泽、根蒂、敲声”就是特征。特征工程是从原始数据里提炼出有用特征的过程,直接影响模型效果。

- 有时候要人工设计特征:比如把“日期”拆成“星期几”“是否节假日”。

- 有时候用算法自动提取特征:比如深度学习里的CNN,能自动从图像里提取“边缘、形状”这些特征,不用人类操心。

3. 模型训练:让机器“刷题涨本事”

选好算法(比如决策树、神经网络),把处理好的数据喂给它,机器就开始“学习”了。它会不断调整内部参数,让预测结果和真实情况越来越接近。

- 训练过程中,得注意过拟合和欠拟合:

- 欠拟合:模型太“笨”,连训练数据都没学好,比如把所有邮件都当成正常邮件。

- 过拟合:模型太“教条”,把训练数据里的噪声也学进去了,比如只认识训练过的那几张人脸,换张角度就不认识了。

解决方法也不少,比如“正则化”(给模型加约束,不让它学太细)、“增加数据量”“模型简化”等。

4. 模型评估:给机器“考试”打分

训练好的模型得测试一下准不准。常用的指标有:

- 准确率(Accuracy):预测对的比例,比如100个邮件,90个判对了,准确率就是90%。但它在“数据不平衡”时不准,比如垃圾邮件只有5%,模型全判正常,准确率也有95%,但没用。

热门小说推荐
谁许我如梦浮生

谁许我如梦浮生

《谁许我如梦浮生》谁许我如梦浮生目录全文阅读,主角是顾家臣任啸徐小说章节完整质量高,包含结局、番外。?────────────────────────-《谁许我如梦浮生》作者:一起喝杯茶文案生在封建守旧家庭的顾家臣,却偏偏爱上了一个男人。一个身份高高在上到遥不可及,个xg温柔冷静到销魂蚀骨,外貌英俊潇洒到让他意乱情迷的男人。更可贵的是,这个男人也像他爱他一样的,深深爱着顾家臣。...

创世玄箓

创世玄箓

闷烧你是否也经历过失败的人生?是否想过利用AI创造属于自己的世界?是不是也幻想过经过拼搏和努力,闯荡异世界?有没有幻想凭着自己的意志改变世界、创造属于自己的世界?你是否曾经想过穿越时空隧道,闯荡宇宙?让我们一起随着张应泽的故事,一同探索……......

斥候之王

斥候之王

++++++++黑豹突击队的杨子伦穿越到大晋王朝。这是一个有趣的修行世界。他成为了军中一名斥候。请问修行者是什么?元气和法器又是什么?卧底卧成了高层,到底收不收网?美女如此多娇,原来土鳖竟是我?饮马瀚海,横扫千军,生死之间有大恐怖。他执着寻找回华夏的路,谁知玄奥的结界后面,竟是............

不一样的中医

不一样的中医

不一样的中医情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的都市言情小说,不一样的中医-秋雨凝华-小说旗免费提供不一样的中医最新清爽干净的文字章节在线阅读和TXT下载。...

一念之私

一念之私

贪婪不是我的错,我只是生来如此 我霸占着属于纪晨风的一切,地位、家世、亲人……明知自己是个冒牌货,仍旧鸠占鹊巢,毫无愧疚。 我的骨子里天生流淌着自私的基因,贪婪无度,卑鄙无耻,什么都想要,什么都要有,并且……不打算改变。 *** 一念善,一念恶;一念贪,一念错。 当混蛋拥有了爱人的能力,或许就是老天对他混蛋的最大惩罚。 *** 纪晨风x桑念,穷人家的贵公子x富人家的混蛋...

重生系统启动中

重生系统启动中

附:【本作品来自互联网,本人不做任何负责】内容版权归作者所有!=================书名:重生系统启动中作者:远游的鱼文案一场突如其来的车祸,让何若辛变成了没有身体的鬼魂。随即一个重生系统就砸到了他的头上。系统:“想有一具身体吗?”何若辛:“想……”系统:“那就接受本系统的调!教!吧!完成任务,斩妖除魔,打败穿越女,赶走重生男……”...