推进网站建设工作计划深圳网站制作hi0755

张小明 2026/1/15 22:43:07
推进网站建设工作计划,深圳网站制作hi0755,东莞企业推广网站制作,wordpress改后台登录路径一、参数选择在逻辑回归建模中#xff0c;“过拟合”是绕不开的坑——当模型在训练数据上表现完美#xff0c;却在新数据上一塌糊涂时#xff0c;大概率是模型复杂度超出了数据所能支撑的范围。而惩罚因子#xff08;也叫正则化参数#xff09;#xff0c;正是我们解决过…一、参数选择在逻辑回归建模中“过拟合”是绕不开的坑——当模型在训练数据上表现完美却在新数据上一塌糊涂时大概率是模型复杂度超出了数据所能支撑的范围。而惩罚因子也叫正则化参数正是我们解决过拟合、平衡模型拟合度与泛化能力的核心工具。1.通过LogisticRegression(Ci,penaltyl2,solverlbfgs,max_iter1000)函数C参数的选择最优惩罚因子。通过K折交叉验证cross_val_score(lr,x_train_w,y_train_w,cv8,scoringrecall)函数来实现。scores[] #不同参数下的验证集评分 c_range[0.01,0.1,1,10,100] for i in c_range: lrLogisticRegression(Ci,penaltyl2,solverlbfgs,max_iter1000) scorecross_val_score(lr,x_train_w,y_train_w,cv8,scoringrecall) score_msum(score)/len(score) scores.append(score_m) print(score_m) best_cc_range[np.argmax(scores)] print(最优惩罚因子,best_c) lrLogisticRegression(Cbest_c,penaltyl2,solverlbfgs,max_iter1000) lr.fit(x_train_w,y_train_w) from sklearn import metrics train_predictlr.predict(x_train_w) print(metrics.classification_report(y_train_w,train_predict))#获得混淆矩阵的准确值召回值。 cm_plot(y_train_w,train_predict).show() test_predictlr.predict(x_test_w) print(metrics.classification_report(y_test_w,test_predict,digits6))#获得混淆矩阵的准确值召回值。 cm_plot(y_test_w,test_predict).show()二、下采样下采样的核心是“削减多数类样本”将不同类别的数量平衡一下减少多的类别的数量在案例中使用代码x_train_wtrain_data[train_data[Class]1]y_train_wtrain_data[train_data[Class]0]y_train_wy_train_w.sample(len(x_train_w))使用sample函数从y_train_w中抽取x_train_w的数量。datapd.read_csv(creditcard.csv) scalerStandardScaler() data[Amount]scaler.fit_transform(data[[Amount]]) datadata.drop([Time],axis1)#axis1表示删除列 xdata.drop(Class,axis1) ydata.Class x_train,x_test,y_train,y_testtrain_test_split(x,y,test_size0.2,random_state0) train_datax_train train_data[Class]y_train x_train_wtrain_data[train_data[Class]1] y_train_wtrain_data[train_data[Class]0] y_train_wy_train_w.sample(len(x_train_w)) data_cpd.concat([x_train_w,y_train_w]) x_train_w_1data_c.drop(Class,axis1) y_train_w_1data_c.Class scores[] c_range[0.01,0.1,1,10,100] for i in c_range: lrLogisticRegression(Ci,penaltyl2,solverlbfgs,max_iter1000) scorecross_val_score(lr,x_train_w_1,y_train_w_1,cv10,scoringrecall) score_msum(score)/len(score) scores.append(score_m) print(score_m) best_cc_range[np.argmax(scores)] print(最优因子,best_c) lrLogisticRegression(Cbest_c,penaltyl2,solverlbfgs,max_iter1000) lr.fit(x_train_w_1,y_train_w_1)三、过采样上采样的核心是“扩充少数类样本”我们可以使用SMOTE合成少数类过采样技术——在少数类样本的特征空间中找到每个样本的k个近邻通过插值生成新的少数类样本如样本A和样本B的近邻新样本Arand(0,1)*(B-A)from imblearn.over_sampling import SMOTE oversamplerSMOTE(random_state100)#保证数据拟合效果随机种子 os_x_train,os_y_trainoversampler.fit_resample(x_train,y_train)#人工拟合数据
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

深圳做三网合一网站外链购买

OneBlog开源博客系统完整部署与实战指南 【免费下载链接】OneBlog :alien: OneBlog,一个简洁美观、功能强大并且自适应的Java博客 项目地址: https://gitcode.com/gh_mirrors/on/OneBlog 在当今数字化时代,拥有一个专业美观的个人博客已成为技术…

张小明 2026/1/14 15:39:05 网站建设

淘宝店铺如何和别的网站做链接谷歌ads

Ring-flash-2.0作为一款高性能思维模型,基于Ling-flash-2.0-base深度优化而来,凭借独创的icepop算法解决了MoE模型在强化学习训练中的不稳定性问题,在数学竞赛、代码生成等复杂任务上实现性能突破,仅需激活6.1B参数即可媲美40B规模…

张小明 2025/12/27 3:10:12 网站建设

洛阳网站建设官网开发新客户的十大渠道

第一章:Open-AutoGLM到底能做什么?——全景透视其核心能力Open-AutoGLM 是一个面向自动化自然语言处理任务的开源框架,深度融合了大语言模型(LLM)与任务编排引擎,能够在无需人工干预的情况下完成复杂文本理…

张小明 2025/12/27 3:10:10 网站建设

赣州专业企业网站建设动态电子商务网站 制作

钢铁行业数字化转型的必然选择在传统钢铁贸易格局中,信息不对称、交易链条冗长、履约风险高企、融资渠道单一等问题长期制约着行业健康发展。随着产业互联网时代的到来,打造一个高效、安全、透明的大宗钢铁产业交易系统已成为推动产业升级的迫切需求。千…

张小明 2025/12/27 3:10:09 网站建设

深圳开发软件公司站长工具seo综合查询全面解析

在数字化商业环境中,精准的全球数据管理已成为企业核心竞争力的关键要素。ISO-3166-Countries-with-Regional-Codes项目提供了一个权威的全球数据标准化库,将ISO国家编码与国际地理区域代码完美整合,为企业级应用提供开箱即用的解决方案。 【…

张小明 2026/1/5 22:03:43 网站建设

网站搜索引擎优化的基本内容网站建设后端

领域驱动设计实战宝典:中文PDF资源深度解析 【免费下载链接】实现领域驱动设计中文PDF下载分享 实现领域驱动设计中文PDF下载 项目地址: https://gitcode.com/Open-source-documentation-tutorial/ee896 还在为理解复杂的领域驱动设计概念而头疼吗&#xff1…

张小明 2026/1/10 10:21:52 网站建设