train_test_split参数含义及用法_John Stones的博客-程序员宝宝

from sklearn.model_selection import train_test_split

在机器学习中,我们通常将原始数据按照比例分割为“测试集”和“训练集”,通常使用sklearn.cross_validation里的train_test_split模块用来分割数据。
cross_validation已经弃用,现在改为从 sklearn.model_selection 中调用train_test_split 函数。

简单用法如下:

X_train,X_test, y_train, y_test =sklearn.model_selection.train_test_split(train_data,train_target,test_size=0.4, random_state=0,stratify=y_train)
  1. train_data:所要划分的样本特征集
  2. train_target:所要划分的样本结果
  3. test_size:样本占比,如果是整数的话就是样本的数量
  4. random_state:是随机数的种子。
    随机数种子:其实就是该组随机数的编号,在需要重复试验的时候,保证得到一组一样的随机数。比如你每次都填1,其他参数一样的情况下你得到的随机数组是一样的。但填0或不填,每次都会不一样。
  5. stratify是为了保持split前类的分布。比如有100个数据,80个属于A类,20个属于B类。如果train_test_split(…test_size=0.25, stratify = y_all), 那么split之后数据如下:
    training: 75个数据,其中60个属于A类,15个属于B类。
    testing: 25个数据,其中20个属于A类,5个属于B类。
    用了stratify参数,training集和testing集的类的比例是 A:B= 4:1,等同于split前的比例(80:20)。通常在这种类分布不平衡的情况下会用到stratify。
    将stratify=X就是按照X中的比例分配
    将stratify=y就是按照y中的比例分配
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_43380984/article/details/102543019

智能推荐

PAT A 1070. Mooncake (25)_xyzchenzd的博客-程序员宝宝

题目Mooncake is a Chinese bakery product traditionally eaten during the Mid-Autumn Festival.  Many types of fillings and crusts can be found in traditional mooncakes according to the region's culture.

华清远见高级讲师蒙洋接受至顶网专访:Windows CE 6.0 R3让用户界面更炫_mistyeyed的博客-程序员宝宝

视频连接地址:http://soft.zdnet.com.cn/software_zone/2010/0408/1697725.shtmlWindows CE 6.0 R3版本在2009年的微软TechED大会上正式推出以来,广受嵌入式开发人员的关注。华清远见高级讲师蒙洋在接受ZDNet视频采访时表示,基于Windows CE 6.0 R3操作系统的嵌入产品的开发周期可以大为缩减,从应用程

跨域问题 以及jsonp方法举例_hpasdabc的博客-程序员宝宝_jsonp 跨域失败

--------------------------------------------------------------------------------------------------------------ajax的跨域的问题:<!-- 不允许跨域 跨域:不同域(不同源) 跨域是浏览器层面拒绝跨域 数据能获取 但不显示 只要不符合同源,就是跨域,资源没有明确表示允许,那么就是不允许,ajax失败 -->同源策略 ...

RxSwift之UI控件UITableView扩展的使用_╰つ栺尖篴夢ゞ的博客-程序员宝宝

一、单分区的表格如下所示,单个分区的表格展示:示例代码:import UIKitimport RxSwiftimport RxCocoa class ViewController: UIViewController { var tableView:UITableView! let disposeBag = DisposeBag() override func viewDidLoad() { super.viewDidLoad

Python之元组tuple对象的创建的十种方式_叫我王员外就行的博客-程序员宝宝_python定义一个tuple

第一种:使用(),创建空的元组对象temp = ()第二种:使用tuple类的构造器,创建空的元组对象temp = tuple()第三种:使用(),创建仅有一个元素的元组对象temp = ("hello",) #逗号不可省略第四种:省略(),创建仅有一个元素的元组对象temp = "hello", #尾部的逗号不可省略第五种:省略(),创建包含多个元素的元组对象temp = 1,2,"Hello World" #逗号隔开多个元...

JAXB处理xml与java对象互转(一)_xiaolenglala的博客-程序员宝宝

JDK中JAXB相关的重要Class和Interface:JAXBContext类,是应用的入口,用于管理XML/Java绑定信息。Marshaller接口,将Java对象序列化为XML数据。 Unmarshaller接口,将XML数据反序列化为Java对象。JDK中JAXB相关的重要Annotation:@XmlType,将Java类或枚举类型映射到XML模式类型(可以指定xml各...

随便推点

单代号网络图计算例题_工程人如何绘制进度计划?(双代号网络图、横道图等)..._weixin_39715907的博客-程序员宝宝

网络图:是由箭线和节点、线路组成的,用来表示工作流程的有向、有序的网状图形,每个工作都有两个节点,用圆圈表示,和一个有方向的箭线构成,箭线的长度代表工期的长短。横道图:又称甘特图(Gantt chart)、条状图(Bar chart)。其通过条状图来显示项目,进度,和其他时间相关的系统进展的内在关系随着时间进展的情况。以提出者亨利·劳伦斯·甘特(Henry Laurence Gantt)先生的名字...

CF809D Hitchhiking in the Baltic States_a6t2007的博客-程序员宝宝

题目描述:luogu题解:平衡树模拟dp?设$dp[i]$表示当前状态下长为$i$的合法子序列最后一位的最小值。容易发现$dp[i]<dp[i+1]$。然后就可以$dp$了。(当前可操作区间为$[l,r]$)1.$dp[i-1]<l$,有$dp[i]=min(dp[i],l)$。此时满足$dp[i-1]<l \le dp[i]$。...

ImageView的scaleType详解_潘永强_IT大厂老潘的博客-程序员宝宝

ImageView的ScaleType详1. 网上的误解不得不说很失望,到网上搜索了几篇帖子,然后看到的都是相互复制粘贴,就算不是粘贴的,有几篇还是只是拿着自己的几个简单例子,然后做测试,这种以一种现象结合自己的猜测便得出结论,其实只是想由不完全归纳得出完全归纳的结果,然而很令人失望,原因是: 数据取样过于片面,只是单纯的测试了一种情况,导致大家对这些帖子相当失望。2. scaleTy

spring整合mysql要什么jar_配置spring所需要的jar包_管住你的嘴的博客-程序员宝宝

spring.jar是包含有完整发布的单个jar 包,spring.jar中包含除了spring-mock.jar里所包含的内容外其它所有jar包的内容,因为只有在开发环境下才会用到 spring-mock.jar来进行辅助测试,正式应用系统中是用不得这些类的。除了spring.jar文件,Spring还包括有其它13个独立的jar包,各自包含着对应的Spring组件,用户可以根据自己的需要来选择...

第一次学习Linux_fype123的博客-程序员宝宝

由于我打算对计算机方面进行学习,并希望在方面能有所收获,现在正式进行了Linux的学习。这是我第一次学习关于操作系统的知识,虽说我经过了一天的学习感觉自己对于这方面略知一二,但还是觉得自己能力实在有限,今后还是需要努力学习,提高自己的水平。这次学习的时候说真天实在热,但为了今后能有水准,还是想方设法来使自己定下心来学习Linux。在学习中,我知道了linux是广泛应用的计算机操作系统,...

翻转image_huangmindong的博客-程序员宝宝_node 旋转图片

-(UIImage *)rotateImage:(UIImage *)aImage{    CGImageRef imgRef = aImage.CGImage;    CGFloat width = CGImageGetWidth(imgRef);    CGFloat height = CGImageGetHeight(imgRef);    CGAffineTransform t

推荐文章

热门文章

相关标签