拓端tecdat|R语言贝叶斯线性回归和多元线性回归构建工资预测模型 标签: R语言 贝叶斯 线性回归 工资模型 在劳动经济学领域,收入和工资的研究为从性别歧视到高等教育等问题提供了见解。在本文中,我们将分析横断面工资数据,以期在实践中使用贝叶斯方法,如BIC和贝叶斯模型来构建工资的预测模型。...
拓端tecdat|使用R语言进行多项式回归、非线性回归模型曲线拟合 标签: R语言 多项式回归 非线性回归 原文链接:http://tecdat.cn/?p=22531 对于线性关系,我们可以进行简单的线性回归。对于其他关系,我们可以尝试拟合一条曲线。 曲线拟合是构建一条曲线或数学函数的过程,它对一系列数据点具有最佳的拟合效果。...
拓端tecdat|R语言生存分析: 时变竞争风险模型分析淋巴瘤患者 标签: R语言 生存分析 时变 原文链接:http://tecdat.cn/?p=22422 在本文中,我们描述了灵活的竞争风险回归模型。回归模型被指定为转移概率,也就是竞争性风险设置中的累积发生率。该模型包含Fine和Gray(1999)的模型作为一个特例。这可以...
拓端tecdat|R语言用ARIMA模型,ARIMAX模型预测冰淇淋消费时间序列数据 标签: R语言 ARIMA模型 ARIMAX 原文链接:http://tecdat.cn/?p=22511 标准的ARIMA(移动平均自回归模型)模型允许只根据预测变量的过去值进行预测。该模型假定一个变量的未来的值线性地取决于其过去的值,以及过去(随机)影响的值。...
拓端tecdat:Python | ARIMA时间序列模型预测航空公司的乘客数量 标签: Python ARIMA 时间序列 时间序列被定义为一系列按时间顺序索引的数据点。时间顺序可以是每天,每月或每年。 以下是一个时间序列示例,该示例说明了从1949年到1960年每月航空公司的乘客数量。 ...时间序列预测是使用统计模型根据过去的...
拓端tecdat|R语言建立和可视化混合效应模型mixed effect model 标签: R语言 可视化 混合效应模型 原文链接:http://tecdat.cn/?p=20631 我们已经学习了如何处理混合效应模型。本文的重点是如何建立和可视化混合效应模型的结果。 设置 本文使用数据集,用于探索草食动物种群对珊瑚覆盖的影响。 knitr::opts_...
拓端tecdat|R语言用Copulas模型的尾部相依性分析损失赔偿费用 标签: R语言 Copula 尾部相依性 两个随机变量之间的相依性问题备受关注,相依性(dependence)是反映两个随机变量之间关联程度的一个概念。它与相关性(correlation)有区别,常用的相关性度量是Pearson相关系数,它只度量了两个随机变量之间的线性关系,...
拓端tecdat|R语言基于线性回归的资本资产定价模型(CAPM) 标签: R语言 线性回归 资本资产定价模型 原文链接:http://tecdat.cn/?p=20031 简介 资本资产定价模型(CAPM)是用于确定是否在一个特定资产的投资是值得的。本质上,问题是:“该资产的回报是否值得投资?” 在本教程中,我们将应用CAPM模型,使用多元...
拓端tecdat|R语言多重比较示例:Bonferroni校正法和Benjamini & Hochberg法 标签: R语言 多重比较 Bonferroni校正 原文链接:http://tecdat.cn/?p=21825 假设检验的基本原理是小概率原理,即我们认为小概率事件在一次试验中实际上不可能发生。 多重比较的问题 当同一研究问题下进行多次假设检验时,不再符合小概率原理所说的...
拓端tecdat|R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析 标签: R语言 随机森林 RandomForest 原文链接:http://tecdat.cn/?p=22596 研究大纲 介绍数据集和研究的目标 探索数据集 可视化 使用Chi-Square独立检验、Cramer's V检验和GoodmanKruskal tau值对数据集进行探索 预测模型,Logisitic回归和...
拓端tecdat|R语言用Garch模型和回归模型对股票价格分析 标签: R语言 Garch模型 回归 为了找出影响石油价格波动的主要因素,我们使用逐步回归法来剔除一些对于应变量即价格影响很小的自变量剔除出我们的模型我们分别把WTI Price Field Production of Crude Oil (Thousand Barrels) 等自变量的名称改为...
拓端tecdat|R语言混合效应逻辑回归(mixed effects logistic)模型分析肺癌数据 标签: R语言 混合效应 逻辑回归 原文链接:http://tecdat.cn/?p=22302 混合效应逻辑回归用于建立二元结果变量的模型,其中,当数据被分组或同时存在固定和随机效应时,结果的对数几率被建模为预测变量的线性组合。 混合效应逻辑回归的例子 ...
拓端tecdat|Matlab中的偏最小二乘法(PLS)回归模型,离群点检测和变量选择 标签: Matlab 偏最小二乘法 PLS 原文链接:http://tecdat.cn/?p=22319 本文建立偏最小二乘法(PLS)回归(PLSR)模型,以及预测性能评估。为了建立一个可靠的模型,我们还实现了一些常用的离群点检测和变量选择方法,可以去除潜在的离群点和只...
拓端tecdat|matlab使用分位数随机森林(QRF)回归树检测异常值 标签: matlab 分位数 随机森林 原文链接:http://tecdat.cn/?p=22160 这个例子展示了如何使用分位数随机林来检测异常值。分位数随机林可以检测到与给定X的Y的条件分布有关的异常值。 离群值是一些观测值,它的位置离数据集中的大多数其他观测...
拓端tecdat|R语言中生存分析模型与时间依赖性ROC曲线可视化 标签: R语言 生存分析 时间依赖性ROC 原文链接:http://tecdat.cn/?p=20650 人们通常使用接收者操作特征曲线(ROC)进行二元结果逻辑回归。但是,流行病学研究中感兴趣的结果通常是事件发生时间。使用随时间变化的时间相关ROC可以更全面地描述这种...
拓端tecdat|R语言信用风险回归模型中交互作用的分析及可视化 标签: R语言 信用风险 回归 原文链接:http://tecdat.cn/?p=21892 多元统计分析 中,交互作用是指某因素作用随其他因素水平的不同而不同,两因素同时存在是的作用不等于两因素单独作用之和(相加交互作用)或之积(相乘交互作用)。通俗来讲就是...
拓端tecdat|如何从xml文件创建R语言数据框dataframe 标签: xml R语言 数据框 问题重现 软件:R语言 环境:windows 问题描述:我有一个XML文档文件。文件的一部分如下所示: <?xml version="1.0" encoding="UTF-8"?> <List> <SubCategory> <.../ID&.
拓端tecdat|R语言主成分分析(PCA)葡萄酒可视化:主成分得分散点图和载荷图 标签: R语言 主成分分析 PCA 原文链接:http://tecdat.cn/?p=22492 我们将使用葡萄酒数据集进行主成分分析。 数据 数据包含177个样本和13个变量的数据框;vintages包含类标签。这些数据是对生长在意大利同一地区但来自三个不同栽培品种的...
拓端tecdat|R语言贝叶斯推断与MCMC:实现Metropolis-Hastings 采样算法示例 标签: R语言 贝叶斯推断 MCMC 示例1:使用MCMC的指数分布采样 任何MCMC方案的目标都是从“目标”分布产生样本。在这种情况下,我们将使用平均值为1的指数分布作为我们的目标分布。所以我们从定义目标密度开始: target = function(x){ ...
拓端tecdat|R语言:状态空间模型和卡尔曼滤波预测酒精死亡人数时间序列 标签: r语言 状态空间模型 卡尔曼滤波 原文链接:http://tecdat.cn/?p=22665 摘要 状态空间建模是一种高效、灵活的方法,用于对大量的时间序列和其他数据进行统计推断。本文介绍了状态空间建模,其观测值来自指数族,即高斯、泊松、二项、负二项和...
拓端tecdat|R语言Fama-French三因子模型实际应用:优化投资组合 标签: R语言 Fama-French 因子模型 本文将说明金融数学中的R 语言优化投资组合,因子模型的实现和使用。 具有单一市场因素的宏观经济因素模型 我们将从一个包含单个已知因子(即市场指数)的简单示例开始。该模型为 其中显式因子ft为S&P 500指数...
拓端tecdat|R语言线性回归和时间序列分析北京房价影响因素可视化案例 标签: R语言 线性回归 时间序列 原文链接:http://tecdat.cn/?p=21467 目的 房价有关的数据可能反映了中国近年来的变化: 人们得到更多的资源(薪水),期望有更好的房子 人口众多 独生子女政策:如何影响家庭的几何结构?更多的卧室,更多...
拓端tecdat|基于R语言股票市场收益的统计可视化分析 标签: R语言 股票市场 收益 金融市场上最重要的任务之一就是分析各种投资的历史收益。要执行此分析,我们需要资产的历史数据。数据提供者很多,有些是免费的,大多数是付费的。在本章中,我们将使用Yahoo金融网站上的数据。...
拓端tecdat|使用R语言做极大似然估计实例 标签: R语言 极大似然估计 在所有双射函数的意义上,最大似然估计是不变的 如果 是的最大似然估计 然后 。让 , 然后 等于 和中的似然函数 是 。由于 是的最大似然估计 ,
拓端tecdat|R语言极值理论EVT:基于GPD模型的火灾损失分布分析 标签: R语言 极值理论 EVT 原文链接:http://tecdat.cn/?p=21425 极值理论关注风险损失分布的尾部特征,通常用来分析概率罕见的事件,它可以依靠少量样本数据,在总体分布未知的情况下,得到总体分布中极值的变化情况,具有超越样本数据的估计...
拓端tecdat|R语言对HullWhite短期利率模型仿真 标签: R语言 Hull White 短期 在这篇文章中,我使用R建立著名的Hull-White利率模型并进行仿真。 Hull and White(1994)模型解决Vasicek模型对利率的初始期限结构的拟合不佳的问题。该模型定义为:
拓端tecdat|R语言中的隐马尔可夫HMM模型实例 标签: r语言 hmm 隐马尔可夫 HMM用于建模数据序列,无论是从连续概率分布还是从离散概率分布得出的。它们与状态空间和高斯混合模型相关,因为它们旨在估计引起观测的状态。状态是未知或“隐藏”的,并且HMM试图估计状态,类似于无监督聚类过程。...
拓端tecdat|R语言计算资本资产定价模型(CAPM)中的Beta值和可视化 标签: R语言 资本资产定价模型 CAPM 原文链接:http://tecdat.cn/?p=22588 今天我们将计算投资组合收益的CAPM贝塔。这需要拟合一个线性模型,得到可视化,从资产收益的角度考虑我们的结果的意义。 简单的背景介绍,资本资产定价模型(CAPM)是由...