拓端tecdat|R语言多项式回归拟合非线性关系 标签: R语言 多项式回归 非线性关系 原文链接:http://tecdat.cn/?p=22438 多项式回归是独立x变量和因果y变量之间的非线性关系。 当我们分析有一些弯曲的波动数据时,拟合这种类型的回归是很关键的。 在这篇文章中,我们将学习如何在R中拟合和绘制...
拓端tecdat|新零售消费者特征的数据视野 标签: 新零售 消费者 特征 原文链接:http://tecdat.cn/?p=22557 新零售,顾名思义,就是与传统零售完全不同的,一种新的零售模式。 要点提示 其价值在于最大程度提升全社会流通零售业的运转效率。建立一个以消费者体验为中心的数据驱动...
拓端tecdat|R语言时间序列GARCH模型分析股市波动率 标签: R语言 时间序列 GARCH模型 原文链接:http://tecdat.cn/?p=22360 在这篇文章中,我们将学习一种在价格序列中建立波动性模型的标准方法,即广义自回归条件异方差(GARCH)模型。 价格波动的 GARCH 模型的思想是利用误差结构的近期实现来...
拓端tecdat|R语言用普通最小二乘OLS,广义相加模型GAM ,样条函数进行逻辑回归LOGISTIC分类 标签: R语言 标准最小二乘 OLS 原文链接:http://tecdat.cn/?p=21379 本文我们对逻辑回归和样条曲线进行介绍。 logistic回归基于以下假设:给定协变量x,Y具有伯努利分布, 目的是估计参数β。 回想一下,针对该概率使用该函数是 ...
拓端tecdat|数据下的隐形眼镜初体验 标签: 数据 隐形眼镜 隐形眼镜是一种戴在眼球角膜上,用以...拓端数据(tecdat)研究人员根据电商网站交易数据从多个角度进行数据分析,对眼镜类型、价格、产地及消费满意度进行数据洞察。 隐形眼镜类型与评分 通过销量我们将价格区间.
拓端tecdat|视频:R语言中的时间序列分析模型:ARIMA-ARCH / GARCH模型分析股票价格 标签: R语言 时间序列 ARIMA 时间序列分析是统计学中的一个主要分支,主要侧重于分析数据集以研究数据的特征并提取有意义的统计信息来预测序列的未来值。时序分析有两种方法,即频域和时域。前者主要基于傅立叶变换,而后者则密切研究序列的自...
拓端tecdat|matlab实现扩展卡尔曼滤波(EKF)进行故障检测 标签: matlab 扩展卡尔曼滤波 EKF 原文链接:http://tecdat.cn/?p=22467 本文展示了如何使用扩展卡尔曼滤波器进行故障检测。本文使用扩展的卡尔曼滤波器对一个简单的直流电机的摩擦力进行在线估计。估计的摩擦力的重大变化被检测出来,并表明存在...
拓端tecdat|Excel中计算票面利率Coupon Rate 标签: Excel 票面利率 Coupon Rate “票面利率”是指债券面值为基数计算每年给投资者的利息。换句话说,这是主要适用于债券的固定收益证券的规定利率。票面利率的公式是通过将每年支付的票面金额之和除以债券的面值得出的,然后以百分比表示。...
拓端tecdat|R语言使用ARIMAX预测失业率经济时间序列数据 标签: R语言 ARIMAX 预测 原文链接:http://tecdat.cn/?p=22521 在大数据的趋势下,我们经常需要做预测性分析来帮助我们做决定。其中一个重要的事情是根据我们过去和现在的数据来预测未来。这种方法我们通常被称为预测。 许多情况下都...
拓端tecdat|R语言在地图上绘制散点饼图可视化 标签: R语言 地图 散点饼图 原文链接:http://tecdat.cn/?p=22537 我们在ggplot2中制作的饼实际上是一个条形图转换为极坐标。如果我们想制作一个像上面截图那样的地图,这就很困难了。 但在地图上绘制饼图时,它也有自己的缺点。首先,当...
拓端tecdat|移动广告中基于点击率的数据策略 标签: 移动广告 点击率 数据 在移动广告领域,移动APP广告因其独特的价值而受到广告商的青睐。APP广告可以准确地根据用户的地理位置、时间、型号、移动操作系统、设备价格,甚至设备品牌来进行广告;同时,新技术支持个性化的交互形式,例如...
拓端tecdat|R语言用LASSO,adaptive LASSO预测通货膨胀时间序列 标签: R语言 LASSO 预测 原文链接:http://tecdat.cn/?p=22273 动机 如果你了解数据科学领域,你可能听说过LASSO。LASSO是一个对目标函数中的参数大小进行惩罚的模型,试图将不相关的变量从模型中排除。它有两个非常自然的用途,第一个...
拓端tecdat|Python使用GARCH,EGARCH,GJR-GARCH模型和蒙特卡洛模拟进行股价预测 标签: Python GARCH 蒙特卡洛 原文链接:http://tecdat.cn/?p=20666 预测股价已经受到了投资者,政府,企业和学者广泛的关注。然而,数据的非线性和非平稳性使得开发预测模型成为一项复杂而具有挑战性的任务。在本文中,我将解释如何将GARCH,...
拓端tecdat|R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 标签: R语言 逻辑回归 Logistic回归 原文链接:http://tecdat.cn/?p=22410 本文的目的是完成一个逻辑回归分析。使你对分析步骤和思维过程有一个基本概念。 library(tidyverse) library(broom) 这些数据来自一项正在进行的对镇居民的心血管研究...
拓端tecdat|Nelsen-Siegel—Svensson扩展模型简介 标签: Nelsen Siegel 模型 机器学习 R语言实例链接:http://tecdat.cn/?p=11878 Nelson—Siegel模型也即参数拟合模 型,最先 ~Charles Nelson~1]Andrew Siegel在1978年提出。该模型通过建立远 期瞬时利率的函数 ,来完成即期利率函数形式的推导,其...
拓端tecdat|数据观察“双十一”网购新常态 标签: 数据 双十一 网购 在国内疫情稳定的新常态下,“双十一”点燃了消费者的购物热情,在购物热潮中,消费热点、消费者理念与行为将出现哪些变化? ▼ 本文基于消费者调研的定量分析数据,与您共同探讨“双十一”,消费者的购物计划与...
拓端tecdat|R语言神经网络模型预测车辆数量时间序列 标签: R语言 神经网络模型 预测 原文链接:http://tecdat.cn/?p=19980 具有单个隐藏层和滞后输入的前馈神经网络,可以用于预测单变量时间序列。将神经网络模型拟合到以时间序列的滞后值作为输入的时间序列。因此它是一个非线性的模型,不可能...
拓端tecdat|ARIMA模型预测CO2浓度时间序列-python实现 标签: ARIMA 预测 时间序列 原文链接:http://tecdat.cn/?p=20424 介绍 时间序列为预测未来数据提供了方法。根据先前的值,时间序列可用于预测经济,天气的趋势。时间序列数据的特定属性意味着通常需要专门的统计方法。 在本教程中,我们...
拓端tecdat|中国消费者共享汽车使用情况调查 标签: 中国 消费者 共享汽车 转载原文http://tecdat.cn/?p=2522 汽车共享”最早出现于上个世纪四十年代的瑞士,他们发明了“自驾车合作社”,后来日本、英国等国争相效仿,但都未形成规模。而今,共享经济通过互联网达到了一个新的高度,共享...
拓端tecdat|t-GARCH 模型的贝叶斯推断理论 标签: r语言 开发语言 R语言实例链接:http://tecdat.cn/?p=17494 实际处理中,发现金融数据存在尖峰厚尾现象。所以我们选择扰动项服从 t 分布的 t-GARCH 模型来描述波动性过程。t-GARCH(1,1)模型的表达式如下: 模型的参数向量记为 ...
拓端tecdat|Python中的Lasso回归之最小角算法LARS 标签: Python Lasso 回归 假设我们期望因变量由潜在协变量子集的线性组合确定。然后,LARS算法提供了一种方法,可用于估计要包含的变量及其系数。 LARS解决方案没有给出矢量结果,而是由一条曲线组成,该曲线表示针对参数矢量L1范数的每个值...
拓端tecdat|数据视域下图书馆话题情感分析 标签: 数据 图书馆话题 情感分析 当前是大数据盛行的时代,各种用户信息行为数据分析的结果影响着人们的生活和学习,同时对图书馆的发展也有着影响。 ▼ 本文在图书馆话题下知乎用户问答行为数据的基础上,分析了图书馆信息资源建设的新要求,并...
拓端tecdat|R语言乘法GARCH模型对高频交易数据进行波动性预测 标签: R语言 GARCH 高频交易 原文链接:http://tecdat.cn/?p=22692 在过去十年中,人们对高频交易和模型的兴趣成倍增长。虽然我对高频噪音中出现信号的有效性有一些怀疑,但我还是决定使用GARCH模型研究一下收益率的统计模型。与每日和较低...
拓端tecdat|R语言基于Bootstrap的线性回归预测置信区间估计方法 标签: R语言 Bootstrap 线性回归 原文链接:http://tecdat.cn/?p=21625 我们知道参数的置信区间的计算,这些都服从一定的分布(t分布、正态分布),因此在标准误前乘以相应的t分值或Z分值。但如果我们找不到合适的分布时,就无法计算置信区间了吗...
拓端tecdat|Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析 标签: Python lstm xgboost 在数据科学学习之旅中,我经常处理日常工作中的时间序列数据集,并据此做出预测。
拓端tecdat|R语言机器学习实战之多项式回归 标签: R语言 机器学习 模型 原文链接:http://tecdat.cn/?p=2686 如果数据比简单的直线更为复杂,我们也可以用线性模型来你和非线性数据。一个简单的方法就是将每一个特征的幂次方添加为一个新的特征,然后在这个拓展的特征集上进行线性拟合,...
拓端tecdat|R语言分段线性回归分析预测车辆的制动距离 标签: R语言 分段 线性回归 原文链接:http://tecdat.cn/?p=21557 分段回归( piecewise regression ),顾名思义,回归式是“分段”拟合的。其灵活用于响应变量随自变量值的改变而存在多种响应状态的情况,二者间难以通过一种回归模型预测或...
拓端tecdat|Python计算股票投资组合的风险价值(VaR) 标签: Python 股票投资组合 风险价值 风险价值(VaR)用于尝试量化指定时间范围内公司或投资组合中的财务风险水平。VaR提供了一段时间内投资组合的最大损失的估计,您可以在各种置信度水平上进行计算。
拓端tecdat|Python中用Prophet模型对天气时间序列进行预测与异常检测 标签: Python Prophet 时间序列 原文链接:http://tecdat.cn/?p=22673 方法 Prophet异常检测使用了Prophet时间序列预测。基本的Prophet模型是一个可分解的单变量时间序列模型,结合了趋势、季节性和节假日效应。该模型预测还包括一个围绕估计的...
拓端tecdat|R语言广义线性模型GLM、多项式回归和广义可加模型GAM预测泰坦尼克号幸存者 标签: r语言 回归 机器学习 本文通过R语言建立广义线性模型(GLM)、多项式回归和广义可加模型来预测谁在1912年的泰坦尼克号沉没中幸存下来。