拓端tecdat|R语言用LOESS(局部加权回归)季节趋势分解(STL)进行时间序列异常检测 标签: R语言 LOESS 局部加权回归 原文链接:http://tecdat.cn/?p=22632 这篇文章描述了一种对涉及季节性和趋势成分的时间序列的中点进行建模的方法。我们将对一种叫做STL的算法进行研究,STL是 "使用LOESS(局部加权回归)的季节-趋势分解 "的缩写...
拓端tecdat|R语言自然语言处理(NLP):情感分析新闻文本数据 标签: R语言 自然语言处理 NLP 本文对R中的文本内容进行情感分析。此实现利用了各种现有的字典,此外,还可以创建自定义词典。自定义词典使用LASSO正则化作为一种统计方法来选择相关词语。最后,评估比较所有方法。 ...
拓端tecdat|R语言时间序列平稳性几种单位根检验(ADF,KPSS,PP)及比较分析 标签: R语言 时间序列 平稳性 原文链接:http://tecdat.cn/?p=21757 时间序列模型根据研究对象是否随机分为确定性模型和随机性模型两大类。 随机时间序列模型即是指仅用它的过去值及随机扰动项所建立起来的模型,建立具体的模型,需解决如下三...
拓端tecdat|R语言基于温度对城市层次聚类、kmean聚类、主成分分析和Voronoi图可视化 标签: R语言 层次聚类 kmean 原文链接:http://tecdat.cn/?p=20960 为了说明层次聚类技术和k-均值,我使用了了城市温度数据集,其中包括几个城市的月平均气温。 我们有15个城市,每月进行一次观测 boxplot(temp[,1:12],main="月平均温度")...
拓端tecdat|R语言MCMC:Metropolis-Hastings采样用于回归的贝叶斯估计 标签: R语言 MCMC Metropolis MCMC是从复杂概率模型中采样的通用技术。 蒙特卡洛 马尔可夫链 Metropolis-Hastings算法
拓端tecdat|R语言混合图形模型MGM的网络可预测性分析 标签: R语言 混合图形模型 MGM 网络模型已经成为抽象复杂系统并深入了解许多科学领域中观测变量之间的关系模式的流行方法。这些应用程序大多数集中于分析网络的结构。但是,如果不是直接观察到网络(爱丽丝和鲍勃是朋友),而是根据数据进行估算...
拓端tecdat|R语言分位数回归预测筛选有上升潜力的股票 标签: r语言 分位数回归 预测 现在,分位数回归已被确立为重要的计量经济学工具。与均值回归(OLS)不同,目标不是给定x的均值,而是给定x的一些分位数。您可以使用它来查找具有良好上升潜力的股票。
拓端tecdat|使用Python中Keras的LSTM递归神经网络进行时间序列预测 标签: Python Keras LSTM 时间序列预测问题是预测建模问题中的一种困难类型。 与回归预测建模不同,时间序列还增加了输入变量之间序列依赖的复杂性。
拓端tecdat|SAS用K-Means 聚类最优k值的选取和分析 标签: sas 聚类 kmeans “聚类是将数据集分为几组的过程,其中包括相似的数据点”。聚类是一种无监督的机器学习,在您拥有未标记的数据时使用。
拓端tecdat|R语言有限混合模型(FMM,finite mixture model)及其EM算法聚类分析间歇泉喷发时间 标签: R语言 有限混合模型 FMM 原文链接:http://tecdat.cn/?p=22609 摘要 本文提供了一套用于分析各种有限混合模型的方法。既包括传统的方法,如单变量和多变量正态混合的EM算法,也包括反映有限混合模型的一些最新研究的方法。许多算法都是...
拓端tecdat|R语言基于Bagging分类的逻辑回归(Logistic Regression)、决策树、森林分析心脏病患者 标签: R语言 逻辑回归 决策树 原文链接:http://tecdat.cn/?p=22448 今天,我们将看下bagging 技术里面的启发式算法。 通常,bagging 与树有关,用于生成森林。但实际上,任何类型的模型都有可能使用bagging 。回顾一下,bagging意味着 ...
拓端tecdat|R语言Copula函数股市相关性建模:模拟Random Walk(随机游走) 标签: R语言 Copula 股市 在引入copula时,大家普遍认为copula很有趣,因为它们允许分别对边缘分布和相依结构进行建模。
拓端tecdat|R语言极值推断:广义帕累托分布GPD使用极大似然估计、轮廓似然估计、Delta法 标签: R语言 极值推断 广义帕累托分布 原文链接:http://tecdat.cn/?p=22566 本文是极端值推断的内容。我们在广义帕累托分布上使用最大似然方法。 极大似然估计 在参数模型的背景下,标准技术是考虑似然的最大值(或对数似然)。考虑到一些技术性...
拓端tecdat|Matlab马尔可夫链蒙特卡罗法(MCMC)估计随机波动率(SV,Stochastic Volatility) 模型 标签: Matlab 马尔可夫链蒙特卡罗法 MCMC 波动率是一个重要的概念,在金融和交易中有许多应用。这是期权定价的基础。波动率还使您可以确定资产分配并计算投资组合的风险价值(VaR)。甚至波动率本身也是一种金融工具,例如CBOE的VIX波动率指数。...
拓端tecdat|R语言股票市场指数:ARMA-GARCH模型和对数收益率数据探索性分析 标签: r语言 股票市场 ARMA 本文将分析2007-2018年的工业指数(DJIA)。工业指数(DIJA)是一个股市指数,表明位于30家大型上市公司的价值。工业指数(DIJA)的价值基于每个组成公司的每股股票价格之和。
拓端tecdat|R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化 标签: R语言 PCA 逻辑回归 原文链接:http://tecdat.cn/?p=22262 在讨论分类时,我们经常分析二维数据(一个自变量,一个因变量)。但在实际生活中,有更多的观察值,更多的解释变量。随着两个以上的解释变量,它开始变得更加复杂的可视化...
拓端tecdat|R语言基于Garch波动率预测的区制转移交易策略 标签: r语言 开发语言 本文提出了一种优雅的算法,可以根据市场波动性在均值回归和趋势跟随策略之间进行切换。研究了两种模型:一种使用历史波动率,另一种使用Garch(1,1)波动率预测。均值回归策略使用RSI(2)建模:RSI(2)时为Long,...
拓端tecdat|TensorFlow 2建立神经网络分类模型——以iris数据为例 标签: TensorFlow 神经网络 分类 这个教程将利用机器学习的手段来对鸢尾花按照物种进行分类。本教程将利用 TensorFlow 来进行以下操作: 构建一个模型, 用样例数据集对模型进行训练,以及 利用该模型对未知数据进行预测。 TensorFlow 编程 ...
拓端tecdat|R语言连续时间马尔可夫链模拟案例 Markov Chains 标签: R语言 连续时间 马尔科夫链 原文链接:http://tecdat.cn/?p=4182 一个加油站有一个加油桩,没有空间供车辆等待(如果车辆到达,加油桩被占用,它就会离开)。车辆到达加油站的速率服从泊松过程λ=3/20每分钟,其中75%是汽车,25%是摩托车。...
拓端tecdat|matlab使用长短期记忆(LSTM)神经网络对序列数据进行分类 标签: matlab 长短期记忆 神经网络 本示例说明如何使用长短期记忆(LSTM)网络对序列数据进行分类。 要训练深度神经网络对序列数据进行分类,可以使用LSTM网络。LSTM网络使您可以将序列数据输入网络,并根据序列数据的各个时间步进行预测。...
拓端tecdat|matlab对国内生产总值(GDP)建立马尔可夫链模型(MC)并可视化 标签: matlab r语言 开发语言 本示例说明如何创建并可视化Markov链模型的结构和演化。考虑从随机转移矩阵中创建马尔可夫链的四状态马尔可夫链,该模型模拟了国内生产总值(GDP)的动态。
拓端tecdat|R语言BUGS/JAGS贝叶斯分析: 马尔科夫链蒙特卡洛方法(MCMC)采样 标签: r语言 bugs jags 在许多情况下,我们没有足够的计算能力评估空间中所有n维像素的后验概率 。在这些情况下,我们倾向于利用称为Markov-Chain Monte Carlo 算法的程序 。此方法使用参数空间中的随机跳跃来(最终)确定后验分布。...
拓端tecdat|Python安装TensorFlow 2、tf.keras和深度学习模型的定义 标签: Python TensorFlow tf.keras 深度学习的预测建模是现代开发人员需要了解的一项技能。 TensorFlow是Google开发和维护的首要的开源深度学习框架。尽管直接使用TensorFlow可能具有挑战性,但现代的tf.keras API使得Keras在TensorFlow项目中的使用...
拓端tecdat|R语言逻辑回归分析连续变量和分类变量之间的“相关性 标签: R语言 逻辑回归 连续变量 原文链接:http://tecdat.cn/?p=18169 比如说分类变量为是否幸存、是因变量,连续变量为年龄、是自变量,这两者可以做相关分析吗?两者又是否可以做回归分析? 我们考虑泰坦尼克号数据集,
拓端tecdat|R语言Lee-Carter模型对年死亡率建模预测期望寿命 标签: R语言 Lee-Carter模型 死亡率 现在我们也可以对这项快速研究的局限性感到疑惑。特别是,正如有配偶的寿命之间存在很强的相关性,我们可能会问,孩子和孙子的出生是否具有对一个人的剩余生命的影响(或者我们是否可以像这样假设独立性)。...
拓端tecdat|R语言:逻辑回归ROC曲线对角线分析过程及结果 标签: R语言 逻辑回归 ROC曲线 之前我们讨论了使用ROC曲线来描述分类器的优势,有人说它描述了“随机猜测类别的策略”,让我们回到ROC曲线来说明。考虑一个非常简单的数据集,其中包含10个观测值(不可线性分离)