stata 17是一款功能非常强大的数据分析软件,在这一领域那是相当有名的,能和它媲美的大概只有ibm的spss了,那让我们来看看这款数据分析软件到底有什么独到之处吧。名气大就意味着用户多,为了能满足不同用户的使用需求,它的界面非常简单,但是又很复杂,具有预设界面,一些简单的功能都在首页,如果是新手也能很好的使用,而说它复杂是因为功能太多了,不过这些功能都是在功能选项卡里的,需要用户自己找到,然后添加进主界面,针对不同的用户提供不同的操作界面,非常友好。在17版本中推出了一系列新功能,现在对表格能完美支持,比如以前如果要将数据导出到表格,虽然官方有提供命令能做到,不过又麻烦又死板,不能解决所有导出需求,现在对这一命令做出了优化,能非常轻易的将数据导出。久期数据也有了新命令,这一数据是长时间的研究,虽然说是长时间的,但总有结束的时候,而实际情况是研究结束了,调查的结果却并没有完整,这就是之前这一数据的问题,用术语来说叫删失,归并,为了解决这个问题,17版本推出了新命令stintcox,这是一个估计算法,能帮助模拟数据,让实验变得更加完整。本站这里带来的是
stata 17中文破解版,这个版本是完全免费使用的,欢迎大家前来下载体验。
stata 17安装教程
1、在本站下载后得到如下所示的安装程序,运行它;
2、等待安装准备完成;
3、这里是软件的安装向导,点击next进入到配置界面;
4、许可协议,可上下滑动滚轮仔细查看;
5、这四项分别是输入用户名,单位名称,为所有用户安装,为当前用户安装;
6、选择许可类型,根据实际情况选择;
7、安装位置建议不要更改;
8、选择文件位置是为一个用户还是所有,建议默认第一个;
9、配置完成,点击安装即可。
17版本新功能
1、双重差分法的官方命令
“双重差分法”(Difference-in-differences,简记DID)或许是最常用的计量方法。怎么能没有DID官方命令呢?为此,Stata 17及时地推出了DID的官方命令xtdidregress;其中,“xt” 表示这是适用于面板数据的命令。
除了进行常规的 DID 估计,命令xtdidregress还允许最多指定三个“分组变量”(group variables),或两个分组变量与一个时间变量,从而进行“三重差分法”(Difference-in-differences-in-differences,简记DDD)的估计。
另外,针对“重复截面数据”(repeated cross-sectional data),即所谓“准面板”(pseudo panel data),也推出了相关的新命令didregress,可进行类似 DID 的估计。更重要的是,你可以用DID的官方命令,轻松地画平行趋势图啦~
2、完美的表格输出
实证研究者经常需要将的多个回归结果以表格形式输出到Word文件中。虽然早有官方命令estimates table可完成此类任务,但比较死板;故此前用户一般使用非官方命令(比如estout或outreg)来输出回归结果。为此,大幅改善了原来的table命令,使用户可轻松地以表格形式汇报回归结果(regression results)或统计特征(summary statistics)。
进一步,你可以设计回归表格的风格(styles),并应用于所创建的表格,然后将此表格输出到Word或其他形式的文件(包括PDF、HTML、LaTex、Excel、Markdown 等)。另外,你还可以使用新增的前缀(prefix)collect,来收集命令的各种估计结果。最后,还新增了Table Builder(表格创建器),让用户可通过点击鼠标(point-and-click)来创建表格。
3、Lasso的新功能
作为“高维回归”(high-dimensional regression)的常用工具,已经推出了有关Lasso(Least Absolute Shrinkage and Selection Operator,即所谓 “套索估计量”)的一系列官方命令。17则提供了更多有关 Lasso 的新功能。
使用Lasso估计处理效应模型。在16 中,可使用命令teffects估计“处理效应”(treatment effects)模型;而命令lasso则用于估计协变量很多的高维模型。17则将二者结合起来,其推出的新命令telasso,可估计包含很多协变量的处理效应模型。
使用Lasso处理聚类数据。对于“聚类数据”(cluster data),由于每个聚类中观测值存在自相关,故通常的Lasso估计可能导致偏差。在17中,在使用命令lasso或elasticnet时,可通过新增选择项 “cluster(clustvar)” 来处理聚类数据。进一步,对于使用Lasso进行统计推断的命令,比如poregress(表示partialing-out regress),则可使用17的新增选择项 “cluster(clustvar)” 来得到聚类稳健的标准误(cluster-robust standard errors)。
4、离散选择模型的新命令
离散选择模型(discrete choice model)是微观计量经济学的常用模型。在17中,增加了以下离散选择模型的新命令:
“面板多项逻辑模型”(panel multinomial logit model)。对于横截面数据的多项逻辑模型,已有mlogit命令。17新增的xtmlogit命令则可使用面板数据估计多项逻辑模型。这无疑是在离散选择模型方面的一大进步,因为此前只能使用xtlogit或xtprobit估计面板二值选择模型。
“零膨胀排序逻辑模型”(zero-inflated ordered logit model)。对于排序数据(ordered data),此前可使用命令ologit或oprobit进行估计。在实践中,有时排序数据中最低类别所占比重很大。若将最低类别的取值记为“零”,则存在所谓“零膨胀”现象。此时可使用 17的新增命令ziologit,估计更有效率的“零膨胀排序逻辑模型”(zero-inflated ordered logit model)。
5、久期数据的新命令
“久期数据”(duration data)常用于生物统计的 “生存分析”(survival analysis),在经济学中也有广泛用途,例如失业的持续时间,婚姻的延续时长,王朝的寿命等。久期数据常存在 “删失”(censoring)或 “归并” 问题,比如当研究结束时,有些病人可能尚未死亡;或者有些失业者还未找到工作。
17新推出的命令stintcox,可使用Cox模型来估计一种特殊的“区间删失”(interval-censored)数据。对于区间删失数据,我们只知道事件发生于某个区间,但无法确知其发生时点;比如,只知道癌症复发于两次体检之间的时段。如果忽略久期数据存在的区间删失问题,则会导致估计偏差。
6、贝叶斯计量经济学的全面升级
在大数据时代,由于数据日益复杂而多样,在处理有些问题时,基于频率学派的传统计量方法可能不便使用,使得贝叶斯学派的计量经济学逐渐兴起。频率学派认为待估计的参数是给定的未知数(fixed unknown parameters),而贝叶斯学派则将未知参数视为服从某个分布的随机变量,并可随时根据新的样本信息将其 “先验分布”(prior distribution)
贝叶斯面板数据模型(Bayesian panel-data models)。目前已有的面板命令包括xtreg(静态面板),xtlogit或xtprobit(面板二值选择模型),以及xtologit或xtoprobit(面板排序模型)等。在17中,如果要使用贝叶斯方法估计这些面板模型,只要在原命令之前加上 “前缀”(prefix)bayes即可。
贝叶斯向量自回归模型(Bayesian VAR models)。“向量自回归”(Vector Autoregression,简记VAR)是常见的时间序列模型。在已有中,可用命令var来估计VAR模型,而后续命令则包括:使用fcast进行 “动态预测”(dynamic forecast),以及使用irf估计 “脉冲响应函数”(impulse response function,简记 IRF)与 “预测误差方差分解”(forecast error variance decomposition,简记 FEVD)。
在stata 17中,则可使用命令“bayes: var”(即在命令var之前加上前缀 bayes)估计贝叶斯的 VAR 模型,然后用bayesfcast进行动态预测;而脉冲响应函数与预测误差方差分解也可类似地得到。
7、非参数的趋势检验
有时样本数据中存在分组(比如,分为3组),且这些分组有天然的排序(比如,记为1,2,3组),即所谓 “排序分组”(ordered groups)。在这种排序分组的数据中,经常希望检验某个变量在此分组排序中(比如,第1-3组),是否存在某种趋势,比如此变量的取值倾向于越来越大,即所谓 “tests for trend across ordered group”。
为此,可使用已有命令nptrend,进行非参数的Cuzick秩检验(Cuzick test using ranks)。而17的最新版nptrend命令,则在 Cuzick秩检验之外,新增了三个非参数检验,即“Cochran-Armitage test”,“Jonckheere-Terpstra test” 与“linear-by-linear trend test”,使得命令nptrend的功能大大增强。
8、元分析的新命令;
“元分析”(meta-analysis)将多个类似的研究结果综合在一起。比如,针对某个疫苗的有效性(vaccine efficacy),在世界各地进行了多个实验,如何将每个实验所得的疫苗有效性指标,通过加权平均得到统一的度量。17将的元分析功能作了进一步的提升。
多维元分析(Multivariate meta-analysis)。在将多个研究结果综合在一起时,其中的每个研究可能同时汇报 “多个效应规模”(multiple effect sizes),而这些效应之间可能存在相关性。若使用既有的 meta命令,则会忽略这种相关性。17的新增命令meta mvregress可进行多维元分析,并处理这种相关性。
9、与Python、Java、H2O及Jupyter Notebook的整合;
在大数据时代,也在加快与主流软件平台的整合,为用户提供更多的增值服务。这在17的此次升级中体现尤其突出。
与 Python 的整合(Python integration)。Python已是炙手可热的主流计算机语言。为此,16专门提供了一个与Python的接口,让用户在熟悉的界面下调用Python,并在中显示运行结果。17则更进一步,推出了新的Python包(Python package)pystata,使得用户可在Python 中方便地调用。 17还引入了一个新概念 “PyStata” ,包括 与Python交互的所有方式。
10、Do文件编辑器的改进与速度提升等
Do文件编辑器的改进(Do-file Editor improvements)。随着编程的重要性日益提高,16在Do文件编辑器中加入了 “自动填写完成”(autocompletion)与 “语法高亮”(syntax highlighting)的功能。17又将Do文件编辑器的功能进一步提升。
在17的Do文件编辑器中,可通过设置 “bookmarks”(书签)而在一个较长的do文件中迅速跳至想要编辑的部分。17的Do文件编辑器还新增了“navigation control”(导航),其中罗列所有的书签及其标签(bookmarks and their labels),以该Do文件中的全部“程序”(programs)
软件功能
【矩阵运算功能】
矩阵代数是多元统计分析的重要工具,提供了多元统计分析中所需的矩阵基本运算,如矩阵的加、积、逆、 Cholesky 分解、 Kronecker 内积等;还提供了一些高级运算,如特征根、特征向量、奇异值分解等;在执行完某些统计分析命令后,还提供了一些系统矩阵,如估计系数向量、估计系数的协方差矩阵等。
【程序设计功能】
这是一个统计分析软件,但它也具有很强的程序语言功能,这给用户提供了一个广阔的开发应用的天地,用户可以充分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲。事实上,我们这个软件的 ado 文件 ( 高级统计部分 ) 都是用自带的语言编写的
其统计分析能力远远超过了 SPSS ,在许多方面也超过了 SAS !由于该软件在分析时是将数据全部读入内存,在计算全部完成后才和磁盘交换数据,因此计算速度极快(一般来说, SAS 的运算速度要比 SPSS 至少快一个数量级,而 Stata 17的某些模块和执行同样功能的 SAS 模块比,其速度又比 SAS 快将近一个数量级!) 也是采用命令行方式来操作,但使用上远比 SAS 简单。其生存数据分析、纵向数据(重复测量数据)分析等模块的功能甚至超过了 SAS 。用该软件绘制的统计图形相当精美,很有特色。
【统计功能】
该软件的统计功能很强,除了传统的统计分析方法外,还收集了近 20 年发展起来的新方法,如 Cox 比例风险回归,指数与 Weibull 回归,多类结果与有序结果的 logistic 回归, Poisson 回归,负二项回归及广义负二项回归,随机效应模型等。具体说,具有如下统计分析能力:
数值变量资料的一般分析:参数估计,t检验,单因素和多因素的方差分析,协方差分析,交互效应模型,平衡和非平衡设计,嵌套设计,随机效应,多个均数的两两比较,缺项数据的处理,方差齐性检验,正态性检验,变量变换等。
分类资料的一般分析:参数估计,列联表分析 ( 列联系数,确切概率 ) ,流行病学表格分析等。
等级资料的一般分析:秩变换,秩和检验,秩相关等
相关与回归分析:简单相关,偏相关,典型相关,以及多达数十种的回归分析方法,如多元线性回归,逐步回归,加权回归,稳键回归,二阶段回归,百分位数 ( 中位数 ) 回归,残差分析、强影响点分析,曲线拟合,随机效应的线性回归模型等。
其他方法:质量控制,整群抽样的设计效率,诊断试验评价, kappa 等。
【作图功能】
作图模块中主要提供如下八种基本图形的制作 : 直方图 (histogram) ,条形图 (bar), 百分条图 (oneway) ,百分圆图 (pie) ,散点图 (twoway) ,散点图矩阵(matrix) ,星形图 (star) ,分位数图。这些图形的巧妙应用,可以满足绝大多数用户的统计作图要求。在有些非绘图命令中,也提供了专门绘制某种图形的功能,如在生存分析中,提供了绘制生存曲线图,回归分析中提供了残差图等。
软件特色
1、重采样和模拟方法
bootstrap•jackknife•蒙特卡罗模拟•置换测试•更多
2、时间序列
ARIMA•ARFIMA•ARCH / GARCH•VAR•VECM•多变量GARCH•未观测组件模型•动态因子•状态空间模型•马尔可夫切换模型•商业日历•结构中断测试•阈值回归•预测•脉冲响应函数•单位根测试•过滤器和平滑器•滚动和递归估计•更多
3、生存分析
Kaplan-Meier和Nelson-Aalen估计,•Cox回归(脆弱)•参数模型(脆弱,随机效应)•竞争风险•危害•时变协变量•左,右和间隔审查•Weibull,指数,和Gompertz模型•更多
4、Mata严谨的编程语言
交互式会话•大规模开发项目•优化•矩阵求逆•分解•特征值和特征向量•LAPACK引擎•实数和复数•字符串矩阵•与数据集和矩阵的接口•数值导数•面向对象编程•更多
5、图形用户界面
所有功能的菜单和对话框•数据编辑器•变量管理器•图形编辑器•项目管理器•文件编辑器•剪贴板预览工具•多个首选项集•更多
6、文档
31本手册•15,000多页•无缝导航•数千个工作示例•快速入门•方法和公式•参考•更多
7、基本统计
摘要•交叉表•相关性•z和t检验•方差检验•比例检验•置信区间•因子变量•更多
8、非参数方法
非参数回归•Wilcoxon-Mann-Whitney,Wilcoxon签署等级,Kruskal-Wallis测试•Spearman和Kendall相关性•Kolmogorov-Smirnov测试•精确二项CI•生存数据•ROC分析•平滑•自举•更多
9、GMM和非线性回归 广义矩量法(GMM)•非线性回归•更多
10、线性模型
回归•审查结果•内生回归量•自举,折刀,鲁棒和群集稳健方差•工具变量•三阶段最小二乘•约束•分位数回归•GLS•更多
11、小组/纵向数据
Stata17具有强大标准误差的随机和固定效应•线性混合模型•随机效应概率•GEE•随机和固定效应泊松•动态面板数据模型•工具变量•面板单位根测试•更多
12、多级混合效果模型
连续,二元,计数和生存结果•两级,三级和更高级模型•广义线性模型•非线性模型•随机截距•随机斜率•交叉随机效应•效果和拟合值的BLUP•分层模型•残差错误结构•DDF调整•支持调查数据•更多
13、二进制,计数和有限的结果
logistic,probit,tobit•泊松和负二项•条件,多项,嵌套,有序,秩序和刻板逻辑•多项概率•零膨胀和左截断计数模型•选择模型•边际效应•更多
14、选择模型
离散选择•等级排序备选方案•条件logit•多项式probit•嵌套logit•混合logit•面板数据•特定于案例和特定于备选方案的预测器•解释结果预期概率,协变量效应,跨备选方案的比较•更多
15、扩展回归模型(ERM)
内源性协变量•样本选择•非随机处理•小组数据•单独或组合出现问题•连续,区间删失,二元和有序结果•更多
16、广义线性模型(GLM)
十个链接函数•用户定义的链接•七个分布•ML和IRLS估计•九个方差估计•七个残差•更多
17、有限混合模型(FMM)
fmm:17个估算器的前缀•单个估算器的混合•混合多个估算器或分布的混合•连续,二元,计数,序数,分类,删失,截断和生存结果•更多
18、空间自回归模型
因变量,自变量和自回归误差的空间滞后•面板数据中的固定和随机效应•内生协变量•分析溢出效应•更多
19、ANOVA / MANOVA
平衡和不平衡设计•阶乘,嵌套和混合设计•重复测量•边际均值•对比•更多
20、确切的统计数据 精确逻辑和泊松回归•精确的病例对照统计•二项式检验•Fisher精确检验r×c表•更多
21、流行病学
标准化率•病例对照•队列•匹配病例对照•Mantel-Haenszel•药代动力学•ROC分析•ICD-10•更多
22、DSGE模型
以代数方式指定模型•求解模型•估计参数•识别诊断•策略和转换矩阵•IRF•动态预测•更多
23、测试,预测和效果
Wald检验•LR检验•线性和非线性组合•预测和广义预测•边际均值•最小二乘均值•调整均值•边际和部分效应•预测模型•Hausman检验•更多
24、对比,成对比较和边距
比较均值,截距或斜率•与参考类别,相邻类别,宏均值等进行比较。•正交多项式•多重比较调整•图形估计均值和对比•交互图•更多
25、简单的最大可能性 使用简单表达式指定可能性•无需编程•调查数据•标准,稳健,自举和重叠SE•矩阵估算器•更多
26、可编程最大似然
用户指定的功能•NR,DFP,BFGS,BHHH•OIM,OPG,强大,bootstrap和jackknife SE•Wald测试•调查数据•数字或分析衍生产品•更多
27、其他统计方
kappa衡量interrater协议•Cronbach的alpha•逐步回归•正常性测试•更多
28、功能
统计•随机数•数学•字符串•日期和时间•正则表达式•Unicode•更多
29、互联网功能
能够安装新命令•网络更新•网络文件共享•最新的新闻•更多
30、社区贡献的命令
搜索和下载数以千计的免费添加内容•发现期刊中的新功能•通过发布到SSC共享命令•讨论list上的社区贡献命令•更多
31、无障碍
第508条规定,残疾人无障碍
32、示例会话
适用于Mac,Unix或Windows的示例会话。
33、贝叶斯分析
数千种内置模型•单变量和多变量模型•线性和非线性模型•多级模型•连续,二进制,序数和计数结果•贝叶斯:46个估计命令的前缀•连续单变量,多变量和离散先验•添加自己的模型模型•多链•收敛诊断•后验总结•假设检验•模型拟合•模型比较•预测•更多
34、Meta分析
影响大小•常见,固定和随机影响•森林,漏斗和更多情节•亚组和累积分析•元回归•小研究影响•发表偏倚•更多
35、功率,精度和样本量
功效•样本量•效应量•最小可检测效果•CI宽度•平均值•比例•方差•相关性•方差分析•回归•群集随机设计•病例对照研究•队列研究•列联表•生存分析•平衡或不平衡设计•表格或图表中的结果•更多
36、治疗效果/因果推断
反向概率权重(IPW)•双重稳健方法•倾向得分匹配•回归调整•协变量匹配•多级治疗•内源性治疗•平均治疗效果(ATEs)•治疗后ATEs(ATETs)•潜在 - 结果均值(POMs) •连续,二元,计数,分数和生存结果•面板数据•更多
37、套索
套索•弹性网•模型选择•预测•推理•连续,二元和计数结果•交叉验证•自适应套索•双重选择•偏离•交叉拟合偏差•双机学习•内生协变•更多
38、SEM(结构方程模型)
图形路径图构建器•标准化和非标准化估计•修改指数•直接和间接影响•连续,二元,计数,序数和生存结果•多级模型•随机斜率和截距•因子分数,经验贝叶斯和其他预测•组和不变性测试•拟合优度•通过FIML处理MAR数据•相关数据•调查数据•更多
39、潜类分析
二元,序数,连续,计数,分类,分数和生存项目•为模型类成员添加协变量•与SEM路径模型相结合•预期类别比例•拟合度•类成员预测•更多
40、多重插补
9个单变量插补方法•多元正态插补•链式方程•探索缺失模式•管理插补数据集•拟合模型和池结果•变换参数•参数估计的联合测试•预测•更多
41、调查方法
多阶段设计•bootstrap,BRR,折刀,线性化和SDR方差估计•后分层•耙•校准•DEFF•预测余量•平均值,比例,比率,总数•汇总表•几乎所有估算器都支持•更多
42、聚类分析
层次聚类•kmeans和kmedian非层次聚类•树形图•停止规则•用户可扩展分析•更多
43、IRT(项目反应理论)
二元(1PL,2PL,3PL),序数和分类响应模型•项目特征曲线•测试特征曲线•项目信息功能•测试信息功能•多组模型•差异项功能(DIF)•更多
44、多变量方法
因子分析•主成分•判别分析•旋转•多维尺度•Procrustean分析•对应分析•双图•树状图•用户可扩展分析•更多
45、数据争论
数据转换•数据框•匹配合并•导入/导出数据•ODBC•SQL•Unicode•分组处理•附加文件•排序•行 - 列转置•标记•保存结果•更多
46、报告
可重现的报告•Word•Excel•PDF•HTML•动态文档•Markdown结果和图形•SVG•EPS•PNG•TIF•格式化文本和表格•更多
47、图像
线条•条形区域•区域•轮廓•置信区间•交互图•生存图•出版质量•定制任何内容•图形编辑器•更多
48、编程功能
添加新命令•脚本•面向对象编程•菜单和对话框编程•动态文档•Markdown•项目经理•Python集成•Java插件•C / C ++插件•更多
常见问题
stata17安装后打不开
这可能是在破解没有成功,而且还损坏了源文件,要解决这一问题需要重新下载安装。
推荐评语
好用的软件