际遇海洋 际遇海洋
热爱生活、创造生活、品位生活。
关注数: 52 粉丝数: 626 发帖数: 951 关注贴吧数: 57
初学者如何把面板数据导入到Stata中 对于Stata初学者而言,把面板数据顺利的导入到Stata中,过程是比较“艰辛”的!但是如果你能够迈过这个坎,那么你的Stata实际操作将有一个显著的提升,对于Stata的数据格式也会有更深的理解。要想把数据输入到Stata中,你首先要知道Stata是如何组织面板数据的。在Stata中,面板数据有两种格式——宽型(wide form)和长型(long form),这两种格式可以很方便地进行相互转换,通常使用的是长型数据。图1展示了这两种格式的数据,你可能不太明白什么意思,但下面我们会通过一个实际的例子来展示这两种数据格式。图2是一个实际的例子,列示了三家大银行的2007——2015年的部分财务数据,这样的数据安排是长型面板。我习惯在收集整理数据时,按照Stata要求的格式在Excel中先安排好数据格式(按照你的偏好或者安排数据的便捷程度,可以选择长型和宽型)。在此,我们以长型数据示例。假设你已经在Excel中组织好数据,个体(id)、时间(year)及其他变量都有了,下一步就是把这些数据导入到Stata中,此处以Stata14为例。启动软件后,顺次点击file>import>excel,依次选择文件路径等选项,确认之后,就可以看到如图3图4的结果。可以看到,汉字是红色标识的,这是“字符型”数据,其他数字是黑色的,是“数值型”数据,数值型数据可以进行数值运算和逻辑运算。如果你发现导入结果中有一列数字是红色的,比如图5中的ld变量。这时候你需要检查一下数据了,可能是Excel中的数据格式不对,这种情况下,使用destring命令可以将字符型数据转换为数值型数据, 但更多情况是原始数据有误,特别是手动输入数据时,更容易出错,检查一下可以发现,原始数据中有一个数多了一个小数点。此时,可以点击这个按钮,调整到数据编辑状态,进行修改(修改后还是红色,该怎么办呢???),也可以在Excel中修改原始数据,然后重新导入。完成以上的数据输入工作并检查无误之后,下一步可以定义面板数据了,输入如下命令: xtset id year(这里的个体和时间变量是我自己定义的),显示的结果如下。至此,我们就完成了面板数据的导入和定义,拥有了自己的面板数据,接下来就可以尽情“回归”了!(当然不要忘了各种检验) 以上是以长型面板数据为例展示数据导入和定义,那么宽型数据呢???利用reshape命令我们可以得到相应的宽型面板数据(请自行查看该命令的帮助文档!),至于结果什么样,请你自己动手操作一下看看结果吧!这里就有一份现成的数据!! 本帖隐藏的内容 工作簿1.xlsx (12.6 KB) 本帖隐藏的内容 lnw.xls (11 KB) Ps:有的同学可能数据量比较大,特别是手动搜集的数据,十分辛苦,觉得这样操作太慢!!!但我还是建议初学者按这个流程走一遍,在此过程中,你可能会接触到以下命令:sort drop order bysort gen destring append …… 注意:遇到问题,请多多使用百度搜索和论坛的搜索功能,基本上你遇到的问题以前也有人遇到,而各路大神已经给出了简洁高效的解决方案!!! 最后,祝大家都能尽快掌握Stata这一科研利器以上有不当之处,还请各位多多指教。
[书籍介绍] 计量经济学 计量经济学会杂志 免费下载 量经济学计量经济学会杂志促进经济 理论与统计和数学关系的国际社会 编辑:Guido W. Imbens • 印刷版 ISSN:0012-9682 • 在线 ISSN:1468-0262 家> 刊物> 计量经济学>即将发表的论文 即将发表的文章以下论文已被接受,并将出现在未来的 Econometrica 期刊中。下面的链接指向最终接受的工作论文格式的论文。这些论文将被编辑和排版以供出版。 连接到权力:政治联系、创新和企业动态 Akcigit、Ufuk、Salomé Baslandze 和 Francesca Lotti 看法 数据和程序 在线附录 错配与资本市场一体化:来自印度的证据 Bau、Natalie 和 Adrien Matray 看法 在线附录 数据和程序 帕累托改进税制改革和所得税抵免 Bierbrauer、Felix J.、Pierre C. Boyer 和 Emanuel Hansen 看法 数据和程序 在线附录 测试 Hurwicz 预期效用 Bleichrodt、Han、Simon Grant和 Jingni Yang 看法 数据和程序 在线附录 注意力是否得到优化?带宽增强实验的理论和证据 Bronchetti、Erin T.、Judd B. Kessler、Ellen B. Magenheim、Dmitry Taubinsky 和 Eric Zwick 看法 数据和程序 在线附录 实验说明 作为在线线性回归的综合控制 陈家峰 看法 约束条件力矩限制模型 Chernozhukov、Victor、Whitney K. Newey 和 Andres Santos 看法 数据和程序 在线附录 反事实敏感性和稳健性 克里斯滕森、蒂莫西和本杰明·康诺特 看法 数据和程序 在线附录 在线更正“社交媒体和抗议参与:来自俄罗斯的证据” Enikolopov、Ruben、Alexey Makarin和 Maria Petrova 看法 数据和程序 已知系数的大规模线性系统的推理 Fang、Zheng、Andres Santos、Azeem M. Shaikh 和 Alexander Torgovitsky 看法
正版Scrivener3真的超好用! 纠结了很久还是买的正版! 写作长文真的很不错,学习起来倒是有一些小难度。 总体来说,非常棒的软件hhh 总有小伙伴问我哪里买的,我还是推荐荔枝数码。 我把链接放一楼吧! 大家可以放心试一试 正版、而且价格比较亲民。 授权详情软件介绍 Scrivener 是一款老牌强大的长文写作工具,适合长期要进行小说、剧本、论文等长文写作的文字工作者,提供了围绕写作所需的各项创作资源。易于使用,支持 macOS 和 Windows 双平台。 除了写作,还是写作 作为各类作家和文字工作者的首选写作工具,包括小说家、编剧、学生、学者、律师、记者、翻译等在内的各行各业的作者都在使用 Scrivener 进行创作。不是解决如何写的问题,而是提供一个开始和持续写作所需的各项资源,你只需负责文字,Scrivener 会精巧地进行呈现。 用喜欢的方式撰写手稿 为长期写作项目量身打造的 Scrivener 可以用任意顺序撰写文本,无论大小,可按任意方式组织文字,随你喜好。 易于使用的项目大纲 在输入一个单词之前构思每一处细节,或者写下一篇新草稿并在稍后开始重组和整理,在 Scrivener 中,所有内容都集成在一个易于使用的项目大纲中。只需点击即可浏览稿件,拖放调整文字内容的顺序也无比简单。 参考资料,随手可达 不管是写一个基于照片的描述,还是转录采访,或者是 PDF 标注以及网页笔记,都能通过 Scrivener 的写作参考功能快速取用。 分享,准备就绪 一旦准备好与世界分享你的工作,Scrivener 能够将所有内容编译成单个文档,以便进行打印、自行发布或导出为诸如 Word 或 PDF 等流行格式分享给他人。 更多特性 根据标签颜色查看索引卡片,适用于跟踪不同的故事情节或其它任何内容; 使用书写统计 (Writing Statistics) 跟踪每天的写作情况; 自定义元数据允许你添加复选框、日期和列表框到检查工具和大纲中; 利用快速搜索工具迅速找到项目中的任何文档; 通过 Markdown 输出和自定义后期处理,丰富了对文本格式的支持; 支持 Mac 的 Touch Bar。 注册向导 当你收到授权邮件后,通过以下步骤使用你的授权激活软件 (以激活 Mac 版为例): 一、启动 Scrivener,依次点击菜单栏「帮助 > 购买 Scrivener」,在弹出的窗口中选择「Enter License」:二、在打开的激活窗口中,输入你的「授权码」及兑换授权码绑定的邮箱账户,确认无误后在联网情况下点击「激活」。
写作神器Scrivener! Scrivener是一款十分强大的写作软件,适用于Windows、Mac以及IOS。 它主要针对的目标群体是职业写作者,除了小说创作以外,也适用于剧本、杂文、评论、乃至学术论文等的写作。 不过,我最初接触这款软件的时候,目的还是想找一个好用的小说写作软件;因此,下面也会主要介绍我自己经常在小说写作中用到的一些功能。 P.S.Scrivener本身带有英文版的教程,内容十分详尽,可以自行学习。 首先介绍几个多数码字软件共有的基础功能。 一、目录树 作为一个专业的写作软件,Scrivener的目录功能十分强大、灵活。打开一个新工程后,会看到界面左侧的活页夹栏,或者说目录树。根目录可以自行增删文件夹(三个默认文件夹除外)。 活页夹的根目录默认有三个文件夹,分别是“草稿”“调查”和“垃圾桶”。 “草稿”和“调查”(research)很容易理解,前者用于放置写作的内容,后者则是放置搜集的资料。 二、全屏写作 全屏写作在各类写作软件中,是很常见的功能了。 全屏状态下,可以自行设置文本缩放、纸张位置(居中、左侧、右侧)、纸张宽度、背景浅淡。幕布(也就是背景)是可以更换的,但软件本身并没有自带幕布,需要自备图片。 在全屏状态下,软件默认开启打字机模式,也就是说,正在输入的那一行会自动放到屏幕中间,不必等打到屏幕底部的时候,内容一行行往上跳,颇为友好。 当然,非全屏状态下,也可以自行设置打字机滚动模式。 另外,全屏模式中直接使用关键字检索、检视器以及文档转跳功能,十分方便。 三、笔记功能 笼统地说,Scrivener的笔记有三种,分别是文档笔记、工程笔记和便笺本。1.文档笔记 文档笔记就是属于单个文档里面的,只能在所属文档中看到。 2.工程笔记 工程笔记则是属于整个工程的笔记。适用于放置当前工程常用的资料。 3.便笺本 便签本相当于一个活页笔记本,由Scrvener的所有工程共用。它的内容可以随时发送到任意工程的指定位置中。便笺本可以指定保存位置。这就意味着,便笺本完全可以作为工程以外、完全独立的资料夹使用了。 怎么理解呢——简单粗暴地说,“文档笔记”和“工程笔记”就是草稿纸旁边添的批注和便利贴,“便笺本”则是稿纸之外另外设置、随时调用的资料本。 四、其他 1.自动保存、自动备份 Scrivener的自动保存是在检测到用户无活动后,自动进行,因此基本不会影响正常操作。 此外,Scrivener还有自动备份功能,可以自行设置备份位置以及备份时间。可以将备份文件设置为ZIP格式,节省内存;还可以自行设置保留的备份文件数量,既可以保留所有备份,也可以“自动洗录”,仅保存最近的几个备份。Scrivener虽然并没有自带云空间,但只要将备份文档设置到网盘自动同步文件夹或者U盘里,同样能够减少意外丢稿的情况。 (暗搓搓地说一句,还不怕码字软件数据泄露呢……) 2.注释、注脚、评论 类似于Word的批注功能。 对于像我这种书到用时方恨少的文盲而言,批注功能真的是无法割舍——在疯狂飙文的时候,经常会有很多不确定或者不满意的地方,可一旦停下查资料,很容易就会打断本身思路,等查过资料之后再继续码字,往往就找不到原来的感觉了;但直接略过吧,说是回头再改,但要是没个批注的话,很可能回头就直接忘掉了,纠结。 这也是我在使用过很多码字软件之后,依然重回Word怀抱的主要原因之一。而Scrivener的批注功能,甚至比Word更方便好用。 Scrivener拥有内联注释、内联注脚、检视器注脚和评论四种功能。四种不同批注方式选择的批注方式不同,最终导出的效果也会有所不同。 这四种功能看起来略显繁琐,但事实上,用习惯之后,真会忍不住“666”起来。 而且,这四种批注方式的不同,使得写作完毕后、导出或编译文档时,显得十分方便。编译/导出时,可以自行选择十分显示注脚、评论、注解等。 除了上述的基础功能外,Scrivener自然有它的特殊之处。下面,我将简单介绍一些在小说写作中可能用到的功能。 一、文档分割或连续查看、编辑 1.文档分割查看、编辑 在编辑较长文本时,往往改了开头又要改结尾,改了结尾又要改中间,不说牵一发而动全身吧,但基本的首尾呼应还是需要的;又或者,在写作A文档时,往往还需要参照B、C、D文档。 Scrivener的屏幕分割就就能很好地适应写作者这种需要。 它既可以同时展示同一文档的不同部分(并且在一个编辑框中编辑时,内容实时体现在另一编辑框中)。左右编辑框显示的是同一文本的不同位置,也可以同时展示不同的文档。这里左右编辑框显示的是不同文本。 2.文档合并查看、编辑 Scrivener还可以在同一个编辑框里,连续查看多个连续或不连续的文档。 因此,即使将一个章节分开多个文档进行编辑,也不会由于需要转跳于多个文档之间而显得不方便。这里编辑框中显示的是《一、文档分割或连续查看编辑》这个文档下的所有子文档。虚线表示不同的文档。 3.文档的分割和合并 除了可以分割或合并查看外,Scrivener还可以直接将一个文档分割为多个文档,或者多个文档合并为一个文档。将《示例丙》分割成四个文档将《示例丙》和《示例丙-1》合并 二、强大的分类和搜索功能 1.分类功能 Scrivener中拥有多种分类方式,包括“标签”“状态”“关键字”“图标”等。标签可以自行增删,设置多种颜色标签颜色可以体现于活页夹、图标、索引卡以及大纲视图行状态则可以体现在索引卡上,也可以自行增删 。这里的水印“修订稿”就是文档的状态。关键字与标签类似,同样可以自行增删、设置颜色,并可以在索引卡和大纲上体现。索引卡右边的色块就是关键字的色块。 关键字功能与标签不同的是,我们既可以将同一关键字分配到多个文档,也可以在一个文档中添加多个关键字。 另外,比较有意思的是,活页夹(也就是目录)中的文档图标是可以自行更改的。注意小黑板图标 “标签”“图标”的分类,对我来说,最大作用在于使得目录树更为一目了然。将标签颜色体现在图标上,黄色是笔记,淡红色是章节,淡绿色是章节下的小节,淡蓝色是正文,橙色是示例。在这里可以看到,我将整篇文章分成了许多的小片段,但因为可以通过颜色对各层级的文档进行区分,因此并不显得凌乱。 直观、层次分明的目录树,再配合上Scrivener的多文档连续查看编辑功能,多层级、碎片式写作变得可能。 2.搜索功能 Scrivener搜索功能的强大之处在于,它能够根据实际需要,在不同元素中搜索所需内容。 它还可以直接将搜索结果制作成收集夹,便于查看。不仅如此,我们还以可以将某个关键字(或者某个元素)直接制作成收集夹,如此一来,只要某个文档增添该关键字,这个文档就会自动显示在此收集夹中。(关于收集夹功能的介绍,请看下一节) 三、灵活的收集夹功能 在写作过程中,不时会碰到一个挺令人尴尬纠结的问题,那就是一份资料往往需要用到不同的地方,即使已经安置在某个目录下,但它包含的内容很可能也涉及到目录树下的另一个分支。 ——比如说,我收集了一份“中医药膳”的资料,在归类的时候放到了“中医”目录下,但事实上,很有可能我写作“饮食”内容的时候,也会用到这份资料。 这时候,除了上面所提到的关键字功能以外,Scrivener的收集夹功能也可以一定程度上地解决这个问题;或者说,通过与关键字功能的相互辅助,更好地解决这个问题。 收集夹功能,就是可以让你在写作中随意地组合各种你需要的资料,或是随时增删收集夹、或是增删收集夹中的文档,而操作都不改变这些资料原本所在的位置。这个是新添加的收集夹四、索引卡和大纲功能 1.索引卡 软木板视图下,将可以看到所选文件夹下,所有文档的索引卡。 索引卡可以自行输入文档概要,方便对整个文档的调整和把控。也可以将任意文档的索引卡放置在软木板上。在软木板界面中,可以直接修改索引卡上的梗概和文档名。 2.大纲 大纲视图中,所选文件夹下的文档将会以列表的形式展示,便于查看各个文档下的子文档,并且可以很方便地看到它们的具体状态。大纲视图显示的项目可以自行设置。 可以说是十分一目了然了。 五、防错改、错删 写作中,错改、错删在所难免,有时一个手癌脑抽的,直接“保存并关闭”,那可真的是很想自挂东南枝了…… Scrivener的快照和垃圾桶功能都能很大程度上地避免这种状况发生。 1.快照 快照,顾名思义就是将文本当前状态保存下来,留待日后需要时进行回溯。真乃改稿狂魔之福音也! 2.垃圾桶 类似电脑系统的垃圾桶。删除文档后,只要不清理垃圾桶,被删除的文档是随时可以恢复的。自从用上Scrivener之后,真真由衷地感受到,只要软件够6,后悔药还是可以有的。 六、美中不足 当然,Scrivener也并非十全十美。 1.字数统计并不适用于中文写作 和多数码字软件一样,Scrivener也有统计字数的功能。但它的统计功能似乎只能适用于英语写作,因为在文档中,有空格分隔的才算是一个“字”,而空行也会被算作一个“字符”…… 这就导致了中文写作时,自带的字数统计功能基本没什么卵用。 可能就是不是很懂我们中文吧_(:з」∠)_ 2.没有中文数据库 这是相较于一些功能比较齐全的小说写作软件而言的。 现在许多码字软件都有润色功能,但对于Scrivener而言,显然是不存在的。虽然软件自带的查询功能(字典)、起名功能,但对于中文写作而言,显然并没有什么卵用。 不过呢,对我来说,尽管它有这样那样的不足,但总的来说,还是瑕不掩瑜,十分好使了。 这里只介绍了Scrivener中一些比较基础、常用的功能,还有更多功能可以自行摸索喔! 作者:fuso,来源:简书
SAS常用快捷键:学会快捷键,能更好的方便编程。这里列出了一 SAS常用快捷键: 学会快捷键,能更好的方便编程。 这里列出了一些学习SAS的基本快捷键,不全,只是常用的,tab、分屏、注释等。 欢迎各位论坛的大神补充,介绍。 【基本】 快捷键 作用 F1 Help 跳出帮助文件 F2 reshow F3 运行代码 F4 Recall 调回提交的代码,非增强型编辑器有效。 F6 Log 日志窗口 F7 Output 结果窗口 F8 zoom off; submit F9 keys 默认快捷键 Ctrl + B libref 显示数据逻辑库的目录 Ctrl + D Dir 显示数据逻辑库的目录 Ctrl + E Clear 清除当前窗口如output,log 【增强编辑器】 快捷键 作用 Alt + Ctrl + Number pad - 收缩代码块 Alt + Ctrl + Number pad + 扩展代码块 Ctrl + F1 执行最后一个记录中的宏 Ctrl + G 跳转行 Ctrl + Home 移动到文件首部 Ctrl + End 移动到文件尾部 【选择操作】 快捷键 作用 Ctrl + / 给选定代码加注释符号/**/ Ctrl + Shift + / 去除注释/**/ Ctrl + Shift + L 选定字母文本变小写 Ctrl + Shift + U 选定字母文本变大写 Tab 选定行tab(制表符) Shift + Tab 选定行取消tab 【窗口操作】 快捷键 作用 Shift + F5 层叠窗口 Shift + F4 纵向分屏窗口 Shift + F3 横向分屏窗口 Ctrl + Tab 激活下一个窗口 Ctrl + Shift + Tab 激活上一个窗口 PS:窗口操作和代码块熟悉的话,基本上可以脱离鼠标,快速键盘编程了。加上一个windows快捷键“alt”,可以锁定/解锁,“文件,编辑...”一栏。
使用SAS进行时间序列分析的过程,与其他软件区别甚微,主要是 使用SAS进行时间序列分析的过程,与其他软件区别甚微,主要是通过不同语句完成预分析、建模、报告过程,这个流程大体相同,唯一区别的地方是,SAS提供可供调整的参数很多,当然在SAS中,所借助的分析语句或过程是很多的。 调用许多不同的过程来处理这类问题也是SAS的一个特点,例如进行图形描述时,可以借助ARIMA模型本身的图形输出,也可以借助图形绘制过程的一系列语句(sgplot、graph、ods等)来完成相应图形的描述。 另外,建模过程与预测过程也是分开的,分别使用ARIMA(或AUTOREG等)、FORECAST来完成,那么在最终结果的输出中,往往还是需要其他图形来加以呈现(gplot等),并保存相应的数据以备后续分析。 所以可以看出SAS的时间序列分析,是依靠多个过程的整合,这可能是它的 “弊端”,显的很繁杂,尤其是有许多可调整优化的地方,往往令人头晕目眩,不过也正因此,这也更像它的优点,这样便于整合不同过程的信息,我们知道每个过程所提供的指标,整体来看,极大的非富了时间序列分析。 那么这个过程,其实就体现了SAS程序的特点——每个看起来很独立的语句,与其他语句都有千丝般的联系,最后看起来盘根错节,不过也许SAS用户能入门后,才能一窥全貌,体会到它的价值所在——几百种语句及其上万种选项的组合,真不知道还有什么做不了的。
SAS宏的基本知识 SAS宏功能1)可以降低重 SAS宏的基本知识 SAS宏功能 1)可以降低重复性任务的工作量,便于重复调用。例如:可以将宏文件永久存储,每次只需要调用相应的宏就可以完成分析,而无需重新运行。 2)使程序模块化,同时便于修改宏参数,而无需重新运行,可以大幅提高运行效率。 a、sas宏变量 1) 宏变量可以独立于data步.并可以在sas程序的任何地方定义(除数据行外); 2)%let语句定义宏变量,当引用宏变量时,使用&符号; 3)使用%str函数围住宏变量的值,使得在这个值内部的分号作为这个文本的部分,而不是%let语句的结束(macro_str例); 4)使用%put语句在log窗口显示宏变量的值(macro_var例) 5)sas/base中的自动宏变量,如:sysver, systime(给出sas程序或会话开始执行的时间),sas/stat中的宏程序可以拟合非线性多层模型,如%glimmix。 b、SAS宏 1)用%macro语句开始一个宏,同时给出这个宏的名字。如:%macro dsn; 用%mend语句结束一个宏,其后给出宏名字。如:%mend dsn; 2)放一个百分数符号(%)在宏名字的前面以调用一个宏,如%dsn c、宏参数 1)定义在一个%macro语句的宏名字后括号内的宏变量称为宏参数, 可以直接给出宏参数的值,也可以在调用这个宏时给出这些参数的值。 2)对参数分配的值只在这个宏执行时有效,而宏变量从用户创建直到SAS会话结束前都存在 %let m=class;*m为宏变量; data temp1; set sashelp.&m.; run; %macro sgplot(yvar=height,xvar=weight); *括号内为宏参数; proc sgplot data=temp1; reg y=&yvar. x=&xvar./group=sex clm cli; run; %mend sgplot; *sgplot为新定义的宏(表示proc sgplot的内容); *以下是调用宏,并修改宏参数,宏参数同样在括号内指定; %sgplot();quit; *未对宏参数做任何修改; %sgplot(xvar=age);quit; *指定x变量为年龄; %sgplot(yvar=age,xvar=height);quit; *分别指定变量x为年龄、y为身高。
EVIEWS的自画像! EViews 的核心是对象,对象是指有一定关系的信息或算子捆绑在一起供使用的单元,用 EViews工作就是使用不同的对象。对象都放置在对象集合中,其中工作文件(workfile)是最重要的对象集合。 一、建立新的工作文件 选择菜单File/New/workfile,则出现数据的频率对话框。可在 "Workfilefrequency"中选择数据的频率,可选的频率包括年度、半年、季度、月度、星期、天(每周5天、每周7天)以及非时间序列或不规则数据。 可在"Start date"文本框中输入起始日期,"End date"文本框中输入终止日期,年度与后面的数字用":"分隔。日期的表示法为:年度:二十世纪可用两位数,其余全用四位数字;半年:年后加1或2;季度:年后加1-4;月度:年后加1-12;星期:月/日/年;日:月/日/年;非时间序列或不规则数据:样本个数。 二、打开旧的工作文件 利用菜单File/open/workfile可打开已有的工作文件。 三、工作文件窗口 建立工作文件或打开旧的工作文件后可看到下面的工作文件窗口 四、保存工作文件 保存工作文件可选菜单File/Save或File/Save as在出现的WINDOWS标准对话框内选择文件要保存的目录及文件名。 五、设置默认路径 打开EViews 文件对话框开始都显示默认路径下的内容。可以通过两种方法改变默认路径,一是选择对话框下端的Update default directory即可使当前目录成为默认路径;二是在命令窗口键入CD后面跟着目录名也可使该目录成为默认路径。 六、引用TSP文件 EViews能以与MicroTsp相容的方式读入和储存工作文件。 七、重置工作文件范围 为了改变工作文件的范围区间,可选择Procs/Change workfile Range 然后输入新的起始日期和终止日期。也可通过双击工作文件目录中的Range来改变工作文件范围。 八、工作文件排序 工作文件中的基础数据是保存在序列对象(Series)中的。通过单击菜单Procs/Sortseries,可以把工作文件中的所有序列以序列中的数据值大小排序。 九、显示限制 当工作文件中包含很多对象时,工作文件窗口就会显得很乱。可以用显示限制(Filter)来限制窗口中所显示的对象。对象类型和对象名称可作为限制条件。该窗口分为两部分。在编辑区域(空白部分)可以设置限制条件,其中可以使用通配符 "*"和"?"比如X*,??Y*;在Include中可以选择工作文件窗口中显示的对象的类型。 十、大小写转换 菜单View/Name Display可以实现大小写转换。 十一、显示方式 通过View/Display Comments(Label + -)可以在标准显示方式和详细显示方式之间切换。 十二、抽出新的工作文件 可以从一个工作文件窗口直接抽出另一个新的工作文件窗口,选择Procs/Extract to new workfile或双击工作文件窗口上的Filter会出现下面的窗口 §3.2 对象基础 EViews中的信息是储存在对象中的。每个对象都包含与一个特定分析领域有关的信息。与每类对象相关联的是一系列视图(Views)和过程(Procedure),它们和对象中的信息一起使用。这种视窗、过程与对象中的数据的相关联被称为是面向对象的EViews 设计。 一、对象中的数据 不同对象包含着多种不同的信息,比如说序列对象、矩阵对象、向量对象等主要包含数值方面的信息;方程对象和系统对象包含方程或系统的完整的信息,除了包含用来做估计的数据外,还包含估计的结果的信息;图对象和表对象包含数值的、文本的和格式的信息。 二、对象视图 不同的对象有不同的视图。序列对象有图表视图(察看原始数据)、线性坐标视图、柱状坐标视图、直方统计视图、相关视图、分布散点视图、QQ散点视图、核密度图。利用序列的视图还可以进行简单的假设检验和统计分析。 三、对象过程 许多 EViews对象还包括过程(Procedure)。与视图一样的是,过程通常以图表或坐标的形式显示在对象窗口中;与视图不同的是,过程改变数据,无论对象本身中的还是其他对象中的。很多过程还创建新的对象。比如说序列对象含有进行平滑与季节调整的过程,该过程可以创建一个新的含有平滑以及调整后的数据的序列。方程对象的过程可以建立新的序列来包含残差、拟合值、以及预测。可以用EViews 主菜单上的 "Procs"或对象窗口工具栏上的"Procs"来选择过程。 四、对象类型 除了序列对象和方程对象外还有许多其他类型的对象,每种对象在对象集合中都有一个特定的图标表示。对象集合虽然也是对象但对象集合没有图标,因此工作文件和数据库不能放在其他的工作文件或数据库中。 五、建立对象 在建立对象之前必须打开工作文件集合而且工作文件窗口必须是激活的。然后选择主菜单上的 "Objects/New Object"将会出现工作文件集合窗口。在"Type of Object"中选择新建对象的类型,在"Name for Object"中输入对象名。 六、选择对象 单击工作文件窗口中的对象图标即可选定对象,也可通过 EViews 主窗口或工作文件窗口上的 "View"菜单来选定对象,该菜单包括"Deselect All"(取消所有选定),"Select all"(选定所有对象),"Select by Filter"(限制条件选定)。 七、打开对象 可以通过双击或菜单 "View/Open as One Window"打开选定的对象。打开单个对象会出现对象窗口,打开选定的多个对象则会建立新的对象或把各个对象在各自相应的窗口打开。 八、显示对象 选择并打开对象的另一种方法是使用主菜单上的"Quick/Show"工作文件窗口中的"Show"。假如在对话框中输入单个对象的名字就会打开该对象窗口;如果输入多个对象的名字,EViews会打开一个窗口显示结果在必要的时候还会创建一个新的对象。 九、对象窗口工具条 每个对象窗口都有一个工具条,不同对象的工具条的内容也不相同,但是有些按扭是相同的。"View"按钮用来改变对象窗口的视图形式;"Procs"按钮可以用来执行对象的过程;"Objects"按钮可以储存、命名、复制、删除、打印对象;"Print"按钮打印单前对象的视图;"Name"按钮允许你命名或更改对象的名字;"Freeze"按钮可以以当前视图为准建立新的图形对象、表格对象或文本对象。 十、对象命名 对象窗口工具条中的"Name"可以给对象命名,其中"Display Name"是对象在图形或表格中显示的名字。如果要重命名对象可选择"Objects/Rename Selected"。序列对象不能用下面的名称:ABS, ACOS, AR, ASIN, C, CON, CNORM, COEF,COS, D, DLOG, DNORM, ELSE, ENDIF, EXP, LOG, LOGIT, LPT1, LPT2, MA,NA, NRND, PDL, RESID, RND, SAR, SIN, SMA, SQR, THEN 十一、对象标签 对象标签可以显示更详细的对象信息,可通过对象窗口中的"View/Label"打开下面窗口: 十二、对象复制 通过 "Objects/Copy selected"可以把选定的对象拷贝到当前工作文件指定的对象中,若工作文件中没有该目标对象则创建一个新的对象;要想实现不同工作文件之间对象的复制可选主菜单上的"Edit/copy"从原工作文件中复制对象,然后打开目标工作文件选择主菜单上的"Edit/paste"。也可以通过单击右键使用"Copy""paste"完成工作文件间复制。 十三、冻结对象 另一种复制对象中信息的方法是冻结对象。选择菜单 "Object/Freeze Output"或"Freeze"钮冻结对象。冻结对象是把对象当前视图以快照的方式保存在一个新的对象中。 十四、删除对象 "Objects/Delete selected"或"Delete"可以删除选定的对象。 十五、打印对象 可以通过对象窗口中的 "Objects/print"或"Print"打印选定的对象。 十六、储存对象 可以通过 "Objects/Store selected to DB"或对应窗口中的"Objects/Store toDB"储存选定的对象到对象文件(扩展名为*.db)或数据库中。利用 "Objects/Fetch from DB"从对象文件或数据库中提取存储的对象。 十八、更新对象 利用 "Objects/Update from DB"从对象文件或数据库中提取存储的对象用以更新当前对象。 §3.3 命令 可以用命令方式建立工作文件。在命令窗口键入Workfile test1可以建立名为test1的工作文件。也可以用命令保存工作文件。例如:Save test2为保存工作文件test2的命令。
谈谈对计量经济学的认识……… 一.计量经济学的介绍   计量经济学是以一定的经济理论和统计资料为基础,运用数学、统计学方法与电脑技术,以建立经济计量模型为主要手段,定量分析研究具有随机性特性的经济变量关系。主要内容包括理论计量经济学和应用经济计量学。   理论经济计量学主要研究如何运用、改造和发展数理统计的方法,使之成为随机经济关系测定的特殊方法。应用计量经济学是在一定的经济理论的指导下,以反映事实的统计数据为依据,用经济计量方法研究经济数学模型的实用化或探索实证经济规律。 二.计量经济学的起源和发展   据说在经济学中,应用数学方法的历史可追溯到三百多年前的英国古典政治经济学的创始人威廉·配第的《政治算术》的问世(1676年)。    “计量经济学”一词,是挪威经济学家弗里希(R. Frisch)在1926年仿照“生物计量学”一词提出的。随后1930年成立了国际计量经济学学会,在1933年创办了《计量经济学》杂志。   人们应如何理解“计量经济学”的含义?弗里希在《计量经济学》的创刊词中说到:“用数学方法探讨经济学可以从好几个方面着手,但任何一方面都不能与计量经济学混为一谈。计量经济学与经济统计学决非一码事;它也不同于我们所说的一般经济理论,尽管经济理论大部分都具有一定的数量特征;计量经济学也不应视为数学应用于经济学的同义语。经验表明,统计学、经济理论和数学这三者对于真正了解现代经济生活中的数量关系来说,都是必要的,但各自并非是充分条件。而三者结合起来,就有力量,这种结合便构成了计量经济学。”   后来美国著名计量经济学家克莱因也认为:计量经济学是数学、统计技术和经济分析的综合。也可以说,计量经济学不仅是指对经济现象加以测量,而且表明是根据一定的经济理论进行计量的意思。   计量经济学从诞生之日起,就显示了极强的生命力,经过20世纪40、50年代的大发展和60年代的大扩张,以及70年代以来现代计量经济学理论方法的研究与应用,它已经在经济学科中占据极重要的地位。正如著名计量经济学家、诺贝尔经济学奖获得者克莱因所评价的,“计量经济学已经在经济学科中居于最重要的地位”,“在大多数大学和学院中,计量经济学的讲授已经成为经济学课程表中最有权威的一部分”。著名经济学家、诺贝尔经济学奖获得者萨谬尔森甚至说,“第二次世界大战后的经济学是计量经济学的时代”。   计量经济学是经济学的一个分支学科,是以揭示经济活动中客观存在的数量关系为内容的分支学科。第一届诺贝尔经济学奖获得者、计量经济学的创始人、挪威经济学家弗里希将它定义为经济理论、经济统计学和数学三者的结合。   在中国,20世纪70年代末80年代初以来,计量经济学得到了迅速的传播与广泛的应用。目前,它对于经济、管理学科的学生以及经济管理工作者的重要性,已经不言而喻。 三.计量经济学的应用和意义   计量经济学是专门研究经济范畴的数量特征、数量关系和数量变动规律的经济学,同时,计量经济学又是一门研究经济问题的方法论和方法学科。计量经济学通过把经济理论具体化、数量化,使人们能够更深刻地理解和掌握经济规律,更好地按客观规律办事;通过经济数学模型和方法的研制和开发,获得经济发展的数量表现、数量关系和数量变化的信息,为制定宏观经济政策与国家经济发展计划提供了可靠的依据,也为微观经济主体经营管理的现代化提供了有力的支持。由于计量经济学要用数学方法把经济理论表述为方程体系,再用数理统计方法进行估算,所以又常常被说成是经济学、数学和统计学的结合。 尽管人们对计量经济学到底是一门学科、是一种学派还是一个分支仍然存在着巨大的争议,但是,这丝毫不影响计量经济学在经济学中的重要地位和重要作用,也并不妨碍计量经济学家同样受到人们的尊敬。   (一)计量经济学的应用   计量经济学的基础是一整套建立在数理统计理论上的计量方法,属于计量经济学的“硬件”,计量经济学的主要用途或目的主要有两个方面:   理论检验。这是计量经济学用途最为主要的和可靠的方面。这也是计量经济学本身的一个主要内容。   预测应用。从理论研究和方法的最终目的看,预测(包括政策评价)当然是计量经济学最终任务,必须注意学习和了解,但其预测的可靠性或有效性是我们应十分注意的。   经过几十年的迅猛发展,几代大师们的开创性研究,计量经济学早已不再是数理统计在经济学领域的简单应用。计量经济学针对它所研究对象的独特性,不断开创出新的理论和方法,如广义矩估计、协整分析、高频数据处理等,不仅拓展和丰富了统计学的研究范式和领域,也带给人们对于身处其中的经济社会的全新认识。如今,计量经济学与微观经济学、宏观经济学一起构成了现代经济学的三大核心。此外,计量经济学对社会学、政治学乃至历史等人文科学的研究也产生了深远的影响,这些学科的研究也越来越多地借鉴和使用计量经济学的分析工具。   (二)计量经济学的重要性  人所共知,首届(1969年)诺贝尔经济学奖就授予了有“计量经济学奠基人”之称的挪威经济学家拉格纳·弗里希和有“计量经济模式建造者之父”的荷兰经济学家简·丁伯根。随后,又有多位与计量经济学有关的经济学家获得了诺贝尔经济学奖。特别是,在最近4年内,诺贝尔经济学奖两次授予计量经济学的分支学科,上一次是赫克曼(JamesJ.Heckman)和麦克法登(DanielL.MacFaddan)因为对横截面数据的分析方法作出了杰出贡献而获得2000年度诺贝尔经济学奖。这都说明计量经济学“技术层面”的研究工作越来越得到广泛的认可和高度的重视,经济科学日益朝着用数学表达经济内容和统计定量的方向发展。同时,这也在一定程度上意味着,诺贝尔经济学奖正变得越来越注重“技术层面”的突破和实际应用。当然,这也会极大地促进计量经济学本身的进一步发展和计量经济学更加广泛的应用。   “计量经济学的定义大家都是非常熟悉的”这句话是它的创始人R.Frish在1933年创刊时所说的一句话,它主要讲的是研究经济问题,经济理论、数学、统计学都是必要的,但是只有把这三者结合起来,才能形成力量。这三者的结合过程称为计量经济学。现在一般把经济理论、经济统计学和数学的结合统称为计量经济学。诺贝尔奖从1969年设立以后,有50多位学者获得奖项,获奖人涵盖了经济学和管理学的几个分支,粗劣的统计一下哪个经济学项获奖的人数最多呢?实际上是计量经济学。另外值得注意的就是在这50多位获奖者当中有一些教授虽然不是因为计量经济学方面的贡献而获奖,但是他们本身都是很著名的计量经济学家,很多人都担任过世界计量经济学会的会长。世界上没有经济学会但是有一个计量经济学会。另外有很多获奖者,包括大家很熟悉的金融领域的诺贝尔获奖者,他们在取得获奖成果的过程当中,毫不例外地运用了计量经济学的方法,所以也可以说他们都是计量经济学家,或者说如果没有计量经济学,他们也很难完成他们的获奖成果。   (三)计量经济学在我国的发展  学界长期以来一直都面临一种争论:中国的经济学到底是一个什么主义的经济学,是马克思主义经济学?还是指导市场运行的西方经济学?这个争论是目前最激烈的一个问题。但是我们发现教计量经济学的老师心里最踏实。为什么呢?这个争论似乎跟他们没有太大的关系,因为不管是主张马克思主义政治经济学是主流经济学的人,还是主张西方经济学是主流经济学的人都不反对学习计量经济学。任何一个科学研究都须要经过这么几个阶段:首先要进行观察,观察的现象都是偶然的,然后在偶然和个别现象的基础上可能要提出假设,这就是所谓的理论和模型。最后必须要经过检验,理论和模型要经过检验,检验如果成立了,通过了,就说明模型和检验的理论成立了。检验有各种方法:工科有实验的检验,但在计量经济学领域中回归预测就是一种检验,计量经济学正是检验理论和检验假设的一种重要的方法。  1998年7月,教育部高等学校经济学学科教学指导委员会讨论并确定了高等学校经济学门类各专业的8门共同核心课程,其中就包括《计量经济学》。但是,由于计量经济学教科书中充满着数学,而中国传统上对经济、管理学科的数学基础未予重视,将它们纳入“文科”范围,导致在许多学校出现了该课程“教师难教、学生难学”的两难境地。   研究领域,在目前我们国内的情况是理论研究很少而且国内经济研究发表的文章,关于理论方法的研究几乎是零,大多数研究是关于应用研究方面的。目前我们国内对于现代计量经济学的理论方法基本上处于在学习、跟踪阶段,暂时还没有能力去发展自己新的理论方法。 四.学习感受   最后谈谈个人学习计量经济学的感受和体会。总体来说,计量经济学还是比较难的,其中需要很好的数学基础、统计基础和自己的分析思考能力,以及良好的计量软件应用能力。但是,另外一个最大的体会,是计量经济学的重要性。在目前的学术现状下,要求研究者必须掌握计量的研究方法,这是实证研究最好的工具。用计量的工具,我们才能够把经济现象肢解开来,找到其中的脉络,进而分析得更加清晰。
多重共线性的解决办法!! (一)删除不重要的自变量 自变量之间存在共线性,说明自变量所提供的信息是重叠的,可以删除不重要的自变量减少重复信息。但从模型中删去自变量时应该注意:从实际经济分析确定为相对不重要并从偏相关系数检验证实为共线性原因的那些变量中删除。如果删除不当,会产生模型设定误差,造成参数估计严重有偏的后果。 (二)追加样本信息(不过实际操作中,这个方法实现率不高) 多重共线性问题的实质是样本信息的不充分而导致模型参数的不能精确估计,因此追加样本信息是解决该问题的一条有效途径。但是,由于资料收集及调查的困难,要追加样本信息在实践中有时并不容易。 (三)利用非样本先验信息 非样本先验信息主要来自经济理论分析和经验认识。充分利用这些先验的信息,往往有助于解决多重共线性问题。 (四)改变解释变量的形式 改变解释变量的形式是解决多重共线性的一种简易方法,例如对于横截面数据采用相对数变量,对于时间序列数据采用增量型变量。 (五)逐步回归法(此法最常用的,也最有效) 逐步回归(Stepwise Regression)是一种常用的消除多重共线性、选取“最优”回归方程的方法。其做法是将逐个引入自变量,引入的条件是该自变量经F检验是显著的,每引入一个自变量后,对已选入的变量进行逐个检验,如果原来引入的变量由于后面变量的引入而变得不再显著,那么就将其剔除。引入一个变量或从回归方程中剔除一个变量,为逐步回归的一步,每一步都要进行F 检验,以确保每次引入新变量之前回归方程中只包含显著的变量。这个过程反复进行,直到既没有不显著的自变量选入回归方程,也没有显著自变量从回归方程中剔除为止。 (六)可以做主成分回归 主成分分析法作为多元统计分析的一种常用方法在处理多变量问题时具有其一定的优越性,其降维的优势是明显的,主成分回归方法对于一般的多重共线性问题还是适用的,尤其是对共线性较强的变量之间。当采取主成分提取了新的变量后,往往这些变量间的组内差异小而组间差异大,起到了消除共线性的问题。
stata自学常用网络资源 1、UCLA网站,上面有许多例子,常见问题解答FAQ,一些教科书上例子用Stata,SAS等软件实现等。 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fstats.idre.ucla.edu%2Fstata%2F&urlrefer=89733a64dd7d07392d7014b31b172d21 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fstats.idre.ucla.edu%2Fstata%2Fwebbooks%2Freg%2F&urlrefer=dc16abd788e78fc0a6912d16cbc97d3b 专门的回归分析的例子 2、princeton网站:有例子,讲义等等 http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fwww.princeton.edu%2F~otorres%2FStata%2F&urlrefer=6c06b4cc4fb8507a9f9db6e4778a51f2 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fdss.princeton.edu%2Fonline_help%2Fstats_packages%2Fstata%2F&urlrefer=fabe699618555482bc76b379f0423245 http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fwww.princeton.edu%2F~otorres%2FRegression101.pdf&urlrefer=b57406f32ea7f78cc0c45b691c829a7a http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fwww.princeton.edu%2F~otorres%2FPanel101.pdf&urlrefer=0b65a1b97cbeb5c8082533d8210eba37 http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fwww.princeton.edu%2F~otorres%2FTS101.pdf&urlrefer=02b175302a5ada4a7061056dc0ea681e http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fwww.princeton.edu%2F~otorres%2FLogit.pdf&urlrefer=fdc51a8f8f9450cc487bd3eff3286cf9 http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fwww.princeton.edu%2F~otorres%2FDID101.pdf&urlrefer=4d3e5dfa5193bdc85610f4f128c22b97 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fdss.princeton.edu%2Fonline_help%2Fstats_packages%2Fstata%2Feventstudy.html&urlrefer=fb606121fe6fc7ed16a6b2d736cedf4e eventstudy的例子 还有其他,大家可以在上面找到 3、Stata小抄,总结的常用的命令:Stata cheat sheets 可以下载pdf的 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fgeocenter.github.io%2FStataTraining%2Fportfolio%2F01_resource%2F&urlrefer=c311a22c331a2fbff520fd23044360c6 4、surveydesign:上面有Stata作图的例子,这些图形是一些复杂的图形。 都有专门的程序,可以安装,拷贝执行。 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fwww.surveydesign.com.au%2Ftipsgraphs.html&urlrefer=17034bc4ce4f10a11511553b8e408f13 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fwww.surveydesign.com.au%2Ftips.html&urlrefer=9f78ad3d48d38ff50e1831b42a3aa2f3
黄老师的经验分享之:sepscatter 应用 我昨天询问 Nick Cox (Editor of Stata Journal) 有关 -sepscatter- 指令可否加入配适线,感谢他的回复,已经增加此功能。 // http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fwww.statalist.org%2Fforums%2Fforum%2Fgeneral-stata-discussion%2Fgeneral%2F3803-sepscatter-available-from-ssc&urlrefer=a340c52d12eeb35c5f68f9a29d2770c1 *! 1.1.0 NJC 5 December 2018 *! 1.0.2 NJC 9 May 2014 *! 1.0.1 NJC 8 May 2014 *! 1.0.0 NJC 29 April 2014 program sepscatter version 9 capture syntax anything [if] [in] [aweight fweight pweight] /// , seperate(varname) [ * ] if _rc == 0 { noisily di _n "note: sep" as err "a" as txt "rate() is correct spelling" local 0 `anything' `if' `in' [`weight' `exp'] /// , separate(`seperate') `options' } syntax varlist(numeric min=2 max=2) [if] [in] /// [aweight fweight pweight] , SEParate(varname) /// [MYLAbel(varname) MYNUmeric(varname) MISSing addplot(str asis) *] capture noisily { quietly { if "`mylabel'" != "" & "`mynumeric'" != "" { di as err "choose mylabel() or mynumeric()" exit 198 } tokenize `varlist' args y x marksample touse if "`missing'" == "" markout `touse' `separate', strok count if `touse' if r(N) == 0 exit 2000 tempname stub separate `y' if `touse', `missing' by(`separate') /// gen(`stub') veryshortlabel local Y `r(varlist)' local nY : word count `Y' } local ytitle : var label `y' if `"`ytitle'"' == "" local ytitle "`y'" if "`mylabel'`mynumeric'" != "" { if "`mynumeric'" != "" { if "`: value label `mynumeric''" != "" { tempvar mylabel gen `mylabel' = `mynumeric' } else local mylabel `mynumeric' } local mylabel : di _dup(`nY') "`mylabel' " local mypos : di _dup(`nY') "0 " local mynone : di _dup(`nY') "none " local mylabel /// ms(`mynone') mla(`mylabel') mlabpos(`mypos') legend(off) } scatter `Y' `x' if `touse' [`weight' `exp'], /// ytitle(`"`ytitle'"') ms(Oh plus X Th Sh Dh) `mylabel' /// `options' || `addplot' } drop `Y' end sysuse auto, clear sepscatter mpg weight , sep(foreign) mc(red blue) addplot(qfit mpg weight if !foreign, lc(red) || qfit mpg weight if foreign, lc(blue)) legend(order(1 2))
(转)Stata 十大 (类) 外.挂指令 Stata 十大 (类) 外挂指令 (to be added/revised) : 回归 (控制多重固定效应并允许多重聚类):(iv)reghdfe (linear regression absorbing multiple levels of fixed effects, allowingtwo- and multi-way clustering) 回归 (工具变量):(xt)ivreg2 (Extendedinstrumental variables/2SLS, GMM and AC/HAC, LIML and k-class regression) 分组统计量与回归 (一般人回归时资料处理或变量建立,你想的到与你想不到的都可以做)a . rangestat/rangerun(Generatestatistics using observations within range/Run Stata commands onobservations within range) b. asreg/asrol(Rolling window regressions and by(group) regressions/Generatesrolling-window/groups descriptive statistics) (允许非典型) 分组统计量与回归:runby -- Run Stata commands on by-groupsof observations (让所有指令都可 byable) 缺失值之处理与填补:mipolate (Interpolate/extrapolate values) 图形:tabplot/catplot, coefplot. 时间变量转换: a. numdate -- Generate numeric date-time variable b. convdate-- Convert numeric date-time variable, generating variable of another date-timetype c. extrdate-- Generate date or time component from date-time variable 各种结果之汇整 (word/excel,各有优缺点): a. outreg2 -- Arrange regression, summary, andtabulation into an illustrative table (我较熟悉常用) b. estout/esttab-- Making regression tables from stored estimates (唯一适合在讲义中编制表格) c. asdoc-- An easy way of creating publication quality tables from Stata commands (特别是high-dimensional correlation matrix,我对作者建议的,呵呵) d. sum2docxcorr2docx -- Report summary statistics and Pearson&Spearman coefficient ofcorrelation to formatted table in DOCXfile (很方便使用) 我的讲义编排: texdoc -- Create a LaTeX document including Stata output
用stata生成空间权重的步骤和操作 以下都用中国的例子 (一)得到数据库文件和坐标文件 1.之所以这一步是由于在实际分析中会删除个别省份,然后基于剩余省份制作shp文件后生成空间权重文件。找到中国地图省级、省会城市、城市、县的dbf和shp文件,注意:各级地图的dbf和shp文件的名称必须相同且是英文,如province.dbf和province.shp,provcap.dbf和provcap.shp等2.在stata中安装spmap、shp2dta和mif2dta命令是ssc install spmap\ shp2dta\mif2dta 3.在指定目录下,运行命令shp2dta using ProCap, data("ProCap_data") coor("ProCap_coordinates"),其中下划线部分分别是使用的数据库和坐标名称,转换后的数据库和坐标文件名称,然后用命令 merge ID using procap_coordinates,将文件复制到txt文档中编辑成符合geoda格式(第一行写上截面单位数和变量数,第二行是变量名称,用英文下双引号引起,用逗号隔开,剩下行是观测值也要用逗号隔开,当然可以先在excel中编辑再拷过来)然后打开geoda~tools~shape~points from ascii,主要设置位置,然后保存为shp文件,最后基于此文件生成空间权重矩阵,当然质点文件只能生成knearest和threshold distance距离权重。 (二)如果用geoda生成了权重数据,那么可以通过以下方法转换成stata文件 1.用geoda生成不同类型的权重文件,比如province_knear.gwt,打开另存为http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fprovince_knear.txt&urlrefer=70b2932635137bafb672bdb05d1bf19c 2.用记事本打开后复制出来或者在stata中输入命令insheet using province_knear.txt,删除关键词,保留位置变量和邻近数量变量,并重命名为v1和v2,并另存为http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fspweight3.dta&urlrefer=dfd28209df851a0e09cd8a69233f8790 3.在stata中安装spweightxt命令 4.输入命令 clear all sysuse spweight3.dta, clear list v1 v2 spweightxt v1 v2 , panel(34) time(8) matrix(W) eigw table 就可以生成中国34个省份观测单位8年的权重指标了。 注意:其中panel()项可以设置你要生成的权重观测单位数一般与原始文件一致,如果想减少几个省份,则先在原始文件减少,time()设置生成时间的维数,一般空间面板数据用的上。然后生成的权重数据分为横截面和面板类型分别保存在 Cross Section Weight Matrix File (Wcs.dta)和 Panel Weight Matrix File (Wxt.dta)中要查看只需输入 use Wcs.dta,clear 或者use http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2FWxt.dta&urlrefer=2f7be2281c579e0e78309447f2a8342c ,clear即可 (三)空间面板回归 主要说gmm估计 命令是 spgmmxt y x1 x2 , nc(7) wmfile(SPWxt) gmm(1) mfx(lin) test 暂时就说这么多,有空了再写详细点,主要想把在STATA中如何进行空间面板的操作写一下!
SPSS数据分析心得小结_数据分析心得分享 SPSS数据分析心得小结_数据分析心得分享 学习数据分析之spss分析工具,可真的不是一般的功夫,真的要很认真和很细心才能做得好spss。下面我来和大家分享一下关于SPSS数据分析心得小结,希望大家从这数据分析心得分享中能得到一些启示和指导。 心得1:拿到一份数据,或者在看到国内外某个学者的文章有想法而自己手里的数据刚好符合这个想法可以做时,在整理好数据后不要急于建模。一定要对数据做缺失值处理、异常值处理。在数据预处理的基础上再进一步建模,否则可能得到错误的结果。 心得2:承接心得1,数据预处理怎么做。一是缺失值的处理。我个人有几个看法:一是数据样本量足够大,在删除缺失值样本的情况下不影响估计总体情况,可考虑删除缺失值;二是数据样本量本身不大的情况下,可从以下两点考虑:1是采用缺失值替换,SPSS中具体操作为“转换”菜单下的“替换缺失值”功能,里面有5种替换的方法。若数据样本量不大,同质性比较强,可考虑总体均值替换方法,如数据来自不同的总体(如我做农户调研不同村的数据),可考虑以一个小总体的均值作为替换(如我以一个村的均值替换缺失值)。2是根据原始问卷结合客观实际自行推断估计一个缺失值的样本值,或者以一个类似家庭的值补充缺失值。 心得3:承接心得1,数据预处理第二点异常值的处理。我大概学了两门统计软件SPSS和Stata,SPSS用的时间久些,熟悉一下,Stata最近才学,不是太熟。关于这点我结合着来说。关于异常值的处理可分为两点,一是怎么判定一个值是异常值,二是怎么去处理。判定异常值的方法我个人认为常用的有两点:1是描述性统计分析,看均值、标准差和最大最小值。一般情况下,若标准差远远大于均值,可粗略判定数据存在异常值。2是通过做指标的箱图判定,箱图上加“*”的个案即为异常个案。发现了异常值,接下来说怎么处理的问题。大概有三种方法:一是正偏态分布数据取对数处理。我做农户微观实证研究,很多时候得到的数据(如收入)都有很大的异常值,数据呈正偏态分布,这种我一般是取对数处理数据。若原始数据中还有0,取对数ln(0)没意义,我就取ln(x+1)处理;二是样本量足够大删除异常值样本;三是从stata里学到的,对数据做结尾或者缩尾处理。这里的结尾处理其实就是同第二个方法,在样本量足够大的情况下删除首尾1%-5%的样本。缩尾指的是人为改变异常值大小。如有一组数据,均值为50,存在几个异常值,都是500多(我这么说有点夸张,大概是这个意思),缩尾处理就是将这几个500多的数据人为改为均值+3标准差左右数据大小,如改为100。总结而言,我个人认为做数据变换的方式比较好,数据变换后再做图或描述性统计看数据分布情况,再剔除个别极端异常值。 心得4:如何做好回归分析。经过多次实战,以及看了N多视频,上了N多课,看了N多专业的书。我个人总结做回归的步奏如下:1是承接心得1-3,对数据进行预处理,替换缺失值和处理异常值;2是将单个自变量分别与因变量做散点图和做回归,判定其趋势,并做好记录(尤其是系数正负号,要特别记录);3是自变量和因变量一起做相关系数,看各个变量相关关系强弱,为下一步检验多重共线性做准备;4是自变量多重共线性诊断。若变量存在多重共线性,可采用主成分回归,即先将存在多重共线性的变量做主成分分析合并为1个变量,然后再将合并成的新变量和其余自变量一起纳入模型做回归;5是做残差图,看残差图分布是否均匀(一般在+-3个单位之间均匀分布就比较好);6是报告相应结果。 心得5:看到论坛上有网友问为什么他(她)老师不建议采用后向步进法处理变量多重共线性。记得张文彤老师说过他有个同学做过一个研究,即采用后向步进法剔除变量的方式去做回归,得到的结果犯错的几率比较大。张老师也不建议用这个方法处理多重共线性。处理多重共线性比较好的方法是做主成分回归。 心得6:有个朋友问我在报到回归结果时用未标准化的回归系数好,还是用标准化后的回归系数好。我个人觉得这个问题仁者见仁智者见智,要看想表达什么。具体而言,如果想表达在其它条件不变的情况下,自变量X每变化1个单位,因变量变化多少个单位,这种情况用未标准化回归系数就好;如果想比较各个自变量对因变量影响的相对大小,即判断相对而言,哪个变量对因变量影响更大。这时需要消除量纲的影响,看标准化后的回归系数。 心得7:这是投稿一篇SSCI外审专家提出的意见。我做的是无序多分类logistic回归模型。因变量分了5类,有一类个数比较多,达到300多,有1-2类个案比较少,只有30左右。专家提到了要做稳健性检验。这个用stata软件编程加一个robust即可解决问题。不知道在SPSS里面怎么做。欢迎知道的朋友一起讨论下。我个人认为这是一个好问题的。不做稳健性检验模型可能受一些极端值的影响,结果不稳定。可能本来显著的变量剔除1-2个样本后就变得不显著了。所以做回归分析稳健性检验也比较重要。 PS:如果有可能,我希望在后面的心得中附上实际操作的步奏图和解释的。看看有没有人需要这个。不然可能说的一些东西需要的人能看明白,但还是不清楚怎么做。希望和大家一起交流学习。
Stata基本操作汇总———异方差、序列相关、多重共线 一、异方差问题 Stata检查是否存在异方差的方法:1.看残差图 【 模型回归之后使用即可】 rvfplot(残差与拟合值的散点图) rvpplot(残差与解释变量的的散点图) 2.怀特(White,1980)检验【 模型回归之后使用即可】 estat imtest,white(怀特检验)whitetst(外源程序,需下载) 3.BP(Breusch and Pagan,1979)检验【 模型回归之后使用即可】 estat hettest(默认设置使用拟合值y_hat) estat hettest(使用方程邮编的解释变量,而不是y_hat) estat hettest varlist(指定使用某些解释变量) 解决办法: 1.WLS加权最小二乘法 reg y x1 x2 x3 [aw=1/var] eg: reg y x1 x2 x3 predict e1,res g e2=e1^2 g lne2=log(e2) reg lne2 y,noc predict lne2f g e2f=exp(lne2f) reg y x1 x2 x3 [aw=1/e2f] 2.White(1980) eg: reg y x1 x2 x3,robust3. wls0命令 二、序列相关问题 Stata检查是否存在序列相关的方法: 1.画图 在做完回归之后,先生成残差项e scatter e L.e 2.BG检验 estat bgodfrey(默认滞后阶数为1) 3.Ljung-Box Q检验 eg: reg y x1 x2 x3 predict e,res wntestq e 3.DW检验 estat dwatson解决办法: 1.Newey稳健性标准差 newey y x,lag(p) (滞后阶数必选) 2.可行广义最小二乘法(FGLS) prais y x prais y x,corc 三、多重共线问题 多重共线性并不会改变OLS估计量BULE的性质,但会使得对系数的估计变得不准确。 Stata检查是否存在多重共线的方法: estat vif VIF值越大说明多重共线性问题越严重。一般认为,最大的VIF不超过10,则不存在明显的多重共线性。 解决办法: 1.如果只关心方程的预测能力,则在整个方程显著的条件下,可以不必关心具体的回归系数。 2.增加样本容量,剔除导致多重共线性的变量或者修改模型设定形式。 3.对于时间序列样本,通过使用差分模型可以一定程度上消除原模型中的多重共线性。 4.岭回归方法。
SAS的语法规律有哪些?转 SAS的语法其实很简单,SAS是一种面向过程的语言,其有两个主要部分构成:Statements 和 Options。 1. Statement Statements就是SAS中的语句,是SAS程序的主干,主要告诉SAS需要进行哪些操作,用分号 ';' 结尾。而Statements由SAS关键字,SAS名称,特殊符号和运算符构成。 例如 DATA a; 就是一个DATA Statement。DATA就是一个sas关键字,a就是一个sas名称。又比如 length x $10.; 就是一个length Statement,x是一个sas名称,'$'和'.'是特殊符号。 函数是SAS Statement的一种特殊组成部分,能接收输入,并返回输出。函数名称后面跟着小括号,小括号里面的参数用逗号分隔开。例如 x = substr(y,1,10);这个Statement由名称x,赋值运算符= 和substr函数组成,其中y,1和10都是函数的参数。 2. Options Options就是SAS中的选项,用来修饰Statements,主要告诉SAS怎样进行这些操作。options根据修饰的对象不同,其语法不相同,但多个option存在时,之间都用空格分隔。 1. 当options修饰SAS数据集时,用小括号把options框起来。 2.当options修饰SAS关键字的时候,则只用空格将options与主干分隔。 3. 在Proc步骤中,除了Proc statement以外,其他修饰statement的options则需要用反斜杠'/'与主干分隔开。 例如: Data a(where = (x = 2));这个语句由主干 Data a和选项where = (x = 2)组成。其中where = (x = 2)修饰SAS名称:数据集名a,所以用括号括起来。 Infile x dlm=',' dsd missover;这个语句主干是Infile x ,dlm=‘,’ dsd 和missover都是修饰infile的选项。因此满足情况2. model y = x1 x2 x3/ stb vif; 是从属于Proc Statement的model statement,stb和vif都是修饰这个model的options,与主干用'/'分隔开,但内部用空格分隔。 注意:单独的where x = 2;是where statements,不是options。options一定是要有修饰对象的。 附:一些特殊符号 1. 点号'.'。 SAS中的点号。主要会出现在三个地方:逻辑库.数据集、SAS Format和宏变量中,主要起到分隔的作用。例如$10. 表示的是$10这样一个Format名称。 又如%let a = mylib; data &a..mydataset; 第一个.代表分隔宏变量&a 和后面的.mydataset,而第二个.则是逻辑库.数据集里面的分隔符。data &&a&i...mydataset; 这里三个点的前两点分别表示表示分隔宏变量&&a&i 和 &ai。 2. 逗号','。 逗号用来分隔参数。比如函数的参数和宏的参数。此外,在SQL中,由于SQL语言本身的特性,逗号也用来分隔变量。比如select *, x1 as var1, x2 as var2 from mylib.mydataset; 就是一个select Statement。其中变量名用逗号分隔。 3. Trail 符号 ‘@’。 SAS 中的@是指针控制符。用来规定指针的位置,@numerical expression的话,就是把指针移动到该expression所指向的位置。如果@在input语句末尾,则代表将指针停留在数据行的末尾直到执行下一个input语句。如果是@@在input语句末尾,则代表将指针停留在数据行的末尾直到执行下一个data步。 3. 井号 ‘#’。 换行符号,制定指针读取的行数。 4. 引号。 分为单引号和双引号,其中单引号内部的宏不解析,双引号内部的宏要解析。此外,单引号用在在call symput和call symget语句中定义宏变量。 5. 百分号%。 用来定义宏语句,%开头的语句有优先编译权。 例如 %let x = 2; data a; %if &x = 2 %then %do; var1 = 1; %end; run; 先编译%开头的语句得到 data a; var1 = 1; run; 然后在编译这段程序。 6. Ambersand 号‘&’。 用来引用宏变量,可以嵌套。 7. 分号 ';'。 用来分隔Statements, 每一个statement有且只有一个;。 8. 冒号 ':'。 这个出现的地方就比较多了。常见在input语句里面,用来修饰Format,比如$10. 会定义一个长度为10的字符串,如果文件中的字符串长度不到10,那就把分隔符也当做字符串的一部分往后读,直到读完10个长度。:$10.则避免了这个问题。有时候在SQL里面也会看到,select into语句中,用在定义的宏变量名称前。
转——用stata生成空间权重的步骤和操作详解 以下都用中国的例子 (一)得到数据库文件和坐标文件 1.之所以这一步是由于在实际分析中会删除个别省份,然后基于剩余省份制作shp文件后生成空间权重文件。找到中国地图省级、省会城市、城市、县的dbf和shp文件,注意:各级地图的dbf和shp文件的名称必须相同且是英文,如province.dbf和province.shp,provcap.dbf和provcap.shp等2.在stata中安装spmap、shp2dta和mif2dta命令是ssc install spmap\ shp2dta\mif2dta 3.在指定目录下,运行命令shp2dta using ProCap, data("ProCap_data") coor("ProCap_coordinates"),其中下划线部分分别是使用的数据库和坐标名称,转换后的数据库和坐标文件名称,然后用命令 merge ID using procap_coordinates,将文件复制到txt文档中编辑成符合geoda格式(第一行写上截面单位数和变量数,第二行是变量名称,用英文下双引号引起,用逗号隔开,剩下行是观测值也要用逗号隔开,当然可以先在excel中编辑再拷过来)然后打开geoda~tools~shape~points from ascii,主要设置位置,然后保存为shp文件,最后基于此文件生成空间权重矩阵,当然质点文件只能生成knearest和threshold distance距离权重。 (二)如果用geoda生成了权重数据,那么可以通过以下方法转换成stata文件 1.用geoda生成不同类型的权重文件,比如province_knear.gwt,打开另存为province_knear.txt 2.用记事本打开后复制出来或者在stata中输入命令insheet using province_knear.txt,删除关键词,保留位置变量和邻近数量变量,并重命名为v1和v2,并另存为spweight3.dta 3.在stata中安装spweightxt命令 4.输入命令 clear all sysuse spweight3.dta, clear list v1 v2 spweightxt v1 v2 , panel(34) time(8) matrix(W) eigw table 就可以生成中国34个省份观测单位8年的权重指标了。 注意:其中panel()项可以设置你要生成的权重观测单位数一般与原始文件一致,如果想减少几个省份,则先在原始文件减少,time()设置生成时间的维数,一般空间面板数据用的上。然后生成的权重数据分为横截面和面板类型分别保存在 Cross Section Weight Matrix File (Wcs.dta)和 Panel Weight Matrix File (Wxt.dta)中要查看只需输入 use Wcs.dta,clear 或者use Wxt.dta ,clear即可 (三)空间面板回归 主要说gmm估计 命令是 spgmmxt y x1 x2 , nc(7) wmfile(SPWxt) gmm(1) mfx(lin) test 暂时就说这么多,有空了再写详细点,主要想把在STATA中如何进行空间面板的操作写一下!
【计量经济学】Stata入门的一些心得【转】 第一次接触Stata是在大三的计量经济学入门课,学校每周都有lab,用Stata教你解决一个计量经济学的问题。Stata是一个统计软件,百度百科说,Stata 是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。 曾经看到一个论坛上说,Stata就是简易版的Matlab。坦白讲,Stata大概是我除了Excel VBA之外接触过的唯一数据分析工具,所以我并不像大牛一样有着居高临下的发言权。但是我深知数据分析和计算机科学在当今的社会科学及金融领域多么重要。这篇文章不甩知识点,只想谈谈作为一名经济学背景的新手、职场的预备小白,接触Data Science的惊喜与思考。 现代科学离不开数据分析。大量的数据能帮助我们理解事物之间的关系,用模型解释发生了的事情并预测未来的故事。计算机是绝好的帮手,因为他能在瞬间理解海量数据,并根据你的指令,帮你找到你所需要的evidence来分析问题。我匆匆看过几个R语言,Java的入门教程,觉得里面绝好的例子就是在学习软件语言的开始先尝试用Code打出“Hello World”。任何软件的基础代码都可以在网上找到,而我在lab中学到的最有用的地方有两方面:在获取evidence方面,是理解发送指令的逻辑;在使用evidence方面,是温习什么问题需要什么evidence,从解决问题中更深刻地理解计量经济学的不同概念。 在学习Stata的过程中,最有挑战的事情,是有时明明觉得输入了对的code,但却出不来结果,最后检查了好半天发现是因为在几行之前遗漏了某一个步骤。所以说,code是实践,实践最能检验理解。如果要处理复杂的问题,严谨的理解才是奠定发送成功指令的基础。 毕业的Dissertation打算做empirical的,应该会用到很多Stata。本来想假期接触一下编程,但想到就业方向和自己的实际情况,觉得还不如精钻Stata的好。至少在目前涉足的领域里,能想到的最多运用数学的地方还是regression了。接下来,我会把找到的关于Stata的优秀素材不定时贴在这篇文章里。
几个适合新手的简单好用的SAS编程小技巧 关于SAS编程和统计,我曾做过比较全面的总结,错过的读者可以戳这里: 今天分享几个常用的,初学者容易忽略的SAS编程小技巧。 (1)让SAS也能用中文变量名 默认的SAS命名规则是无法使用中文等特殊字符作为SAS名,不过我们可以通过validvarname=any系统选项,突破此限制,不仅如此,我们甚至可以通过validmemname=extend系统选项突破数据集名称的限制。 options validmemname=extend validvarname=any ; 突破命名限制 技虽如此,但并不推荐,在确实无奈的情况下,比如别给了你一个几百个中文变量名的CSV文件,可以考虑救急。 (2)忽略打开SAS数据集提示格式错误 有时候会碰到别人给的SAS数据集,用libname设置好逻辑库后,却仍然无法打开,总是提示格式错误,此时可用nofmterr选项忽略此类错误。 options nofmterr; (3)一键清理SAS的所有结果 当SAS结果窗口结果太多,希望尽快清理干净,从一个干净清爽的基础重新开始时,dm命令就可以派上用场了。 ↑Results树形目录下结果很多 dm odsresults "clear"continue; 直接运行上面的代码,还给你一个清爽的世界,效果如下。 ↑Results树形目录下结果一键清理 (4)SAS绘图设计器帮你写画图代码 关于SAS绘图,我曾写过系列教程,目录如下: 如何用SAS画正态、t、卡方以及F分布曲线? SAS绘图是不真的又难又丑啊? 多图预警:如何又快又美地用SAS画各种统计图形? 精雕细琢:一图看尽丑小鸭变白天鹅全过程,手把手教你SAS画图哦! 怎么画一个丰满又美丽的生存分析K-M曲线图? 怎么用SAS来玩转统计地图? 扒一扒一些数据平滑曲线的实现方法 校正的生存曲线如何绘制:方法总计及SAS代码? 但是真正愿意去用SAS写代码绘图的人较少。其实,我们可以试试%sgdesign,用拖拽的办法绘图,并且可以保存背后的SAS GTL代码为日后所用。 %sgdesign; ↑sg designer ↑图及GTL代码 (5)逃离「黑洞」错误 有没有碰到这样一种情况:运行任何SAS代码,SAS都没有任何结果,也没有错误反馈,只是在log里重复显示你的代码。 这就是所谓的「黑洞」错误,你进入了这样一个「黑洞」,任何运行的SAS代码都被他吸入,木有任何反馈! 神马?你还没遇到过,看来历练还不够啊。运行下面一段宏代码,再试试后面其他SAS过程步。 %macrotest; %put This is a "Balk Hole"test; %put **** %str(Gu's Wechat) ****; %mend ; %test /*以下代码不管怎么运行就是没反应啊*/ proc print data=sashelp.class; run; 怎么破?运行下面代码,可以跳出来! '); %mend; 其实,这个示例还是比较简单的,仔细观察宏定义,发现问题可能就在于单引号不匹配导致。完整的匹配是这样的: %put **** %str(Gu's Wechat) ****; %mend ; '); %mend; 但是,如果在复杂一点的宏,我们可能就没那么容易一眼找到问题所在了,所幸的是,我们可以用一段万能代码,多次运行,直到出现错误提示,就可以逃离黑洞!这就是: *';*";*);*/;%mend; run; (6)SAS EG/SAS Studio写代码 初学者,可能总是记不住函数,记不住选项。没关系,让SAS自动给我们提示吧。这时,可以试试在SAS EG或者SAS Studio里写代码。 ↑SAS studio (7) 一键格式化别人凌乱的代码 遇到别人写的无法直视的SAS代码,难道要白白忍受吗?别了,在SAS EG里借助ctrl+i一键缩进代码,从此整整齐齐,一键治好强迫症患者。
1 下一页