ChaseDream
搜索
返回列表 发新帖
楼主: 永远没多远
打印 上一主题 下一主题

[咨询答疑] 关于统计软件-在读PhD学生讨论

[复制链接]
11#
 楼主| 发表于 2022-11-22 01:54:32 | 只看该作者
raccoon_paw 发表于 2022-11-21 22:55
SAS的好处是能用WRDS Cloud,而且WRDS有各种现成的code可以抄。很多教授开源的code也是SAS,比如很多TAQ  ...

现在python也可以用WRDS cloud,我觉得这不是啥大优势。
12#
 楼主| 发表于 2022-11-22 01:56:39 | 只看该作者
roycheung 发表于 2022-11-21 10:50
SAS蛮多人用的,但是SAS和stata在数据量太大的时候就容易爆内存,建议32G起步。CPU12代13代标压i7就差不多 ...

那我知道为啥我时间那么长了。处理一个7,000OBS的数据,生成2个lag variables, 7mins你敢信。。。我去问问HPC了,一年多了都还不知道有这个HPC,我以为LABS里面的电脑就是学校最好的了。。。
13#
发表于 2022-11-22 01:57:26 | 只看该作者
In Fin. research, Stata satisfies the vast majority of one's modeling/computing needs although the more trendy may also try R/Python.
14#
 楼主| 发表于 2022-11-22 01:58:13 | 只看该作者
d.jiao 发表于 2022-11-21 22:52
Python(处理数据)+STATA/R(回归)
8G完全足够处理0.3m obs,如果内存崩溃的话,你应该查一查自己代码内 ...

有的,就是中间过程我会生成很多临时的数据集,会生成很多临时的变量,到最后在合并。这个也要删除吗,我以为这个应该是在hard drive里面。。原来是在RAM里面吗。
15#
 楼主| 发表于 2022-11-22 02:01:14 | 只看该作者
Tripleg 发表于 2022-11-22 01:57
In Fin. research, Stata satisfies the vast majority of one's modeling/computing needs although the m ...

STATA方便多了,代码也简单。。。我们学校好多老师用的还是SAS,这东西我是不喜欢,随便跑一下代码,一个下午就没了。。我找到了学校的HPC了,申请了个账号估计以后会快一点稍微。。
16#
发表于 2022-11-22 02:06:26 | 只看该作者
永远没多远 发表于 2022-11-22 02:01
STATA方便多了,代码也简单。。。我们学校好多老师用的还是SAS,这东西我是不喜欢,随便跑一下代码,一个 ...

Yes, Stata involves a minimal amount of coding and in this sense is similar to SPSS. SAS is more a statistical software and is usually the favourite of old-timers. By the way, I recently got a penchant for Python.
17#
发表于 2022-11-22 03:15:59 | 只看该作者
永远没多远 发表于 2022-11-22 01:54
现在python也可以用WRDS cloud,我觉得这不是啥大优势。

... Stata Matlab R 也都可以通过 SSH连接WRDS cloud, 但是直接登录WRDS cloud 只能用SAS Studio, 而且我之前说了,最主要的是很多现成的code都是SAS。当然,也可能你code大牛,对别人现成的code没兴趣,那确实不是什么大优势。
18#
发表于 2022-11-22 10:58:23 | 只看该作者
我个人完全用Python的,没用过其他的,感觉Python还是有点慢,我做资产定价研究的,处理大量数据常常需要多线程加速。有两个都熟悉的朋友知道哪个更快吗
19#
发表于 2022-11-22 11:15:15 发自 iPhone | 只看该作者
个人浅薄的经验:sas stata python r c cpp 都有大于2年或者大于5年的使用。最熟练的是前四者,一定要选一个最熟练的是python。前二者在经济商科中用的多因为senior faculty习惯用sas以及做回归分析没有谁比stata更强大。

至于效率,我在认真学习sas前很不适应,觉得效率低下。等我真的上手之后,发现sas在处理大规模数据面前吊打python。抵触sas觉得不适应的同学们最好还是多尝试。百万行甚至千万行的数据我都能在笔记本上跑,python不可能,会crash的。用好sas能有所助力。

其实语言这东西,还是功能性的。各有优劣,能完成功能就好,多掌握一个有时候是多一条路。比如我做ml nlp 爬虫就必然用python,做可视化我也绝对用python因为我可以玩出花来。pull data就必然sas。回归分析就换到stata。等我想自己写nn来补充一些数据点的时候我甚至可能用cpp以确保我fully customize我想要的算法。
20#
发表于 2022-11-22 19:10:11 | 只看该作者
Konley 发表于 2022-11-22 11:15
个人浅薄的经验:sas stata python r c cpp 都有大于2年或者大于5年的使用。最熟练的是前四者,一定要选一 ...

可以,火速学习一手sas,我用python搞大规模数据太慢了
您需要登录后才可以回帖 登录 | 立即注册

Mark一下! 看一下! 顶楼主! 感谢分享! 快速回复:

近期活动

正在浏览此版块的会员 ()

手机版|ChaseDream|GMT+8, 2024-12-5 03:12
京公网安备11010202008513号 京ICP证101109号 京ICP备12012021号

ChaseDream 论坛

© 2003-2023 ChaseDream.com. All Rights Reserved.

返回顶部