首页
关于
论坛
投稿
搜索
统计之都
2022-05-09
38 / 49
统计计算
那些年,我们一起追的EB
杨灿
/
2012-05-26
写了《统计学习那些事》,很多童鞋都表示喜欢,这让我越来越觉得冯导的一句话很有道理:“我的电影一向只伺候中国观众,还没想过拍给全世界人民看。这就跟献血一样,本身是好事,但如果血型不对,输进去的血也会产生排异现象。我的‘血型’就适合中国人,对不上世界观众,别到时伤了我的身子骨,还伤害了世界观众,所以我暂时不会‘献血’。”比如他的《天下无贼》,我就特别喜欢。然而天下可以无贼,却不可以没有英雄(不是张导的……
R语言
R You Ready?——大数据时代下优雅、卓越的统计分析及绘图环境
刘思喆
/
2012-05-05
作者按:本文根据去年11月份CSDN举办的“大数据技术大会”演讲材料整理,最初发表于2012年2月期《程序员》杂志。 […] R(R Development Core Team, 2011)语言由新西兰奥克兰大学的 Ross Ihaka 和 Robert Gentleman 两人共同发明,其词法和语法分别源自 Scheme 和 S 语言,R 语言一般认为是 S 语言(John……
统计图形
日历中的夏天
肖凯
/
2012-05-03
不知不觉,夏日已慢慢临近。姑娘们飞扬的裙角,小贩叫卖的西瓜,蚊蝇嗡嗡的声音,以及翻过的一页日历,都提醒着你夏天快来了。夏季有着不同的定义:根据中国人的日历,我们所俗称的夏季从立夏开始,到立秋结束;但在气候学上,夏季是指连续五天平均温度超过22摄氏度即算作夏季的开始,若连续五天平均温度低于22度则算作入秋;而天文学上的夏季一般是指六、七、八这三个月。 那么哪一种夏季的定义更合适一些呢?还是用数据可视……
R会议
第五届中国R语言会议通知
统计之都
/
2012-04-16
R是一门用于统计计算和作图的语言,其官方机构每年都会举办useR!会议,但会议地点主要局限在欧美地区。自2008年以来,在谢益辉的倡导下,中国已经成功举办了四届自行组织的R语言会议,极大促进了R语言在中国的推广和发展。在前四届会议的成功经验下,为了进一步加强各领域R语言使用者之间的交流,我们准备于2012年5月(北京会场)举办第五届中国R语言会议。 […] 会议定于2012年5……
推荐文章
关于概率论主干课程的训练
周达
/
2012-04-15
虽然外界不大能区分“概率论”和“统计学”的差别,但是在概率统计专业内的人士们看来,这两者无论从思维方式、课程学习还是学术训练角度来看,区别还是相当明显的。比如我了解的北大概率统计系的情况,概率论和数理统计分属不同的教研室,日常的学术活动也大相径庭。研究生除了第一年会一起上专业基础课之外,之后就少有交集。我当年的体会是,在统计专业同学们的眼中,“概率论跟基础数学没有什么区别”;而在概率专业的同学看……
统计模型
因果推断简介之四:观察性研究,可忽略性和倾向得分
丁鹏
/
2012-04-01
这节采用和前面相同的记号。$Z$ 表示处理变量($1$ 是处理,$0$是对照),$Y$ 表示结果,$X$ 表示处理前的协变量。在完全随机化试验中,可忽略性 $Z \bot \{Y(1), Y(0)\} $ 成立,这保证了平均因果作用 $ACE(Z\rightarrow Y) = E\{Y(1) – Y(0)\} = E\{Y\mid Z=1\} – E\{Y\mid Z=0\}$ 可以表示成观测数……
统计模型
因果推断简介之三:R. A. Fisher 和 J. Neyman 的分歧
丁鹏
/
2012-03-30
这部分谈到的问题非常微妙:完全随机化试验下的 Fisher randomization test 和 Neyman repeated sampling procedure。简单地说,前者是随机化检验,或者如很多教科书讲的Fisher 精确检验 (Fisher exact test);后者是 Neyman 提出的置信区间 (confidence interval)理论。 我初学因果推断的时候,并没有……
统计模型
因果推断简介之二:Rubin Causal Model (RCM)和随机化试验
丁鹏
/
2012-03-28
因果推断用的最多的模型是 Rubin Causal Model (RCM; Rubin 1978) 和 Causal Diagram (Pearl 1995)。Pearl (2000) 中介绍了这两个模型的等价性,但是就应用来看,RCM 更加精确,而 Causal Diagram 更加直观,后者深受计算机专家们的推崇。这部分主要讲 RCM。 设 $Z_i$ 表示个体 $i$ 接受处理与否,……
统计模型
因果推断简介之一:从 Yule-Simpson’s Paradox 讲起
丁鹏
/
2012-03-26
在国内的时候,向别人介绍自己是研究因果推断(causal inference)的,多半的反应是:什么?统计还能研究因果?这确实是一个问题:统计研究因果,能,还是不能?直接给出回答,比较冒险;如果有可能,我需要花一些篇幅来阐述这个问题。 目前市面上能够买到的相关教科书仅有 2011 年图灵奖得主 Judea Pearl 的 Causality: Models, Reasoning, and……
统计应用
统计词话(二)
邱怡轩
/
2012-03-21
[…] 抬头,他们看到了诗云。 […] 诗云处于已消失的太阳系所在的位置,是一片直径为一百个天文单位的旋涡状星云,形状很像银河系。空心地球处于诗云边缘,与原来太阳在银河系中的位置也很相似,不同的是地球的轨道与诗云不在同一平面,这就使得从地球上可以看到诗云的一面,而不是像银河系那样只能看到截面。 […] ——刘慈欣 《诗云》 […] 时光荏苒,……
统计应用
需要相亲几次才能找到靠谱的对象?
肖凯
/
2012-03-11
谈到相亲就不得不提到著名的麦穗问题。说有一天,苏格拉底带领几个弟子来到一块成熟的麦地边。他对弟子们说:“你们去麦地里摘一个最大的麦穗,但要求只能摘一次,只许进不许退,我在麦地的尽头等你们。”可以看得出,相亲这种活动就有点类似于摘麦穗,在等待和决断之间达成平衡是解决问题的重点。 将上述的麦穗问题进一步抽象就是一个经典的概率问题。若一个袋子里有100个不同的球。每个球上标明了其尺寸大小。我们每次随机无……
统计模型
议员是如何投票的?
贺诗源
/
2012-03-03
这个数据在近几年的图模型文章中常能见到,并且已有很多深入的讨论——包括图结构随时间变化、多图联合估计等情况。本文只涉及单个图结构的估计,此外笔者对政治不了解,因此文中摘录wiki的相关评论。 从 http://www.senate.gov 可以看到senators每次投票的结果。那么,你关心的议员在每次投票中起到怎样的作用?有怎样的政治立场?本文数据选取美国第111届议会(2009年、2010……
««
«
36
37
38
39
40
»
»»