首页
关于
论坛
投稿
搜索
统计应用
2022-05-09
2 / 7
统计应用
聊聊美国保险业
侯澄钧
/
2017-03-18
作者简介:侯澄钧,俄亥俄州立大学运筹学博士, 目前在美国从事财产事故险(Property & Casualty)领域的保险产品开发,涉及数据分析、统计建模和产品算法优化等方面的工作。 只有想不到,没有保不了。这就是我对美国保险行业最深刻的认识。 大到地震,小到球票,加上平时开车,租房,看病,旅游,保险无时不刻的出现在了美国人生活工作的方方面面。 除了没有住所,没有工作,没有任何财产的流浪人……
统计模型
假新闻引发的愤怒——非算法视角对自我学习的搜索排序算法和选择偏差的一些解读
陈丽云
/
2017-01-16
本文作者陈丽云,落园园主。 声明:本文与作者工作单位及工作内容无关,完全出于个人兴趣爱好。 最近有条很火的新闻。美国大选刚刚落下帷幕,却余波不断。其中一条新闻就是,Google被指责利用搜索结果(假新闻)左右民意。可是事情到底是怎么回事呢? […] SAN, FRANCISCO/WASHINGTON – Google’s search engine is highlighting……
统计应用
利用R语言对用户进行深度挖掘
谢佳标
/
2017-01-13
作者简介:谢佳标 乐逗游戏高级数据分析师,负责大数据挖掘及可视化。资深R语言用户,有九年以上数据挖掘工作实战经验,多次在中国R语言大会上作主题演讲。与张良均老师、杨坦老师合著的《R语言与数据挖掘》一书已在2016年7月出版,新书《R语言游戏数据分析》一书也即将于2017年初出版。 随着游戏市场竞争的日趋激烈,在如何获得更大收益延长游戏周期的问题上,越来越多的手机游戏开发公司开始选择借助大数据,以便……
统计应用
降维攻击:目标,比率指标
陈丽云
/
2016-11-28
作者简介:陈丽云,在eBay从事 Experimentation Analytics Research。网络上素来自黑为“落园园主”。 […] 在这个互联网数据唾手可得的时代,但凡有数据的地方,就有战争。一场战役,有人登高摇旗呐喊,有人趁夜暗度陈仓。在以浩瀚数据为目标的战场上,大家费尽心思用尽招数,各种降维攻击,只是没有《三体》里面的体外文明那种强行把三维生物体打击到二维空间的那么残……
统计应用
热门数据挖掘模型应用入门(一): LASSO回归
侯澄钧
/
2016-10-10
Kaggle网站(https://www.kaggle.com/)成立于2010年,是当下最流行的进行数据发掘和预测模型竞赛的在线平台。 与Kaggle合作的公司可以在网站上提出一个问题或者目标,同时提供相关数据,来自世界各地的计算机科学家、统计学家和建模爱好者, 将受领任务,通过比较模型的某些性能参数,角逐出优胜者。 通过大量的比赛,一系列优秀的数据挖掘模型脱颖而出,受到广大建模者的认同,被普遍……
推荐文章
中药、西药及统计学
李舰
/
2016-08-04
作者简介: 李舰,现任九峰移动医疗 CTO,曾任 Mango Solutions 中国区数据总监。专注于数据科学在行业里的应用。 擅长R语言的工程开发与分析建模,是 Rweibo、Rwordseg、tmcn 等 R 包的作者。与肖凯合著了《数据科学中的R语言》, 参与翻译了《R语言核心技术手册》、《机器学习与R语言》。 这篇文章本来是从屠呦呦得诺奖的时候开始写的,作为一个拖延症晚期患者,直到今天才……
统计应用
互联网金融中的数据科学
张云松
/
2016-08-01
作者简介: 张云松,毕业于中科院,多年咨询公司和互联网公司从事数据算法、决策分析、风险管理和产品设计的工作,目前是融360风控总监,负责纯线上小额微贷信用贷款产品。 最近几年,这波在资本撬动的互联网金融的浪潮极大地提升了数据科学的行业应用价值,数据分析师不再是苦逼的跑数的,摇身一变成了风控模型专家、数据科学家。 尤其是大数据风控、大数据征信领域一片火热的场景,数据挖掘、机器学习相关专业同学的数量也……
统计应用
有效统计实践的十项简明原则
Robert E. Kass / Brian S. Caffo / Marie Davidian / 孟晓犁 / 郁彬 / Nancy Reid
/
2016-07-26
原文作者:Robert E. Kass; Brian S. Caffo; Marie Davidian; Xiao-Li Meng; Bin Yu; Nancy Reid 原文出处: Ten Simple Rules for Effective Statistical Practice. Kass RE, Caffo BS, Davidian M, Meng X-L, Yu B, Reid N……
统计应用
股市稳赚不亏?标普500的40年的投资回报
覃文锋
/
2016-07-03
本文翻译自 GitHub 项目 zonination/investing 的描述文件 README.md。译者对原文顺序有所改动。 […] 原文以 MIT 协议发布,已征得作者 Zoni Nation 许可进行翻译。译文版权归统计之都所有,转载请注明出处。 […] 很多人是从 Reddit 上的 “个人理财”(/r/personalfinance)板块的贴子和评论里认识……
统计应用
标题党统计学
邱怡轩
/
2016-07-02
如果你是被这个标题骗进来的,那么说明标题党的存在的确是有原因的。 在网络高度发达(以及“大数据”泛滥)的今天,数据动不动就是以 GB 和 TB 的级别存储,然而相比之下,人类接受信息的速度却慢得可怕(参见大刘《乡村教师》)。 试想一下,你一分钟能阅读多少文字?一千?五千?总之是在 KB 的量级。 所以可以说,人们对文字的“下载速度”基本上就是 1~10KB/min。如果拿这个速度去上网的话你还能……
统计应用
数据告诉你:高信誉的卖家应该收高价,还是收低价?
刘跃文
/
2016-05-31
看到这个题目,各位看官不妨想一想,淘宝上的信誉高的卖家会收高价,还是会收低价呢?根据我多年的教学经验,这里有四种可能的答案:(A)收高价、(B)收低价、(C)不好说、(D)不知道。您选哪一种?为什么? 且听我慢慢道来。 […] 从2000年开始,以eBay为代表的电子商务发展势头迅猛,养活了一大票科研人员。eBay以网上拍卖为主要的营业方式,因此,当时科研人员的一个主要的研究题目,就……
统计应用
从搜索序列文本看高端商务车
朱雪宁 / 王汉生
/
2016-05-27
摘要:本文对100万搜索引擎用户的13亿搜索序列文本进行探索分析,对高端车用户以及商学院人群做了描述对比,并针对用户搜索高端车品牌过程中的动态选择行为进行建模。首先,我们发现,在人群划分上,高端车用户和商学院用户表现出更加高端的属性,这主要表现在他们对生活、事业、学业上更卓越的追求。接下来,本文利用逻辑回归构建了忠诚模型,对用户在搜索过程中表现的忠诚和叛变行为进行了刻画,并对影响其忠诚行为的关键因……
««
«
1
2
3
4
5
»
»»