统计模型
-
用统计回归模型判断葡萄酒的味道
如何描述葡萄酒的味道,通常就像一首诗:“酒香浓郁,回味悠长,酒精含量高,但不酸也不辣口,味道鲜美,又夹带一丝黑樱桃味……” 鲜花和水果一般都是用来做修饰,旨在帮助饮用者了解一杯葡萄酒中的风味。
-
基于统计学模型的无指导中文文本分析
摘要:以下为清华大学统计学研究中心邓柯分享的主题为“基于统计学模型的无指导中文文本分析”的演讲。 邓柯:今天下午非常荣幸参加这样的活动,也非常感谢活动的主办方,清华大学数据科学研究院的邀请。今天给大家分享一个我们最近做的工作。 刚才主持人介绍了我的教育背景。我本科和博士都是在北大念的,拿的统计学博士。北大毕业之后到哈佛大学统计系,做了几年博士后,做了一些研究…
-
用R语言进行数据分析:最小二乘法和最大似然法
特定形式的非线性模型可以通过广义线性模型 (glm()) 拟合。但是许多时候,我们必须把非线性拟合的问题 作为一个非线性优化的问题解决。 R的非线性优化程序是 optim() 和 nlm()。 二者分别替换 S-Plus 的 ms() 和 nlminb()。我们通过搜寻 参数值使得缺乏度(lack-of-fit)最低,如 nlm() 就是通过循环调试各种参数…
-
用R语言进行数据分析:常规和广义线性模型
线性模型 对于常规的多重模型(multiple model)拟合,最基本的函数是lm()。 下面是调用它的方式的一种改进版: > fitted.model <- lm(formula, data = data.frame) 例如 > fm2 <- lm(y ~ x1 + x2, data = production) 将会拟合 y 对 …
-
用R语言进行数据分析:定义统计模型的公式
下面的统计模型的模板是一个基于 独立的方差齐性数据的线性模型 y_i = sum_{j=0}^p beta_j x_{ij} + e_i, i = 1, …, n, 其中 e_i 属于 NID(0, sigma^2)。 用矩阵格式表示,它可以写为 y = X beta + e 其中 y 是响应向量,X 是模型 矩阵(model matrix)或者设计矩阵…