每年的9月20日,是全国爱牙日。作为中国特有的节日,爱牙日的由来主要与兰州地区的牙科医生--白成平有关。白成平在17岁的时候,就跟随美国口腔医学博士毛燮均学习牙医技术。此后,他便一直在兰州一家医院担任牙科医生。在50多年的牙医生涯中,他对人
全部3个回答 >一元线性估计量的方差推导
-
变量之间的非确定性相关关系。一般形式:y = f(x0,x1,x2,…xp)+ε若为线性回归,y = β0+β1x1+β2x2+…+βnxn+εβ0,β1等为回归系数,ε为随机误差。模型假设①零均值,ε均值为0②同方差,ε项方差为常数③无自相关性,ε项值之间无自相关性④正态分布,ε项呈正态分布。
⑤x1,x2等解释变量之间是非随机变量,其观测值是常数。
⑥解释变量之间不存在精确线性关系。⑦样本个数多于解释变量个数。建立回归分析模型的一般步骤①需求分析明确变量②数据收集加工,检查是否满足回归分析断的假设。
③确定回归模型:一元,二元,多元;线性,非线性。画散点图。
④确定模型参数:常用最小二乘法,若不符合假设条件,可用其它方法。最小二乘法也叫最小化平方法,通过使误差的平方和最小来寻找最佳函数匹配。
⑤模型检验优化⑥模型部署应用。优点:模型简单,应用方便;有坚实的理论支撑;定量分析各变量间关系;模型预测结果可通过误差分析精确了解。缺点:假设条件比较多且严格;变量选择对模型影响较大。回归模型的参数估计一元线性回归模型:研究与现象关系最大的主要因素,两者有密切关系,但并非确定性关系,可用该模型。y = β0+β1x+εy为被解释变量或因变量,x为解释变量或自变量。β0回归常数,β1回归系数,二者统称为回归参数。ε为随机误差。其中E(ε) = 0,var(ε) = 常数。一元线性回归方程:y = β0+β1x 忽略随机误差。回归方程从平均意义上表达了变量y与x的统计规律性。回归分析的主要任务是通过n组样本的观察值,对β0,β1进行估计,得到最终方程。参数估计:最小二乘估计(OLE)通过最小二乘法求出对β0,β1的估计值。离差平方和Q(β0,β1)=Σ(yi - E(yi))²=Σ(yi -β0+β1xi)²估计值满足使上式离差平方和最小。其最小值的求法为求其偏导数,并令其为0。求解方程组即可。实操一下。先创建数据,画散点图。
x = [3.4, 1.8, 4.6, 2.3, 3.1, 5.5, 0.7, 3, 2.6, 4.3, 2.1, 1.1, 6.1, 4.8, 3.8] y = [26.2, 17.8, 31.3, 23.1, 27.5, 36, 14.1, 22.3, 19.6, 31.3, 24, 17.3, 43.2, 36.4, 26.1] x = np.array(x) y = np.array(y) print(len(x), len(y)) plt.scatter(x, y) plt.savefig("scatter.png")
建立线性回归模型
df pd.DataFrame() df["X"] = x df["Y"] = y print(df) regr = linear_model.LinearRegression() # 拟合 regr.fit(x.reshape(-1,1), y) # 得到回归参数的二乘法估计 a, b = regr.coef_, regr.intercept_ print(a, b) # 画出拟合的直线 yp = a*x + b plt.scatter(x, y) plt.plot(x, yp) plt.savefig("fit.png")
拟合结果a = 4.91933073 b = 10.277928549524688
另一种参数估计方法:最大似然估计(MLE)利用总体的分布密度或概率分布的表达式及其样本所提供的信息求未知参数估计量的一种方法。基本思路:已知样本符合某种分布,但分布参数未知,通过实验来估计分布参数。估算思路:如果某组参数能使当前样本出现的概率最大,就认为该参数为最终的估计值。解决的是模型已定,参数未知的问题,用已知样本去估算未知参数。出现当前情形的概率为f(x1x2x3…xn|θ)=f(x1|θ)f(x2|θ)f(x3|θ)…f(xn|θ),其中θ未知。似然函数L(θ|x1x2x3…xn) = f(x1x2x3…xn|θ)=f(x1|θ)f(x2|θ)f(x3|θ)…f(xn|θ)=Πf(xi|θ)前提是事件x之间是独立的。取对数lnL(θ|x1x2x3…xn) = lnf(x1|θ)+lnf(x2|θ)+lnf(x3|θ)+…+lnf(xn|θ) = Σf(xi|θ)平均对数似然l = lnL(θ|x1x2x3…xn)最大似然估计就是找到一个θ使得l最大。求导求出最大值。一元线性回归,OLE和MLE是等价的,MLE还可以估计方差σ²的值。无偏估计,估计不同样本,偏差平均值为0。反之则为有偏估计。一元线性回归方差的性质:
①线性:估计回归参数为随机变量yi的线性函数。
②无偏,估计值y为真实值的无偏估计,即E(y) = E(y)③参数的方差,与样本方差,随机误差的方差等有关系。模型的检验①回归系数是否显著:t检验检验因变量y与自变量x之间是否真的存在线性关系?即β1=0?用t检验进行判断。确定假设:目的是找到不达标的证据。原假设H0:β0=0,备择假设H1:β0≠0检验水平:α=0.05或0.01构造统计量:H0成立时,β1满足正态分布。计算p值。得出结论。
②回归方程是否显著:F检验。根据平方和分解式,直接从回归效果检验回归方程的显著性。
③相关系数显著性检验:t检验。样本相关系数可以作为总体相关系数的估计值,样本相关系数不等于零时需要进行假设检验确定是来自抽样误差还是来自整体。
④决定系数SST = SSR + SSE, SSR占的比重越大,线性回归效果越好。r² = SSR/SST用模型的score函数来给模型评分,结果为0.9234781689805285。还可以用statsmodels库来做,回归结果类似,与sklearn库不同的是它可以输出检验结果。用statsmodels来做
import statsmodels.api as sm X = sm.add_constant(x) model = sm.OLS(y, X) result = model.fit() print("statsmodels做线性回归") print(result.params)
2023-10-23 18:44:21 -
一元线性回归估计量的推算需要先确定回归方程的形式,即Y = β0 + β1X + ε。其中,Y是因变量,X是自变量,β0和β1是回归系数,ε是误差项。
接下来,根据最小二乘法原理,可以得到β0和β1的估计量分别为:
β1 = ∑(Xi - X¯)(Yi - Ȳ) / ∑(Xi - X¯)²
β0 = Ȳ - β1X¯
其中,Xi和Yi分别为样本中第i个观测值,X¯和Ȳ分别为样本中所有观测值的平均值。
最后,代入所得到的β0和β1的估计量,就可以得到回归方程的估计值Y',即Y' = β0 + β1X。
2023-10-23 18:44:21
-
问 爱牙日的由来答
-
问 爱尔兰是哪个国家答
爱尔兰被称为翡翠岛国,这里西临大西洋、东靠爱尔兰海,与英国隔海相望。爱尔兰其实是一个独立的西欧国家,为北美通向欧洲的通道。爱尔兰、英格兰、苏格兰、威尔士是四个民族,也是四个地方。在历史上,这四个地方分分合合,瓜葛不断。1918年前,四个民族
全部10个回答 > -
问 圣城是哪个城市答
希腊雅典、中国洛阳、沙特麦加和以色列耶路撒冷被世界公认为世界四大圣城。关于洛阳圣城称号的由来,可追溯至上古时期。 相传上古时期,洛阳孟津县境内的黄河中出现背着“河图”的龙马和背着“洛书”的神龟,它们把图和书献给了伏羲后,伏羲根据图和书
全部10个回答 > -
问 芥菜的营养价值答
食材简介: 芥菜又称盖菜、挂菜,是中国的特产蔬菜。芥菜植株一般可高150厘米,幼茎及叶具有毛刺。经过长期选择和栽培,芥菜出现了不同的变种:根芥菜,也叫大头菜,主要用来腌制咸菜;叶芥菜俗称雪里红,可制成霉干菜;茎芥菜,用来制作榨菜;芽芥
全部10个回答 > -
问 猪肝的营养价值答
食材简介: 猪肝又名血肝,是猪的肝脏,与胆相连,肝脏是动物体内储存养料和解毒的重要器官。猪肝在消化系统中能够制造胆汁,一般呈紫红色、红褐色,质软而脆,呈楔形,右端圆钝,左端扁薄,可分为上、下两面,前后两缘,左右两叶。 营养功效:
全部10个回答 > -
问 花椒的营养价值答
食材简介: 花椒,又叫麻椒、蜀椒、点椒等,是我国原产的一种干、枝、叶、果均具浓郁辛香的落叶灌木或小乔木。它最初野生于我国中西部,是作为是敬神的香物。现在广泛分布于我国南北各地。由于它的果皮暗红,密生粒状突出的腺点,犹如细斑,故花椒之名
全部10个回答 > -
问 银鱼的功效与作用答
食材简介: 银鱼,又称炮仗鱼、面条鱼、白饭鱼等,通体白色,整体长约10厘米,刺少,有牙并且十分锋利。银鱼具有海洋至江河洄游的习性,多生活于水的下层,我国的太湖、西湖、马湖是三大银鱼盛产湖。 营养功效: 银鱼所含营养十分丰富,具有高
全部10个回答 > -
答
大理是悠闲和浪漫的代名词,下关的风,上关的花,苍山的雪,洱海的月,“风花雪月”构成了大理最著名的特色。去大理,我们的路线是先游览大理古城周边及崇圣寺三塔,然后环洱海游,最后以登苍山结束。大理古城是大理旅游的核心区,这里承载着大理历史文化、宗
全部10个回答 > -
问 原单和正品的区别答
现在的市场可以说是乌烟瘴气,光各种产品的头衔都搞的人一头雾水,那么,原单和正品有什么区别呢?所谓的原单货和“真货”的唯一区别,不过是“庶出”而已,数量很少。众所周知,现在国外60%以上的奢侈品都在中国生产。国外的一些大品牌会在国内找一些代工
全部10个回答 > -
问 太湖的简介答
“太湖美呀太湖美,美就美在太湖水”,1978年,这首《太湖美》传遍大江南北,太湖一时成为了大家都心中的向往之地。太湖位于江苏省南部,长江三角洲南部,是中国著名的五大淡水湖之一。太湖湖泊面积2427.8平方公里,湖岸线全长393.2公里。其西
全部10个回答 >