概率论、统计常见面试问题2

作者&投稿:盖咏 (若有异议请与网页底部的电邮联系)
~

贝叶斯公式,全概率公式,指数分布、均匀分布、泊松分布、二项分布公式,中心极限定理,大数定律,切比雪夫,Markov性,李雅普诺夫稳定性,Type I Error,

(1) 试验中所有可能出现的基本事件只有有限个;

(2) 试验中每个 基本事件 出现的可能性相等。

具有以上两个特点的概率模型是大量存在的,这种概率模型称为 古典概率模型 ,简称 古典概型 ,也叫 等可能概型。

有限性(所有可能出现的基本事件只有有限个)
等可能性(每个基本事件出现的可能性相等)

一个函数如果满足如下条件,则可以称为概率密度函数:

分布函数是概率密度函数的变上限积分,它定义为:

对任意b>0

设( X ,Σ,μ)为一测度空间, f 为定义在 X 上的广义实值可测函数。则对于任意实数t>0,有:

一般而言,若 g 是非负广义实值可测函数,在 f 的定义域非降,则有:

设X为随机变量,期望值为u ,标准差为σ 。对于任何实数k>0

实验次数越多,样本均值趋向于总体的均值

实验次数越多,样本均值的分布趋向于正态分布。

参数估计(parameter estimation),统计推断的一种。根据从总体中抽取的随机样本来估计总体分布中未知参数的过程。

从估计形式看,区分为点估计与区间估计:
从构造估计量的方法讲,有矩法估计、最小二乘估计、似然估计、贝叶斯估计等。

(1)求出未知参数的估计量;
(2)在一定信度(可靠程度)下指出所求的估计量的精度。
其中,信度一般用概率表示,如可信程度为95%;精度用估计量与被估参数(或待估参数)之间的接近程度或误差来度量。

用样本矩估计总体矩,从而得到总体分布中参数的一种估计。它的思想实质是用样本的经验分布和样本矩去替换总体的分布和总体矩。矩估计法的优点是简单易行, 并不需要事先知道总体是什么分布。缺点是,当总体类型已知时,没有充分利用分布提供的信息。一般场合下,矩估计量不具有唯一性。

于1912年由英国统计学家R.A.费希尔提出,利用样本分布密度构造似然函数来求出参数的最大似然估计。

最小二乘法形容的是一种思想,即待估计参数的真值与实际的样本的真值的数据点形成的损失应该是最小的。即让总的误差的平方最小的就是真值,这是基于, 如果误差是随机的,应该围绕真值上下波动

参考 知乎用户微调

指根据以往经验和分析。在实验或采样前就可以得到的概率。
先验概率是指根据以往经验和分析得到的概率,如全概率公式,它往往作为"由因求果"问题中的"因"出现。

指某件事已经发生,想要计算这件事发生的原因是由某个因素引起的概率。
后验概率是指依据得到"结果"信息所计算出的最有可能是那种事件发生,如贝叶斯公式中的,是"执果寻因"问题中的"因"。

所以预测的准确度得到了加强。而大部分机器学习模型尝试得到的,就是后验概率。

我们多举几个例子来理解:

最近天气炎热,我来到超市准备买个西瓜,可是没有太多的经验,不知道怎么样才能挑个熟瓜。这时候,作为理科生,喔就有这样的考虑:

如果我对这个西瓜没有任何了解,包括瓜的颜色、形状、瓜蒂是否脱落。按常理来说,西瓜成熟的概率大概是 60%。那么,这个概率 P(瓜熟) 就被称为先验概率。

也就是说,先验概率是根据以往经验和分析得到的概率,先验概率无需样本数据,不受任何条件的影响。就像红色石头只根据常识而不根据西瓜状态来判断西瓜是否成熟,这就是先验概率。

再来看,红色石头以前学到了一个判断西瓜是否成熟的常识,就是看瓜蒂是否脱落。一般来说,瓜蒂脱落的情况下,西瓜成熟的概率大一些,大概是 75%。如果把瓜蒂脱落当作一种结果,然后去推测西瓜成熟的概率,这个概率 P(瓜熟 | 瓜蒂脱落) 就被称为后验概率。后验概率类似于条件概率。

玩英雄联盟占到中国总人口的60%,不玩英雄联盟的人数占到40%:

为了便于数学叙述,这里我们用变量X来表示取值情况,根据概率的定义以及加法原则,我们可以写出如下表达式:

P(X=玩lol)=0.6;P(X=不玩lol)=0.4,这个概率是统计得到的,即X的概率分布已知,我们称其为先验概率(prior probability);

另外玩lol中80%是男性,20%是小姐姐,不玩lol中20%是男性,80%是小姐姐,这里我用离散变量Y表示性别取值,同时写出相应的条件概率分布:

P(Y=男性|X=玩lol)=0.8,P(Y=小姐姐|X=玩lol)=0.2

P(Y=男性|X=不玩lol)=0.2,P(Y=小姐姐|X=不玩lol)=0.8

那么我想问在已知玩家为男性的情况下,他是lol玩家的概率是多少:

依据贝叶斯准则可得:

P(X=玩lol|Y=男性)=P(Y=男性|X=玩lol)*P(X=玩lol)/

[ P(Y=男性|X=玩lol) P(X=玩lol)+P(Y=男性|X=不玩lol) P(X=不玩lol)]

最后算出的P(X=玩lol|Y=男性)称之为X的后验概率,即它获得是在观察到事件Y发生后得到的

隔壁老王要去10公里外的一个地方办事,他可以选择走路,骑自行车或者开车,并花费了一定时间到达目的地。

在这个事件中,可以把交通方式(走路、骑车或开车)认为是原因,花费的时间认为是结果。若老王花了一个小时的时间完成了10公里的距离,那么很大可能是骑车过去的,当然也有较小可能老王是个健身达人跑步过去的,或者开车过去但是堵车很严重。

若老王一共用了两个小时的时间完成了10公里的距离,那么很有可能他是走路过去的。若老王只用了二十分钟,那么很有可能是开车。这种先知道结果,然后由结果估计原因的概率分布,p(交通方式|时间),就是后验概率。

老王早上起床的时候觉得精神不错,想锻炼下身体,决定跑步过去;也可能老王想做个文艺青年试试最近流行的共享单车,决定骑车过去;也可能老王想炫个富,决定开车过去。老王的选择与到达目的地的时间无关。先于结果,确定原因的概率分布,p(交通方式),就是先验概率。

后验概率无法直接获得,因此我们需要找到方法来计算它,而解决方法就是引入贝叶斯公式。后验概率这种表达叫做条件概率(conditional probability),一般写作p(A|B),即仅当B事件发生时A发生的的概率。我们由条件概率计算公式很容易得到

通过上面的贝叶斯公式就可以计算出后验概率了。

当一个 随机过程 在给定现在状态及所有过去状态情况下,其未来状态的条件 概率分布 仅依赖于当前状态;换句话说,在给定现在状态时,它与过去状态(即该过程的历史路径)是条件独立的,那么此 随机过程 即具有 马尔可夫性质 。具有马尔可夫性质的过程通常称之为 马尔可夫过程

在 自动控制 领域中, 李雅普诺夫稳定性 (英语: Lyapunov stability ,或 李亚普诺夫稳定性 )可用来描述一个 动力系统 的稳定性。如果此动力系统任何初始条件在平衡态附近的轨迹均能维持在平衡态附近,那么可以称为在处 李雅普诺夫稳定

若任何初始条件在平衡态附近的轨迹最后都趋近,那么该系统可以称为在处 渐近稳定 指数稳定 可用来保证系统最小的衰减速率,也可以估计轨迹收敛的快慢。

李雅普诺夫稳定性可用在 线性 及 非线性 的系统中。不过线性系统的稳定性可由其他方式求得,因此李雅普诺夫稳定性多半用来分析非线性系统的稳定性。李亚普诺夫稳定性的概念可以延伸到无限维的 流形 ,即为 结构稳定性 ,是考虑微分方程中一群不同但“接近”的解的行为。输入-状态稳定性(ISS)则是将李雅普诺夫稳定性应用在有输入的系统。

统计学中有2种假设,原假设和备择假设。
在原假设会发生的时候,我们计算出来p-value==0.05,认为此事件不会发生,拒绝原假设了,此时我们就会犯第一类错误。(违背小概率事件原理)
在原假设不会发生的时候,我们计算出来p-value==0.95,认为此事件会发生,接受原假设了,此时我们就会犯第二类错误。(违背小概率事件原理)

实际进行假设检验时候,我们要优先避免第一类错误,其次第二类错误。
因为假设检验是具有偏袒性的,只有假设检验拒绝原假设的时候(按照小概率事件下结论),假设检验的正确性才较高,拒绝原假设时我们要尽量避免错误拒绝,因此我们要避免第一类错误。
假设检验在接受原假设的时候,“其结论时很弱的”,一般我们不回让这种结果出现,尽量拒绝原假设。

https://zhuanlan.zhihu.com/p/55780975
https://zhuanlan.zhihu.com/p/26464206
https://zhuanlan.zhihu.com/p/39125269
https://www.zhihu.com/question/24261751/answer/158547500
《概率论与数理统计》第四版



MBA提前面试需要准备什么?
答:MBA面试攻略解读来啦!MBA提前面试一般考试时间为3月-10月,各大MBA院校分为3-5个批次进行。对于MBA提前面试一定要做好准备工作,下面众凯小编总结了MBA面试攻略这些常见问题教教大家该怎么答?MBA面试攻略1:“请你自我介绍一下”思路:1、这是面试的必考题目。2、介绍内容要与个人简历相一致。3、表述...

上海大学数学考研经验分享?
答:判断题涉及的知识点不是很难,证明也是一些比较小的证明,平时注重积累一些经典的反例。 3、复试经验 复试科目: 数学综合(内容包括:泛函分析初步、计算方法、概率论与数理统计) 参考书目: 泛函分析初步 《实变函数与泛函分析概要》(第5版)郑维行 王声望 高等教育出版社 2019年...

东南大学统计学考研经验分享?
答:十月份我学习了茆诗松老师和吕晓玲老师编著的《数理统计学》,这一本书也对《概率论与数理统计》起到补充作用,主要是补充了指数型分布族、完备性和充分完备统计量方面的内容,这部分内容比较难但是也非常重要,是需要好好弄清楚的。 之后就是陆陆续续地将这些书看了第二遍,把一轮中的错题找出来重新做了,整理了...

概率论求解?
答:不懂你这个概率论,随便到什么意思?那你可以上网搜百度上搜一下,或者说你问下你的朋友啊,老师啊,同学啊,在哪啊?甚者我惹或者是你刘向蕙打电话问下他老师,然后他面试一下比较快,或者是你把问题补充清楚一点,然后再发过来了帮你转达 ...

研究生复试考什么内容
答:网络空间安全:科目1:离散数学(约占3/5)、数据库原理(约占1/5)、计算机网络(约占1/5);科目2:概率论与数理统计、数论与代数结构、应用密码学(各约占1/3);2.复试面试内容 基础数学:英语、数学分析、线性代数、常微分方程、复变函数、实变函数;计算数学:英语、数学分析、线性代数、微分方程数值...

和舰科技面试(设备工程师),一般内容会是什么? 非常感谢你们的回答_百 ...
答:也可以应用控制图来使生产过程达到统计控制的状态。产品质量特性值的分布是一种统计分布.因此,绘制控制图需要应用概率论的相关理论和知识。控制图是对生产过程质量的一种记录图形,图上有中心线和上下控制限,并有反映按时间顺序抽取的各样本统计量的数值点。中心线是所控制的统计量的平均值,上下控制界限与中心线相距...

大连理工大学应用数学考研经验分享?
答:专业笔试范围包括:复变函数、近世代数、常微分方程、概率论与数理统计。复试笔试要求四选三作答,笔试侧重基础,基本上包括重点定理的叙述、计算、重要的反例和正例等。了解相关科目核心要点即可,难度不高。英语笔试考察英译汉,可参考统考英语的翻译。听力和口语一同进行,基本会要求自我介绍,之后再问一个问题,比如...

同济大学计算机科学与技术考研经验分享?
答:再就是数学,可以考虑报一些网课,然后要理解,不能单纯求速度,复习资料用李永乐的线代讲义,线代讲义要搞明白每一道题,做到精益求精。概率论也是用李永乐的,还有...面试完不要着急走,第一志愿没被录取的话,电话通知面试第二志愿。 一开始觉得自己第一志愿肯定没戏了,都要放弃了,结果通知我过了,下午和老师讨论以后的...

江南大学工商管理考研经验分享?
答:我所准备的有:1)英语自我介绍与常见问题2)毕业论文设计 3)企业管理时事新闻 4)工商管理经典教科书籍5)821初试融汇贯通 6)导师文献:结合研究的方向 7)本科科研经历8)中文自我介绍并准备简历。 我认为复试有几点黄金原则:1)尽可能展现准备的工作 2)面试不紧张,大方3)流利不卡壳 4)表现出对科研的热情 5)表现出...

中国人民大学国民经济学考研经验分享?
答:二.各科目复习经验分享 【数学】 首先是数学三的准备过程。我的数学考试科目是数学三,它考察高等数学、线性代数、概率论和数理统计三部分。其中高等数学所占分数最高,题型也最为灵活。 线性代数和概率论分值相对较少,但也需要重视基本题型。由于在本科期间没有系统地学过高等数学,所以我在这一科目上投入地精力最大...