Professional Documents
Culture Documents
HFA Quantitative Interview Problem Sets
HFA Quantitative Interview Problem Sets
1
P
6
其中,EXi = 6
i = 27 ,下求 EN .
i=1
记状态 Si 表示已经投出了 i 个数字 (i = 1, 2, · · · , 6), ∆i 为从状态 Si 到状态
P5
Si+1 所需要投掷次数的期望。在这样的记号下,有 EN = ∆i 。显然 ∆0 = 1,因
i=0
为第一次总可以投出一个数字,对 i ≥ 1,已经投出了 i 个数,还剩 6 − i 个数,所以
6−i 6−i
每次有 6
的概率投出一个新数。于是投的次数可以看成一个 p = 6
的几何随机
6−i
变量,所以 ∆i = 6
。该式对 i = 0 也成立,因此可以计算 EN 为:
X
5 X
5
6 147
EN = ∆i = =
i=0 i=0
6−i 10
代回上式得到最终结果:
X
N
7 147
E( Xi ) = × = 51.45
i=1
2 10
1
个硬币的结果应用全概率公式:
由于已知以上概率为 21 ,因此整理得到:
1
(1 − 2p1 )p = − p1
2
以下对 1 − 2p1 的取值进行分类讨论:
1. 1 − 2p1 ̸= 0:解得
1
2
− p1 1
p= =
1 − 2p1 2
2
例题 4 (HRT-Algo Dev-第一轮电面-2023) Throw a fair dice 100 times, let X be
the sum of the results; flip a fair coin 600 times, let Y be the number of heads.
P(X<Y)=?
色子和硬币的结果分别为伯努利分布和离散均匀分布,由于实验的 n 较大,因
此应考虑使用中心极限定理进行近似。记单次实验的结果为 Xi 和 Yi ,有:
X
100
1
X= Xi , P (Xi = k) = , for k = {1, 2, 3, 4, 5, 6}
i=1
6
X
600
1
Y = Yi , P (Yi = 0) = P (Yi = 1) =
i=1
2
容易求得 Xi 和 Yi 的均值和方差如下:
2
1X 2
6
7 7 35
EXi = , Var (Xi ) = i − =
2 6 i=1 2 12
2 2
1 1 1 1 1 1
EYi = , Var(Yi ) = × + × =
2 2 2 2 2 4
应用中心极限定理,有如下近似分布:
875
X∼N 350,
3
Y ∼ N (300, 150)
由于二者之间独立,因此它们近似服从联合正态分布,从而可知它们的线性组合也近
似服从正态分布:
1325
X −Y ∼N 50,
3
记 Φ 为标准正态分布的分布函数,则所求概率可以表示为:
P (X > Y ) = P (X − Y > 0)
X − Y − 50 50
= P( q > − 1325 )
1325
3
3
√ !
50 3
= 1 − Φ −√
1325
√ !
50 3
=Φ √
1325
记 Sn 为有 n 个点时的交点数。
首先 Sn ≤ n4 ,因为每个交点可以看成一个四边形对角线的交点,而一共有 n4
组 4 个点,所以 Sn ≤ n4 。Sn < n4 当且仅当这些交点有重合的。下证 P (Sn <
3
n
n
4
) = 0,于是 ESn = 4
。
应用数学归纳法:
n
1. n = 4 时,显然 S4 = 1,即总有一个交点,所以 P (Sn < 4
)=0
n+1
n
n
2. 假设对 n = k 成立,下证对 n = k+1 也成立: 首先有恒等式 r
= r
+ r−1
,
因此有:
k+1 k k+1
P Sk+1 < = P Sk < , Sk+1 <
4 4 4
k k
+ P Sk = , Sk+1 − Sk <
4 3
k
所以第 k + 1 个点可能新形成的少于 3
个交点的位置总是有限的 (例如 k = 5
时只有 5 个位置,而圆周上的点有无限个,因此有:
k
P (Sk+1 − Sk < )=0
3
代入上式得到:
k+1
P Sk+1 < =0
4
即证得对 n = k + 1 也成立。
由数学归纳法可知,∀n ∈ N∗ ,均有 P Sn < n
4
=0
4
例题 6 (HRT-第一轮电面) If a basketball player shot 100 shots, missed the first
one and then after the 100 shots had an accuracy of 90%. Is it possible that the
player never had 80% accuracy through all shots.
XN ≤ X100 ≤ 9
结合两不等式得到:
N < 50
而对于 N ≥ 50 则无解,因此得到矛盾,假设不成立。
1
P
6
其中,EXi = 6
i = 72 。求 EN 时,可以将投掷次数视为 p = 1
6
的几何分布,得到:
i=1
EN = 6
代入上式得到: " #
X
N
7
E Xi = × 6 = 21
i=1
2
5
以下分为 With replacement(有放回) 和 Without replacement(无放回) 两种情况讨
论:
综上,所以有无放回的期望相等。
X
a+b
EX = EXi
i=1
代入前式可以得到总握手次数的期望为:
a(a − 1) + b(b − 1)
EX = (a + b)EXi =
a+b−1
6
例题 11 (HRT) 两张红色和两张黑色卡片,随机排序,连续的相同颜色为一个序
列,问序列数的期望。如果是 n 张红色和 n 张黑色,期望是多少?
记 Xi = 1 [第i张牌与第i + 1张牌颜色相同],则总序列数可以表示为:
X
2n−1
X= Xi
i=1
根据期望的线性性,有:
X
2n−1
EX = EXi
i=1
由于两张牌是否构成序列仅与这两张牌有关而与其他牌无关,因此有:
2 n
n−1
E[Xi ] = 2n =
1 2
2
2n − 1
因此得到总序列数的期望为:
EX = (2n − 1)EXi = n − 1
例题 12 (HRT) You have 100 noodles in your soup bowl. Being blindfolded, you
are told to take two ends of some noodles (each end of any noodle has the same
probability of being chosen) in your bowl and connect them. You continue until
there are no free ends. The number of loops formed by the noodles this way is
stochastic. Calculate the expected number of circles.
假设有 n 根面条,取两个面条端点进行连接时有两种情况:
4( n
2) 2n−2
1. 两个端点分属于两根不同的面条:这种情况的概率为 p1 = = ,在这
(2n
2 )
2n−1
种情况下,面条总数会减少 1,而环的数量不变;
2. 两个端点属于同一根面条,这种情况的概率为 p2 = 1 − p1 = 1
2n−1
,在这种情况
下,面条总数会减少 1,而环的数量会增加 1。
记 f (n) 为有 n 根面条时的最终成环的期望数,则有如下递推关系:
1
f (n) = p1 f (n − 1) + p2 (1 + f (n − 1)) = f (n − 1) +
2n − 1
其边界条件为 f (1) = 1,容易得到:
X
n
1
f (n) =
k=1
2k − 1
7
例题 13 (HRT) 假设街上人的身高 iid uniform, 问 in expectation 需要见多少个人
才会遇到一个比第一个人高的人
解法 1:积分法
记 Xi 为第 i 个人的身高,N 为停止时观察的人的数量,设身高服从 U[0, h],那
么有 N 的分布如下:
Z h Z x1 Z x1 Z h
P (N = n) = f (x1 ) f (x2 ) · · · f (xn−1 ) f (xn )dxn dxn−1 · · · dx2 dx1
0 0 0 x1
Z h
= f (x)[F (x)]n−2 (1 − F (x))dx
0
Z 1
= un−2 (1 − u)du
0
1
=
n(n − 1)
因此得到期望为:
X
∞ X
∞
1
EN = nP (N = n) = →∞
k=2 k=2
n−1
解法 2:顺序统计量
N = n 等价于第 1 次抽样为前 n − 1 次抽样中的最大值且第 n 次抽样的结果大于这
一最大值,利用均匀分布顺序统计量的结论有:
Z h Z h
(n − 2)!
P (N = n) = (n − 1)f (x)[F (x)]n−1 dydx
0 (n − 1)! x
Z h
= f (x)[F (x)]n−2 (1 − F (x))dx
0
Z 1
= un−2 (1 − u)du
0
1
=
n(n − 1)
计算期望与方法 1 相同。
解法 3:排列组合
N = n 等价于在前 n 次抽样中,第 1 次抽样为前 n 次抽样中的第二大值,且第 n 次
抽样的结果为最大值,那么考虑其他元素的排列组合,有:
(n − 2)! 1
P (N = n) = =
n! n(n − 1)
计算期望与方法 1 相同。
8
例题 14 (HRT) X, Y 都是高斯随机变量,服从正态分布,(iid standard normal) 求
P (Y > 3X)
Followup: 求 P (Y > 3X|X > 0) 和 P (Y > 3X|Y > 0)
由于 X, Y 服从 iid 标准正态分布,他们也服从联合正态分布,从而有:
从而可以计算得:
1 π Z +∞ r2 r2
= − θ1 e− 2 d
2π 2 0 2
1 π r2
+∞
= − θ1 · −e− 2
2π 2 0
1 1
= − arctan 3
4 2π
因此可以求得:
P (Y > 3X, X > 0) 1 1
P (Y > 3X|X > 0) = = − arctan 3
P (X > 0) 2 π
对于第二个概率,我们可以先考虑:
Z +∞ Z 3x
1 y2 1 x2
P (0 < Y ≤ 3X) = √ e− 2 dy · √ e− 2 dx
0 0 2π 2π
Z +∞ Z 3x
1 x2 +y 2
= e− 2 dydx
2π 0 0
Z +∞ Z θ1
1 r2
= e− 2 rdrdθ
2π 0 0
Z +∞ 2
1 r2 r
= θ1 e− 2 d
2π 0 2
1
= arctan 3
2π
基于这一概率,可以按照以下方法计算目标条件概率:
1
P (Y > 3X|Y > 0) = 1 − P (Y ≤ 3X|Y > 0) = 1 − arctan 3
π
9
例题 15 (HRT) 一个箱子里有 100 美元,有 50% 概率有炸弹,会在 100 天内爆炸,
爆炸概率分布是离散均匀分布。有个人在 n 天买这个箱子,定价应该多少?
Followup: 那个人 10% 概率知道里面有没有炸弹。定价应该多少?
10
例题 17 (HRT) 一直生成 (0,1) 上 iid 的随机数, 直到新的数比上一个数小就停, 问
生成数字个数的期望。
解法一:积分解法
设 F (x) = P (0 ≤ X ≤ x), F ′ (x) = f (x),根据
Z 1 Z x1 Z xn−2 Z 1
P (N = n) = f (x1 )dx1 f (x2 )dx2 ... f (xn−1 )dxn−1 f (xn )dxn
0 0 0 xn−1
Z 1 Z x1 Z xn−2
= f (x1 )dx1 f (x2 )dx2 .... (F (1) − F (xn−1 ))f (xn−1 )dxn−1
0 0 0
= ...
Z 1
1 1
= [ F n−2 (x1 ) − F n−1 (x1 )]f (x1 )dx1
0 (n − 2)! (n − 1)!
1 1 n
=[ F n−1 (x1 ) − F (x1 )]10
(n − 1)! (n)!
n−1
=
n!
本题将 xi 替换为 1 − xi 同理,所以本题随机变量的概率分布为:
n−1
P (N = n) =
n!
求期望得:
X
∞ X
∞
1
E= nP (N = n) = =e
n=2 n=2
(n − 2)!
解法二:顺序统计量
记在 n 次仍未停止的概率为 pn ,则在第 n + 1 次未停止的概率为:
因此有:
Z 1 Z 1
1
P (Xn+1 ≥ Xn |n次未停止) = f(n) (x)f (y)dydx =
0 x n+1
代入上式,并考虑 p1 = 1,可得:
pn 1
pn+1 = =
n+1 (n + 1)!
而第 n 次停止的概率 qn 可以表示为:
n−1
qn = pn−1 P (Xn < Xn−1 |n − 1次未停止) =
n!
进而可以求得期望为:
X
∞
E= nqn = e
n=2
11
例题 18 (HRT) 52 cards. What is the expected number of cards you need to draw
before seeing the first Ace?
情况 1:有放回
此时抽取一张后放回并洗混,与没有抽之前的情况相同,因此期望抽取牌数有以
下关系:
1 12
EX = 1 + (1 + EX)
13 13
求解得到 EX = 13
情况 2:不放回
有 4 张 Ace 和 48 张其他牌,令 Xi = 1 [第i张牌在四张 Ace 前被翻出]。一张其
他牌相对于四张 Ace 有 5 种可能位置,如以下的 * 所示:
∗ A1 ∗ A2 ∗ A3 ∗ A4 ∗
解法一:线性规划
假设 stick 长度为 1,三段长度分别为 a,b,1-a-b。a,b 满足 0<a<1,0<b<1,a+b<1,
所以应当满足:
a+b >1−a−b
a + (1 − a − b) >b
b + (1 − a − b) >a
得到:
a + b > 1/2
b < 1/2
a < 1/2
12
1
如上图所示,概率为红色区域与大三角形的面积比面积比,即 4
解法二:几何关系
在等边三角形中,任意一点 P 向三条边引的垂线长度和为等边三角形的高。小
三角形的三个顶点分别是大三角形的边的中点。只有 P 点在小三角形中,三条边才
1
能组成三角形。概率为红色区域与大三角形的面积比,即 4
例题 20 (HRT 电面-数学) Xi i.i.d. U[0,1]. You get them one by one. Ask about
the expected number of Xi to see so that you get an Xi that is not the smallest
among the first i random variables
解法 1:积分法
首先通过积分求得抽样次数的分布:
Z 1 Z x1 Z xn−2 Z 1
P (N = n) = f (x1 )dx1 f (x2 )dx2 · f (xn−1 )dxn−1 f (xn )dxn
0 0 0 xn−1
Z 1 Z x1 Z xn−2
= f (x1 )dx1 f (x2 )dx2 · (F (1) − F (xn−1 ))f (xn−1 )dxn−1
0 0 0
=·
Z 1
1 1
= [ F n−2 (x1 ) − F n−1 (x1 )]f (x1 )dx1
0 (n − 2)! (n − 1)!
1 1 n
=[ F n−1 (x1 ) − F (x1 )]10
(n − 1)! (n)!
n−1
=
n!
因此期望次数为:
X∞ X∞
1
EN = nP (N = n) = =e
n=2 n=2
(n − 2)!
解法 2:顺序统计量
记在 n 次仍未停止的概率为 pn ,则在第 n + 1 次未停止的概率为:
13
根据顺序统计量结论知其 pdf 为:
因此有:
Z 1 Z x
1
P (Xn+1 ≤ Xn |n次未停止) = f(n) (x)f (y)dydx =
0 0 n+1
代入上式,并考虑 p1 = 1,可得:
pn 1
pn+1 = =
n+1 (n + 1)!
而第 n 次停止的概率 qn 可以表示为:
n−1
qn = pn−1 P (Xn > Xn−1 |n − 1次未停止) =
n!
进而可以求得期望为:
X
∞
E= nqn = e
n=2
14