面试点点滴滴-深度学习

时间:2024-07-09 07:12:32

1 你了解focal loss吗?

答:(1)alpha系数平衡正负样本,正样本为alpha,负样本为(1-alpha)
(2)gamma系数平衡难易样本,系数为(1-pt)**gamma,pt预测概率越大,说明越容易预测,属于容易样本,所以(1-pt)计算下来的权重值会比较小;pt预测概率越低,说明越难以预测,属于难样本,所以(1-pt)计算下来的权重值会比较大。

2 你了解transformer的qkv是什么意思吗,qkv怎么相互作用的?

答:(1)q是查询向量,k是键向量,v是值向量
(2)q叉乘k的转置,除以根号dk,再取softmax,得到注意力;将得到的注意力再叉乘v的转置

3 说一下BEV感知中2D->3DBEV空间转换的几种方法?

4 heatmap和直接回归的关键点检测方式相比有什么优点?

5 你用了什么剪枝方法,你了解他的原理吗?

6 你了解transformer吗,说一下它的原理?

7 你了解BEV感知吗?

8 你对目标跟踪了解吗,reID网络用的什么距离来计算两个目标的相似性?

9 你们是在什么平台上进行训练的,如何进行多机多卡训练?

10 说一下cuda编程怎么做的?写过吗?

11 你有过tensorRT使用的经验吗?

12 你对建图有什么了解吗?(可能是想问mapTR)

13 既然你说模型中用到了CSPDarkNet,那你说说CSPDarkNet的结构?

14 既然你说熟悉deeplab系列,那你说说deeplabv3+网络的结构?

15 resnet是解决什么样的问题的,为什么resnet能解决这个问题?

16 为什么DETR或者VIT使用了transformer结构,使用同样的数据,训练效果却不必YOLO效果好?

17 sgd,adaw的区别,你们是用的哪个,为什么?

18 为什么yolo比rcnn快?

19 anchor-based和anchor-free的区别?为什么anchor-free比较快?哪些场景适合使用anchor-based?

20 yolov8相比yolov5做了哪些改进?

21 你熟悉地平线芯片的量化流程吗?

22 你熟悉地平线芯片上推理的前处理过程吗?

23 防止过拟合的方法有哪些?

24 L1正则化和L2正则化的区别?

25 你用过哪些激活函数?

26 你用过哪些损失函数?