• 【论文笔记】M-Walk: Learning to Walk over Graphs using Monte Carlo Tree Search

    时间:2024-04-03 19:14:41

    本文用了强化学习,在知识图谱上游走,寻找目标节点。一、简介大概意思就是,在知识图谱上,给出一个起始节点和查询(query),然后找到目标节点。 图G包含节点和边。如下图,给出起始节点Obama,query:citizenship,目标节点是USA。  我们要学习一个方法来预测。我们我们将f作为强化学...

  • MOTDT多目标跟踪论文学习笔记

    时间:2024-04-03 19:06:21

    MOTDT是2018年提出的一种非常简单有效且实时的多目标跟踪方法,代码已开源,其整体架构及其中部分模块都可以在工程中部署,效果不错。原文:Real-Time Multiple People Tracking With Deeply Learned Candidate Selection And P...

  • FitNets: Hints for thin deep nets论文笔记

    时间:2024-04-03 18:48:06

    论文地址:https://arxiv.org/abs/1412.6550github地址:https://github.com/adri-romsor/FitNets这篇文章提出一种设置初始参数的算法,目前很多网络的训练需要使用预训练网络参数。对于一个thin但deeper的网络的训练,作者提出知识...

  • 论文笔记:《FoldingNet: Point Cloud Auto-encoder via Deep Grid Deformation》

    时间:2024-04-03 18:42:17

    1.介绍三维点云处理通常被认为比二维图像更具挑战性,这主要是因为点云样本存在于不规则的结构上,而二维图像样本(像素)依赖于图像平面上具有规则间距的2D网格。点云几何通常由一组稀疏的三维点表示。这种数据格式使得传统的深度学习框架难以应用。例如:对于每个样本,传统的卷积神经网络(CNN)要求相邻样本出现...

  • 基于多流双向RNN网络的动作检测(论文笔记)

    时间:2024-04-03 18:22:04

    一、概述动作检测是指在一段视频里,检测出人的动作(已知的几类动作)以及发生的时间和地点。目前关注比较多的是动作识别,也可以叫动作分类。动作识别的任务是,输入一段剪辑好的视频,将其归为N类已知动作中的一类,不需要关心动作发生的时间,因为剪辑好的视频包含了某个动作从开始到结束的完整过程,而且它也不用考虑...

  • 【论文阅读笔记】Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference

    时间:2024-04-03 17:09:57

    该方法的简称为:IAO  该论文提出了一种允许网络在推测时只使用整数计算的方法,即 float32 --> int8.  该文在MobileNets等已经压缩过的网络进行量化,测试数据集为ImageNet分类数据集。不同于其他的方法,在高度冗余的模型,如Alexnet等网络上进行的,且提出的硬...

  • 1604.Person Re-identification in the Wild 论文笔记

    时间:2024-04-03 17:01:17

    1.摘要这篇论文发布了一个可以研究端到端的行人检测-重识别的大规模数据集和一些baselines,baselines主要包括不同检测器和reid识别算法组合的性能,行人检测怎么有助于reid准确率的提升及评估不同检测器对reid的有效性。 贡献:PRW数据集及基于数据集的广泛的benchmark(s...

  • 深度学习论文笔记(异常检测)——f-AnoGAN: Fast unsupervised anomaly detection with generative adversarial networks

    时间:2024-04-03 15:49:39

    文章目录主要工作算法介绍阶段一:训练WGAN阶段二:训练Encoder训练方式一:iziiziizi训练方式二:zizzizziz训练方式三:izifizi_fizif​异常检测实验主要工作提出了一种Encoder,可以快速将图片映射到隐空间中的某个点,接着利用WGAN进行异常检测。在深度学习论文笔...

  • CVPR Oral【论文笔记】Unsupervised Monocular Depth Estimation with Left-Right Consistency

    时间:2024-04-03 15:35:09

    1 Intro基于学习的方法对深度估计有非常好的效果,然而现存的方法都是监督学习需要大量的训练数据,本文作者提出一种单视图的深度估计方法,且不需要ground truth depth data。2 Method建立一种training loss去check左右一致性,可以使训练在不需要ground ...

  • Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning 论文笔记

    时间:2024-04-03 15:23:26

    Abstract近年来,机器视觉图像识别领域取得了很大的突破,非常深的卷积神经网络为此立下首功。一个典型的例子是Inception结构在一个相对较低的计算代价下取得了较好的性能。ILSVRC 2015 竞赛中残差连接和传统网络结构相结合取得了state-of-the-art的性能,几乎和Incept...

  • 论文笔记: Deep Learning based Recommender System: A Survey and New Perspectives

    时间:2024-04-03 15:15:31

    (聊两句,突然记起来以前一个学长说的看论文要能够把论文的亮点挖掘出来,合理的进行概括23333)传统的推荐系统方法获取的user-item关系并不能获取其中非线性以及非平凡的信息,获取非线性以及非平凡的信息恰恰是深度学习所具备的特点.论文对基于深度的学习的推荐系统方法进行了对比以及分类.文章的主要贡...

  • YOLO3D端到端的3d物体检测 论文笔记

    时间:2024-04-03 13:44:50

    YOLO3D: End-to-end real-time 3D Oriented Object Bounding Box Detection from LiDAR Point Cloud论文地址传送门这篇论文将Yolo应用到 3D 物体检测,在KITTI 数据集下利用Titan X GPU达到了40...

  • 行为识别 论文笔记(一):Going Deeper into Action Recognition - A Survey

    时间:2024-04-03 11:58:23

    文章地址:https://arxiv.org/abs/1605.04988First, what is a actionleg movement on a football kick : simple motionjumping for a head-shoot : collective movem...

  • 【论文笔记】Question Answering over Freebase with Multi-Column Convolutional Neural Networks

    时间:2024-04-01 19:50:54

    一、概要   该文章发于ACL 2015,作者提出了一个基于Freebase,使用multi-column convolutional neural networks(MCCNNs)的自动问答模型,分别从答案路径(answer path), 答案背景信息(answer context), 以及答案类...

  • Leveraging the Feature Distribution in Transfer-based Few-Shot Learning——论文翻译&笔记

    时间:2024-04-01 10:12:45

    本人:刚开始读研的小菜鸡~~ 目前方向是基于小样本学习(FSL)的detection,欢迎方向类似的道友一起讨论鸭 ~带带我QQ1149062028摘要在基于迁移的小样本学习中利用特征分布 过去,优秀的backbone和有效的后处理,使得基于transfer的方法达到了最强的性能。基于这一思路,本文...

  • 论文笔记:再看ResNet——ResNet典型网络结构

    时间:2024-03-31 15:17:34

    前言第一次看ResNet论文的时候,由于刚接触深度学习不久,对ResNet的理解仅仅停留在论文中阐述的一些基本思想。加上当时实验室的硬件条件很有限,用的模型基本上以AlexNet和VGG为主,并没有在学习中使用过ResNet。因此忽略了论文中提出的几种典型ResNet网络。一直到工作后,才发现Res...

  • 论文笔记:Adversarially Regularized Graph Autoencoder for Graph Embedding

    时间:2024-03-31 14:00:38

    前言大多数现有的嵌入算法通常集中于保留拓扑结构或最小化图数据的重构错误,但它们大多忽略了图中潜在代码的数据分布,这通常导致在现实世界中的图数据嵌入效果较差。由此作者提出了两种基于对抗正则化的图自动编码方法:**即对抗正则化图自动编码器(ARGA)和对抗正则化变图自动编码器(ARVGA)。**实验证明...

  • VGG论文笔记/小结

    时间:2024-03-31 12:28:34

    VGG论文的主要内容如下:VGG研究了卷积网络深度在大规模的图像识别环境下对准确性的影响。主要贡献是使用非常小的(3×3)卷积滤波器架构对网络深度的增加进行了全面评估,这表明通过将深度推到16-19加权层可以实现对现有技术配置的显著改进。1 不同大小的核的区别,以及Alexnet与VGG对比1.1 ...

  • 【深度学习系列】Voxnet论文学习阅读笔记 及代码相关

    时间:2024-03-31 12:25:40

    【深度学习系列】Voxnet论文阅读笔记 及代码相关论文相关1 Abstract & Introduction2 Approach2.1 Volumetric Occupancy Grid2.1.1占用模型2.1.2分辨率2.2 3D Convolutional Neural Network...

  • ECCV超分辨率方向论文整理笔记

    时间:2024-03-31 07:15:44

    ECCV2020超分辨率篇ECCV的全称是European Conference on Computer Vision(欧洲计算机视觉国际会议) ,是计算机视觉三大顶级会议(另外两个是ICCV]和CVPR)之一,两年一次在欧洲召开。ECCV2020超分方向有24篇,涉及图像超分辨率的有8篇,本文只介...