奖池90万！阿里天池发起肺部CT多病种智能诊断大赛

点击我爱计算机视觉标星，更快获取CVML新技术

全球数据智能大赛(2019)——“数字人体”赛场一：

肺部CT多病种智能诊断

大赛概况

全球数据智能大赛(2019)由广西壮族自治区人民*主办，面向全球人工智能优秀团队征集多领域的算法智力成果和解决方案，集结众智，探索数字广西的蓝图，共领数据智能未来发展。大赛共设“数字人体”和“科技扶农”两个赛场，聚焦医疗和农业真实痛点。

中国是肺部疾病大国，肺炎、肺癌的发病率在全球水平较高。肺部疾病除了会引起与肺部有关的疾病之外，还会引发多种并发症，如：气管炎、心脏疾病、淋巴系统疾病等。作为肺部疾病最有效的无创检测技术，胸部CT影像以其分层薄、高清、低噪声等优点，被广泛用于肺部疾病筛查和辅助诊断。

人工阅片一方面耗时耗力，存在漏检、错检的误差。而海量的影像数据每天都被生产出来，机器阅片帮助人工做病灶位置粗筛、疾病辅助诊已经成为潮流。在人工智能技术加持下，机器阅片具有速度快、准确率高、高并发等优势。以肺结节为例，据不完全统计，目前拿出肺结节产品的企业达到数十家，在核心医院影像科普遍有3家以上的肺结节系统。在肺结节单病种的临床实践中，AI技术已经取得了较好的效果，下一步的重点，是对肺部多种疾病进行智能综合诊治。

赛场一“数字人体”挑战赛以肺部CT多病种智能诊断为课题，开放高质量CT标注数据，要求选手提出并综合运用目标检测、深度学习等人工智能算法，识别肺结节、索条（条索状影）、动脉硬化或钙化、淋巴结钙化等多个病种，避免同一部位单病种的反复筛查，提高检测的速度和精度，辅助医生进行诊断。

赛题背景

大赛旨在通过提供大规模经过严格标注的临床胸部CT影像数据，选手能够提出并综合运用目标检测、深度学习等优秀方法对肺结节、索条、动脉硬化或钙化、淋巴结钙化等病种进行定位和疾病分类工作，提高检测的速度和精度，辅助医生进行诊断。

赛题数据

本次大赛采用的影像数据为两千余份高危患者的低剂量肺部CT扫描，数据格式为mhd，可使用SimpleITK读取。每个三维影像包含一系列胸腔的多个轴向二维切片。影像包含的切片数量不定，随着扫描机器、扫描层厚和患者而变化。比赛会根据初赛、复赛难度系数不同，选择不同层厚的扫描、不同的病种作为赛题。数据集由两名医生进行原始标注，通过标注检验后，由第三名医生进行消歧工作保证数据标注的一致性。

初赛数据标注样例如下所示：从左至右依次为结节、索条、动脉硬化或钙化、淋巴结钙化。

enter image description here

初赛环节允许选手下载数据，初赛提供的数据如下：肺部CT扫描共1837份，训练集1470份，测试A集145份，测试B集222份，层厚以5mm为主（占比超过80%）。在复赛环节，通过线上赛的方式，不允许选手下载数据，在线完成模型训练，同时在线赛也为选手模型的代码复现和成果落地过程中的工程化开发提供支持，复赛预计提供近1000份层厚均为2mm的CT扫描，同时在初赛的基础上检测更具有临床意义的病种。

本次大赛将合理划分训练集和测试集，隐藏部分测试标注数据作为模型测评依据。初赛的数据分为train、testa、testb三部分：train用来给选手训练模型，会提供给选手标注文件annotation.csv，其中记录了与CT扫描对应的标注信息：中心坐标+半径（单位为mm）+类别（1-结节，5-索条，31-动脉硬化或钙化，32-淋巴结钙化）：testa用来进行第一阶段的评测；testb用来进行第二阶段的评测。

本次比赛将从数据安全角度保证医疗数据安全。本次比赛数据集将基于专门的数据安全脱敏软件，所有CT影像数据严格按照国际通行的医疗信息脱敏标准，进行脱敏处理，脱敏信息包括：医院信息、患者信息和标注医师信息，所有数据不可溯，切实保障数据安全，保护患者的隐私。

赛程安排

本次大赛分为初赛、复赛和决赛三个阶段，具体安排和要求如下：

初赛（6月25日-7月25日，UTC+8）

报名成功后，参赛队伍通过天池平台下载数据至本地调试算法，在线提交结果。若参赛队伍在一天内多次提交结果，新结果版本将覆盖旧版本。参赛地点不限。

比赛提供标准训练数据集（含标注），供参赛选手训练算法模型；提供标准测试数据集（无标注），供参赛选手提交评测结果参与排名。

初赛一阶段（7月2-7月24日）：系统每天进行2次评测和排名，评测开始时间为当天12:00和22:00，按照评测指标从高到低进行排序，定时更新排行榜；排行榜将选择参赛队伍在本阶段的历史最优成绩进行排名展示。

初赛二阶段（7月25日）：系统将在7月24日12:00更换测试数据（加密），参赛队伍需再次下载数据文件，7月25日12:00公布新数据集密码。本轮仅2次评测机会，排行榜进行重新排名。

初赛结束的时候，要求TOP80团队提交代码审核，组委会将识别并剔除只靠人工标注而没有算法贡献的队伍，晋级空缺名额后补。初赛成绩符合要求的排名前50名且通过支付宝实名认证的参赛队伍将进入复赛。（认证入口：天池网站-个人中心-认证-支付宝实名认证，要求初赛截至前完成认证，要求7月24日12:00 前完成认证）。

复赛（8月1日—8月28日，UTC+8）

复赛参赛队伍在线获取训练数据和更新的测试数据，在线提交调试算法，在线提交结果，若参赛队伍在一天内多次提交结果，新结果版本将覆盖旧版本。复赛期间限制评测次数，具体的评测安排另行通知。8月28日截止时，要求TOP20团队提交代码审核。复赛代码审核通过的排名前6名的参赛队伍选手代表将受邀参加决赛。

决赛（9月9日，UTC+8）

决赛将以现场答辩会的形式进行，晋级决赛团队需提前准备答辩材料，包括答辩PPT、参赛总结、算法核心代码。

决赛将邀请每支队伍至多3位代表参加，由组委会承担差旅费用。具体安排另行通知。

答辩现场，每支队伍面对评委有15分钟的陈述时间和10分钟的问答时间。评委将根据选手的技术思路、理论深度和现场表现进行综合评分。决赛前，选手需要提交算法答辩材料，页数不少于10页。

决赛分数将根据参赛队伍的算法成绩和答辩成绩加权得出。评分权重：复赛二阶段60%，决赛答辩40%，决赛评审会考虑算法的工程效率。依据决赛分数评选出大赛奖项并举行隆重颁奖。

此外，本次决赛还需要集合算法最终成绩排名，按照顺序遴选后续精益化改进的团队1支，精益化获奖者需要参与后续比赛算法成果优化和工程化落地。

参赛对象

大赛面向全社会开放，个人、高等院校、科研单位、企业、创客团队等人员均可报名参赛，组队上限5人。

注：1）大赛组织机构单位中涉及题目编写、数据接触的人员禁止参赛；2）阿里云员工和赛事合办单位参赛，可参与排名，但不参与评奖及领取奖金。

奖项设置

冠军：1支队伍，奖金30万，颁发获奖证书；

亚军：2支队伍，奖金15万，颁发获奖证书；

季军：3支队伍，奖金5万，颁发获奖证书；

精益大奖：针对上述参赛队伍，遴选出支持成果落地和改进的队伍1支，提供额外奖金15万。按照比赛的综合排名的顺序，结合队伍参与后续优化改进的意愿和客观条件进行评审。

（上述奖项以决赛答辩的最终名次决定）

报名方式

https://tianchi.aliyun.com/competition/entrance/231724/introduction

即日起开始报名，2019年7月24日报名截止。

点击文本左下角阅读原文即可直达官网报名。

算法竞赛交流群

关注更多计算机视觉与机器学习相关竞赛、技术交流、找人组队，欢迎加入52CV-竞赛群，扫码添加CV君拉你入群，（如已为CV君好友，请直接私信）

（务必注明:竞赛）

喜欢在QQ交流的童鞋可以加52CV官方QQ群：702781905。

（不会时时在线，如果没能及时通过还请见谅）

奖池90万！阿里天池发起肺部CT多病种智能诊断大赛

长按关注我爱计算机视觉