第四届中国计算机学会生物信息学会议 2019年8月23日-8月25日在广东省广州CBC2019
http://www2.scut.edu.cn/_upload/tpl/08/ae/2222/template2222/main.htm
第四届中国计算机学会生物信息学会议
The Fourth CCF Bioinformatics Conference (CBC 2019)
广州, 2019年8月23日-25日
Keynote Speaker
方向东 研究员,中国科学院北京基因组研究所研究员、“百人计划”研究员
报告题目:基因组大数据与全民健康
摘要:基于高通量测序的基因组技术近几年在国内外均得到了飞速的发展,并成为精准医学和智慧健康的核心内容。随着基因测序的价格越来越低,越来越多的基因数据积累起来,如果能够及时获取、结构化整合、快速分析这些数据,并且有效整合临床医疗与卫生健康数据,才能开展精准的疾病分类及诊断,实现个性化的疾病防治和健康管理的全新模式。其技术核心是根据个体的基因和表型特征,早期快速诊断、适时个性化干预、精准有效治疗。目前关键技术瓶颈是生命健康大数据不能得到有效利用,其主要原因在于:数据多元异构、物理分散,亟需集成与融合,需要开发组学和医疗数据集成引擎,建立标准化的、可拓展、可共享的精准医学大数据平台;在充分保障健康数据的隐私和安全的前提下,有效实现精准医学大数据的互联、互通、互操作。国家主管部门要及时出台相关的法规和标准,加快建设统一权威、互联互通的人口健康信息平台,积极推动并协调多部门信息互通和共享。还需要尽快建立符合精准医疗需求的大型自然人群和专病队列、标准化生物标本库、中国人群多组学参比数据库、重大疾病临床样本生命组学数据库等大数据资源;努力提高海量临床医疗数据的集成度和规范化程度,建立并完善融合生命组学数据跨库关联技术体系,并且及时纳入精准医学的评价和治疗体系,对不同基因型的患者提供个体化诊断及精准药物治疗。
报告人简介:方向东研究员,第一军医大学博士毕业,导师李进教授、戚正武院士。现任中国科学院“基因组科学与信息” 重点实验室副主任,北京基因组研究所“百人计划”研究员,北京市“基因组与精准医学检测技术”重点实验室主任, 《发育医学电子杂志》主编、Genomics Proteomics Bioinformatics副主编, 还担任科技部人类遗传资源管理专家、卫健委遗传咨询能力建设专家委员会和中国遗传学会遗传咨询分会专家委员、国家自然科学基金委员会医学科学部评审组专家。 还是中国转化医学联盟理事、中华医学会医学信息学分会、中国医药生物技术协会基因检测技术分会和生物医学信息技术专业委员会常务委员等。 SCI期刊Genomics Proteomics Bioinformatics和中国科技核心期刊《发育医学电子杂志》副主编、《遗传》杂志编委。 主要从事医学遗传学和基因组学研究。发表SCI论文60余篇;主编专著1部;参编专著6部; 获得国家发明专利授权10项、计算机软件著作权24项、新药证书1项、省部级科技进步奖3项。 主持国家“十三五”重点研发计划“精准医学研究”《精准医学大数据处理和利用的标准化技术体系建设》项目。
黄德双 教授,英国利物浦约翰摩尔大学兼职教授、“百人计划”入选者、IAPR Fellow
报告题目:Motif Mining in Biological Sequences by Deep Neural Networks
摘要:Recent biological studies have shown that binding-site motif mining plays a crucial role in the transcription and translation phases of gene expression, so the study of motif will help to understand the complex biomolecular system and explain disease pathogenesis. Generally, how to carry out an in-depth research on motifs through computational methods has always been one of the core issues in the modeling of life system gene regulation processes. In this report, I will first present the fundamental issue for motif prediction of biological sequences, then systematically present motif prediction of biological sequences in combination with the popular emerging technology “Deep Neural Networks”. Firstly, several classical models for deep neural network and the research status of biological sequence motif prediction will be briefly introduced. Secondly, the existing shortcomings of deep-learning based motif prediction is discussed, and correspondingly a variety of improved motif prediction methods including high-order convolutional neural network architecture, weakly-supervised convolutional neural network architecture, deep-learning based sequence + shape framework and bidirectional recurrent neural network for DNA motif prediction, multi-scale convolution gated recurrent neural network model and improved capsule network for RNA motif prediction, are introduced. Finally, some new research problems in this aspect will be pointed out and over-reviewed.
报告人简介:黄德双教授,工学博士,英国利物浦约翰摩尔大学兼职教授,同济大学特聘教授(二级教授)、博士生导师,中国科技大学博士生导师、兼职教授,2000年度中科院“百人计划”入选者。 同济大学认知互联网国际合作联合实验室主任,机器学习与系统生物学研究所所长, 国家自然科学基金委第十四届专家评审组成员。国际模式识别学会会士(IAPR Fellow),国际智能计算学术会议Founding Chair,国际神经网络学会(INNS)常务理事,IEEE高级会员,上海市计算机学会生物信息学专业委员会主任委员。IEEE/ACM Transactions on Computational Biology and Bioinformatics, Neural Networks等国际杂志编委。已发表学术论文460余篇,其中收录论文210余篇,SCI他引3800余次,入选2014-2018年度爱思唯尔(Elsevier)Scopus数据库中国高被引学者榜单(计算机科学卷),出版专著3本,主编论文集49本, 曾获1997年度第八届全国优秀科技图书二等奖 (排名唯一),2010年度安徽省自然科学一等奖 (排名第一) ,2016年度教育部自然科学一等奖(排名第一),2018年度吴文俊人工智能科技进步一等奖(排名第一)。 发表在Neural Computation,Digital Signal Processing和Methods上的3篇论文分别被选为当期的封面。 已申请发明和实用新型专利34项,其中19项已授权,软件著作权4个。作为客座编辑,在13种国际SCI杂志已编辑出版24期刊物。
李亦学 研究员,中科院上海马普计算生物学研究所研究员、首席科学家
报告题目:肝癌的生物信息学以及多组学研究
摘要:我国肝脏疾病发病率高,相对生存率差 ,治疗困难。我们整合肝癌多组学数据,识别肝癌各个层面的候选驱动基因,利用贝叶斯网络模块的方法计算各层面的候选基因对肝癌表达的调控作用,全面识别肝癌的驱动基因,根据结果对肝癌病人分型,希望增进对肝癌的了解从而辅助肝癌治疗。 临床上肝脏受损时肝细胞重编程对肝脏再生有重要贡献,我们发现了重要的表观遗传因子Arid1a,在肝脏重编程过程中赋予在静息条件下重编程富集基因保守的染色质状态,以应对肝损伤信号快速再生。敲除导致肝细胞重编程缺陷,再生受损、肝功能障碍。希望研究促进基于肝细胞可塑性的再生疗法的发展 我们建立了世界上最大的肝癌细胞系肝癌模型库(LIMORE),作为肝癌精确治疗研究的模式细胞系系统,通过这个模式细胞系系统,我们还建立了一个具有很好的应用价值的数据库体系,数据包括该癌细胞系的全基因组变异信息,基因表达信息,肝癌细胞系对绝大多数抗肿瘤药物的治疗效果和耐药的药物基因组信息。作为临床精准医学研究的应用实例,我们成功地使用LIMORE系统的多组学数据,结合机器学习方法,通过整合分析,发现了一个可用于肝癌治疗一线药物索拉菲尼预后评估的疾病生物标志物,这是一种分泌蛋白,全面的验证实验表明,该疾病生物标志物可以作为索拉非尼预后和疗效诊断的伴随诊断标志物,具有良好的临床应用前景。
报告人简介:李亦学教授,博士毕业于德国海德堡大学理论物理研究所(Heidelberg University, Heidelberg,Germany),博士后研究员任职于欧洲分子生物学实验室(EMBL),现为中科院上海马普计算生物学研究所研究员,博士生导师,中科院特聘研究员,中国科学院上海生命科学研究院营养与健康研究所生物医学大数据中心主任,上海生物信息技术研究中心主任,中国生物信息学会(筹)副理事长,上海生物信息学会理事长,国家蛋白质科学重大研究计划专家组专家,国家生物安全重点专项专家组专家,国家精准医学重点专项专家组专家,上海交通大学教授,复旦大学遗传学教育部协同创新中心前沿生物技术部主任。曾任国家“十五” 863计划生物和农业技术领域生物信息技术主题专家组组长,国家“十一五” 863计划生物医药技术领域专家组专家。国家蛋白质科学研究重大专项《模式生物和细胞等功能系统的系统生物学研究》、《代谢生理活动与病理过程中信号转导网络的系统生物学研究》两任专项项目首席科学家。作为通讯和共同通讯作者在包括 Nature,Science,Nature Communications, Genome Research,Genome Biology,Genome Medicine,Molecular System Biology,Molecular Biology & Evolution,PANS,Diabetes,Molecular Cell Proteomics,Cell Research,Nucleic Acid Research,Bioinformatics,Plos Computational Biology 在内的专业杂志共发表科学论文300篇以上,引用12500次以上。
刘奕志 教授,国自然基金创新群体学术带头人、973计划首席科学家、中山大学中山眼科中心主任、眼科学国家重点实验室主任、眼科医院院长
报告题目:用人工智能进行常见眼病筛查诊断、风险和预后预测的研究
摘要:全球的盲和视觉损伤患者数量已超过2.5亿人。然而因为有经验的眼科医生不足,且患者普遍对疾病缺乏认识,许多患者错过眼病的早期诊断,也少有对疾病发展预后的准确评估。我们利用近年来高速发展的机器学习新算法,用计算机对眼科诊疗大数据进行深度学习,构建了白内障图像识别诊疗决策云平台、青光眼多模态诊断体系、眼底多疾病诊断系统和近视发展预测的一系列人工智能模型,经过内外部的机器数据验证,准确率均可达到90%以上。我们的系统已经在临床上初步投入使用,并取得了临床实践上的真实反馈。在一项多中心临床随机对照研究中,我们的小儿白内障诊疗决策平台对每位患者的平均诊疗用时在3分钟以内,速度远快于人类专家,并且患者在接受人工智能诊疗过程中体现了高度的满意度。人工智能可辅助或部分代替医生,通过网络通讯技术,远程为广大患者提供专家级别的筛查、诊断、诊疗决策、风险评估和预后预测的新型医疗服务。
报告人简介:刘奕志教授,1991年于中山医科大学博士毕业;国自然基金创新群体学术带头人、973计划首席科学家;现任中山大学中山眼科中心主任,眼科医院院长,眼科学国家重点实验室主任,中华医学会眼科分会副主任委员。国务院*特殊津贴专家,*保健会诊专家。白内障科学科带头人。亚太眼科学会常务理事,中华医学会眼科分会白内障人工晶状体学组副组长,广东省医学会副会长,广东省医学会眼科分会主任委员,《Molecular Vision》共同主编,《current Molecular Medicine》杂志副主编,《中华眼科杂志》等核心眼科杂志编委。实现了人类晶状体再生,开拓了利于内源性干细胞治疗疾病的新方向,以通讯作者发表在Nature杂志,并被Nature Medicine杂志评为“2016年度全球医学八大突破性进展”。创新了系列眼科诊治技术:“扭动”白内障粉碎技术在全球广泛应用;曾在 Science 、N Engl J Med 、Lancet 、BMJ 撰写临床述评和技术标准。曾获得“何梁何利”基金科学与技术进步奖、国家科学技术进步二等奖、中国青年科技奖、*保健先进个人、全国“五一”劳动奖章等荣誉。
王建新 教授,中南大学计算机学院院长,医疗大数据应用技术国家工程实验室副主任,首席科学家
报告题目:生物医学大数据处理研究探讨
摘要: 随着生物分析和计算技术的快速发展以及医疗信息化水平的不断提高, 生物医学领域产生了大量的数据,促进了生物医学大数据的形成,也使得生物医学的研究由原来的假设驱动向数据驱动的方式进行转变。生物医学大数据蕴含了极其丰富的信息和知识,是关乎国家持续发展、人类生存与健康的重要战略资源。然而,生物医学数据具有明显的高维、海量以及多源异类异构的特点,传统的分析方法已经难以适应生物医学大数据分析的需求,这使得生物医学大数据的分析与应用成为了当前国内外一个极具挑战性的问题。以深度学习为代表的人工智能技术的兴起给生物医学大数据的分析应用带来了新的曙光,成为了感知生物医学大数据跃动的脉搏,洞悉和发掘生物医学大数据神秘丰富的内在世界的重要手段和工具。我们将在分析生物医学大数据的主要来源以及相关特点的基础上,与大家分享交流目前人工智能技术在电子健康档案、医学影像数据以及生物组学数据的分析应用等方面的相关研究工作和挑战,并就生物医学人工智能应用中存在的主要问题进行简要地分析和探讨。
报告人简介:王建新教授,中南大学计算机学院院长、教授、博士生导师,医疗大数据应用技术国家工程实验室副主任,国务院学位委员会第七届学科评议组(计算机科学与技术)成员、国务院*特殊津贴获得者、ACM Sigbio China主席、中国计算机学会生物信息学专业组副主任委员。国家973计划前期研究专项项目“信息处理算法及物理实现”首席科学家。从事生物信息学、计算机优化算法、网络优化理论等相关的研究工作。近5年来,主持国家自然科学基金重点项目、国家973等科研课题10余项,获授权发明专利15项,在Bioinformatics、TON、TCOM、TCBB、JCSS、Algorithmica、ISMB等刊物和国际会议上发表论文200多篇,出版专著3部,获得省部级科技奖励4项。
王鲁生 教授,香港城市大学计算机科学系教授
报告题目:New Findings for Rearrangement Events and Efficient Algorithms for Longest Common Subsequence with Distance Constraint
摘要: In this talk, we will discuss two problems in computational biology, new findings for rearrangement events and a new algorithm for the problem of longest common subsequence with distance constraint that runs in time O(mlogn), where m is the number of matched pairs of letters between the sequences and n is the length of the short sequence. Genome rearrangements describe changes in the genetic linkage relationship of large chromosomal regions, involving reversals, transpositions, block interchanges, deletions, insertions, fissions, fusions and translocations etc. By comparisons of strains for the same species, we find that the existence of repeats at the breakpoints of a rearrangement event can make the sequences at the breakpoints remain unchanged before and after the rearrangement events. Thus, the conservation of ends of rearrangement events could possibly be a popular phenomenon in many types of genome rearrangement events. The problem of the longest common subsequence with distance constraint is formulated from mapping long reads to reference genomes. An algorithm with running time O(mlogn) was given 40 years ago for the case, where there is no distance constraint. It seems that the old algorithm cannot be extended to work for the new version. Here we give a different algorithm that can solve the problem in O(mlogn) time. We will also discuss the applications of the algorithm in mapping long reads to reference genomes.
报告人简介:王鲁生教授,香港城市大学计算机科学系教授。在加入香港城市大学前,他曾在加州大学戴维斯分校担任博士后研究员一年。从事算法、生物信息学、计算生物学、网络、人工智能等领域的研究工作,在TCBB、Bioinformatics、JCSS、JACM等领域期刊发表论文数百篇。他是IEEE/ACM TCBB、BMC Bioinformatics、International Journal of Knowledge Discovery in Bioinformatics、JCSS的副主编,也是Journal of Bioinformatics and Computational Biology和Journal of Global Optimization的编辑委员会成员。
张晓明 教授,IEEE Fellow、IET/IEE Fellow、BCS Fellow、RSA Fellow、IETI Distinguished Fellow
报告题目:Clustering on Imbalanced Data
摘要:In many practical problems, the number of data forming difference classes can be quite imbalanced, which could make the performance of the most machine learning methods become deteriorate to a certain degree. In general, the problem of learning from imbalanced data is nontrivial and challenging in the field of data engineering and machine learning, which has attracted growing attentions in recent years. In the literature, most of the existing works are focusing on supervised learning only. As far as we know, imbalanced data clustering in unsupervised environment has yet to be well studied. In this talk, we will first formally describe and compare the imbalance problem on supervised and unsupervised learning setting. Then, we describe the key challenge of the problem of clustering on imbalanced data, which is called uniform effect. Accordingly, we propose a solution called SMCL for this problem. The advantages of SMCL are three-fold: (1) It inherits the advantages of competitive learning, and meanwhile is applicable to the imbalanced data clustering; (2) The self-adaptive multi-prototype mechanism uses a proper number of subclusters to represent each cluster with any arbitrary shape; (3) It automatically determines the number of clusters for imbalanced clusters. Empirical studies show the promising results.
报告人简介:CHEUNG, Yiu-ming(张晓明)教授, 2000年获香港中文大学计算机科学系博士学位, IEEE Fellow, IET/IEE Fellow, British Computer Society Fellow (BCS Fellow), Fellow of the Royal Society of Arts (RSA Fellow), Distinguished Fellow of International Engineering and Technology Institute, * (IETI Distinguished Fellow),IEEE香港计算智能(前身为神经网络)学会始创者及前任主席, 而且也是香港浸会大学计算和理论科学研究所的副所长,现任香港浸会大学终身教授。在相关国际著名期刊及学术会议上发表高水平论文220篇,获得国际会议最佳论文奖4篇、香港浸会大学计算机科学系最佳研究奖、第45届日内瓦国际发明展上荣获计算机科学组别优异金奖(即金奖中的*别)、瑞士汽车会大奖二项国际大奖、第七届香港创新科技成就大奖香港创新发明奖金牌、第46届日内瓦国际发明展评判嘉许特别金奖(即金牌中的*别)、罗马尼亚优异奖,住持承担香港研究资助局、国家自然科学基金等科研项目20多项,发明专利3项(第一发明人),担任IJCIAI,ACML,ICIP等多个国际著名会议程序委员会主席、组织委员会主席、分会主席,是湖北省楚天学者及华中科技大学讲座教授,是哈尔滨工业大学深圳研究员客座教授,同时是香港研究资助局优配研究金及优质教育基金评审专家、深圳市科技创新委员会以及香港学术及职业资助资历评委局评委,并担任多个国际期刊的副主编