贵宾会·(中国区)有限公司官网

关于我们 董事长致辞 集团简介 企业文化 组织架构 发展历程 新闻中心 集团新闻 行业资讯 产品中心 蓬生源牌辅酶Q10维生素E软胶囊 注射用丁二磺酸腺苷蛋氨酸 瓜蒌皮注射液 舒肝宁注射液 贵宾会·(中国区)有限公司官网 澳门贵宾会 加入贵宾会 联系我们 大健康产业
新闻中心

官方网站:http://www.wanbang360.com
贵宾会

 

地址:内蒙古呼和浩特市和林格尔县盛

   乐经济园区贵宾会·(中国区)有限公司官网

集团新闻当前位置: 首页 > 新闻中心 > 集团新闻

澳门贵宾大厅|平山绫|中国工程院院士丛斌:生命科学进化带来的思考

来源:贵宾会生物工程 发布日期:2024/09/06 19:34:34

  生命科学的发展进程与自然界生物物种进化过程类似ღ★ღ,都是由简单到复杂澳门贵宾大厅ღ★ღ,由单一到多样澳门贵宾ღ★ღ,由低级到高级ღ★ღ。因此ღ★ღ,可以把生命科学的发展进程类比为生命科学进化ღ★ღ。

  目前ღ★ღ,全世界范围内科技领域都存在“三多三少”的现象科技投入越来越多ღ★ღ、论文越来越多ღ★ღ、专利越来越多ღ★ღ,但颠覆性成果越来越少ღ★ღ、原始创新越来越少ღ★ღ、专利转化越来越少ღ★ღ。科学技术创新模式面临挑战ღ★ღ。就医学科学而言ღ★ღ,如何确立医学领域的前沿科学问题ღ★ღ,突破人类的认知边界ღ★ღ,实现“从0到1”的突破ღ★ღ,是生命科学进化带给我们的深刻思考ღ★ღ。

  当前ღ★ღ,新一轮科技革命和产业变革突飞猛进ღ★ღ,学科交叉融合趋势凸显ღ★ღ,国际科技竞争向基础前沿转移ღ★ღ。国际学术期刊《科学》在庆祝其创刊125周年时ღ★ღ,公布了125个最具挑战性的科学问题ღ★ღ。其中涉及生命科学的问题占46%ღ★ღ,关系宇宙和地球的问题占16%ღ★ღ,与物质科学相关的问题占14%以上ღ★ღ,认知科学问题占9%ღ★ღ,其余问题分别涉及数学与计算机科学ღ★ღ、政治与经济ღ★ღ、能源ღ★ღ、环境和人口等ღ★ღ。

  这125个科学问题ღ★ღ,从基础科学角度可归纳为三个基本问题平山绫ღ★ღ,即对物质本质ღ★ღ、宇宙起源ღ★ღ、生命本质的探索ღ★ღ。一旦这些问题获得突破ღ★ღ,将是科学技术革命性的工作ღ★ღ,是突破人类认知边界的重大创新ღ★ღ。揭示物质的本质是为了破解能量和物质形成之间的关系和能量聚集成物质(宇宙中63种基本粒子)的过程ღ★ღ;研究宇宙的起源是为了破解信息和能量传递ღ★ღ、转换的机制ღ★ღ,物质传送速度的机制ღ★ღ;破解生命的本质是为了揭示生命物质互作的复杂网络动态运行机制ღ★ღ,为探索决定生命ღ★ღ、健康ღ★ღ、疾病的分子网络调控规律提供科学基础ღ★ღ。

  科学研究范式是20世纪60年代由美国科学家托马斯库恩提出的ღ★ღ。科学研究范式是指从事某一领域研究的科学共同体所共同遵从的信念ღ★ღ、理论ღ★ღ、价值观ღ★ღ、科研行为方式ღ★ღ,是科学工作赖以维持运转的学理基础和实践规范ღ★ღ。当原有的范式已不能实现科学理论的实质性突破ღ★ღ,甚至是理论之间多有冲突时ღ★ღ,科学研究范式就会转变生物科技ღ★ღ,ღ★ღ。2007年ღ★ღ,图灵奖得主吉姆格雷提出ღ★ღ:“信息爆炸迫使科学家必须将实验ღ★ღ、理论和计算机计算统一起来ღ★ღ,建立起一种新的科学研究范式ღ★ღ,数据密集型的科学发现(Data-intensiveScientificDiscovery)ღ★ღ,即第四范式ღ★ღ。研究内容由局部走向系统ღ★ღ,方法由单一学科走向学科交叉ღ★ღ,范畴由多层分科走向探索共性ღ★ღ。”

  纵观人类发展历史平山绫ღ★ღ,我们共经历了四次科学研究范式的转变ღ★ღ。第一范式是实验科学范式ღ★ღ,即基于实验或经验的归纳总结(Describingnaturalphenomena)来发现规律的科学范式平山绫ღ★ღ,钻木取火ღ★ღ、比萨斜塔实验澳门贵宾大厅ღ★ღ、拉瓦锡发现的质量守恒定律等ღ★ღ,都属于第一范式ღ★ღ。文艺复兴以后ღ★ღ,第二范式即理论科学开始备受推崇ღ★ღ,它是以理论为基础开展研究ღ★ღ,通过建立数学模型和理论框架(Usingmodels,generalizations)演算ღ★ღ、归纳总结ღ★ღ,来解释自然现象的科学范式ღ★ღ,代表性研究为牛顿定律ღ★ღ、麦克斯韦方程ღ★ღ、门捷列夫的元素周期律ღ★ღ、相对论等ღ★ღ。第三范式是计算机科学范式ღ★ღ,即利用计算机仿真模拟复杂自然现象(Simulatingcomplexphenomena)ღ★ღ,用计算机和AI模拟代替实验研究ღ★ღ、预测结果的科学范式ღ★ღ,如量子化学计算分子动力学模拟ღ★ღ、天气预报模拟ღ★ღ、核试验模拟ღ★ღ、复杂化学反应模拟等ღ★ღ。第四范式是数据密集驱动的范式澳门贵宾大厅ღ★ღ,即以数据密集和智能驱动研究ღ★ღ,发现其中的相关知识和规律的研究范式ღ★ღ。这种范式通过实验ღ★ღ、采集数据或模拟器仿真产生数据ღ★ღ,建立数据集医药检测ღ★ღ,采用数据挖掘ღ★ღ、降维ღ★ღ、升维ღ★ღ、机器学习等方法分析计算ღ★ღ,预测物质性质ღ★ღ、揭示物质互作规律等ღ★ღ,获取之前未知的新知识ღ★ღ。

  今天的科学研究范式已经进展到第四范式ღ★ღ,但对生命科学ღ★ღ,尤其是医学科学的研究来讲澳门贵宾大厅ღ★ღ,还大多停留在第一范式ღ★ღ,即试图通过生物学实验探索一个复杂事物的规律ღ★ღ;也很少采用第二范式ღ★ღ,很少用数理逻辑表征事物之间的逻辑关系ღ★ღ;即便是目前蓬勃兴起的元宇宙技术和数字孪生技术ღ★ღ,实际上也仅停留在第三范式ღ★ღ。要进行未知的生命本质研究ღ★ღ,必须将科学研究范式推进到第四范式ღ★ღ,而其关键就在于大数据的收集ღ★ღ。数据和AI有着极为密切的关系ღ★ღ,如果把AI比作工具ღ★ღ,数据就是生产资料ღ★ღ,只有数据的质量和数量达到一定程度ღ★ღ,才能被AI工具有效利用ღ★ღ。如果原始数据的收集很粗糙贵宾会vip登录ღ★ღ,ღ★ღ,就无法转换为特征性的数据表征ღ★ღ,AI也就不能得出正确结论ღ★ღ。

  20世纪ღ★ღ,生物学从传统的描述性科学转变成为假设驱动的实验科学ღ★ღ。与此紧密联系的是ღ★ღ,还原论占据了统治地位ღ★ღ,即对复杂生命系统的理解可以通过将其拆解为组成部件并逐个研究ღ★ღ。在这种分子生物学“范式”的指导下ღ★ღ,试图通过认识单个基因或蛋白质的结构与功能来阐释个体的生理或病理活动澳门贵宾大厅ღ★ღ。然而ღ★ღ,细胞内的真实世界并非如此ღ★ღ。事实上ღ★ღ,我们很难找到真实世界的因果关系ღ★ღ,即一个原因必须是一个结果的充分条件ღ★ღ。例如ღ★ღ,在真实生命的复杂系统中ღ★ღ,mRNA表达水平及其翻译产生的蛋白质丰度之间存在着复杂的非线性关系ღ★ღ。

  由于慢性病威胁日益增大ღ★ღ,现代医学正进入一个新的转型时期ღ★ღ,有三种主要发展趋势值得我们关注ღ★ღ:一是从简单性思维的分子生物医学转变到复杂性思维的系统生物医学ღ★ღ;二是从基于统计研究证据的循证医学转变到关注个体分子特征的精确医学ღ★ღ;三是从以治病为中心的临床医学转变到以健康为中心的健康医学ღ★ღ。

  要想实现这几个转变ღ★ღ,我们需要厘清目前在生命科学领域ღ★ღ,尤其是医学领域亟待解决的基本科学问题ღ★ღ。在生命科学领域的研究中ღ★ღ,不能仅局限于用先进的观测手段揭示亚细胞水平或分子水平的微观结构ღ★ღ,因为这些被发现的静态结构并不能表征生命的微观动态过程ღ★ღ。一定的组织结构必定为执行一定的功能而存在ღ★ღ。细胞ღ★ღ、亚细胞或分子水平的微观生命活动ღ★ღ,是基于一定的结构存在所表征的结构间系统互作ღ★ღ,并以这种互作行使一定功能的时空变化动态过程ღ★ღ。这就需要我们一要解析细胞内的空间结构ღ★ღ;二要揭示细胞内结构间的网络化系统互作表征ღ★ღ;三要探索细胞内结构间系统互作的网络化动态时空演变规律ღ★ღ。因此ღ★ღ,要建立新的范式研究生命科学领域的这三大基本科学问题ღ★ღ。

  系统生物学通过整合经典的分子细胞生物学ღ★ღ、新兴的生命组学以及信息科学和数学等非生物学科的研究策略和方法平山绫ღ★ღ,对生命复杂系统及其生理病理活动进行系统性ღ★ღ、整体性的检测和分析ღ★ღ。当前ღ★ღ,系统生物学已成为生物学研究方法的主流ღ★ღ。生命组学变化的多维度研究ღ★ღ,可以揭示生物分子间系统性ღ★ღ、网络化ღ★ღ、时相性互作的生命活动规律ღ★ღ。

  系统生物学是一门注重定量研究的学科ღ★ღ,不仅注重分子细胞生物学和组学等“湿实验”(第一范式)ღ★ღ,也同样注重信息科学和计算生物学等“干实验”(第二范式ღ★ღ、第三范式)ღ★ღ。成功的系统生物学研究应该是“干实验”与“湿实验”的紧密结合ღ★ღ。

  人体细胞内是一个多元异构的网络化复杂巨系统ღ★ღ,要破解上述三大基本科学问题贵宾会官网ღ★ღ,需要从揭示细胞内复杂表型的发生与发展的动态过程入手ღ★ღ。复杂表型涉及DNAღ★ღ、RNAღ★ღ、蛋白质及表观遗传等多个分子水平的共同作用形式ღ★ღ。由于研究策略和分析方法的限制ღ★ღ,既往的机制研究缺乏对不同分子水平组学数据的整合分析贵宾厅游戏ღ★ღ,ღ★ღ,无法实现对复杂表型分子机制的充分解释ღ★ღ。因此ღ★ღ,有效整合DNAღ★ღ、RNAღ★ღ、蛋白质ღ★ღ、表观遗传等多组学数据ღ★ღ,不仅可系统揭示复杂表型发生与发展的调控网络与分子特征ღ★ღ,阐释其复杂分子机制ღ★ღ,还有助于确定多组学分子标志物ღ★ღ,在推进分子机制研究的基础上ღ★ღ,实现从分子机制理解到疾病诊疗转化应用的跨越式发展澳门贵宾大厅ღ★ღ,为建立风险评估与精准疾病诊疗模型以及探索有效的监测与预警方法奠定基础ღ★ღ。具体思路如下ღ★ღ:

  高通量技术的发展产生了大量与基因ღ★ღ、蛋白质和代谢相关的生物组学数据ღ★ღ。从这些多源异构的生物组学数据中发现和提炼与疾病相关的信息ღ★ღ,需要借助特征衍生的方法获取具有高区分性的特征ღ★ღ。目前常用的特征衍生方法主要是对现有特征进行线性或非线性的变换ღ★ღ,如四则运算特征衍生ღ★ღ、交叉组合特征衍生ღ★ღ、分组统计特征衍生等ღ★ღ。然而ღ★ღ,在特征衍生的过程中往往会产生大量无效或者低效的特征ღ★ღ。如果把这些冗余特征带入模型中ღ★ღ,会形成维度灾难ღ★ღ,使建模工作无法在合理时间内有效完成ღ★ღ,且冗余信息往往会造成干扰ღ★ღ,导致真正有效的信息被掩盖ღ★ღ,模型预测效能降低ღ★ღ。通过模式识别中的特征选择技术ღ★ღ,对高维生物组学数据中蕴藏的重要信息进行提取ღ★ღ、筛选ღ★ღ、识别和分类ღ★ღ,也是生物组学数据整合分析的关键步骤ღ★ღ。编码器接受原始特征输入ღ★ღ,将原始特征转换成低维的新特征ღ★ღ,解码器接受新特征并将新特征升维至与原始数据相同的维度ღ★ღ,以达到有效数据降维和分子特征提取的目的ღ★ღ。

  不同模型对于输入数据的要求不同ღ★ღ,因此需要在输入数据之前对数据进行预处理ღ★ღ,若选择多层感知机和集成学习模型ღ★ღ,需要进行多组学数据的表征合并ღ★ღ;若选择卷积神经网络和图神经网络模型ღ★ღ,需要进行高维度表征变换ღ★ღ。这样可以将有效特征压缩并进行低维映射ღ★ღ,构建交互调控网络平山绫ღ★ღ,对细胞事件进行预测ღ★ღ。对于多组学数据的模型选择ღ★ღ,目前并没有一个金标准ღ★ღ,往往需要根据具体任务进行选择ღ★ღ。

  值得注意的是ღ★ღ,目前所有原生人工智能算法的开发都基于非生命体的工程数据ღ★ღ,并不能完全适配以动态时空变化为主要异质性特征的生物类数据ღ★ღ。因此ღ★ღ,适配人工智能模型的开发和各级分子互作关系数据库的构建是生物组学数据整合与交互调控网络解析的关键和瓶颈ღ★ღ,需要学科交叉进行联合攻关ღ★ღ。

  现代生命实验科学的主要目的是探寻事物之间的因果关系ღ★ღ,但从大数据中获得的生命科学知识基本上是相关性的ღ★ღ,而非因果性的ღ★ღ。生物体是一个复杂网络的巨系统ღ★ღ,研究者不能控制任何一个生理或病理活动涉及的所有变量ღ★ღ。数据驱动的研究不依赖于假设澳门贵宾大厅ღ★ღ,因而研究者不仅可以避开现存理论的限制澳门vip游戏厅ღ★ღ,ღ★ღ,以及对“实验事实”的主观性选择和判断ღ★ღ,还可以利用各种算法对获得的大数据进行分析ღ★ღ,进而发现全新的现象或者事物之间隐藏着的内在联系ღ★ღ。数据驱动的生命科学研究新范式并不追求结果的完备性ღ★ღ。它采用的是一种全新的工作模式迭代(iterate)ღ★ღ,即每一次研究工作获得的成果都不是完备的ღ★ღ,需要未来研究者在已有版本的基础上不断完善并产生新版本ღ★ღ,就像人类基因组从研究启动到今天的几次迭代不断完善一样ღ★ღ。知识就像“未知海洋”中的“岛屿”ღ★ღ,随着“知识岛屿”的扩大ღ★ღ,“未知水域”同样也在扩大ღ★ღ。不断拓展人类认知边界的挑战在于此ღ★ღ,探索未知的乐趣也在于此ღ★ღ。

贵宾会·(中国区)有限公司官网| http://www.wanbang360.com
贵宾会 | 贵宾会 | 贵宾会 | 贵宾会 | 贵宾会 | 网站地图 | 网站地图_m |