撰文 | 春晓
在过去的十年里,人工智能(artificial intelligence,AI)经历了一场改变经济、改变社会、改变科学的革命,以极为惊人的速度解决了曾经各种棘手的问题,特别是AI与神经科学之间的交叉成果倍出,尤其令人兴奋。
2022年7月21日,加拿大麦吉尔大学Blake Richards、美国加州大学伯克利分校Doris Tsao和冷泉港实验室Anthony Zador合作在Cell杂志上发表题为The application of artificial intelligence to biology and neuroscience的评论论文,在这篇评论论文中,作者讨论了人工智能在分析和解释生命科学数据特别是神经科学数据方面的影响,这是人工智能在生物医学领域的最新综述。
1. 什么是人工智能?
人工智能一词没有严格的定义。广义而言,人工智能是指用于模拟人类智能的计算机系统,其目标是执行人类可以执行的任何任务。之所以远景很大是因为人工智能能够看到高维数据,可以在大型数据集中发现学习并进行预测甚至执行任务(图1),补充了人类的优势。人工智能的灵感来源于人的神经系统,几乎所有的现代人工智能系统都依赖于人工神经网络。
图1:“文本到图像”--人工智能的成功范例(系统的输入是文本提示“三个盲人触摸一头大象试图找出它是什么,除了盲人是人形机器人。”,图像由人工智能系统自动生成)【1】
人工智能中有三种从数据中提取结构的经典范例:1)“监督学习”,数据由输入项及其标签成对组成,目标是预测新项目的标签,被视为非线性回归的一种特别强大的形式;2)“无监督学习”,数据没有标签,目标是找到潜在的统计结构(例如,从狩猎照片集合中推断大象和长颈鹿的存在),被视为聚类和主成分分析等经典统计技术的推广;3)“强化学习”,是利用以前的行动中获得的奖励信息,发现实现某些目标的策略,被用于在国际象棋和围棋等游戏,以及新药设计中实现超人表现。
2. 用于分析和解释数据的人工智能工具
人工智能的第一个重要应用是开发分析和解释数据的工具。例如,运动跟踪软件Deeplabcut【2】分析视频以识别和/或标记动物的精确姿势,从而在神经记录或干扰期间更精确地描述动物行为(包括个人和社会群体);显微镜数据突触重建系统MICrONS【3】;从一维氨基酸序列预测三维蛋白质结构的Alphafold-2【4】等重大的突破。
3. 模拟大脑的人工智能工具
人工神经网络最初是按照大脑模型开发的,所以人工智能的重要应用就涉及使用人工神经网络作为神经计算模型,其明确目标是理解和模拟人类认知(图2)。于是引发了一系列的跨学科互动,近年的一系列成功得益于新开发的用于监测大量神经元活动的实验技术,这使得研究人员能够更直接地比较人工神经网络和真实大脑,在相关任务中训练的人工神经网络中出现的表征与真实大脑中出现的表征相似【5】,例如这种对应关系出现在许多大脑区域的前馈和递归神经网络中;与此同时,对理解大脑学习和可塑性感兴趣的计算神经学家开始研究用于训练人工神经网络的技术。最近,美国国防部高级研究计划局提出了一项重大挑战—“重播”(replay),即海马体重新激活已经学习到的记忆【6】;另一个挑战是“基因组瓶颈”(genomic bottleneck),即许多动物(包括人类)的行为是天生的,以某种方式嵌入到基因组中【7】。解决这些挑战,还需要神经科学的支撑。
图2:人工神经网络如何帮助我们理解大脑功能和可塑性。
4. 未来展望
人工智能是分析高维数据的新工具,正在影响所有科学领域。特别是在神经科学领域,人工智能提供了强大的新模型来展示大脑的计算方式。将人工智能用作神经计算模型,可以说是实现了人工智能最初的诞生目的。然而,它还是个叛逆的孩子,也展示出了自己颠覆性的另一面。理解大脑意味着什么?曾经的答案是 “能够通过一个简单的模型解释尽可能多的神经活动。” 然而,随着包含数百万参数的模型的出现,“简单解释”的概念现在变得模糊,那么,用一个包含无数单元的神经网络来解释一个大脑区域的价值是什么?从实现新预测到脑机接口这种实际应用,你可以想出无数种答案。
伟大的物理学家Richard Feynman有句名言:“I do not understand what I cannot build”,但最近人工智能的成功不得不说:“I cannot understand even that which I can build”。人们对机器学习越来越感兴趣,也越来越觉得捉摸不透,即使是深度学习领域,也好像在以一种进化的模式发展,那么,一个最成功的模型究竟是寻找基本原则,还是适者生存呢?
https://doi.org/10.1016/j.cell.2022.06.047
制版人:十一
参考文献
1. Ramesh, A., Dhariwal, P., Nichol, A., Chu, C., and Chen, M. (2022). Hierarchical Text-Conditiona Image Generation with CLIP Latents.Preprint at arXiv.
2. Mathis, A., Mamidanna, P., Cury, K.M., Abe, T., Murthy, V.N., Mathis, M.W., and Bethge, M. (2018). DeepLabCut: Markerless Pose Estimation of User-Defined Body Parts with Deep Learning.Nat. Neurosci.21, 1281–1289.
3. MICrONS Consortium, Alexander Bae, J., Baptiste, M., Bodor, A.L., Brittain, D., Buchanan, J., Castro, M.A., Bumbarger, D.J., Celii, B., Cobos, E., Collman, F., et al. (2021). Functional Connectomics Spanning Multiple Areas of Mouse Visual Cortex.Preprint at bioRxiv.
4. Jumper, J., Evans, R., Pritzel, A., Green, T., Figurnov, M., Ronneberger, O., Tunyasuvunakool, K., Bates, R., Zidek, A., Potapenko, A., et al. (2021). Highly Accurate Protein Structure Prediction with AlphaFold.Nature596, 583–589.
5. Richards, B.A., Lillicrap, T.P., Beaudoin, P., Bengio, Y., Bogacz, R., Christensen, A., Clopath, C., Costa, R.P., de Berker, A., Ganguli, S., et al. (2019). A Deep Learning Framework for Neuroscience.Nat. Neurosci.22, 1761–1770.
6. Kudithipudi, D., Aguilar-Simon, M., Babb, J., Bazhenov, M., Blackiston, D., Bongard, J., Brna, A.P., Raja, S.C., Cheney, N., Clune, J., et al. (2022). Biological Underpinnings for Lifelong Learning Machines.Nature Machine Intelligence4, 196–210.
7. Koulakov, A., Shuvaev, S., Lachi, D., and Zador, A. (2021). Encoding Innate Ability through a Genomic Bottleneck.
转载须知
【原创文章】BioArt原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArt所拥有。BioArt保留所有法定权利,违者必究。
生命科学研究(生命科学研究院)
评论列表 人参与