首页>全球战略>智库与机构>正文

《人工智能时代的科学:人工智能如何改变科学研究的性质和方法》

2024-09-04 英国皇家科学院(The Royal Society)

2024年5月,英国皇家科学院(The Royal Society)发布了由牛津大学、剑桥大学等各大著名高校、Deepmind等人工智能企业的100余位专家联合撰写的最新报告《人工智能时代的科学:人工智能如何改变科学研究的性质和方法》,深度剖析了人工智能在科研领域的角色、潜力及面临的挑战,进一步强调了在全球科学共同体中构建共识、协同应对人工智能时代科学变革的重要性。

报告指出,近年来,人工智能以前所未有的速度和规模发展,这表明社会可能正在经历一个拐点。ChatGPT和Midjourney等平台可以生成类似人类的文本和图像内容,其传播进一步引发了公众对这一领域的兴趣,也为那些担心人工智能技术如何融入更广泛社会的政策制定者敲响了警钟。此外,著名计算机科学家和公众人物就人工智能风险发表的评论,也将这一话题转变为主流问题。对于科学研究人员来说,人工智能并不是一个新话题,几十年来一直以某种形式被应用。然而,学术界和产业界主导的研究加大了人工智能投资、兴趣和采用力度,引发了一场“深度学习革命”,正在改变科学发现的格局。

在大数据(例如,从望远镜、卫星和其他先进传感器收集到的大量不同形式的数据)的推动下,基于人工智能的技术正在帮助识别大型数据集中的新模式和新关系,而这些模式和关系在其他情况下是很难识别的。这为科学研究带来了巨大的潜力,并鼓励科学家采用更复杂的技术,以超越其领域内的现有方法。人工智能工具能够从现有内容中识别模式并对新内容进行预测,这也使科学家们能够进行更精确的模拟并创建合成数据。这些模拟从大量不同来源(可能是实时)获取数据,可以帮助决策者更准确地评估潜在干预措施的效果,并应对社会或环境挑战。

除了上述机遇之外,人工智能的日益普及也带来了各种挑战。这些挑战包括:可重复性(其他研究人员无法复制使用人工智能工具进行的实验);跨学科性(人工智能与非人工智能学科之间的合作有限,可能导致人工智能在各领域的应用不够严格);以及环境成本(运行大型计算基础设施需要消耗大量能源)。由于人工智能系统的黑箱性质,有效采用开放科学原则的障碍也越来越多。此外,整个科学生态系统中不断变化的激励机制可能会增加研究人员的压力,迫使他们采用先进的人工智能技术,而忽视更传统的方法,或者“擅长人工智能”而不是“擅长科学”。

一、主要结论

1.除了AlphaFold这样的标志性案例,人工智能的应用遍及所有STEM领域,主要集中在医学、材料科学、机器人学、农业、遗传学和计算机科学等领域。科学、技术、工程和数学领域最突出的人工智能技术包括人工神经网络、深度学习、自然语言处理和图像识别。

2.高质量数据是人工智能应用的基础,但研究人员面临着与可用数据的数量、异质性、灵敏度和偏差有关的障碍。一些科学数据(如从望远镜和卫星收集的数据)的总量可达PB级,这使得数据共享和互操作性等目标难以实现。从传感器数据中收集的数据的异质性也带来了困难,而人工智能模型在有偏差的输入上进行训练很可能会导致有偏差的输出。鉴于这些挑战,信息管理人员等对于保持数据质量,以及应对与人工数据生成相关的风险(如数据伪造、中毒或污染)至关重要。

3.产业界和学术机构正在推进用于科学研究的人工智能创新。在过去十年中,与人工智能科学相关的专利申请激增,其中中国、美国、日本和韩国的专利申请数量占主导地位。本报告委托进行的一项研究表明,全球人工智能市场的估值(截至2022年)约为1069.9亿英镑。

4.中国约占专利总量的62%。在欧洲,英国与生命科学相关的人工智能专利所占比例仅次于德国,牛津大学、帝国理工学院和剑桥大学等学术机构在英国专利申请量最高的大学中占有突出地位。Alphabet、西门子、IBM和三星等公司似乎在科学和工程领域展现出相当大的影响力。

5.人工智能工具的黑箱和潜在专有性质限制了基于人工智能的研究的可重复性。文档不足、对重要基础设施(如代码、数据和计算能力)的访问受限以及对人工智能工具如何得出结论(可解释性)缺乏了解等障碍,使独立研究人员难以对实验进行仔细检查、验证和复制。采用开放科学原则和实践有助于应对这些挑战,提高科学的完整性。

6.跨学科合作对于弥合技能差距和提高人工智能在科学研究中的效益至关重要。通过分享彼此领域的知识和技能,人工智能和领域专家(包括艺术、人文和社会科学研究人员)之间的合作有助于构建更有效、更准确的人工智能模型。然而,各自为政的研究环境和不奖励跨学科合作的激励结构阻碍了这种合作。

7.生成式人工智能工具可以帮助推进科学研究。它们有望加快常规科学任务的完成,如处理非结构化数据、解决复杂的编码难题或支持学术文章的多语种翻译。此外,文本生成模型还可用于学术和非学术书面任务,对学术交流和研究评估具有潜在影响。对此,资助者和学术机构正在制定规范,以防止不可取的使用。

二、未来研究的问题

1.人工智能与科学计算基础设施:考虑到不同科学领域的不同需求,如何优化人工智能工作负载,以便在科学研究中充分发挥异构计算基础设施的潜力?

2.人工智能和小数据:越来越多地使用人工智能对研究人员有何影响?只有少量数据可用?如何有效利用人工智能技术来扩充用于训练目的的小型数据集?在应用于小数据场景时,如何在缩小模型规模和保持性能之间进行权衡?

3.人工智能与科学体系中的不平等:在为代表性不足的群体提供公平获取人工智能技术的机会方面存在哪些障碍?如何利用人工智能扩大专家群体的参与,包括代表性不足的学者和非科学家公众?

4.人工智能与知识产权:人工智能系统的哪些输入(数据集、算法或输出)对知识产权保护至关重要,它与开放科学原则在科学中的应用在哪些方面相互影响?

5.人工智能与科学技能的未来:随着人工智能的日益融合,科学研究的技能要求如何变化?未来研究人员必须具备哪些能力,需要做出哪些努力来促进不同科学学科对人工智能的了解?

6.人工智能与学术交流的未来:随着人工智能技术的融入,学术和科学传播的格局将如何演变?如何利用人工智能改善学术成果中的知识翻译、多语言性和多模态性?

7.人工智能与环境可持续性:人工智能在促进科学界的可持续实践方面能发挥什么作用?人工智能算法如何优化环境建模,以提高能效,并促进气候科学、生态学和环境监测等领域的可持续发展?

8.人工智能标准与科学研究:在基于人工智能的科学研究中,人工智能标准如何帮助应对可重复性或互操作性方面的挑战?科学界如何为建立人工智能标准做出贡献?。


关键词: 人工智能   科学研究   变革  

附件下载