hyperai / awesome-ai4s

AI for Science 论文解读合集(持续更新ing),论文/数据集/教程下载:hyper.ai

Home Page:https://hyper.ai

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Awesome AI for Science

前言

从 2020 年开始,以 AlphaFold 为代表的科研项目将 AI for Science (AI4S) 推向了 AI 应用的主舞台。近年来,从生物医药到天文气象、再到材料化学等基础学科,都成为了 AI 的新战场。

随着越来越多的交叉学科人才开始在其研究领域应用机器学习、深度学习等技术进行数据处理、构建模型,加之跨学科研究团队的合作日益加强,AI4S 的能力被更多科研人员所关注到,但却未达到规模化应用的目标。提高相关研究的可复用性、降低技术门槛、提高数据质量等诸多问题亟待解决。

目前,除了高校、科研机构在积极探索 AI4S 外,多国政府及头部科技企业也都关注到了 AI 革新科研的潜力,并进行了相关的政策疏导与布局,可以说 AI4S 已经是大势所趋。

作为最早一批关注到 AI for Science 的社区,「HyperAI超神经」在陪伴行业成长的同时,也乐于将最新的研究进展与成果进行普适化分享,我们希望通过解读前沿论文与政策的方式,令更多团队看到 AI 对于科研的帮助,为 AI for Science 的发展贡献力量。

目前,HyperAI超神经已经解读分享了百余篇论文,为了便于大家检索,我们将文章根据学科进行分类,并展示了发表期刊及时间,提取了关键词(研究团队、相关研究、数据集等),大家可以点击题目获取论文解读文章(内含完整论文下载链接),或者直接点击论文标题查看原文。

本文档将以开源项目的形式呈现,我们将持续更新解读文章,同时也欢迎大家投稿优秀研究成果,如果您所在的团队/课题组有报道需求,可添加微信:神经星星(微信号:Hyperai01)。

AI+ 生物医药:AI+Biopharmaceutical

  • 科研团队: 军事医学研究院应晓敏研究团队

  • 相关研究: IPBMC 数据集、dogma-full 数据集、teadog-full 数据集、MMIDAS、self-supervised learning、information-theoretic approaches、深度神经网络、SGVB、单细胞多组学马赛克数据

  • 发布期刊: Nature Biotechnology, 2024.01

  • 论文链接: Mosaic integration and knowledge transfer of single-cell multimodal data with MIDAS

  • 科研团队: 中科院罗小舟研究团队

  • 相关研究: kcat/Km 数据集、米氏常数数据集、pH 和温度数据集、DLKcat 数据集、UniKP 框架、ProtT5-XL-UniRef50、SMILES Transformer model、集成性模型、随机森林、极端随机树、线性回归模型

  • 发布期刊: Nature Communications, 2023.12

  • 论文链接: UniKP: a unified framework for the prediction of enzyme kinetic parameters

  • 科研团队: 梅奥诊所的 James L. Kirkland 博士等人

  • 相关研究: 机器学习、随机森林模型、5倍交叉验证、随机森林(RF)模型。发现抗衰老药物 Ginkgetin、Periplocin 和 Oleandrin

  • 发布期刊: Nature Communications, 2023.06

  • 论文链接: Discovery of Senolytics using machine learning

  • 科研团队: 上海交通大学洪亮课题组

  • 相关研究: 微环境感知图神经网络、轻量级图神经去噪网络、自监督预训练、等变图神经网络、超过 40% 的 PROTLGN 设计单点突变体蛋白质优于其野生型对应物

  • 发布期刊: JOURNAL OF CHEMICAL INFORMATION AND MODELING, 2024.04

  • 论文链接: Protein Engineering with Lightweight Graph Denoising Neural Networks

  • 科研团队: 延世大学王建民团队

  • 相关研究: 深度学习、生成式 AI、Transformer、生成神经网络学习、分子动力学、barnase-barstar 复合物轨迹集、蛋白质数据库 Protein Data Bank、AlphaPPIMd 模型、自注意力机制、特征优化模块、注意力分数、全原子模型、模型的平均训练精度为 0.995、平均验证精度为 0.999

  • 发布期刊: Journal of Chemical Theory and Computation, 2024.05

  • 论文链接: Exploring the conformational ensembles of protein-protein complex with transformer-based generative model

  • 科研团队: 俄亥俄州立大学 Jiaman Wu 团队

  • 相关研究: 生物图像数据集 TreeOfLife-10M、多模态模型、计算机视觉、视觉编码器、文本编码器、自回归语言模型、模型在零样本和少样本任务中均表现出色

  • 发布期刊: CVPR 2024, 2024.02

  • 论文链接: BIoCLIP: A Vision Foundation Model for the Tree of Life

  • 科研团队: 清华大学自动化系生命基础模型实验室主任张学工教授、电子系/AIR 马剑竹教授和百图生科宋乐博士

  • 相关研究: 人工智能细胞大模型、人类单细胞组学数据 DISCO,欧洲分子生物学实验室-欧洲生物信息学研究所数据库 EMBL-EBI、GEO 数据集,Single Cell Portal 数据集,HCA 数据集,hECA 数据集、Transformer、非对称的编码器-解码器结构、向量模块、RDA 建模

  • 发布期刊: Nature Methods, 2024.06

  • 论文链接: Large-scale foundation model on single-cell transcriptomics

AI+ 医疗健康:AI+Healthcare

  • 科研团队: 上海交通大学贾伟平、李华婷和盛斌教授团队,清华大学黄天荫研究团队

  • 相关研究: SDPP 数据、DRPS 数据、ResNet-50、眼底模型、自监督学习、 IBS 评估模型、元数据模型、组合模型。将临床应用的平均筛查间隔从 12 个月延长至 31.97 个月

  • 发布期刊: Nature Medicine, 2024.01

  • 论文链接: A deep learning system for predicting time to progression of diabetic retinopathy

  • 科研团队: 伦敦大学学院和 Moorfields 眼科医院的在读博士周玉昆等人

  • 相关研究: 自监督学习、MEH-MIDAS 数据集、EyePACS 数据集、SL-ImageNet、SSL-ImageNet、SSL-Retinal。RETFound 模型预测 4 种疾病的性能均超越对比模型

  • 发布期刊: Nature, 2023.08

  • 论文链接: A foundation model for generalizable disease detection from retinal images

  • 科研团队: Google 研究团队

  • 相关研究: 机器学习、HEAL (The health equity framework) 框架、逻辑回归分析、交叉性分析、健康公平

  • 科研团队: 上海国家应用数学中心(上海交通大学分中心)俞章盛课题组(生命科学技术学院/医学院临床研究中心)

  • 相关研究: 深度学习系统、ST 数据集、integrated graph 和图深度学习的模型、卷积神经网络和图神经网络、外部测试集 MCO-CRC、空间基因表达预测模型、super-patch graph 生存模型、H&E 染色组织学图像 (H&E-stained histological image) 预处理、IGI-DL 模型

  • 发布期刊: Cell Reports Medicine, 2024.05

  • 论文链接: Harnessing TME depicted by histological images to improve cancer prognosis through a deep learning system

  • 科研团队: 深圳大学吴惠思

  • 相关研究: 视觉模型、医学视频分割、超声心动图视频分割模型、记忆强化机制、超声心动图数据集 CAMUS 和 EchoNet-Dynamic、图像编码器、提示编码器、掩码解码器、Softmax 函数、基于 CNN 的 UNet 、基于 Transformer 的 SwinUNet、CNN-Transformer 混合的 H2Former、SonoSAM 模型、SAMUS 模型

  • 发布期刊: CVPR 2024, 2024.05

  • 论文链接: MemSAM: Taming Segment Anything Model forEchocardiography Video Segmentation

AI+ 材料化学:AI+Materials Chemistry

  • 科研团队: 谷歌 DeepMind 研究团队

  • 相关研究: GNoME 数据库、GNoME、SOTA GNN 模型、深度学习、Materials Project、OQMD、WBM、ICSD

  • 发布期刊: Nature, 2023.11

  • 论文链接: Scaling deep learning for materials discovery

  • 科研团队: **科学技术大学的蒋彬课题组

  • 相关研究: 场诱导递归嵌入原子神经网络 FIREANN、FIREANN-wF 模型。可准确描述外场强度和方向的变化时系统能量的变化趋势,还能对任意阶数的系统响应进行预测

  • 发布期刊: Nature Communication, 2023.10

  • 论文链接: Universal machine learning for the response of atomistic systems to external fields

AI+动植物科学:AI+Zoology-Botany

  • 科研团队: 系统生物学家 Patrick Müller 及康斯坦茨大学研究团队

  • 相关研究: ImageNet 数据集、孪生网络、深度学习、迁移学习、三联体损失训练、迭代训练、分任务训练。在没有人为干预的情况下识别胚胎发育特征阶段点

  • 发布期刊: Nature Methods, 2023.11

  • 论文链接: Uncovering developmental time and tempo using deep learning

  • 主要内容: AI 在同源搜索、多重比对及系统发育构建、基因组序列分析、基因发现等生物学领域中,都有丰富的应用案例。作为一名生物学研究人员,能熟练地将机器学习工具整合到数据分析中,必将加速科学发现、提升科研效率。
  • 科研团队: 马萨诸塞州立大学、康奈尔大学的研究团队

  • 相关研究: 计算机建模、eBird 数据集、马尔可夫模型、Hyperparameter grid search、Entropy calibration、k-week forecasting

  • 发布期刊: Methods in Ecology and Evolution, 2023.01

  • 论文链接: BirdFlow: Learning seasonal bird movements from eBird data

AI+农林畜牧业:AI+Agriculture-Forestry-Animal husbandry

  • 科研团队: 以色列特拉维夫大学的研究团队

  • 相关研究: 机器学习模型、SVM、Basic、MFCC、Scattering network、神经网络模型、留一法交叉验证。识别准确率高达 99.7%、4-6 天时番茄尖叫声最大

  • 发布期刊: Cell,2023.03

  • 论文链接: Sounds emitted by plants under stress are airborne and informative

AI+ 气象学:AI+Meteorology

  • 主要内容: 数值天气预报是天气预报的主流方法。它通过数值积分,对地球系统的状态进行逐网格的求解,是一个演绎推理的过程。 2022 年以来,天气预报领域的机器学习模型取得了一系列突破,部分成果可以与欧洲中期天气预报中心的高精度预测匹敌。
  • 主要内容: 2021 年,达摩院与国家气象中心联合研发了 AI 算法用于天气预测,并成功预测了多次强对流天气。同年 9 月,Deepmind 在《Nature》上发表文章,利用深度生成模型进行降雨量的实时预报。

2023 年年初,Deepmind 正式推出了 GraphCast,可以在一分钟内对全球未来 10 天的气象,进行分辨率为 0.25° 的预测。 4 月,南京信息工程大学和上海人工智能实验室合作研发了「风乌」气象预测大模型,误差较 GraphCast 进一步降低。

随后,华为推出了「盘古」气象大模型。由于模型中引出了三维神经网络,「盘古」的预测准确率首次超过了目前最准确的 NWP 预测系统。近期,清华大学和复旦大学相继发布了「NowCastNet」和「伏羲」模型。

AI+ 天文学:AI+Astronomy

  • 科研团队: 西开普大学的研究者

  • 相关研究: CNN、无监督机器学习、Astronomaly、PCA、孤立森林、LOF 算法、iForest 算法、NS 算法、DR 算法。Astronomaly 从异常评分最高的 2,000 张图像中找到了 1,635 处异常

  • 发布期刊: arXiv, 2023.09

  • 论文链接: Astronomaly at Scale: Searching for Anomalies Amongst 4 Million Galaxies

AI+ 自然灾害:AI+Natural Disaster

  • 科研团队: 成都理工大学刘瑞研究团队

  • 相关研究: Sentinel-2 多光谱数据、NASADEM 数据、滑坡数据、GLFE、CNN、DSSA、DSC、DTL、Transformer、深度迁移学习。交并比提高了 1.91% - 24.42%,F1 提高了 1.26% - 18.54%

  • 发布期刊: International Journal of Applied Earth Observation and Geoinformation, 2024.01

  • 论文链接: A deep learning system for predicting time to progression of diabetic retinopathy

  • 科研团队: 加利福尼亚大学洛杉矶分校的研究团队

  • 相关研究: 可叠加神经网络、半自动检测算法、additive ANN、SNN、特征选择模型、多阶段训练

  • 发布期刊: Communications Earth & Environment, 2023.05

  • 论文链接: Landslide susceptibility modeling by interpretable neural network

  • 科研团队: **科学院成都山地灾害与环境研究所欧阳朝军团队

  • 相关研究: 2 千个水文站数据、训练数据集来自美国、英国、中欧、加拿大、跨区域时空集成模型、编码器-解码器、多模态数据、空间静态网格属性数据、残差卷积、

  • 发布期刊: The Innovation, 2024.04

  • 论文链接: Deep learning for cross-region streamflow and flood forecasting at a global scale

AI4S 政策解读:AI4S Policy

其他:Others

  • 科研团队: 谷歌 DeepMind 与利物浦足球俱乐部

  • 相关研究: Geometric deep learning、GNN、predictive model、generative model。射球机会提升 13%

  • 发布期刊: Nature, 2024.03

  • 论文链接: TacticAI: an AI assistant for football tactics

  • 科研团队: 清华大学电子工程系城市科学与计算研究中心、清华大学深圳国际研究生院深圳市泛在数据赋能重点实验室、鹏城实验室的研究团队

  • 相关研究: GC 数据集、UCY 数据集、条件去噪扩散模型、SPDiff、GN、EGCL、LSTM、多帧推演训练算法。5% 训练数据量即可达到最优性能

  • 发布期刊: Nature, 2024.02

  • 论文链接: Social Physics Informed Diffusion Model for Crowd Simulation

  • 科研团队: 上海交通大学梅宏研究团队

  • 相关研究: 科学领域大模型、生成式模拟与反演、自主智能无人实验、大规模可信科研协作、AI 科研助手

  • 发布期刊: **科学院院刊,2023.12

  • 论文链接: AI for Science:智能化科学设施变革基础研究

  • 科研团队: 英伟达研究团队

  • 相关研究: 领域自适应技术、NVIDIA NeMo、domain-adapted retrieval models、RAG、supervised fine-tuning with domain-specific instructions、DAPT、SFT、Tevatron、LLM

  • 发布期刊: arXiv, 2024.04

  • 论文链接: ChipNeMo: Domain-Adapted LLMs for Chip Design

  • 科研团队: 清华大学李勇研究团队

  • 相关研究: 深度强化学习、human–artificial intelligence collaborative 框架、城市规划模型、策略网络、价值网络、GNN。在服务和生态指标上击败了 8 名专业人类规划师

  • 发布期刊: Nature Computational Science, 2023.09

  • 论文链接: Spatial planning of urban communities via deep reinforcement learning

  • 主要内容: 来自斯坦福大学计算机科学与基因技术学院的博士后 Hanchen Wang,与佐治亚理工学院计算科学与工程专业的 Tianfan Fu,以及康奈尔大学计算机系的 Yuanqi Du 等 30 人,回顾了过去十年间,基础科研领域中的 AI 角色,并提出了仍然存在的挑战和不足

  • 论文链接: Scientific discovery in the age of artificial intelligence

  • 科研团队: DeepMind 和威尼斯福斯卡里大学的研究团队

  • 相关研究: I.PHI 数据集、Ithaca 模型、Kullback-Leibler 散度、交叉熵损失函数。文本修复工作的准确率达到 62%,时间归因误差在 30 年内,地域归因准确率达到 71%

  • 发布期刊: Nature, 2020.03

  • 论文链接: Restoring and attributing ancient texts using deep neural networks

  • 科研团队: 香港城市大学的研究团队

  • 相关研究: Predicting NN、深度神经网络。预测准确率达到 99% 以上

  • 发布期刊: ACS Publications, 2022.06

  • 论文链接: Artificial Intelligence in Meta-optics

  • 科研团队: 清华大学电子工程系城市科学与计算研究中心李勇研究团队

  • 相关研究: 智慧城市、时空数据、知识迁移、MetaLA、PEMS-BAy、Transformer 扩散模型、条件生成框架 GPD、神经网络、神经网络参数、预训练 + 提示微调

  • 发布期刊: ICLR 2024, 2024.01

  • 论文链接: Spatio-Temporal Few-Shot Learning via Diffusive Neural Network Generation

  • 主要内容: 斯坦福大学 HAI 研究中心发布《2024 年人工智能指数报告》。这份报告全面追踪了 2023 年全球人工智能的发展趋势。还探讨人工智能在科学和医学领域的深远影响。报告中展示了 2023 年 AI 在科学领域的辉煌成就,以及 AI 在医疗领域取得的重要创新成果,包括 SynthSR 和 ImmunoSEIRA 等突破性技术。此外,还分析了 FDA 对 AI 医疗设备审批的趋势,为行业提供了宝贵的参考。

About

AI for Science 论文解读合集(持续更新ing),论文/数据集/教程下载:hyper.ai

https://hyper.ai

License:Apache License 2.0