研究方向

  • 生物序列的语言学建模

  • 将生物序列(DNA/RNA序列和氨基酸序列)视为特殊的生物语言,使用大语言模型和深度学习方法,在序列分析的基础上探索生物分子结构和功能。

  • 生物医学影像分析

  • 设计用于生物医学图像注释、聚类和分割的机器学习算法,包括生物显微图像中分子复杂定位模式的识别,医学影像中生物标志物的鉴定等。

  • 化合物分子以及材料的表征学习

  • 基于机器学习、深度学习方法,提取化合物分子、化学反应特征,提出元素、材料的新型描述符,用于预测化学反应结果及逆合成,设计具有增强性能的新材料等。

  • 机器学习/深度学习模型研究

  • 关注机器学习模型的不确定性问题,包括认知不确定性和偶然不确定性的建模、度量和缓解方法。

研究项目

  • “深海生物原位智能感知技术研究”,国家重点研发计划课题 (2023YFC2811502), 主持, 2023-2026
  • “基于自监督学习的RNA分子表征学习”,国家自然科学基金面上项目 (62272300), 主持, 2023-2026
  • “基于多模态机器学习的非编码RNA亚细胞定位预测”,国家自然科学基金面上项目 (61972251), 主持, 2020-2023
  • “探索可靠筛选microRNA生物标志物的途径与方法”,上海市自然科学基金 (16ZR1448700), 主持, 2016-2019
  • “植物防御反应中转录与转录后协同调控网络研究”,教育部留学回国人员科研启动基金, 主持, 2015-2016