研究方向
生物序列的语言学建模
生物医学影像分析
化合物分子以及材料的表征学习
机器学习/深度学习模型研究
将生物序列(DNA/RNA序列和氨基酸序列)视为特殊的生物语言,使用大语言模型和深度学习方法,在序列分析的基础上探索生物分子结构和功能。
设计用于生物医学图像注释、聚类和分割的机器学习算法,包括生物显微图像中分子复杂定位模式的识别,医学影像中生物标志物的鉴定等。
基于机器学习、深度学习方法,提取化合物分子、化学反应特征,提出元素、材料的新型描述符,用于预测化学反应结果及逆合成,设计具有增强性能的新材料等。
关注机器学习模型的不确定性问题,包括认知不确定性和偶然不确定性的建模、度量和缓解方法。