几乎每个人出生时都携带有50—100个父母没有的突变,这导致了个体之间巨大的基因差异。对医生来说,对某个病人的基因组进行测序以找出病因极具挑战性,因为可能有成千上万个突变与这种疾病有关。“阿尔法错义”应运而生,旨在预测这些基因突变是否有害。
由于碱基置换,与某一氨基酸相对应的密码子变成其他氨基酸的密码子,其结果使合成的蛋白质的活性发生变化或失去活性,这样的突变称为错义突变。每人体内平均携带约9000个错义突变,但在所有可能发生的7100万个错义突变中,科学家只确定了其中0.1%的错义突变的影响。
“阿尔法错义”并非要厘清错义突变如何改变蛋白质的结构或稳定性,以及与其他蛋白质之间的相互作用。相反,它会将每种可能的突变蛋白质的序列与“阿尔法折叠”(AlphaFold)训练过的蛋白质的序列进行比较,查看它看起来是否“自然”,看起来“不自然”的蛋白质会被评为潜在有害。
在对已知突变开展测试时,“阿尔法错义”的表现优于其他方法。研究人员评论道,“阿尔法错义”在几项不同的性能测试中“表现优异”,将有助于科学家确定哪些致病突变应优先研究。不过,错义突变只是众多不同突变中的一种。DNA片段也可以被添加、删除、复制、翻转等。此外,许多致病突变不会改变蛋白质,而是出现在参与调节基因活性的序列附近,在确定病因时也需要考虑这些因素。