
Forskare har länge kämpat med att förstå hur vissa proteiner kan bilda amyloider – långa, fibrösa aggregat som spelar centrala roller i sjukdomar som Alzheimers, Parkinsons och typ 2-diabetes. Till skillnad från den noggrant styrda vikningen av vanliga proteiner, kan en och samma proteinsekvens bilda flera olika amyloidformer, så kallade polymorfer. Nu har forskare tagit hjälp av artificiell intelligens för att förutsäga denna komplexa mångfald, med RibbonFold – en AI-modell inspirerad av AlphaFold2.
Vad är amyloider och varför är de svåra att förutsäga?
Amyloider är proteinaggregat som kännetecknas av sina ordnade, fibrösa strukturer, ofta rika på så kallade β-flak. De har blivit kända genom kopplingen till dödliga prionsjukdomar och andra neurodegenerativa tillstånd, men nya upptäckter visar att amyloider även förekommer i friska celler och kan ha funktionella roller, exempelvis i minne och katalys. Problemet är att samma protein kan bilda flera olika fibrilstrukturer beroende på omständigheterna – det vill säga polymorfism.
För att förutsäga vilken struktur en viss amyloid kommer att få, krävs mer än bara sekvensinformation. Miljöfaktorer och närvaron av olika joner eller hjälpämnen (cofaktorer) kan dramatiskt ändra formen och stabiliteten av amyloiden.
Hur fungerar RibbonFold?
RibbonFold bygger på arkitekturen bakom AlphaFold2, en banbrytande AI som gjort det möjligt att förutsäga proteiners 3D-strukturer från deras aminosyrasekvens. Men Amyloiders strukturella mångfald och bristen på data gör problemet mycket svårare. RibbonFold möter denna utmaning genom att:
- Inkoda specifika strukturregler för amyloider, t.ex. deras typiska ”parallel in-register” -arrangemang – där kedjorna i fibrillerna ligger parallellt och i registret, med mycket specifika avstånd mellan samma position av olika kedjor.
- Ta hänsyn till polymorfism: För varje aminosyrasekvens kan flera ursprungliga strukturer (polymorfer) förekomma. RibbonFold tränas därför med en speciell funktionsförlust (loss function) som premierar mångfalden av förutsagda strukturer.
- Diversifiering via MSA: Genom att slumpmässigt välja delmängder av sekvensdatabaser vid varje prediktion ökar modellen sitt spektrum av möjliga strukturer — vilket speglar den biologiska verkligheten bättre.
Resultat och betydelse
Med över 800 unika amyloidstrukturer från Amyloid Atlas 2024 och klustertester visar forskarna att RibbonFold kan uppskatta och generera flera realistiska polymorfstrukturer för samma aminosyrasekvens. Detta är ett viktigt verktyg både för att förstå sjukdomars uppkomst och, på sikt, för att utveckla riktade behandlingar som kan bromsa eller förhindra sjukdomsframkallande proteinaggregation.
Begränsningar och framtida utveckling
RibbonFold hanterar idag bäst monomera ”band” (ribbons), och inte större fibriller med flera protofilament. Forskarna hoppas dock att framtida versioner, tränade på ännu fler och mer varierande strukturer, ska kunna ta itu med även detta. Att förstå och förutsäga amyloidernas mångfald är avgörande för att hitta nya vägar i kampen mot en rad svåra sjukdomar.
FAKTA
- Amyloid: Ett fibrillärt proteinaggregat vars felaktiga bildning är kopplat till flera sjukdomar, men som också har normala biologiska funktioner.
- Polymorfism: Förmågan hos en och samma sekvens att bilda flera distinkt olika 3D-strukturer.
- AlphaFold2: En AI-modell som revolutionerat förmågan att förutsäga proteinstrukturer enbart utifrån sekvensdata.
- ”Parallel in-register”: Ett typiskt arrangemang i amyloidfibriller där motsvarande positioner i varje kedja ligger parallellt och med exakt avstånd mellan varandra.
- Loss function: Ett matematiskt mått inom maskininlärning som styr modellens inlärning genom att straffa felaktiga gissningar och premiera korrekta.
Referenser
- M. Chen, L. Guo, Q. Yuan, D. Wang, X. Wang, P. G. Wolynes. Generating the polymorph landscapes of amyloid fibrils using AI: RibbonFold PNAS, 2025. Fulltext & data | RibbonFold på GitHub
- Bryngelson, J. D. et al. (1995). Funnels, pathways, and the energy landscape of protein folding: A synthesis. Proteins 21, 167–195.
- Schafer, N. P. et al. (2014). Learning to fold proteins using energy landscape theory. Isr. J. Chem. 54, 1311–1337.
- Hadži, S. et al. (2021). The sequence–ensemble relationship in fuzzy protein complexes. PNAS 118, e2020562118.