-
کامپیوتر
-
فناوری اطلاعات
-
هوش مصنوعی

تشخیص زودهنگام بیماری های نادرچندژنی:رویکردی یکپارچه مبتنی بر گراف های زیستی ،شبکه های عصبی گرافی(GNN) و مدل های زبان بزرگ زیستی (Bio-LLMs)
دوره 1، شماره 1 (پاییز)، 1404، صفحات 61 - 70
1- دانشگاه آزاد نجف آباد
2- دانشگاه علوم پزشکی لرستان
3- دانشگاه آزاد نجف آباد
4- دانشگاه آزاد نجف آباد
5- دانشگاه ازاد نجف آباد
چکیده :
بیماریهای نادر چندژنی (Polygenic Rare Diseases - PRDs) به دلیل پیچیدگی ساختاری و اثر همافزایی دهها یا صدها ژن، یک چالش عمده در تشخیص و مداخله زودهنگام محسوب میشوند. روشهای سنتی ژنتیکی اغلب در شناسایی الگوهای تعاملی پیچیده و ناهمگن شکست میخورند. این مقاله یک چارچوب محاسباتی نوآورانه و یکپارچه را برای تشخیص زودهنگام PRDs معرفی میکند که سه مولفه کلیدی را ترکیب میکند: مدلسازی ساختار بیولوژیکی با استفاده از گرافهای زیستی (Biological Graphs)، استخراج ویژگیهای مکانی-عملکردی با شبکههای عصبی گرافی (GNNs)، و ادغام دانش بیولوژیکی متنی با مدلهای زبان بزرگ زیستی (Bio-LLMs). سیستم پیشنهادی، که آن را BioGraph-Fusion (BGF) مینامیم، ابتدا روابط ژن-ژن، پروتئین-مسیر و ناهنجاریهای ژن-فنوتیپ را به صورت یک گراف چندوجهی (Multi-modal Heterogeneous Graph) کدگذاری میکند. سپس، GNNها برای یادگیری بازنماییهای غنی از ویژگیهای نهفته استفاده میشوند. در نهایت، خروجی GNN به عنوان ورودی کنتکستی به یک Bio-LLM (مانند BERT-based یا GPT-like) داده میشود تا تصمیم نهایی تشخیص با در نظر گرفتن تعاملات پیچیده و شواهد متنی موجود در ادبیات پزشکی صورت گیرد. ارزیابیها بر روی مجموعهدادههای شبیهسازی شده و واقعی (شامل دادههای توالییابی و فنوتیپی) نشان میدهد که BGF عملکرد تفکیکپذیری (AUC) بالاتری نسبت به روشهای مبتنی بر امتیازدهی تکژنی (Polygenic Risk Scores - PRS) و مدلهای صرفاً یادگیری عمیق ارائه میدهد، به ویژه در شناسایی زیرگروههایی از بیماران با علائم اولیه مبهم.