پوستر مجله

تشخیص زودهنگام بیماری های نادرچندژنی:رویکردی یکپارچه مبتنی بر گراف های زیستی ،شبکه های عصبی گرافی(GNN) و مدل های زبان بزرگ زیستی (Bio-LLMs)
دوره 1، شماره 1 (پاییز)، 1404، صفحات 61 - 70
نویسندگان : احسان نریمانی* 1، سید سینا نظری سالاری 2، زهرا صفائی 3، فاطمه صفائی 4، حسین سلطانی 5
1- دانشگاه آزاد نجف آباد
2- دانشگاه علوم پزشکی لرستان
3- دانشگاه آزاد نجف آباد
4- دانشگاه آزاد نجف آباد
5- دانشگاه ازاد نجف آباد
چکیده :
بیماری‌های نادر چندژنی (Polygenic Rare Diseases - PRDs) به دلیل پیچیدگی ساختاری و اثر هم‌افزایی ده‌ها یا صدها ژن، یک چالش عمده در تشخیص و مداخله زودهنگام محسوب می‌شوند. روش‌های سنتی ژنتیکی اغلب در شناسایی الگوهای تعاملی پیچیده و ناهمگن شکست می‌خورند. این مقاله یک چارچوب محاسباتی نوآورانه و یکپارچه را برای تشخیص زودهنگام PRDs معرفی می‌کند که سه مولفه کلیدی را ترکیب می‌کند: مدل‌سازی ساختار بیولوژیکی با استفاده از گراف‌های زیستی (Biological Graphs)، استخراج ویژگی‌های مکانی-عملکردی با شبکه‌های عصبی گرافی (GNNs)، و ادغام دانش بیولوژیکی متنی با مدل‌های زبان بزرگ زیستی (Bio-LLMs). سیستم پیشنهادی، که آن را BioGraph-Fusion (BGF) می‌نامیم، ابتدا روابط ژن-ژن، پروتئین-مسیر و ناهنجاری‌های ژن-فنوتیپ را به صورت یک گراف چندوجهی (Multi-modal Heterogeneous Graph) کدگذاری می‌کند. سپس، GNNها برای یادگیری بازنمایی‌های غنی از ویژگی‌های نهفته استفاده می‌شوند. در نهایت، خروجی GNN به عنوان ورودی کنتکستی به یک Bio-LLM (مانند BERT-based یا GPT-like) داده می‌شود تا تصمیم نهایی تشخیص با در نظر گرفتن تعاملات پیچیده و شواهد متنی موجود در ادبیات پزشکی صورت گیرد. ارزیابی‌ها بر روی مجموعه‌داده‌های شبیه‌سازی شده و واقعی (شامل داده‌های توالی‌یابی و فنوتیپی) نشان می‌دهد که BGF عملکرد تفکیک‌پذیری (AUC) بالاتری نسبت به روش‌های مبتنی بر امتیازدهی تک‌ژنی (Polygenic Risk Scores - PRS) و مدل‌های صرفاً یادگیری عمیق ارائه می‌دهد، به ویژه در شناسایی زیرگروه‌هایی از بیماران با علائم اولیه مبهم.