<?xml version='1.0' encoding='UTF-8'?>
<ArticleSet>
  <Article>
    <Journal>
      <PublisherName>حسین ترحمی اردکانی</PublisherName>
      <JournalTitle>مجله بین‌المللی کامپیوتر، فناوری اطلاعات و هوش مصنوعی</JournalTitle>
      <Issn></Issn>
      <Volume>1</Volume>
      <Issue>1 (پاییز)</Issue>
      <PubDate PubStatus="epublish">
        <Year>2025</Year>
        <Month>12</Month>
        <Day>17</Day>
      </PubDate>
    </Journal>

    <ArticleTitle>Early Detection of Rare Multigenic Diseases:An Integrated Approach Based on Biological Graphs,Graph Neural Networks (GNNs),and Bio-Large Language Models(Bio-LLMs)</ArticleTitle>
    <VernacularTitle>تشخیص زودهنگام بیماری های نادرچندژنی:رویکردی یکپارچه مبتنی بر گراف های زیستی ،شبکه های عصبی گرافی(GNN) و مدل های زبان بزرگ زیستی (Bio-LLMs)</VernacularTitle>
    <FirstPage>61</FirstPage>
    <LastPage>70</LastPage>
    <ELocationID EIdType="doi">10.22051/jera.2021.31891.2698</ELocationID>
    <Language>FA</Language>

    <AuthorList>
      <Author>
        <FirstName>احسان</FirstName>
                <Affiliation>دانشگاه آزاد نجف آباد</Affiliation>
      </Author>
      <Author>
        <FirstName>سید</FirstName>
        <LastName>سینا</LastName>        <Affiliation>دانشگاه علوم پزشکی لرستان</Affiliation>
      </Author>
      <Author>
        <FirstName>زهرا</FirstName>
                <Affiliation>دانشگاه آزاد نجف آباد</Affiliation>
      </Author>
      <Author>
        <FirstName>فاطمه</FirstName>
                <Affiliation>دانشگاه آزاد نجف آباد</Affiliation>
      </Author>
      <Author>
        <FirstName>حسین</FirstName>
                <Affiliation>دانشگاه ازاد نجف آباد</Affiliation>
      </Author>
    </AuthorList>

    <PublicationType></PublicationType>

    <History>
      <PubDate PubStatus="received">
        <Year>2025</Year>
        <Month>11</Month>
        <Day>24</Day>
      </PubDate>
    </History>

    <Abstract>Polygenic Rare Diseases (PRDs) pose a major challenge in early diagnosis and intervention due to their structural complexity and synergistic effects of tens or hundreds of genes. Traditional genetic approaches often fail to identify complex and heterogeneous interaction patterns. This paper introduces an innovative and integrated computational framework for early diagnosis of PRDs that combines three key components: modeling biological structure using Biological Graphs, extracting spatial-functional features with Graph Neural Networks (GNNs), and fusing textual biological knowledge with Bio-Large Language Models (Bio-LLMs). The proposed system, which we call BioGraph-Fusion (BGF), first encodes gene-gene, protein-pathway, and gene-phenotype abnormalities into a multi-modal Heterogeneous Graph. Then, GNNs are used to learn rich representations of the latent features. Finally, the output of the GNN is fed as contextual input to a Bio-LLM (such as BERT-based or GPT-like) to make the final diagnosis decision considering the complex interactions and contextual evidence available in the medical literature. Evaluations on simulated and real datasets (including sequencing and phenotypic data) show that BGF provides higher discrimination performance (AUC) than methods based on single-gene scores (Polygenic Risk Scores (PRS) and pure deep learning models, especially in identifying subgroups of patients with ambiguous initial symptoms.</Abstract>
    <OtherAbstract Language="FA">بیماری‌های نادر چندژنی (Polygenic Rare Diseases - PRDs) به دلیل پیچیدگی ساختاری و اثر هم‌افزایی ده‌ها یا صدها ژن، یک چالش عمده در تشخیص و مداخله زودهنگام محسوب می‌شوند. روش‌های سنتی ژنتیکی اغلب در شناسایی الگوهای تعاملی پیچیده و ناهمگن شکست می‌خورند. این مقاله یک چارچوب محاسباتی نوآورانه و یکپارچه را برای تشخیص زودهنگام PRDs معرفی می‌کند که سه مولفه کلیدی را ترکیب می‌کند: مدل‌سازی ساختار بیولوژیکی با استفاده از گراف‌های زیستی (Biological Graphs)، استخراج ویژگی‌های مکانی-عملکردی با شبکه‌های عصبی گرافی (GNNs)، و ادغام دانش بیولوژیکی متنی با مدل‌های زبان بزرگ زیستی (Bio-LLMs). سیستم پیشنهادی، که آن را BioGraph-Fusion (BGF) می‌نامیم، ابتدا روابط ژن-ژن، پروتئین-مسیر و ناهنجاری‌های ژن-فنوتیپ را به صورت یک گراف چندوجهی (Multi-modal Heterogeneous Graph) کدگذاری می‌کند. سپس، GNNها برای یادگیری بازنمایی‌های غنی از ویژگی‌های نهفته استفاده می‌شوند. در نهایت، خروجی GNN به عنوان ورودی کنتکستی به یک Bio-LLM (مانند BERT-based یا GPT-like) داده می‌شود تا تصمیم نهایی تشخیص با در نظر گرفتن تعاملات پیچیده و شواهد متنی موجود در ادبیات پزشکی صورت گیرد. ارزیابی‌ها بر روی مجموعه‌داده‌های شبیه‌سازی شده و واقعی (شامل داده‌های توالی‌یابی و فنوتیپی) نشان می‌دهد که BGF عملکرد تفکیک‌پذیری (AUC) بالاتری نسبت به روش‌های مبتنی بر امتیازدهی تک‌ژنی (Polygenic Risk Scores - PRS) و مدل‌های صرفاً یادگیری عمیق ارائه می‌دهد، به ویژه در شناسایی زیرگروه‌هایی از بیماران با علائم اولیه مبهم.</OtherAbstract>

    <ObjectList>
      <Object Type="keyword">
        <Param Name="value">Keywords: Rare multigene diseases</Param>
      </Object>
      <Object Type="keyword">
        <Param Name="value">biological graphs</Param>
      </Object>
      <Object Type="keyword">
        <Param Name="value">graph neural networks (GNN)</Param>
      </Object>
      <Object Type="keyword">
        <Param Name="value">biological large language models (Bio-LLMs)</Param>
      </Object>
      <Object Type="keyword">
        <Param Name="value">early detection</Param>
      </Object>
      <Object Type="keyword">
        <Param Name="value">fusion learning.</Param>
      </Object>
    </ObjectList>

    <ArchiveCopySource DocType="pdf">/downloadfilepdf/47016</ArchiveCopySource>
  </Article>
</ArticleSet>
