تحلیل‌های ارتباطی سطوح‌کل ژنومی ساختارهای ژنتیکی متمایزی برای افسردگی زودآغاز و دیرآغاز شناسایی می‌کنند

چکیده

اختلال افسردگی عمده (MDD) یک اختلال شایع و متغیر با اتیولوژی پیچیده است. بررسی گروه‌های همگن‌تر که بر پایه ویژگی‌های بالینی، مانند سن ابتلا، طبقه‌بندی می‌شوند، می‌تواند شناسایی عوامل ژنتیکی زیربنایی را بهبود بخشد و منجر به استراتژی‌های درمانی هدفمندتر شود. ما از بانک‌های زیستی نوردیک همراه با سجلات بهداشتی طولی برای بررسی تفاوت‌های ساختارهای ژنتیکی افسردگی زودآغاز (eoMDD؛ n = 46,708 مورد) و افسردگی دیرآغاز (loMDD؛ n = 37,168 مورد) استفاده کردیم. در نتیجه 12 مکان ژنومی برای eoMDD و دو مکان برای loMDD شناسایی شد. به‌طور کلی، دو زیرنوع MDD همبستگی متوسطی (همبستگی ژنتیکی، rg = 0.58) داشتند و در همبستگی‌های ژنتیکی با صفات مرتبط تفاوت نشان دادند. این نتایج نشان می‌دهد که eoMDD و loMDD دارای امضاهای ژنتیکی جزئی متمایز هستند، به‌ویژه یک امضای توسعه‌ای مغزی خاص برای eoMDD. مهم است که نشان می‌دهیم نمرات خطر پلی‌ژنیک (PRS) برای eoMDD توان پیش‌بینی تلاش برای خودکشی را در اولین 10 سال پس از تشخیص اولیه دارد: خطر مطلق برای تلاش خودکشی در دهکده بالایی PRS برابر 26٪ بود، در مقایسه با 12٪ و 20٪ در دهکده پایینی و گروه میانی به ترتیب. با جمع‌بندی این نتایج، می‌توانند به روش‌های روان‌پزشکی دقیق برای MDD کمک کنند.

موضوعات

  • افسردگی
  • ژنتیک جمعیتی

متن اصلی

مانند سایر اختلالات پیچیده‌ای نظیر دیابت نوع ۲1 و صرع2، احتمالاً ناهمگونی بالینی مشاهده‌شده در اختلال افسردگی عمده (MDD) از ناهمگونی اتیولوژیک زیرین ناشی می‌شود3,4,5. پیشرفت‌های اخیر در مطالعات انجمن ژنتیک سطح‌کل (GWAS) برای MDD، که با نمونه‌های بزرگ از کنسرسیوم ژنومیک روانپزشکی6,7، 23andMe8، برنامه صدایانیک ویترن9 و بانک‌های زیستی جهانی10,11,12,13 تسهیل شده‌اند، پیشرفت قابل‌توجهی در شناسایی واریانت‌های ژنتیکی مرتبط با MDD به‌دست آورده‌اند و شواهدی از تفاوت‌های ژنتیکی بین انواع بالینی مختلف ظاهر شده‌اند3,7,13. علیرغم این تلاش‌ها، جستجوی مکان‌های ژنتیکی خاص برای زیرنوع‌های MDD به‌سختی پیش رفته است که درک ما از اتیولوژی پیچیده آن را محدود می‌کند.

در این مطالعه، منبع مهمی از ناهمگونی MDD را بررسی می‌کنیم؛ یعنی سن ابتلا (AAO)، با تقسیم افراد به افسردگی زودآغاز (eoMDD) و افسردگی دیرآغاز (loMDD) و انجام یک متاآنالیز GWAS بزرگ از دو زیرنوع در همکاری مداوم نوردیک TRYGGVE14,15 (شکل 1). eoMDD با پیامدهای شدید، از جمله علائم روان‌پریشی، رفتارهای خودکشی و هم‌مری‌های دیگر اختلالات روانی و بیماری‌های سوماتیک مرتبط است16,17، در حالی که loMDD تمایل دارد با کاهش توانایی‌های شناختی و افزایش خطر بیماری‌های قلبی‌عروقی ظاهر شود18. تلاش‌های قبلی برای طبقه‌بندی MDD بر اساس AAO به دلیل چالش‌های روش‌شناختی، از جمله تفاوت‌های بزرگ در AAO میان نمونه‌ها، سوگیری یادآوری و اندازه نمونه نسبتاً کوچک، مانع شدند17. برای رفع این مشکلات، از بانک‌های زیستی نوردیک و سجلات بهداشتی طولی هم‌سطح استفاده کردیم تا موارد MDD را بر پایه سن اولین تشخیص MDD دسته‌بندی کنیم15. پژوهش‌های پیشین نشان دادند که سن اولین تشخیص می‌تواند به‌عنوان یک جایگزین مفید برای AAO عمل کند، با توجه به همبستگی ژنتیکی بالا (rg = 0.95) بین دو فنوتیپ16.

شکل 1: طرح مطالعه و مرور تحلیل.

EMR، پرونده پزشکی الکترونیکی.

پس از هم‌سازگاری تعاریف فنوتیپی MDD و سن اولین تشخیص در نه گروه از پنج کشور نوردیک (دانمارک، استونی، فنلاند، نروژ و سوئد؛ روش‌ها)، 151,582 مورد MDD شناسایی کردیم که شامل 46,708 مورد eoMDD با سن اولین تشخیص کمتر از 25 سال (تقریبی به صدک 25 توزیع AAO ≤ 20–21 (مرجع 19؛ روش‌ها)) و 37,168 مورد loMDD با سن اولین تشخیص 50 سال یا بالاتر (تقریبی به صدک 75 توزیع AAO ≥ 44–45 سال؛ روش‌ها) (جدول 1)19 بود. تحلیل‌های GWAS هم‌ساز شده بر روی eoMDD و loMDD را با استفاده از کانتینرهای Singularity20 در هر گروه انجام دادیم و سپس متاآنالیزهایی انجام شد. پس از هم‌سازگاری فنوتیپ، همبستگی‌های ژنتیکی بالایی (rg = 0.7–0.9) بین بزرگ‌ترین گروه‌های نوردیک (کنسرسیوم تحقیقات روانپزشکی یکپارچه (iPSYCH)، بانک زیستی استونی (EstBB)، FinnGen) مشاهده شد (شکل تکمیلی 1). برای ارزیابی قابلیت تعمیم به‌خارج از گروه‌های نوردیک، داده‌های UK Biobank (UKB) را نیز تجزیه و تحلیل کردیم که بر پایه خوداظهاری سن اولین تشخیص استوار است و GWASهای eoMDD و loMDD را با همان قطع‌های سنی انجام دادیم (شکل تکمیلی 1). با این حال، با توجه به تفاوت‌های عمده در نمونه‌ها و فنوتیپ‌ها، تجزیه و تحلیل اصلی براساس گروه‌های نوردیک افراد با نژاد اروپایی انجام شد، در حالی که UKB به‌عنوان گروه مقایسه‌ای برای مکان‌های شناسایی‌شده به‌کار رفته است.

شکل 2: متاآنالیز GWAS زیرنوع MDD در گروه‌های نوردیک و ارث‌پذیری SNP.

a،b، نمودارهای منهتن آینه‌ای نتایج GWAS از کشورهای ترکیبی نوردیک، با استفاده از متاآنالیز وزن‌دار معکوس‑واریانس و آستانه معناداری سرتاسری P < 5 × 10−8 (که در خط افقی نقطه‌چین نشان داده شده است)، برای eoMDD (a) و loMDD (b). c، غنی‌سازی علامت‌های کروماتین باز در GWAS eoMDD و loMDD. خط نقطه‌چین نشان‌دهنده آستانه یک‑طرفه بونفرونی‑تصحیح‌شده P است که برابر P = 0.05/102 = 0.0005. d، ارث‌پذیری مبتنی بر تک‑نوکلئوتید (SNP) \(\left({h}_{{\rm{SNP}}}^{2}\right)\) در دامنه‌ای از برآوردهای شیوع جمعیت، که خطوط نقطه‌چین نشان‌داده‌شده مقدار برآورد نقطه‌ای شیوع جمعیت را نشان می‌دهند. e، همپوشانی ژنتیکی بین MDD کلی، eoMDD و loMDD، که در مثلث بالا خطاهای استاندارد را نشان می‌دهد و در قطر، برآوردهای پلی‌ژنتیک‌پذیری از SBayesS آمده است. * برای loMDD، الگوریتم همگرا نشد، لذا برآورد پلی‌ژنتیک‌پذیری نامطمئن است، هرچند در تمام اجراهای موفق به‌طور مداوم بالاتر از eoMDD بود.

شکل 3: همبستگی‌های ژنتیکی.

a، همبستگی‌های ژنتیکی حاصل از تجزیه‌وتجمیع نمره‌های عدم‑توازن لینکج (LD) (LDSC) مقایسه‌کننده eoMDD (بر پایه GWAS n = 153,532) و loMDD (GWAS n = 158,588) با نتایج کلیدی بهداشتی و اختلالات روانپزشکی مرتبط (GWAS n در جدول تکمیلی 15). نوارهای خطا نشان‌دهنده فواصل اطمینان 95٪ هستند. مقادیر P برای ارتباطات در جدول تکمیلی 8 گزارش شده‌اند. b، نتایج رگرسیون خطی از SEM ژنومی، که در آن نتایج بر پایه eoMDD (GWAS n = 153,532) با کنترل همپوشانی loMDD (GWAS n = 158,588) رگرسیون می‌شوند، و بالعکس. ستارهٔ تک‑ستاره نشان‌دهندهٔ تفاوت معنی‌دار بین eoMDD و loMDD در P < 0.05 است. نوارهای خطا فواصل اطمینان 95٪ را نشان می‌دهند.

شکل 4: روابط علّی بین eoMDD، loMDD و نتایج بهداشتی.

a، نتایج تحلیل‌های MR با MDD به‌عنوان معرض، با آماره IVW به‌عنوان برآورد اندازه اثر MR (به‌ترتیب اثرات اندازه‌گیری شده برای eoMDD). نوارهای خطا فواصل اطمینان 95٪ را نشان می‌دهند. b، اثرها با MDD به‌عنوان خروجی (به‌ترتیب اثر در a). هر دو بخش a و b شامل تعداد SNPهای ابزار استفاده‌شده در تحلیل («SNPs»،)، درصد واریانس توضیح‌داده‌شده توسط SNPهای ابزار در معرض («% R2»)، و قدرت ابزار («F») می‌باشند. ما صرفاً روابط محتمل (مطابق با ترتیب زمانی) را آزمون کردیم؛ روابط غیرممکن، مانند مرگ ناشی از خودکشی به‌عنوان عامل خطر برای MDD، از شکل حذف شد. اگر تحلیل حساسیت MR‑Egger یک تقاطع معنی‌دار (مثلث‌ها) داشته باشد، نشان می‌دهد برآورد MR پلیتروپیک است و نباید تفسیر شود. برآوردهای دارای ستاره پس از اصلاح برای آزمون‌های متعدد (مقادیر دقیق P در جدول تکمیلی 10 گزارش شده) معنادار بودند. نوارهای خطا فواصل اطمینان 95٪ را نشان می‌دهند.

شکل 5: ارتباطات PRS برای eoMDD و loMDD با نتایج بالینی و خودکشی.

a، ارتباطات متاآنالیز شده بین PRS و نتایج MDD در گروه‌های نوردیک، با استفاده از آماری خلاصه GWAS LOO برای eoMDD و loMDD. نوارهای خطا فواصل اطمینان 95٪ را نشان می‌دهند. b، گروه‌های ICD‑10 مرتبط با سلامت ذهنی و خودکشی که با eoMDD و loMDD از PheWAS PRS مرتبط هستند، انتخاب شده‌اند. نوارهای خطا فواصل اطمینان 95٪ را نشان می‌دهند. c، تعداد ارتباطات منحصر به‌فرد و مشترک با eoMDD و loMDD از PheWAS. d، میانگین نمرات علائم خودکشی گزارش‌شده توسط خود (مقیاس خودکشی پی‌کل) بر پایه طبقه‌بندی سِت ده درصد برتر، 80٪ میانی و ده درصد پایین PRS eoMDD. نوارهای خطا فواصل اطمینان 95٪ را نشان می‌دهند. e، نرخ تجمعی وقوع خودکشی در دورهٔ 10 ساله از اولین تشخیص eoMDD، بر پایه طبقه‌بندی سِت ده درصد برتر، میانی و پایین PRS eoMDD. سایهٔ خاکستری فواصل اطمینان 95٪ را نشان می‌دهد.

برای فهمیدن نحوهٔ ارتباط پیش‌زمینه‌های ژنتیکی زیرساختی دو زیرنوع با هم‌مری‌ها، یک مطالعهٔ ارتباط‌پهن‌نقشه‌ای مبتنی بر PRS (PheWAS) با استفاده از مدل‌های رگرسیون لجستیک و داده‌های پروندهٔ بهداشتی الکترونیکی (EHR) بانک زیستی استونی (EstBB) انجام دادیم. تحلیل‌ها با نرم‌افزار R (نسخه 4.3) انجام شد. برای هر کد ICD‑10 که حداقل 50 مورد (n = 1,151) در EHR EstBB موجود بود، دو مدل ساخته شد—PRS برای eoMDD و PRS برای loMDD به‌عنوان متغیر پیش‌بینی‌کننده. این مدل‌ها از PRS نرمال‌شده (نه eoMDD نه loMDD) و یک متغیر خروجی دودویی که حضور یا عدم حضور کد ICD‑10 را نشان می‌دادند، استفاده می‌کردند. داده‌های EHR شامل هر دو دادهٔ مراقبت اولیه و مراقبت ثانویه/داخل‌ستانی از طریق ارتباط با پایگاه دادهٔ e‑health مرکزی استونی، از سال 2004 تا 2022 بود.

پس از اصلاح برای آزمون‌های متعدد (تصحیح بونفرونی، آستانه P برابر 0.05/1,428)، هر دو ارتباط مشترک و منحصر به‌فرد برای هر زیرنوع شناسایی شد (شکل 5c و شکل تکمیلی 8a,b). به‌ویژه، PRS eoMDD ارتباطات منحصر به‌فردی با اختلالات روانپزشکی مانند اختلال رفتار (کد ICD‑10: F91) و اختلال اسکیزوتیپی (F21)، تلاش برای خودکشی/آسیب‌رسانی عمدی به خود (X78) و مشکلات مرتبط با حوادث منفی در دوران کودکی (Z61) یا سایر مشکلات مرتبط با پرورش (Z62) نشان داد. در مقابل، PRS loMDD ارتباط بیشتری با اختلالات روانی و رفتاری ناشی از مصرف مسکن یا هیدروتیک (F13) و اختلال وسواسی‑اجباری (F42) نشان داد (شکل 5b و جدول تکمیلی 12).

به‌دلیل یافته‌های ما دربارهٔ ارتباط ژنتیکی قوی بین eoMDD و تلاش خودکشی، بررسی کردیم که آیا PRS eoMDD می‌تواند خطر تلاش به خودکشی را با استفاده از نظرسنجی‌های خوداظهاری و سوابق پزشکی EstBB پیش‌بینی کند. افراد مبتلا به eoMDD را بر پایه PRS eoMDD به سه زیرگروه تقسیم کردیم (دهکده بالایی، دهکده پایینی و 80٪ میانی). ابتدا، رابطهٔ دوز‑پاسخ بین طبقه‌های PRS eoMDD و میانگین نمرات مقیاس خودکشی پی‌کل (Paykel Suicide Scale)32 را مشاهده کردیم، به این معنا که هرچه PRS eoMDD بالاتر باشد، علائم افکار و تلاش‌های خودکشی نیز بیشتر می‌شود (میانگین نمرات علائم = 0.85، 95٪ CI = 0.79–0.91؛ 1.05 (1.03–1.07)، 1.22 (1.15–1.29) برای طبقه‌های PRS پایین، میانی و بالا به‌ترتیب) (شکل 5d و جدول تکمیلی 13a). سپس نسبت خطر حاد (HRR) و خطر مطلق برای تلاش به خودکشی که در مراقبت اولیه یا تخصصی در دورهٔ 10 ساله پس از اولین تشخیص MDD درمان شد، برآورد شد. در مقایسه با گروه PRS میانی، افراد در دهکده پایین HRR به‌طور معناداری کمتر (0.57، 95٪ CI = 0.49–0.68، P = 1.34 × 10−10) داشتند، در حالی که افراد در دهکده بالایی خطر بیشتری (HRR = 1.13، 95٪ CI = 1.00–1.28، P = 0.058) نشان دادند. علاوه بر این، افراد با PRS پایین به‌طور مستمر خطر مطلق کم برای تلاش به خودکشی در طول زمان پس از اولین تشخیص MDD را نشان دادند (12٪ تجمعی در دورهٔ 10 ساله)، در حالی که تفاوت قابل‌توجهی در خطر مطلق بین گروه‌های میانی و بالایی تا 5.5 سال مشهود نبود، که نرخ تجمعی 10 ساله به‌ترتیب 20٪ و 26٪ بود (شکل 5e).

پژوهش‌های پیشین نشان دادند که شیوع تلاش‌های خودکشی به‌ویژه در دوران نوجوانی و جوانی افزایش قابل‌توجهی دارد33. شناسایی زودهنگام افراد در معرض خطر بالای خودکشی از اهمیت بالینی بالایی برخوردار است. این دوره از شیوع بالای تلاش‌های خودکشی همزمان با خطر eoMDD است، که انجام پیش‌بینی خطر در این زیرگروه را به‌ویژه حائز اهمیت می‌سازد. همراه با یافته‌های ما مبنی بر اینکه eoMDD به‌صورت احتمالی علّی برای تلاش‌های خودکشی است، این نتایج استفادهٔ بالقوهٔ PRS eoMDD در طبقه‌بندی خطر تلاش به خودکشی در میان افراد مبتلا به eoMDD را نشان می‌دهند (جدول تکمیلی 13b) و نیاز به بررسی بیشتر در زمینه پیشگیری از خودکشی را برجسته می‌سازند33.

ژنومیک افسردگی عمده (MDD) پیشرفت شگرفی داشته است؛ از عدم وجود ارتباطات معنی‌دار در سال 2013 تا 697 ارتباط در سال 2025 برای فنوتیپ مورد‑کنترل MDD6,7,34. در این مطالعه، استراتژی فراتر رفتن از طرح مورد‑کنترل برای هدف‌گیری زیرگروه‌های فنوتیپی خاص را بررسی کردیم تا ناهمگونی ژنتیکی در MDD را کاهش دهیم. داده‌های بهداشتی هم‌ساز و تجزیه‌وتحلیل‌های ما در کشورهای مختلف قدرت تحلیلی را ارتقا داد و سیگنال‌های ژنتیکی متفاوت در زیرنوع‌های مبتنی بر AAO را شناسایی کرد. چنین رویکردی می‌تواند به سایر ویژگی‌های بالینی، مانند علائم گیاهی، ویژگی‌های روان‌پریشی و ناتوانی، گسترش یابد تا زیرنوع‌های بالینی مرتبط بیشتری از MDD هدف‌گذاری شود3,5,35,36. این یافته‌ها می‌توانند در راهنمایی درمان هدفمند و پیشگیری در روانپزشکی نقش مهمی ایفا کنند.

روش‌ها

جمعیت مورد مطالعه

برای انجام یک GWAS بزرگ از زیرنوع‌های MDD مبتنی بر AAO با فنوتیپ‌های همسان، نه گروه از پنج کشور نوردیک (دانمارک، سوئد، نروژ، فنلاند و استونی) و یک گروه مقایسه‌ای از یک کشور غیرنوردیک (انگلستان: UKB) شناسایی کردیم. بسیاری از این گروه‌ها بانک‌های زیستی بزرگی هستند که با سوابق پزشکی طولانی‌مدت در سامانه‌های ملی بیماران مرتبط‌اند، از جمله iPSYCH، FinnGen، مطالعات مادر‑پدر‑فرزند نروژ (MoBa)، UKB و EstBB (جزئیات گروه‌ها در روش‌های تکمیلی). این مطالعه توسط مرجع اخلاقی سوئد (شماره پرونده 2023-03073) تأیید شد و هر گروه توسط هیئت‌های بررسی مؤسسه‌ای مربوطه تأیید شد.

فنوتیپ‌ها

ما تلاش قبلی خود را در هم‌سازسازی فنوتیپ‌های مبتنی بر ثبت‌های سامانه‌ای از MDD، سن اولین تشخیص و پیامدهای آن در سه کشور اسکاندیناوی، به سایر کشورهای نوردیک با سامانه‌های مشابه گسترش دادیم15. با استفاده از سامانه‌های ملی بیماران، ابتدا اطلاعاتی دربارهٔ تشخیص‌های MDD با کدهای ICD‑10 F32 (دوره افسردگی) یا F33 (دوره‌های مکرر افسردگی) استخراج کردیم، به‌طوری که مواردی با تشخیص دو قطبی یا اسکیزوفرنی (کدهای ICD‑10: F30/F31/F32/F33, F20/F23.1/F23.2/F25) حذف شدند (جدول تکمیلی 14)، که منجر به مجموع n = 151,582 مورد MDD در کشورهای نوردیک شد. پژوهش قبلی ما نشان داد همبستگی ژنتیکی بالایی (rg ≈ 0.95) بین AAO و سن اولین تشخیص MDD وجود دارد16، و متوسط زمان ابتلا به‌طور متوسط 5 سال پیش از اولین تشخیص است16. بنابراین، سن اولین تشخیص برای جمعیت بیماران MDD استخراج شد و به‌عنوان جایگزین برای AAO در تعریف eoMDD و loMDD استفاده شد. آستانه‌ها بر پایه مرور دقیق ادبیات و داده‌های تجربی سامانه‌ای سوئد انتخاب شدند. متاآنالیز قبلی گزارش داد که میانگین AAO برای اختلال افسردگی در حدود 30 سال است، با صدک ۲۵ و ۷۵ در سن ۲۱ و ۴۴ به ترتیب15,19؛ داده‌های سامانه‌ای سوئد نشان داد که برای تشخیص متخصص MDD، صدک ۲۵ و ۷۵ به ترتیب در سن ۲۵ و ۴۵ سال بود15. لذا افرادی که اولین تماس درمانی متخصص با MDD آن‌ها در یا قبل از سن ۲۵ سال (تقریبی به صدک ۲۵ توزیع AAO ≤ 20–21) به‌عنوان موارد eoMDD (n = 46,708) در نظر گرفته شد؛ موارد loMDD آن‌ها در یا بعد از سن ۵۰ سال (تقریبی به صدک ۷۵ توزیع AAO ≥ 44–45) (n = 37,168) (جدول 1)19. گروه‌های کنترل شامل افرادی بودند که تشخیص MDD، دو قطبی یا اسکیزوفرنی در آن‌ها ثبت نشده بود. به‌دلیل تفاوت در طراحی گروه، کنترل‌ها در گروه‌های مبتنی بر جمعیت EstBB، FinnGen, MoBa و UKB با موارد مطابقت داده شد. گروه‌های دانمارکی و سوئدی که از طراحی مورد‑کوهورت و مورد‑کنترل استفاده کردند، نیازی به تطبیق کنترل نداشتند.

نرم‌افزارهای کانتینری برای تحلیل‌های توزیعی

به‌منظور اطمینان از شفافیت و قابلیت تکرار تحلیل‌ها در سایت‌های مختلف، نرم‌افزارهای کانتینری و کدهای همراه برای پردازش داده‌ها و تحلیل‌ها (مانند GWAS، PRS، LDSC) توسعه دادیم و این کانتینرها را در سایت‌های پژوهش توزیع کردیم. به‌طور خلاصه، ابزارها و وابستگی‌های اصلی در ماشین‌های مجازی مبتنی بر سیستم‌عامل Ubuntu 20.04 LTS از طریق Docker (https://docker.com) نصب شد و به فرمت Singularity Image File (https://sylabs.io) برای توزیع بسته‌بندی شد20. تمام کدهای منبع و فایل‌ها به‌صورت عمومی در GitHub در دسترس هستند و تحت مجوز GNU General Public License (GPL v.3.0) منتشر شده‌اند. ابزارهای منتشرشده تحت سایر مجوزها، مجوزهای اصلی خود را حفظ می‌کنند.

GWAS و متاآنالیز

GWAS افراد با نژاد اروپایی در هر گروه با استفاده از بسته نرم‌افزاری REGENIE37 که در کانتینرهای نرم‌افزاری موجود است20 انجام شد. تحلیل‌ها با تصحیح برای ده مؤلفهٔ اصلی اول (PCs)، سن و جنس انجام شد. آمارهای خلاصهٔ هر گروه در متاآنالیز اثرات ثابت در METAL38 با دستور ‘SCHEME STDERR’ بر پایه وزن معکوس واریانس خطاهای استاندارد مربوط به همهٔ فنوتیپ‌ها ترکیب شد، که منجر به 151,582 مورد و 362,873 کنترل برای تمام MDD، 46,708 مورد و 106,824 کنترل برای eoMDD، و 37,168 مورد و 121,420 کنترل برای loMDD شد. فیلترهای اضافی بر روی واریانس‌ها اعمال شد: نمره INFO > 0.8، فرکانس آللی کمینه ≥ 1 % و n > 10,000. پس از این فیلتر، تعداد مارکرهای نهایی METAL به ترتیب 8,910,578 برای MDD عمومی، 8,848,589 برای eoMDD و 8,820,060 برای loMDD رسید. آستانهٔ معناداری سرتاسری بر پایه P < 5 × 10−8 تعیین شد. مکان‌های ژنومی بر پایه SNPهای معنادار سرتاسری با استفاده از PLINK (دستور –clump) شناسایی شد. سپس فهرستی از ژن‌ها تهیه شد که با این مکان‌ها همپوشانی فیزیکی دارند (جدول تکمیلی 2). یک GWAS مورد‑مورد دیگر بین eoMDD و loMDD در گروه‌های EstBB و FinnGen انجام شد، چرا که این دو بانک شامل هر دو زیرنوع eoMDD و loMDD هستند. مجموعاً 32,060 نمونه از FinnGen و 23,447 نمونه از EstBB متاآنالیز شدند با METAL؛ ارث‌پذیری \(\left({h}_{{\rm{SNP}}}^{2}\right)\) با LDSC39,40 برآورد شد.

آزمون‌های مبتنی بر ژن

ما از MAGMA41 نسخه 1.08 برای آزمون ارتباط تجمعی واریانت‌ها با تخصیص SNP‌ها به ژن‌ها استفاده کردیم. مرزهای ژن‌ها به‌صورت 35 kb بالای سر و 10 kb پایین‌تر گسترش یافت تا پروموترها و تک‌تقویت‌کننده‌های cis نیز شامل شوند. به‌عنوان مرجع، داده‌های توالی‌گذاری کامل ژنوم پروژه 1000 Genomes (زیرمجموعهٔ اروپایی) به‌روزرسانی شد42 و از آدرس http://ftp.1000genomes.ebi.ac.uk/vol1/ftp/data_collections/1000G_2504_high_coverage/working/20220422_3202_phased_SNV_INDEL_SV/ دانلود شد.

غنی‌سازی نوع بافت و نوع سلول از ارث‌پذیری SNP با LDSC لایه‌بندی‌شده

ما از LDSC لایه‌بندی‌شده39 برای انجام تجزیه و تحلیل نوع بافت و نوع سلول، و برآورد غنی‌سازی ارث‌پذیری SNP در مجموعه‌ای از حاشیه‌نویسی‌های ژنوم استفاده کردیم. نمرات LDSC پیش‌محاسبه‌شده را از https://console.cloud.google.com/storage/browser/_details/broad-alkesgroup-public-requester-pays/LDSCORE/LDSC_SEG_ldscores/biorxiv/Roadmap_1000Gv3.tgz دریافت کردیم، که شامل داده‌های 396 حاشیه‌نویسی از نشانه‌های اپی‌ژنتیک پروژه ROADMAP بود، و به‌ویژه 102 حاشیه‌نویسی مرتبط با مغز را انتخاب کردیم. برای داده‌های بیان ژن، همان‌طور که در پروتکل قبلی‌مان43 انجام شد، ابتدا بیان ژن‌ها را در هر سلول جمع‌آوری کردیم تا متوسط بیان هر ژن در هر نوع سلول به‌دست آید. سپس خاصیت سلولی را با تقسیم بیان یک ژن در یک سلول بر کل بیان آن در تمام سلول‌ها تعریف کردیم. برای هر نوع سلول، دهکده بالایی از ژن‌های با خاصیت خاص بیان‌شده را به‌عنوان نمایندهٔ آن نوع سلول در نظر گرفتیم و نمرات LDSC برای این حاشیه‌نویسی محاسبه شد. علاوه بر حاشیه‌نویسی‌های ROADMAP، غنی‌سازی ارث‌پذیری SNP (یک‌طرفه) در بافت‌های انسانی (37 بافت انسانی از GTEx28) و نوع سلول‌های مغزی با استفاده از جدیدترین داده‌های تک‌هسته‌ای انسان (31 نوع اصلی سلول مغزی از مرجع 29) نیز بررسی شد. برای هر حاشیه‌نویسی و ویژگی، اصلاح بونفرونی برای آزمون‌های متعدد اعمال شد (به عنوان مثال، در تحلیل داده‌های ROADMAP، سطح معنی‌داری برابر P < 0.05/102 برای هر ویژگی تنظیم شد).

ارث‌پذیری مبتنی بر SNP و ارزیابی همپوشانی ژنتیکی

ما از LDSC برای برآورد ارث‌پذیری مبتنی بر SNP و همبستگی ژنتیکی40 استفاده کردیم. برای تبدیل ارث‌پذیری مبتنی بر SNP به مقیاس مسئولیت، شیوع نمونهٔ موارد در متاآنالیز محاسبه شد؛ برای شیوع جمعیت، برآورد طول عمر تشخیص MDD برابر 16 % در نظر گرفته شد (مرجع 44). برای به‌دست آوردن برآوردهای متقابل برای eoMDD و loMDD، نسبت موارد MDD که تشخیص زودآغاز یا دیرآغاز داشتند در بزرگ‌ترین نمونه‌های جمعیتی (EstBB و FinnGen) محاسبه شد و به‌عنوان درصدی از برآورد کلی شیوع MDD، شیوع جمعیتی 6.2 % برای eoMDD و 3.2 % برای loMDD به‌دست آمد. با درک این‌که این‌برآوردها تخمین تقریبی هستند، برآوردهای ارث‌پذیری SNP برای دامنه‌ای از برآوردهای شیوع (±50 % حول برآوردهای نقطه‌ای) ارائه شد.

برای برآورد همبستگی‌های ژنتیکی با سایر صفات، از آمارهای خلاصهٔ عمومی موجود استفاده کردیم و اختلالات روانپزشکی مهم و عوامل کلیدی سلامت و نتایج مرتبط، از جمله خودکشی، شاخص توده بدنی، سطح آموزش، مصرف مواد، مرگ و بیماری‌های قلبی‌عروقی را انتخاب کردیم (منابع GWAS در جدول تکمیلی 15).

SBayesS

با استفاده از SBayesS30، برآوردهای LDSC از ارث‌پذیری مبتنی بر SNP را تأیید کرده و پارامتر پلی‌ژنیک‌پذیری، یعنی درصد SNPهای با اثر غیرصفر، و انتخاب منفی را برآورد کردیم. ماتریس LD پیش‌محاسبه‌شده از شرکت‌کنندگان UKB (‘ukbEURu_imp_v3_HM3_n50k.chisq10’) که توسط نویسندگان نرم‌افزار در دسترس است، به‌کار گرفته شد. چهار زنجیره به‌صورت موازی برای ارزیابی همگرایی در پارامترهای شروع اجرا شد (–num‑chains 4)، که هر اجرا شامل 25,000 تکرار (–chain‑length 25,000) بود و 5,000 تکرار به‌عنوان تکرارهای سوزاندن در نظر گرفته شد (–burn‑in 5,000).

Genomic SEM

ما از genomic SEM برای مقایسهٔ میزان همپوشانی وراثتی بین eoMDD و loMDD با وراثت دیگر صفات استفاده کردیم45. genomic SEM یک گسترش از SEM است که در آن آماره‌های خلاصهٔ GWAS برای نمایان‌سازی «مشاهده» ویژگی‌ها در مدل به‌کار می‌رود تا ساختار ژنتیکی زیرساختی روابط چندمتغیره بین صفات مدل‌سازی شود. genomic SEM بر پایه LDSC برای ارزیابی همبستگی ژنتیکی متکی است و در برابر هر میزان همپوشانی نمونه مقاوم است. ما ارتباط زیرنوع‌های MDD با صفات مرتبط دیگر، که در ادبیات به‌خوبی مطالعه شده‌اند، از جمله مجموعه‌ای از اختلالات روانپزشکی، عوامل کلیدی سلامت، CVD و مرگ و میر را مدلسازی کردیم (جدول تکمیلی 15). ابتدا، اندازه و معنی‌داری همبستگی‌های ژنتیکی دو زیرنوع (eoMDD و loMDD) با صفات دیگر را مقایسه کردیم. سپس، مشارکت خاص هر زیرنوع در صفات دیگر را با کنترل نسبت به زیرنوع دیگر ارزیابی کردیم (مثلاً ارتباط eoMDD با تلاش خودکشی پس از کنترل loMDD). به این ترتیب می‌توان مشارکت منحصر‌به‌فرد هرکدام را در حالی که واریانس مشترک آن‌ها کنترل می‌شود، ارزیابی کرد. همپوشانی ژنتیکی بین eoMDD و loMDD متوسط بود؛ نگرانی دربارهٔ سوگیری شدید به‌دلیل هم‌خطی (multicollinearity) محدود شد.

مطالب مرتبط
ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.