تحلیلهای ارتباطی سطوحکل ژنومی ساختارهای ژنتیکی متمایزی برای افسردگی زودآغاز و دیرآغاز شناسایی میکنند
چکیده
اختلال افسردگی عمده (MDD) یک اختلال شایع و متغیر با اتیولوژی پیچیده است. بررسی گروههای همگنتر که بر پایه ویژگیهای بالینی، مانند سن ابتلا، طبقهبندی میشوند، میتواند شناسایی عوامل ژنتیکی زیربنایی را بهبود بخشد و منجر به استراتژیهای درمانی هدفمندتر شود. ما از بانکهای زیستی نوردیک همراه با سجلات بهداشتی طولی برای بررسی تفاوتهای ساختارهای ژنتیکی افسردگی زودآغاز (eoMDD؛ n = 46,708 مورد) و افسردگی دیرآغاز (loMDD؛ n = 37,168 مورد) استفاده کردیم. در نتیجه 12 مکان ژنومی برای eoMDD و دو مکان برای loMDD شناسایی شد. بهطور کلی، دو زیرنوع MDD همبستگی متوسطی (همبستگی ژنتیکی، rg = 0.58) داشتند و در همبستگیهای ژنتیکی با صفات مرتبط تفاوت نشان دادند. این نتایج نشان میدهد که eoMDD و loMDD دارای امضاهای ژنتیکی جزئی متمایز هستند، بهویژه یک امضای توسعهای مغزی خاص برای eoMDD. مهم است که نشان میدهیم نمرات خطر پلیژنیک (PRS) برای eoMDD توان پیشبینی تلاش برای خودکشی را در اولین 10 سال پس از تشخیص اولیه دارد: خطر مطلق برای تلاش خودکشی در دهکده بالایی PRS برابر 26٪ بود، در مقایسه با 12٪ و 20٪ در دهکده پایینی و گروه میانی به ترتیب. با جمعبندی این نتایج، میتوانند به روشهای روانپزشکی دقیق برای MDD کمک کنند.
موضوعات
- افسردگی
- ژنتیک جمعیتی
متن اصلی
مانند سایر اختلالات پیچیدهای نظیر دیابت نوع ۲1 و صرع2، احتمالاً ناهمگونی بالینی مشاهدهشده در اختلال افسردگی عمده (MDD) از ناهمگونی اتیولوژیک زیرین ناشی میشود3,4,5. پیشرفتهای اخیر در مطالعات انجمن ژنتیک سطحکل (GWAS) برای MDD، که با نمونههای بزرگ از کنسرسیوم ژنومیک روانپزشکی6,7، 23andMe8، برنامه صدایانیک ویترن9 و بانکهای زیستی جهانی10,11,12,13 تسهیل شدهاند، پیشرفت قابلتوجهی در شناسایی واریانتهای ژنتیکی مرتبط با MDD بهدست آوردهاند و شواهدی از تفاوتهای ژنتیکی بین انواع بالینی مختلف ظاهر شدهاند3,7,13. علیرغم این تلاشها، جستجوی مکانهای ژنتیکی خاص برای زیرنوعهای MDD بهسختی پیش رفته است که درک ما از اتیولوژی پیچیده آن را محدود میکند.
در این مطالعه، منبع مهمی از ناهمگونی MDD را بررسی میکنیم؛ یعنی سن ابتلا (AAO)، با تقسیم افراد به افسردگی زودآغاز (eoMDD) و افسردگی دیرآغاز (loMDD) و انجام یک متاآنالیز GWAS بزرگ از دو زیرنوع در همکاری مداوم نوردیک TRYGGVE14,15 (شکل 1). eoMDD با پیامدهای شدید، از جمله علائم روانپریشی، رفتارهای خودکشی و هممریهای دیگر اختلالات روانی و بیماریهای سوماتیک مرتبط است16,17، در حالی که loMDD تمایل دارد با کاهش تواناییهای شناختی و افزایش خطر بیماریهای قلبیعروقی ظاهر شود18. تلاشهای قبلی برای طبقهبندی MDD بر اساس AAO به دلیل چالشهای روششناختی، از جمله تفاوتهای بزرگ در AAO میان نمونهها، سوگیری یادآوری و اندازه نمونه نسبتاً کوچک، مانع شدند17. برای رفع این مشکلات، از بانکهای زیستی نوردیک و سجلات بهداشتی طولی همسطح استفاده کردیم تا موارد MDD را بر پایه سن اولین تشخیص MDD دستهبندی کنیم15. پژوهشهای پیشین نشان دادند که سن اولین تشخیص میتواند بهعنوان یک جایگزین مفید برای AAO عمل کند، با توجه به همبستگی ژنتیکی بالا (rg = 0.95) بین دو فنوتیپ16.

EMR، پرونده پزشکی الکترونیکی.
پس از همسازگاری تعاریف فنوتیپی MDD و سن اولین تشخیص در نه گروه از پنج کشور نوردیک (دانمارک، استونی، فنلاند، نروژ و سوئد؛ روشها)، 151,582 مورد MDD شناسایی کردیم که شامل 46,708 مورد eoMDD با سن اولین تشخیص کمتر از 25 سال (تقریبی به صدک 25 توزیع AAO ≤ 20–21 (مرجع 19؛ روشها)) و 37,168 مورد loMDD با سن اولین تشخیص 50 سال یا بالاتر (تقریبی به صدک 75 توزیع AAO ≥ 44–45 سال؛ روشها) (جدول 1)19 بود. تحلیلهای GWAS همساز شده بر روی eoMDD و loMDD را با استفاده از کانتینرهای Singularity20 در هر گروه انجام دادیم و سپس متاآنالیزهایی انجام شد. پس از همسازگاری فنوتیپ، همبستگیهای ژنتیکی بالایی (rg = 0.7–0.9) بین بزرگترین گروههای نوردیک (کنسرسیوم تحقیقات روانپزشکی یکپارچه (iPSYCH)، بانک زیستی استونی (EstBB)، FinnGen) مشاهده شد (شکل تکمیلی 1). برای ارزیابی قابلیت تعمیم بهخارج از گروههای نوردیک، دادههای UK Biobank (UKB) را نیز تجزیه و تحلیل کردیم که بر پایه خوداظهاری سن اولین تشخیص استوار است و GWASهای eoMDD و loMDD را با همان قطعهای سنی انجام دادیم (شکل تکمیلی 1). با این حال، با توجه به تفاوتهای عمده در نمونهها و فنوتیپها، تجزیه و تحلیل اصلی براساس گروههای نوردیک افراد با نژاد اروپایی انجام شد، در حالی که UKB بهعنوان گروه مقایسهای برای مکانهای شناساییشده بهکار رفته است.

a،b، نمودارهای منهتن آینهای نتایج GWAS از کشورهای ترکیبی نوردیک، با استفاده از متاآنالیز وزندار معکوس‑واریانس و آستانه معناداری سرتاسری P < 5 × 10−8 (که در خط افقی نقطهچین نشان داده شده است)، برای eoMDD (a) و loMDD (b). c، غنیسازی علامتهای کروماتین باز در GWAS eoMDD و loMDD. خط نقطهچین نشاندهنده آستانه یک‑طرفه بونفرونی‑تصحیحشده P است که برابر P = 0.05/102 = 0.0005. d، ارثپذیری مبتنی بر تک‑نوکلئوتید (SNP) \(\left({h}_{{\rm{SNP}}}^{2}\right)\) در دامنهای از برآوردهای شیوع جمعیت، که خطوط نقطهچین نشاندادهشده مقدار برآورد نقطهای شیوع جمعیت را نشان میدهند. e، همپوشانی ژنتیکی بین MDD کلی، eoMDD و loMDD، که در مثلث بالا خطاهای استاندارد را نشان میدهد و در قطر، برآوردهای پلیژنتیکپذیری از SBayesS آمده است. * برای loMDD، الگوریتم همگرا نشد، لذا برآورد پلیژنتیکپذیری نامطمئن است، هرچند در تمام اجراهای موفق بهطور مداوم بالاتر از eoMDD بود.

a، همبستگیهای ژنتیکی حاصل از تجزیهوتجمیع نمرههای عدم‑توازن لینکج (LD) (LDSC) مقایسهکننده eoMDD (بر پایه GWAS n = 153,532) و loMDD (GWAS n = 158,588) با نتایج کلیدی بهداشتی و اختلالات روانپزشکی مرتبط (GWAS n در جدول تکمیلی 15). نوارهای خطا نشاندهنده فواصل اطمینان 95٪ هستند. مقادیر P برای ارتباطات در جدول تکمیلی 8 گزارش شدهاند. b، نتایج رگرسیون خطی از SEM ژنومی، که در آن نتایج بر پایه eoMDD (GWAS n = 153,532) با کنترل همپوشانی loMDD (GWAS n = 158,588) رگرسیون میشوند، و بالعکس. ستارهٔ تک‑ستاره نشاندهندهٔ تفاوت معنیدار بین eoMDD و loMDD در P < 0.05 است. نوارهای خطا فواصل اطمینان 95٪ را نشان میدهند.

a، نتایج تحلیلهای MR با MDD بهعنوان معرض، با آماره IVW بهعنوان برآورد اندازه اثر MR (بهترتیب اثرات اندازهگیری شده برای eoMDD). نوارهای خطا فواصل اطمینان 95٪ را نشان میدهند. b، اثرها با MDD بهعنوان خروجی (بهترتیب اثر در a). هر دو بخش a و b شامل تعداد SNPهای ابزار استفادهشده در تحلیل («SNPs»،)، درصد واریانس توضیحدادهشده توسط SNPهای ابزار در معرض («% R2»)، و قدرت ابزار («F») میباشند. ما صرفاً روابط محتمل (مطابق با ترتیب زمانی) را آزمون کردیم؛ روابط غیرممکن، مانند مرگ ناشی از خودکشی بهعنوان عامل خطر برای MDD، از شکل حذف شد. اگر تحلیل حساسیت MR‑Egger یک تقاطع معنیدار (مثلثها) داشته باشد، نشان میدهد برآورد MR پلیتروپیک است و نباید تفسیر شود. برآوردهای دارای ستاره پس از اصلاح برای آزمونهای متعدد (مقادیر دقیق P در جدول تکمیلی 10 گزارش شده) معنادار بودند. نوارهای خطا فواصل اطمینان 95٪ را نشان میدهند.

a، ارتباطات متاآنالیز شده بین PRS و نتایج MDD در گروههای نوردیک، با استفاده از آماری خلاصه GWAS LOO برای eoMDD و loMDD. نوارهای خطا فواصل اطمینان 95٪ را نشان میدهند. b، گروههای ICD‑10 مرتبط با سلامت ذهنی و خودکشی که با eoMDD و loMDD از PheWAS PRS مرتبط هستند، انتخاب شدهاند. نوارهای خطا فواصل اطمینان 95٪ را نشان میدهند. c، تعداد ارتباطات منحصر بهفرد و مشترک با eoMDD و loMDD از PheWAS. d، میانگین نمرات علائم خودکشی گزارششده توسط خود (مقیاس خودکشی پیکل) بر پایه طبقهبندی سِت ده درصد برتر، 80٪ میانی و ده درصد پایین PRS eoMDD. نوارهای خطا فواصل اطمینان 95٪ را نشان میدهند. e، نرخ تجمعی وقوع خودکشی در دورهٔ 10 ساله از اولین تشخیص eoMDD، بر پایه طبقهبندی سِت ده درصد برتر، میانی و پایین PRS eoMDD. سایهٔ خاکستری فواصل اطمینان 95٪ را نشان میدهد.
برای فهمیدن نحوهٔ ارتباط پیشزمینههای ژنتیکی زیرساختی دو زیرنوع با هممریها، یک مطالعهٔ ارتباطپهننقشهای مبتنی بر PRS (PheWAS) با استفاده از مدلهای رگرسیون لجستیک و دادههای پروندهٔ بهداشتی الکترونیکی (EHR) بانک زیستی استونی (EstBB) انجام دادیم. تحلیلها با نرمافزار R (نسخه 4.3) انجام شد. برای هر کد ICD‑10 که حداقل 50 مورد (n = 1,151) در EHR EstBB موجود بود، دو مدل ساخته شد—PRS برای eoMDD و PRS برای loMDD بهعنوان متغیر پیشبینیکننده. این مدلها از PRS نرمالشده (نه eoMDD نه loMDD) و یک متغیر خروجی دودویی که حضور یا عدم حضور کد ICD‑10 را نشان میدادند، استفاده میکردند. دادههای EHR شامل هر دو دادهٔ مراقبت اولیه و مراقبت ثانویه/داخلستانی از طریق ارتباط با پایگاه دادهٔ e‑health مرکزی استونی، از سال 2004 تا 2022 بود.
پس از اصلاح برای آزمونهای متعدد (تصحیح بونفرونی، آستانه P برابر 0.05/1,428)، هر دو ارتباط مشترک و منحصر بهفرد برای هر زیرنوع شناسایی شد (شکل 5c و شکل تکمیلی 8a,b). بهویژه، PRS eoMDD ارتباطات منحصر بهفردی با اختلالات روانپزشکی مانند اختلال رفتار (کد ICD‑10: F91) و اختلال اسکیزوتیپی (F21)، تلاش برای خودکشی/آسیبرسانی عمدی به خود (X78) و مشکلات مرتبط با حوادث منفی در دوران کودکی (Z61) یا سایر مشکلات مرتبط با پرورش (Z62) نشان داد. در مقابل، PRS loMDD ارتباط بیشتری با اختلالات روانی و رفتاری ناشی از مصرف مسکن یا هیدروتیک (F13) و اختلال وسواسی‑اجباری (F42) نشان داد (شکل 5b و جدول تکمیلی 12).
بهدلیل یافتههای ما دربارهٔ ارتباط ژنتیکی قوی بین eoMDD و تلاش خودکشی، بررسی کردیم که آیا PRS eoMDD میتواند خطر تلاش به خودکشی را با استفاده از نظرسنجیهای خوداظهاری و سوابق پزشکی EstBB پیشبینی کند. افراد مبتلا به eoMDD را بر پایه PRS eoMDD به سه زیرگروه تقسیم کردیم (دهکده بالایی، دهکده پایینی و 80٪ میانی). ابتدا، رابطهٔ دوز‑پاسخ بین طبقههای PRS eoMDD و میانگین نمرات مقیاس خودکشی پیکل (Paykel Suicide Scale)32 را مشاهده کردیم، به این معنا که هرچه PRS eoMDD بالاتر باشد، علائم افکار و تلاشهای خودکشی نیز بیشتر میشود (میانگین نمرات علائم = 0.85، 95٪ CI = 0.79–0.91؛ 1.05 (1.03–1.07)، 1.22 (1.15–1.29) برای طبقههای PRS پایین، میانی و بالا بهترتیب) (شکل 5d و جدول تکمیلی 13a). سپس نسبت خطر حاد (HRR) و خطر مطلق برای تلاش به خودکشی که در مراقبت اولیه یا تخصصی در دورهٔ 10 ساله پس از اولین تشخیص MDD درمان شد، برآورد شد. در مقایسه با گروه PRS میانی، افراد در دهکده پایین HRR بهطور معناداری کمتر (0.57، 95٪ CI = 0.49–0.68، P = 1.34 × 10−10) داشتند، در حالی که افراد در دهکده بالایی خطر بیشتری (HRR = 1.13، 95٪ CI = 1.00–1.28، P = 0.058) نشان دادند. علاوه بر این، افراد با PRS پایین بهطور مستمر خطر مطلق کم برای تلاش به خودکشی در طول زمان پس از اولین تشخیص MDD را نشان دادند (12٪ تجمعی در دورهٔ 10 ساله)، در حالی که تفاوت قابلتوجهی در خطر مطلق بین گروههای میانی و بالایی تا 5.5 سال مشهود نبود، که نرخ تجمعی 10 ساله بهترتیب 20٪ و 26٪ بود (شکل 5e).
پژوهشهای پیشین نشان دادند که شیوع تلاشهای خودکشی بهویژه در دوران نوجوانی و جوانی افزایش قابلتوجهی دارد33. شناسایی زودهنگام افراد در معرض خطر بالای خودکشی از اهمیت بالینی بالایی برخوردار است. این دوره از شیوع بالای تلاشهای خودکشی همزمان با خطر eoMDD است، که انجام پیشبینی خطر در این زیرگروه را بهویژه حائز اهمیت میسازد. همراه با یافتههای ما مبنی بر اینکه eoMDD بهصورت احتمالی علّی برای تلاشهای خودکشی است، این نتایج استفادهٔ بالقوهٔ PRS eoMDD در طبقهبندی خطر تلاش به خودکشی در میان افراد مبتلا به eoMDD را نشان میدهند (جدول تکمیلی 13b) و نیاز به بررسی بیشتر در زمینه پیشگیری از خودکشی را برجسته میسازند33.
ژنومیک افسردگی عمده (MDD) پیشرفت شگرفی داشته است؛ از عدم وجود ارتباطات معنیدار در سال 2013 تا 697 ارتباط در سال 2025 برای فنوتیپ مورد‑کنترل MDD6,7,34. در این مطالعه، استراتژی فراتر رفتن از طرح مورد‑کنترل برای هدفگیری زیرگروههای فنوتیپی خاص را بررسی کردیم تا ناهمگونی ژنتیکی در MDD را کاهش دهیم. دادههای بهداشتی همساز و تجزیهوتحلیلهای ما در کشورهای مختلف قدرت تحلیلی را ارتقا داد و سیگنالهای ژنتیکی متفاوت در زیرنوعهای مبتنی بر AAO را شناسایی کرد. چنین رویکردی میتواند به سایر ویژگیهای بالینی، مانند علائم گیاهی، ویژگیهای روانپریشی و ناتوانی، گسترش یابد تا زیرنوعهای بالینی مرتبط بیشتری از MDD هدفگذاری شود3,5,35,36. این یافتهها میتوانند در راهنمایی درمان هدفمند و پیشگیری در روانپزشکی نقش مهمی ایفا کنند.
روشها
جمعیت مورد مطالعه
برای انجام یک GWAS بزرگ از زیرنوعهای MDD مبتنی بر AAO با فنوتیپهای همسان، نه گروه از پنج کشور نوردیک (دانمارک، سوئد، نروژ، فنلاند و استونی) و یک گروه مقایسهای از یک کشور غیرنوردیک (انگلستان: UKB) شناسایی کردیم. بسیاری از این گروهها بانکهای زیستی بزرگی هستند که با سوابق پزشکی طولانیمدت در سامانههای ملی بیماران مرتبطاند، از جمله iPSYCH، FinnGen، مطالعات مادر‑پدر‑فرزند نروژ (MoBa)، UKB و EstBB (جزئیات گروهها در روشهای تکمیلی). این مطالعه توسط مرجع اخلاقی سوئد (شماره پرونده 2023-03073) تأیید شد و هر گروه توسط هیئتهای بررسی مؤسسهای مربوطه تأیید شد.
فنوتیپها
ما تلاش قبلی خود را در همسازسازی فنوتیپهای مبتنی بر ثبتهای سامانهای از MDD، سن اولین تشخیص و پیامدهای آن در سه کشور اسکاندیناوی، به سایر کشورهای نوردیک با سامانههای مشابه گسترش دادیم15. با استفاده از سامانههای ملی بیماران، ابتدا اطلاعاتی دربارهٔ تشخیصهای MDD با کدهای ICD‑10 F32 (دوره افسردگی) یا F33 (دورههای مکرر افسردگی) استخراج کردیم، بهطوری که مواردی با تشخیص دو قطبی یا اسکیزوفرنی (کدهای ICD‑10: F30/F31/F32/F33, F20/F23.1/F23.2/F25) حذف شدند (جدول تکمیلی 14)، که منجر به مجموع n = 151,582 مورد MDD در کشورهای نوردیک شد. پژوهش قبلی ما نشان داد همبستگی ژنتیکی بالایی (rg ≈ 0.95) بین AAO و سن اولین تشخیص MDD وجود دارد16، و متوسط زمان ابتلا بهطور متوسط 5 سال پیش از اولین تشخیص است16. بنابراین، سن اولین تشخیص برای جمعیت بیماران MDD استخراج شد و بهعنوان جایگزین برای AAO در تعریف eoMDD و loMDD استفاده شد. آستانهها بر پایه مرور دقیق ادبیات و دادههای تجربی سامانهای سوئد انتخاب شدند. متاآنالیز قبلی گزارش داد که میانگین AAO برای اختلال افسردگی در حدود 30 سال است، با صدک ۲۵ و ۷۵ در سن ۲۱ و ۴۴ به ترتیب15,19؛ دادههای سامانهای سوئد نشان داد که برای تشخیص متخصص MDD، صدک ۲۵ و ۷۵ به ترتیب در سن ۲۵ و ۴۵ سال بود15. لذا افرادی که اولین تماس درمانی متخصص با MDD آنها در یا قبل از سن ۲۵ سال (تقریبی به صدک ۲۵ توزیع AAO ≤ 20–21) بهعنوان موارد eoMDD (n = 46,708) در نظر گرفته شد؛ موارد loMDD آنها در یا بعد از سن ۵۰ سال (تقریبی به صدک ۷۵ توزیع AAO ≥ 44–45) (n = 37,168) (جدول 1)19. گروههای کنترل شامل افرادی بودند که تشخیص MDD، دو قطبی یا اسکیزوفرنی در آنها ثبت نشده بود. بهدلیل تفاوت در طراحی گروه، کنترلها در گروههای مبتنی بر جمعیت EstBB، FinnGen, MoBa و UKB با موارد مطابقت داده شد. گروههای دانمارکی و سوئدی که از طراحی مورد‑کوهورت و مورد‑کنترل استفاده کردند، نیازی به تطبیق کنترل نداشتند.
نرمافزارهای کانتینری برای تحلیلهای توزیعی
بهمنظور اطمینان از شفافیت و قابلیت تکرار تحلیلها در سایتهای مختلف، نرمافزارهای کانتینری و کدهای همراه برای پردازش دادهها و تحلیلها (مانند GWAS، PRS، LDSC) توسعه دادیم و این کانتینرها را در سایتهای پژوهش توزیع کردیم. بهطور خلاصه، ابزارها و وابستگیهای اصلی در ماشینهای مجازی مبتنی بر سیستمعامل Ubuntu 20.04 LTS از طریق Docker (https://docker.com) نصب شد و به فرمت Singularity Image File (https://sylabs.io) برای توزیع بستهبندی شد20. تمام کدهای منبع و فایلها بهصورت عمومی در GitHub در دسترس هستند و تحت مجوز GNU General Public License (GPL v.3.0) منتشر شدهاند. ابزارهای منتشرشده تحت سایر مجوزها، مجوزهای اصلی خود را حفظ میکنند.
GWAS و متاآنالیز
GWAS افراد با نژاد اروپایی در هر گروه با استفاده از بسته نرمافزاری REGENIE37 که در کانتینرهای نرمافزاری موجود است20 انجام شد. تحلیلها با تصحیح برای ده مؤلفهٔ اصلی اول (PCs)، سن و جنس انجام شد. آمارهای خلاصهٔ هر گروه در متاآنالیز اثرات ثابت در METAL38 با دستور ‘SCHEME STDERR’ بر پایه وزن معکوس واریانس خطاهای استاندارد مربوط به همهٔ فنوتیپها ترکیب شد، که منجر به 151,582 مورد و 362,873 کنترل برای تمام MDD، 46,708 مورد و 106,824 کنترل برای eoMDD، و 37,168 مورد و 121,420 کنترل برای loMDD شد. فیلترهای اضافی بر روی واریانسها اعمال شد: نمره INFO > 0.8، فرکانس آللی کمینه ≥ 1 % و n > 10,000. پس از این فیلتر، تعداد مارکرهای نهایی METAL به ترتیب 8,910,578 برای MDD عمومی، 8,848,589 برای eoMDD و 8,820,060 برای loMDD رسید. آستانهٔ معناداری سرتاسری بر پایه P < 5 × 10−8 تعیین شد. مکانهای ژنومی بر پایه SNPهای معنادار سرتاسری با استفاده از PLINK (دستور –clump) شناسایی شد. سپس فهرستی از ژنها تهیه شد که با این مکانها همپوشانی فیزیکی دارند (جدول تکمیلی 2). یک GWAS مورد‑مورد دیگر بین eoMDD و loMDD در گروههای EstBB و FinnGen انجام شد، چرا که این دو بانک شامل هر دو زیرنوع eoMDD و loMDD هستند. مجموعاً 32,060 نمونه از FinnGen و 23,447 نمونه از EstBB متاآنالیز شدند با METAL؛ ارثپذیری \(\left({h}_{{\rm{SNP}}}^{2}\right)\) با LDSC39,40 برآورد شد.
آزمونهای مبتنی بر ژن
ما از MAGMA41 نسخه 1.08 برای آزمون ارتباط تجمعی واریانتها با تخصیص SNPها به ژنها استفاده کردیم. مرزهای ژنها بهصورت 35 kb بالای سر و 10 kb پایینتر گسترش یافت تا پروموترها و تکتقویتکنندههای cis نیز شامل شوند. بهعنوان مرجع، دادههای توالیگذاری کامل ژنوم پروژه 1000 Genomes (زیرمجموعهٔ اروپایی) بهروزرسانی شد42 و از آدرس http://ftp.1000genomes.ebi.ac.uk/vol1/ftp/data_collections/1000G_2504_high_coverage/working/20220422_3202_phased_SNV_INDEL_SV/ دانلود شد.
غنیسازی نوع بافت و نوع سلول از ارثپذیری SNP با LDSC لایهبندیشده
ما از LDSC لایهبندیشده39 برای انجام تجزیه و تحلیل نوع بافت و نوع سلول، و برآورد غنیسازی ارثپذیری SNP در مجموعهای از حاشیهنویسیهای ژنوم استفاده کردیم. نمرات LDSC پیشمحاسبهشده را از https://console.cloud.google.com/storage/browser/_details/broad-alkesgroup-public-requester-pays/LDSCORE/LDSC_SEG_ldscores/biorxiv/Roadmap_1000Gv3.tgz دریافت کردیم، که شامل دادههای 396 حاشیهنویسی از نشانههای اپیژنتیک پروژه ROADMAP بود، و بهویژه 102 حاشیهنویسی مرتبط با مغز را انتخاب کردیم. برای دادههای بیان ژن، همانطور که در پروتکل قبلیمان43 انجام شد، ابتدا بیان ژنها را در هر سلول جمعآوری کردیم تا متوسط بیان هر ژن در هر نوع سلول بهدست آید. سپس خاصیت سلولی را با تقسیم بیان یک ژن در یک سلول بر کل بیان آن در تمام سلولها تعریف کردیم. برای هر نوع سلول، دهکده بالایی از ژنهای با خاصیت خاص بیانشده را بهعنوان نمایندهٔ آن نوع سلول در نظر گرفتیم و نمرات LDSC برای این حاشیهنویسی محاسبه شد. علاوه بر حاشیهنویسیهای ROADMAP، غنیسازی ارثپذیری SNP (یکطرفه) در بافتهای انسانی (37 بافت انسانی از GTEx28) و نوع سلولهای مغزی با استفاده از جدیدترین دادههای تکهستهای انسان (31 نوع اصلی سلول مغزی از مرجع 29) نیز بررسی شد. برای هر حاشیهنویسی و ویژگی، اصلاح بونفرونی برای آزمونهای متعدد اعمال شد (به عنوان مثال، در تحلیل دادههای ROADMAP، سطح معنیداری برابر P < 0.05/102 برای هر ویژگی تنظیم شد).
ارثپذیری مبتنی بر SNP و ارزیابی همپوشانی ژنتیکی
ما از LDSC برای برآورد ارثپذیری مبتنی بر SNP و همبستگی ژنتیکی40 استفاده کردیم. برای تبدیل ارثپذیری مبتنی بر SNP به مقیاس مسئولیت، شیوع نمونهٔ موارد در متاآنالیز محاسبه شد؛ برای شیوع جمعیت، برآورد طول عمر تشخیص MDD برابر 16 % در نظر گرفته شد (مرجع 44). برای بهدست آوردن برآوردهای متقابل برای eoMDD و loMDD، نسبت موارد MDD که تشخیص زودآغاز یا دیرآغاز داشتند در بزرگترین نمونههای جمعیتی (EstBB و FinnGen) محاسبه شد و بهعنوان درصدی از برآورد کلی شیوع MDD، شیوع جمعیتی 6.2 % برای eoMDD و 3.2 % برای loMDD بهدست آمد. با درک اینکه اینبرآوردها تخمین تقریبی هستند، برآوردهای ارثپذیری SNP برای دامنهای از برآوردهای شیوع (±50 % حول برآوردهای نقطهای) ارائه شد.
برای برآورد همبستگیهای ژنتیکی با سایر صفات، از آمارهای خلاصهٔ عمومی موجود استفاده کردیم و اختلالات روانپزشکی مهم و عوامل کلیدی سلامت و نتایج مرتبط، از جمله خودکشی، شاخص توده بدنی، سطح آموزش، مصرف مواد، مرگ و بیماریهای قلبیعروقی را انتخاب کردیم (منابع GWAS در جدول تکمیلی 15).
SBayesS
با استفاده از SBayesS30، برآوردهای LDSC از ارثپذیری مبتنی بر SNP را تأیید کرده و پارامتر پلیژنیکپذیری، یعنی درصد SNPهای با اثر غیرصفر، و انتخاب منفی را برآورد کردیم. ماتریس LD پیشمحاسبهشده از شرکتکنندگان UKB (‘ukbEURu_imp_v3_HM3_n50k.chisq10’) که توسط نویسندگان نرمافزار در دسترس است، بهکار گرفته شد. چهار زنجیره بهصورت موازی برای ارزیابی همگرایی در پارامترهای شروع اجرا شد (–num‑chains 4)، که هر اجرا شامل 25,000 تکرار (–chain‑length 25,000) بود و 5,000 تکرار بهعنوان تکرارهای سوزاندن در نظر گرفته شد (–burn‑in 5,000).
Genomic SEM
ما از genomic SEM برای مقایسهٔ میزان همپوشانی وراثتی بین eoMDD و loMDD با وراثت دیگر صفات استفاده کردیم45. genomic SEM یک گسترش از SEM است که در آن آمارههای خلاصهٔ GWAS برای نمایانسازی «مشاهده» ویژگیها در مدل بهکار میرود تا ساختار ژنتیکی زیرساختی روابط چندمتغیره بین صفات مدلسازی شود. genomic SEM بر پایه LDSC برای ارزیابی همبستگی ژنتیکی متکی است و در برابر هر میزان همپوشانی نمونه مقاوم است. ما ارتباط زیرنوعهای MDD با صفات مرتبط دیگر، که در ادبیات بهخوبی مطالعه شدهاند، از جمله مجموعهای از اختلالات روانپزشکی، عوامل کلیدی سلامت، CVD و مرگ و میر را مدلسازی کردیم (جدول تکمیلی 15). ابتدا، اندازه و معنیداری همبستگیهای ژنتیکی دو زیرنوع (eoMDD و loMDD) با صفات دیگر را مقایسه کردیم. سپس، مشارکت خاص هر زیرنوع در صفات دیگر را با کنترل نسبت به زیرنوع دیگر ارزیابی کردیم (مثلاً ارتباط eoMDD با تلاش خودکشی پس از کنترل loMDD). به این ترتیب میتوان مشارکت منحصربهفرد هرکدام را در حالی که واریانس مشترک آنها کنترل میشود، ارزیابی کرد. همپوشانی ژنتیکی بین eoMDD و loMDD متوسط بود؛ نگرانی دربارهٔ سوگیری شدید بهدلیل همخطی (multicollinearity) محدود شد.