제퍼넷 로고

ZFP352에 의한 레트로트랜스포존의 선택적 결합은 전능성 네트워크의 적시 용해를 촉진합니다 – Nature Communications

시간

세포 배양 및 세포주

HEK293T 세포(Pricella, CL-0005)를 0.12% FBS(Gibco, 30243.01-10)가 보충된 DMEM 고글루코스(HyClone, SH10270)와 함께 106% 젤라틴으로 사전 코팅된 접시에서 배양했습니다. E14 세포(Cell Search System, E14tg2a)를 11965% FBS(Gibco, 084-15), 16000X NEAA(Gibco, 044), 100X L-글루타민(Gibco, 11140050)이 포함된 DMEM 고글루코스(Gibco, 100-25030081)에서 배양했습니다. ), 1000X β-머캅토에탄올(Gibco, 21985023), 홈메이드 LIF(10,000X 희석)를 젤라틴 사전 코팅된 플레이트에 담았습니다. 매체는 매일 새로 고쳐졌습니다. E14 세포를 0.05°C에서 0203분간 3% 트립신(Beyotime, C37)과 함께 배양하여 계대배양했습니다. ZFP352 유도성 mESC 계통은 pCW57.1-의 렌티바이러스 통합에 의해 만들어졌습니다.ZFP352 발현 플라스미드. ZFP352 pCW57.1 플라스미드의 TET 유도성 ​​프로모터 하에 코딩 서열을 클로닝하였다. 세포의 마이코플라스마 오염 여부를 정기적으로 확인했습니다.

형질감염 및 형질도입

프로토콜에 따라 Lipofectamine 2000(Life Technologies, 11668027)을 사용하여 형질감염을 수행했습니다. 세포를 파종하기 전에 젤라틴으로 미리 코팅된 플레이트에 형질감염 혼합물을 첨가했습니다. 렌티바이러스 생산을 위해 HEK293T 세포를 70% 컨플루언시까지 성장시켰습니다. 전달 플라스미드, pxPAX2 및 VSVG를 모두 PEI(Polysciences, 293-24765)를 사용하여 HEK1T 세포에 형질감염시켰습니다. 48시간에서 72시간 후에 상청액을 수확하고, 생성된 바이러스를 5X 바이러스 농축 용액(Origene, TR30026)을 사용하여 침전시킨 후 PBS에 재현탁시키고 분주한 후 -80°C에 보관했습니다. 렌티바이러스로 세포를 감염시키기 위해 바이러스를 4μg/ml 폴리브렌이 포함된 배지에 24시간 동안 첨가했습니다. 후속 분석을 허용하기 위해 둘째 날에 배지를 새로 고쳤습니다.

RNA 추출 및 RT-qPCR

총 RNA는 RNAios Plus(Takara, 9109)로 추출되었습니다. RNA는 HiScript II Q RT SuperMix(Vazyme, R223-01)를 사용하여 cDNA로 역전사되었습니다. Roche LightCycler® 311(LC03) 시스템과 함께 ChamQ SYBR qPCR Master Mix(Vazyme, Q480-480)를 사용하여 qPCR을 수행했습니다.

루시퍼라제 발현 분석

SINE_B1 서열 및 MT2_Mm 서열을 SV4.23 미니-프로모터를 함유하는 pGL40 루시퍼라제 리포터 플라스미드 또는 psi-CHECK-2(Promega, C8021) 루시퍼라제 리포터 플라스미드에 클로닝했습니다. 루시퍼라제 리포터 플라스미드를 HEK293T 세포에 형질감염시켰습니다. ZFP352 or 덕스 플라스미드를 과발현합니다. 루시퍼라제 발현 변화는 RT-qPCR에 의해 검출되었습니다. 루시퍼라제 활성은 또한 이중 루시퍼라제 분석 시스템(Promega, E1910)을 사용하여 측정하고 Synergy2 플레이트 판독기(BioTek)에서 분석했습니다.

공동면역침전

세포를 얼음 위의 프로테아제 억제제 칵테일(Biotool, B14001)이 포함된 Endo-IP 완충액에서 30분 동안 용해시키고, 용해물을 4°C에서 25분 동안 원심분리하여 침전물을 제거했습니다. 500 μg의 총 단백질을 5 μg의 토끼 IgG 또는 HA 항체(Sigma, H3663) 또는 Flag 항체(Sigma, F1804)와 함께 4°C에서 밤새 회전시키면서 배양했습니다. 용해물과 항체 혼합물을 30μl 단백질 G Dynabeads(Thermo Fisher Scientific, 10003D)와 함께 회전하면서 실온에서 2시간 동안 배양했습니다. 비드를 용해 완충액으로 세척하고 용출시켰습니다. 용리액은 웨스턴 블랏으로 분석되었습니다. 단백질 유비퀴틴화를 검출하기 위해 총 단백질 500μg을 토끼 IgG 또는 ZSCAN5 항체(Millipore, AB4) 3430μg과 함께 4°C에서 밤새 회전시키면서 배양했습니다. 용해물과 항체 혼합물을 30μl 단백질 G Dynabeads(Thermo Fisher Scientific, 10003D)와 함께 실온에서 회전시키면서 2시간 동안 배양했습니다. 용리액은 나중에 유비퀴틴 항체(CST, #3936)로 블롯팅되었습니다.

웨스턴 블 랏팅

프로테아제 억제제 칵테일이 포함된 Endo-IP 완충액 또는 Co-IP 용출 샘플의 세포 용해물을 95°C에서 변성시키고 얼음 위에 보관했습니다. 단백질 샘플은 SDS-PAGE를 사용하여 분리하고 습식 탱크 전달 시스템을 사용하여 폴리비닐리덴 디플루오라이드(PVDF) 막(Sigma-Aldrich, 3010040001)으로 옮겼습니다. PVDF 멤브레인을 PBST의 10% 무지방 우유에서 1시간 동안 차단하고 4차 항체를 차단 완충액에서 00098°C에서 밤새 배양한 다음 HRP(Genescrip, A1)와 접합된 5000차 항체를 300:033으로 희석했습니다. 멤브레인은 Azure C3663 시스템을 사용하여 시각화되었습니다. 사용된 1804차 항체에는 GAPDH(Abclonal, AC4), HA(Sigma, H3430), Flag(Sigma, F3936), ZSCAN352(Millipore, AB1), 유비퀴틴(CST, #2000) 및 ZFPXNUMX에 대한 항체가 포함되었으며 모든 XNUMX차 항체는 XNUMX:XNUMX으로 희석.

유세포 분석

mESC는 0.05°C에서 37% 트립신에 의해 단일 세포로 소화되었고 4분 동안 30% PFA로 고정되었습니다. 사전 냉각된 PBS에 재현탁시킨 후 현탁액을 40μm 스트레이너를 통해 여과하고 BD LSRFortessa에서 분석했습니다.TM 세포 분석기. FACS 데이터는 FlowJo X V10을 사용하여 분석되었으며 보충 그림 XNUMX에 게이팅 전략이 설명되어 있습니다. 7.

CRISPRi 및 CRISPRa

CRISRi 및 CRISPRa 시스템의 경우 Dfam의 MT2_Mm 공통 서열에서 설계된 sgRNA를 사용하고 Addgene #9에서 변형된 dCAS160-VP9 및 dCAS48240-KRAB 벡터에 클로닝했습니다. 본 연구에 사용된 sgRNA 서열은 다음과 같습니다.

CAGCTGTGAATGGAAGTCCA

ATTTATTGATGACTTACAGT

CACCAGTGACCCTTATCTGG

sgRNA가 포함된 dCAS9-VP160 또는 dCAS9-KRAB 플라스미드를 E14 세포에 형질도입하고 빈 벡터를 대조군으로 사용했습니다.

배아 채취 및 미세주입

8~10주령 암컷 ICR 마우스는 Shanghai SLAC Laboratory Animal Co., Ltd.에서 구입했습니다. 모든 마우스는 12시간 명암 주기의 SPF 환경에서 사육되었으며 온도는 22~24°C였습니다. C, 습도 50~60%. ICR 암컷 생쥐(8-12주령)는 10 IU 임신한 암말의 혈청 성선 자극 호르몬(PMSG, CEN'S, Hangzhou, China)을 복강내 주사하여 과배란시켰고, 48시간 후에 10 IU 인간 융모막 성선 자극 호르몬(hCG, CEN'S, Hangzhou, China) ). 생체 내에서 생산된 배아의 경우 암컷을 ICR 수컷 마우스(10~18주령)와 교배시켰습니다. 접합체는 해부된 난관으로부터 0.5 dpc로 수집되었습니다. KSOM 배지(ARK Resource Co., Ltd.)에 넣어줍니다. 절강대학교(중국)는 윤리적 승인 번호 ZJU20230182로 동물 연구 프로토콜에 대한 지침을 제공했습니다.

siRNA 주입의 경우 생체 내에서 수집된 접합체를 무작위로 XNUMX개 그룹으로 할당했습니다.ZFP352, siMERVL, siNC(스크램블 제어) 및 주입되지 않은 제어입니다. siRNA 서열은 아래와 같다.

siZFP352: CCAUUGAGAACACCUUCUUTT; GCUCCAUAUGUGGGUGAAUTT; GGUUCUACGCUUGUCCCUTT

simMERVL: GAAGAUAUGCCUUUCACCAGCUCUA

siNC: UUCUCCGAACGUGUUCACGUTT

60 μM의 siRNA를 미세주입 유리 모세관(BOROSILICATE GLASS, ITEM#: BF100-78-15)을 사용하여 접합체의 세포질에 주입했습니다. 주입된 배아는 가습 다중 가스 인큐베이터(35% O430165)에서 5mm 페트리 접시(Corning Life Sciences, XNUMX)의 미네랄 오일 아래 KSOM 배지에서 배양되었습니다.2, 6 % CO2, 및 89% N2) 37°C에서. 미세주사 후 총 XNUMX일 동안 배아 발달을 기록했습니다.

마우스 배아에 대한 실시간 qPCR 및 RNA-seq

10개의 배아로부터 총 RNA를 분리하고 모았습니다. cDNA 전환은 이전에 설명한대로 수행되었습니다.57. 배아를 채취하여 세포 용해 완충액(0.2% RNase 억제제 및 2% Triton X-5 포함) 95μl, 100μM 올리고-dT 프라이머 1μl 및 dNTP 믹스(각각 10mM; Fermentas, R1). 혼합물을 빠르게 와동시킨 후 10×로 스팬다운했습니다. g 실온에서 10초 동안) 즉시 얼음 위에 옮겼습니다. 샘플을 72°C에서 3분 동안 배양한 후 즉시 다시 얼음 위에 놓았습니다. SuperScript II 역전사효소(Invitrogen, 카탈로그 번호 5.7-18064), RNAse 억제제(014U), 10X Superscript II 첫 번째 가닥 완충액, 5mM DTT(Invitrogen, 100-18064), 014M를 포함하는 RT 혼합물 5μl 베타인(BioUltra ≥99.0%; Sigma-Aldrich, 61962), 1M MgCl2, 100 μM TSO를 위아래로 부드럽게 피펫팅하여 혼합했습니다. 역전사를 위해 샘플을 42°C에서 배양한 후 First-strand 반응 KAPA HiFi HotStart ReadyMix(KAPA Biosystems, KK2601)를 사용하여 증폭시켰습니다. 상대적 발현 수준 ZFP352 및 MERVL은 RT-qPCR로 측정하고 다음과 같이 정규화되었습니다. 갑드. cDNA는 Illumina 키트(TD2-503)용 Vazyme TruePrep DNA Library Prep Kit V01를 사용하여 라이브러리 구성에 사용되었으며 이후 샘플당 20M 읽기 깊이로 Illumina 플랫폼 시퀀싱을 거쳤습니다. 라이브러리 구성에 대한 자세한 내용은 사용자 매뉴얼에서 확인할 수 있습니다.

ELISA 분석

SINE_B1 DNA 프로브는 비오티닐화된 프라이머를 사용하여 PCR로 합성하고, 0.1% TBS-T로 희석한 후 스트렙타비딘 플레이트(Thermo Scientific, 15500)에 코팅했습니다. 프로브 코팅된 웰을 세척하고 차단한 후 과발현되는 HEK293T 세포의 다양한 양의 단백질 추출물을 로딩했습니다. ZFP352 or ZFP352+덕스 함께. 1:2000 희석 비율로 HA에 대한 1차 항체와 5000:352 희석 비율로 HRP와 결합된 항-마우스 1차 항체를 사용하여 SINE_B610348 프로브에 결합된 HA-ZFP30를 검출했습니다. 정지 용액을 추가하기 전에 웰을 어둠 속에서 492분 동안 OPD-용액(Sangon Biotech A650)과 함께 추가로 배양했습니다. 방출은 기준 파장으로 XNUMXnm를 사용하여 XNUMXnm에서 측정되었습니다.

반복 요소 주석

UCSC 게놈 브라우저에서 mm10의 RepeatMasker(rmsk) 트랙을 다운로드했습니다(https://genome.ucsc.edu/). 우리는 합의 시퀀스(Repbase에 주석이 추가됨)보다 길이가 20% 더 길거나 짧은 TE를 큰 삽입 삭제로 추가로 필터링했습니다. 그런 다음 필터링된 TE를 Ensembl 유전자 주석(버전 GRCm38.99)과 결합하여 GTF 형식의 새로운 유전자 주석 파일을 생성했습니다. 결합된 GTF 파일은 이후 RNA-seq 또는 Chip-seq 분석에 사용되었습니다.

단일 세포 RNA-seq 분석

마우스 초기 배아 발달 scRNA-seq 데이터 재처리

초기 배아 발달 동안 TE의 발현을 정량화하기 위해 우리는 scRNA-seq 데이터(SMART-Seq)를 재처리했습니다.46 앞서 설명한 바와 같이58. 간단히 말해, 원시 파일은 SRA(Short Reads Achieve) 데이터베이스(접속: SRA072494)에서 다운로드되었으며 STAR(v38.99e)를 사용하여 마우스 참조 게놈 GRCm2.7.0에 매핑되었습니다.59. 2000개 이하의 유전자좌에 매핑된 읽기가 유지되었으며 가장 좋은 적중만 유지되었습니다(–alignEndsType EndToEnd –winAnchorMultimapmax 2000 –outFilterMultimapNmax 2000 –outSAMprimaryFlag AllBestScore –outSAMmultNmax 1). 이러한 설정을 사용하면 고유하게 매핑된 모든 읽기가 유지됩니다. 동일한 점수의 여러 개의 동등한 최고 히트가 있는 읽기의 경우 히트 중 하나만 유지됩니다. 그런 다음 featureCounts(v2.0.0)를 사용했습니다.60 매개변수(-s 0 –fraction -M -C)를 사용하여 유전자와 TE 모두에 매핑된 읽기 수를 정량화합니다.

featureCounts에 의해 생성된 개수 행렬이 Seurat(v3.0.0)에 로드되었습니다.61 기본 QC, 정규화, 클러스터링을 포함한 다운스트림 처리용. 우리는 2000개 이상의 유전자 특징을 발현하는 세포를 보관하고 미토콘드리아에서 유래된 RNA의 50%가 있는 세포를 걸러냈습니다. 그런 다음 원시 개수를 10회 읽기당 개수로 정규화하고 Seurat 함수 "NormalizeData", "FindVariableFeatures" 및 "vst" 선택 방법을 사용하여 가장 가변적인 상위 3000개 유전자를 식별했습니다. 변수 유전자의 크기를 조정하여 주성분(PC)을 계산하기 위한 입력으로 사용했습니다. 기본 설정을 사용하여 Seurat 기능 "RunUMAP"을 사용하여 UMAP(Uniform Manifold Approximation and Projection)을 계산하기 위해 상위 50대의 PC가 선택되었습니다. 세포 유형 정보는 심판에서 채택되었습니다. 46. 단계별 마커 유전자는 Seurat 함수 "FindMarkers" 및 매개변수: "min.pct = 0.2, logfc.threshold = 1, test.use = "wilcox", max.cells.per.ident = 20"으로 식별되었습니다.

세포 유형(세포의 배아 단계) 마커 유전자 목록은 참고문헌의 주석 파일에 따라 정의되었습니다. 46. 마커는 Seurat의 FindMarker 기능을 사용하여 식별되었습니다. 평균 FC > 2 및 P 값 < 0.05는 최종 마커를 정의하기 위한 컷오프로 사용되었으며, 마커 유전자 목록은 다음 분석에 사용되었습니다.

scRNA-seq 데이터를 활용한 2CLC 진입 및 퇴출 과정 통합 분석

2CLC 진입 및 퇴출 프로세스의 통합 분석을 위해 2CLC 진입에 대한 연구에서 원시 fastq 파일을 다운로드했습니다. 덕스 과잉 표현15 (GEO: GSE121459) 및 DUX 유발 2CLC 종료 연구에서45 (지역: GSE133234). 이러한 데이터 세트는 10X Genomics 플랫폼에서 생성되었으므로 먼저 다음 매개변수를 사용하여 STARsolo에서 처리했습니다. AS CR UR CB UB GX GN sS sQ sM –soloType CB_UMI_Simple –soloCBwhitelist 2000K-april-2000_rc.txt –soloCBlen 1 –soloUMIstart 10000 –soloUMIlen 3000000 –soloBarcodeReadLength 737 –soloStrand Forward –soloFeatures Gene GeneFull SJ). 또한 TE 주석이 추가된 결합 GTF를 사용하여 TE 풍부도를 정량화했습니다. 이러한 설정을 사용하여 MT2014_Mm 또는 다른 TE를 표현하는 셀을 식별했습니다.

STARSolo에서 생성된 카운트 매트릭스를 사용하여 Seurat에서 다운스트림 분석이 수행되었습니다. 간단히 말해서, 우리는 (1) 400개 미만의 UMI/세포, ​​(2) 500개 미만 또는 8000개 이상의 유전자가 검출되고 미토콘드리아 RNA에서 파생된 UMI가 30% 이상인 세포를 제외했습니다. 원시 UMI 수는 10k UMI당 수로 정규화되고 로그 변환되었습니다. 두 데이터 세트에 대해 각각 Seurat 함수 "FindVariableFeatures" 및 변수 선택 방법 "vst"를 사용하여 상위 3000개의 가장 가변적인 유전자를 식별했습니다. 그런 다음 상위 20개 CCA에 "FindIntegrationAnchors" 및 "IntegrateData" 기능을 적용하여 두 데이터 세트를 통합했습니다. 통합 데이터 세트의 UMAP는 "n.neighbors = 5" 설정으로 "RunUMAP" 함수에 의해 계산되었습니다.

RNA-seq 및 데이터 분석

라이브러리는 샘플당 2M 읽기 깊이의 Illumina 플랫폼 시퀀싱을 받기 전에 Truseq RNA 샘플 준비 키트 v122(Illumina, RS-2001-20)를 사용하여 구성되었습니다. 원시 읽기에 대한 품질 관리는 FastQC(v0.11.8)에 의해 수행되었습니다.62. 두 페어드 엔드 읽기의 처음 10bp는 cutadapt(v2.9)에 의해 잘렸습니다.63. 스타(v2.7.0e)59 마우스 참조 게놈 GRCm38.99에 대한 판독을 정렬하는 데 사용되었습니다(https://ftp.ensembl.org/pub/release-99/fasta/mus_musculus/dna/). 매핑된 유전자좌가 2000개 이하인 읽기는 유지되었으며 가장 좋은 적중만 유지되었습니다(–alignEndsType EndToEnd –winAnchorMultimapmax 2000 –outFilterMultimapNmax 2000 –outSAMprimaryFlag AllBestScore –outSAMmultNmax). 유전자와 TE 모두에 대한 정량화는 FeatureCounts v2.0.0에 의해 계산되었습니다.60 GRCm38.99 GTF 파일(-s 0 –fraction -M –C, https://ftp.ensembl.org/pub/release-99/gtf/mus_musculus/).

차별적으로 발현된 유전자(DEG)와 전이 요소(DE-TE)는 R 패키지 edgeR(v3.30.3)에 의해 생성되었습니다.64. 대조군이나 치료군에서 평균 TPM이 1보다 큰 특징만 유지되었습니다. DEG는 접기 변경 > 2로 정의되었으며 조정되었습니다. P 값 < 0.05. DEG에 대한 GO 용어 강화는 R 패키지 ClusterProfiler(v3.12.0)를 사용하여 수행되었습니다.65 (ont = 'ALL', pAdjustMethod = 'BH', pvalueCutoff = 0.05, qvalueCutoff = 0.05).

클러스터링 마커 유전자 목록은 다음 기준과 일치하는 유전자로 정의되었습니다. 먼저 Dux 과발현 후 여러 다른 시점에서 DEG를 필터링한 다음 다른 시점과 비교하여 TPM이 가장 높고 다른 시점의 평균 TPM보다 높은 DEG를 다음과 같이 정의했습니다. 덕스 특정 유전자를 클러스터링하는 과발현 시점. 중복 분석은 R 패키지 GeneOverlap(v1.30.0, GitHub - shenlab-sinai/GeneOverlap: 유전자 목록 중복 테스트 및 시각화를 위한 R 패키지)를 사용하여 수행되었습니다.

ChIP-seq 및 데이터 분석

세포를 수확하고 1% 포름알데히드(Sigma, 47608-250ML-F)로 실온에서 10분간 회전하면서 고정했습니다. 0.14 M 글리신을 사용하여 실온에서 10분 동안 담금질을 수행했습니다. 세포를 ChIP 용해 완충액(10mM Tris-HCl(pH 8.0), 0.25% Triton X-100, 10mM EDTA, 100mM NaCl, 프로테아제 억제제 칵테일)으로 용해시켰습니다. 게놈 DNA를 평균 크기 500bp의 짧은 단편으로 초음파 처리했습니다. 단편화된 DNA를 3μg HA(CST, 61099) 항체와 함께 4°C에서 밤새 배양했습니다. 이후 혼합물을 30μl 단백질 G Dynabeads와 함께 회전시키면서 실온에서 2시간 동안 배양했습니다. DNA를 용출 완충액(50mM Tris-HCl(pH 8.0), 1mM EDTA, 1% SDS)에서 용출하고 단백질분해효소 K로 60°C에서 밤새 처리했습니다. DNA를 FastPure DNA Extraction Mini Kit(Vazyme Biotech Co. Ltd, DC301)로 정제하고 qPCR 또는 Illumina 시퀀싱을 수행했습니다.

우리는 커뮤니티에서 선별한 생물정보학 파이프라인 "nf-core/chipseq"(v1.1.0)를 사용했습니다.66 ChIP-seq 데이터 분석을 위해. 우리는 Chipseq 파이프라인의 기본 설정을 사용했지만 TE 영역의 피크를 식별할 수 있도록 여러 적중 읽기를 유지하기 위해 "–keep-multi-map" 옵션을 추가했습니다. 간단히 말해서 원시 fastq 파일은 FastQC(v0.11.8)에 의해 처음으로 피팅되었습니다.62. TrimGalore(v0.5.0, https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/)는 어댑터 트리밍에 사용되었습니다. 나머지 고품질 읽기는 BWA(v38.99)에 의해 Ensembl(GRCm0.7.17)에서 다운로드한 마우스 참조 게놈에 매핑되었습니다.67. PCR 중복은 PICARD(v2.19.0, http://broadinstitute.github.io/picard/) 및 SAMtools(v1.9)에 의해 제거됨68. 그런 다음 MACS2(v2.1.2)69 피크를 호출하는 데 사용되었습니다. q 값(최소 FDR)이 0.05 미만인 좁은 피크는 최종 피크로 유지되었습니다.

Bigwig 트랙은 Deeptools(v3.4.3)를 사용하여 생성되었습니다.70 10bp의 binsize를 사용하여 RPKM으로 정규화합니다. 게놈 영역에 대한 ChIP-seq 신호는 Deeptools(v3.4.3)에 의해 플롯되었습니다.70. 피크 영역의 TE 주석의 경우 피크 영역에 대한 다양한 TE 계열/클래스(관찰)의 주석은 Homer(v4.7)의 annotatePeaks.pl 함수를 통해 얻었습니다.71 TE 주석 파일을 사용하여.

덕스 과발현 ChIP-seq 원시 데이터는 GEO: GSE95517에서 나왔습니다.8. DeepTools(v3.4.3)의 ComputeMatrix 및plotHeatmap 명령을 사용하여 ChIP-seq 히트맵을 플롯했습니다.70. K-평균 클러스터링 방법을 사용하여 지역을 세 가지 범주로 나누었습니다. 결과 클러스터는 ZFP352 및 DUX 공동 바인딩 영역(±500bp), ZFP352가 없는 DUX 전용 바인딩 영역 및 DUX가 없는 ZFP352 전용 바인딩 영역입니다. 피크 영역 및 판독 범위의 게놈 브라우저 이미지는 IGV(Integrative Genomics Viewer)를 사용하여 구성되었습니다. 피크는 UCSC의 주석 라이브러리를 사용하여 mm10에 대해 주석을 달았습니다.

ZFP352 ChIP 피크 주변의 예상 TE 위치는 ZFP352 ChIP 피크 영역의 결합 영역에서 각 TE 서브패밀리 복사본의 수를 계산하여 식별되었으며 예상 TE 수는 각에서 TE 서브패밀리의 무작위 분포를 가정하여 계산되었습니다. 게놈 지역. 각 TE 하위 계열의 평균 길이도 고려되었습니다. SINE_B1 특정 유전자와 B1_Mus2, B1_Mus1, B1_Mm 특정 유전자는 BEDtools(v2.29.2)를 사용하여 계산되었습니다.72,73 피크 정상에서 ±5kb의 창에서 창 명령을 실행합니다. MT2_Mm 특정 유전자는 SINE_B50의 총 복사 수가 MT1_Mm의 수보다 훨씬 높기 때문에 피크 정상에서 ±2kb의 창에서 BEDtools 창 명령을 사용하여 계산되었으므로 다른 거리 기준이 사용되었습니다.

ATAC-seq 및 데이터 분석

ATAC-seq는 이전에 설명한대로 수행되었습니다74 Illumina용 MagicSeq Tn5 DNA 라이브러리 준비 키트(Magic-Bio, M3141)를 사용합니다. mESC 펠릿을 37°C에서 30분 동안 트랜스포사제로 처리하고 MinElute PCR 정제 키트(QIAGEN, 28006)를 사용하여 정제하고 맞춤형 Nextera PCR 프라이머 1 및 0541를 사용하여 1xNEBnext PCR 마스터 믹스(NEB, M2S)를 사용하여 증폭시켰습니다. MinElute로 정제 시 PCR 정제 키트(QIAGEN, 28006). 라이브러리는 Nova 쌍말단 150bp 시퀀싱을 거쳤습니다.

ATAC-seq 데이터 분석을 위해 FastQC v0.11.8을 사용하여 품질 관리를 수행했습니다.62. Tn5 어댑터(AGATGTGTATAAGAGACAG)가 cutadapt v2.9에 의해 잘렸습니다.63. 스타 v2.7.0e59 인간 참조 게놈 GRCm38.99에 대한 정렬에 사용되었습니다. 최대 1000개의 다중 매핑된 사이트를 읽고 3개 이하의 불일치가 유지되었으며 가장 좋은 적중만 유지되었습니다(–outFilterMultimapNmax 1000, –outFilterMismatchNmax 3, –outSAMmultNmax 1). 일반 기능 형식 파일 없이 STAR 인덱스를 생성하고 인트론 길이(–alignIntronMax 1)를 허용하지 않음으로써 스플라이스 접합이 무시되었습니다. PCR 중복은 Samtools v1.2에 의해 제거되었습니다.68 rmdup 기능.

ATAC-seq 피크는 MACS2 v2.2.7.1을 사용하여 정의되었습니다.75 기본 매개변수를 사용하는 callpeaks 함수. Bigwig 트랙은 deeptools v3.4.3을 사용하여 생성되었습니다.70 10bp의 binsize를 사용하여 RPKM으로 정규화합니다. 게놈 영역에 대한 ATAC-seq 신호는 deeptools v3.2.1에 의해 플롯되었습니다.70.

모티브 분석

ZFP352 결합 SINE_B1 서열은 ±1kb 영역에서 ZFP352 ChIP-seq 피크를 갖는 SINE_B5/Alu 피크였습니다(n = 4141). ZFP352 바운드 B1_Mus2(n = 2150), ZFP352 바운드 B1_Mus1(n = 780) 및 ZFP352 바인딩 B1_Mm(n = 1211)도 같은 방법으로 얻었다. ZFP352 결합 MT2_Mm 시퀀스는 ±2kb 영역에서 ZFP352 ChIP-seq 피크를 갖는 MT50_Mm 피크였습니다(n = 1896). Motif 분석은 ZFP352 바운드 SINE_B1 및 ZFP352 바운드 MT2_Mm 베드 파일을 사용하여 MEME 웹 사이트의 Motif Discovery 기능으로 수행되었습니다. Hexamer 분석은 ZFP352 결합 SINE_B1 또는 ZFP352 결합 MT2_Mm 시퀀스를 사용하여 수행되었습니다. ZFP352 바운드 SINE_B1 또는 ZFP352 바운드 MT2_Mm의 시퀀스 정보는 BEDtools(v2.29.2)의 getfasta 명령을 사용하여 생성되었습니다.72,73 각각의 베드 파일을 사용하여 2.3.0량체를 Jellyfish(vXNUMX)를 사용하여 계산했습니다.76 count 명령어를 사용하였고, 헥사머 카운트 결과로부터 통계를 얻기 위해 Jellyfish dump 명령어를 사용하였다. 각 ZFP352_bound TE 서브패밀리의 모든 XNUMX량체의 백분율 분포는 레트로트랜스포존 서브패밀리 사본의 모든 무작위 XNUMX량체 중 이 XNUMX량체의 백분율로 계산되었으며 히트맵에 함께 표시되었습니다.

데이터 시각화

선택된 유전자의 히트맵은 R 패키지 pheatmap(v1.0.12) 및 ComplexHeatmap(v2.0.0)을 사용하여 플롯되었습니다.77.

RAD 분석

RAD 분석은 웹 도구를 사용하여 수행되었습니다. https://labw.org/rad/docs47. DEG의 덕스 과발현과 ZFP352 과발현 RNA-seq는 다음 기준에 따라 선택되었습니다: 배수 변화 [FC] > 1.5 및 조정된 상향 조절된 유전자 P 값 < 0.05; 배수 변화 [FC] < -1.5 및 조정된 하향 조절된 유전자 P 값 < 0.05. 입력 영역에는 GRCm352(mm2) 게놈의 ChIP-seq, MT1_Mm 및 SINE_B38 하위 계열 위치 좌표에서 밝혀진 DUX 또는 ZFP10 바운드 피크가 포함됩니다. 제출 옵션의 경우 "GRCm38(mm10)"이 참조 게놈으로 선택되었고, 맞춤형 피크 연장 거리로 "1000, 500, 200, 100, 50, 25, 20, 15, 10, 5, 0kb"가 선택되었습니다. 농축 점수는 예상 분포 빈도에 대해 관찰하여 계산되었습니다. "예상"은 무작위 분포를 가정한 게놈 평균을 나타냅니다. 통계적 유의성을 평가하기 위해 단면 초기하 테스트를 수행하였고, P 값은 다음과 같이 표시되었습니다. *P < 0.05, **P < 0.01, ***P < 0.001, ****P <0.0001.

통계 및 재현성

Next Generation Sequencing의 데이터를 제외하고 그림에 제시된 모든 데이터에 대해 실험은 최소 두 번 수행되었으며, 매번 반복 실험을 수행했으며 통계 분석은 각 그림 범례에 설명된 대로였습니다.

보고 요약

연구 설계에 대한 추가 정보는 Nature 포트폴리오 보고 요약 이 기사에 링크되어 있습니다.

spot_img

최신 인텔리전스

spot_img