Zephyrnet-logo

Analyse van de kwaliteit van mRNA-vaccins met behulp van RNA-sequencing – Nature Communications

Datum:

Ontwerp en synthese van referentieplasmide

Eerst werd een referentieconstruct ontworpen, met de bedoeling de productie van RNA-therapieën voor preklinisch onderzoek te optimaliseren. De coderende sequentie van eGFP30 werd geselecteerd als reporter in het coderende gebied, omdat het eiwitproduct eenvoudig kan worden getest via flowcytometrie en andere fluorometrische methoden. De transcriptie wordt geïnitieerd met behulp van een gemodificeerde T7-promotor (5'-TAATACGACTCACTATAAGG-3'), die compatibel is met CleanCap AG-reagentia (TriLink BioTechnologies) voor co-transcriptionele capping tijdens mRNA IVT, en de 5'- en 3'-UTR-sequenties werden geselecteerd uit Respectievelijk humaan alfaglobine en AES-mtRNR1, vanwege hun aangetoonde effect op de stabiliteit en expressie van mRNA31,32,33. Er werd gekozen voor een gesegmenteerde poly(A)-staart van 126nt, omdat voorspeld werd dat deze het optreden van plasmiderecombinatie bij E. coli tijdens plasmidepropagatie en klonering, zonder de halfwaardetijd van mRNA en de efficiëntie van translatie in zoogdiercellen in gevaar te brengen17. Ons construct werd gesynthetiseerd en gekloneerd in een pUC57-Kan-skelet (GenScript), die een oorsprong van replicatie en een kanamycineresistentiegen bevat.

Plasmide-DNA werd met behulp van hitteschok getransformeerd in NEB Stable competent E. coli cellen (NEB, C3040H). Een enkele kolonie die het plasmide bevatte, werd vervolgens in LB-media geamplificeerd met 30 µg/ml kanamycine. E. coli werd geoogst uit 2500 ml cultuur met behulp van centrifugatie en gelyseerd met behulp van alkalische lyse. Het supercoiled plasmide-DNA werd vervolgens gezuiverd met behulp van meerstaps FPLC-zuivering, eerst met behulp van anionenuitwisselingschromatografie en vervolgens met behulp van een ontzoutingskolom, waar de buffer werd uitgewisseld voor TE. Eén mg supercoiled plasmide-DNA werd gelineariseerd met behulp van het restrictie-enzym Bsal-HFv2 (NEB, R3733), waardoor een enkel fragment werd gegenereerd dat eindigt aan het uiteinde van de poly(A)-staart. Deze linearisatie zorgt voor run-off in vitro transcriptie, die onmiddellijk 3' van de poly(A)-staart eindigt. Na linearisatie werd het plasmide-DNA verder gezuiverd met hydrofobe interactiechromatografie (HIC). Het gelineariseerde plasmide-DNA werd verdund met 3 volumes 4 M ammoniumsulfaat en vervolgens gezuiverd met behulp van HIC om andere isovormen van plasmide-DNA te verwijderen. De samengevoegde fracties die overeenkomen met lineair plasmide-DNA werden van buffer uitgewisseld met TE-buffer op een ontzoutingskolom om het ammoniumsulfaat te verwijderen. Het gezuiverde lineaire plasmide-DNA werd geconcentreerd met behulp van isopropanolprecipitatie tot een concentratie van ongeveer 500 ng/ul.

We evalueerden de lengte en zuiverheid van ons gelineariseerde plasmide-sjabloon met behulp van een reeks verschillende analytische methoden. Eerst werd de grootteverdeling van het gelineariseerde plasmide vergeleken met het supercoiled plasmide met behulp van Agarose-gelelektroforese. Dit maakt de analyse mogelijk van het aandeel gelineariseerde plasmiden in het preparaat. Ten tweede werd de zuiverheid van het supercoiled en gelineariseerde plasmide-DNA geanalyseerd met HPLC met behulp van een CIMac™. Het pDNA werd geanalyseerd op een 0.3 ml (1.4 mm) diethylaminoethyl (DEAE) zwakke anionenuitwisselingskolom (BIA Separations, Adjovščina, Slovenië) verbonden met een PATfix® analytisch HPLC-systeem (Sartorius, Goettingen, Duitsland). HPLC werd uitgevoerd met behulp van mobiele fase Buffer A (0.1 M Tris, 0.3 M Guanidine-HCl, 1% Tween-20 (w/v), pH 8.0) en Buffer B (0.1 M Tris, 0.3 M Guanidine-HCl, 0.7 M NaCl 1% Tween-20 (w/v), pH 8.0).

Oxford Nanopore-plasmidesequencing

Oxford Nanopore-sequencing werd gebruikt om de nauwkeurigheid en zuiverheid van plasmide-template-preparaten te meten. Ligatiesequencing-bibliotheken (SQK-LSK109) werden bereid uit gelineariseerde plasmide-matrijzen (hierboven beschreven) en werden gelabeld met PCR-vrije natieve streepjescodes (EXP-NBD104). Bibliotheken werden vervaardigd volgens de instructies van de fabrikant (Oxford Nanopore Technologies), met de uitzondering dat 2 µg template als invoer werd gebruikt in plaats van de aanbevolen 1 µg. De resulterende bibliotheken werden gekwantificeerd op een Qubit-instrument (Invitrogen) met de dsDNA HS-kit en kwalitatieve analyse van de fragmentlengteverdeling werd voltooid met D5000 ScreenTapes (Agilent Technologies, VS). De resultaten van de kwantitatieve en kwalitatieve analyses werden gebruikt om de vereiste bibliotheekconcentraties voor het samenvoegen en laden te berekenen. Barcodebibliotheken werden gesequenced op R9.4.1 (FLO-MIN106D) of Flongle Flow Cells, met High Accuracy live base-calling ingeschakeld (Guppy v5.1.13 en MinKNOW Core 4.5.4). Alle nanoporie-metingen met kwaliteitsscores> 9 werden gebruikt om een ​​aaneengeschakeld FASTQ-bestand te vormen en gingen verder met analyse.

Bioinformatische analyse van Oxford Nanopore-plasmidesequencing

Eerst werden streepjescodes verwijderd met Poechop v0.2.4 Oxford Nanopore pDNA-sequentiegegevens werden vervolgens in kaart gebracht en geanalyseerd met behulp van een aangepaste pijplijn. De op kwaliteit gefilterde, aaneengeschakelde FASTQ-lezingen werden uitgelijnd met de plasmidereferentie via Minimap2 (Release 2.20-r1064) met -ax map-ont voor Nanopore34. De resulterende SAM-uitlijningsbestanden werden verwerkt via SAMtools v1.15 om gesorteerde en geïndexeerde BAM-bestanden te genereren, evenals diverse andere mapping-analysebestanden35. De gegenereerde BAM-bestanden werden bekeken en geanalyseerd met behulp van Integrative Genomics Viewer (IGV v2.12.3)36. Verdere run- en monsterkwaliteitsstatistieken werden verkregen via NanoPlot v1.38.1 en pycoQC v v2.5.237,38.

Het per-nucleotide-foutprofiel van toegewezen waarden werd bepaald ten opzichte van de referentie-indexreeks met behulp van pysamstats v 1.1.2 met opties –max-diepte=300000000 –FASTA –type variatie (https://github.com/alimanfoo/pysamstats). Om eenvoudige foutcorrectie uit te voeren, werd het per-nucleotide-foutprofiel van de plasmidesequenties afgetrokken van de overeenkomstige nucleotiden binnen de cDNA/dRNA-sequenties. Plotten en statistische analyses werden uitgevoerd met behulp van Excel (v 16.67 voor Mac) en GraphPad Prism (v 9.3.1 voor Mac) software.

Om de inhoud van de niet-toegewezen reads te onderzoeken op mogelijke besmetting, werd een BAM-bestand gegenereerd voor niet-toegewezen reads via SAMtools (v1.15) met behulp van SAMtools view -S -b -f 4 en dit werd via SAMtools FASTA geconverteerd naar een FASTA-bestand. Dit FASTA-bestand is uitgelijnd met een E. coli referentiereeks met behulp van Minimap2 en vervolgens gesorteerde en geïndexeerde BAM-bestanden en uitlijningsstatistieken werden gegenereerd met SAMtools zoals eerder beschreven. Sequentiehomologie van de waarden die niet overeenkwamen met de E. coli referentie werd onderzocht met behulp van de Basic Local Alignment Search Tool (BLAST) Nucleotide Collection nr/nt, verstrekt door het National Center for Biotechnology Information.

Het aanroepen van varianten en het genereren van consensussequenties werd voltooid met behulp van bcftools (v1.15)35 met de volgende reeks opdrachten die het BAM-bestand vergelijken met de referentie en een VCF genereren; bcftools mpileup -d 300000000 –no-BAQ –min-BQ 0 -Ou -f | bcftools roept -c -M –ploidy 1 -Oz -o *.vcf.gz aan. De resulterende VCF werd geïndexeerd en genormaliseerd ten opzichte van de referentie en er werd een BCF gegenereerd. Er werd een consensus.fa-reeks gegenereerd na vergelijking van de VCF met de referentiereeks met het commando bcftools consensus en optie -a – om posities die afwezig zijn in de VCF (nul dekking) te vervangen door een teken.

Illumina-plasmide-DNA-sequencing

Plasmide-DNA-sjablonen werden vervolgens gesequenced op een Illumina MiSeq-instrument. Illumina-DNA met streepjescode PCR-vrije bibliotheken werden bereid uit hetzelfde gelineariseerde plasmide-matrijs gebruikt voor ONT-sequencing, volgens de instructies van de fabrikant (Illumina). De resulterende bibliotheken werden gesequenced op een MiSeq-instrument bij de Australian Genome Research Facility met behulp van v2-chemie, ingesteld op een uiteinde van 150 basenparen.

BCL-bestanden gegenereerd op de Illumina MiSeq werden verwerkt met de Illumina DRAGEN BCL Convert 07.021.609.3.9.3-pijplijn om FASTQ.gz-bestanden te genereren. De kwaliteit van de leesbewerkingen in deze bestanden werd gecontroleerd met FastQC (v0.11.9). De leesbewerkingen werden vervolgens aangepast en de kwaliteit werd bijgesneden met behulp van TrimGalore (v0.6.8dev) om FASTQ.gz-bestanden te maken met leesbewerkingen die de Q20-drempel overschreden39. Adapters werden uit de Illumina PCR-vrije bibliotheken geknipt met behulp van –stranded_illumina –paired. Bovendien werden T-overhangen verwijderd uit de Illumina-gestrande mRNA-bibliotheken met behulp van –clip_r1 1 –clip_r2 1. De resulterende bijgesneden bestanden werden gecontroleerd met FastQC en vervolgens uitgelijnd met een geïndexeerd plasmide-referentiebestand40 met behulp van BWA-MEM (bwa-0.7.17-r1188).

In vitro transcriptie van mRNA

Afgedekt mRNA met gemodificeerde nucleotiden werd geproduceerd door in vitro transcriptie (IVT) met behulp van T7 RNA-polymerase volgens protocollen beschreven door Henderson et al.41 en volgens de instructies van de fabrikant (NEB, E2080S). In het kort werd 50 µg/ml gezuiverd lineair plasmide-DNA gebruikt als sjabloon voor een IVT-reactie bij 32 °C gedurende 3 uur met 16 µg/ml T7 RNA-polymerase (NEB M0251), ribonucleotiden (6 mM ATP, 5 mM CTP, 5 mM GTP; NEB, N0450), 5 mM N1-methylpseudouridine-5'-trifosfaat (TriLink BioTechnologies, TRN108110), of 5 mM UTP voor gematchte ongemodificeerde controles, transcriptiebuffer (40 mM Tris·HCl pH 8.0, 16.5 mM magnesiumacetaat, 10 mM dithiothreitol (DTT), 20 mM spermidine, 0.002% (v/v) Triton X-100), 2 U/ml gist Anorganische pyrofosfatase (NEB, M2403) en 1000 U/ml muriene RNase-remmer (NEB, M0314). Cap1-analoog werd co-transcriptioneel opgenomen aan het 5'-uiteinde van mRNA door toevoeging van 4 mM CleanCap AG-reagentia (TriLink, TRN711310) aan de reactie. De mRNA IVT-reactie werd gestopt door toevoeging van 200 eenheden DNaseI (NEB, M0303) per ml IVT-reactie en incubatie bij 37 ° C gedurende 15 minuten. De resulterende mRNA's werden gezuiverd met behulp van Monarch RNA-opruimkits (NEB, T2050) volgens de instructies van de fabrikant met de uiteindelijke elutie in gedestilleerd ultrapuur water (ThermoFisher Scientific, 10977015).

We evalueerden de opbrengst, lengte en zuiverheid van de IVT-mRNA's met behulp van een reeks verschillende analytische methoden. mRNA werd gekwantificeerd door UV-spectrofotometrieanalyse met behulp van een NanoPhotometer N120 (Implen) en de grootteverdeling werd geëvalueerd met behulp van TapeStation-elektroforese met RNA ScreenTapes (Agilent Technologies, VS, 5067-5576).

Detectie van dsRNA-verontreinigingen door dot-blot-analyse

De IVT-mRNA-monsters werden verdund in nucleasevrij water tot eindconcentraties van 200, 500, 1000 en 2000 ng/μl. Van de verdunde monsters werden porties van 5 μl op een positief geladen nylonmembraan (Roche, Bazel, Zwitserland) geladen, wat resulteerde in een totale laadhoeveelheid van respectievelijk 1000, 2500, 5000 en 10,000 ng IVT-mRNA-monsters op elke blot. dsRNA werd in eigen huis vervaardigd42 als positieve controle en voor de negatieve controle werd nucleasevrij water gebruikt. Monsters werden volgens de instructies van de fabrikant op een Bio-Dot® microfiltratieapparaat (Bio-Rad, CA, VS) geladen. Het membraan werd aan de lucht gedroogd, vervolgens geblokkeerd door onderdompeling en bij kamertemperatuur geïncubeerd met blokkeerbuffer die 5% magere droge melk in TBS-T (50 mM Tris-HCl, 150 mM NaCl, 0.05% Tween (w/v)) bevat. gedurende 1 uur onder roeren.

Voor de detectie van dsRNA werd het membraan een nacht bij 4 ° C geïncubeerd met twee verschillende dsRNA-specifieke monoklonale antilichamen van muizen (mAb), die waren afgeleid van klonen 3G1 en 2G4 (Mozzy Mabs, Brisbane, Australië). Beide antilichamen werden afzonderlijk overnacht geïncubeerd bij een verdunning van 1:5, verdund in incubatiebuffer (1% magere droge melk in TBS-T). De membranen werden vervolgens driemaal gespoeld en vervolgens driemaal gedurende 3 minuten gewassen, elke wasbeurt met TBS-T. De membranen werden vervolgens gedurende 3 uur onder roeren geïncubeerd met mierikswortelperoxidase (HRP)-geconjugeerd geit-anti-muis immunoglobuline G (IgG) secundair antilichaam (Abklonal, MA, VS) bij een verdunning van 15:1, verdund in incubatiebuffer. De membranen werden vervolgens driemaal gespoeld en vervolgens driemaal gewassen gedurende 5000 minuten per wasbeurt. Chemiluminescentiedetectie werd uitgevoerd met behulp van Novex ™ ECL chemiluminescente substraatkit (Invitrogen, MA, VS) en de signaalintensiteiten van de stippen werden gevisualiseerd met behulp van het ChemiDoc MP Imaging System (Bio-Rad, CA, VS).

ONT cDNA-PCR-sequencing

cDNA-PCR-sequencing werd gebruikt om de nauwkeurigheid en zuiverheid van de IVT-mRNA's te bepalen. Eerst werd de mRNA-concentratie berekend met behulp van de Qubit RNA BR-kit (ThermoFisher Scientific). mRNA's werden verdund in nucleasevrij water tot een geschikte concentratie voor bibliotheekbereiding (~1 ng/μL), en concentraties werden bevestigd met behulp van een Qubit RNA HS-kit (ThermoFisher). ONT-cDNA-PCR-bibliotheken met streepjescode (SQK-PCB109 en SQK-PCS111) werden bereid volgens de instructies van de fabrikant (Oxford Nanopore Technologies), met de volgende uitzonderingen. De verdamping tijdens de cDNA-synthesestap werd beoordeeld door het reactievolume te meten, en de buizen werden indien nodig bijgevuld met nucleasevrij water. Het cDNA werd gedurende 14–16 cycli geamplificeerd (aanbevolen is 14–18 cycli). Ten slotte werden de bibliotheken geëlueerd in 8 µl elutiebuffer (in plaats van het aanbevolen volume van 12 µl) om de eindconcentraties van de bibliotheken te verhogen. Dit was nodig omdat bibliotheken die zijn bereid met sjablonen die gemodificeerde basen bevatten, bibliotheken met een lagere output lijken te produceren dan die welke zijn bereid met niet-gemodificeerde basen.

De resulterende bibliotheken werden gekwantificeerd via een Qubit-instrument (Invitrogen) met de dsDNA HS-kit (ThermoFisher Scientific) en kwalitatieve analyse van de fragmentlengteverdeling werd uitgevoerd met behulp van D5000 ScreenTapes (Agilent Technologies, VS). De resultaten van de kwantitatieve en kwalitatieve analyse werden gebruikt om bibliotheekconcentraties aan te passen voor pooling en laden. Op elke R10 (FLO-MIN9.4.1D) stroomcel werd de sequentie van maximaal 106 bibliotheken met streepjescode bepaald, waarbij live base-calling met hoge nauwkeurigheid was ingeschakeld (Guppy v5.1.13 en MinKNOW Core 4.5.4). Alle nanoporie-metingen met een kwaliteitsscore> 9 werden toegewezen als geslaagd en gingen verder met analyse.

Bio-informatica-analyse van ONT-cDNA-PCR-sequencing

cDNA-PCR-gegevens werden geanalyseerd zoals beschreven voor ONT-pDNA-sequencing (zie hierboven). Daarnaast zijn de volgende analyses uitgevoerd. Om FASTQ-transcripten van volledige lengte te identificeren die SSP- en VNP-primers in de juiste oriëntatie bevatten, werd de tool pychopper (v.2.5.0) gebruikt (met standaardparameters). Deze adapters werden vervolgens bijgesneden en er werden nieuwe FASTQ-bestanden gegenereerd. Bijgesneden waarden uit geredde mappen en mappen met de volledige lengte werden samengevoegd en deze waarden werden zoals hierboven beschreven met Minimap2 in kaart gebracht aan de plasmidereferentie. Er werden ook BAM-bestanden gegenereerd zoals hierboven beschreven en deze werden gebruikt voor analyse van de cDNA-leeslengtes. SAMtools (v1.15) met behulp van SAMtools view -F 2048 werd gebruikt om leeslengteverdelingen van de primair uitgelijnde leesbewerkingen uit de BAM-bestanden te extraheren. Plotten en statistische analyses werden uitgevoerd met behulp van GraphPad Prism (v9.4.1 voor Mac) software om leeslengteverdelingsprofielen voor elk monster te creëren.

Vervolgens analyseerden we het aandeel on-target-reads uit onze cDNA-PCR-dataset (dat wil zeggen reads die correct zijn getranscribeerd en waarschijnlijk zullen worden vertaald in een functioneel eiwit). Eerst werd BEDtools (v2.27.1) intersect gebruikt om de gesorteerde BAM-bestanden te analyseren en de verhoudingen van on- en off-target-lezingen te identificeren. Er werden BED-bestanden gegenereerd, die doelcoördinaten aangeven die het begin van de Kozak-sequentie en het einde van de 3'-UTR omvatten. Lezingen werden weggegooid als on-target en er werd een BAM-bestand gegenereerd als ze de start- en stopcoördinaten overlapten. Alle andere lezingen werden weggegooid als off-target. Aflezingen buiten het doel werden verder naar beneden gefilterd, afhankelijk van de overlap van de start- of stopcoördinaten, wat 3'- of 5'-degradatie aangeeft. De gegenereerde BAM-bestanden werden bekeken en geanalyseerd met behulp van Integrative Genomics Viewer (IGV v2.12.3).

Variantaanroep en consensussequentiegeneratie van het mRNA-coderende gebied werd voltooid zoals eerder beschreven, behalve dat het ook de optie –targets gebruikt om de stapeling te beperken tot de hierboven gespecificeerde start- en stopcoördinaten.

poly(A) staartlengteberekening met behulp van ONT cDNA-PCR-sequencing

De poly(A)-staartlengte werd geschat op basis van cDNA-PCR-gegevens (SQK PCS111) die de oligo dT-primer aan het 3'-uiteinde verankeren, en met behulp van staartvinder (v1.3) met behulp van protocollen beschreven in Kraus et al.21. In het kort worden niet-uitgelijnde FAST5-bestanden ingevoerd, die vervolgens worden gesegmenteerd in de sequencing-adapter, spalkadapter, poly(A)-staart en genlichaam. poly(A) staartlengte wordt vervolgens berekend op basis van schattingen van de porietranslocatietijd. De poly(A)-staartlengte werd geschat op basis van Fast5-bestanden gegenereerd op basis van de originele cDNA-PCR-kit (SQK PCB109) en de bijgewerkte versie (SQK PCS111). Hier werden Fast5-bestanden uit beide kits met hoge nauwkeurigheid opgeroepen met behulp van de volgende configuratie dna_r9.4.1_450bps_hac.cfg (Guppy v5.1.13 en MinKNOW Core 4.5.4). Vervolgens wordt de find_tails-functie van staartvinder (v1.3) werd uitgevoerd met standaardinstellingen21. Fast5-bestanden gegenereerd op basis van de SQK PCB109-kit vereisten specificatie van aangepaste cDNA 5' (TTTCTGTTGGTGCTGATATTGCT) en 3' (ACTTGCCTGTCGCTCTATCTTC) primerdetails om schatting mogelijk te maken.

Illumina cDNA-sequencing

Barcode-gestrande mRNA-bibliotheken van Illumina werden bereid uit dezelfde IVT-mRNA-sjablonen die werden gebruikt voor ONT-sequencing, volgens de instructies van de fabrikant (Illumina). De resulterende bibliotheken werden gemultiplext met de plasmide-DNA-bibliotheken en de sequentie ervan werd bepaald op een MiSeq-instrument bij de Australian Genome Research Facility met behulp van v2-chemie, ingesteld op een uiteinde van 150 basenparen. Het bijsnijden en in kaart brengen van onze Illumina-cDNA-sequencinggegevens volgde de pijplijn die is beschreven voor Illumina pDNA-sequencing (zie hierboven).

Het genereren van mappingstatistieken, berekeningen per nucleotidefout, variantaanroep, het genereren van consensussequenties en niet-toegewezen leesanalyses werden uitgevoerd zoals hierboven beschreven voor ONT-sequencing. Voor monsters die op het Illumina-platform zijn gesequenced, werden de in- en uitlezingen van het doel via een andere methode berekend vanwege de korte lengte van de metingen. SAMtools (v1.15) met de opdracht SAMtools view (verschillende coördinaten) werd gebruikt om metingen stroomafwaarts en stroomopwaarts van het mRNA-coderingsgebied van de referentie te extraheren en overeenkomstige BAM-bestanden te genereren. SAMtools flagstat werd gebruikt om de primaire leesbewerkingen in deze BAM-bestanden te tellen en dit aantal werd vergeleken met het totale aantal primaire leesbewerkingen om de beoogde leesaantallen te berekenen.

Om antisense-lezingen te identificeren, hebben we de SAMtools-weergave gebruikt om leesbewerkingen te scheiden die afkomstig waren van de voorwaartse (tweede in paar van voorwaartse streng, -b -f 128 -F 16 en eerste in paar van de omgekeerde streng, -b -f 80) of omgekeerde streng (tweede in paar als ze naar de omgekeerde streng verwijzen, -b -f 144 en eerste in paar als ze naar de voorste streng verwijzen, -b -f 64 -F 16). De lezingen die afkomstig waren van de omgekeerde streng werden aangeduid als antisense-lezingen.

Gemodificeerd polyadenylatieprotocol

Om fragmenten te detecteren die een poly(A)-staart missen in onze synthetische RNA's, hebben we enzymatisch poly(A)-staarten toegevoegd aan ons eGFP-mRNA. Dit werd bereid volgens een Oxford Nanopore-protocol, met behulp van E. coli Poly(A)-polymerase. In het kort werd tot 10 µg RNA met NEB geïncubeerd E. coli Poly(A) Polymerase (M0276) en 1 mM ATP gedurende 1.5 minuten. De reactie werd gestopt met behulp van EDTA (tot een eindconcentratie van 10 mM), waardoor een eindvolume van 25 µl werd verkregen. Het RNA met poly(A)-staart werd vervolgens schoongemaakt met behulp van 72 µl Agencourt RNAClean XP-kralen (Beckman Coulter A63987) en werd geëlueerd in 12 µl nucleasevrij water. Het eluaat werd vervolgens gekwantificeerd met behulp van Qubit BR- of HS-RNA-kits (afhankelijk van de hoeveelheid RNA die in de reactie werd ingevoerd). Een geschikte hoeveelheid RNA werd vervolgens gebruikt als matrijs voor de voorbereiding van de SQK-PCB109- of SQK-RNA002-bibliotheek. Bibliotheken werden bereid en gesequenced zoals hierboven beschreven.

Directe RNA-sequencing met Oxford Nanopore

Directe RNA-sequencing werd gebruikt om de nauwkeurigheid en zuiverheid van de IVT-mRNA's te bepalen. Bibliotheken werden bereid met behulp van de ONT SQK-RNA002-kit volgens de instructies van de fabrikant (Oxford Nanopore Technologies), met de volgende uitzonderingen. Eerst werd 400 ng matrijs gebruikt om elke bibliotheek te bereiden, in plaats van de 500 of 50 ng die wordt aanbevolen in ONT-protocollen voor directe RNA-sequencing. We hebben de cDNA-synthesestap gebruikt, die de matrijsstabiliteit verbetert. Bovendien hebben we Superscript IV gebruikt in plaats van het aanbevolen Superscript III, vanwege de hogere efficiëntie. Bibliotheken werden gekwantificeerd met behulp van een Qubit RNA BR-kit (ThermoFisher Scientific). Van elke bibliotheek werd de sequentie gedurende 9.4.1 uur bepaald op een afzonderlijke R106 (FLO-MIN72D) stroomcel. Fast5-bestanden werden later met hoge nauwkeurigheid opgeroepen met behulp van de volgende configuratie rna_r9.4.1_70bps_hac.cfg (Guppy v5.1.13). Alle nanoporie-metingen met een kwaliteitsscore> 9 werden toegewezen als geslaagd en gingen verder met analyse. Directe RNA-sequencinggegevens werden geanalyseerd zoals voor cDNA, met uitzondering van barcodedetectie met behulp van Pychopper, en on- en off target detectieberekeningen. Bovendien werden poly(A)-staartlengteberekeningen uitgevoerd zoals beschreven voor SQK PCS111-bibliotheken (hierboven).

Vervolgens werd de poly(A)-staartlengte geschat op basis van directe RNA-sequentiegegevens (SQK-RNA002). De poly(A)-staartlengte werd geschat met behulp van staartvinder (v1.3), met behulp van protocollen beschreven in Kraus et al.21. staartvinder (v1.3) maakt gebruik van de Fast5-bestanden om de staartlengte te schatten en deze tool werd aanvankelijk uitgevoerd op dezelfde directe RNA-dataset als Nanopolish v0.13.3 poly(A). Na vergelijking van de geschatte poly(A)-staartlengte werden verdere monsters geanalyseerd. staartvinder werd uitgevoerd met standaardinstellingen, waarbij een.tsv-bestand als uitvoer werd gegenereerd. Dit.tsv-bestand werd ondervraagd met een aangepast R-script dat voor elke lezing een dichtheidsplot genereerde van de geschatte poly(A)-staartlengte.

Statistieken en reproduceerbaarheid

De gegevens die in dit artikel worden weergegeven, zijn voornamelijk een proof of concept en variëren van n = 1 tot n = 4. Details over experimentele replicatie zijn opgenomen in afzonderlijke resultatensecties. Er werd geen statistische methode gebruikt om de steekproefomvang vooraf te bepalen. Er zijn geen gegevens uitgesloten van de analyses. De experimenten waren niet gerandomiseerd, omdat de kwaliteit van de template de belangrijkste bepalende factor is voor de kwaliteit van de sequencing, en niet welke alternatieve covariant dan ook. De onderzoekers waren niet blind voor de toewijzing tijdens experimenten en de beoordeling van de uitkomsten, omdat het onwaarschijnlijk was dat kennis van de identiteit van het monster de interpretatie van de resultaten zou beïnvloeden.

Rapportage samenvatting

Nadere informatie over onderzoeksontwerp is beschikbaar in de Samenvatting van de rapportage over de natuurportfolio gekoppeld aan dit artikel.

spot_img

Laatste intelligentie

spot_img