Characterization of SsoSSB, Sso1450, Sso2001 Proteins and Analysis of CRISPR and cas Genes from Sulfolobus solfataricus P2

Charakterisierung fuer SsoSSB, Sso1450, Sso2001 Proteinen und der Analyse fuer CRISPR und cas Genen von Sulfolobus solfataricus P2

Die Sequenzierung des kompletten Genoms von Sulfolobus solfataricus (Sso) P2 macht ihn zu einem der Modellorganismen für Crenarchaea. Diese Arbeit befasst sich mit der Charakterisierung eines neu entdeckten SSB Proteins von Sso P2, sowie der computergestützten Analyse von clustered regularly interspaced short palindromic repeats (CRISPR) und der experimentellen Untersuchung von CRISPR-associated (cas) Genen. Die DNS-Bindungseigenschaften von SsoSSB, die Organisation der CRISPR Loki und die biochDie Sequenzierung des kompletten Genoms von Sulfolobus solfataricus (Sso) P2 macht ihn zu einem der Modellorganismen für Crenarchaea. Diese Arbeit befasst sich mit der Charakterisierung eines neu entdeckten SSB Proteins von Sso P2, sowie der computergestützten Analyse von clustered regularly interspaced short palindromic repeats (CRISPR) und der experimentellen Untersuchung von CRISPR-associated (cas) Genen. Die DNS-Bindungseigenschaften von SsoSSB, die Organisation der CRISPR Loki und die biochemischen Eigenschaften einiger cas Genprodukte von Sso P2 wurden untersucht. Durch Größenausschlusschromatographie konnte gezeigt werden, dass SsoSSB in Lösung als Monomer vorliegt. Mittels Fluoreszenzanisotropie konnte die Wechselwirkung von SsoSSB in seiner monomeren Form mit kurzen Oligonukleotiden nachgewiesen werden. Mit Hilfe der nativen Gelelektrophorese konnte die Größe der Bindungsstelle mit 4-6 Nukleotide pro Proteinmolekül bestimmt werden. SsoSSB zeigt eine mehr als zehnmal so hohe Bindungsaffinität für Einzelstrang-DNS (ssDNS) im Vergleich zu Doppelstrang-DNS (dsDNS), was mit bereits veröffentlichten Daten übereinstimmt. Die Dissoziationskonstante ist im nieder-nanomolaren Bereich angesiedelt. Darüber hinaus bindet SsoSSB, ähnlich wie humanes Replikationsprotein A (RPA), bevorzugt an pyrimidinreiche ssDNS. Die Sequenzwiederholungen im CRISPR Lokus und die dazugehörigen cas Gene haben sich jüngst zu einer neuen genomischen Eigenschaft der Archaea und einiger Bakterien herausgestellt. Ursprünglich wurde angenommen, dass die cas Gene für Reparaturproteine codieren. In der vorliegenden Arbeit wurden fünf CRISPR Loki und die zugehörigen cas Gene in Sso P2 auf ihre genomische Organisation hin untersucht. Darüber hinaus wurde die Expression der cas Gene analysiert. Die Sequenzwiederholungen der CRISPR-Loki weisen hoch konservierte Sequenzabschnitte in regelmäßigen Intervallen auf, die durch Platzhaltersequenzen ähnlicher Größe getrennt sind. Die meisten der cas Gengruppen eines benachbarten CRISPR Lokus enthalten homologe Gene, die auch in anderen CRISPR-Loki gefunden werden. Die cas Gene können anhand ihres Genlokus und ihrer Genfolge gruppiert werden. In einer Gengruppe sind sie meistens „Kopf an Schwanz“ angeordnet, was eine funktionelle Beziehung andeutet. Die cas Gene sso1996-2002, sso1438-1443 und sso1398-1403 besitzen jeweils eine für Sulfolobus spezifische transcription factor B recognition element, TATA-Box, Shine-Dalgarno- und Terminatorsequenz. Die meisten cas Gene konnten trotz unterschiedlich getesteter Bedingungen nicht in löslicher Form in E.coli exprimiert werden. Die unlöslichen Proteine wurden rückgefaltet. Sso1442, Sso1996 und Sso1997 konnten in teilweise löslicher Form in E.coli exprimiert werden. Dennoch konnte für sie keine biochemische Funktion gezeigt werden. Aus der Rückfaltung von Sso1999, einer vermeintlichen Helikase, ging ein lösliches Protein hervor. Es konnten jedoch weder ATPase- noch Helikaseaktivität nachgewiesen werden. Definierte biochemische Aktivitäten konnten nur für Sso1450 und Sso2001 gezeigt werden. Sso2001 wurde als Fusionsprotein mit einer Esterase aus Alicyclobacillus acidocaldarius in löslicher Form coexprimiert. Die enzymatische Untersuchung wies darauf hin, dass Sso2001 Nukleaseaktivität besitzt. Weitere Experimente zeigten, dass es sich bei Sso2001 um eine Endonuklease handelt, die spezifisch in der Nachbarschaft von Guaninen schneidet. Das pH-Optimum dieser Nuklease liegt im neutralen Bereich und zusätzlich bei pH 3. Spezifische Punktmutationen weisen darauf hin, dass es sich bei Sso2001 nicht um ein Mitglied der HD-Nuklease-Familie handelt wie ursprünglich angenommen. Das Protein Sso1450 (COG1518), welches als Markerprotein des CRISPR- und Cas-Systems angesehen wird, bindet Nukleinsäuren wie ssDNS, dsDNS und RNS mit hoher Affinität. Die Dissoziationskonstante für die Bindung von DNS liegt im nanomolaren Bereich. EMSA-Experimente deuten auf eine Aggregation von Sso1450 auf den DNS-Substraten hin. Interessanterweise fördert Sso1450 die Anlagerung von komplementären ssDNS. Diese Tatsache unterstützt die Annahme, dass Sso1450 eine Rolle in der Rekombination der Wiederholungssequenzen im CRISPR-System spielt, wie die Gruppe um Koonin (Makarova et al., 2006) bereits postuliert. Das CRISPR-System steht im Verdacht eine zentrale Rolle in einem neu gefundenen genomischen Immunsystem von Prokaryoten zu spielen.show moreshow less
Following the complete sequencing of the genome of Sulfolobus solfataricus (Sso) P2, this organism has been widely used as a model strain for crenarchaea. The present work concentrated on the characterization of a newly discovered single-stranded binding (SSB) protein from Sso P2 and the computational and experimental analyses of clustered regularly interspaced short palindromic repeats (CRISPRs) and CRISPR-associated (cas) genes, respectively. The DNA-binding properties of SsoSSB, the organizatFollowing the complete sequencing of the genome of Sulfolobus solfataricus (Sso) P2, this organism has been widely used as a model strain for crenarchaea. The present work concentrated on the characterization of a newly discovered single-stranded binding (SSB) protein from Sso P2 and the computational and experimental analyses of clustered regularly interspaced short palindromic repeats (CRISPRs) and CRISPR-associated (cas) genes, respectively. The DNA-binding properties of SsoSSB, the organization of the CRISPR loci and the biochemical properties of some of the cas gene products of Sso P2 were studied. Size-exclusion chromatography indicated that SsoSSB exists as a monomer in solution. Using fluorescence anisotropy as a method to study the interaction of SsoSSB to DNA, it can be shown that SsoSSB binds as a monomer to small oligonucleotides. The approximate binding site size is 4- 6 nt per protein molecule as determined by native electrophoresis. SsoSSB shows a more than 10 fold higher binding affinity to single-stranded (ss) DNA as compared to double-stranded (ds) DNA, which is consistent with former reports. The dissociation constant could be determined to be in a low nanomolar range. Furthermore, SsoSSB preferentially binds to pyrimidine-rich ssDNA as compared to purine-rich DNA. This property is similar to that observed for human replication protein A (RPA). The clustering of repeat sequences in CRISPR loci and the associated cas genes have emerged recently as a new genomic feature of Archaea and of some Bacteria. Formerly, the cas genes have been predicted to encode repair proteins. In the present work, five CRISPR loci and their cas genes in Sso P2 were analyzed with respect to their genomic organization. The repeats of the CRISPR loci show highly conserved sequences at regular intervals, separated by spacer sequences of similar size. Most of the cas gene groups flanking a CRISPR locus contain homologous genes that were also found at other CRISPR loci. The cas genes could be grouped by gene location and gene order. Mostly, in each group they were head-to-tail arranged implying a functional relation. The operons of the cas genes sso1996-2002, sso1438-1443 and sso1398-1403 could be shown to contain Transcription Factor B recognition element (BRE), TATA-box, Shine-Dalgarno and terminator sequences specific for Sulfolobus. Most cas genes could not be expressed in a soluble form in E.coli, even when the expression conditions were widely varied. Refolding of the insoluble proteins was then undertaken. sso1442, sso1996 and sso1997 could be expressed in partially soluble form in E.coli, however catalytical activities could not be identified for these proteins. Refolding of Sso1999, a putative helicase, yielded a soluble protein. However no helicase and ATPase activity could be detected in the renatured Sso1999. Defined biochemical activities could be only assigned to the proteins Sso1450 and Sso2001. In the latter case, the sso2001 gene was fused with an esterase gene from Alicyclobacillus acidocaldarius, and was co-expressed in a soluble form. The enzymatic screening indicated that Sso2001 harbored a nuclease activity. Further experiments showed that Sso2001 was an endonuclease with specificity for cleavage near G residues. The nuclease activity was optimal at the neutral pH range with another activity peak at pH 3. Specific point mutations introduced in Sso2001 indicate that this protein was not a HD-family nuclease as previously predicted. The protein Sso1450 (COG1518), which is considered to be a marker protein of the CRISPR and Cas system, bound nucleic acids, including ssDNA, dsDNA and RNA, with high affinity. The dissociation constant of binding to DNA oligonucleotides was in the nanomolar range. EMSA experiments indicated an aggregation of Sso1450 on the DNA substrates. Interestingly, Sso1450 promoted the annealing of complementary ssDNAs. This finding supported a role of Sso1450 in the recombination of repeat sequences of the CRISPR system as suggested by Koonin’s group (Makarova et al., 2006). The CRISPRs were thought to play a major role in a newly discovered genome immune system in prokaryotes.show moreshow less

Download full text files

Export metadata

  • Export Bibtex
  • Export RIS
  • frontdoor_exportcitavi

Additional Services

    Share in Twitter Search Google Scholar
Metadaten
Institutes:Chemie
Author: Dong Han
Advisor:Prof. Dr. Gerhard Krauss
Granting Institution:Universität Bayreuth,Fakultät für Biologie, Chemie und Geowissenschaften
Date of final exam:07.05.2008
Year of Completion:2008
SWD-Keyword:Proteine; Sulfolobus solfataricus
Tag:CRISPR; SsoSSB; cas; protein
CRISPR; SsoSSB; cas; protein
Dewey Decimal Classification:570 Biowissenschaften; Biologie
URN:urn:nbn:de:bvb:703-opus-4404
Document Type:Doctoral Thesis
Language:English
Date of Publication (online):30.05.2008