NTDB

Overview

Name	clpC	Type	Regulator
Locus tag	FGL22_RS10170	Genome accession	NZ_LR594048
Coordinates	2059453..2061897 (-)	Length	814 a.a.
NCBI ID	WP_065355376.1	Uniprot ID	-
Organism	Streptococcus dysgalactiae subsp. equisimilis strain NCTC11556
Function	degradation of ComX (predicted from homology) Competence regulation

Related MGE

Note: This gene co-localizes with putative mobile genetic elements (MGEs) in the genome predicted by VRprofile2, as detailed below.

Gene-MGE association summary

MGE type	MGE coordinates	Gene coordinates	Relative position	Distance (bp)
Prophage	2057324..2069761	2059453..2061897	within	0

Gene organization within MGE regions

Location: 2057324..2069761

Locus tag	Gene name	Coordinates (strand)	Size (bp)	Protein ID	Product	Description
FGL22_RS10160 (NCTC11556_02095)	groL	2057324..2058949 (-)	1626	WP_012767614.1	chaperonin GroEL	-
FGL22_RS10165 (NCTC11556_02096)	groES	2058985..2059275 (-)	291	WP_003054738.1	co-chaperone GroES	-
FGL22_RS10170 (NCTC11556_02097)	clpC	2059453..2061897 (-)	2445	WP_065355376.1	ATP-dependent Clp protease ATP-binding subunit	Regulator
FGL22_RS10175 (NCTC11556_02098)	-	2061897..2062358 (-)	462	WP_003054759.1	CtsR family transcriptional regulator	-
FGL22_RS10180	-	2062554..2062757 (-)	204	WP_003053018.1	cold-shock protein	-
FGL22_RS10185 (NCTC11556_02100)	-	2063340..2064071 (+)	732	WP_081281093.1	amidohydrolase family protein	-
FGL22_RS10190 (NCTC11556_02101)	-	2064273..2065136 (+)	864	WP_046177583.1	IS982 family transposase	-
FGL22_RS10195 (NCTC11556_02102)	-	2065172..2065627 (+)	456	WP_046177586.1	MarR family transcriptional regulator	-
FGL22_RS10975	-	2065632..2067108 (-)	1477	Protein_1936	IS1182 family transposase	-
FGL22_RS11110	-	2067085..2067339 (-)	255	Protein_1937	DUF4355 domain-containing protein	-
FGL22_RS10205 (NCTC11556_02106)	-	2067607..2067840 (-)	234	WP_046177129.1	hypothetical protein	-
FGL22_RS10210 (NCTC11556_02107)	-	2067893..2068312 (-)	420	WP_046177130.1	HD domain-containing protein	-
FGL22_RS10215 (NCTC11556_02108)	-	2068309..2068515 (-)	207	WP_003052398.1	hypothetical protein	-
FGL22_RS10220 (NCTC11556_02109)	-	2068517..2069761 (-)	1245	WP_046177131.1	phage head morphogenesis protein	-

Sequence

Protein

Download Length: 814 a.a. Molecular weight: 90287.89 Da Isoelectric Point: 6.5647

                                >NTDB_id=1127941 FGL22_RS10170 WP_065355376.1 2059453..2061897(-) (clpC) [Streptococcus dysgalactiae subsp. equisimilis strain NCTC11556]

MIMYSLKMQEIFRQAQFQAARFDSQYLETWHILLAMARVDHSLAGLVLSEFDAKVAVEEYEAAAILAMGKSPKDQVSHID

FRPQSKTLTNLLQFAQAISQVTKDQEVGSEHVLFAILLNPDIMATRLLEMAGYTIKDKGNGEPRLADLRKAIEIHAGYSK

EIIKAIHELRKPKKTKNQGSFSDMMKPPSTAGDLADFTRDLTEMASQGLLEPVIGRDAEVSRMIQVLSRKTKNNPVLVGD

AGVGKTALAYGLAQRIANGVIPYELQDMRVLELDMMSVVAGTRFRGDFEERMNQIIDDIESDGKIILFVDELHTIMGSGS

GIDSTLDAANILKPALSRGTLHMVGATTQEEYQKHIEKDAALSRRFAKILIEEPNVEDAYQILLGLKGSYETYHNVTIAN

QAVRTAVKMAHRYLTSKNLPDSAIDLLDEASATVQGMVKKSTPEIITPLDQALIDGDMKKASRLLAKDVKGQHRKPTAVT

EEDILTTLSKLSGIPLEKLSQADSKKYLNLEKELHKRVIGQEDAVSAISRAIRRNQSGIRTGKRPIGSFMFLGPTGVGKT

ELAKALAEVLFDDASALIRFDMSEYMEKFAASRLNGAPPGYVGYDEGGELTEKVRNKPYSVLLFDEVEKAHPDIFNVLLQ

VLDDGMLTDSRGRKVDFSNTIIIMTSNLGATALRDDKTVGFGAKGISHDHQAMEKRILEELKKAYRPEFINRIDEKVVFH

SLTQDNMREVVKIIVQPLMATLAEKGITLKFQPMALKYLSEEGYDVEMGARPLRRTLQTQVEDKLSELILAGELASGHTL

KIGLSHGKLSFNLE

Nucleotide

Download Length: 2445 bp

                                >NTDB_id=1127941 FGL22_RS10170 WP_065355376.1 2059453..2061897(-) (clpC) [Streptococcus dysgalactiae subsp. equisimilis strain NCTC11556]

ATGATCATGTATTCATTGAAGATGCAAGAAATTTTCAGGCAGGCGCAGTTTCAAGCAGCCCGCTTTGATAGCCAATATCT

AGAAACTTGGCATATATTGCTAGCTATGGCGAGGGTTGATCACTCCCTAGCGGGTTTGGTGCTAAGCGAATTTGATGCTA

AGGTTGCAGTGGAAGAATATGAGGCTGCAGCTATTTTAGCGATGGGCAAAAGCCCTAAAGACCAAGTGTCTCACATTGAC

TTTAGGCCTCAGTCAAAAACCTTAACGAACCTTTTGCAATTTGCCCAAGCTATCAGTCAAGTCACCAAAGACCAAGAGGT

AGGTTCAGAGCATGTTCTCTTTGCCATTTTGCTTAATCCAGATATTATGGCGACTCGCTTATTAGAGATGGCGGGTTATA

CTATCAAGGATAAAGGAAATGGGGAGCCTCGCTTAGCTGATTTACGAAAAGCTATCGAGATTCATGCAGGCTATAGCAAG

GAAATAATTAAGGCTATCCACGAGTTGCGTAAGCCAAAGAAAACCAAAAATCAAGGTTCTTTTTCAGACATGATGAAGCC

ACCAAGCACGGCTGGGGACTTGGCGGACTTTACACGTGATTTGACCGAGATGGCAAGCCAAGGTCTCTTAGAGCCAGTTA

TTGGCCGTGATGCTGAAGTGTCACGGATGATTCAAGTACTGAGTCGTAAAACAAAGAATAACCCTGTTCTTGTGGGTGAT

GCAGGTGTGGGTAAAACGGCCCTTGCCTACGGCCTAGCCCAACGTATTGCTAATGGTGTTATTCCTTATGAGCTGCAAGA

CATGCGTGTTCTAGAATTAGACATGATGAGTGTTGTTGCGGGGACCCGTTTTCGTGGGGATTTTGAAGAGCGCATGAATC

AAATCATTGACGATATTGAGTCAGATGGCAAAATTATTCTCTTCGTAGATGAATTGCACACCATTATGGGATCAGGAAGT

GGTATTGATAGCACGCTTGATGCTGCCAATATTTTAAAACCAGCCTTATCTCGTGGAACCCTCCATATGGTGGGTGCAAC

AACGCAGGAAGAATACCAAAAACACATTGAAAAAGATGCCGCTCTTTCGCGCCGCTTTGCTAAGATTTTAATTGAAGAAC

CTAATGTAGAAGATGCTTATCAGATTCTGCTAGGACTAAAAGGCTCTTACGAGACTTACCATAATGTGACCATTGCTAAT

CAGGCTGTTAGAACCGCTGTGAAAATGGCACATCGCTATCTGACCAGCAAAAACCTTCCGGATTCTGCCATTGATTTGTT

GGATGAAGCCAGTGCTACAGTGCAAGGTATGGTTAAAAAATCTACGCCAGAAATCATCACGCCATTAGATCAAGCTTTGA

TTGATGGCGATATGAAGAAGGCCTCTCGTTTGTTGGCAAAAGACGTTAAAGGGCAACATCGCAAGCCAACAGCTGTGACA

GAAGAGGACATCCTGACGACCTTGAGCAAGCTATCAGGTATTCCACTGGAAAAACTCAGCCAAGCTGATAGCAAAAAATA

CCTTAATTTGGAAAAAGAACTGCATAAGCGCGTGATTGGGCAAGAAGATGCTGTCTCAGCTATTTCTAGAGCCATTCGCC

GTAATCAGTCAGGCATTCGTACAGGTAAACGTCCAATCGGTTCTTTCATGTTCCTTGGTCCAACAGGGGTTGGTAAGACC

GAGTTGGCAAAAGCCTTGGCAGAAGTTCTCTTTGATGACGCGTCCGCCCTTATCCGCTTTGATATGTCAGAGTATATGGA

GAAATTTGCGGCTTCTCGCCTTAATGGCGCACCTCCAGGCTATGTTGGTTACGATGAAGGTGGTGAATTAACAGAGAAGG

TCAGAAACAAGCCTTATTCTGTGCTCCTCTTTGACGAGGTGGAAAAAGCTCACCCTGATATTTTCAACGTCCTCTTACAA

GTGCTTGATGATGGCATGTTGACAGATAGCCGTGGGCGTAAAGTGGACTTCTCAAATACCATTATTATCATGACAAGTAA

TCTAGGGGCAACAGCTCTGCGTGATGATAAAACAGTTGGCTTTGGGGCAAAAGGCATTAGCCATGACCACCAAGCCATGG

AAAAACGGATTTTGGAAGAGTTGAAAAAAGCTTACCGACCAGAATTTATCAACCGAATTGATGAAAAGGTTGTCTTCCAC

AGCCTCACTCAGGACAATATGAGAGAAGTAGTCAAGATTATAGTGCAGCCGTTGATGGCTACTTTGGCAGAAAAAGGCAT

TACCCTCAAATTCCAGCCAATGGCCCTCAAGTATTTATCAGAAGAAGGGTATGATGTGGAAATGGGTGCTCGTCCATTAC

GCCGCACTTTGCAAACTCAGGTGGAAGATAAATTGTCTGAATTGATTCTTGCTGGTGAATTGGCAAGTGGTCATACCCTG

AAAATTGGCCTTTCTCATGGAAAACTCAGCTTTAACCTTGAGTGA

Domains

Predicted by InterproScan.

AAA lid domain (AAA_lid_9)

(376-462)

Clp amino terminal domain, pathogenicity island component (Clp_N)

(15-53)

Clp amino terminal domain, pathogenicity island component (Clp_N)

(95-137)

ATPase family associated with various cellular activities (AAA) (AAA)

(236-368)

C-terminal, D2-small domain, of ClpB protein (ClpB_D2-small)

(722-801)

AAA domain (Cdc48 subfamily) (AAA_2)

(544-715)

Secondary structure

Protein secondary structures were predicted by S4PRED and visualized by seqviz.

3D structure

Source	ID	Structure

Transmembrane helices

Transmembrane helices of protein were predicted by TMHMM 2.0 and visualized by seqviz and ECharts.

Visualization of predicted probability:

Similar proteins

Only experimentally validated proteins are listed.

Protein	Organism	Identities (%)	Coverage (%)	H_a-value
clpC	Streptococcus mutans UA159	76.261	99.877	0.762
clpC	Streptococcus thermophilus LMG 18311	72.794	100	0.73
clpC	Streptococcus thermophilus LMD-9	72.794	100	0.73
clpC	Streptococcus pneumoniae TIGR4	66.913	99.877	0.668
clpC	Streptococcus pneumoniae Rx1	66.913	99.877	0.668
clpC	Streptococcus pneumoniae D39	66.913	99.877	0.668
clpC	Lactococcus lactis subsp. lactis strain DGCC12653	48.561	100	0.498
clpC	Bacillus subtilis subsp. subtilis str. 168	42.668	100	0.436

Detailed information

Overview

Related MGE

Gene-MGE association summary

Gene organization within MGE regions

Sequence

Protein

Nucleotide

Domains

Secondary structure

3D structure

Transmembrane helices

Similar proteins

Multiple sequence alignment

Detailed information NTG1127941

Overview

Related MGE

Gene-MGE association summary

Gene organization within MGE regions

Sequence

Protein

Nucleotide

Domains

Secondary structure

3D structure

Transmembrane helices

Similar proteins

Multiple sequence alignment Download

Detailed information

Multiple sequence alignment