NTDB

Overview

Name	clpC	Type	Regulator
Locus tag	FQT67_RS10045	Genome accession	NZ_LR595857
Coordinates	2013425..2015869 (-)	Length	814 a.a.
NCBI ID	WP_046177491.1	Uniprot ID	A0A9X9R4E8
Organism	Streptococcus sp. NCTC 11567 strain NCTC11567
Function	degradation of ComX (predicted from homology) Competence regulation

Related MGE

Note: This gene co-localizes with putative mobile genetic elements (MGEs) in the genome predicted by VRprofile2, as detailed below.

Gene-MGE association summary

MGE type	MGE coordinates	Gene coordinates	Relative position	Distance (bp)
Prophage	2011296..2023802	2013425..2015869	within	0

Gene organization within MGE regions

Location: 2011296..2023802

Locus tag	Gene name	Coordinates (strand)	Size (bp)	Protein ID	Product	Description
FQT67_RS10035 (NCTC11567_02079)	groL	2011296..2012921 (-)	1626	WP_012767614.1	chaperonin GroEL	-
FQT67_RS10040 (NCTC11567_02080)	groES	2012957..2013247 (-)	291	WP_003054738.1	co-chaperone GroES	-
FQT67_RS10045 (NCTC11567_02081)	clpC	2013425..2015869 (-)	2445	WP_046177491.1	ATP-dependent Clp protease ATP-binding subunit	Regulator
FQT67_RS10050 (NCTC11567_02082)	-	2015869..2016330 (-)	462	WP_003054759.1	CtsR family transcriptional regulator	-
FQT67_RS10055	-	2016526..2016729 (-)	204	WP_046177492.1	cold-shock protein	-
FQT67_RS10060 (NCTC11567_02084)	-	2017230..2018114 (+)	885	WP_261308909.1	amidohydrolase family protein	-
FQT67_RS10065 (NCTC11567_02085)	-	2018316..2019179 (+)	864	WP_046177583.1	IS982 family transposase	-
FQT67_RS10070 (NCTC11567_02086)	-	2019215..2019670 (+)	456	WP_046177586.1	MarR family transcriptional regulator	-
FQT67_RS10075 (NCTC11567_02087)	-	2019675..2021096 (-)	1422	WP_143936423.1	IS1182 family transposase	-
FQT67_RS10080 (NCTC11567_02088)	-	2021120..2021380 (-)	261	Protein_1936	DUF4355 domain-containing protein	-
FQT67_RS10835 (NCTC11567_02089)	-	2021487..2021657 (-)	171	WP_172601566.1	hypothetical protein	-
FQT67_RS10085 (NCTC11567_02090)	-	2021648..2021881 (-)	234	WP_046177129.1	hypothetical protein	-
FQT67_RS10090 (NCTC11567_02091)	-	2021934..2022353 (-)	420	WP_046177130.1	HD domain-containing protein	-
FQT67_RS10095 (NCTC11567_02092)	-	2022350..2022556 (-)	207	WP_003052398.1	hypothetical protein	-
FQT67_RS10100 (NCTC11567_02093)	-	2022558..2023802 (-)	1245	WP_046177131.1	phage head morphogenesis protein	-

Sequence

Protein

Download Length: 814 a.a. Molecular weight: 90335.98 Da Isoelectric Point: 6.6501

                                >NTDB_id=1128452 FQT67_RS10045 WP_046177491.1 2013425..2015869(-) (clpC) [Streptococcus sp. NCTC 11567 strain NCTC11567]

MIMYSLKMQEIFRQAQFQAARFDSQYLETWHILLAMARVDHSLAGLVLSEFDAKVAVEEYEAAAILAMGKSPKYQVSHID

FRPQSKTLTNLLQFAQAISQVTKDQEVGSEHVLFAILLNPDIMATRLLEMAGYTIKDKGNGEPRLADLRKAIEIHAGYSK

EIIKAIHELRKPKKTKNQGSFSDMMKPPSTAGDLADFTRDLTEMASQGLLEPVIGRDAEVSRMIQVLSRKTKNNPVLVGD

AGVGKTALAYGLAQRIANGVIPYELQDMRVLELDMMSVVAGTRFRGDFEERMNQIIDDIESDGKIILFVDELHTIMGSGS

GIDSTLDAANILKPALSRGTLHMVGATTQEEYQKHIEKDAALSRRFAKILIEEPNVEDAYQILLGLKGSYETYHNVTIAN

QAVRTAVKMAHRYLTSKNLPDSAIDLLDEASATVQGMVKKSTPEIITPLDQALIDGDMKKASRLLAKDVKGQHRKPTAVT

EEDILTTLSKLSGIPLEKLSQADSKKYLNLEKELHKRVIGQEDAVSAISRAIRRNQSGIRTGKRPIGSFMFLGPTGVGKT

ELAKALAEVLFDDASALIRFDMSEYMEKFAASRLNGAPPGYVGYDEGGELTEKVRNKPYSVLLFDEVEKAHPDIFNVLLQ

VLDDGMLTDSRGRKVDFSNTIIIMTSNLGATALRDDKTVGFGAKGISHDHQAMEKRILEELKKAYRPEFINRIDEKVVFH

SLTQDNMREVVKIIVQPLMATLAEKGITLKFQPMALKYLSEEGYDVEMGARPLRRTLQTQVEDKLSELILAGELASGHTL

KIGLSHGKLSFNLE

Nucleotide

Download Length: 2445 bp

                                >NTDB_id=1128452 FQT67_RS10045 WP_046177491.1 2013425..2015869(-) (clpC) [Streptococcus sp. NCTC 11567 strain NCTC11567]

ATGATCATGTATTCATTGAAGATGCAAGAAATTTTCAGGCAGGCGCAGTTTCAAGCAGCCCGCTTTGATAGCCAATATCT

AGAAACTTGGCATATATTGCTAGCTATGGCGAGGGTTGATCACTCCCTAGCGGGTTTGGTGCTAAGCGAATTTGATGCTA

AGGTTGCAGTGGAAGAATATGAGGCTGCAGCTATTTTAGCGATGGGCAAAAGTCCTAAATACCAAGTGTCTCACATTGAC

TTTAGGCCTCAGTCAAAAACCTTAACGAACCTTTTGCAATTTGCCCAAGCTATCAGTCAAGTCACCAAAGACCAAGAGGT

AGGTTCAGAGCATGTTCTCTTTGCCATTTTGCTTAATCCAGATATTATGGCGACTCGCTTATTAGAGATGGCGGGTTATA

CTATCAAGGATAAAGGAAACGGGGAGCCTCGCTTAGCTGATTTACGAAAAGCTATCGAGATTCATGCAGGCTATAGCAAG

GAAATAATTAAGGCTATCCACGAGTTGCGTAAGCCAAAGAAAACCAAAAATCAAGGTTCTTTTTCAGACATGATGAAGCC

ACCAAGCACGGCTGGGGACTTGGCGGACTTTACACGTGATTTGACCGAGATGGCAAGCCAAGGTCTCTTAGAGCCAGTTA

TTGGCCGTGATGCTGAAGTGTCACGGATGATTCAAGTACTGAGTCGTAAAACAAAGAATAACCCTGTTCTTGTGGGTGAT

GCAGGTGTGGGTAAAACGGCCCTTGCCTACGGCCTAGCCCAACGTATTGCTAATGGTGTTATTCCTTATGAGCTGCAAGA

CATGCGTGTTCTAGAATTAGACATGATGAGTGTTGTTGCGGGGACCCGTTTTCGTGGGGATTTTGAAGAGCGCATGAATC

AAATCATTGACGATATTGAGTCAGATGGCAAAATTATTCTCTTCGTAGATGAATTGCACACCATTATGGGATCAGGAAGT

GGTATTGATAGCACGCTTGATGCTGCCAATATTTTAAAACCAGCCTTATCTCGTGGAACCCTCCATATGGTGGGTGCAAC

AACGCAGGAAGAATACCAAAAACACATTGAAAAAGATGCCGCTCTTTCGCGCCGCTTTGCTAAGATTTTAATTGAAGAAC

CTAATGTAGAAGATGCTTATCAGATTCTGCTAGGACTAAAAGGCTCTTACGAGACTTACCATAATGTGACCATTGCTAAT

CAGGCTGTTAGAACCGCTGTGAAAATGGCACATCGCTATCTGACCAGCAAAAACCTTCCGGATTCTGCCATTGATTTGTT

GGATGAAGCCAGTGCTACAGTGCAAGGTATGGTTAAAAAATCTACGCCAGAAATCATCACGCCATTAGATCAAGCTTTGA

TTGATGGCGATATGAAGAAGGCCTCTCGTTTGTTGGCAAAAGACGTTAAAGGGCAACATCGCAAGCCAACAGCTGTGACA

GAAGAGGACATCCTGACGACCTTGAGCAAGCTATCAGGTATTCCACTGGAAAAACTCAGCCAAGCTGATAGCAAAAAATA

CCTTAATTTGGAAAAAGAACTGCATAAGCGCGTGATTGGGCAAGAAGATGCTGTCTCAGCTATTTCTAGAGCCATTCGCC

GTAATCAGTCAGGCATTCGTACAGGTAAACGTCCAATCGGTTCTTTCATGTTCCTTGGTCCAACAGGGGTTGGTAAGACC

GAGTTGGCAAAAGCCTTGGCAGAAGTTCTCTTTGATGACGCGTCCGCCCTTATCCGCTTTGATATGTCAGAGTATATGGA

GAAATTTGCGGCTTCTCGCCTTAATGGCGCACCTCCAGGCTATGTTGGTTACGATGAAGGTGGTGAATTAACAGAGAAGG

TCAGAAACAAGCCTTATTCTGTGCTCCTCTTTGACGAGGTGGAAAAAGCTCACCCTGATATTTTCAACGTCCTCTTACAA

GTGCTTGATGATGGCATGTTGACAGATAGCCGTGGGCGTAAAGTGGACTTCTCAAATACCATTATTATCATGACAAGTAA

TCTAGGGGCAACAGCTCTGCGTGATGATAAAACAGTTGGCTTTGGGGCAAAAGGCATTAGCCATGACCACCAAGCCATGG

AAAAACGGATTTTGGAAGAGTTGAAAAAAGCTTACCGACCAGAATTTATCAACCGAATTGATGAAAAGGTTGTCTTCCAC

AGCCTCACTCAGGACAATATGAGAGAAGTAGTCAAGATTATAGTGCAGCCGTTGATGGCTACTTTGGCAGAAAAAGGCAT

TACCCTCAAATTCCAGCCAATGGCCCTCAAGTATTTATCAGAAGAAGGGTATGATGTGGAAATGGGTGCTCGTCCATTAC

GCCGCACTTTGCAAACTCAGGTGGAAGATAAATTGTCTGAATTGATTCTTGCTGGTGAATTGGCAAGTGGTCATACCCTG

AAAATTGGCCTTTCTCATGGAAAACTCAGCTTTAACCTTGAGTGA

Domains

Predicted by InterproScan.

AAA lid domain (AAA_lid_9)

(376-462)

Clp amino terminal domain, pathogenicity island component (Clp_N)

(15-53)

Clp amino terminal domain, pathogenicity island component (Clp_N)

(95-137)

ATPase family associated with various cellular activities (AAA) (AAA)

(236-368)

C-terminal, D2-small domain, of ClpB protein (ClpB_D2-small)

(722-801)

AAA domain (Cdc48 subfamily) (AAA_2)

(544-715)

Secondary structure

Protein secondary structures were predicted by S4PRED and visualized by seqviz.

3D structure

Source	ID	Structure

Transmembrane helices

Transmembrane helices of protein were predicted by TMHMM 2.0 and visualized by seqviz and ECharts.

Visualization of predicted probability:

Similar proteins

Only experimentally validated proteins are listed.

Protein	Organism	Identities (%)	Coverage (%)	H_a-value
clpC	Streptococcus mutans UA159	76.261	99.877	0.762
clpC	Streptococcus thermophilus LMG 18311	72.672	100	0.729
clpC	Streptococcus thermophilus LMD-9	72.672	100	0.729
clpC	Streptococcus pneumoniae TIGR4	67.036	99.877	0.67
clpC	Streptococcus pneumoniae Rx1	67.036	99.877	0.67
clpC	Streptococcus pneumoniae D39	67.036	99.877	0.67
clpC	Lactococcus lactis subsp. lactis strain DGCC12653	48.561	100	0.498
clpC	Bacillus subtilis subsp. subtilis str. 168	42.668	100	0.436

Detailed information

Overview

Related MGE

Gene-MGE association summary

Gene organization within MGE regions

Sequence

Protein

Nucleotide

Domains

Secondary structure

3D structure

Transmembrane helices

Similar proteins

Multiple sequence alignment

Detailed information NTG1128452

Overview

Related MGE

Gene-MGE association summary

Gene organization within MGE regions

Sequence

Protein

Nucleotide

Domains

Secondary structure

3D structure

Transmembrane helices

Similar proteins

Multiple sequence alignment Download

Detailed information

Multiple sequence alignment