NTDB

Overview

Name	clpP	Type	Regulator
Locus tag	GZS08_RS16805	Genome accession	NZ_CP048371
Coordinates	3517096..3517719 (-)	Length	207 a.a.
NCBI ID	WP_000122253.1	Uniprot ID	A0A370V1H3
Organism	Escherichia coli strain 163
Function	degradation of ComK; degradation of DegU (predicted from homology) Competence regulation

Genomic Context

Location: 3512096..3522719

Locus tag	Gene name	Coordinates (strand)	Size (bp)	Protein ID	Product	Description
GZS08_RS16790 (GZS07_16795)	hupB	3512673..3512945 (-)	273	WP_001043542.1	nucleoid-associated protein HU-beta	-
GZS08_RS16795 (GZS07_16800)	lon	3513154..3515508 (-)	2355	WP_001295325.1	endopeptidase La	-
GZS08_RS16800 (GZS07_16805)	clpX	3515696..3516970 (-)	1275	WP_000130305.1	ATP-dependent protease ATP-binding subunit ClpX	Regulator
GZS08_RS16805 (GZS07_16810)	clpP	3517096..3517719 (-)	624	WP_000122253.1	ATP-dependent Clp endopeptidase proteolytic subunit ClpP	Regulator
GZS08_RS16810 (GZS07_16815)	tig	3517965..3519263 (-)	1299	WP_001198386.1	trigger factor	-
GZS08_RS16815 (GZS07_16820)	bolA	3519607..3519924 (-)	318	WP_000973448.1	transcriptional regulator BolA	-
GZS08_RS16820 (GZS07_16825)	yajG	3520229..3520807 (+)	579	WP_001295326.1	lipoprotein	-
GZS08_RS16825 (GZS07_16830)	ampG	3520851..3522326 (+)	1476	WP_000098429.1	muropeptide MFS transporter AmpG	-

Sequence

Protein

Download Length: 207 a.a. Molecular weight: 23186.65 Da Isoelectric Point: 5.6032

                                >NTDB_id=368380 GZS08_RS16805 WP_000122253.1 3517096..3517719(-) (clpP) [Escherichia coli strain 163]

MSYSGERDNFAPHMALVPMVIEQTSRGERSFDIYSRLLKERVIFLTGQVEDHMANLIVAQMLFLEAENPEKDIYLYINSP

GGVITAGMSIYDTMQFIKPDVSTICMGQAASMGAFLLTAGAKGKRFCLPNSRVMIHQPLGGYQGQATDIEIHAREILKVK

GRMNELMALHTGQSLEQIERDTERDRFLSAPEAVEYGLVDSILTHRN

Nucleotide

Download Length: 624 bp

                                >NTDB_id=368380 GZS08_RS16805 WP_000122253.1 3517096..3517719(-) (clpP) [Escherichia coli strain 163]

ATGTCATACAGCGGCGAACGAGATAACTTTGCACCCCATATGGCGCTGGTGCCGATGGTCATTGAACAGACCTCACGCGG

TGAGCGCTCTTTTGATATCTATTCTCGTCTACTTAAGGAACGCGTCATTTTTCTGACTGGCCAGGTTGAAGACCACATGG

CTAACCTGATTGTGGCGCAGATGCTGTTCCTGGAAGCGGAAAACCCAGAAAAAGATATCTATCTGTACATTAACTCCCCA

GGCGGGGTGATCACTGCCGGGATGTCTATCTATGACACCATGCAGTTTATCAAGCCTGATGTCAGCACCATCTGTATGGG

CCAGGCGGCCTCGATGGGCGCTTTCTTGCTGACCGCAGGGGCAAAAGGTAAACGTTTTTGCCTGCCGAATTCGCGCGTGA

TGATTCACCAACCGTTGGGCGGCTACCAGGGCCAGGCGACCGATATCGAAATTCATGCCCGTGAAATTCTGAAAGTTAAA

GGGCGCATGAATGAACTTATGGCGCTTCATACGGGTCAATCATTAGAACAGATTGAACGTGATACCGAGCGCGATCGCTT

CCTTTCCGCCCCTGAAGCGGTGGAATACGGTCTGGTCGATTCGATTCTGACCCATCGTAATTGA

Domains

Predicted by InterProScan.

Clp protease (CLP_protease)

(26-205)

Secondary structure

Protein secondary structures were predicted by S4PRED and visualized by seqviz.

3D structure

Source	ID	Structure
AlphaFold DB	A0A370V1H3

Transmembrane helices

Transmembrane helices of protein were predicted by TMHMM 2.0 and visualized by seqviz and ECharts.

Visualization of predicted probability:

Similar proteins

Only experimentally validated proteins are listed.

Protein	Organism	Identities (%)	Coverage (%)	H_a-value
clpP	Bacillus subtilis subsp. subtilis str. 168	69.792	92.754	0.647
clpP	Campylobacter jejuni subsp. jejuni NCTC 11168 = ATCC 700819	68.617	90.821	0.623
clpP	Lactococcus lactis subsp. cremoris KW2	56.701	93.72	0.531
clpP	Streptococcus pneumoniae R6	55.155	93.72	0.517
clpP	Streptococcus pneumoniae TIGR4	55.155	93.72	0.517
clpP	Lactococcus lactis subsp. lactis strain DGCC12653	55.155	93.72	0.517
clpP	Streptococcus pneumoniae Rx1	55.155	93.72	0.517
clpP	Streptococcus pneumoniae D39	55.155	93.72	0.517
clpP	Streptococcus thermophilus LMD-9	54.922	93.237	0.512
clpP	Streptococcus thermophilus LMG 18311	54.922	93.237	0.512
clpP	Streptococcus pyogenes JRS4	55.263	91.787	0.507
clpP	Streptococcus pyogenes MGAS315	55.263	91.787	0.507
clpP	Streptococcus mutans UA159	53.886	93.237	0.502

Detailed information

Overview

Genomic Context

Sequence

Protein

Nucleotide

Domains

Secondary structure

3D structure

Transmembrane helices

Similar proteins

Multiple sequence alignment

Detailed information NTG0368380

Overview

Genomic Context

Sequence

Protein

Nucleotide

Domains

Secondary structure

3D structure

Transmembrane helices

Similar proteins

Multiple sequence alignment Download

Detailed information

Multiple sequence alignment