NTDB

Overview

Name	comEC/celB	Type	Machinery gene
Locus tag	R4701_RS00660	Genome accession	NZ_CP137114
Coordinates	140608..142848 (-)	Length	746 a.a.
NCBI ID	WP_000942406.1	Uniprot ID	A0A4J2I0U7
Organism	Streptococcus pneumoniae strain 15P3054
Function	ssDNA transport into the cell (predicted from homology) DNA binding and uptake

Genomic Context

Location: 135608..147848

Locus tag	Gene name	Coordinates (strand)	Size (bp)	Protein ID	Product	Description
R4701_RS00625	-	136518..136898 (-)	381	WP_000157154.1	VOC family protein	-
R4701_RS00630	rplT	136956..137315 (-)	360	WP_000124836.1	50S ribosomal protein L20	-
R4701_RS00635	rpmI	137367..137567 (-)	201	WP_001125943.1	50S ribosomal protein L35	-
R4701_RS00640	infC	137600..138130 (-)	531	WP_000848180.1	translation initiation factor IF-3	-
R4701_RS00645	-	138437..139618 (-)	1182	WP_000655934.1	hypothetical protein	-
R4701_RS00650	-	139622..140209 (-)	588	WP_000939880.1	ATP-binding cassette domain-containing protein	-
R4701_RS00655	-	140242..140459 (-)	218	Protein_130	hypothetical protein	-
R4701_RS00660	comEC/celB	140608..142848 (-)	2241	WP_000942406.1	DNA internalization-related competence protein ComEC/Rec2	Machinery gene
R4701_RS00665	comEA/celA/cilE	142832..143482 (-)	651	WP_000387330.1	ComEA family DNA-binding protein	Machinery gene
R4701_RS00670	-	143550..144119 (-)	570	WP_000443899.1	GNAT family N-acetyltransferase	-
R4701_RS00675	ald	144296..145407 (+)	1112	Protein_134	alanine dehydrogenase	-
R4701_RS00680	-	145708..146034 (-)	327	Protein_135	TfoX/Sxy family protein	-
R4701_RS00685	-	146037..146537 (-)	501	WP_000566988.1	GNAT family N-acetyltransferase	-
R4701_RS00690	-	146730..147698 (-)	969	WP_000658183.1	PhoH family protein	-

Sequence

Protein

Download Length: 746 a.a. Molecular weight: 84545.06 Da Isoelectric Point: 9.5148

                                >NTDB_id=896147 R4701_RS00660 WP_000942406.1 140608..142848(-) (comEC/celB) [Streptococcus pneumoniae strain 15P3054]

MLQWIKNFSIPLIYLSFLLLWLYYAIFSASYLALLGFVFLLVCLFIQFPWKSAGKVLIICGIFGFWFVFQNWQQSQASQN

LADSVERVRILPDTVKVNGDSLSFRGKADGRIFQVYYKLQSEEEKEAFQALTDLHEIGLEGKLSEPEGQRNFGGFNYQAY

LKTQGIYQTLNIKKIQSLQKIGSWDIGENLSSLRRKAVVWIKTHFPDPMRNYMTGLLLGHLDTDFEEMNELYSSLGIIHL

FALSGMQVGFFMNGFKKLLLRLGLTQEKLKWLTYPFSLIYAGLTGFSASVIRSLLQKLLAQHGVKGLDNFALTVLVLFIV

MPNFFFTAGGVLSCAYAFILTMTSKEGEGLKAVASESLVISLGILPILSFYFAEFQPWSILLTFVFSFLFDLTFLPLLSI

LFVLSFLYPVIQLNFIFEWLEGIIRLVSQVTSRPLVFGQPNAWFLILLLISLALVYDLRKNIKKLTVLCLLITGLFLLTK

HPLENEITMLDVGQGESIFLRDVTGKTILIDVGGKAESYKKIEKWQEKMTTSNAQRTLIPYLKSRGVAKIDQLILTNTDK

ENVGDLSEVTKAFHVGEILVSKDSLKQKEFVAELQATQTKVRSMTVGENLPIFGSQLEVLSPRKMGDGGHDDTLVLYGKF

LDKQFLFTGNLEEKGEKDLLKHYPDLKVNVLKASQHGNKKSSSPAFLEKLKPELTLISVGKSNRMKLPHQETLTRLEGIN

SKVYRTDQQGAIRFKGLDSWKIESVR

Nucleotide

Download Length: 2241 bp

                                >NTDB_id=896147 R4701_RS00660 WP_000942406.1 140608..142848(-) (comEC/celB) [Streptococcus pneumoniae strain 15P3054]

ATGTTACAGTGGATTAAGAATTTCTCTATTCCCCTAATTTACCTGAGTTTTCTATTACTTTGGCTTTATTACGCTATTTT

CTCAGCATCCTATCTTGCTTTGTTGGGCTTTGTTTTTCTGCTAGTCTGTCTCTTTATCCAATTTCCGTGGAAATCTGCTG

GTAAAGTTCTAATAATTTGCGGAATCTTTGGATTTTGGTTTGTTTTTCAAAATTGGCAACAGAGTCAAGCGAGTCAAAAT

CTGGCGGATTCTGTTGAAAGGGTACGGATTCTGCCTGACACTGTTAAGGTCAATGGTGATAGTCTGTCCTTTCGCGGCAA

GGCTGATGGACGCATTTTTCAAGTCTATTATAAACTCCAGTCCGAGGAGGAGAAAGAAGCCTTTCAAGCTTTAACCGACC

TGCATGAGATAGGACTAGAAGGGAAGCTTTCGGAGCCAGAAGGGCAGAGAAATTTTGGTGGCTTTAATTACCAAGCCTAT

CTGAAGACTCAGGGAATTTACCAGACTCTCAATATCAAAAAAATCCAGTCACTTCAAAAGATTGGCAGTTGGGATATAGG

AGAAAACTTGTCCAGTTTACGTCGAAAGGCTGTGGTTTGGATTAAGACGCACTTTCCAGACCCTATGCGCAATTACATGA

CAGGACTCTTGCTGGGACATCTGGACACCGACTTTGAGGAGATGAATGAGCTTTATTCCAGTCTAGGAATTATCCACCTC

TTTGCCCTATCTGGCATGCAGGTAGGTTTTTTCATGAATGGATTTAAGAAACTTCTCTTGCGATTGGGCTTGACCCAAGA

AAAGTTGAAATGGCTGACTTATCCCTTTTCCCTTATCTATGCGGGACTAACTGGATTTTCAGCATCGGTTATTCGCAGTC

TCTTGCAAAAGCTACTGGCTCAACATGGGGTTAAGGGCTTGGATAATTTTGCCTTGACGGTGCTTGTCCTCTTTATTGTC

ATGCCAAACTTTTTCTTTACAGCAGGAGGAGTCTTGTCCTGCGCTTATGCTTTTATCCTGACCATGACCAGCAAAGAAGG

GGAGGGGCTCAAGGCTGTTGCTAGTGAAAGTCTAGTCATCTCCTTGGGCATATTGCCCATTCTATCCTTCTATTTTGCGG

AATTTCAACCTTGGTCTATCCTTTTGACCTTTGTCTTTTCCTTTCTATTTGACTTGACCTTCTTACCGCTCTTGTCTATT

TTATTTGTCCTTTCCTTTCTCTATCCAGTCATTCAGCTGAACTTTATCTTTGAATGGTTGGAGGGCATTATTCGCTTGGT

GTCACAGGTGACAAGTAGACCTCTGGTCTTTGGACAACCCAATGCATGGTTTTTAATCCTATTGTTAATTTCCTTGGCTT

TGGTCTATGATTTGAGAAAAAACATTAAAAAGCTAACGGTATTGTGCTTATTGATTACAGGGCTCTTTCTCCTGACCAAG

CATCCACTGGAAAATGAAATCACCATGCTGGATGTGGGGCAAGGAGAAAGTATTTTCCTACGGGATGTAACTGGGAAAAC

CATTCTCATAGATGTAGGTGGTAAGGCAGAATCTTATAAGAAAATCGAAAAATGGCAAGAAAAGATGACGACCAGCAATG

CCCAGCGAACCTTGATTCCCTATCTCAAAAGTCGAGGAGTAGCTAAGATTGACCAGCTAATTTTGACTAACACGGACAAG

GAGAATGTTGGAGATTTGTCAGAGGTGACCAAGGCTTTCCATGTAGGGGAGATTCTAGTATCAAAAGACAGTCTGAAACA

GAAGGAATTTGTGGCAGAACTACAGGCGACTCAAACAAAGGTGCGTAGTATGACAGTAGGGGAGAACTTGCCCATTTTTG

GAAGTCAGTTAGAAGTTCTATCTCCAAGGAAAATGGGAGATGGAGGACACGATGATACCCTAGTTCTGTATGGGAAATTC

TTGGATAAGCAATTTCTCTTCACGGGAAATTTGGAGGAGAAAGGAGAGAAGGACTTGCTGAAGCACTATCCAGACTTGAA

AGTAAATGTTTTGAAAGCTAGCCAACATGGCAATAAAAAATCATCAAGTCCAGCCTTTCTAGAAAAACTCAAACCAGAGC

TTACTCTTATCTCAGTTGGAAAGAGCAATCGAATGAAACTCCCCCATCAGGAAACATTGACACGACTGGAAGGTATCAAT

AGCAAAGTTTACCGAACTGACCAGCAAGGAGCTATACGTTTTAAGGGGTTGGATAGTTGGAAAATCGAAAGTGTTCGATA

G

Domains

Predicted by InterproScan.

Metallo-beta-lactamase superfamily (Lactamase_B)

(492-693)

Domain of unknown function (DUF4131) (DUF4131)

(31-177)

Competence protein (Competence)

(216-458)

Secondary structure

Protein secondary structures were predicted by S4PRED and visualized by seqviz.

3D structure

Source	ID	Structure
AlphaFold DB	A0A4J2I0U7

Transmembrane helices

Transmembrane helices of protein were predicted by TMHMM 2.0 and visualized by seqviz and ECharts.

Visualization of predicted probability:

Similar proteins

Only experimentally validated proteins are listed.

Protein	Organism	Identities (%)	Coverage (%)	H_a-value
comEC/celB	Streptococcus pneumoniae Rx1	98.928	100	0.989
comEC/celB	Streptococcus pneumoniae D39	98.928	100	0.989
comEC/celB	Streptococcus pneumoniae R6	98.928	100	0.989
comEC/celB	Streptococcus pneumoniae TIGR4	97.319	100	0.973
comEC/celB	Streptococcus mitis NCTC 12261	92.349	99.866	0.922
comEC/celB	Streptococcus mitis SK321	92.225	100	0.922
comEC	Lactococcus lactis subsp. cremoris KW2	43.725	99.33	0.434

Detailed information NTG0896147