NTDB

Overview

Name	comEC/celB	Type	Machinery gene
Locus tag	R4707_RS10445	Genome accession	NZ_CP137113
Coordinates	1990679..1992919 (+)	Length	746 a.a.
NCBI ID	WP_050103505.1	Uniprot ID	-
Organism	Streptococcus pneumoniae strain ZGX
Function	ssDNA transport into the cell (predicted from homology) DNA binding and uptake

Genomic Context

Location: 1985679..1997919

Locus tag	Gene name	Coordinates (strand)	Size (bp)	Protein ID	Product	Description
R4707_RS10410	pyrH	1985769..1986506 (+)	738	WP_000002997.1	UMP kinase	-
R4707_RS10415	frr	1986515..1987072 (+)	558	WP_000024409.1	ribosome recycling factor	-
R4707_RS10420	cvfB	1987132..1987986 (+)	855	WP_001095445.1	RNA-binding virulence regulatory protein CvfB	-
R4707_RS10425	-	1987995..1988210 (+)	216	WP_001232085.1	YozE family protein	-
R4707_RS10430	-	1988296..1989300 (+)	1005	WP_000658177.1	PhoH family protein	-
R4707_RS10435	-	1989408..1989977 (+)	570	WP_000443770.1	GNAT family N-acetyltransferase	-
R4707_RS10440	comEA/celA/cilE	1990045..1990695 (+)	651	WP_000387330.1	ComEA family DNA-binding protein	Machinery gene
R4707_RS10445	comEC/celB	1990679..1992919 (+)	2241	WP_050103505.1	DNA internalization-related competence protein ComEC/Rec2	Machinery gene
R4707_RS10450	-	1993098..1993286 (+)	189	WP_001812421.1	hypothetical protein	-
R4707_RS10455	-	1993319..1993906 (+)	588	WP_000939895.1	ATP-binding cassette domain-containing protein	-
R4707_RS10460	-	1993910..1995094 (+)	1185	WP_016398520.1	hypothetical protein	-
R4707_RS10465	infC	1995405..1995935 (+)	531	WP_000848180.1	translation initiation factor IF-3	-
R4707_RS10470	rpmI	1995968..1996168 (+)	201	WP_001125943.1	50S ribosomal protein L35	-
R4707_RS10475	rplT	1996220..1996579 (+)	360	WP_000124836.1	50S ribosomal protein L20	-
R4707_RS10480	-	1996637..1997017 (+)	381	WP_000157154.1	VOC family protein	-

Sequence

Protein

Download Length: 746 a.a. Molecular weight: 84463.97 Da Isoelectric Point: 9.6737

                                >NTDB_id=896142 R4707_RS10445 WP_050103505.1 1990679..1992919(+) (comEC/celB) [Streptococcus pneumoniae strain ZGX]

MLQWIKNFSIPLIYLSFLLLWLYYAIFSASYLALLGFVFLLVCLFIQFPWKSAGKVLIICGIFGFWFVFQNWQQSQASQN

LADSVERVRILPDTIKVNGDSLSFRGKSNGRAFQVYYKLQSEEEKEAFQALTDLHEIGLEGKLSEPEGQRNFGGFNYQAY

LKTQGIYQTLNIKKIQSLQKIGSWDIGENLSSLRRKAVVWIKTHFPDPMRNYMTGLLLGHLNTDFEEMNELYSSLGIIHL

FALSGMQVGFFMNGFKKLLLRLGLTQEKLKWLTYPFSLIYAGLTGFSASVIRSLLQKLLAQHGVKGLDNFALTVLVLFIV

MPNFFLTAGGVLSCAYAFILTMTSKEGEGLKAVASESLVISLGILPILSFYFAEFQPWSILLTFVFSFLFDLVFLPLLSI

LFVLSFLYPVIQLNFIFEWLEGIIRLVSQVARRPLVFGQPNAWLLILLLISLALVYDLRKNIKGLTVLSLLITGLFFLTK

YPLENEITMLDVGQGESIFLRDVTGKTILIDVGGKAESYKKIEKWQEKMTTSNAQRTLIPYLKSRGVAKIDQLILTNTDK

ENVGDLSEVTKAFHVGEILVSKDSLKQKEFVAELQATQTKVRSMTVGENLPIFGSQLEVLSPRKMGDGGHDDTLVLYGKF

LDKQFLFTGNLEEKGEKDLLKHYPDLKVNVLKASQQGNKKSSSPAFLEKLKPELTLISVGKSNRMKLPHQETLTRLEGIN

SKVYRTDQQGAIRFKGLDSWKIESVR

Nucleotide

Download Length: 2241 bp

                                >NTDB_id=896142 R4707_RS10445 WP_050103505.1 1990679..1992919(+) (comEC/celB) [Streptococcus pneumoniae strain ZGX]

ATGTTACAGTGGATTAAGAATTTCTCTATTCCCCTAATTTACCTGAGTTTTCTATTACTTTGGCTTTATTACGCTATTTT

CTCAGCATCTTATCTTGCTTTGTTGGGCTTTGTTTTTCTGCTAGTCTGTCTCTTTATCCAATTTCCGTGGAAATCTGCTG

GTAAAGTTCTAATAATTTGCGGAATCTTTGGATTTTGGTTTGTTTTTCAAAATTGGCAACAGAGTCAAGCGAGTCAAAAT

CTGGCGGATTCTGTTGAAAGGGTACGGATTTTACCTGATACTATTAAGGTTAATGGTGATAGTCTATCCTTTCGTGGCAA

GTCTAACGGTCGTGCTTTCCAAGTCTATTATAAACTCCAGTCCGAGGAGGAGAAAGAAGCCTTTCAAGCTTTAACCGACC

TGCATGAGATAGGACTAGAAGGGAAGCTTTCGGAGCCAGAAGGGCAGAGAAATTTTGGTGGCTTTAATTACCAAGCCTAT

CTGAAGACTCAGGGAATTTACCAGACTCTCAATATCAAAAAAATCCAGTCACTTCAAAAGATTGGCAGTTGGGATATAGG

AGAAAACTTGTCCAGTTTACGTCGAAAGGCTGTGGTTTGGATTAAGACGCACTTTCCAGACCCTATGCGCAATTACATGA

CAGGACTCTTGCTGGGACATCTGAACACCGACTTTGAGGAGATGAATGAGCTTTATTCCAGTCTAGGAATTATCCACCTC

TTTGCCCTATCTGGCATGCAGGTAGGTTTTTTCATGAATGGATTTAAGAAACTTCTCTTGCGATTGGGCTTGACCCAAGA

AAAGTTGAAATGGCTGACTTATCCCTTTTCCCTTATCTATGCGGGACTAACTGGATTTTCAGCATCGGTTATTCGCAGTC

TCTTGCAAAAGCTACTGGCTCAACATGGGGTTAAGGGCTTGGATAATTTTGCCTTGACGGTGCTTGTCCTCTTTATTGTC

ATGCCAAACTTTTTCTTGACAGCAGGAGGAGTCTTGTCCTGCGCTTATGCTTTTATCCTGACCATGACCAGCAAAGAAGG

GGAGGGGCTCAAGGCTGTTGCTAGTGAAAGTCTAGTCATCTCCTTGGGCATATTGCCCATTCTATCCTTCTATTTTGCGG

AATTTCAACCTTGGTCTATCCTTTTGACCTTTGTCTTTTCCTTTCTTTTTGACTTGGTCTTCTTACCGCTCTTGTCTATC

TTATTTGTCCTTTCCTTTCTCTATCCAGTCATTCAGCTGAACTTTATCTTTGAATGGTTAGAGGGCATTATTCGCTTGGT

CTCGCAGGTGGCAAGGAGACCGCTTGTCTTTGGTCAACCCAACGCATGGCTTTTAATCTTATTGTTAATTTCCTTGGCTT

TGGTCTATGATTTGAGGAAAAACATTAAAGGATTAACAGTATTGAGTTTATTGATTACAGGTCTCTTTTTCCTTACCAAG

TATCCACTGGAAAATGAAATCACCATGCTGGATGTGGGGCAAGGAGAAAGTATTTTCCTACGGGATGTAACTGGGAAAAC

CATTCTCATAGATGTAGGTGGTAAGGCAGAATCTTATAAGAAAATCGAAAAATGGCAAGAAAAGATGACGACCAGCAATG

CCCAGCGAACCTTGATTCCCTATCTCAAAAGTCGAGGAGTAGCTAAGATTGACCAGCTAATTTTGACTAACACGGACAAG

GAGAATGTTGGAGATTTGTCAGAGGTGACCAAGGCTTTCCATGTAGGGGAGATTCTAGTATCAAAAGACAGTCTGAAACA

GAAGGAATTTGTGGCAGAACTACAGGCGACTCAAACAAAGGTGCGTAGTATGACAGTAGGGGAGAACTTGCCCATTTTTG

GAAGTCAGTTAGAAGTTCTATCTCCAAGGAAAATGGGAGATGGAGGACACGATGATACCCTAGTTCTGTATGGGAAATTC

TTGGATAAGCAATTTCTCTTCACGGGAAATTTGGAGGAGAAAGGAGAGAAGGACTTGCTGAAGCACTATCCAGACTTGAA

AGTAAATGTTTTGAAAGCTAGCCAACAAGGAAATAAAAAATCATCAAGTCCAGCCTTTCTAGAAAAACTCAAACCAGAGC

TTACTCTTATCTCAGTTGGAAAGAGCAATCGAATGAAACTCCCCCATCAGGAAACATTGACACGACTGGAAGGTATCAAT

AGCAAAGTTTATCGAACTGACCAGCAAGGAGCTATACGTTTTAAGGGGTTGGATAGTTGGAAAATCGAAAGTGTTCGATA

G

Domains

Predicted by InterproScan.

Competence protein (Competence)

(216-458)

Domain of unknown function (DUF4131) (DUF4131)

(30-177)

Secondary structure

Protein secondary structures were predicted by S4PRED and visualized by seqviz.

3D structure

Source	ID	Structure

Transmembrane helices

Transmembrane helices of protein were predicted by TMHMM 2.0 and visualized by seqviz and ECharts.

Visualization of predicted probability:

Similar proteins

Only experimentally validated proteins are listed.

Protein	Organism	Identities (%)	Coverage (%)	H_a-value
comEC/celB	Streptococcus pneumoniae TIGR4	98.794	100	0.988
comEC/celB	Streptococcus pneumoniae Rx1	97.185	100	0.972
comEC/celB	Streptococcus pneumoniae D39	97.185	100	0.972
comEC/celB	Streptococcus pneumoniae R6	97.185	100	0.972
comEC/celB	Streptococcus mitis SK321	92.493	100	0.925
comEC/celB	Streptococcus mitis NCTC 12261	92.215	99.866	0.921
comEC	Lactococcus lactis subsp. cremoris KW2	44.13	99.33	0.438

Detailed information NTG0896142