NTDB

Overview

Name	comEC/celB	Type	Machinery gene
Locus tag	R4708_RS10630	Genome accession	NZ_CP137104
Coordinates	2036641..2038881 (+)	Length	746 a.a.
NCBI ID	WP_000942392.1	Uniprot ID	A0A6I3VL05
Organism	Streptococcus pneumoniae strain LM
Function	ssDNA transport into the cell (predicted from homology) DNA binding and uptake

Genomic Context

Location: 2031641..2043881

Locus tag	Gene name	Coordinates (strand)	Size (bp)	Protein ID	Product	Description
R4708_RS10600	-	2031791..2032759 (+)	969	WP_000658198.1	PhoH family protein	-
R4708_RS10605	-	2032952..2033452 (+)	501	WP_000566986.1	GNAT family N-acetyltransferase	-
R4708_RS10610	-	2033455..2033781 (+)	327	Protein_2050	TfoX/Sxy family protein	-
R4708_RS10615	ald	2034082..2035193 (-)	1112	Protein_2051	alanine dehydrogenase	-
R4708_RS10620	-	2035370..2035939 (+)	570	WP_000443775.1	GNAT family N-acetyltransferase	-
R4708_RS10625	comEA/celA/cilE	2036007..2036657 (+)	651	WP_000387328.1	ComEA family DNA-binding protein	Machinery gene
R4708_RS10630	comEC/celB	2036641..2038881 (+)	2241	WP_000942392.1	DNA internalization-related competence protein ComEC/Rec2	Machinery gene
R4708_RS10635	-	2039023..2039247 (+)	225	WP_000583432.1	hypothetical protein	-
R4708_RS10640	-	2039280..2039867 (+)	588	WP_000939884.1	ATP-binding cassette domain-containing protein	-
R4708_RS10645	-	2039871..2041052 (+)	1182	WP_000655951.1	membrane protein	-
R4708_RS10650	infC	2041359..2041889 (+)	531	WP_000848180.1	translation initiation factor IF-3	-
R4708_RS10655	rpmI	2041922..2042122 (+)	201	WP_001125943.1	50S ribosomal protein L35	-
R4708_RS10660	rplT	2042174..2042533 (+)	360	WP_000124836.1	50S ribosomal protein L20	-
R4708_RS10665	-	2042591..2042971 (+)	381	WP_000157154.1	VOC family protein	-

Sequence

Protein

Download Length: 746 a.a. Molecular weight: 84589.24 Da Isoelectric Point: 9.8000

                                >NTDB_id=895447 R4708_RS10630 WP_000942392.1 2036641..2038881(+) (comEC/celB) [Streptococcus pneumoniae strain LM]

MLQWIKNFSIPLIYLSFLLLWLYYAIFSASYLALLGFVFLLVCLFIQFPWKSAGKVLIICGIFGFWFVFQNWQQSQASQN

LADSVERVRILPDTIKVNGDSLSFRGKSNGRAFQVYYKLQSEEEKEAFQALTDLHEIGLEGKLSEPEGQRNFGGFNYQAY

LKTQGIYQTLNIKKIQSLQKIGSWDIGENLSSLRRKAVVWIKTHFPDPMRNYMTGLLLGYLNTDFEEMNELYSSLGIIHL

FALSGMQVGFFMNGFKKLLLRLGLTQEKLKWLTYPFSLIYAGLIGFSASVIRSLLQKLLAQHGVKGLDNFALTVLVLFIV

MPNFFLTAGGVLSCAYAFILTMTSKEGEGLKAVASESLVISLGILPILSFYFAEFQPWSILLTFVFSFLFDLTFLPLLSI

LFVLSFLYPVIQLNFIFEWLEGIIRLVSQVARRPLVFGQPNAWLLILLLISLALVYDLRKNIKGLTVLSLLITGLFFLTK

YPLENEITMLDVGQGESIFLRDVTGKTILIDVGGKAESYKKIEKWQEKMTTSNAQRSLIPYLKSRGVAKIDQLILTNTDK

EHVGDLLEVTKAFHVGEILVSKGSLKQKQFVVELQATQTKVRSMTVGENLPIFGSQLEVLSPRKMGDGGHDDTLVLYGKF

LDKQFLFTGNLEEKGEKDLLKHYPDLKVNVLKASQHGNKKSSSPAFLEKLKPELTLISVGKSNRMKLPHQETLTRLEGIN

SKVYRTDQQGAIRFKGWNSWKIESVR

Nucleotide

Download Length: 2241 bp

                                >NTDB_id=895447 R4708_RS10630 WP_000942392.1 2036641..2038881(+) (comEC/celB) [Streptococcus pneumoniae strain LM]

ATGTTACAGTGGATTAAGAATTTCTCTATTCCCCTAATTTACCTGAGTTTTCTATTACTTTGGCTTTATTACGCTATTTT

CTCAGCATCTTATCTTGCTTTGTTGGGCTTTGTTTTTCTGCTAGTCTGTCTCTTTATCCAATTTCCGTGGAAATCTGCTG

GTAAAGTTCTAATAATTTGCGGAATCTTTGGATTTTGGTTTGTTTTTCAAAATTGGCAACAGAGTCAAGCGAGTCAAAAT

CTGGCGGATTCTGTTGAAAGGGTACGGATTTTACCTGATACTATTAAGGTTAATGGTGATAGTCTATCCTTTCGTGGCAA

GTCTAACGGTCGTGCTTTCCAAGTCTATTATAAACTCCAGTCCGAGGAGGAGAAAGAAGCCTTTCAAGCTTTAACCGACC

TGCATGAGATAGGACTAGAAGGGAAGCTTTCGGAGCCAGAAGGGCAGAGAAATTTTGGTGGCTTTAATTACCAAGCCTAT

CTGAAGACTCAGGGAATTTACCAGACTCTCAATATCAAAAAAATCCAGTCACTTCAAAAGATTGGCAGTTGGGATATAGG

AGAAAACTTGTCCAGTTTACGTCGAAAGGCTGTGGTTTGGATTAAGACGCACTTTCCAGACCCTATGCGCAATTACATGA

CAGGACTCTTGCTGGGATATCTGAACACCGACTTTGAGGAGATGAATGAGCTTTATTCCAGTCTAGGAATTATCCACCTC

TTTGCCCTATCTGGCATGCAGGTAGGTTTTTTCATGAATGGATTTAAGAAACTTCTCTTGCGATTGGGCTTGACCCAAGA

AAAGTTGAAATGGCTGACTTATCCCTTTTCCCTTATCTATGCGGGACTAATTGGATTTTCAGCATCGGTTATTCGCAGTC

TCTTGCAAAAGCTACTGGCTCAACATGGGGTTAAGGGCTTGGATAATTTTGCCTTGACGGTGCTTGTCCTCTTTATTGTC

ATGCCAAACTTTTTCTTGACAGCAGGAGGAGTCTTGTCCTGCGCTTATGCTTTTATCCTGACCATGACCAGCAAAGAAGG

GGAGGGGCTCAAGGCTGTTGCTAGTGAAAGTCTAGTCATCTCCTTGGGCATATTGCCCATTCTATCCTTCTATTTTGCGG

AATTTCAACCTTGGTCTATCCTTTTGACCTTTGTCTTTTCCTTTCTATTTGACTTGACCTTCTTACCGCTCTTGTCTATT

TTATTTGTCCTTTCCTTTCTCTATCCAGTCATTCAGCTGAACTTTATCTTTGAATGGTTAGAGGGCATTATTCGCTTGGT

CTCGCAGGTGGCAAGGAGACCGCTTGTCTTTGGTCAACCCAACGCATGGCTTTTAATCTTATTGTTAATTTCCTTGGCTT

TGGTCTATGATTTGAGGAAAAACATTAAAGGATTAACAGTATTGAGTTTATTGATTACAGGTCTCTTTTTCCTTACCAAG

TATCCACTGGAAAATGAAATCACCATGCTGGATGTGGGGCAAGGAGAAAGTATTTTCCTACGGGATGTAACTGGGAAAAC

CATTCTCATAGATGTAGGTGGTAAGGCAGAATCTTATAAGAAAATCGAAAAATGGCAAGAAAAGATGACGACCAGCAATG

CACAGAGAAGCTTGATACCCTATCTTAAAAGTCGAGGAGTAGCTAAGATTGACCAGCTGATTTTGACAAATACGGACAAG

GAACATGTCGGAGATTTGTTAGAGGTGACCAAGGCTTTCCATGTAGGGGAGATTTTAGTATCAAAAGGCAGTTTGAAGCA

GAAGCAATTTGTGGTAGAACTACAGGCGACTCAAACAAAGGTGCGTAGTATGACAGTAGGGGAGAACTTGCCCATTTTTG

GAAGTCAGTTAGAAGTTCTATCCCCAAGGAAAATGGGAGATGGAGGACACGATGATACCCTAGTTCTGTATGGGAAATTC

TTGGATAAGCAATTTCTCTTCACGGGAAATTTGGAGGAGAAAGGAGAGAAGGACTTGCTGAAGCACTATCCAGACTTGAA

AGTAAATGTTTTGAAAGCTAGCCAACATGGCAATAAAAAATCATCAAGTCCAGCCTTTCTAGAAAAACTCAAACCAGAGC

TTACTCTTATCTCAGTTGGAAAGAGCAATCGAATGAAACTCCCCCATCAGGAAACATTGACACGACTGGAAGGTATCAAT

AGCAAAGTTTACCGAACTGACCAGCAAGGAGCTATACGGTTTAAAGGTTGGAATAGTTGGAAAATCGAAAGTGTTCGATA

G

Domains

Predicted by InterproScan.

Metallo-beta-lactamase superfamily (Lactamase_B)

(492-693)

Domain of unknown function (DUF4131) (DUF4131)

(30-177)

Competence protein (Competence)

(216-458)

Secondary structure

Protein secondary structures were predicted by S4PRED and visualized by seqviz.

3D structure

Source	ID	Structure
AlphaFold DB	A0A6I3VL05

Transmembrane helices

Transmembrane helices of protein were predicted by TMHMM 2.0 and visualized by seqviz and ECharts.

Visualization of predicted probability:

Similar proteins

Only experimentally validated proteins are listed.

Protein	Organism	Identities (%)	Coverage (%)	H_a-value
comEC/celB	Streptococcus pneumoniae TIGR4	97.721	100	0.977
comEC/celB	Streptococcus pneumoniae Rx1	96.649	100	0.966
comEC/celB	Streptococcus pneumoniae D39	96.649	100	0.966
comEC/celB	Streptococcus pneumoniae R6	96.649	100	0.966
comEC/celB	Streptococcus mitis SK321	92.493	100	0.925
comEC/celB	Streptococcus mitis NCTC 12261	92.349	99.866	0.922
comEC	Lactococcus lactis subsp. cremoris KW2	44.534	99.33	0.442

Detailed information NTG0895447