NTDB

Overview

Name	comEC/celB	Type	Machinery gene
Locus tag	EQB42_RS04730	Genome accession	NZ_LR129841
Coordinates	892672..894912 (+)	Length	746 a.a.
NCBI ID	WP_000942394.1	Uniprot ID	A0A166WJ67
Organism	Streptococcus pneumoniae strain 947 isolate 947
Function	ssDNA transport into the cell (predicted from homology) DNA binding and uptake

Genomic Context

Location: 887672..899912

Locus tag	Gene name	Coordinates (strand)	Size (bp)	Protein ID	Product	Description
EQB42_RS04695	-	888018..888808 (+)	791	Protein_890	IS5 family transposase	-
EQB42_RS04705	-	888991..889491 (+)	501	WP_000566988.1	GNAT family N-acetyltransferase	-
EQB42_RS04710	-	889494..889820 (+)	327	Protein_892	TfoX/Sxy family protein	-
EQB42_RS04715	ald	890125..891224 (-)	1100	Protein_893	alanine dehydrogenase	-
EQB42_RS04720	-	891401..891970 (+)	570	WP_000443750.1	GNAT family N-acetyltransferase	-
EQB42_RS04725	comEA/celA/cilE	892038..892688 (+)	651	WP_000387344.1	helix-hairpin-helix domain-containing protein	Machinery gene
EQB42_RS04730	comEC/celB	892672..894912 (+)	2241	WP_000942394.1	DNA internalization-related competence protein ComEC/Rec2	Machinery gene
EQB42_RS04735	-	895091..895279 (+)	189	WP_001808514.1	hypothetical protein	-
EQB42_RS04740	-	895312..895899 (+)	588	WP_000939895.1	ATP-binding cassette domain-containing protein	-
EQB42_RS04745	-	895903..897087 (+)	1185	WP_000655960.1	ABC transporter permease	-
EQB42_RS04750	infC	897398..897928 (+)	531	WP_000848180.1	translation initiation factor IF-3	-
EQB42_RS04755	rpmI	897961..898161 (+)	201	WP_001125943.1	50S ribosomal protein L35	-
EQB42_RS04760	rplT	898213..898572 (+)	360	WP_000124836.1	50S ribosomal protein L20	-
EQB42_RS04765	-	898630..899010 (+)	381	WP_000157154.1	VOC family protein	-

Sequence

Protein

Download Length: 746 a.a. Molecular weight: 84444.00 Da Isoelectric Point: 9.6202

                                >NTDB_id=1116267 EQB42_RS04730 WP_000942394.1 892672..894912(+) (comEC/celB) [Streptococcus pneumoniae strain 947 isolate 947]

MLQWIKNFSIPLIYLSFLLLWLYYAIFSASYLALLGFVFLLVCLFIQFPWKSAGKVLIICGIFGFWFVFQNWQQSQASQN

LADSVERVRILPDTIKVNGDSLSFRGKSNGRAFQVYYKLQSEEEKEAFQALTDLHEIGLEGKLSEPEGQRNFGGFNYQAY

LKTQGIYQTLNIKTIQSLQKIGSWDIGENLSSLRRKAVVWIKTHFPDPMGNYMTGLLLGHLDTDFEEMNELYSSLGIIHL

FALSGMQVGFFMNGFKKLLLRLGLTQEKLKWLTYPFSLIYAGLTGFSASVIRSLLQKLLAQHGVKGLDNFALTVLVLFIV

MPNFFLTAGGVLSCAYAFILTMTSKEGEGLKAVTSESLVISLGILPILSFYFAEFQPWSILLTFVFSFLFDLVFLPLLSI

LFVLSFLYPVIQLNFIFEWLEGIIRLVSQVARRPLVFGQPNAWLLILLLISLALVYDLRKNIKGLTVLSLLITGLFFLTK

YPLENEITMLDVGQGESIFLRDVTGKTILIDVGGKAESYKKIKKWQEKMTTSNAQRTLIPYLKSRGVAKIDQLILTNTDK

EHVGDLSEMTKAFHVGEILVSKDSLKQKEFVAELQATQTKVRSMIVGENLPIFGSQLEVLSPRKMGDGGHDDTLVLYGKF

LDKQFLFTGNLEEKGEKDLLKHYPDLKVNVLKASQHGNKKSSSPAFLEKLKPELTLISVGKSNRMKLPHQETLTRLEGIN

SKVYRTDQQGAIRFKGLDSWKIESVR

Nucleotide

Download Length: 2241 bp

                                >NTDB_id=1116267 EQB42_RS04730 WP_000942394.1 892672..894912(+) (comEC/celB) [Streptococcus pneumoniae strain 947 isolate 947]

ATGTTACAGTGGATTAAGAATTTCTCTATTCCCCTAATTTACCTGAGTTTTCTATTACTTTGGCTTTATTACGCTATTTT

CTCAGCATCTTATCTTGCTTTGTTGGGCTTTGTTTTTCTGCTAGTCTGTCTCTTTATCCAATTTCCGTGGAAATCTGCTG

GTAAAGTTCTAATAATTTGCGGAATCTTTGGATTTTGGTTTGTTTTTCAAAATTGGCAACAGAGTCAAGCGAGTCAAAAT

CTGGCGGATTCTGTTGAAAGGGTACGGATTTTGCCTGATACTATTAAGGTTAATGGTGATAGTCTATCCTTTCGTGGCAA

GTCTAACGGTCGTGCTTTCCAAGTCTATTATAAACTCCAGTCCGAGGAGGAGAAAGAAGCCTTTCAAGCTTTAACTGACC

TGCATGAGATAGGACTAGAAGGGAAGCTTTCGGAGCCAGAAGGGCAGAGAAATTTTGGTGGCTTTAATTACCAAGCCTAT

CTGAAGACTCAGGGAATTTACCAGACTCTCAATATCAAAACAATCCAGTCACTTCAAAAGATTGGCAGTTGGGATATAGG

AGAAAACTTGTCCAGTTTACGTCGAAAGGCTGTGGTTTGGATTAAGACGCACTTTCCAGACCCTATGGGCAATTACATGA

CAGGACTCTTGCTGGGACATCTGGACACCGACTTTGAGGAGATGAATGAGCTTTATTCCAGTCTAGGAATTATCCACCTC

TTTGCCCTATCTGGCATGCAGGTAGGTTTTTTCATGAATGGATTTAAGAAACTTCTCTTGCGATTGGGCTTGACCCAAGA

AAAGTTGAAATGGCTGACTTATCCCTTTTCCCTTATCTATGCGGGACTAACTGGATTTTCAGCATCGGTTATTCGCAGTC

TCTTGCAAAAGCTACTGGCTCAACATGGGGTTAAGGGCTTGGATAATTTTGCCTTGACGGTGCTTGTCCTCTTTATTGTC

ATGCCAAACTTTTTCTTGACAGCAGGAGGAGTCTTGTCCTGCGCTTATGCTTTTATCCTGACCATGACCAGCAAAGAAGG

GGAGGGGCTCAAGGCTGTTACTAGTGAAAGTCTAGTCATCTCCTTGGGCATATTGCCCATTCTATCCTTCTATTTTGCGG

AATTTCAACCTTGGTCTATCCTTTTGACCTTTGTCTTTTCCTTTCTTTTTGACTTGGTCTTCTTACCGCTCTTGTCTATC

TTATTTGTCCTTTCCTTTCTCTATCCAGTCATTCAGCTGAACTTTATCTTTGAATGGTTAGAGGGCATTATTCGCTTGGT

CTCGCAGGTGGCAAGGAGACCACTTGTCTTTGGTCAACCCAACGCATGGCTTTTAATCTTATTGTTAATTTCCTTGGCTT

TGGTCTATGATTTGAGGAAAAACATTAAAGGATTAACAGTATTGAGTTTATTGATTACAGGTCTCTTTTTCCTTACCAAG

TATCCACTGGAAAATGAAATCACCATGCTGGATGTGGGGCAAGGAGAAAGTATTTTCCTACGGGATGTAACTGGGAAAAC

CATTCTCATAGATGTAGGTGGTAAGGCAGAATCTTATAAGAAAATCAAAAAATGGCAAGAAAAGATGACGACCAGCAATG

CCCAGCGAACCTTGATTCCCTATCTCAAAAGTCGAGGAGTAGCTAAGATTGACCAGCTAATTTTGACTAACACGGACAAG

GAGCATGTTGGAGATTTGTCAGAGATGACCAAGGCTTTCCATGTAGGGGAGATTCTAGTATCAAAAGACAGTCTGAAACA

GAAGGAATTTGTGGCAGAACTACAGGCGACTCAAACAAAGGTGCGTAGTATGATAGTAGGGGAGAACTTGCCCATTTTTG

GAAGTCAGTTAGAAGTTCTATCTCCAAGGAAAATGGGAGATGGAGGACACGATGATACCCTAGTTCTGTATGGGAAATTC

TTGGATAAGCAATTTCTCTTCACGGGAAATTTGGAGGAGAAAGGAGAGAAGGACTTGCTGAAGCACTATCCAGACTTGAA

AGTAAATGTTTTGAAAGCTAGCCAACATGGCAATAAAAAATCATCAAGTCCAGCCTTTCTAGAAAAACTCAAACCAGAGC

TTACTCTTATCTCAGTTGGAAAGAGCAATCGAATGAAACTCCCCCATCAGGAAACATTGACACGACTGGAAGGTATCAAT

AGCAAAGTTTATCGAACTGACCAGCAAGGAGCTATACGTTTTAAGGGGTTGGATAGTTGGAAAATCGAAAGTGTTCGATA

G

Domains

Predicted by InterproScan.

Competence protein (Competence)

(216-458)

Domain of unknown function (DUF4131) (DUF4131)

(30-176)

Metallo-beta-lactamase superfamily (Lactamase_B)

(492-693)

Secondary structure

Protein secondary structures were predicted by S4PRED and visualized by seqviz.

3D structure

Source	ID	Structure
AlphaFold DB	A0A166WJ67

Transmembrane helices

Transmembrane helices of protein were predicted by TMHMM 2.0 and visualized by seqviz and ECharts.

Visualization of predicted probability:

Similar proteins

Only experimentally validated proteins are listed.

Protein	Organism	Identities (%)	Coverage (%)	H_a-value
comEC/celB	Streptococcus pneumoniae TIGR4	100	100	1
comEC/celB	Streptococcus pneumoniae Rx1	97.587	100	0.976
comEC/celB	Streptococcus pneumoniae D39	97.587	100	0.976
comEC/celB	Streptococcus pneumoniae R6	97.587	100	0.976
comEC/celB	Streptococcus mitis SK321	92.225	100	0.922
comEC/celB	Streptococcus mitis NCTC 12261	91.812	99.866	0.917
comEC	Lactococcus lactis subsp. cremoris KW2	44.399	99.33	0.441

Detailed information

Overview

Genomic Context

Sequence

Protein

Nucleotide

Domains

Secondary structure

3D structure

Transmembrane helices

Similar proteins

Multiple sequence alignment

Detailed information NTG1116267

Overview

Genomic Context

Sequence

Protein

Nucleotide

Domains

Secondary structure

3D structure

Transmembrane helices

Similar proteins

Multiple sequence alignment Download

Detailed information

Multiple sequence alignment