NTDB

Overview

Name	comGB/cglB	Type	Machinery gene
Locus tag	EQH42_RS09365	Genome accession	NZ_CP035238
Coordinates	1841589..1842605 (-)	Length	338 a.a.
NCBI ID	WP_074196785.1	Uniprot ID	-
Organism	Streptococcus pneumoniae strain TVO_D39
Function	dsDNA binding to the cell surface; assembly of the pseudopilus (predicted from homology) DNA binding and uptake

Genomic Context

Location: 1836589..1847605

Locus tag	Gene name	Coordinates (strand)	Size (bp)	Protein ID	Product	Description
EQH42_RS10480	-	1836666..1836797 (-)	132	WP_000768904.1	hypothetical protein	-
EQH42_RS09325 (EQH42_09855)	-	1836798..1837988 (-)	1191	WP_000167757.1	acetate kinase	-
EQH42_RS09330 (EQH42_09860)	comYH	1838039..1838992 (-)	954	WP_000345135.1	class I SAM-dependent methyltransferase	Machinery gene
EQH42_RS09335 (EQH42_09865)	-	1839053..1839647 (-)	595	Protein_1839	class I SAM-dependent methyltransferase	-
EQH42_RS09340 (EQH42_09870)	comGG/cglG	1839784..1840197 (-)	414	WP_000265622.1	competence type IV pilus minor pilin ComGG	Machinery gene
EQH42_RS09345 (EQH42_09875)	comGF/cglF	1840175..1840636 (-)	462	WP_000250534.1	competence type IV pilus minor pilin ComGF	Machinery gene
EQH42_RS09350 (EQH42_09880)	comGE/cglE	1840599..1840901 (-)	303	WP_000413382.1	competence type IV pilus minor pilin ComGE	Machinery gene
EQH42_RS09355 (EQH42_09885)	comGD/cglD	1840864..1841268 (-)	405	WP_000588026.1	competence type IV pilus minor pilin ComGD	Machinery gene
EQH42_RS09360 (EQH42_09890)	comGC/cglC	1841261..1841587 (-)	327	WP_000738626.1	comG operon protein ComGC	Machinery gene
EQH42_RS09365 (EQH42_09895)	comGB/cglB	1841589..1842605 (-)	1017	WP_074196785.1	competence type IV pilus assembly protein ComGB	Machinery gene
EQH42_RS09370 (EQH42_09900)	comGA/cglA/cilD	1842553..1843494 (-)	942	WP_000249564.1	competence type IV pilus ATPase ComGA	Machinery gene
EQH42_RS09375 (EQH42_09905)	-	1843570..1843935 (-)	366	WP_000286412.1	DUF1033 family protein	-
EQH42_RS09380 (EQH42_09910)	-	1844086..1845144 (-)	1059	WP_000649468.1	zinc-dependent alcohol dehydrogenase family protein	-
EQH42_RS09385 (EQH42_09915)	nagA	1845307..1846458 (-)	1152	WP_001134457.1	N-acetylglucosamine-6-phosphate deacetylase	-

Sequence

Protein

Download Length: 338 a.a. Molecular weight: 38392.40 Da Isoelectric Point: 9.4802

                                >NTDB_id=336928 EQH42_RS09365 WP_074196785.1 1841589..1842605(-) (comGB/cglB) [Streptococcus pneumoniae strain TVO_D39]

MDISQVFRLRRKKLATAKQKNIITLFNNLFSSGFHLVETISFLDRSALLDKQCVTQMRVGLSQGKSFSEMMESLGCSSAI

VTQLSLAEVHGNLHLSLGKIEEYLDNLAKVKKKLIEVATYPLILLGFLLLIMLGLRNYLLPQLDSSNIATQIIGNLPQIF

LGMVGLVSVLALLALTFYKRSSKMSVFSILARLPFIGIFVQTYLTAYYAREWGNMISQGMELTQIFQMMQEQGSQLFKEV

GQDLAQTLKNGREFSQTIGTYPFFRKELSLIIEYGEVKSKLGSELEIYAEKTWEAFFTRVNRTMNLVQPLVFIFVALIIV

LLYAAMLMPMYQNMEVNF

Nucleotide

Download Length: 1017 bp

                                >NTDB_id=336928 EQH42_RS09365 WP_074196785.1 1841589..1842605(-) (comGB/cglB) [Streptococcus pneumoniae strain TVO_D39]

ATGGACATATCACAAGTCTTCAGGCTGAGACGGAAAAAATTAGCTACAGCTAAGCAAAAAAATATCATCACCCTATTTAA

CAATCTCTTTTCTAGCGGTTTTCATCTGGTGGAGACTATCTCCTTTTTAGATAGGAGTGCTTTGTTGGACAAGCAGTGTG

TGACCCAGATGCGTGTGGGCTTGTCTCAGGGGAAATCATTCTCAGAAATGATGGAAAGTTTGGGATGTTCAAGTGCTATT

GTCACTCAGTTATCCCTAGCTGAAGTTCATGGCAATCTCCACCTGAGTTTGGGAAAGATAGAAGAATATCTGGACAATCT

GGCTAAGGTCAAGAAAAAATTGATTGAAGTAGCGACCTATCCCTTGATTTTGCTGGGTTTTCTTCTCTTAATTATGCTGG

GGCTACGGAATTACCTGCTCCCACAACTGGATAGTAGCAATATTGCCACCCAAATTATCGGTAATCTGCCCCAAATTTTT

CTAGGCATGGTAGGGCTTGTTTCCGTGCTTGCCCTTTTAGCACTCACTTTTTATAAAAGAAGTTCTAAGATGAGTGTCTT

TTCTATCTTAGCACGCCTTCCCTTTATTGGAATCTTTGTGCAGACCTACTTGACAGCCTATTATGCACGTGAATGGGGGA

ATATGATTTCACAGGGAATGGAGTTGACGCAGATTTTTCAAATGATGCAGGAACAAGGTTCCCAGCTCTTTAAAGAAGTC

GGTCAAGATCTGGCTCAAACCCTGAAAAATGGCCGTGAATTTTCTCAGACGATAGGAACCTATCCTTTCTTTAGGAAGGA

ATTGAGTCTCATCATAGAGTATGGGGAAGTTAAGTCCAAGCTGGGTAGTGAGTTGGAAATCTATGCTGAAAAAACTTGGG

AAGCCTTTTTTACCCGAGTCAACCGCACCATGAATTTGGTGCAGCCACTGGTTTTTATCTTTGTGGCACTGATTATCGTT

TTACTTTATGCGGCAATGCTCATGCCCATGTATCAAAATATGGAGGTAAATTTTTAA

Domains

Predicted by InterproScan.

Type II secretion system (T2SS), protein F (T2SSF)

(209-329)

Type II secretion system (T2SS), protein F (T2SSF)

(24-141)

Secondary structure

Protein secondary structures were predicted by S4PRED and visualized by seqviz.

3D structure

Source	ID	Structure

Transmembrane helices

Transmembrane helices of protein were predicted by TMHMM 2.0 and visualized by seqviz and ECharts.

Visualization of predicted probability:

Similar proteins

Only experimentally validated proteins are listed.

Protein	Organism	Identities (%)	Coverage (%)	H_a-value
comGB/cglB	Streptococcus pneumoniae Rx1	100	100	1
comGB/cglB	Streptococcus pneumoniae D39	100	100	1
comGB/cglB	Streptococcus pneumoniae R6	100	100	1
comGB/cglB	Streptococcus pneumoniae TIGR4	100	100	1
comGB/cglB	Streptococcus mitis SK321	95.266	100	0.953
comGB/cglB	Streptococcus mitis NCTC 12261	94.675	100	0.947
comYB	Streptococcus gordonii str. Challis substr. CH1	71.131	99.408	0.707
comYB	Streptococcus mutans UA140	57.547	94.083	0.541
comYB	Streptococcus mutans UA159	57.547	94.083	0.541
comGB	Lactococcus lactis subsp. cremoris KW2	51.198	98.817	0.506

Detailed information

Overview

Genomic Context

Sequence

Protein

Nucleotide

Domains

Secondary structure

3D structure

Transmembrane helices

Similar proteins

Multiple sequence alignment

Detailed information NTG0336928

Overview

Genomic Context

Sequence

Protein

Nucleotide

Domains

Secondary structure

3D structure

Transmembrane helices

Similar proteins

Multiple sequence alignment Download

Detailed information

Multiple sequence alignment