NTDB

Overview

Name	comEC	Type	Machinery gene
Locus tag	AP033_RS11870	Genome accession	NZ_CP013014
Coordinates	1457354..1459483 (-)	Length	709 a.a.
NCBI ID	WP_001911453.1	Uniprot ID	-
Organism	Vibrio cholerae strain Env-390
Function	ssDNA transport through the inner membrane (predicted from homology) DNA binding and uptake

Genomic Context

Location: 1452354..1464483

Locus tag	Gene name	Coordinates (strand)	Size (bp)	Protein ID	Product	Description
AP033_RS11850 (AP033_21271)	kdsB	1453647..1454405 (-)	759	WP_000011330.1	3-deoxy-manno-octulosonate cytidylyltransferase	-
AP033_RS11855 (AP033_21272)	-	1454405..1454584 (-)	180	WP_000350068.1	Trm112 family protein	-
AP033_RS11860 (AP033_21273)	lpxK	1454565..1455572 (-)	1008	WP_001995372.1	tetraacyldisaccharide 4'-kinase	-
AP033_RS11865 (AP033_21274)	msbA	1455575..1457323 (-)	1749	WP_000052152.1	lipid A ABC transporter ATP-binding protein/permease MsbA	-
AP033_RS11870 (AP033_21275)	comEC	1457354..1459483 (-)	2130	WP_001911453.1	DNA internalization-related competence protein ComEC/Rec2	Machinery gene
AP033_RS11875 (AP033_21276)	-	1459606..1460136 (+)	531	WP_001881633.1	DUF2062 domain-containing protein	-
AP033_RS11880 (AP033_21277)	lolE	1460251..1461495 (-)	1245	WP_000493010.1	lipoprotein-releasing ABC transporter permease subunit LolE	-
AP033_RS11885 (AP033_21278)	lolD	1461496..1462182 (-)	687	WP_001061290.1	lipoprotein-releasing ABC transporter ATP-binding protein LolD	-
AP033_RS11890 (AP033_21279)	lolC	1462175..1463383 (-)	1209	WP_000468903.1	lipoprotein-releasing ABC transporter permease subunit LolC	-
AP033_RS11895 (AP033_21280)	-	1463559..1464134 (+)	576	WP_000999601.1	PilZ domain-containing protein	-

Sequence

Protein

Download Length: 709 a.a. Molecular weight: 80009.33 Da Isoelectric Point: 7.7984

                                >NTDB_id=159201 AP033_RS11870 WP_001911453.1 1457354..1459483(-) (comEC) [Vibrio cholerae strain Env-390]

MVLLGYHRVGRQFLGFVAAILTIVLQGNLIRDQSNVLYQAGPDIIIKGRVDSFFTQTRYAYEGFVLIHEVNGQTLNKMTR

PRIRLSAPLLLQPNDRVEFSVTLKPIVGRLNQTGFDLEAHYMAQSVVARAVVKPDTAYQIVQESGIRSSLFFELEQLTHT

SPYQGLILALTFGERKGIDEQEWQALRNSGLIHLVAISGLHIGIAFSVGYFLGLGMMRFHAQLLWSPFVCGALLAVLYAW

LAGFTLPTQRALIMCLLNVALIMLAFPLSALKRILLTLVAVLLWSPFASLSNSFWMSFLAVAIVLYQLASQSQRQVWWKA

LLWAQVFLVCLMAPVTAYFFGGLSVTAVLYNLVFIPWFSLVIVPALFLGLLLMVVWPSVAAAYWPWVDWTFLPLDWALQF

ADVGWWVVPSKVQGVVAASVAILLLYRFMSLKACSLLLGMIGLWWWFPSLTPLWRMDVLDVGHGLAIVIEQDERAIVYDT

GSSWPGGSYVQSVIEPMLQQRGLRQVDGVILSHLDNDHAGDWQGLAERWQPNWIRASQLGTEFMPCIRGESWQWQSLHFT

VLWPPQAVSRAYNQHSCVIRMTDTQSNHSVLLSGDVTAMGEWLLARDGAQLQSEVMIVPHHGSKTSSTAEFIAQVNPKLA

IASVAKDNRWNLPNPQVVARYQAQQVEWLDTGHAGQISLFFYLDQLDWFTQRSLGWQPWYRQMLRKGVE

Nucleotide

Download Length: 2130 bp

                                >NTDB_id=159201 AP033_RS11870 WP_001911453.1 1457354..1459483(-) (comEC) [Vibrio cholerae strain Env-390]

ATGGTTTTGCTCGGTTATCACCGAGTTGGCCGTCAATTCCTTGGCTTCGTGGCTGCCATACTAACCATTGTGCTACAGGG

CAACCTTATACGAGATCAATCCAATGTGCTCTATCAAGCAGGGCCGGATATTATCATAAAAGGCCGTGTTGACAGCTTTT

TTACGCAAACTCGTTACGCTTATGAGGGTTTTGTCCTCATTCATGAAGTGAATGGACAAACCTTAAACAAAATGACTCGC

CCTCGCATACGTTTAAGTGCCCCTTTACTGTTACAACCCAATGATCGCGTCGAATTTTCGGTAACTCTCAAGCCGATAGT

GGGTCGACTCAACCAAACCGGCTTTGATTTAGAAGCGCATTACATGGCGCAATCTGTCGTCGCACGAGCGGTCGTAAAAC

CTGACACTGCTTATCAAATTGTGCAAGAGAGTGGCATAAGGTCAAGTTTGTTTTTTGAGCTAGAGCAATTAACGCATACC

AGCCCATACCAAGGATTGATCTTAGCCCTGACGTTTGGCGAGCGAAAAGGTATTGATGAGCAAGAGTGGCAAGCCTTACG

CAATAGTGGCTTAATTCATTTAGTGGCCATTTCGGGGCTGCACATTGGTATCGCTTTTAGCGTGGGGTATTTTCTCGGGC

TCGGCATGATGCGTTTTCATGCTCAGTTATTGTGGTCCCCTTTTGTGTGTGGGGCTTTACTGGCGGTGCTCTACGCTTGG

CTGGCCGGATTTACGTTGCCTACTCAGCGTGCATTGATTATGTGCTTACTCAATGTGGCGTTGATCATGTTGGCTTTTCC

TCTTTCCGCGCTCAAGCGGATTCTACTCACCTTAGTCGCGGTCTTGCTTTGGTCGCCATTCGCCTCACTTTCAAACAGTT

TCTGGATGTCGTTTTTGGCGGTCGCGATTGTTCTCTACCAATTAGCCAGTCAAAGCCAGCGTCAGGTGTGGTGGAAAGCT

CTTCTTTGGGCGCAGGTGTTCCTCGTCTGTTTAATGGCACCGGTCACGGCCTATTTTTTCGGTGGCTTAAGCGTAACGGC

AGTTCTGTACAATTTGGTGTTTATTCCTTGGTTTTCGTTGGTGATTGTCCCAGCTTTGTTTTTGGGTCTATTACTCATGG

TGGTATGGCCTAGTGTGGCCGCCGCTTACTGGCCTTGGGTGGATTGGACGTTTTTACCGCTCGATTGGGCTTTGCAGTTT

GCCGATGTAGGCTGGTGGGTGGTCCCCAGCAAAGTACAAGGTGTGGTCGCAGCGAGTGTGGCAATCCTCTTGCTTTATCG

ATTTATGAGCCTAAAAGCCTGCAGCTTATTATTGGGTATGATTGGCTTATGGTGGTGGTTTCCCTCTCTCACTCCACTTT

GGCGAATGGATGTGCTGGATGTTGGACATGGCTTGGCGATTGTGATTGAGCAAGATGAGCGAGCAATTGTCTACGATACA

GGCAGCAGTTGGCCGGGAGGCAGCTATGTGCAAAGCGTGATTGAGCCTATGCTCCAACAGCGGGGGCTACGCCAAGTGGA

TGGAGTGATTTTAAGTCATCTTGATAATGATCATGCGGGTGATTGGCAAGGTTTAGCTGAGCGCTGGCAACCCAATTGGA

TTCGTGCCAGCCAACTCGGGACAGAGTTTATGCCTTGTATCCGTGGTGAAAGCTGGCAGTGGCAATCTCTCCATTTTACG

GTGTTATGGCCACCACAAGCGGTTAGCCGAGCGTACAACCAGCATTCGTGTGTGATTCGTATGACCGATACTCAGTCTAA

CCATTCTGTACTGCTCTCCGGGGATGTCACAGCCATGGGGGAGTGGCTGCTTGCTCGCGACGGAGCGCAACTGCAAAGTG

AGGTGATGATCGTGCCGCACCACGGCAGTAAAACATCGTCCACCGCAGAGTTTATTGCCCAAGTGAATCCCAAACTTGCG

ATTGCTTCTGTGGCGAAAGATAACCGCTGGAATTTGCCTAATCCGCAAGTCGTGGCACGTTATCAAGCTCAGCAAGTTGA

GTGGCTAGATACTGGACACGCTGGGCAAATTAGCCTCTTTTTCTATCTAGATCAGCTGGATTGGTTTACCCAGCGTAGCC

TTGGCTGGCAGCCTTGGTATAGGCAGATGCTGCGTAAAGGAGTAGAATGA

Domains

Predicted by InterProScan.

Domain of unknown function (DUF4131) (DUF4131)

(6-135)

Competence protein (Competence)

(170-426)

Metallo-beta-lactamase superfamily (Lactamase_B)

(461-641)

Secondary structure

Protein secondary structures were predicted by S4PRED and visualized by seqviz.

3D structure

Source	ID	Structure

Transmembrane helices

Transmembrane helices of protein were predicted by TMHMM 2.0 and visualized by seqviz and ECharts.

Visualization of predicted probability:

Similar proteins

Only experimentally validated proteins are listed.

Protein	Organism	Identities (%)	Coverage (%)	H_a-value
comEC	Vibrio cholerae strain A1552	100	100	1
comEC	Vibrio parahaemolyticus RIMD 2210633	41.433	100	0.416
comEC	Vibrio campbellii strain DS40M4	41.301	99.718	0.412

Detailed information

Overview

Genomic Context

Sequence

Protein

Nucleotide

Domains

Secondary structure

3D structure

Transmembrane helices

Similar proteins

Multiple sequence alignment

Detailed information NTG0159201

Overview

Genomic Context

Sequence

Protein

Nucleotide

Domains

Secondary structure

3D structure

Transmembrane helices

Similar proteins

Multiple sequence alignment Download

Detailed information

Multiple sequence alignment