Detailed information
Overview
| Name | comA | Type | Machinery gene |
| Locus tag | MTZ49_RS06870 | Genome accession | NZ_CP094972 |
| Coordinates | 1430104..1432323 (+) | Length | 739 a.a. |
| NCBI ID | WP_264747603.1 | Uniprot ID | - |
| Organism | Entomomonas sp. E2T0 | ||
| Function | ssDNA transport through the inner membrane (predicted from homology) DNA binding and uptake |
||
Genomic Context
Location: 1425104..1437323
| Locus tag | Gene name | Coordinates (strand) | Size (bp) | Protein ID | Product | Description |
|---|---|---|---|---|---|---|
| MTZ49_RS06850 (MTZ49_06845) | - | 1425909..1426643 (-) | 735 | WP_264747599.1 | class I SAM-dependent methyltransferase | - |
| MTZ49_RS06855 (MTZ49_06850) | - | 1426719..1428065 (-) | 1347 | WP_264747600.1 | flippase | - |
| MTZ49_RS06860 (MTZ49_06855) | - | 1428062..1429399 (-) | 1338 | WP_264747601.1 | UDP-glucose dehydrogenase family protein | - |
| MTZ49_RS06865 (MTZ49_06860) | - | 1429569..1430099 (+) | 531 | WP_264747602.1 | DUF4124 domain-containing protein | - |
| MTZ49_RS06870 (MTZ49_06865) | comA | 1430104..1432323 (+) | 2220 | WP_264747603.1 | DNA internalization-related competence protein ComEC/Rec2 | Machinery gene |
| MTZ49_RS06875 (MTZ49_06870) | - | 1432391..1433098 (+) | 708 | WP_264747604.1 | MotA/TolQ/ExbB proton channel family protein | - |
| MTZ49_RS06880 (MTZ49_06875) | - | 1433095..1433532 (+) | 438 | WP_264747605.1 | ExbD/TolR family protein | - |
| MTZ49_RS06885 (MTZ49_06880) | lpxK | 1433534..1434529 (+) | 996 | WP_264747606.1 | tetraacyldisaccharide 4'-kinase | - |
| MTZ49_RS06890 (MTZ49_06885) | - | 1434587..1434772 (+) | 186 | WP_264747607.1 | Trm112 family protein | - |
| MTZ49_RS06895 (MTZ49_06890) | kdsB | 1434769..1435536 (+) | 768 | WP_264747608.1 | 3-deoxy-manno-octulosonate cytidylyltransferase | - |
| MTZ49_RS06900 (MTZ49_06895) | - | 1435536..1435994 (+) | 459 | WP_264747609.1 | low molecular weight protein-tyrosine-phosphatase | - |
| MTZ49_RS06905 (MTZ49_06900) | murB | 1435991..1437007 (+) | 1017 | WP_264747610.1 | UDP-N-acetylmuramate dehydrogenase | - |
Sequence
Protein
Download Length: 739 a.a. Molecular weight: 82032.65 Da Isoelectric Point: 9.8431
>NTDB_id=674625 MTZ49_RS06870 WP_264747603.1 1430104..1432323(+) (comA) [Entomomonas sp. E2T0]
MRIALITFIIGLLSIRFFPALPSLSACIILACVGLTLLPWRLYPLGMLLIGIAWGCYGASQTINDRLNPALDGKTIWIEG
TIAGLPEQAEQVIRFQLKNAKAQDIQLPTNIRLAWYKGEQVATGESWRLQVRLKYPRGTINPYVFDYEAWLTAKHIGATG
TVKQAQRLQENTNIINWRYQLRQKMLAQDTANQTAGLIALVLGDGSALSRSQWQVLQETGTVHLMVISGQHITLLAGFLY
FFIAGLVRLGWWPKRLPWLPIACGLAMLGALAYGLLAGFEVPVQRACIMLALVLLWRLRFRHLGVATPFLMALAIVLIAD
PLASLQAGFWLSFSAVAILLLLLSGRLNYNNWWLSAINIQWAITIGLIPVLLVLLLPVSLTSPIANLIAVPIVSFIIVPF
ALLGTLLIGIPYVGALLLWLAGYTLKLMFIILTFVAEVVPAWVAPMPPWWAFLLAFLGVFLILLPRGALLRVFGIVFCLP
LFFVNTVNIKEDQAEVTVFDVGQGLSVLVRTKNHSLLYDTGPSFGDFNLGERIITPSLQRQGVKLLDKIVVSHADTDHAG
GLQAITKRVTVQQLISGEPDKLVSELMTHPCQNNSWQWDGVKFSLWQWSAATKGNDASCVLLVEAKGETLLLTGDISSKA
EQAWFAENNRQINWLLVPHHGSKNSSSWNFLAATKPQYIIVSRGWLNPFNHPNLATLERYQKVGAKVEDTALAGALQINL
GTFQSATRQRDTKYFWRKQ
MRIALITFIIGLLSIRFFPALPSLSACIILACVGLTLLPWRLYPLGMLLIGIAWGCYGASQTINDRLNPALDGKTIWIEG
TIAGLPEQAEQVIRFQLKNAKAQDIQLPTNIRLAWYKGEQVATGESWRLQVRLKYPRGTINPYVFDYEAWLTAKHIGATG
TVKQAQRLQENTNIINWRYQLRQKMLAQDTANQTAGLIALVLGDGSALSRSQWQVLQETGTVHLMVISGQHITLLAGFLY
FFIAGLVRLGWWPKRLPWLPIACGLAMLGALAYGLLAGFEVPVQRACIMLALVLLWRLRFRHLGVATPFLMALAIVLIAD
PLASLQAGFWLSFSAVAILLLLLSGRLNYNNWWLSAINIQWAITIGLIPVLLVLLLPVSLTSPIANLIAVPIVSFIIVPF
ALLGTLLIGIPYVGALLLWLAGYTLKLMFIILTFVAEVVPAWVAPMPPWWAFLLAFLGVFLILLPRGALLRVFGIVFCLP
LFFVNTVNIKEDQAEVTVFDVGQGLSVLVRTKNHSLLYDTGPSFGDFNLGERIITPSLQRQGVKLLDKIVVSHADTDHAG
GLQAITKRVTVQQLISGEPDKLVSELMTHPCQNNSWQWDGVKFSLWQWSAATKGNDASCVLLVEAKGETLLLTGDISSKA
EQAWFAENNRQINWLLVPHHGSKNSSSWNFLAATKPQYIIVSRGWLNPFNHPNLATLERYQKVGAKVEDTALAGALQINL
GTFQSATRQRDTKYFWRKQ
Nucleotide
Download Length: 2220 bp
>NTDB_id=674625 MTZ49_RS06870 WP_264747603.1 1430104..1432323(+) (comA) [Entomomonas sp. E2T0]
ATGCGGATAGCGTTAATAACTTTTATCATTGGATTGTTATCTATTCGTTTTTTTCCTGCGTTACCCTCACTTTCAGCTTG
TATCATATTGGCTTGTGTGGGGCTAACTTTATTACCTTGGCGACTTTATCCACTAGGCATGCTGTTAATAGGTATTGCAT
GGGGATGTTATGGGGCAAGTCAAACCATTAATGATCGTTTAAATCCAGCATTAGATGGCAAAACAATATGGATAGAGGGC
ACTATAGCTGGTTTACCAGAGCAAGCTGAACAGGTTATTCGCTTTCAATTAAAAAATGCCAAAGCACAAGATATTCAGTT
ACCTACCAATATAAGGCTTGCTTGGTATAAAGGTGAACAAGTAGCTACTGGGGAGTCTTGGCGTCTACAAGTAAGATTAA
AATACCCTAGAGGAACAATTAACCCGTATGTTTTCGATTATGAAGCATGGCTAACAGCCAAGCATATTGGTGCAACAGGT
ACGGTTAAACAAGCACAACGTTTACAAGAAAACACCAATATTATTAACTGGCGTTATCAACTACGTCAAAAAATGTTAGC
ACAAGATACTGCTAACCAAACAGCAGGATTAATCGCTTTAGTATTAGGTGATGGTTCTGCATTATCTAGAAGTCAATGGC
AAGTATTACAAGAAACGGGCACTGTCCATTTAATGGTTATTTCGGGGCAGCATATTACGTTATTAGCAGGATTTCTTTAT
TTTTTTATAGCAGGCTTAGTGCGTTTAGGGTGGTGGCCTAAAAGACTACCATGGTTACCTATAGCTTGTGGTTTAGCTAT
GTTAGGTGCTTTAGCTTATGGTTTATTGGCAGGGTTTGAAGTACCTGTACAGCGTGCTTGTATTATGTTGGCACTCGTGT
TGTTATGGCGTTTAAGGTTTCGTCATTTAGGGGTAGCCACACCGTTTTTAATGGCTTTAGCTATTGTTCTTATTGCAGAC
CCTTTAGCCAGTTTACAAGCTGGTTTTTGGCTATCGTTTAGTGCAGTAGCCATCTTATTATTGTTGCTTTCAGGGCGACT
GAATTATAACAATTGGTGGTTAAGTGCTATAAACATTCAGTGGGCAATTACCATAGGTTTAATACCTGTACTATTGGTTT
TGCTATTGCCTGTTAGTTTAACCAGCCCTATTGCCAATTTAATAGCAGTACCTATTGTTAGTTTTATTATTGTACCTTTT
GCATTATTGGGGACTTTACTCATAGGTATTCCCTATGTAGGCGCACTATTGCTTTGGTTGGCGGGTTATACTTTAAAGTT
AATGTTTATTATTTTGACTTTTGTTGCTGAAGTAGTACCTGCTTGGGTAGCCCCTATGCCTCCTTGGTGGGCTTTTTTAT
TAGCTTTTTTAGGCGTATTTTTAATATTGTTACCAAGAGGTGCATTACTTCGAGTATTTGGCATAGTTTTTTGTTTGCCA
TTATTTTTTGTTAACACAGTAAATATTAAAGAAGATCAAGCAGAAGTAACAGTGTTTGATGTAGGACAAGGGTTGTCCGT
ATTAGTGAGAACTAAAAATCATAGCTTATTATATGATACAGGTCCCAGTTTTGGTGATTTTAATTTGGGAGAGAGGATTA
TTACTCCCTCTCTACAGCGACAAGGGGTTAAACTACTCGATAAAATAGTTGTTTCTCATGCAGATACAGATCATGCAGGC
GGACTACAAGCAATTACTAAGCGTGTAACCGTGCAACAGTTAATAAGTGGTGAGCCAGATAAATTAGTGAGTGAATTAAT
GACTCACCCTTGTCAAAATAATAGTTGGCAGTGGGATGGGGTAAAATTCTCATTATGGCAGTGGTCAGCAGCAACAAAGG
GTAATGATGCATCTTGCGTATTATTGGTAGAAGCAAAGGGTGAAACGTTATTATTAACAGGTGATATTTCAAGTAAAGCT
GAACAAGCTTGGTTTGCAGAAAATAACAGGCAGATTAATTGGCTATTAGTGCCACATCACGGTAGTAAGAATAGTTCATC
ATGGAACTTTTTAGCGGCTACAAAGCCTCAATATATAATTGTTTCAAGAGGATGGTTAAATCCATTTAATCATCCAAACT
TAGCCACTCTGGAGCGTTATCAAAAAGTGGGAGCTAAGGTTGAGGATACAGCATTAGCAGGTGCTTTACAGATTAACTTA
GGTACATTTCAATCTGCTACAAGGCAGCGTGATACAAAATATTTTTGGCGAAAACAATGA
ATGCGGATAGCGTTAATAACTTTTATCATTGGATTGTTATCTATTCGTTTTTTTCCTGCGTTACCCTCACTTTCAGCTTG
TATCATATTGGCTTGTGTGGGGCTAACTTTATTACCTTGGCGACTTTATCCACTAGGCATGCTGTTAATAGGTATTGCAT
GGGGATGTTATGGGGCAAGTCAAACCATTAATGATCGTTTAAATCCAGCATTAGATGGCAAAACAATATGGATAGAGGGC
ACTATAGCTGGTTTACCAGAGCAAGCTGAACAGGTTATTCGCTTTCAATTAAAAAATGCCAAAGCACAAGATATTCAGTT
ACCTACCAATATAAGGCTTGCTTGGTATAAAGGTGAACAAGTAGCTACTGGGGAGTCTTGGCGTCTACAAGTAAGATTAA
AATACCCTAGAGGAACAATTAACCCGTATGTTTTCGATTATGAAGCATGGCTAACAGCCAAGCATATTGGTGCAACAGGT
ACGGTTAAACAAGCACAACGTTTACAAGAAAACACCAATATTATTAACTGGCGTTATCAACTACGTCAAAAAATGTTAGC
ACAAGATACTGCTAACCAAACAGCAGGATTAATCGCTTTAGTATTAGGTGATGGTTCTGCATTATCTAGAAGTCAATGGC
AAGTATTACAAGAAACGGGCACTGTCCATTTAATGGTTATTTCGGGGCAGCATATTACGTTATTAGCAGGATTTCTTTAT
TTTTTTATAGCAGGCTTAGTGCGTTTAGGGTGGTGGCCTAAAAGACTACCATGGTTACCTATAGCTTGTGGTTTAGCTAT
GTTAGGTGCTTTAGCTTATGGTTTATTGGCAGGGTTTGAAGTACCTGTACAGCGTGCTTGTATTATGTTGGCACTCGTGT
TGTTATGGCGTTTAAGGTTTCGTCATTTAGGGGTAGCCACACCGTTTTTAATGGCTTTAGCTATTGTTCTTATTGCAGAC
CCTTTAGCCAGTTTACAAGCTGGTTTTTGGCTATCGTTTAGTGCAGTAGCCATCTTATTATTGTTGCTTTCAGGGCGACT
GAATTATAACAATTGGTGGTTAAGTGCTATAAACATTCAGTGGGCAATTACCATAGGTTTAATACCTGTACTATTGGTTT
TGCTATTGCCTGTTAGTTTAACCAGCCCTATTGCCAATTTAATAGCAGTACCTATTGTTAGTTTTATTATTGTACCTTTT
GCATTATTGGGGACTTTACTCATAGGTATTCCCTATGTAGGCGCACTATTGCTTTGGTTGGCGGGTTATACTTTAAAGTT
AATGTTTATTATTTTGACTTTTGTTGCTGAAGTAGTACCTGCTTGGGTAGCCCCTATGCCTCCTTGGTGGGCTTTTTTAT
TAGCTTTTTTAGGCGTATTTTTAATATTGTTACCAAGAGGTGCATTACTTCGAGTATTTGGCATAGTTTTTTGTTTGCCA
TTATTTTTTGTTAACACAGTAAATATTAAAGAAGATCAAGCAGAAGTAACAGTGTTTGATGTAGGACAAGGGTTGTCCGT
ATTAGTGAGAACTAAAAATCATAGCTTATTATATGATACAGGTCCCAGTTTTGGTGATTTTAATTTGGGAGAGAGGATTA
TTACTCCCTCTCTACAGCGACAAGGGGTTAAACTACTCGATAAAATAGTTGTTTCTCATGCAGATACAGATCATGCAGGC
GGACTACAAGCAATTACTAAGCGTGTAACCGTGCAACAGTTAATAAGTGGTGAGCCAGATAAATTAGTGAGTGAATTAAT
GACTCACCCTTGTCAAAATAATAGTTGGCAGTGGGATGGGGTAAAATTCTCATTATGGCAGTGGTCAGCAGCAACAAAGG
GTAATGATGCATCTTGCGTATTATTGGTAGAAGCAAAGGGTGAAACGTTATTATTAACAGGTGATATTTCAAGTAAAGCT
GAACAAGCTTGGTTTGCAGAAAATAACAGGCAGATTAATTGGCTATTAGTGCCACATCACGGTAGTAAGAATAGTTCATC
ATGGAACTTTTTAGCGGCTACAAAGCCTCAATATATAATTGTTTCAAGAGGATGGTTAAATCCATTTAATCATCCAAACT
TAGCCACTCTGGAGCGTTATCAAAAAGTGGGAGCTAAGGTTGAGGATACAGCATTAGCAGGTGCTTTACAGATTAACTTA
GGTACATTTCAATCTGCTACAAGGCAGCGTGATACAAAATATTTTTGGCGAAAACAATGA
3D structure
| Source | ID | Structure |
|---|
Similar proteins
Only experimentally validated proteins are listed.
| Protein | Organism | Identities (%) | Coverage (%) | Ha-value |
|---|---|---|---|---|
| comA | Pseudomonas stutzeri DSM 10701 |
52.288 |
97.564 |
0.51 |
| comA | Ralstonia pseudosolanacearum GMI1000 |
33.046 |
100 |
0.363 |