J 2021

SoluProt: prediction of soluble protein expression in Escherichia coli

HON, Jiří; Martin MARUSIAK; Tomas MARTINEK; Antonín KUNKA; Jaroslav ZENDULKA et. al.

Základní údaje

Originální název

SoluProt: prediction of soluble protein expression in Escherichia coli

Autoři

HON, Jiří (203 Česká republika, domácí); Martin MARUSIAK (203 Česká republika); Tomas MARTINEK (203 Česká republika); Antonín KUNKA (203 Česká republika, domácí); Jaroslav ZENDULKA (203 Česká republika); David BEDNÁŘ (203 Česká republika, domácí) a Jiří DAMBORSKÝ (203 Česká republika, garant, domácí)

Vydání

Bioinformatics, Oxford (UK), Oxford University Press, 2021, 1367-4803

Další údaje

Jazyk

angličtina

Typ výsledku

Článek v odborném periodiku

Stát vydavatele

Velká Británie a Severní Irsko

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Kód RIV

RIV/00216224:14310/21:00119188

Organizace

Přírodovědecká fakulta – Masarykova univerzita – Repozitář

UT WoS

000649437800004

EID Scopus

2-s2.0-85100389869

Klíčová slova anglicky

SOLUBILITY; WEBSERVER; TOPOLOGY; ACCURATE

Návaznosti

EF17_043/0009632, projekt VaV. GJ20-15915Y, projekt VaV. LM2018131, projekt VaV. LM2018140, projekt VaV. 814418, interní kód Repo. 857560, interní kód Repo.
Změněno: 16. 2. 2024 04:08, RNDr. Daniel Jakubík

Anotace

V originále

Motivation: Poor protein solubility hinders the production of many therapeutic and industrially useful proteins. Experimental efforts to increase solubility are plagued by low success rates and often reduce biological activity. Computational prediction of protein expressibility and solubility in Escherichia coli using only sequence information could reduce the cost of experimental studies by enabling prioritization of highly soluble proteins. Results: A new tool for sequence-based prediction of soluble protein expression in E.coli, SoluProt, was created using the gradient boosting machine technique with the TargetTrack database as a training set. When evaluated against a balanced independent test set derived from the NESG database, SoluProt's accuracy of 58.5% and AUC of 0.62 exceeded those of a suite of alternative solubility prediction tools. There is also evidence that it could significantly increase the success rate of experimental protein studies.

Přiložené soubory