机器学习是一门多领域交叉学科,涉及概率论、统计学、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能核心,是使计算机具有智能的根本途径。
最近,人们对于机器学习在生物加工和生物制造领域的应用引起了极大的兴趣,包括微藻(Teng et al., 2020, Wang et al., 2022)、细菌(Kumar et al., 2021)和酵母等微生物。机器学习通过预测构建微生物菌株的性能来筛选出最优排列组合,无需对生物系统中所有可能的组合进行实验验证。
比如Yikang Zhou等开发了一种与YeastFab组件相结合的人工神经集成网络,通过预测最佳启动子基因序列来优化紫色杆菌素的生产过程(Zhou et al.,2018)。Jervis等人报道了通过使用支持向量回归和前馈神经网络预测核糖体结合位点(RBS)的最佳序列来提高柠檬烯的产量(Jervis et al.,2019)。Tijana Radivojevic等开发出了一种专门用于提供菌株设计策略的工具,并通过混合机制模型的使用将色氨酸产量提高43%(Radivojević et al., 2020)。
Chang KeunKang等作者2023年在Bioresource Technology发表了一篇名为“Machine learning-guided prediction of potential engineering targets for microbial production of lycopene"的文章,通过对耐辐射球菌R1菌株进行了机器学习指导的菌株构建工作,以提高番茄红素的产量。
番茄红素是一种重要的次级代谢产物,具有抗氧化和抗癌作用。为了实现这一目标,首先从17株菌株中获得类胡萝卜素生物合成途径的关键基因的mRNA表达水平与番茄红素产量的相关性来训练多层感知器(MLP),然后使用MLP结合遗传算法(GA)从2047个可能的组合中预测潜在的过表达靶基因,最后通过启动子替换加强了预测基因的表达水平,获得工程菌株LY04。
在补料分批培养过程中,番茄红素的产量快速增加,最高可达1.25 g/L,与原始菌株相比较,产量增加了8倍,产率增加了6倍。这项研究成果还证明了将MLP与GA相结合的方法具有很大的应用潜力。
https://www.sciencedirect.com/science/article/abs/pii/S0734975020301336
https://www.sciencedirect.com/science/article/abs/pii/S0734975021001257
https://www.sciencedirect.com/science/article/abs/pii/S1096717618300144
https://www.sciencedirect.com/science/article/abs/pii/S0960852422017886#preview-section-references
作者:随风