化学信息学
化学信息学(Cheminformatics)是使用计算机和信息技术应用于化学领域的一系列问题。这些计算机(In silico)技术被用于在制药公司的药物发现过程中。这些方法也可以以各种其他形式用于化学和相关行业。
历史
术语化学信息学(Cheminformatics)是1998年被F.K. 布朗[1][2]定义的:
化学信息学是这些信息资源的混合,将数据转化为信息和信息转化为知识,以便在药物导向识别和优化领域更快地做出更好的决策。
从那时起,两种拼写已被使用,有些已经演变为化学信息学(Cheminformatics)[3],而欧洲学术研究会于2006年设立为化学信息学[4],最近成立的《化学信息学学报》(Journal of Cheminformatics)是对较短变体的强力推动。
基础
化学信息学将化学,计算机科学和信息科学的科学工作领域结合在化学空间中的拓扑,化学图论,信息检索和数据挖掘领域[5][6][7][8]。化学信息学也可以应用于各种行业,如纸张和纸浆,染料和相关行业的数据分析。
应用
存储和检索
化学信息学的主要应用是存储,索引和搜索与化合物有关的信息。这种存储信息的有效搜索包括计算机科学中作为数据挖掘,信息检索,信息抽取和机器学习的主题。相关研究课题包括:
- 非结构化数据
- 信息检索
- 信息抽取
- 结构化数据挖掘和挖掘结构化数据
- 数据库挖掘
- 图形挖掘
- 分子挖掘
- 序列模式挖掘
- 树挖掘
- 数字图书馆
文件格式
化学结构的计算机表示使用专门的格式,例如基于XML的化学标记语言或简化分子线性输入规范(SMILES)。 这些表征通常用于存储在大型化学数据库中。 虽然一些格式适用于2或3维的视觉表示,但其他格式更适合于研究物理相互作用,建模和对接研究。
虚拟图书馆
化学数据可以涉及真实或虚拟分子。可以以各种方式产生化合物的虚拟图书馆以探索化学空间,并假设具有所需性质的全新的化合物。
最近使用FOG(片段优化生长)算法生成化合物类(药物,天然产物,多样性合成产品)的虚拟文库[9] 。这是通过使用化学信息工具来训练马可夫链在真实化合物类别上的转变概率,然后使用马尔可夫链产生类似于训练数据库的全新化合物。
定量构效关系(QSAR)
这是定量结构-活性关系和定量结构性质关系值的计算,用于预测其结构中化合物的活性。在这种情况下,化学计量学也和它有很强的关系。化学专家系统也是相关的,因为它们代表化学知识的一部分,作为计算机(In silico)表示。有一个相对较新的匹配分子对分析或预测驱动的MMPA的概念,它与QSAR模型相结合,以便识别活动悬崖[10]。
参阅
参考资料
- ^ F.K. Brown. Chapter 35. Chemoinformatics: What is it and How does it Impact Drug Discovery. Annual Reports in Med. Chem. Annual Reports in Medicinal Chemistry. 1998, 33: 375. ISBN 978-0-12-040533-6. doi:10.1016/S0065-7743(08)61100-8.
- ^ Brown, Frank. Editorial Opinion: Chemoinformatics – a ten year update. Current Opinion in Drug Discovery & Development. 2005, 8 (3): 296–302.
- ^ Cheminformatics or Chemoinformatics ?. [2017-07-01]. (原始内容存档于2017-06-21).
- ^ Obernai Declaration (PDF). [2017-07-01]. (原始内容存档 (PDF)于2016-03-03).
- ^ Gasteiger J.(Editor), Engel T.(Editor): Chemoinformatics : A Textbook. John Wiley & Sons, 2004, ISBN 3-527-30681-1
- ^ A.R. Leach, V.J. Gillet: An Introduction to Chemoinformatics. Springer, 2003, ISBN 1-4020-1347-7
- ^ Alexandre Varnek and Igor Baskin. Chemoinformatics as a Theoretical Chemistry Discipline. Molecular Informatics. 2011, 30 (1): 20–32. doi:10.1002/minf.201000100.
- ^ Barry A. Bunin (Author), Brian Siesel (Author), Guillermo Morales (Author), Jürgen Bajorath (Author): Chemoinformatics: Theory, Practice, & Products. Springer, 2006, ISBN 978-1402050008
- ^ Kutchukian, Peter; Lou, David; Shakhnovich, Eugene. FOG: Fragment Optimized Growth Algorithm for the de Novo Generation of Molecules occupying Druglike Chemical. Journal of Chemical Information and Modeling. 2009, 49 (7): 1630–1642. PMID 19527020. doi:10.1021/ci9000458.
- ^ Sushko, Yurii; Novotarskyi, Sergii; Körner, Robert; Vogt, Joachim; Abdelaziz, Ahmed; Tetko, Igor V. Prediction-driven matched molecular pairs to interpret QSARs and aid the molecular optimization process. Journal of Cheminformatics: 48. 2014-12-11 [2017-07-01]. doi:10.1186/s13321-014-0048-0. (原始内容存档于2015-09-07) (英语).
外部链接
- (英文)印第安纳化学信息学教育门户网站
- (英文)化学信息学学报(Journal of Cheminformatics) (页面存档备份,存于互联网档案馆)
- (英文)OEChem化学信息学编程工具包 (页面存档备份,存于互联网档案馆)