mzML

aus Wikipedia, der freien Enzyklopädie
mzML
Dateiendung: .mzML
Entwickelt von: Proteomics Standards Initiative
Aktuelle Version: 1.1.0 (Stand: 1. Juni 2009)
Erweitert von: mzXML, mzData[1]


mzML ist ein XML basiertes Dateiformat in der Proteomik, das die Vorgänger mzXML und mzData konsolidiert. Es dient als herstellerunabhängiges Austausch- und Archivierungsformat für massenspektrometrische Daten. Das XML Schema ist strikt festgelegt, aber es existiert ein erweiterbares kontrolliertes Vokabular, das den technischen Fortschritt in dem Gebiet abbilden soll. Die Projektgruppe stellt eine Referenzimplementierung und Validatoren zur Verfügung. Mit der Trans-Proteomic Pipeline ist eine weitergehende Datenanalyse möglich.[2] Der vollständige Lauf mitsamt allen Metadaten ist im Dateiformat enthalten. Das Format erlaubt den wahlfreien Zugriff: ein Programm muss die Datei nicht erst vollständig einlesen, um ein Massenspektrum aufzurufen. Es wird von ProteoWizard und OpenMS unterstützt. Zudem ist es im NCBI C++ Toolkit enthalten und durch jmzML in Java implementiert. Die Suchmaschinen X!Tandem und Myrimatch zählen zu den Unterstützern der ersten Stunde.[3] ChemClipse und das darauf aufbauende OpenChrom unterstützen mzML ebenfalls.[4] Nachteilig ist die 4–18 × höhere Dateigröße im Vergleich zu binären Herstellerformaten, was in durch Festplattenzugriff limitierten Szenarien zu längeren Verarbeitungszeiten führen kann.[5]

Weblinks

Einzelnachweise

  1. Eric W. Deutsch: Mass Spectrometer Output File Format mzML. In: Methods in molecular biology (Clifton, N.J.). Band 604, 2010, ISSN 1064-3745, S. 319–331, doi:10.1007/978-1-60761-444-9_22, PMID 20013381, PMC 3073315 (freier Volltext).
  2. Eric Deutsch: mzML: A single, unifying data format for mass spectrometer output. In: PROTEOMICS. Band 8, Nr. 14, 2008, ISSN 1615-9861, S. 2776–2777, doi:10.1002/pmic.200890049.
  3. Lennart Martens, Matthew Chambers, Marc Sturm, Darren Kessner, Fredrik Levander, Jim Shofstahl, Wilfred H. Tang, Andreas Römpp, Steffen Neumann, Angel D. Pizarro, Luisa Montecchi-Palazzi, Natalie Tasman, Mike Coleman, Florian Reisinger, Puneet Souda, Henning Hermjakob, Pierre-Alain Binz, Eric W. Deutsch: mzML—a Community Standard for Mass Spectrometry Data *. In: Molecular & Cellular Proteomics. Band 10, Nr. 1, 2011, ISSN 1535-9476, doi:10.1074/mcp.R110.000133, PMID 20716697.
  4. ChemClipse mzML converter plugin. In: GitHub. Eclipse Foundation, abgerufen am 8. März 2021 (englisch).
  5. Johan Teleman, Andrew W. Dowsey, Faviel F. Gonzalez-Galarza, Simon Perkins, Brian Pratt, Hannes L. Röst, Lars Malmström, Johan Malmström, Andrew R. Jones, Eric W. Deutsch, Fredrik Levander: Numerical Compression Schemes for Proteomics Mass Spectrometry Data. In: Molecular & Cellular Proteomics : MCP. Band 13, Nr. 6, 2014, ISSN 1535-9476, S. 1537–1542, doi:10.1074/mcp.O114.037879, PMID 24677029, PMC 4047472 (freier Volltext).