Vorlage Diskussion:Infobox Protein

aus Wikipedia, der freien Enzyklopädie

Orthologe in Protein Infobox

Da bisher dort keine Antwort kam, versuche ich es mal hier. In der en:WP wird seit ein paar Wochen eine stark erweiterte Infobox verwendet, z.B. hier en:KiSS1-derived peptide receptor, den ich gerade übersetzen will (Benutzer:Drahkrub/Spielwiese), oder noch umfangreicher in diesem Artikel en:Kisspeptin. Für mich stellt sich die Frage wie ich mit den Orthologen verfahren soll. Natürlich kann ich die Maus einfach rausschmeissen, aber das wäre schade. Ich würde vermuten, dass ich nicht der einzige Benutzer bin, dem sich diese Frage stellt. Evtl. ist ja eine neue Version der Infobox in Planung? -- Burkhard 10:57, 3. Jan. 2008 (CET)

Du könntest zunächst erstmal zwei Infoboxen verwenden. Gruß, --Hoffmeier 13:55, 3. Jan. 2008 (CET)
Daran habe ich auch schon gedacht. Sähe aber eher bescheiden aus und löst das grundsätzliche Problem auch nicht. --Burkhard 14:27, 3. Jan. 2008 (CET)

Symbol

Im Gegensatz zur englischen Wikipedia scheint in der deutschen Wikipedia der Link Symbol nicht mehr zu funktionieren. --Hdumann 12:37, 22. Feb. 2008 (CET)

Geht auch in en:WP gerade nicht mehr. Grund ist wohl ein fehlender Eintrag für die Domain gene.ucl.ak.uk. Wer weiss mehr? --Burkhard 19:40, 22. Feb. 2008 (CET)
en:WP benutzt jetzt offensichtlich http://www.genenames.org --Burkhard 23:16, 25. Feb. 2008 (CET)
O.k. - hab mich getraut und den Link gefixt. --Burkhard 23:26, 25. Feb. 2008 (CET)

Neugestaltung der Infobox Protein

Nach Diskussion in der QS-Chemie habe ich die aktuelle Version der englischen Vorlage:Protein übersetzt, etwas angepasst und zunächst hier zur weiteren Bearbeitung abgelegt. Die Vorlage wird testweise hier und im Artikel Dynamine eingebunden. Mir gefällt die Vorlage allerdings bislang nicht besonders, da sie überwiegend aus Datenbanklinks besteht. Ich bitte euch daher um Mitarbeit bei der Neugestaltung einer Infobox für Proteine.

Um einen Anfang zu machen möchte ich folgende neue Parameter vorschlagen:

  • Größe (123 AS, 1234 kDa)
  • Struktur (heterotetramer, α2βγ)
  • Kofaktoren/prostethische Gruppen
  • Isoformen
  • Vorkommen (Spezies)
  • Vorkommen (Gewebe)
  • Funktion

Mit der Bitte um Kommentare. --NEUROtiker 22:34, 8. Mär. 2008 (CET)

Erstmal ist die Farbe (zumindest auf meinem Rechner) super-scheußlich. Kann es nicht etwas neutraler sein, wie zum Beispiel bei der Vorlage:Infobox Enzym?
Im angegebenen Beispiel Dynamine ist die Box zumindest im Augenblick keine "Infobox" sondern eine "Verwirrobox". Der Leser, der die jeweilige Datenbank nicht vorher schon kennt, weiß nicht wohin ihn der link auch nur ungefähr führen wird. Wäre es zu OmA-freundlich, statt "OMIM" zu schreiben: "Gendatenbank OMIM"? Da gefallen mir die Vorschläge von Neurotiker schon besser, weil sie mir sagen, was sie mir da eigentlich sagen.
Herzliche Grüße, --Drahreg·01RM 06:30, 9. Mär. 2008 (CET)
Zwei Gedanken zum Thema
  • Viele, wenn nicht die meisten Protein-Artikel werden in irgendeiner Form die Angaben aus en:WP übernehmen - falls wir uns zu weit von der en-Vorlage entfernen wird dadurch das Übersetzen nicht leichter.
  • "Gendatenbank OMIM" hinzuschreiben mach die Box nur (unnötig?) breiter. Man kann das vielleicht auch summarisch im Kopf der Box erledigen evtl. mit einem Trennstrich zwischen Gen- und Proteindatenbanken. Schön fände ich einen Link auf eine Übersichtsseite, auf der die benutzten Datenbanken nochmal im Überblick kurz erwähnt werden - und man dort auch erfährt, was sie voneinander abhebt. Einzelne Wikilinks auf die meisten gibt es ja schon.
BTW, die Farbe ist tatsächlich zu grell. --Burkhard 10:54, 9. Mär. 2008 (CET)
Die Farbe war erstmal nur ein Platzhalter, da die Infobox nun im ANR eingebunden ist habe ich sie durch eine dezentere ausgetauscht (die man aber gerne noch ändern kann). Die Idee, die Datenbanken nach Gen- und Proteindatenbanken zu ordnen, gefällt mir. Sowieso würde ich die Datenbanken ganz nach unten in die Vorlage packen. --NEUROtiker 23:20, 9. Mär. 2008 (CET)
Mein erste Gedanke war, in welchem Organismus kommt das Protein vor? Da ich mit und über verschiedene Systeme gearbeitet (human, murin, S. cerevisiae, E.coli) habe. Ich halte den Parameter Vorkommen für einen sehr wesentlichen. Ein weiteres: Wie sieht es mit einem Verweis zu RasMol-Daten aus? Dies zum ersten Eindruck, näheres demnächst.--Ilgom 23:43, 9. Mär. 2008 (CET)
Da es mE unrealistisch ist zu Proteinen generell artspezifische Artikel zu erstellen (Serumalbumin (Mensch), Serumalbumin (Rind) etc.) müsste man sich entscheiden entweder einen Vertreter für die Box auszuwählen, oder mehrere Arten von Interesse auszuwählen und die entsprechenden Daten in die Box zu packen. EN hat sich für letzteres entschieden und ich tendiere auch dazu die Situation von bis zu drei Organismen in der Box darzustellen. Mehr würde mE zu schnell unübersichtlich werden. Wenn es zu den RasMol-Daten (das sind Strukturen, oder?) eine geeignete Datenbank gibt, sehe ich kein Problem, einen entsprechenden Link einzubauen. Ich habe mich damit bislang nicht auseinandergesetzt, schlage am besten ein konkretes Beispiel vor. --NEUROtiker 00:02, 10. Mär. 2008 (CET)
  • RasMol ist das Programm, mit dem man die PDB-Daten grafisch darstellt. => RasMol hinfällig, da PDB-Link vorhanden.
  • Zu der Einteilung (Art, Spezies): volle Zustimmung hinsichtlich der Problematik der artspezifischen Artikel zu Proteinen. Den konkreten Organismus abzuhandeln ist das Extrem. Den Parameter Vorkommen halte ich aber insofern für wichtig, als dass er eine schnelle Orientierung ermöglicht, wo dieses Protein zu finden ist. Kernporen-Proteine z.B. nicht in Bakterien, Photosynthese-Proteine nicht in Mammalia. Organismus ist hier vielleicht das falsche Wort, die Frage welches das richtige ist richte ich mal an die Biologen.--Ilgom 00:07, 11. Mär. 2008 (CET)
Klade oder Taxon, glaube ich. --Ayacop 21:57, 30. Aug. 2008 (CEST)
Ein Problem, das ich sehe, ist die Angabe des Genlocus: Für welchen Organismus soll das gelten? Es gibt schließlich genug Gene, die bei unterschliedlichen Taxa nicht nur auf unterschiedlichen Chromosomen, sondern sogar in unterschliedlichen Genomen (Kern vs. Chloroplast oder Mt) vorkommen. Beispiel Dynamin: da steht Chromosom 8, im Text dann die in der eukaryotischen Zelle. Es gibt aber genügend Eukaryoten, die gar keine acht Chromosomen haben. Was nu? Solch spezifischen Angaben sollten nicht in einer Box angegeben werden. In meinen Augen ist die Box eher was für die Weblinks.... Griensteidl 19:00, 10. Mär. 2008 (CET)
Ja ich stimme total zu. Es ist im Moment noch sehr sehr anthropozentrisch, für alle Proteine erstmal den Locus auf dem Humanen Genom anzugeben (falls überhaupt vorhanden). Für nicht-humane Proteine klappt das demnach auch schonmal gar nicht. --Lode (bla) 16:05, 18. Jun. 2008 (CEST)

Es wurde vorgeschlagen, eine (optionale) Zeile für den ATC-Code (einzufügen mittels Vorlage:ATC) zu ergänzen, da es für etliche Proteine einen eindeutigen ATC-Code gibt. Potentiell betroffen sind (momentan) 104 Artikel. Meinungen dazu? --Leyo 18:36, 19. Aug. 2008 (CEST)

Nachdem ich ein Dutzend Infoboxen unterhalb Kategorie:Peptidhormon ausgefüllt (und jetzt erst die Disk bemerkt) habe, kann ich vielleicht was dazu beitragen. --Ayacop 09:19, 31. Aug. 2008 (CEST)

  1. die Namensdatenbank HGNC (auf die die Abkürzung zeigt), enthält gleich auf der ersten Seite des Eintrags Links auf RefSeq (Nukleotidsequenz), OMIM, EntrezGene, Ensembl, Swiss/UniProt Einträge zum selben Protein. Ich bin daher der Ansicht, dass eine nochmalige Angabe mancher dieser Links redundant ist. Oder stellen wir diese Links nach ganz unten in der Box.
  2. Das gilt nicht für den OMIM-Link, den ich für so wichtig halte, dass er prominent in der Infobox erscheinen soll. Den würde ich auch anders bezeichnen als mit der Nummer des Eintrags, oder statt 'OMIM' würde ich 'OMIM-Zusammenfassung' oder sowas schreiben.
  3. der PDB Slot kann nur einen Eintrag aufnehmen. Das ist vielleicht gut so, da ja laufend Kristalldaten hinzukommen und die WP da keinen Anspruch auf Vollständigkeit erheben will, das ist Sache der Datenbanken. Ein Link auf repräsentative Strukturdaten (wenn vorhanden) sollte aber sein, da eine vollständige Liste z.B. bei Ensembl relativ versteckt erst weiter unten zu sehen ist. Außerdem sollte die Vorlage den Code nach Großbuchstaben wandeln.
  4. NEUROs kleine Liste (Größe, Struktur etc.) stimme ich voll zu
  5. viele Peptide z.B. werden aus einem Precursor gespleißt und wir haben sowohl die Precursorproteine als auch die Endprodukte. Also braucht es zwei weitere optionale Einträge, für erstere die Endprodukte, für letztere den Precursor
  6. Tax. Vorkommen halte ich zwar für wichtig, das ist aber oft nicht mit einem Link auf ein Taxon getan, da viele Gene in manchen Spezies verschwinden bzw. abgeschaltet werden, wodurch ständig Ausnahmen zu beachten sind. Exakt wäre ein Slot für das übergeordnete Taxon, und eine Liste für die Ausnahmen.
  7. Taxonomische Angaben heißen in den Datenbanken 'Taxonomy Level' (Ensembl), 'Taxonomy' (UniProt), 'Expression System' (PDB). Ist etwas gegen 'Taxon' einzuwenden?
  8. Beachten: Tax. Vorkommen ist etwas anderes als die Spezies, auf die sich das konkrete Protein bezieht. Der Slot sollte als Default Homo sapiens enthalten, auch wenn dies optische Wiederholung verursacht. Die Spezies ist einfach zu wichtig und die meisten Lemmata sind nun mal humane Proteine.
  9. Genlokus: ich mußte feststellen, dass Angaben, die Bereiche betreffen (z.B. 17p21.3-p21.1) dazu führen, dass der Eintrag in der OMIM Genlokusdatenbank nicht genau angesprungen wird, da offenbar simple Textsuche gemacht wird. Man muss dann hoch oder runter brausen, und das ist unnötig, wie man auf der Zusammenfassungsseite von OMIM sieht, da der Link dort immer zu einer Seite führt, die den Lokus ganz oben hat. Wir brauchen also ein zweites Feld, um einen solchen exakten Link konstruieren zu können.
  10. Alternativ könnte man es so machen wie en-WP: den exakten Ort in Megabasen angeben und auf den UCSC Genome Browser linken. Halte ich aber für wenig aussagekräftig. Und Oma bekommt so wenigstens mal sekundenlang mit, was alles auf einem Chromosom stehen kann (mich hat die Lokustabelle schon immer fasziniert und bin sicher nicht der einzige). Also nicht so wie en-WP.
  11. All diese Angaben/Felder, bis auf Vorkommen/Ausnahmen beziehen sich immer auf ein konkretes Protein einer konkreten Spezies. Ich bin daher nicht der Ansicht, dass in die Box noch eine zweite Spezies reingequetscht werden soll, wie en-WP das mit der Maus macht. Warum überhaupt Maus? So aussagekräftig ist das eh nicht, sonst bräuchten wir keine klinischen Studien. Wenn unbedingt mehrere Proteine abgehandelt werden sollen dann muss eben für jedes eine eigene Box her. Alle Felder, bis auf Vorkommen/Ausnahmen, können und werden dann ohnehin anderen Inhalt haben -- ich frage mich, wie die en-WP das machen will, wenn das Mausprotein eine andere Abkürzung, andere Funktionen hat?
  12. Zustimmung zum optionalen ATC-Code für Arzneistoffe.
  13. Bitte insgesamt möglichst klein halten.
Es wäre schön, wenn Du die Diskussion unten fortgesetzt hättest - wegen der Übersichtlichkeit.
  • Du beginnst mit dem Hinweis (1), dass HGNC bereits alle Links enthält, diese beziehen sich aber, in den Fällen in denen ich den Links gefolgt bin, nur auf Homo Sapiens. Insofern ist die Angabe dieser Links weiter unten notwendig, sobald Orthologe ins Spiel kommen.
  • (11) en:WP hat nicht fest Mouse als Ortholog in der Box, ich habe auch schon Bovine gesehen - und GFP dürfte beim Menschen wohl nicht vorkommen. Die GNF Protein Box ist generisch genug aufgebaut, um beliebige Orthologe in beliebiger Zahl unterzubringen (ab einer Breite von 4 Spezies dürfte es wohl Schwierigkeiten mit der Darstellung geben). Insofern wäre eine Beschränkung der Datenbankangaben auf den Menschen unklug. Und augenscheinlich ist die Maus eine sehr häufige Quelle von Daten - in der englischen WP finde ich in fast jedem Proteinartikel Angaben dazu. --Burkhard 11:03, 31. Aug. 2008 (CEST)
Dass in derselben Box Funktionen angegeben sind, die wahrscheinlich (?) nur am Menschen ermittelt wurden, und andererseits Proteindaten zu allen möglichen anderen Spezies gelistet werden, halte ich für problematisch. Oder man macht es so, dass Funktionen und Proteindatenbanklinks sichtbar getrennt werden, dann hätten wir also wieder eine getrennte Box für alle anderen Spezies. Anders sind Fehlinterpretationen unvermeidlich, wie bereits am Ende von Punkt 11 angedeutet.
Ich kann Dir nicht folgen, wie wäre es mit konkreten Beispielen? Welche Funktionen z.B. sind nur am Menschen ermittelt worden, bei denen Proteinlinks zu "allen möglichen anderen" Spezies gelistet werden? --Burkhard 14:07, 7. Sep. 2008 (CEST)
Da nun daraus folgt, dass eine Trennung ohnehin sinnvoll ist, kann ein Großteil der Datenbanklinks in der dann humanspezifischen Infobox weggelassen werden, da der HUGO-Link diese enthält.
Auch hier kann ich die Conclusio nicht nachvollziehen. Der größte Teil der beschriebenen Proteine dürfte in vielen Organismen vergleichbare oder zumindest verwandte Funktionen haben, warum muss da getrennt werden? --Burkhard 14:07, 7. Sep. 2008 (CEST)
Also gut, ist ja nur ein Ausnahmefall. Nennen wir also mehrere Spezies. Ich kann nur hoffen, es kommt niemand auf die Idee, mit mehr als zwei nebeneinander die Box über Gebühr zu verbreitern. --Ayacop 16:27, 7. Sep. 2008 (CEST)
Ein weiteres Beispiel, dass die GNF box nicht blind übernommen werden sollte, ist die Vorlage Pfam_box, die statt auf pdb.org auf die PDBsum Datenbank zeigt, die ein paar Features mehr hat. Ist Geschmackssache, es sollte aber hier darüber entschieden werden, welche der zwei Sites verlinkt werden, da ich zumindest keine Crosslinks zwischen den beiden Sites feststellen kann. --Ayacop 12:01, 2. Sep. 2008 (CEST)

Vorlage GNF protein box

Von meiner Diskussionsseite hierher kopiert:

Hallo Leyo, bei der Diskussion damals blieben einige Fragen offen: z.B. der Umgang mit Orthologen und die ausschliessliche Verlinkung auf das menschliche Chromosom. In der WP:en wurden gleich eine Reihe von Problemen durch Einführung einer Vorlage Vorlage GNF protein box gelöst, die als eine Art Infobox-Wrapper dient. Vielleicht wäre es sinnvoll, sich zunächst mal anzuschauen, was von dem dortigen Modell sinnvoll übernommen werden kann - auch im Hinblick darauf, dass viele Protein-Artikel durch Übersetzungen aus en entstehen. Was meinst Du? --Burkhard 09:56, 24. Aug. 2008 (CEST)
Ich fände es am sinnvollsten, die Diskussion auf der Vorlagendiskussionsseite fortzusetzen (inkl. deiner obigen Anmerkung) und somit einer breiteren Benutzerzahl „zugänglich“ zu machen. Die engl. Version schaue ich mir demnächst noch genauer an. --Leyo 23:12, 24. Aug. 2008 (CEST)

Neue Bearbeitung der GNF Protein

Die neue Bearbeitung ist hier und benutzt wird sie von hier. Es handelt sich um die GNF aus en-WP ohne die Expressionsdaten und, soweit ich das überblicke, mit allem, was diskutiert wurde. Bitte Wünsche äußern. Die Daten sind teilweise Fantasie, um alle Felder zu zeigen, was aber selten der Fall sein wird. Wenn ein weiteres Orthologes dazukäme, würde ich raten, unten statt seitlich weiterzumachen. --Ayacop 18:59, 9. Sep. 2008 (CEST)

Ich habe mir erlaubt, einige IMHO unnötige Dinge aus dem Quelltext zu entfernen. --Leyo 19:10, 9. Sep. 2008 (CEST)
Vielen Dank. Ich kenne mich da noch nicht aus und habe einfach was zusammenkopiert. Die Ortholog Box muss auch noch übersetzt werden. --Ayacop 09:54, 10. Sep. 2008 (CEST)
Mir fiel gerade ein, es dürfte das Beste sein, eine Unterbox 'Arzneistoffangaben' nur dann anzuzeigen, wenn einer der Einträge ATC, Drugbank, Wirkstoffklasse, Fertigpräparate vorkommt. --Ayacop 10:18, 10. Sep. 2008 (CEST)
Ditto für die Enzym-Unterbox, die nur erscheint, wenn eine EC-Nummer angegeben wird. Nachdem die Ortholog-Box nun übersetzt ist, mache ich mich mal an die Dokumentation. --Ayacop 17:22, 10. Sep. 2008 (CEST)
Erstmal ganz vielen Dank für Deine Arbeit. Ich habe für Kisspeptin in meinem BNR schnell mal eine eine Baustelle angelegt. Ein paar Kleinigkeiten sind mir dabei aufgefallen:
  • Abschnitt Bezeichner - Querstriche gehen nicht durch die Spalten.
  • Abschnitt Bezeichner/Externe IDs - Platz wird nicht ausgefüllt.
  • Abschnitt Bezeichner/Externe IDs - Ich vermisse den HomoloGene-Link?
  • Abschnitt Orthologe/UniProt - Link UniProt erscheint sowohl in der linken Leiste als auch in den Spalten selbst. Vorschlag, Link nur links in der Leiste.
  • Abschnitt Orthologe/RefSeq - Erläuterungen (mRNA,Protein) erscheinen in den Spalten der Orthologe, wären vielleicht besser in der linken Leiste untergebracht?
  • Abschnitt Orthologe - Genlocus könnte vielleicht verlinkt werden?
Im Gesamtbild wirkt die Box noch ein wenig flatterig, insgesamt finde ich sie aber recht übersichtlich. Leider bin ich in nächster Zeit meist offline, so dass ich nur wenig testen kann. Gruß, --Burkhard 23:15, 11. Sep. 2008 (CEST)
Dank fürs Feedback. Alle Punkte sind akzeptiert. Hinzu kommt, wie ich gerade sehe, betreffend automatisch gesetzter Kategorien, dass die Genkategorie noch übersetzt werden muss, und bei fehlendem Bild keine entsprechende (welche?) gesetzt wird. --Ayacop 09:19, 12. Sep. 2008 (CEST)
Hallo! Habe z.Z. wenig Zeit. Auf deine Bitte hin habe ich mal einen rasche Blick drauf geworfen. Sieht so erst mal gut aus. Bei den Handelsnamen bewirkt das Zentrieren eine gewisse Unruhe. Was natürlich von der Namenslänge abhängt; Linksbündigkeit fänd ich passender. Bei den anderen Einträgen ist das aber okay. Ein kleiner bug ist noch in der Orthologe-Unterbox: Hier ist in der Zeile 'Refseq', Spalte 'Mensch' nicht "(mRNA)" angezeigt. Wobei Refseq nicht ganz korrekt ist, da auch hier wie unter Entrez zum NCBI verlinkt wird...
Zu deinem Vorschlag die Enzym-Unterbox von der EC-Nr. abhängig zu machen: Was macht user OmA, der herausgefunden hat, dass es sich um eine Hydrolase handelt respektive XY als Substrat umsetzt, aber nicht wie er an die EC-Nr. kommt? Grüße -- Ilgom 01:09, 13. Sep. 2008 (CEST)

die Enzymklassifikation würde ich auf jeden Fall über die Arzneistoffangaben setzen, Arzneistoffangaben gibts ohnehin ja nur für sehr wenige Proteine, oder? In den anderen wird dieser Bereich dann hoffentlich ausgeblendet? Noch weiter nach oben sollte die Ontologie. Ich finde die Infobox außerdem ganz schön überfrachtet. Die Angaben zum Biologischen Prozess gehören in den Text, manche Proteine sind an so ziemlich allem beteiligt, und das alles in der Box unterbringen zu wollen ist nicht sinnvoll. -- Nina 08:51, 13. Sep. 2008 (CEST)

Das Ontologiegeschwurbel ist ohnehin der Teil, der IMHO am meisten Arbeit macht (Übersetzung!) und daher am seltensten ausgefüllt werden wird. Anstelle dessen müssten dann aber die Zellkomponente/expr. Gewebe oben einen oder zwei Einträge erhalten.
Gerade da Arzneiangaben so selten sind, sollten sie sofort sichtbar sein, da die Seite dann viel häufiger von O.Ma. besucht wird. Die Unterbox ist völlig optional, verschwindet also wenn kein ATC existiert.
@Ilgom: Gut, die Enzymunterbox soll also bei Eintrag eines ihrer Felder erscheinen. Die anderen Punkte sind auch akzeptiert.
Nochmal zur Erinnerung: Burkhard hat ein zweites Beispiel ohne Arznei- und Enzymbox erstellt, das geht also (bis auf das Problem, dass dann eine Leerzeile bei 'Externe IDs' erscheint). --Ayacop 09:15, 13. Sep. 2008 (CEST)
So, die Orthologe-Unterbox habe ich jetzt generalisiert (beliebige Spezies können angegeben werden), dokumentiert und als Vorlage:Protein Orthologe in den Vorlagen-Namensraum verschoben. Die Beispiele wurden entsprechend angepasst. --Ayacop 18:17, 13. Sep. 2008 (CEST)

Wenn niemand was dagegen hat, werde ich dann den Inhalt der Infobox Protein durch meine Version ersetzen. Die Artikel mit Infobox zeigen dann eine Minibox mit ein paar Einträgen und ohne Bild, und sind daher dann alle in der Kategorie:Wikipedia:Proteinbild nicht vorhanden versammelt. --Ayacop 18:45, 13. Sep. 2008 (CEST)

Das ist nun gemacht. Der erste Artikel mit der neuen Infobox: Ghrelin. --Ayacop 11:31, 15. Sep. 2008 (CEST)
Der ist nicht mehr einsam: Kisspeptin und KiSS1R sind jetzt auch dabei. Gruß, --Burkhard 22:43, 15. Sep. 2008 (CEST)
Da nur die neuen Infobox-Artikel die Ortholog-Vorlage einbinden, enthält die Liste der Links auf die Ortholog-Vorlage alle mit der neuen Box erstellten Artikel, jetzt acht. --Ayacop 09:48, 16. Sep. 2008 (CEST)

Genial wäre jetzt noch eine automatisierte Übersetzung aus dem Englischen bei Importen. Ein entsprechendes Perl- oder PHP-Skript ist sicher schnell zusammengehackt - aber wie könnte man das bei WP einbinden? --Burkhard 21:50, 16. Sep. 2008 (CEST)

Das wäre mit einem Bot machbar, und dann in Python. Aber auch ohne WP-Einbindung sicher praktisch mit Cut&Paste. Das Skript könnte weitere Datenbankabfragen machen. --Ayacop 08:39, 17. Sep. 2008 (CEST)

Eine Frage: warum ist die CAS-Nummer bei den Arzneistoffangaben? Es ist doch gar keine. Würde sie weiter nach oben stellen. Außerdem sollte die Bezeichnung IMO wie in der Chemobox CAS-Nummer und nicht nur CAS lauten. Viele Grüße --Orci Disk 00:14, 17. Sep. 2008 (CEST)

Stimmt eigentlich. Die häufigste kommerzielle Nutzung von Proteinen ist zwar Pharma, aber nicht die einzige. Ich ändere das gleich. --Ayacop 08:39, 17. Sep. 2008 (CEST)

PDB: Wie ist es gedacht, wenn ich Reihe von vielen Strukturdaten wie bei Titin habe? Wenn ich die PDB Codes nur (durch Komma getrennt) aufliste, werden sie nicht verlinkt, wenn ich Vorlage PDB 1xyz verwende, habe ich vor jedem verlinkten Code nocheinmal den Link auf die Protein Data Bank? Beides ist unschön. --Burkhard 00:15, 20. Sep. 2008 (CEST)

Ich habe nun die Vorlage PDB2 aus en-WP für diesen Zweck kopiert. --Ayacop 08:46, 20. Sep. 2008 (CEST)

ich finde

die grüne Farbe der Proteinbox doof. Ansonsten is sie ganz praktisch, vor allem weil man jetzt verschiedene Spezies nebeneinander eintragen kann. Ich hab auf die Schnelle nur Probleme mit der chromosomalen Lokalisation. Vielleicht krieg ich es ja raus. Gute Arbeit! Gruß -- Andreas Werle 23:24, 17. Sep. 2008 (CEST)

Ich hab mal unter Genlocus den UCSC Browser verlinkt. Mach doch mal nen Beispiel, was die Farbe angeht. --Ayacop 08:35, 18. Sep. 2008 (CEST)
Ich fand die Farbe zuerst auch doof, sehe inzwischen aber, dass durch das eher dezente Grün die Lesbarkeit, sowohl der Box als auch des Artikels, durchaus unterstützt wird. Ich bin für behalten. --Burkhard 22:00, 18. Sep. 2008 (CEST)
Das Problem sind zwei verschiedene Grüntöne, die beißen sich. Zumindest sieht das auf meinem TV so aus. Ich finde die grau-grün-Kombination auf en angenehmer. lg -- Andreas Werle 21:27, 19. Sep. 2008 (CEST)

Bitte beachten

Unter diesem Betreff möchte ich Punkte betreffend der neuen Box ansprechen, die beim Ausfüllen zu beachten sind, bevor ich das (zusätzlich) in die Dokumentation schreibe. Ein Grund ist auch, dass Dokumentation selten gelesen wird ;)

Neben der PDB2-Vorlage, die jetzt für Einträge im Feld PDB zur Verfügung steht, ist auch das Feld 'Taxon' problematisch, wie ich gerade bemerkt habe: die Site HomoloGene spuckt auch dann 'Eukaryotes' aus, wenn ein Gen bei Bakterien oder Archaeen vorkommt, da diese offensichtlich nicht in der Datenbank enthalten sind! Man sollte also in diesem Fall in UniProt suchen, ob es auch Kopien bei den Prokaryoten gibt, wenn man es nicht genau selber weiß. --Ayacop 09:00, 20. Sep. 2008 (CEST)

Ich bin Deinem Hinweis gerade für UCP1 gefolgt: HomoloGene sagt Eutheria, eine Suche bei UniProt gibt neben Säugetieren noch Karpfen, Forelle und Chlamydomonas reinhardtii als Nicht-Säuger an! D.h. HomoloGene ist überhaupt kein Verlass, wäre überlegen, ob man HG nicht ganz rausschmeisst und durch eine geeignetere Suche ersetzet? (Aber welche? Das Ergebnis bei Uniprot hängt vom verwendeten Symbol ab, nehme ich für die Suche Thermogenin statt UCP1, dann fällt z.B. Chlamydomonas raus.) --Burkhard 13:07, 20. Sep. 2008 (CEST)
Es gibt noch HOGENOM/HOVERGEN (von UniProt aus zB), die die betreffende Proteinfamilie in den Spezies sucht, einen Baum aufspannt und auch das übergeordnete Taxon nennt (unter Family, wo auch die Arten gelistet sind). Ist eh fraglich, wo Identität aufhört und Zugehörigkeit zu einer Familie anfängt. Wenn wir das nehmen, müßten wir die Familie auch nennen, oder einen Link auf die Seite basteln. HomoloGene macht offensichtlich nur eine Textsuche, nicht nach Sequenz.
Ich schlage also vor, statt HomoloGene die HOGENOM-Familie einzutragen und den Link auf die Family-Seite zu legen. Und für den Taxon-Eintrag den Eintrag zu nehmen, der dort steht. --Ayacop 16:50, 20. Sep. 2008 (CEST)
Die Startseite für HOGENOM ist http://pbil.univ-lyon1.fr/databases/hogenom.php . --Ayacop 16:56, 20. Sep. 2008 (CEST)
Argl, das funktioniert nicht wie gedacht. Um einen Link auf die Family-Seite zu bauen, braucht es sowohl die Family-Nummer ('HBG123456') als auch den Datenbanknamen (HOGENOM/HOVERGEN). Hoffentlich bin ich dann nicht der einzige, der diese Angaben macht, denn ich finde den Output von der Datenbank hochinteressant. Vielleicht sollte man den Eintrag 'Homologiefamilie' nennen und unter Orthologe über das Taxon stellen?
Der Unterschied zwischen HOVERGEN und HOGENOM ist übrigens, dass sich HOVERGEN auf Verte-braten beschränkt. --Ayacop 17:45, 20. Sep. 2008 (CEST)
Nach fünf Einträgen mit dem neuen Schema...: HOVERGEN/HOGENOME mag generell besser sein, im Fall von GIP hat HomoloGene die Nase vorn: 6 Treffer incl. Canis gegenüber nur Mensch und Nager. Was nun? --Ayacop 18:37, 20. Sep. 2008 (CEST)
Wäre es möglich je nach Datenlage nur die jeweils bessere einzutragen? (Also beide zulassen). Gruß, --Burkhard 18:59, 20. Sep. 2008 (CEST)
Ich verstehe was du meinst, aber nachdem ich jetzt gerade >40 Proteine umgestellt und nur drei weitere Problemfälle gefunden habe (APC (Gen), Kisspeptin und Heparanase), während in über der Hälfte der Fälle das Taxon von HomoloGene auf zuwenig Daten beruhte und schlicht falsch war, würde ich abraten, die Datenbank anzuzeigen. Allenfalls als Gegencheck sollte ich sie in der Doku erwähnen. --Ayacop 20:24, 20. Sep. 2008 (CEST)

Die Situation betreffs der Homolog-Datenbanken in Lyon hat sich in den letzten Tagen insoweit verändert, dass keine Queries mithilfe von Sequenzen bzw. deren SwissProt-Nummern mehr angenommen werden. Das bedeutet, dass die Links im UniProt/SwissProt-Eintrag, die auf HOVERGEN/HOGENOM zeigen, ins Leere laufen! Andererseits ist es problemlos möglich, die bereits berechneten Homologiefamilien über http://pbil.univ-lyon1.fr/search/query_fam.php abzufragen (und auch die Links in unseren Boxen funktionieren weiterhin). Dort ist übrigens auch HOBACGEN speziell für Bakterien zugänglich, was man sehr schön in dem Boxeintrag bei Streptokinase sehen kann. Ich kann die Admins gut verstehen, denn jeder Klick auf nen Link bei Uniprot hatte unnötig CPU verbraten.

Obiges war Spekulation und nach einem Mailaustausch mit M. Duret (bei dem wir auch die Erlaubnis zur Verlinkung bekommen haben), sollen wir im Link nicht die Familiennummer, sondern eine Uniprot-Bezeichnung nennen. Ich habe mich jetzt entschlossen, den UniProt-Bezeichner, der ohnehin einer der wichtigsten ist, oben in der Box mit als Bezeichner zu nennen, und mit dem Wert gleichzeitig den Homologiefamilienlink unten zu bauen, d.h. es ist nur noch notwendig, die Datenbank zu nennen. Möglich ist aber auch, der Familie einen Namen zu geben, der dann der Linktext wird. Natürlich muss ich die bereits erstellten Boxen jetzt umstellen. --Ayacop 18:03, 26. Sep. 2008 (CEST)

Nächstes Problem: der genenames.org Link (HUGO, HGNC) bringt mir keinen Eintrag mehr, sondern die Aufforderung, die Daten doch bitte im Bulk herunterzuladen, vermutlich ein Automatismus, wenn zuviel zugegriffen wird. Oder geht es auch anderen so? Wenn nicht, muss ich die Links blind setzen, nicht so schlimm. --Ayacop 11:44, 21. Sep. 2008 (CEST)

War wohl down, jetzt gehts wieder. --Ayacop 19:02, 23. Sep. 2008 (CEST)

Anregungen

Zuächst mal ein Lob: Die Box gefällt mir schon ganz gut. Allerdings sollte sie noch deutlich OMA-freundlicher gestaltet werden. Das fängt schon damit an, dass man die Fachbegriffe erläutern oder zumindest verlinken sollte, damit man nachschauen kann, was sich dahinter verbirgt.

  • Unter dem Punkt Größe kann man Aminosäuren ruhig ausschreiben und kDa verlinken.
  • Bei Vorkommen sollte auf jeden Fall auch die deutsche Bezeichnung des Taxons stehen. Unter Euteleostomi und dergleichen kann sich kaum jemand etwas vorstellen.
  • Was auf jeden Fall noch fehlt ist die Aufgabe des Proteins. Handelt es sich um ein Strukturprotein, ein Enzym, einen Rezeptor etc.? Zudem könnte man eine kurze Zusammenfassung der Aufgabe auflisten, etwa „Eisentransport im Blut“ bei Transferrin.
  • Wir sollten eine Zusammenfassen mit der Enzymbox in Erwägung ziehen. Die Enzymbox ist redundant und es bräuchte nur ein wenig Anpassung der Proteinbox.
  • Warum ist der Text der rechten Spalte größtenteils zentriert? Bei den anderen Boxen aus den Naturwissenschaften, die mir spontan einfallen, ist der Text durchgehend linksbündig.
  • Was haltet ihr von einem zusätzlichen Parameter Proteindomänen, bei dem man die wichtigsten enthaltenen Domänen angeben kann?

Das ist erstmal alles, was mir bisher auf- und eingefallen ist. Gruß, --NEURO  ± 20:32, 20. Sep. 2008 (CEST)

Euteleostomi hat auch in der deutschen WP keine deutsche Bezeichnung, die beste Übersetzung wäre Wirbeltiere ohne Schleimaale und Neunaugen oder Knochenfische aufwärts. Oder kennt jemand eine passende deutsche Bezeichnung dafür? Coelomata ist auch noch so ein Fall, Triploblasten ist auch nicht viel verständlicher. Ansonsten steht es in der Verantwortung des Bearbeiters, auch die deutsche Bezeichnung in Klammern nachzustellen, wie ja auch sonst oft geschehen. Coelomata ist auch noch so ein Fall, Triploblasten ist auch nicht viel besser. (Habe bei den Zoologen nicht richtig aufgepasst - das rächt sich jetzt). --Burkhard 20:56, 20. Sep. 2008 (CEST)
Ja, und die Aufgabe des Proteins, da sind wir wieder bei Ninas Argument, dem ich zustimme, dass das bei vielen Proteinen eine lange Liste wird, und die Box ist ohnehin schon sehr lang. Dass die Enzymbox wegfallen kann, war klar, bei ein einem halben Dutzend Enzymen ist das bereits der Fall. Domänen sind interessant, und da sage ich, wie über den Rest der Anregungen: gerne, sei mutig und danke für die Ideen. --Ayacop 08:20, 21. Sep. 2008 (CEST)

Weitere Felder

Neu hinzugekommen sind die Felder Peptidase_fam für die MEROPS-Klassifikation von Proteasen, sowie TCDB und TranspText für die TCDB-Klassifikation von Membrantransportern. Beides hervorragende Informationsquellen, beides von UniProt verlinkt, so dass man nicht selbst suchen muss. --Ayacop 10:08, 23. Okt. 2008 (CEST)

Rahmen um Bild

Ich finde den Rahmen um das Strukturbild unschön und unnötig (Beispiel). Gibt es einen Grund dafür? --Leyo 18:05, 30. Jun. 2009 (CEST)

Finde ich auch. --NEURO  ± 19:09, 30. Jun. 2009 (CEST)
Da es keine Gegenstimmen gab, habe ich's umgesetzt. --Leyo 18:47, 28. Jul. 2009 (CEST)

Bild2

Der Parameter „Bild2“ wird gemäss TemplateTiger genau von 1 Artikel verwendet. Der im Quelltext ebenfalls vorkommende Parameter „bild2“ scheint gar nicht benutzt zu werden. Der Alternativtext sollte übrigens wegen WP:BIENE nicht entfernt werden. --Leyo 11:45, 24. Sep. 2009 (CEST)

Das ist nur in Topoisomerase und viel zu lang. Warum das zweite Bild nicht unter die Box gesetzt wurde, bleibt rätselhaft. Das mit dem Alternativtext mache ich gleich rückgängig. --Ayacop 12:04, 24. Sep. 2009 (CEST)
Danke. Wofür das „bild2“ dort gut sein soll, sehe ich aber nicht.
Mit dem Link oben lassen sich übrigens Tippfehler in Parametern oder falsch von der en-WP übertragene Infoboxen finden. Einige Korrekturen habe ich so schon gemacht. --Leyo 12:16, 24. Sep. 2009 (CEST)

Fettschreibung

Wieso muss die Erklärung in der Protein-Infobox fettgeschrieben werden? Wer's lesen will tut's sowieso, und die anderen stört's. Hundsnormale Formatierung ist völlig ausreichend. (Fettschreibung hier als Beispiel.... und dort Cytochrom P450) -- Robodoc 13:34, 5. Jun. 2010 (CEST)

ich hatte erst gar nicht verstanden was Du meinst - bis ich den IE angeworfen habe. Scheint ein Browserproblem zu sein, denn bei Chrome und Firefox erscheint die Erklärung ("Molekülstruktur von Cytochrom P450eryF (PDB:1EGY)") nicht fett. Keine Ahnung woran das liegt, vielleicht mal auf Wikipedia:WikiProjekt Vorlagen/Werkstatt nachfragen? --Tinz 15:15, 5. Jun. 2010 (CEST)
Etwas in der Richtung, möglich. Allerdings benutze ich immer den Firefox. -- Robodoc 07:50, 6. Jun. 2010 (CEST)

Größe/Masse/Daltons/u...

Hmm... die Angabe "Größe" scheint mir im zusammenhang mit einer Massenangabe falsch - müsste "Masse" heißen. Außerdem ist die Atomare Masseeinheit das "u" und kein "Dalton". Bitte um Kommentare!--Mager 20:17, 21. Aug. 2010 (CEST)

Fehlendes Bild

Die Infobox ist bei fehlendem Bild nicht besonders schön. Was soll der "-"-Platzhalter da? Und der Balken, der sonst wohl Bilduntertitel und Rest der Box optisch voneinander abtrennen soll? Kann man diese Elemente nicht einfach ausblenden, solange kein Bild vorhanden ist? --y work? 13:54, 30. Dez. 2011 (CET)

ESIS

...aus der Versionsgeschichte: "der Aufruf von ESIS funktioniert NICHT ohne Dereferrer; ob das jemand "Käse findet" ist hier schlicht egal!!!"

"schlicht egal" ist ob man die Seite mit oder ohne Dereferer (wisst ihr was das ist?) aufruft... probier doch mal: http://esis.jrc.ec.europa.eu/lib/esis_pgm.php?GENRE=ECNO&ENTREE=200-816-9

aber schwärzt mich mal weiter fröhlich an --.love.is.war. 02:51, 20. Jan. 2012 (CET)

Nö keine Ahnung, was das ist...aber probier doch mal den folgenden Link aus ESIS (Cas-No 200-816-9) ohne Dereferer und dann ESIS (Cas-No 200-816-9) mit Dereferer.org mit den Browsern Firefox oder IE. Vielleicht überlegst Du Dir mal, dass auch andere Leute hier ein Hirn zum Einschalten haben und Dinge nicht einfach so machen. --Cvf-psDisk+/− 08:43, 20. Jan. 2012 (CET)

Der Direktlink auf ESIS funktioniert nun gar nicht mehr, weder mit noch ohne Dereferrer. Was tun? --Leyo 12:32, 11. Jan. 2013 (CET)

Entfernung von Verschreibungspflicht

In Analogie zur Infobox Chemikalie, wo der Parameter Verschreibungspflicht gemäss Diskussionsergebnis entfernt wurde, würde es sich wohl auch hier aufdrängen. Gibt es Gegenstimmen? --Leyo 15:19, 2. Aug. 2013 (CEST)

Ich war schon bei der Infobox Chemie für die Entfernung - das ist hier nicht anders. Soweit ich sehe, waren auch andere RM-Mitglieder dieser Meinung. Grüße --Partynia RM 15:47, 2. Aug. 2013 (CEST)
Danke für dein Feedback. IMO sollten wir noch ein Weilchen warten und dann einen Entfernungantrag unter WP:B/A stellen. --Leyo 00:19, 3. Aug. 2013 (CEST)
Schade, dass sich nicht mehr zur Diskussion gemeldet haben. Vielleicht liegt´s an der Urlaubszeit. ich denke aber, dass das in Ordnung geht. Argumente wurden ja schon bei der Infobox Chemie ausgetauscht. Grüße --Partynia RM 19:54, 8. Aug. 2013 (CEST)
Die genannten Argumente & Meinungen bei der Infobox Chemikalie gelten wohl auch hier, d.h. der Parameter sollte raus. Gruß --Cvf-psDisk+/− 12:45, 12. Aug. 2013 (CEST)

Aufnahme des Parameters 'GeneCards'

Hallo, könnte man die Infobox Protein um den Parameter der ID-Nummer von GeneCards erweitern? Deren Seite stellt eine Verlinkung zu den meisten Datenbanken bereit. Grüße, --Ghilt (Diskussion) 16:03, 28. Apr. 2014 (CEST)

Wurde umgesetzt, Grüße, --Ghilt (Diskussion) 16:38, 22. Jun. 2014 (CEST)
Dieser Abschnitt kann archiviert werden. Ghilt (Diskussion) 16:38, 22. Jun. 2014 (CEST)

KEGG

Hallo, kann man den KEGG Eintrag in der Infobox ergänzen? Schöne Grüße RoM1982 (Diskussion) 20:58, 2. Mai 2015 (CEST)

Es gab hier mal eine Diskussion zu weiteren Datenbank-IDs, in der auch KEGG erwähnt wurde. Zusammenfassen kann man das dort mit: Identifier gehören auf Wikidata, nicht aber massenhaft in die Box.--Mabschaaf 21:47, 2. Mai 2015 (CEST)

Änderung der Variablen homolog_db in der Vorlage:Infobox Protein

bitte s. Wikipedia:Redaktion_Chemie#.C3.84nderung_der_Vorlage:Infobox_Protein, Grüße, --Ghilt (Diskussion) 16:02, 2. Apr. 2017 (CEST)

Problem bei merops.sanger.ac.uk

Wie man am Beispiel Lysosomales Schutzprotein sehen kann, leitet die Seite merops.sanger.ac.uk (so steht es in der Vorlage) nach www.ebi.ac.uk/merops/ um und wirft dabei alle Parameter weg. Kann sich das jemand mit Ahnung ansehen und den Link in der Vorlage anpassen. und dann auch gleich bei diesem auf https umstellen --Wurgl (Diskussion) 16:21, 3. Apr. 2018 (CEST)

Hi Wurgl, was spräche dagegen, das Ziel der Weiterleitung zu verwenden? Grüße, --Ghilt (Diskussion) 17:02, 3. Apr. 2018 (CEST)
(BK) Habe ich schon so umgesetzt: Spezial:Diff/175723668/175725237--Mabschaaf 17:04, 3. Apr. 2018 (CEST)
Prima, Dankeschön und Grüße, --Ghilt (Diskussion) 17:06, 3. Apr. 2018 (CEST)

HGNC benötigt andere URLs

Die Links, die zu den HGNC-Infos führen, zeigen ins Leere, da deren URL-Struktur geändert worden zu sein scheint. Beispiel: Artikel Transglutaminasen, Infobox rechts. Der Link zu F13A1 zeigt auf: http://www.genenames.org/data/hgnc_data.php?match=F13A1 -- das gibt aber einen Fehler, weil die URL so nicht (mehr) funktioniert. Der korrekte Link müsste lauten https://www.genenames.org/data/gene-symbol-report/#!/hgnc_id/HGNC:3531 bzw. alternativ die Suchergebnisseite: https://www.genenames.org/tools/search/#!/all?query=F13A1 Ich bin mir unsicher, wie man die Infobox ändert, lasse daher lieber die Finger davon und hoffe, jemand hier kann die Infobox updaten. Danke im Voraus! --suvidu (Diskussion) 14:34, 19. Dez. 2018 (CET)

@Suvidu: Danke für den Hinweis, Vorlage:HGNC habe ich auch direkt angepasst.--Mabschaaf 17:18, 19. Dez. 2018 (CET)

Angebliche Pflichtangaben

Umseitig wird behauptet:

  • Die mit dieser Farbe (   ) hinterlegten Zeilen sind Pflichtangaben und müssen angegeben werden.

Das trifft nicht zu.

  • Noch nicht einmal der Name ist Pflichtparameter, denn Default wäre „Lemma des Wikipedia-Artikels“.
  • Zu diversen Angaben lernte ich, dass sie überhaupt nicht für alle Wikipedia-Artikel definiert oder inhaltlich sinnvoll wären.
  • Deshalb sind sie auch pflichtwidrig nicht alle eingetragen; 1.764 Einbindungen:
    • ATC-Code 1.121
    • CAS 273
    • EC-Nummer 673
    • Kategorie 577
    • Reaktionsart 479
    • Substrat 552
    • Produkte 509
    • TCDB 124
  • Sollten vielleicht besser als „empfohlen“ charakterisiert werden.

VG --PerfektesChaos 23:14, 29. Mär. 2021 (CEST)

Link im Parameter Homolog_fam

Diese Verlinkung scheint nicht mehr gültig zu sein. Kann sich das bitte mal jemand ansehen? Beispiele wären

Ich habe jetzt nicht alle Vorlageneinbindungen getestet, sicher ist aber, dass zumindest diese URL https://pbil.univ-lyon1.fr/ = Forbidden You don't have permission to access / on this server. nicht mehr geht, eventuell so https://pbil.univ-lyon1.fr/R/ und mit anderer Zusammensetzung er Links @Mabschaaf, Ghilt: --Liebe Grüße, Lómelinde Diskussion 14:38, 11. Jun. 2022 (CEST)

Das ist schon länger bekannt (→Wikipedia:Redaktion_Chemie/Knacknüsse#Links_auf_HOGENOM,_HOVERGEN_&_HOBACGEN) aber leider nach wie vor ein ungelöstes Problem.--Mabschaaf 16:46, 11. Jun. 2022 (CEST)