Diskussion:Awk

aus Wikipedia, der freien Enzyklopädie

download-moeglichkeit awk

Warum gibt es keine Quelle, wo man awk bekommen kann zB. für Windows? --20:42, 18. Okt. 2006 (CEST)

siehe gawk. --Mannerheim 22:30, 20. Jan. 2008 (CET)

Groß- / Kleinschreibung

Da in der Versionsgeschichte gerade gestritten wird, ob "awk" am Satzanfang groß oder klein geschrieben wird: Tatsächlich sieht bspw. der Duden hier keine entsprechende Ausnahme vor (nicht: er sieht keine Ausnahme vor; beim Satzanfang nach einem Doppelpunkt etwa ist es zumeist egal, und wenn der Satz mit Apostroph beginnt, muss er klein begonnen werden). Die Namenskonventionen hier aber gehen ganz offensichtlich von der Möglichkeit der Kleinschreibung am Satzanfang aus, Zitat: "Artikeltitel mit einem (auch am Satzanfang) kleingeschriebenen Anfangsbuchstaben werden durch die Verwendung des Schlüsselwortes DISPLAYTITLE realisiert." Dieser Satz impliziert die Möglichkeit, dass Kleinschreibung am Satzanfang angebracht sein kann, und er legt die Anwendung im konkreten Fall nahe: Müsste "awk" am Satzanfang großgeschrieben werden, müsste jedenfalls auch das Lemma "Awk" heißen. --YMS 17:55, 29. Jul. 2008 (CEST)

Hallo!

Die Kleinschreibung bei Artikeltiteln ist möglich, auch wenn es sich um einen Satz handelt. Das ist sinnvoll, da ja kein Satz davor steht. Im Text bedeutet Großschreibung zusammen mit dem Punkt des letzten Satzes: Hier beginnt ein neuer Satz. Deshalb lässt die Großschreibregel da keine Ausnahme zu.--Eledill 09:08, 31. Jul. 2008 (CEST)

Woher stammt eigentlich dieses Märchen von der unbedingten Großschreibung am Satzanfang? § 54 ist ein Grundsatz, der Ausnahmen zuläßt. Ich möchte diese Stellungnahme der GfdS zur Lektüre empfehlen. Die Änderungen von Eledill sind absolut überflüssig. --Wero 17:20, 1. Aug. 2008 (CEST)
...so wie der user selbst, es war eine sockenpuppe von user:bechterev, siehe dazu meine DS (abschnitt ueber 84.167.*). -- seth 18:29, 4. Aug. 2008 (CEST)

string-only

Die Sprache arbeitet fast ausschließlich mit dem Datentyp Zeichenkette...

Das stimmt so nicht. Es gibt: die Datentypen STRING, NUMERIC und STRNUM, siehe u.a.: http://www.gnu.org/software/gawk/manual/gawk.html#Typing-and-Comparison

Gruß, Hermann (nicht signierter Beitrag von 217.74.209.1 (Diskussion) 9:16, 9. Sep 2008 (CEST))

Ist "awk" auch ironisch gemeint?

Ist es Zufall dass die Programmiersprache "awk" genannt wurde? Im Englischen wird bei Korrekturlesungen am Rand "awk" (kurz fuer: "awkward") vermerkt, wenn der Satz oder Satzbau "awkward" (dt. "holprig", "unbequem", "schwierig", "heikel") ist. (nicht signierter Beitrag von 62.80.17.84 (Diskussion | Beiträge) 15:13, 30. Jun. 2009 (CEST)) nein, awk= Aho, Weinberger, Kernighan (die Programmierer) (nicht signierter Beitrag von 140.78.4.102 (Diskussion) 06:35, 24. Apr. 2012 (CEST))

link kaputt, deswegen entfernt

mal abgesehen davon, ob ein Link auf einen SVN-Baum wirklich weiterhelfen würde, funktioniert dieser Link nicht, deswegen erst mal wieder entfernt.

--Hella 19:51, 20. Okt. 2009 (CEST)

mawk

Ich habe gerade einen Link auf den mawk gesetzt, und denke, dass der Artikelwunsch Portal:Informatik/Fehlende_Artikel#Programmiersprachen nun mit einem Redirect gemacht werden könnte, wie es für gawk ja auch vorliegt.
H.Marxen 20:27, 2. Sep. 2010 (CEST)

Hab mawk eben noch im Artikel kurz charakterisiert und die Umleitung von mawk auf awk eingerichtet. --Thüringer ☼ 22:16, 2. Sep. 2010 (CEST)

Prima, danke! Aber paßt dein Text nicht besser in das Kapitel "Versionen, Dialekte"? Im einleitenden Kopf-Text scheint es mir ein bisschen viel Detail zu sein. Gawk ist wohl wichtig genug dort Erwähnung zu finden, bei mawk schätze ich das anders ein. Ich wäre aber auch nicht dagegen, den einen Satz über gawk aus dem Kopf ebenfalls nach dort unten zu verfrachten. Was meint ihr? --H.Marxen 17:16, 3. Sep. 2010 (CEST)

awk und Linux

Mir ist keine einzige Linux Distro bekannt, die "awk" ausliefert. Da Linux stattdessen gawk liefert, kann man awk definitiv nicht als "Linux Software" bezeichnen. Ich werde einige Tage warten um zu sehen ob jemand tragfähige Argumente für die aktuelle Änderung liefert. Kommen die nicht, fliegt die Kategorie wieder raus. --Schily 13:15, 17. Apr. 2011 (CEST)

gudn tach!
gawk leitet auf awk weiter; unter linux ist awk meist ein link auf gawk. in awk wird alles, was darunter faellt, erklaert. macht es dann nicht sinn, auch die linux-kategorie aufzufuehren. schliesslich wird linux vermutlich das betriebssystem sein, in dem (g)awk die meiste verwendung findet. in der englischen wikipedia ist es sogar als cross-plattform-software kategorisiert. (haben wir auch so ne kategorie?) -- seth 23:22, 17. Apr. 2011 (CEST)
Wenn OpenOffice ein Link auf Microsoft Word wäre, würdest Du dann dem Microsoft Word Artikel das Attribut "Linux Software" geben, nur weil OO auch auf Linux läuft? --Schily 09:18, 18. Apr. 2011 (CEST)
gudn tach!
nein, aber OO ist halt auch was anderes als word. gawk und awk machen aber grundsaetzlich das gleiche und sind gleich spezifiziert, oder nicht? (kenne mich mit awk nicht aus). bei perl jedenfalls ist es so, dass es verschiedene gruppen gibt, die fuer verschiedene plattformen perl entwickeln, z.b. strawberryperl oder active-state-perl fuer windows, obwohl perl urspruenglich aus der unix-welt kommt. dementsprechend wird perl auch als windows-software kategorisiert. -- seth 23:47, 18. Apr. 2011 (CEST)
Ich sehe gerade bei OO und MS-Word sehr ähnliche Vorraussetzungen wie für den awk/gawk Vergleich. Beide tun ähnliche Dinge nach einem Standard und beide haben ansonsten nichts miteinander zu tun.
Perl-Derivate hingegen sind MW nach aus einer gemeinsamen Ur-Quelle entstanden.
Man tut übrigens auch den ursprünglichen Autoren der UNIX-Programme keinen guten Dienst, wenn (wie in der gesamten WP) versucht wird, ihre Programme mit den GNU Nachbauten in einen Topf zu werfen oder gar nur noch über die Nachbauten zu sprechen. Ein allgegenwärtiges Problem der WP ist z.B. die Diskussion der Optionen eines Programms an Hand der nicht portablen Optionen der GNU-Nachbauten. Dadurch wird übrigens ein "Vendor-lock-in" geschaffen, denn nach falschen Dokumentationen entstehen z.B. unportable Skripte. Eine korrekte Einhaltung von dem was man und nicht die WP-Kategorie unter einem "Linux-Programm" versteht wäre ein Anfang WP weniger verfälschend zu gestalten. --Schily 14:53, 19. Apr. 2011 (CEST)
Es geht bei Wikipedia aber nicht darum, eine exakte Software-Versionsliste zu erstellen. Für WP:OMA ist der Unterschied zwischen awk und gawk zu vernachlässigen, beide Programme werden am Besten in einem Artikel erklärt. Der Lemmaname ist als "Awk und Varianten" zu interpretieren, nicht als "Original awk". Wichtige varianten können in Paragraphen erklärt und differenziert werden. Der Artikel Autoreifen spricht auch nicht nur über den ersten Hersteller von Autoreifen! --Chire 08:50, 20. Apr. 2011 (CEST)
Sehe ich auch so. --B-greift 09:34, 20. Apr. 2011 (CEST)
Das magst Du - als Privatmeinung - gerne so sehen, aber tatsächlich gibt es einen POSIX-Standard für awk und der (und nicht irgendein Hacker, der glaubt, awk verbessern zu müssen) legt fest, was awk alles ist (und damit auch, was es alles nicht ist). Tatsächlich ist der gawk eben KEIN awk, sondern irgendwas, das so ähnlich ist. Es ist im Übrigen auch (die folgende Liste von Analogien beruht auf ähnlichen Mißverständnissen)
  • das, was Microsoft als TCP/IP bezeichnet, kein TCP/IP (sondern RFC 1001 / RFC 1002);
  • das, was Microsoft als "SCSI" bezeichnet, kein SCSI (sondern meistens SATA oder IDE);
  • das, was Microsoft als HTML bezeichnet, kein HTML (wegen falscher Implementierung des Standards);
  • das, was man bekommt, wenn man unter Linux "vi" aufruft, kein vi (sondern vim);
  • das, was man bekommt, wenn man Linux installiert, kein Unix (sondern, mangels POSIX-Erfüllung, unixähnlich).
Alles das sind Dinge, die "so ähnlich wie" das, was sie zu sein vorgeben, sind, aber sie sind nicht die Sache selbst, üblicherweise, weil sie die einschlägigen Standards an irgendeiner Stelle verletzen. Das ist nicht weiter verwerflich, aber man sollte sich dieser Unterschiede bewußt sein. Umso mehr, wenn man sich anmaßt, es anderen erklären zu wollen. Wenn man nämlich WP:OMA erklärt, daß zwischen einem Auto von Matchbox und einem von Mercedes nur ein zu vernachlässigender Unterschied besteht, weil beide 4 Räder und ein Lenkrad haben, dann hat man den Anspruch, irgendwelche Information zu transportieren, aufgegeben. Wenn man genügend unscharf hinschaut, dann ist für einen Höhlenmenschen auch der Unterschied zwischen einem Laptop und einem Ziegelstein vernachlässigbar. Vielleicht könnte man auch medizinische Artikel wie Schulterluxation, Bankart-Läsion und Hill-Sachs-Läsion zu einem WP:OMA-freundlichen Schulterwehweh zusammenführen, der Unterschied für den Laien ist schließlich vernachlässigbar. In Erwartung deiner Zusammenführung von Lemmata mit vernachlässigbaren Unterschieden --bakunin (Diskussion) 23:57, 24. Nov. 2014 (CET)

OSTC-Verlag

Die vom OSTC-Verlag angebotene deutsche Übersetzung ist anderswo offenbar nicht zu finden. Meine Suche nach der ISBN 978-3-9811280-0-0 war jedenfalls fruchtlos. Auch finde ich keine weiteren Referenzen zu dem Verlag. Auf der obigen Seite wird man aufgefordert, sich per Telefon, Fax oder E-Mail zu melden.

Mir ist nun nicht ganz klar, ob das insgesamt zu dünn für WP ist, so daß dieses Buch aus der Literaturliste wieder raus sollte. Wäre schade, wenn es tatsächlich da und zu haben ist, oder?

Wer weiß mehr?
--H.Marxen (Diskussion) 13:56, 22. Dez. 2013 (CET)

Das Buch gibt es nicht (https://portal.dnb.de/opac.htm?referrer=Wikipedia&method=simpleSearch&query=9783981128000) (nicht signierter Beitrag von 87.185.150.74 (Diskussion) 01:26, 6. Feb. 2014 (CET))

Mängel des Artikels

  • Der erste Satz der Einleitung ist schon falsch: awk ist keineswegs zur Bearbeitung "strukturierter" Textdaten bestimmt, sondern kann mit allen Textdaten umgehen, strukturiert (was immer das sein soll) oder nicht.
Ist aber der Haupteinsatzzweck, weil es eben diese besonderen Features dafür enthält.
  • Die Standardisierung und deren Stand wird nicht einmal erwähnt.
Ja, es gibt einen POSIX-Standard. Könnte man erwähnen.
  • Die Textbeareitungsmöglichkeiten heben ausschließlich auf search and replace ab, was man mit sed genausogut könnte. Die wesentlichen Unterschiede zu anderen programmierbaren Textfiltern (etwa persistentes memory über Input-Zeilen hinweg, der BEGIN-Block und der END-Block, automatisches Tokenizing des Inputs, ...) wird unterschlagen bzw. nur am Rande erwähnt, obwohl das gerade die zentralen Vorteile sind.
Ja sehe ich auch so. Die Beispiele zeigen wenig was awk ausmacht.
  • Der im zweiten Satz der Einleitung erwähnte Gebrauch "zusammen mit sed" beschreibt lediglich eine ziemlich schlechte Praxis von Leuten, die Shell-Programmierung nur unzureichend beherrschen. Wenn man etwas mit sed anfängt, dann bringt man es auch darin zu Ende und mit awk verhält es sich genauso. "awk .... | sed ..... | awk ...." kostet unnötig Prozessaufrufe und damit (Hauptspeicher-)Platz und Performance. Deshalb machen das höchstens Anfänger.
Ja sehe ich auch so. Wer awk zusammen mit tools wie cut, grep, sed,... verwendet kann kein awk.
  • Daß "Beschränkungen in awk" Larry Wall dazu gebracht aben, Perl zu programmieren, ist eo ipso Quatsch: awk ist (genauso wie sed und Perl) eine Turing-vollständige Sprache, weshalb man in awk, sed oder Perl dieselben Probleme lösen kann. Welches dieser Tools jeweils besser geeignet (das heißt, in kürzerer Zeit zum ergebnis führend) ist, hängt wohl in erster Linie vom Problem ab.
Turingvollständig ist so ne Floskel die praktisch nix aussagt. Die primitivsten Blödelsparchen sind turingvollständig, nutzt aber trotzdem keiner der noch ganz bei Trost ist für ernsthafte Programme, danach wählt man keine Sprache aus, das sagst du ja selbst, also was soll das "Argument"? Wall hat das nun mal selbst so gesagt und Perl massgeblich beeinflusst. Nach welchen Kriterien andere Leute ihre Sprachen auswählen ist hier zudem uninteressant.
  • Warum "nawk [...] die Grundlage neuerer Implementierungen" sein soll, ist mir auch nicht begreiflich. Tatsächlich arbeite ich seit über zwanzig Jahren mit einem Unix-System (AIX), das auch in der neuesten Version 7.1.3 keinen von nawk abgeleiteten awk beinhaltet, sondern einen (POSIX-konformen) normalen awk. Auch Solaris hat einen (uralten) awk unter /bin/awk und eine modernen, POSIX-kompatiblen unter /usr/xpg4/bin/awk, aber (von Haus aus) keinen nawk. Bei HP-Ux kenne ich keine aktuelle Version, aber meines Wissens ist auch da kein nawk dabei, sondern ein ganz normaler awk. Das sind immerhin die drei bei weitem größten Hersteller von Unix-Betriebssystemen und zugehöriger Hardware. von welchen "neueren Implementierungen" reden wir also und in welchen Unix-Systemen sind die zu finden?
Die sind doch nur wegen der Kompatibilität drauf, ausserdem hat es nix mit der Aussage zu tun. Grundlage neuerer Implementierungen hat nichts damit zu tun was irgendwelche Steinzeitunices mitliefern, sondern damit worauf heutige awk-Implementierungn BASIEREN das ist nun mal nawk.

--bakunin (Diskussion) 00:54, 25. Nov. 2014 (CET)

awk in anderen Programmen

Auch unter R kann die Kommandozeile mit der Funktion system() aufgerufen werden (getestet bei openSuse und Ubuntu 16.04), um dort Strings zu verändern. Dies kommt bei Systemen zu Gute, die über wenig RAM verfügen, die bei Überschreiten des verfügbaren RAM-Speichers unter nativer R-Umgebung nicht möglich sind (Stackoverflow). Ältere Systeme (32 bit) unterstützen nicht mehr als z.B 4 GB RAM, oder der Zubau von RAM ist wegen begrenzter Anzahl an Steckplätzen nicht möglich, bzw. kann die Finanziellen Mittel überschreiten.

Vorwissen aus awk kann somit direkt produktiv in R verwendet werden. Es ist nicht notwendig, die Textdateien in R zu laden und diese vor einer Weiterverwendung in R zu verkleinern, oder auch die notwendigen Analysedaten zu beschränken. Perl hat eine höhere Verarbeitungsgeschwindigkeit als awk, kann ebenfalls aus R heraus benutzt werden.