Kann, soll oder darf die künstliche Intelligenz das menschliche Denken substituieren? - Seite 86 - triathlon-szene.de | Europas aktivstes Triathlon Forum
Unsere Programmierer arbeiten nicht mehr mit ChatGPT, sondern mit Anthropic Claude.
Ich bin Abo-Anwender von Grok, Gemini, ChatGPT und Claude. Dabei nutze ich sie aktuell nur selten fürs Coding, sondern für eher allgemeine konzeptionelle Aufgaben und für Sanity Checks meiner eigenen Ideen.
ChatGPT habe ich gerade gekündigt, weil der Output für meine Zwecke immer schlechter wurde (mit 5.1 und dann 5.2), teilweise haarsträubend. Gemini ist besser, steht aber auch ziemlich oft auf dem Schlauch und missachtet sporadisch – gefühlt regelmäßig – klare Vorgaben. Grok ist aktuell komplett unbrauchbar.
Claude hingegen (ich erkenne kaum einen Unterschied zwischen Opus 4.5 und 4.6, außer einer viel besseren Kontextverwaltung) ist sensationell. Was das Verständnis subtiler oder komplexer Zusammenhänge angeht, ist Claude den anderen um Lichtjahre voraus. Der Output ist oft so menschenähnlich und pointiert, dass es erschreckend ist. Wenn ein Satz als Antwort ausreicht, dann kommt auch nur ein Satz, ohne dümmliche Präambeln, Vorschläge und Angebote zur weiteren Bearbeitung wie bei anderen.
....
Claude hingegen (ich erkenne kaum einen Unterschied zwischen Opus 4.5 und 4.6, außer einer viel besseren Kontextverwaltung) ist sensationell. Was das Verständnis subtiler oder komplexer Zusammenhänge angeht, ist Claude den anderen um Lichtjahre voraus. Der Output ist oft so menschenähnlich und pointiert, dass es erschreckend ist. Wenn ein Satz als Antwort ausreicht, dann kommt auch nur ein Satz, ohne dümmliche Präambeln, Vorschläge und Angebote zur weiteren Bearbeitung wie bei anderen.
Opus 4.6 hat bessere Benchmarks als 4.5. Mir kommt es auch so vor.
Davon abgesehen: Es ist tatsächlich erschreckend. Bei komplexen Aufgaben übertrifft es menschliches Expertenwissen, das man sich über Jahre angeeignet hat, mittlerweile locker.
Ich bin ja nur ein doofer Mathematiker und kein schlauer Informatiker. Daher die Frage:
Codieren Informatiker denn noch?!
Oh! Das tut mir leid. Da kannst du ja aber nix dafür, also frag ruhig.
In Programmiersprachen m.E. weniger - in Umgangssprache halt. Einer muss es ja hinschreiben. Umso wichtiger ist Sprachkompetenz, denn: Das Problem, die Fachseite zu verstehen bleibt ja. Das war schon immer der größte Teil der Aufgabe, Missverständnisse hier haben schon immer die höchsten Kosten verursacht. Das Programmieren an sich war ja nie ein Problem. Da hat sich nix geändert.
Dafür sind sie nun mehr mit Softwarearchitektur, Engineering, Infrastruktur, Refrakturieren von Code, Debugging, Meetings mit Kollegen aus der Fachabteilung, Coaching von Juniors usw. usw. beschäftigt. Wie groß ein ggf. vorhandener Produktivitätsgewinn ist, muss sich im konkreten Fall zeigen.
Wo sicher ein Produktivitätsgewinn da ist, ist für eher einfache Aufgaben. Mittlerweile machen Modelle wie Claude ja praktisch keine Syntaxfehler mehr und die Probleme mit API Versionen sind auch viel weniger geworden. Das war noch vor nem halben Jahr anders.
Du müsstest das eventuell allgemeinverständlicher beschreiben.
Sorry und danke für den Hinweis.
Es geht darum, dass Entwickler spätestens seit den 0er Jahren angefangen haben signifikant „frei verfügbaren“ Code aus dem Internet für eigene Projekte zu laden.
Es entwickelten sich riesige Bibliotheken, die frei verfügbaren Code hosten. Das Laden von Modulen und deren neuen Versionen geschieht mittlerweile automatischen. Es gibt in den Bibliotheken Prozesse, die die Sicherheit und Qualität von freiem Code gewährleisten. Es kommt trotzdem zu Qualitätsproblemen oder gar zu Sicherheitsproblemen. Ein Teil dieser Prozesse ist automatisiert, ein anderer ist organisatorisch.
Aktuell gibt es solche Bibliotheken auch für Module, mit denen Agenten z.B. Zugriff auf den lokalen Rechner oder die Produktivdatenbank erhalten. Diese Module sind entweder von Menschen oder von Agenten bereit gestellt. An der Stelle entstehen neue Sicherheitsrisiken, entweder weil der Code Sicherheitslücken hat oder ein Benutzer/Entwickler die Tragweite seines Tuns nicht erkennt.
Hier braucht es neue Ansätze und Ideen um einerseits von AI generiertem Code zu profitieren, aber andererseits sich nicht Risiken einzuhandeln.
..... Das Programmieren an sich war ja nie ein Problem. Da hat sich nix geändert.
Warum habe ich dann schon 100000 Bugs gesehen, wenn das kein Problem war?
Überschätzten sich die schlauen Informatiker die ganze Zeit? Oder siehst du das zu optimistisch?
Zitat:
Dafür sind sie nun mehr mit Softwarearchitektur, Engineering, Infrastruktur, Refrakturieren von Code, Debugging, Meetings mit Kollegen aus der Fachabteilung, Coaching von Juniors usw. usw. beschäftigt. Wie groß ein ggf. vorhandener Produktivitätsgewinn ist, muss sich im konkreten Fall zeigen.
...
Wie sollen die schlauen Informatiker, die bisher 100000 Bugs programmiert haben, gewinnbringend Refakturieren, debuggen und tolle Architekturen entwerfen, wenn sie nicht mal mehr programmieren müssen? Woher nehmen sie ihr Wissen dafür? Sollte nicht auch gleich eine KI das coachen übernehmen?
Wenn man euch so zuhört, erstaunlich, wie sich KI im Bereich Programmierung entwickelt hat.
Das passt auch zu den neuerlichen Aussagen, dass die bekannten KI Unternehmen die Programmierung ihrer KI Modelle wiederum mit KI verbessern und weiterentwickeln. Das hieße für mich, dass die KI sich immer mehr selbst programmiert.
Wenn man euch so zuhört, erstaunlich, wie sich KI im Bereich Programmierung entwickelt hat.
Das passt auch zu den neuerlichen Aussagen, dass die bekannten KI Unternehmen die Programmierung ihrer KI Modelle wiederum mit KI verbessern und weiterentwickeln. Das hieße für mich, dass die KI sich immer mehr selbst programmiert.
Skynet 1.0?
Es ist grundsätzlich kein Problem, dass KI Code verbessert, sofern das sauber getestet und reviewed wird.
Bei der Programmierung geht es i.d.R. darum, Anforderungen oder Probleme zu codieren. Meist wurde das schon mal gemacht und hinterlegt. Die Vorgehensweise beim Programmieren sollte strukturiert und durchdacht sein. Alles in allem also ein gefundenes Fressen für jede KI.
Das lässt sich aber leicht auf andere Arbeitsbereich übertragen.
Opus 4.6 kommt erstmals mit einem Kontextfenster von einer Million Token daher. Für Laien: Opus kann mehrere hundert Seiten Text im Blick behalten.