OpenAI, Inc. ist ein US-amerikanisches Softwareunternehmen, das sich seit Ende 2015 mit der Erforschung von künstlicher Intelligenz (KI, englisch Artificial Intelligence, AI) beschäftigt. Anfänglich war das Ziel von OpenAI, künstliche Intelligenz auf Open-Source-Basis zu entwickeln. Das Unternehmen wurde vorerst als Non-Profit geführt. 2019 wurde die gewinnorientierte Tochtergesellschaft OpenAI Global, LLC gegründet, in der Microsoft größter Investor ist. OpenAI ist vor allem bekannt für die Entwicklung der generativen vortrainierten Transformer (GPT) – auch generative künstliche Intelligenz, kurz GenAI, bezeichnet, und der daraus abgeleiteten Softwareprodukte wie ChatGPT oder DALL-E.

Schnelle Fakten
OpenAI, Inc.
Thumb
Logo
Rechtsform Public Charity (501(c), Nonprofit)[1]
Gründung 2015[2]
Sitz San Francisco,
Vereinigte Staaten
Leitung Sam Altman (CEO)
Mitarbeiterzahl ca. 1.700
Website openai.com
Stand: 2. Oktober 2024
Schließen
Thumb
Hauptsitz

Geschichte

Gründungsphase und Mission

Der Gründung von OpenAI im Jahr 2015 ging bereits eine lange Debatte um die Risiken von KI voraus. Die Wissenschaftler Stephen Hawking und Stuart Jonathan Russell etwa hatten Befürchtungen geäußert, wenn künstliche Intelligenz eines Tages die Fähigkeit erlangen könnte, sich selbst zu verbessern, dies zu einer Explosion der Intelligenz führen könnte. Durch die damit einhergehende Überlegenheit der KI sei eine Verdrängung der Spezies Mensch durch superintelligente künstliche Intelligenz denkbar, die keinen menschlichen Wertvorstellungen unterworfen ist. Um Risiken wie diesen bei der Entwicklung künstlicher Intelligenz entgegenzutreten, wurde Open AI, Inc. als Open-Source-Non-Profit-Organisation in der Rechtsform einer Public Charity (501(c), Nonprofit) konzipiert. Damit sollte die Unabhängigkeit der Organisation gegenüber Geldgebern und deren Interessen sichergestellt werden; für die Forschung sollte der Freiraum geschaffen werden, sich auf lange Sicht positiv auf die Gesellschaft auswirken zu können.[3] Die Organisation wollte eine „freie Zusammenarbeit“ mit anderen Institutionen[4] und Forschern ermöglichen, indem sie ihre Patente und Forschungsergebnisse für die Öffentlichkeit zugänglich mache.[5]

Gegründet wurde OpenAI von einer Gruppe von KI- und IT-Experten, darunter als bekannteste Personen Sam Altman (zuvor unter anderem bei Y Combinator tätig), Greg Brockman, ehemaliger Chefentwickler von Stripe, der Multiunternehmer Elon Musk und Ilya Sutskever, ein ehemaliger Experte von Google für Maschinelles Lernen. Open AI, Inc. wurde ursprünglich ausschließlich durch Spenden finanziert.[3] Die Initiative hatte von Beginn an sehr prominente Unterstützer mit Reid Hoffman, Mitbegründer von LinkedIn,[6] Peter Thiel, Mitbegründer von PayPal,[6] Jessica Livingston, eine Gründungspartnerin von Y Combinator, Amazon Web Services und Infosys Technologies.[7]

Das Unternehmen OpenAI selbst äußerte noch 2015, dass schwer abzuschätzen sei, wie sehr die Gesellschaft von hochwertiger künstlicher Intelligenz profitieren könnte. Genauso komplex sei zu eruieren, welchen Schaden eine missbräuchliche Verwendung dieser Technologie mit sich bringen könnte.[3] Es sei nicht absehbar, wann künstliche Intelligenz auf dem Niveau sein werde, mit der menschlichen Intelligenz in Konkurrenz zu treten.[8] Der Vorstand von OpenAI sagte 2015, künstliche Intelligenz sei eine Erweiterung des individuellen menschlichen Willens. Damit sollte diese Technologie auch flächendeckend verfügbar und jedem Menschen im gleichen Maße zugänglich sein.[3] Das erklärte Fernziel von OpenAI ist die Entwicklung einer künstlichen allgemeinen Intelligenz (Artificial General Intelligence (AGI)), einer fortgeschrittenen Form der KI, die in der Lage sein soll, intellektuelle Aufgaben nicht nur auf einem menschenähnlichen, sondern potenziell darüber hinaus gehenden Niveau zu bewältigen. Ein Übertreffen der menschlichen Intelligenz durch das auf mehrere Jahrzehnte konzipierte Projekt OpenAI ist für den Vorsitzenden des Unternehmens, Sam Altman, jedenfalls denkbar.[9]

Vishal Sikka, 2014 bis 2017 Vorstandsvorsitzender von Infosys, schrieb 2015, es sei wichtig, dass die OpenAI-Forschung „the greater good“ – das Wohl der Allgemeinheit – anstrebe.[10] Cade Metz von Wired sagte, dass Firmen wie Amazon Interesse an der Verwendung von Open-Source-Software und Open-Source-Daten hätten, um sich gegen Unternehmen wie Google oder Facebook zu behaupten, die über eine starke proprietäre Datenbasis verfügen. Firmen von Y Combinator teilen ihre Daten ebenfalls mit OpenAI, so Altman in einem Interview.[9] OpenAI profitierte anfangs so sehr von seinen guten Absichten und dem Image, dass es trotz schlechterer Gehälter im Vergleich zu anderen KI-Entwicklern wie Google oder Facebook zahlreiche Top-Entwickler für sich gewinnen konnte. Trotz dieser Unterschiede in der Bezahlung wechselte etwa Sutskever von Google zu OpenAI. Forscher Wojciech Zaremba lehnte demnach Angebote von Firmen ab, die ihm das Zwei- bis Dreifache als Gehalt angeboten hätten, um sich stattdessen OpenAI anzuschließen.[11]

Weitere Unternehmensentwicklung bis Veröffentlichung von ChatGPT

Nachdem die bis 2019 durch Spenden erworbenen finanziellen Mittel nur etwa 130 Millionen US-Dollar erreichten und nicht mehr für die Weiterentwicklung der Organisation ausreichten, wurde die gewinnorientierte Tochterfirma OpenAI Global, LLC gegründet. Dabei handelt es sich um ein Unternehmen, für dessen Investoren die Erträge begrenzt sind (englisch Capped profit company). Für diese Regelung wurde die Metapher Nobel Moment in Anspielung an die Stiftung der Nobelpreise durch Alfred Nobel verwendet. Nobel wollte damals seine hohen Gewinne aus dem Dynamitgeschäft für einen guten Zweck einsetzen.[12] Allerdings ist die Begrenzung der zukünftig an Investoren ausbezahlten Erträge sehr hoch angesetzt, indem sie bis zum Hundertfachen der ursprünglichen Investition ansteigen dürfen.[13] Open AI, Inc., weiterhin eine Nonprofit-Organisation, übt volle Kontrollrechte (über eine zwischengeschaltete Struktur, OpenAI GP, LLC, die als general partner (vergleichbar einem Komplementär) fungiert) über die Tochterfirma aus und erhält deren allfällig überschüssige Erträge.[1]

Open AI Global verdient Geld mit Software-Produkten. Das bekannteste ist ChatGPT Plus, ein Abonnementservice für ChatGPT, der den zahlenden Nutzern Privilegien und Zusatzfunktionen gegenüber nichtzahlenden Nutzern einräumt.[14] Wichtiger Geldgeber und größter Einzelaktionär von OpenAI Global ist das Unternehmen Microsoft; Microsoft ist jedoch nur nicht-stimmberechtigter Beobachter im Verwaltungsrat von OpenAI und hat keinerlei Kontrollrechte in OpenAI Global.[1][15] Hatte Microsoft bereits in den Jahren 2019 und 2021 jeweils eine Milliarde US-Dollar in OpenAI Global investiert, sicherte sich das Unternehmen im Januar 2023 für ein weiteres Investment in Höhe von zehn Milliarden US-Dollar die Dienste von OpenAI zur Implementierung von deren Algorithmen und Produkten in eigene Microsoft-Produkte. OpenAI benötigte die Finanzierung sowie das Cloud-Computing (Microsoft Azure) und Supercomputer von Microsoft, um die eigenen Programme betreiben zu können, bzw. die durch die eigenen Programme anfallenden riesigen Datenmengen zu verarbeiten sowie die eigene Forschung voranzutreiben.[16][17]

Im Februar 2018 verließ Elon Musk die Leitung von OpenAI, um angeblich Interessenkonflikte mit Teslas Entwicklungen im Bereich künstliche Intelligenz zu vermeiden. Er blieb zunächst weiterhin Spender und Berater der Organisation. Sam Altman fungiert als CEO und wurde zum Gesicht von OpenAI, Brockman war als CTO und später als Vorsitzender des Aufsichtsrats und Präsident tätig. Im November 2022 wurde der KI-Chatbot ChatGPT 3.5 freigeschaltet und binnen weniger Tage nutzten mehr als 100 Millionen User weltweit das Programm. Damit war ChatGPT die am schnellsten wachsende Plattform aller Zeiten.[18] Im Herbst 2023 wurde OpenAI mit einem Firmenwert von 80 bis 90 Milliarden US-Dollar bewertet.[19]

KI-Strategie und Kritik

Dass ein Risiko mit der Entwicklung und dem Voranbringen von künstlicher Intelligenz einhergehe, bestritt Mitgründer Elon Musk in einem Interview im Jahr 2015 nicht. Wichtig sei, künstliche Intelligenz möglichst vielen Menschen zur Verfügung zu stellen, damit nicht ein kleiner Teil die Vorteile der KI allein für sich beanspruchen könne. Das sei die beste Verteidigung gegen missbräuchliche Verwendung von KI-Systemen.[7]

Die ursprüngliche Strategie von Musk und Altman, das Risiko der Schadensverursachung durch künstliche Intelligenz durch Open-Source-KI für jedermann zu reduzieren, war in der Community umstritten. Der Philosoph Nick Bostrom ist einer der Skeptiker dieses Ansatzes und verdeutlicht das sinngemäß mit folgender Metapher: Wenn Sie einen Knopf haben, der Schaden in der Welt anrichten kann, würden Sie ihn nicht jedem verfügbar machen.[11]

Musk kritisierte im Februar 2023 via Twitter die Gewinnorientierung von OpenAI Global, LLC, indem er den Screenshot einer vermeintlichen Konversation von ChatGPT mit einem unbekannten Nutzer veröffentlichte, in dem die KI nach Eingabe bestimmter suggestiver Elemente und Fragen die Gründung eines profitorientierten Subunternehmens unter der Schirmherrschaft einer Non-Profit-Organisation als „hoch unethisch und illegal“ (englisch highly unethical and illegal) bezeichnete.[20] Jüngere KI-Modelle sind weitgehend proprietär und nicht mehr offen dokumentiert, was wiederum Kritik hervorgerufen und Fragen der Machtkonzentration und Transparenz aufgeworfen hat.[21][22] Das Unternehmen sei demnach inzwischen ein gewinnorientiertes Unternehmen, das Open Innovation lediglich zur Einbindung fremder Open-Source-Erzeugnisse nutze.[23]

Laut Vox-Berichten im Mai 2024 müssten ausscheidende Angestellte ein Non-Disclosure-Agreement (NDA) unterzeichnen, dessen Existenz auch an sich nicht erwähnt werden dürfe. Verstöße könnten unter anderem zum Verlust sämtlicher Unternehmensanteile führen.[24] Das Unternehmen gab später an, die NDA aufgelöst zu haben und künftig nicht mehr zu verwenden.[25]

Klagen wegen Verletzung von Copyrights

Medienunternehmen bezichtigen OpenAI der Verletzung von Copyrights, weil zum Trainieren der verwendeten Lernmodelle ohne Nachfrage und Lizenzierung von mehreren Unternehmen umfangreiche Inhalte verwendet wurden. Bisher wurden entsprechende Vereinbarungen mit der Nachrichtenagentur AP und mit dem Axel Springer SE abgeschlossen. Ausstehend sind Klagen des Autorenverbands Authors Guild und der New York Times.[26][27]

Entlassung und Rückkehr von Sam Altman

Am 17. November 2023 kam es zu der überraschenden Entlassung von CEO Sam Altman durch den Verwaltungsrat des Unternehmens. Der Verwaltungsratsvorsitzende Greg Brockman trat daraufhin zurück, obwohl er nicht an der Entlassung beteiligt war.[28][29] Als Begründung zur Entlassung wurde angegeben, dass Sam Altman in seiner Kommunikation „nicht durchweg aufrichtig“ gewesen sei.[30] Der tiefere Hintergrund der Entlassung Altmans soll eine Kontroverse zwischen ihm und Verwaltungsratsmitglied Sutskever gewesen sein, der in der Kommerzialisierung von OpenAI ein Sicherheitsrisiko gesehen haben soll.[31] Noch am selben Tag übernahm die bisherige CTO Mira Murati als neue Interims-CEO.[32] Der Verwaltungsrat von OpenAI bestand aus sechs Mitgliedern, dazu gehörten:

  • Greg Brockman (Verwaltungsratsvorsitzender)
  • Ilya Sutskever (Chefwissenschaftler)
  • Adam D’Angelo (CEO der Frageplattform Quora)
  • Tasha McCauley (Techunternehmerin)
  • Helen Toner (strategische Direktorin am Center for Security and Emerging Technology der Georgetown-Universität in Washington, D. C).

Bereits zwei Tage später wurde am Sonntag, in der Nacht zu Montag, bekannt, dass Emmett Shear (ehemaliger CEO von Twitch) neuer Interims-CEO von OpenAI wird.[33] Nur eine Stunde zuvor war bekannt geworden, dass Altman zu Microsoft wechseln werde, zusammen mit Brockman. Microsoft als größter Aktionär von OpenAI hatte Interesse bekundet und ihm angeboten, eine neue KI-Abteilung zu leiten.[34][15] Parallel dazu hatten am Wochenende auch intensive Verhandlungen zwischen Altman und OpenAI über seine mögliche Rückkehr stattgefunden, die vorerst scheiterten.

Am 22. November 2023 verkündete OpenAI dann die Rückkehr von Sam Altman als CEO. Der Druck von Beschäftigten – in der Zwischenzeit hatten mindestens 650 von rund 770 Beschäftigten mit Kündigung und dem Wechsel zu Microsoft gedroht[34] – und Investoren von OpenAI spielte dabei eine wesentliche Rolle. Sie drängten darauf, Altman, den Mitbegründer von OpenAI, wieder in seine frühere Position einzusetzen. Als Konsequenz wurde auch der Verwaltungsrat neu formiert.[35]

Der Konflikt um die Entlassung und Wiedereinstellung von Altman war geprägt von Ideologie und Machtkämpfen.[36] Altman ist Repräsentant für die kommerzielle Ausrichtung von OpenAI, Sutskever für den Auftrag zur Schaffung „sicheren, wohlwollenden KI“ und als Kämpfer für sein Projekt besserer menschlicher KI-Ausrichtung (AI Alignment) der Produkte von OpenAI.[37] Es geht konkret auch um die Mittelzuteilung von Personal und Rechenleistungskapazitäten. Die Wiedereinsetzung von Altman als Vorsitzender (CEO), die Absetzung von Sutskever und der zwei unabhängigen Firmenexternen Helen Toner (Forscherin) und Tasha McCauley (Wissenschaftlerin der RAND Corp.) als Verwaltungsrätinnen sowie die neu gewählten Verwaltungsräte geben Hinweise auf die erfolgte Machtverschiebung.[38][39]

Aufsichtsrat von OpenAI, Inc.

Nach Umstrukturierung setzt er sich wie folgt zusammen:[40][41]

Klage von Elon Musk

Am 1. März 2024 berichteten deutschsprachige Medien, dass Elon Musk OpenAI und CEO Sam Altman verklage. „OpenAI sollte ein gemeinnütziges Unternehmen sein, strebe nun aber nach Profit, wirft Elon Musk dem Unternehmen vor. Er wirft den Gründern Vertragsbruch vor – und klagt“, heißt es dazu beispielsweise auf Zeit online.[44][45]

OpenAI veröffentlichte daraufhin eine Replik, in welcher das Unternehmen versucht, die „For-Profit“-Strategie zu rechtfertigen. OpenAI veröffentlichte auch Auszüge aus Email Konversationen zwischen Musk, Altman, Brockman und Sutskever. Diese sollten belegen, dass auch Musk die „For-Profit“-Strategie als sinnvoll angesehen habe.[46]

Wachstumspläne ab 2024

Im Februar 2024 kündigte Altman an, für die weitere Unternehmensentwicklung Rekordinvestitionen in Höhe von 7 Billionen US-Dollar einwerben zu wollen, was mehr als sechs Prozent des jährlichen globalen Bruttoinlandsprodukts entspräche.[47] Im Zuge dessen sei auch die firmeneigene Fertigung neuromorpher Chips beabsichtigt.[48] Das Unternehmen begann im Juni 2024 mit der Einstellung entsprechenden Personals.[49] Bisherige Kooperationsverhandlungen mit TSMC, SK Hynix und Samsung sollen aufgrund mangelnden Vertrauens in das Vorhaben, zu hohen Risikos und Bedenken bezüglich der nationalen Sicherheit gescheiert sein (Stand: September 2024).[50]

Im zweiten Quartal 2024 äußerten Mitarbeiter des OpenAI-Teams für Ethik- und Alignment-Fragen (Superalignment) Misstrauen in die Absichten Altmans[51] und Sicherheitsbedenken.[25] Die Abteilung um Ilya Sutskever wurde im Mai 2024 aufgelöst.[52] Die Unternehmensführung beabsichtigt die Wandlung zur gewinnorientierten Körperschaft (For-Profit-Organisation).[53] Sie legt Investoren weiterhin nahe, eingesetztes Kapital als „Spenden“ zu erachten.[54]

Seit September 2024 buhlt das Unternehmen um die Erlaubnis zur Errichtung von 5-GW-Rechenzentren in mehreren US-Städten, was einem Strombedarf von jeweils etwa 3 Millionen Haushalten beziehungsweise dem Ertrag von 5 Kernkraftwerken entspräche. Das Unternehmen rechnet mit Kosten von etwa 100 Milliarden US-Dollar je Rechenzentrum.[55] Bereits zuvor hatten Microsoft und OpenAI mit dem Programm Stargate die Errichtung eines derartigen Rechenzentrums angekündigt.[56]

Mit dem Wandel zur Gewinnorientierung wurden CEO Sam Altman erstmalig Anteile im Wert von voraussichtlich 150 Milliarden US-Dollar in Aussicht gestellt.[57] CTO Mira Murati und weitere leitende Entwickler verließen derweil das Unternehmen.[58]

Im Oktober 2024 erhielt OpenAI weitere 6,6 Milliarden USD von den bisherigen Investoren Thrive Capital und Khosla Ventures wie auch von Microsoft. Neu haben sich auch Nvidia, die japanische SoftBank und die Investitionsfirma MGX der United Arab Emirates beteiligt. Es ist geplant, dass Angestellten von OpenAI mit Aktienbesitz ein Angebot für Aktienrückkäufe durch die Firma gemacht werde.[59]

Produkte

OpenAI Gym

Ab 2016 hat OpenAI seine Plattform „OpenAI Gym“ entwickelt, die sich mit bestärkendem Lernen (englisch: reinforcement learning) befasst.[60] Der Quellcode ist in seiner aktuellen Version auf GitHub abrufbar.[61] Dabei wird ein Basissystem angestrebt, das leicht aufzusetzen ist und eine große Bandbreite an verschiedenen Entwicklungsumgebungen unterstützt. OpenAI Gym will damit eine Standardisierung für die Veröffentlichung von Ergebnissen in der Erforschung künstlicher Intelligenz anbieten, um Publikationen leichter vergleichen und reproduzieren zu können.[62][63]

OpenAI Five

Mit OpenAI Five wurde ein System miteinander kooperierender Algorithmen entwickelt. KI-Systeme agieren üblicherweise unabhängig voneinander. Hier arbeiten jetzt erstmals KI-Systeme zusammen im Team an einem gemeinsamen Ziel. In dem komplexen strategischen Computerspiel Dota 2 treten Teams aus mehreren Spielern gegeneinander an. In einem Wettbewerb waren diese kooperierenden KI-Systeme den menschlichen Spielern zwar überlegen, doch es ist zu beachten, dass in diesem Wettkampf eine stark vereinfachte Version des Spiels verwendet wurde, in der nur 17 der insgesamt 115 Helden spielbar sind und einige Gegenstände sowie Illusionsrunen nicht verfügbar waren.[64] Später wurde es Spielern aus der ganzen Welt für drei Tage ermöglicht, im Rahmen der vereinfachten Version online gegen die KI zu spielen, wobei OpenAI in 7257 Spielen eine Siegesrate von 99,4 % aufwies, aber auch von vielen Teams mehrmals hintereinander besiegt wurde – von einem Team gar zehnmal in Folge.[65] Ein Wettkampf mit Menschen ohne Einschränkungen im Spiel ist nicht geplant.

GPT-2

Thumb
Die Architektur eines GPT-Modells

GPT-2 (Generative Pretrained Transformer 2) ist das erste Produkt der GPT-Serie, die große Verbreitung und Anklang fand. GPT-2 kann englischsprachige Texte selbstständig vervollständigen. Dessen Texte können teilweise von menschengeschriebenen Texten nicht unterschieden werden. Der Unterschied zu einigen anderen automatischen Textgeneratoren bestand darin, dass die Software zur Texterzeugung keine vordefinierten Textblöcke nutzt. Sie ist auch nicht auf einen Themenbereich festgelegt, sondernzu jeglichem Text einige passende Sätze erzeugen konnte.[66] Das Sprachmodell basiert auf einem Modell mit 1,5 Milliarden Parametern; es erlaubt zu bestimmen, wie wahrscheinlich ein bestimmter Satz in einem Kontext ist.[67] Datengrundlage für GPT-2 waren ungefähr 45 Millionen Seiten Text.

Wissenschaftler kritisierten die von OpenAI gemeldeten Durchbrüche als Clickbaiting; die reißerischen Überschriften übertrieben den von OpenAI erzielten Durchbruch.[68] Wie bei ähnlichen Systemen hatte nach Beurteilung von Fachleuten auch GPT-2 deutliche Schwierigkeiten, Inhalte zu verstehen, was mithilfe statistischer Analysen eher überdeckt wurde. Zum Beispiel wurde ein Text über Einhörner zu einem fantasievollen Text über Einhörner mit vier Hörnern. Sind die Themen ungewöhnlicher und spezieller, schienen die erzeugten Texte an Qualität zu verlieren.

GPT-3

GPT-3, eine Weiterentwicklung von GPT-2, wurde in Form einer wissenschaftlichen Publikation erstmals am 28. Mai 2020 vorgestellt.[69] Die darauf basierende OpenAI-API ist das erste kommerzielle Produkt von OpenAI.[70] Mit über 175 Milliarden Parametern übertrifft es bei weitem das mit 17 Milliarden Parametern vergleichbare und vormals größte T-NLG-Modell von Microsoft.

ChatGPT

Im Dezember 2022 stellte OpenAI den Chatbot ChatGPT vor, die auf dem GPT-3.5-Modell basierte, wobei die aktuelle Pro-Version auf dem GPT-4.0-Modell (ohne Bilderkennung) basiert.[71] Sie wurde entwickelt, um Benutzern das Erstellen von natürlich klingenden Konversationen in Echtzeit in Form eines Chatbots zu ermöglichen. Eine wichtige Eigenschaft von ChatGPT ist die Fähigkeit, sich an den Kontext einer Konversation anzupassen sowie sich an vorherige Themen zu erinnern und darauf basierend angemessene Antworten zu generieren. Dadurch kann sich ChatGPT an veränderte Gesprächssituationen anpassen und eine realistischere Unterhaltung simulieren.[72] Es kann den Code nahezu aller Programmiersprachen analysieren und schreiben sowie Fehler und Bugs finden, Lösungen vorschlagen und dabei seinen Lösungsweg beschreiben. Aufgrund einer zu hohen Fehleranfälligkeit wurden ChatGPT-Antworten kurz nach der Veröffentlichung auf Stack Overflow gebannt.[73]

GPT-4

Im März 2023 wurde GPT-4 vorgestellt.[74] GPT-4 soll nun auch Bilder erkennen und dazu passende Texte schreiben können. Laut Berichterstattung von Heise online soll GPT-4 angeblich ein halbes Jahr lang durch Sicherheitstrainings und menschliche Nachjustierungen gelaufen sein, nachdem es auf „AzureAI-Supercomputern“ trainiert habe. GPT-4 soll aber auch aufgrund der wohl „erhöhten“ Fähigkeiten neue Risiken bergen, die aber nicht im technischen Bericht des OpenAI-Teams (oder sonst) veröffentlicht wurden.[75]

Anfang des Jahres 2023 forderten Wissenschaftler und IT-Prominente in einem offenen Brief, das Training besonders leistungsfähiger KI-Modelle, die kompetenter sind als GPT-4, für mindestens sechs Monate auszusetzen. Zu den Unterzeichnern gehörten u. a. Geoffrey Hinton, Yoshua Bengio, Steve Wozniak und Elon Musk.[76][77]

GPT-4 Turbo

GPT-4 Turbo ging im November 2023 online. Es enthielt neue Features wie „Custom GPTs“ – eine Möglichkeit für User, im System eigene Chatbots zu bauen –, basiert auf einem Datenstand von Dezember 2023 und kann bis zu 128.000 Tokens (rund 96.000 Wörter in Englischer Sprache) auf einmal verarbeiten. Das vorherige GPT-4-Modell schaffte 8.192 Tokens (rund 6000 Wörter in englischer Sprache).[78][79] Das Erstellen eigener Bots (GPTs) erfordert keine Programmierkenntnisse, sondern kann direkt im Dialog mit ChatGPT auf der Plattform erfolgen.[80] Dieses Angebot wurde als Vorstufe hin zu einem „GPT Store“ gesehen, analog zu den App-Stores großer Smartphone-Anbieter.[81]

Es fand zudem eine Preissenkung für die Nutzung via API statt. Der Input in das System (also die Eingabe von Text) sank von 0,03 auf 0,01 US-Dollar pro 1000 Token, während sich der Preis für den Output (die Nutzung der Ergebnisse) auf 0,03 US-Dollar halbierte.[82][83][84] Die „Custom GPTs“ waren zunächst nur für Nutzer der Bezahlversion zugänglich.

Dall-E

Thumb
Ein mit DALL-E erstelltes Bild, nach Eingabe von „racoons playing poker, digital art“

DALL-E wurde am 5. Januar 2021 von OpenAI vorgestellt. Der Name bildet ein Kofferwort aus WALL·E und dem spanischen Künstler Salvador Dalí. Das Programm beruht auf GPT-3 und kann Wörter als Input in Anordnungen von Pixeln als Output transferieren und ist damit ein sogenannter Text-zu-Bild-Generator. Das System kombiniert dabei Bilderkennung und Computerlinguistik.[85] So erstellt das Programm fotorealistische Bilder allein auf Basis von Texteingaben. Im April 2022 wurde die verbesserte Version DALL-E 2 vorgestellt,[86] im Oktober folgte 2023 DALL-E 3.[87]

Whisper

OpenAI hat September 2022 ein automatisches multilinguales Spracherkennungssystem namens Whisper[88] veröffentlicht. Es basiert auf einem Encoder-Decoder-Transformer und steht als Open-Source-Software zur Verfügung.[89] Das System wurde auf 680.000 Stunden mehrsprachiger und multitaskfähiger überwachter Daten trainiert, die aus dem Web gesammelt wurden.[90] Die verbesserte Version Whisper V2 wurde im Dezember 2022 veröffentlicht, Whisper V3 im November 2023.

3D-Modellierung

Das ebenfalls 2022 via Preprint und Repository vorgestellte Point-E ermöglicht die Generierung von Punktwolken auf Basis von Texteingaben.[91][92][93] 2023 stellten Mitarbeiter Shap-E zur Erstellung von 3D-Modellen nach demselben Vorgehen vor.[94][95][96]

Sora

Am 15. Februar 2024 stellte OpenAI den Text-zu-Video-Generator „Sora“ vor, der aus Textanweisungen realistisch wirkende Videos erzeugt.[97][98] Das Modell erzeugt Videos von bis zu einer Minute Länge und gewährleistet dabei eine hohe visuelle Qualität sowie eine präzise Umsetzung der Benutzervorgaben.[99] Sora nutzt eine Diffusionsmodell-Technologie und Transformer-Architektur, um auf Basis der bei anderen Produkten gewonnenen Erkenntnisse aus kleinen Datenpaketen bewegte Bilder zu generieren.

Kritiker geben zu bedenken, dass die Technologie auch für kriminelle Zwecke, wie beispielsweise Propaganda, die Verbreitung von Fake News oder Beeinflussung vor Wahlkämpfen eingesetzt werden könnte. Darüber hinaus fürchten Berufsgruppen, die mit Motion-Design, Illustration oder Werbespots ihren Lebensunterhalt verdienen, von dem günstigen Bewegtbildgenerator ersetzt zu werden. Die Verfügbarkeit von Sora wurde zunächst auf Sicherheitsforscher und Kunstschaffende begrenzt, wie CEO Sam Altman bekannt gab. Um sicherzustellen, dass Nutzer Sora-Videos als KI-generiert erkennen können, sollen diese, unter anderem bei Meta, entsprechend gekennzeichnet werden.[100]

Figure 01

In Kooperation mit dem Unternehmen Figure stellte OpenAI im März 2024 den humanoiden Roboter Figure 01 vor, in den Sprache und visuelle Informationen verarbeitende Modelle von OpenAI implementiert sind.[101]

Commons: OpenAI – Sammlung von Bildern, Videos und Audiodateien

Einzelnachweise

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.