Bilder per Texteingabe modifzieren
Apples KI-Offensive: Firmenübernahmen und eigenes Sprachmodell
Beim Thema KI haben über die vergangenen Monate hinweg insbesondere Unternehmen wie Google, Microsoft und allem voran die ChatGPT-Macher OpenAI Schlagzeilen gemacht. Doch ist es kein Geheimnis, dass sich auch Apple mächtig in diesem Bereich engagiert. Spannend wird vor diesem Hintergrund sicherlich die Vorstellung der nächsten Generationen von macOS und iOS in Verbindung mit Apples Sprachassistentin Siri. Einen kleinen Vorgeschmack auf das, was da kommt, bietet uns Apple immer wieder auch jetzt – wenngleich dezent und vergleichsweise unspektakulär.
In Kooperation mit der University of California in Santa Barbara hat Apple das KI-Modell „MLLM-Guided Image Editing“ (MGIE) entwickelt, das in dieser Woche vorgestellt wurde. Bei MGIE handelt es sich um ein Open-Source-Projekt, das in diesem PDF ausführlich beschrieben wird. Die begleitend angehängten Beispiele sind zum Teil durchaus eindrucksvoll.
MGIE ist in der Lage, vorhanden Bilder auf Basis einer Textbeschreibung zu überarbeiten. Oben seht ihr beispielsweise das Bild einer Pizza, deren Belag auf den Befehl „mach sie gesünder“ hin anstelle von Salami mit Tomaten und Kräutern belegt wird. Weitere Beispiele zeigen allgemeine Bildbearbeitungen und -verbesserungen oder auch ein Notebook, dass per Textanweisung eine Webseite mit grünem Hintergrund auf dem Bildschirm anzeigt.
Das von Apple mit entwickelte KI-Modell wurde als Open-Source-Project veröffentlicht und steht auf der Plattform GitHub zur freien Nutzung bereit.
Apple auf KI-Einkaufstour
Apple hat darüber hinaus über die vergangenen Monate hinweg verstärkt seine Fühler ausgestreckt und für seine Verhältnisse im großen Stil Firmenübernahmen im KI-Bereich angeleiert. Im Jahr 2023 hat das Unternehmen einem Medienbericht zufolge 32 Firmen aus diesem Segment übernommen, deutlich mehr als jeder andere der großen Konzerne.
Bild: Brighter AI
Unter anderem steht wohl auch das deutsche Unternehmen Brighter AI auf der Einkaufsliste von Apple, das eine auf generativer KI basierende Technik zur Anonymisierung von Gesichtern und anderen Bilddetails entwickelt hat. Auf deren Webseite gibt es interessante Beispiele zu sehen.
Schön, Tomaten sind gesünder ? Ich. In allergisch dagegen….. hoffentlich weiß daß Fräulein Siri…. Aber wahrscheinlich werden noch nebenbei meine Google und Amazon – Cookies ausgelesen – da habe ich gar keine Bedenken !!
Omg
Selber denken könnte soll helfen und dem Sprachassi das einfach mitteilen – wenn man‘s dann unbedingt darüber mache will. .
Das ist ein BEISPIEL.
Omg
self fulfilling prophecy – sobald alle Allergiker durch allergischen Schock weg sind, ist es für den Rest sicher gesund ;)
Was ein Schmarn…..
mhh Cookies..
Ich finde den Hinweis von Frank gar nicht so abwegig: Attribute, wie „gesünder“ haben eine hohe individuelle Dimension. Sofern die KI dies bei den Lösungen nicht automatisch berücksichtigt, oder vorab nach benötigten Zusatz-Infos (z.B.“Haben Sie eine Histamin-Überempfindlichkeit“) fragt, können die Antworten sehr problematische Auswirkungen haben.
Lustig wäre natürlich, wenn der Befehl „Mach die Pizza leckerer“ wieder den Salami-Belag erscheinen lassen würde :-)
Leude das BEISPIEL, wie ein Vorredner bereits hervorhob, wurde im Bereich der Bildmanipulation generiert.
Wenn hier jemand auf den Anblick von Tomaten oder anderen abgebildeten Lebensmitteln allergisch sein sollte, dann natürlich: gute Besserung von mir.
Hat Apple keine eigenen Entwicklungsabteilungen? Was machen die eigentlich den ganzen lieben Tag. Der Outcome ist ja zum Vergleich zu anderen Unternehmen recht überschaubar.
Apple hat noch nie das Rad neu erfunden. Es wurden immer bestehende Ideen aufgegriffen und perfektioniert bzw. weiterentwickelt. Mausbedienung und Userinterface bei Xerox abgekupfert, iTunes wurde dazugekauft, MP3-Player mit HD gab es schon vor dem iPod, Tabletts auch… so neu war auch die Idee des iPhones nicht, Smartwatches gabe es auch schon, auch Headsets sind wahrlich nicht neu. Die Art wie es alles integriert ist und untereinander funktioniert macht viel aus.
+1
Apple ist ne Software Firma, die hardware ist bloss fancy DRM.
Sie haben doch eigene Entwicklungsabteilungen, ob zugekauft oder nicht, wo ist dein Problem? Achja sinnloses Apple Bashing mal wieder. Man, man.
Es geht einfach darum, das bei Apple quasi nichts grossartiges am Ende rauskommt. Wenn ich Tim Cook wäre, würde ich mir über die Effizienz meiner Entwicklungsabteilungen Gedanken machen. Da sind andere Firmen einfach besser.
Ja klar, ist halt einfach eine Firma voller dummer Menschen, die da jeden Tag blöd rumsitzen.
Und unsereins hat hier aus der Ferne alle relevanten Informationen um die richtige Diagnose zu stellen. Klar, macht voll (nicht) Sinn….
Die hätten mal bei rabbit r1 zuschlagen sollen. Da wäre schon vieles fertig gewesen. Falls das wirklich so klappt wie gezeigt
LoL
Ich bin unbesorgt.
Das wird bestimmt richtig gut sein am Anfang und alles toppen .
Und dann wird es 10 Jahre so gelassen und nie weiter entwickelt
Genau so wird es sein. Ein paar baustellen mehr..
Bin ja mal gespannt, welche Hardware-Voraussetzungen dafür gelten werden, wenn das Ganze lokal verarbeitet werden soll.
Ich wäre ja schon zufrieden, wenn Siri mal was anderes sagt, als“ soll ich im Internet danach suchen „oder „ich habe in deinem Kalender nichts dazu gefunden.“
++1
Ich bat Siri, die letzten beiden bei Apple Music aufgerufenen und abgespielten Titel zu wiederholen.
Das Ergebnis: Siri hat den zuletzt aufgerufenen Titel in einer Endlosschleife wiederholt. Das ist schon ein arges Trauerspiel.
wie gut, dass viele hier ganz genau wissen, wie es bei apple intern abgeht, woran gearbeitet wird.
ihr sitzt irgendwie in DE und nutzt apple produkte, lest ein paar newsticker artikel über apple und erlaubt euch solche aussagen zu machen? leitet selbst erstmal ein unternehmen, das einiges größer ist euer eigenes (sofern ihr eines habt), t4agt verantwortung für angestellte und die zig milli9nen produkte, die da draußen genutzt werden.
es ist etwas anderes als seine eigene homepage mal zu aktualisieren.
BrighterAI ist sicherlich interessant für das LookAround-Feature in Apples Karten-App. Das nimmt viel Arbeit ab und kann die Bilder unverpixelter wirken lassen.
Ansonsten liest sich das eher wie ein Armutszeugnis: „deutlich mehr [Übernahmen] als jeder andere“ sagt mir, dass auf dem Gebiet intern sehr viel verschlafen wurde. Und nun wird teuer eingekauft, was extern vorangebracht wurde, in der Hoffnung, auf dem Gebiet nicht ganz abgehängt zu werden.