Was wahr sein muss, bevor wir KI in eine App einbauen
Dein iPhone ist voll mit Dingen, die du dort abgelegt hast. Rezepte, die du von einer Webseite gescreenshottet hast. Halb fertige Listen in Notizen. Ein PDF, das dir jemand geschickt hat. Ein Foto eines Workouts, das auf einem Whiteboard stand. Eine Sprachnotiz, in der du dir selbst erklärst, wie du einem Kunden eine Rechnung schreibst. Es ist schon da. Du hast es dort hingelegt, weil es dort hingehört.
Wenn jetzt also eine neue App auftaucht, die das theoretisch alles nutzen könnte, ist die Frage nicht, ob die App gut ist. Die Frage ist, ob sie dich dort abholt, wo dein Zeug schon liegt, oder ob sie erwartet, dass du alles von Grund auf neu eintippst. Eine App, die dich ein Rezept noch einmal abtippen lässt, das du längst gescreenshottet hast, oder die Schritte noch einmal auflisten lässt, die du längst in Notizen geschrieben hast, verlangt von dir Arbeit, die nichts mit dem zu tun hat, was du eigentlich machen willst. Die Daten sind da. Die Hürde ist die App.
Genau dafür sind KI-Funktionen eigentlich da, wenn sie überhaupt für irgendetwas sind. Nicht, um irgendwen zu beeindrucken. Nicht für den Werbetext. Sondern um die Lücke zwischen dem, was die Nutzer:innen schon haben, und dem, was die neue App daraus braucht, zu schließen.
Es gibt im Moment keinen Mangel an KI-Funktionen, die in Apps eingebaut werden. Viele davon sind gut. Viele sind da, weil Investoren sie sehen wollen, oder weil das Team eine Quote hatte, oder weil alle anderen es auch tun und keine zu haben sich langsam wie ein Problem angefühlt hat. Wir sind ein kleines Studio. Wir haben diese Zwänge nicht, und wir haben auch nicht die Kapazitäten, Funktionen aus irgendeinem anderen Grund zu bauen, als dass sie helfen. Also haben wir aufgeschrieben, was eine KI-Funktion sein muss, damit sie es überhaupt in eine Gums-&-Bones-App schafft.
Es sind drei Dinge, und sie sind alle ein hartes Nein, wenn sie nicht erfüllt sind.
Das erste ist, dass sie dabei helfen muss, das zu tun, wofür die App eigentlich da ist. Patter gibt es, um Menschen zu helfen, Routinen aufzubauen und aus diesen Routinen Gewohnheiten werden zu lassen. Eine KI-Funktion in Patter muss in diese Richtung drücken — eine Routine leichter starten lassen, eine schärfen, dich aus dem leeren Bildschirm holen. Dass jemand Patter eine Webseite, eine Notiz oder ein Foto einer Liste in die Hand drücken und einen Routinen-Entwurf zurückbekommen kann, den er bearbeiten kann, passt. Ein Generator, der für jede Routine ein süßes Icon macht, würde es nicht tun. Nicht weil er schlecht wäre. Er ist okay. Er hat nur nichts mit dem Grund zu tun, aus dem irgendwer Patter öffnet. Jede App, die wir machen, hat einen Zweck, schmal genug, um auf eine Postkarte zu passen, und eine KI-Funktion dient diesem Zweck oder sie kommt nicht rein.
Das zweite ist, dass sie zu der Art passen muss, wie wir ohnehin bauen. Unsere Apps sind ein einmaliger Kauf, kein Abo, keine Werbung, kein Account, keine Analytics, keine Cloud. Eine KI-Funktion dranzubasteln, die irgendetwas davon klammheimlich aufweicht, hätte den Rest des Studios zunichte gemacht. Also muss die Funktion innerhalb dieser Beschränkungen funktionieren: auf dem Gerät der Nutzer:innen, von uns bezahlt und nicht von ihnen, ohne Telemetrie, die zurückgeschickt wird.
Das dritte ist, dass die Nutzer:innen die vollständige Kontrolle haben müssen. KI läuft nie im Hintergrund. Sie liest nie irgendetwas, das die Nutzer:innen ihr nicht ausdrücklich in die Hand gedrückt haben. Sie verarbeitet die Inhalte der Nutzer:innen nie still im Hintergrund, um „hilfreich“ zu sein. Sie läuft, wenn die Nutzer:innen sie laufen lassen, mit dem Inhalt, den die Nutzer:innen ihr geben, und das Ergebnis wird ihnen gezeigt, bevor irgendetwas gespeichert wird. Eine halbe Version davon gibt es nicht. Entweder sitzen die Nutzer:innen jedes Mal am Steuer, oder wir bauen die Funktion nicht. Ein Zusammenfasser, der im Hintergrund leise deine Notizen liest, um „Erkenntnisse“ zutage zu fördern, würde nicht durchkommen, egal wie nützlich diese Erkenntnisse am Ende wären. Du wirst dich nie fragen, ob unsere Apps ein Modell über deine Daten haben laufen lassen, ohne es dir zu sagen. Die Antwort lautet nein.
Und was die KI hervorbringt, ist ein Entwurf, den sich die Nutzer:innen anschauen — keine Veränderung an irgendetwas, das sie schon hatten. Wir schreiben die Inhalte der Nutzer:innen nicht um. Das Foto, die Notiz, der Screenshot, das PDF — was du der App in die Hand gegeben hast, bleibt genau, wie es war. Das, was die KI ausspuckt, ist eine eigene Sache, die neben dem Original liegt, und du kannst sie behalten oder wegwerfen.
Das sind die drei. Zweck, Passung, Kontrolle. Die meisten KI-Funktionsideen — auch die meisten von unseren — kommen nicht durch alle drei durch, und das ist der ganze Sinn, warum wir sie aufgeschrieben haben. Die Liste ist dazu da, nein zu sagen.
Es gibt noch eine vierte Sache, die kein Kriterium ist, aber genauso viel zählt wie die Kriterien. Welche KI eine Funktion verwendet, ist selbst eine Design-Entscheidung. Im Moment ist Apples Modell auf dem Gerät die einzige Option, die wir kennen, die uns die drei oben stehenden Regeln einhalten lässt, ohne eine lange Liste an Kompromissen. Es läuft auf dem Gerät der Nutzer:innen, es kostet uns nichts in der Nutzung, es sieht nicht, was es verarbeitet, und Apple versucht nicht, irgendjemandem darauf eine Abo-Stufe aufzudrücken. Es hat außerdem direkten Zugriff — mit der Erlaubnis der Nutzer:innen — auf die Dinge, die ohnehin schon auf dem Telefon sind, was der ganze Grund ist, warum sich das alles überhaupt lohnt. Wenn sich das irgendwann ändert, oder wenn eine bessere Option verfügbar wird, die die gleiche Latte schafft, denken wir neu nach. Wir sind keinem Modell treu. Wir sind den Regeln treu.
Eine berechtigte Frage an dieser Stelle ist: Warum schreibt man das überhaupt auf? Die meisten Studios unserer Größe veröffentlichen keine Haltung zu KI. Die ehrliche Antwort ist, dass wir diese Entscheidungen auf eigene Faust treffen werden, häufig, schnell, und über lange Zeit. Die Regeln auf Papier zu haben, ist vor allem für uns. Es bedeutet, dass es das nächste Mal, wenn wir versucht sind, etwas zu bauen, weil es sich gut vorführen ließe oder weil alle anderen es ausgeliefert haben, ein Stück Text gibt, in das wir zuerst hineinschauen müssen. Die Kriterien sagen für uns nein, damit wir das nicht jedes Mal von vorn machen müssen.
Du darfst uns gern daran festhalten.