Ne pas prendre ce qui est gratuit
Ces dernières semaines, il y a eu un flot régulier de plaintes de développeurs au sujet de la tarification de Private Cloud Compute d’Apple. L’histoire, c’est que le nouveau palier d’IA côté serveur est gratuit, mais seulement pour les développeurs du App Store Small Business Program, qui plafonne l’éligibilité à deux millions de téléchargements cumulés. Beaucoup de développeurs sont au-dessus de ce plafond — parfois pour des apps qui n’ont pas gagné d’argent depuis des années — et il n’y a pour l’instant aucune voie payante pour accéder à PCC, même s’ils le voulaient. Ils sont dehors, et ils ne sont pas contents.
Moi, je ne suis pas dehors. Patter est largement sous le plafond, et Gums & Bones est exactement le genre de petit studio à qui le programme s’adresse. J’avais le palier gratuit à disposition. J’ai pensé à m’en servir. J’ai décidé de ne pas le faire. Et plus j’ai pensé à pourquoi, plus j’ai commencé à me dire que les développeurs qui se sont retrouvés dehors ont reçu un cadeau, même si vu d’où ils sont, ça n’en a pas l’air.
Voici ce qu’Apple propose. Le modèle d’IA sur l’appareil livré avec iOS est vraiment capable, mais il a une petite fenêtre de contexte — autour de 4 000 tokens au moment où j’écris ça — ce qui veut dire qu’il ne peut pas raisonner sur un dossier rempli de documents ou sur une entrée très longue. Pour les développeurs qui veulent faire ce genre de travail, Apple a Private Cloud Compute : son équivalent côté serveur, qui tourne sur du silicium Apple dans des datacenters Apple, avec une architecture qui ne stocke ni ne journalise vraiment les requêtes. PCC est, à l’aune des standards actuels, le service d’IA côté serveur le plus respectueux de la vie privée sur le marché. Ce n’est pas la partie qui m’inquiète.
La partie qui m’inquiète, c’est que c’est gratuit. Et par « gratuit », je veux dire : gratuit pour les petits développeurs, aujourd’hui, pendant qu’Apple construit la force gravitationnelle de la plateforme. Il n’y a pas de prix publié pour ce que ça coûte quand on dépasse le plafond pour petits développeurs. Il n’y a pas encore de palier payant pour les développeurs qui se plaignent d’être dehors. Il n’y a pas de prix engagé pour ce que le palier gratuit coûtera dans deux ans, ou dans cinq, quand le programme changera — et les programmes finissent toujours par changer.
Imagine, en tant que petit développeur, que tu construises une fonctionnalité sur PCC gratuit. Elle fait quelque chose de vraiment utile — disons qu’elle permet à un utilisateur de pointer ton app vers un dossier de documents et d’en faire quelque chose de cohérent. Les utilisateurs adorent. Les avis la saluent. Les gens upgradent spécifiquement pour ça. Deux ans passent. Apple annonce que l’allocation gratuite de PCC dans le programme pour petits développeurs va être plafonnée à, disons, dix mille requêtes par mois par app, avec un dépassement facturé à un certain tarif par requête. Ou Apple annonce un palier payant de PCC et le palier gratuit devient une sorte d’« essayez avant d’acheter ». Ou tu dépasses le plafond des deux millions de téléchargements, il n’y a toujours pas d’option payante, et ta fonctionnalité arrête de fonctionner pour les nouveaux utilisateurs. Ou n’importe quoi d’autre que les plateformes font.
À ce moment-là, tu as trois options. Tu peux absorber le coût et laisser ça grignoter pour toujours l’économie d’une app en achat unique. Tu peux introduire un abonnement, ce qui, si tu as fait d’autres promesses à tes utilisateurs, les casse. Ou tu peux retirer la fonctionnalité, ce qui est l’option qui protège ton business mais te fait passer pour le méchant. Il n’y a pas de bonne quatrième option. L’arbre de décision a été planté au moment où tu as souscrit.
D’ailleurs, c’est comme ça que le lock-in de plateforme fonctionne en vrai. Pas en forçant qui que ce soit. Même pas par mauvaise intention — je ne pense pas qu’Apple fasse ça de mauvaise foi, et je pense que leur architecture de confidentialité est construite sincèrement. Le lock-in fonctionne par subvention. Tu donnes aux développeurs quelque chose de vraiment précieux, gratuitement, pendant que tu construis l’intégration. Avec le temps, les produits des développeurs évoluent jusqu’à dépendre de la ressource subventionnée. Puis, quand l’économie doit changer — et elle finit toujours par devoir changer — les développeurs ne peuvent plus partir, parce que leurs utilisateurs attendent maintenant la fonctionnalité, et reconstruire sans la ressource subventionnée n’est plus possible. La plateforme ne leur a rien fait. Ils se le sont fait eux-mêmes, une décision rationnelle après l’autre.
Les développeurs qui sont actuellement dehors de PCC gratuit parce que leurs apps ont franchi les deux millions de téléchargements sont protégés de faire ce marché. Ils peuvent regarder PCC, décider si ça vaut la peine de payer ce que ça finira par coûter, et choisir les yeux ouverts. Aux développeurs dans le programme, on propose quelque chose qui ressemble à une bonne affaire et qui est en réalité un engagement.
Voilà l’argument pour traiter « je ne peux pas y accéder » comme un meilleur problème que « j’ai un accès gratuit dont je pourrais devenir dépendant ».
Cela dit, pour être juste avec Apple, le programme pour petits développeurs est un vrai bénéfice, les garanties de confidentialité sont réelles, et les ingénieurs qui ont construit PCC se soucient manifestement de ce qu’ils ont construit. Rien de tout ça n’est un argument disant que PCC est mauvais. C’est un argument disant qu’une fonctionnalité dont l’existence continue dépend d’une subvention que tu ne contrôles pas est un autre type de fonctionnalité qu’une dont l’existence continue dépend de matériel que l’utilisateur a déjà payé. Le modèle sur l’iPhone de ton utilisateur continue de fonctionner qu’Apple soit content de toi ou non. Il continue de fonctionner si Apple change sa stratégie de prix. Il continue de fonctionner si Apple modifie le programme. Il continue de fonctionner dans cinq ans, sur du matériel déjà acheté. C’est une classe d’actif différente d’un service.
Donc la fonctionnalité d’IA de Patter utilise le modèle sur l’appareil et seulement le modèle sur l’appareil. Il y a des choses concrètes qu’il ne sait pas faire. Le cas du dossier entier est celui sur lequel je reviens sans arrêt — un utilisateur avec un dossier de Notes plein de fragments, qui aimerait que l’app en extraie une routine. C’est utile, et ça ne tient pas dans 4 000 tokens. Pour l’instant, ces utilisateurs devront résumer d’abord, ou écrire la routine eux-mêmes. Le coût de cette limite est réel, et je ne prétends pas le contraire. Mais c’est le coût d’avoir une fonctionnalité que je peux maintenir pour toujours, à mes propres conditions, sans avoir à reconsidérer la décision chaque fois qu’Apple reconsidère ses prix.
Il y a deux choses sur lesquelles je fais des paris, et je peux me tromper sur les deux. La première, c’est de savoir si Apple finit par proposer un palier PCC payant, tarifé proprement et engagé sur le long terme. S’ils le font, tout le calcul change — un service payant transparent avec lequel on peut budgéter est très différent d’un service gratuit dont on ne peut pas prévoir l’avenir. Je reconsidérerais à ce moment-là. La deuxième, c’est de savoir si la fenêtre de contexte du modèle sur l’appareil grandit. Presque certainement oui. Si le modèle de l’année prochaine encaisse 32 000 tokens au lieu de 4 000, le cas du dossier entier dont je n’arrête pas de parler pourrait simplement se résoudre tout seul dans le chemin sur l’appareil, et la question avec laquelle je me débats ici se règle en silence par le progrès matériel. C’est le résultat le plus probable, et c’est une autre raison de ne pas s’engager maintenant sur un chemin serveur.
Les studios qui ont pris le palier gratuit quand il a été proposé s’en sortiront, dans beaucoup de cas. Certains prendront les bonnes décisions quand les conditions changeront. D’autres non, et on lira parler d’eux plus tard — fonctionnalités retirées, promesses cassées, virages embarrassants vers l’abonnement habillés en « investir dans l’avenir du produit ». Quelques-uns absorberont en silence des coûts qui auraient dû les tuer, soutenus par des utilisateurs qui ne savent pas que c’est ce qui se passe.
Les studios qui étaient dehors, et ceux qui ont choisi de rester dehors, n’auront aucun de ces problèmes. Ils auront un autre problème, qui est que leur app ne peut pas faire autant de choses. C’est un vrai problème. Mais c’est un problème que tu peux résoudre en étant honnête à son sujet, plutôt qu’un problème qui te résout quand les conditions changent.
J’ai choisi le plus petit problème. La plupart des jours, je suis assez sûr que c’était la bonne décision.