Nota Anthropic despre AI care construieste AI nu trebuie redusa la speculatii despre recursive self-improvement. Semnalul operational imediat este mai simplu: gap-ul dintre generatiile de modele devine suficient de mare incat schimba designul workflow-ului.
Anthropic Institute spune ca Anthropic deleaga catre sisteme AI o parte tot mai mare din munca de dezvoltare AI, iar asta accelereaza munca companiei. Institutul spune si ca recursive self-improvement nu este aici inca si nu este inevitabil.
Se schimba orizontul task-ului
Cand un model devine mai bun la munca autonoma pe termen mai lung, forma workflow-ului se schimba.
Setup-urile asistive mai vechi presupun ca omul conduce des: intreaba, inspecteaza, corecteaza, continua. Setup-urile agentice mai puternice pot impinge mai multa munca intr-un run mai lung. Asta poate reduce efortul manual, dar muta erorile mai tarziu in proces, dupa ce mai multe decizii au fost deja luate.
De aceea upgrade-urile de model trebuie evaluate ca schimbari de workflow, nu ca simple inlocuiri.
Ce trebuie testat inainte de upgrade
O evaluare utila include orizonturi reale de task: input-uri murdare, context partial, mai multe tool-uri, retry-uri si handoff-uri ambigue. Masoara nu doar finalizarea, ci si recuperarea.
Poate echipa sa inspecteze ce s-a intamplat? Poate reviewerul sa inteleaga deciziile? Poate workflow-ul sa se opreasca inainte de o actiune riscanta? Poate cobori intr-un mod mai restrans daca increderea scade?
Cu cat modelul este mai puternic, cu atat controalele devin mai importante. Un gap mai mare intre modele inseamna ca vechiul pattern prompt-plus-review poate sa nu mai potriveasca munca.
