¿Self-host o nube gestionada?
Elige lo que le va a tu equipo.
Cuatro pasos.
Tu worker, en vivo.
Config de inferencia en el edge.
Dos variables.
Establece PII_STRATEGY para controlar dónde se ejecuta la inferencia. Añade EDGE_MODEL para elegir el modelo de Workers AI.
Tareas de alto volumen, baja latencia. Mejor opción para clasificación y extracción.
Q&A y resumen de uso general. Buen equilibrio calidad-coste.
Razonamiento complejo, equivalente a GPT-3.5. La mayor calidad en el edge.
[vars] PII_STRATEGY = "edge" # "anonymize" | "edge" EDGE_MODEL = "@cf/meta/llama-3.3-70b-instruct-fp8-fast" # modelo Workers AI
Tres hechos.
No promesas.
El mapa de sustitución de PII se crea al inicio del request dentro del heap del isolate y se destruye con él. Nunca se escribe en ningún almacenamiento — ni KV, ni R2, ni disco.
Con PII_STRATEGY=edge, Cloudflare Workers AI corre en el mismo nodo que recibió tu petición. Sin llamada a API cloud, sin salto de red externo, sin modelo de terceros.
El código del worker es MIT open source. Puedes auditarlo, forkearlo, modificarlo y redistribuirlo sin restricciones. Sin caja negra, sin fe ciega requerida.